KR101227432B1 - 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 - Google Patents
향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 Download PDFInfo
- Publication number
- KR101227432B1 KR101227432B1 KR1020097018675A KR20097018675A KR101227432B1 KR 101227432 B1 KR101227432 B1 KR 101227432B1 KR 1020097018675 A KR1020097018675 A KR 1020097018675A KR 20097018675 A KR20097018675 A KR 20097018675A KR 101227432 B1 KR101227432 B1 KR 101227432B1
- Authority
- KR
- South Korea
- Prior art keywords
- plant
- nucleic acid
- plants
- sequence
- delete delete
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H6/00—Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
- A01H6/46—Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/21—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8262—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
- C12N15/827—Flower development or morphology, e.g. flowering promoting factor [FPF]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8273—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Physiology (AREA)
- Natural Medicines & Medicinal Plants (AREA)
- Botany (AREA)
- Developmental Biology & Embryology (AREA)
- Environmental Sciences (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 일반적으로 분자생물학 분야에 관한 것이며, 식물에 있어 다양한 경제적으로 중요한 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 더욱 상세하게는, 본 발명은 HpaG (Harpin-associated Factor G) 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 HpaG 폴리펩티드를 암호화하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 향상된 수확량 관련 형질을 가진다. 또한, 본 발명은 본 발명의 방법을 수행하는데 유용한, HpaG 암호화 핵산을 포함하는 구축물을 제공한다. 본 발명은 또한 식물에서 SWITCH 2/SUCROSE NON-FERMENTING 2(SWI2/SNF2) 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현을 조절 (바람직하게는 증가)함으로써, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다. 본 발명은 또한 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 수확량 관련 형질이 향상된 것이다. 본 발명은 또한 본 발명의 방법을 수행하는데 유용한 구축물을 제공한다.
HpaG 폴리펩티드, SWI2/SNF2 폴리펩티드, 수확량, 발현 조절
Description
본 발명은 일반적으로 분자생물학 분야에 관한 것이며, 식물에 있어 다양한 경제적으로 중요한 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 더욱 상세하게는, 본 발명은 Harpin-associated Factor G 폴리펩티드 (이후부터 "HpaG"라 명명함)를 암호화하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 HpaG 폴리펩티드를 암호화하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 향상된 수확량 관련 형질을 가진다. 또한, 본 발명은 본 발명의 방법을 수행하는데 유용한, HpaG 암호화 핵산을 포함하는 구축물을 제공한다. 본 발명은 또한 SWITCH 2/SUCROSE NON-FERMENTING 2 (SWI2/SNF2) 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현을 조절 (바람직하게는 증가)함으로써, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 수확량 관련 형질이 향상된 것이다. 본 발명은 또한 본 발명의 방법을 수행하는데 유용한 구축물을 제공한다.
세계 인구의 증가와 농업에 유용한 경작지의 감소는 농업의 효율성을 증가시키는 연구에 박차를 가하게 만들었다. 작물 및 원예농업 향상을 위한 전통적인 방식은 바람직한 특성을 가진 식물체를 동정하기 위하여 선택적 육종기법을 이용한다. 그러나, 상기 선택적 육종기법에는 몇가지 약점이 있는데, 즉 노동집약적이며 양친으로부터 원하는 형질이 항상 전해지는 것이 아닌 이종의 유전적 요소를 가진 식물로 귀착된다는 것이다. 분자생물학의 진보로 인간이 동물 및 식물의 생식질 (germplasm)을 변형시키게 되었다. 식물유전공학은 유전물질 (전형적으로 DNA 또는 RNA 형태)의 분리와 조작 및 이 유전물질을 식물체 내로 도입하게 했다. 그런 기술은 다양한 향상된 경제적, 농업적, 원예적 형질을 가진 작물 또는 식물을 제공할 수 있다.
특히 경제적으로 중요한 형질은 증가된 수확량이다. 수확량은 보통 작물로부터 경제적 가치의 측정할 수 있는 산물로 정의된다. 이는 양 및/또는 질의 면에서 정의될 수 있다. 수확량은 몇가지 요인에 직접적으로 의존하는데, 예를 들면 기관의 수와 크기, 식물체 형상 (예를 들면, 가지의 수), 종자 생산, 잎의 노화 등이다. 뿌리 발달, 양분 흡수, 스트레스 내성, 및 초기 활력 또한 수확량 결정에 중요한 요인일 수 있다. 상기 요인들의 최적화는 작물의 수확량 증가에 기여할 수 있다.
많은 식물의 종자는 인간과 동물의 영양에 중요하므로 종자 수확량이 특히 중요한 형질이다. 옥수수, 벼, 밀, 캐놀라 및 대두와 같은 작물이 종자 자체의 직접적인 소비, 또는 가공종자로 사육된 육류 소비를 통해서 전체 인간 칼로리 흡수 량의 절반 이상을 차지한다. 상기 작물들은 설탕, 기름 및 산업적 가공공정에 사용되는 많은 종류의 대사물의 재료이기도 하다. 종자는 배 (어린 줄기와 뿌리의 근원) 및 배유 (발아 동안 및 실생의 초기 생장 동안 배 생장 양분의 공급원)를 포함한다. 종자 발달에는 많은 유전자가 관여되며, 뿌리, 잎 및 줄기로부터 생장하는 종자로 대사물의 이동이 필요하다. 특히 배유는 탄수화물, 오일 및 단백질의 대사 전구물질을 동화하여, 이 물질들을 알곡을 채우기 위한 저장성 고분자로 합성한다.
지상부 건조 중량에 대한 종자 수확량의 비율인 수확지수는 많은 환경 조건하에서 비교적 안정되어 있어, 식물 크기 및 곡물 수확량 간에 강한 상관관계가 얻어질 수 있다 (예를 들면, Rebetzke 등 (2002) Crop Science 42:739). 곡물 생물량의 대부분은 식물체의 잎 및 줄기에 의한 현재의 또는 저장된 광합성 생산성에 의존하므로 상기 과정들은 본질적으로 연결되어 있다 (Gardener 등 (1985) Physiology of Crops. Iowa State University Press, pp 68-73). 따라서, 발달 초기 단계에 식물체의 크기에 대한 선발은 미래의 잠재적인 수확량에 대한 지표로 사용되어 왔다 (예를 들면, Tittonell 등 (2005) Agric Ecosys & Environ 105: 213). 유전적 차이가 스트레스 내성에 미치는 영향을 점검 시, 토양 특성, 온도, 수분 및 양분 이용성 및 광 강도를 표준화하는 능력이 필드와 비교하여 온실 또는 식물 생장상(growth chamber) 환경의 본질적인 이점이다. 그러나, 바람 또는 곤충의 부재로 인한 빈약한 수분(pollination), 또는 뿌리 생장 또는 수관(canopy) 생장을 위한 불충분한 공간으로 인한 수확량의 인위적인 제한은 수확량 차이의 점검을 위한 상기 통제된 환경의 사용을 제한할 수 있다. 따라서, 생장상 또는 온실의 표준화된 조건하에서 발달 초기에 식물체의 크기를 측정하는 것이 잠재적인 유전적 수확량 이점을 표시하는 표준 방식이다.
특별한 경제적인 관심의 대상인 또 다른 형질은 비생물적 스트레스 조건하에서 자란 식물의 향상된 수확량 관련 형질이다. 비생물적 스트레스가 전세계적으로 작물 손실의 일차적인 원인이며, 대부분의 주요 작물에 대해 평균 수확량을 50% 이상 감소시켰다 (Wang 등, Planta (2003) 218: 1-14). 비생물적 스트레스는 가뭄, 염분, 극단적인 온도, 화학적 독성 및 산화적 스트레스에 의해 야기될 수 있다. 비생물적 스트레스 조건하에서 자란 식물의 수확량 관련 형질을 향상시키는 능력은 전세계적으로 농업가에게 큰 경제적인 이점이 있으며, 불리한 조건에서 및 작물 재배가 불가능한 지역에서 작물 재배를 가능하게 한다.
식물 수확량을 증가시키는 능력은 관상식물 생산을 포함한 농업, 수목재배, 원예 및 삼림과 같은 영역에 많이 적용된다. 수확량 증가는 (제약, 항체 또는 백신과 같은 물질의 생물공학적 생산, 또는 유기 폐기물의 생물학적 전환을 위한) 생물반응기에 사용을 위한 조류(algae)의 생산 및 다른 영역에도 사용 가능하다.
I. 하핀(
HARPlN
)
TTSS (Type III Secretion System)는 그람음성균에 특이적인 분비 기구이고, 식물 및 동물 병원균뿐 아니라, 내부공생 리조비아(Rhizobia)에서도 발견된다. TTSS는 세균이 관련된 숙주 세포로 단백질을 전달하는 것으로 추론된다. 식물 병원성 세균에 있어, TTSS는 과민성 반응의 집단(cluster)이며, 약 20 개의 유전자를 포함하는 병원성 유전자, Hrp 집단이다. 상기 유전자들 중 9 개 (보존된 harpin 또 는 hrc)는 식물 및 동물 병원균 양자에서 보존되어 있으며, 이들 중 8 개는 편모 장치를 암호화하는 유전자와 상동성이 있으며 (Bogdanove 등, MoI. Microbiol. 20, 681-683, 1996), 9 번째인 hrcC는 GSP 외막 세크레틴(secretin)에 상동성이 있다 (Deng 및 Huang, J. Bacteriol. 180, 4523-4531, 1999). Hpa (hrp-associated) 유전자는 병원성 및 비기주 식물에서의 과민성 반응 (HR)의 유도에 기여하나, 식물과 세균의 병원성 상호작용에 필수적인 것은 아니다. 편모 장치 및 TTSS는 공통적인 기원으로부터 진화된 것으로 추론되며 (Gophna 등, Gene 312, 151-163, 2003); TTSS는 다수의 수평적인 전달을 거쳐 진화적으로 거리가 먼 세균 종간에 더 퍼졌다 (Nguyen 등, J. MoI. Microbiol. Biotechnol. 2, 125-144, 2000).
많은 그람음성 식물-병원성 세균은 식물과의 상호작용을 조절하는 2 세트의 유전자를 가지고 있다. 비병원성 유전자는 유전자 대 유전자 상호작용에 근거하여 기주 특이성을 결정하며, hrp (hypersensitive reaction and pathogenicity) 유전자는 비기주 식물에서 병원성 및 과민성 반응 (HR)의 유도에 관여된다. HR은 비기주 식물 또는 기주 식물의 저항성 재배종이 식물 병원균 또는 Avr 단백질 및 하핀(harpin)과 같은 HR 유도인자 분자의 침입을 받았을 때 발생하는 고도의 국부적인 식물 세포 사멸이다. HR은 미생물 병원균에 대한 식물의 저항성 반응으로 생각되고 있다.
하핀은 HR 유도인자의 집단이며, TTSS (type III secretion pathway)에 의해 분비되어 비기주 식물 잎의 아포플라스트(apoplast)로 침투 시 HR을 유도한다. 기능을 하기 위해 세포 내부로 전달되어야만 하는 Avr 단백질과는 달리, 하핀은 식물 세포의 세포 간 공간으로 전달 시 HR을 유도할 수 있다. 첫 번째 하핀인 HrpN이 어위니아 아밀로보라(Erwinia amylovora)로부터 동정된 이래, 많은 하핀이 슈도모나스(Pseudomonas), 랄스토니아(Ralstonia), 및 잔토모나스(Xanthomonas)를 포함하여 다양한 종으로부터 보고되었다. 하핀(harpins)은 글리신(glycin)이 풍부하며, 열에 안정적인 단백질이고, 시스테인(cysteine)이 없으며, TTSS를 가지는 모든 식물 병원성 세균에 존재하는 것으로 추론된다 (Alfano 및 Colmer, Annu. Rev. Phytopathol. 42, 385-414, 2004). 비기주 식물에서 하핀에 의한 HR 유도의 생화학적 기작은 불분명하다. 슈도모나스 시린개 피브이. 시린개(Pseudomonas syringae pv. syringae)의 HrpZ는 식물 세포막보다 오히려 세포벽과 연관되며, 단백질은 세포벽이 없는 원형질체로부터는 반응을 유도하지 않는다 (Hoyos 등 Mol. Plant-Microbe Interact. 9, 608-616, 1996). 그러나, 슈도모나스 시린개 피브이. 파세오리콜라(P. syringae pv. phaseolicola)의 HrpZ은 지질 이중층에 결합하여, 이온 통도 구(ion-conducting pore)를 형성한다 (Lee 등, Proc. Natl. Acad. Sci. USA 98, 289-294, 2001). HrpZ의 N-말단 109 개 아미노산 및 C-말단 216 개의 아미노산은 전장 HrpZ와 비슷한 수준으로 HR을 유도할 수 있다 (Alfano 등, Mol. Microbiol. 19, 715-728, 1996). Kim 등 및 Charkowski 등은 어위니아 아밀로보라(E. amylovora) 및 슈도모나스 시린개 피브이. 토마토(P. syringae pv. tomato)의 HrpW 하핀이 2 개의 도메인 - N-말단 하핀 도메인 및 C-말단 Pel(pectate lyase) 도메인 -으로 구성되어 있음을 보여주었으며, HrpW이 세포벽에서 작용함을 제안하였다 (Charkowski 등, J. Bacteriol. 180, 5211-5217, 1998; Kim 및 Beer, J. Bacteriol. 180, 5203-5210, 1998).
하핀 외에도, 세균의 TTSS 집단은 하핀 관련 인자(Harpin associated Factors)를 암호화하는 유전자도 포함한다. HpaG 폴리펩티드는 하핀 보다 작으며, 둘 간의 서열 상동성은 거의 없다. 하핀과의 서열 차이로 인해 식물에 있어서 HpaG 폴리펩티드 및 하핀 간에 HR을 유도하는 능력상의 차이가 생기는 것으로 추론된다 (Kim 등, J. Bacteriol. 186, 6239-6247, 2004).
한국특허출원 KR20030068302에는 잔토모나스(Xanthomonas) HpaG 단백질이 개시되어 있으며, 상기 단백질을 식물 또는 식물 종자에 적용 시, 질병 저항성 특히 잔토모나스 악소노포디스(Xanthomonas axonopodis) 감염에 대한 저항성을 부여한다. 하핀 관련 인자는 식물에 질병 저항성을 부여하는 데 사용되어 왔으며; 상기 생물적 스트레스 저항성의 결과, 식물은 생물적 스트레스 조건하에서 대조구 식물에 비해 보다 나은 수확량을 나타낸다.
놀랍게도 Harpin-associated Factors G 폴리펩티드 (HpaG)를 암호화하는 핵산을 식물에서 발현을 조절하면 대조구 식물에 비해 향상된 수확량 관련 형질을 가지게 된다는 것이 발견되었다. 상기 향상된 수확량 관련 형질은 스트레스에 노출되지 않았던 식물에서 얻어졌다.
II
.
SNF2
본 발명은 SWITCH 2/SUCROSE NON-FERMENTING 2 (SWI2/SNF2) 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현 증가에 의한 대조구 식물에 비하여 수확량 관련 형질을 향상시키는 방법에 관한 것이다.
복제, 전사, DNA 복구, 또는 재조합과 같은 많은 염색체와 관련된 세포내 과정에서는 DNA에 접근이 되어야 한다. 이를 위해, 세포는 진핵세포의 경우 염색질을 개조하거나 또는 원핵 및 진핵세포 양자의 경우 ATP 가수분해를 사용하여 DNA:단백질 복합체를 파괴하는 활성을 가진다. 상기 활성 중 가장 잘 연구된 예 중의 하나는 많은 다른 개조(remodeling) 유사 과정에 관련된 큰 단백질 집단인 ATPases의 SWI2/SNF2 패밀리에 의해 수행된다.
SWI2/SNF2 패밀리 단백질은 세균, 고세균 및 진핵세포에서 발견되는 것처럼 편재한다. 상기 단백질은 7 개의 보존된 서열 모티프 (I, Ia, II, III, IV, V, 및 VI)를 포함하는 SWI2/SNF2 ATPase 도메인의 다중 서열 정렬(alignment) 후에 최근에 24 개의 서브패밀리로 분류되었다 (Flaus 등 (2006) Nucleic Acids Res. 2006; 34(10): 2887-2905). 상기 서브패밀리는 전통적으로 고세균 구성원의 명칭을 따른다. 한 서브패밀리는 유일한 SWI2/SNF2 패밀리 구성원인 고세균 술포로부스 솔파타리쿠스(Sulfolobus solfataricus)(Flaus 등, supra; Duur 등 (2005) Cell 121 (3): 363-373)의 명칭에 따라 SSO1653로 명명되며, 유일하게 고세균 및 진정세균 서브패밀리는 진핵성 SWI2/SNF2 단백질에 가장 비슷하다. SSO1653 서브패밀리는 모든 SWI2/SNF2 패밀리 서열 및 구조적 특징을 가진다.
미국특허출원 US2003/233670는 폴리뉴클레오티드 및 폴리뉴클레오티드에 의해 암호화되는 단백질을 기재하고 있다. 서열번호 125는 시네코시스티스(Synechocystis) sp. PCC 6803으로부터 SSO1653 서브패밀리의 SWI2/SNF2 폴리펩 티드를 암호화하는 폴리뉴클레오티드 서열이다. 미국특허출원 US2005/108791는 24149 개의 핵산 및 폴리펩티드 서열을 기재하고 있으며, 이 중 서열번호 57로 표시된 핵산 서열은, 서열번호 396으로 표시된 시네코시스티스(Synechocystis) sp. PCC 6803으로부터 SSO1653 서브패밀리의 SWI2/SNF2 폴리펩티드를 암호화한다.
놀랍게도, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현 증가는 대조구 식물에 비해 향상된 수확량 관련 형질을 가지는 식물을 제공한다는 것을 밝혔다.
폴리펩티드(들)/단백질(들)
용어 "폴리펩티드" 및 "단백질"은 본 발명에서 상호 교체 사용되며, 임의의 길이의 아미노산의 중합형을 말한다.
폴리뉴클레오티드(들)/핵산(들)/핵산 서열(들)/뉴클레오티드 서열(들)
용어 "폴리뉴클레오티드(들)", "핵산 서열(들)", "뉴클레오티드 서열(들)"은 본 발명에서 상호 교체 사용되며, 임의의 길이의 중합형인, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 양자의 조합인 뉴클레오티드를 말한다.
대조구
식물(들)
적절한 대조구 식물의 선택은 실험 셋업에서는 통상적인 부분이며, 해당 식물의 야생형 또는 목적 유전자가 없는 해당 식물을 포함할 수 있다. 대조구 식물은 전형적으로 평가되는 식물과 동일한 식물 종 또는 동일한 변종이다. 대조구 식물은 또한 평가되는 식물의 공접합자(nullizygote)일 수 있다. 본 발명에서 사용된 "대조구 식물"은 전체 식물뿐 아니라 종자 및 종자의 일부분을 포함한 식물의 일부분을 말한다.
상동체
(들)
단백질의 "상동체"는 문제의 변형되지 않은 단백질에 대해 아미노산 치환, 결실 및/또는 삽입을 가지며, 이들이 유래되는 변형되지 않은 단백질과 유사한 생물학적 및 기능적 활성을 가진 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다.
결실은 단백질로부터 하나 이상의 아미노산의 제거를 말한다.
삽입은 단백질 내의 예정된 위치에 하나 이상의 아미노산 잔기가 도입되는 것을 말한다. 삽입은 하나 또는 다수 아미노산의 서열 내 삽입뿐 아니라 N-말단 및/또는 C-말단 융합을 포함할 수 있다. 일반적으로 아미노산 서열 내 삽입은 N- 또는 C-말단 융합보다 작을 것이며, 약 1 내지 10 개 정도의 잔기이다. N- 또는 C-말단 융합 단백질 또는 펩티드의 예는 효모 투 하이브리드(two-hybrid) 시스템에 사용된 전사 활성제의 결합 도메인 또는 활성화 도메인, 파아지 외피 단백질, (히스티딘)-6-태그, 글루타치온 S-전달효소-태그, 단백질 A, 말토스-결합 단백질, 디히드로폴레이트 환원효소, Tag·100 에피토프, c-myc 에피토프, FLAG-에피토프, lacZ, CMP (칼모둘린-결합 펩티드), HA 에피토프, 단백질 C 에피토프 및 VSV 에피토프를 포함한다.
치환은 유사한 성질 (유사한 소수성, 친수성, 항원성, 알파 나선 구조 또는 베타 병풍 구조를 형성하거나 파괴하는 경향 같은)을 가진 다른 아미노산으로 단백질의 아미노산의 치환을 말한다. 아미노산 치환은 전형적으로 한 잔기의 치환이나, 폴리펩티드에 부여된 기능적 제약에 따라 클러스터될(clustered) 수도 있으며; 삽입은 보통 약 1 내지 10 개 정도의 아미노산 잔기가 삽입된다. 아미노산 치환은 바람직하게는 보존적 아미노산 치환이다. 보존적 치환 표는 당업계에 주지되어 있다 (예를 들면, Creighton (1984) Proteins. W.H. Freeman and Company (Eds) 및 하기 표 1 참고).
표 1: 보존된 아미노산 치환의 예
잔기 | 보존적 치환 | 잔기 | 보존적 치환 |
Ala | Ser | Leu | Ile; Val |
Arg | Lys | Lys | Arg; Gln |
Asn | Gln; His | Met | Leu; Ile |
Asp | Glu | Phe | Met; Leu; Tyr |
Gln | Asn | Ser | Thr; Gly |
Cys | Ser | Thr | Ser; Val |
Glu | Asp | Trp | Tyr |
Gly | Pro | Tyr | Trp; Phe |
His | Asn; Gln | Val | Ile; Leu |
Ile | Leu, Val |
아미노산 치환, 결실 및/또는 삽입은 고체상 펩티드 합성 등과 같은 당업계에 주지된 펩티드 합성 기술을 이용하거나 또는 재조합 DNA 조작에 의해 용이하게 수행될 수 있다. 단백질의 치환, 삽입 또는 결실 변이체를 제조하기 위한 DNA 서열 조작 방법은 당업계에 주지되어 있다. 예를 들면, DNA 상의 예정된 위치에 치환 돌연변이를 제조하기 위한 기술은 당업자에게 주지되어 있으며, M13 돌연변이유발, T7-Gen 시험관 내 돌연변이유발 (USB, Cleveland, OH), QuickChange 자리지정 돌연변이유발 (Stratagene, San Diego, CA), PCR-매개된 자리지정 돌연변이유발 또는 기타 자리지정 돌연변이유발 프로토콜을 포함한다.
유도체
"유도체"는 서열번호 2에 제시된 것과 같은 자연발생 형태의 단백질의 아미노산 서열과 비교하여, 자연적으로 발생하지 않는 아미노산 잔기로 아미노산의 치환 또는 자연적으로 발생하지 않는 아미노산 잔기의 첨가를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 단백질의 "유도체"는 또한 자연발생 형인 폴리펩티드의 아미노산 서열과 비교하여 자연적으로 발생하는 변형된 (글리코실화, 아실화, 프레닐화, 인산화, 미리스토일화, 황화 등) 또는 자연적으로 발생하지 않는 변형된 아미노산 잔기를 포함하는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 유도체는 또한 유래되는 아미노산 서열과 비교하여 하나 이상의 비아미노산의 치환 또는 첨가를 포함할 수 있는데, 예를 들면, 이의 검출을 용이하게 하기 위해 결합되는 리포터 분자와 같은 아미노산 서열에 공유적으로 또는 비공유적으로 결합한 리포터 분자나 다른 리간드, 및 자연적으로 발생하는 단백질의 아미노산 서열에 대해 비자연적으로 발생하는 아미노산 잔기이다.
오쏘로그
(들)/
패럴로그
(들)
오쏘로그 및 패럴로그는 유전자의 조상관계를 기재하는데 사용되는 진화적 개념을 포함한다. 패럴로그는 조상 유전자의 복제로 생긴 동일한 종 내의 유전자이고, 오쏘로그는 종분화를 통해 유래된 다른 생물체의 유전자이다.
도메인
용어 "도메인"은 진화적으로 연관된 단백질의 서열정렬 시 특정 위치에서 보존된 아미노산의 세트이다. 다른 위치의 아미노산은 상동체들 간에 다양할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 활성에 필수적일 것 같은 아미노산을 나타낸다. 단백질 상동체 패밀리의 정렬된 서열상에서 고도로 보존된 부분은 임의의 문제되는 폴리펩티드가 이전에 동정된 폴리펩티드 패밀리에 속하는지를 결정하는 동정부위로 사용될 수 있다.
모티프/일치 서열(
consensus
sequence
)/시그너처(
Signature
)
용어 "모티프", "일치 서열" 또는 "시그너처"는 진화적으로 연관된 단백질의 서열에 있어 짧은 보존된 영역을 말한다. 모티프는 흔히 도메인의 고도로 보존된 부분뿐만 아니라, 도메인의 일부만을 포함할 수도 있거나 또는 보존된 도메인 외부에 있을 수도 있다 (만일 모티프의 아미노산 모두가 지정된 도메인 외부에 있으면).
혼성화
본 발명에 정의된 용어 "혼성화"는 실질적으로 상동인 상보적인 뉴클레오티드 서열이 서로 어닐링하는 과정이다. 혼성화 과정은 전적으로 용액 내에서, 즉 상보적인 양 핵산이 용액 내에 있을 때 일어날 수 있다. 혼성화 과정은 또한 상보적인 핵산의 하나가 자성 비드, Sepharose 비드 또는 어떤 다른 수지(resin) 같은 기질에 고정되었을 때도 일어날 수 있다. 혼성화 과정은 더욱이 상보적인 핵산 중의 하나가 니트로셀룰로스 또는 나일론 막 같은 고체 지지체에 고정되었거나 또는 포토리쏘그래피에 의하여 규산질의 유리 지지체 (핵산 어레이, 마이크로어레이 또는 핵산 칩이라 알려짐)에 고정되었을 때에도 일어날 수 있다. 혼성화가 일어나게 하기 위하여, 핵산분자는 일반적으로 열적으로 또는 화학적으로 변성되어 하나의 이중가닥을 2개의 단일가닥으로 녹이고/녹이거나 단일가닥 핵산으로부터 헤어핀 또는 기타 이차 구조를 제거한다.
용어 "스트린전시"는 혼성화가 일어나는 조건을 말한다. 혼성화의 스트린전시는 온도, 염 농도, 이온 강도 및 혼성화 완충액 조성 같은 조건의 영향을 받는다. 일반적으로 낮은 스트린전시 조건은 정해진 이온강도 및 pH에서 특정 서열에 대한 용해점 (Tm) 보다 약 30℃ 낮은 온도가 선택된다. 중간 스트린전시 조건은 Tm 보다 20℃ 낮은 온도일 때, 높은 스트린전시 조건은 Tm 보다 10℃ 낮은 온도이다. 높은 스트린전시 혼성화 조건은 전형적으로 표적 핵산 서열에 높은 서열 유사성을 가진 혼성화 서열을 분리하기 위해 사용된다. 그러나, 핵산은 서열 상의 차이가 있더라도 유전암호의 축퇴로 인하여 실제로는 동일한 폴리펩티드를 암호화할 수 있다. 그러므로, 중간 스트린전시 혼성화 조건은 종종 상기 핵산분자를 동정하는데 필요할 수 있다.
Tm은 정해진 이온 강도 및 pH 하에서 표적 서열의 50%가 완벽하게 매치된 탐침에 혼성화하는 온도이다. Tm은 용액 조건, 염기 조성 및 탐침의 길이에 의존적이다. 예를 들면, 보다 긴 서열일수록 보다 높은 온도에서 특이적으로 혼성화한다. 최대 혼성화율은 Tm보다 약 16℃에서 32℃까지 낮을 때 얻어진다. 1가 양이온이 혼성액에 있으면 두 핵산 가닥 간에 정전기적 반발이 감소하여 혼성화가 촉진되고; 이 효과는 0.4M (보다 높은 농도에서는 이 효과가 무시될 수 있다)까지의 나트륨 농도에서 보여진다. 포름아미드는 DNA-DNA 및 DNA-RNA 이중가닥의 용해 온도를 포름아미드 퍼센트당 0.6 내지 0.7℃ 내리며, 50% 포름아미드의 첨가는 혼성화율은 낮아지더라도 혼성화가 30 내지 45℃에서 일어나게 한다. 염기쌍 미스매치는 혼성화율 및 이중가닥의 온도 안정성을 감소시킨다. 평균적으로 그리고 큰 탐침에 대하여, Tm은 염기 미스매치 %당 약 1℃ 감소한다. Tm은 혼성체의 유형에 따라 하기의 식으로 계산할 수 있다:
1) DNA-DNA 혼성체 (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1 -0.61x%포름아미드
2) DNA-RNA 또는 RNA-RNA 혼성체:
Tm= 79.8 + 18.5 (log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3) 올리고-DNA 또는 올리고-RNAd 혼성체:
20개 뉴클레오티드 미만에 대해: Tm=2(In)
20-35개 뉴클레오티드에 대해: Tm=22+1.46(In)
a 또는 다른 1가 양이온에 대하여, 0.01-0.4 M 범위 내에서만 정확.
b 30% 내지 75% 범위 내에서 %GC에 대하여만 정확.
c L = bp으로 표시된 이중가닥의 길이.
d 올리고, 올리고뉴클레오티드; In, 효과적인 프라이머 길이 = 2x(G/C의 수)+(A/T의 수)
비특이적 결합은 예를 들면, 단백질 함유 용액으로 막을 차단하고, 혼성화 완충액에 이종의 RNA, DNA, 및 SDS를 첨가하고, RNAse 처리하는 것과 같은 많은 알려진 기술 중 임의의 하나를 사용하여 조절할 수 있다. 비상동 탐침에 대하여, 일련의 혼성화 과정은 (i) 점차적으로 어닐링 온도를 낮추거나 (예를 들면 68℃에서 42℃까지) (ii) 점차적으로 포름아미드 농도를 낮추거나 (예를 들면 50%에서 0%까지) 중 하나를 변화시킴으로써 수행될 수 있다. 당업자는 혼성화 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
혼성화 조건 외에, 혼성화의 특이성은 또한 전형적으로 혼성화 후 세척 기능에 의존한다. 비특이적 혼성화로 생기는 백그라운드를 제거하기 위하여, 시료를 묽은 염 용액으로 세척한다. 이런 세척의 결정적인 요인은 최종 세척액의 이온 강도 및 온도를 포함하며: 염 농도가 낮고 세척 온도가 높을수록 세척의 스트린전시는 높아진다. 세척 조건은 전형적으로 혼성화 스트린전시에서 또는 보다 낮게 수행된다. 양성 혼성화는 적어도 백그라운드의 2 배의 신호로 나타난다. 일반적으로 핵산 혼성화 분석이나 유전자 증폭 검출 과정에 적절한 스트린전트 조건은 상기와 같다. 다소 스트린전트한 조건 또한 선택될 수 있다. 당업자는 세척 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
예를 들면, 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 전형적인 높은 스트린전시 혼성화 조건은 65℃, 1x SSC에서 또는 42℃, 1x SSC 및 50% 포름아미드에서 혼성화 후 65℃, 0.3x SSC에서 세척하는 것이다. 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 중간 스트린전시 혼성화 조건은 50℃, 4x SSC 또는 40℃, 6x SSC 및 50% 포름아미드에서 혼성화 후, 50℃, 2x SSC에서 세척하는 것이다. 혼성체의 길이는 혼성화하는 핵산에 대해 예측된 길이이다. 알려진 서열의 핵산이 혼성화될 때 혼성체의 길이는 서열을 정렬하고 본 발명에서 기재된 보존된 영역을 동정하면 결정될 수 있다. 1X SSC는 0.15M NaCl 및 15mM 소듐 시트레이트이며; 혼성액 및 세척액에는 부가적으로 5x Denhardt's reagent, 0.5-1.0% SDS, 100 ㎍/ml 변성된, 단편화된 연어 정자 DNA, 0.5% 소듐 피로포스페이트가 포함된다.
스트린전시 수준을 결정하기 위해서는 [Sambrook 등 (2001) Molecular Cloning: laboratory manual, 3rdEdition, Cold Spring Harbor Laboratory Press, CSH, New York or to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989, 매년 개정됨)]을 참조하면 된다.
유전자
셔플링
(
shuffling
)/방향진화(
directed
evolution
)
유전자 셔플링 또는 방향진화는 DNA 셔플링의 반복에 이은 변형된 생물학적 활성을 가진 단백질을 암호화하는 핵산이나 그 일부분의 변이체 생성을 위해 적절한 탐색 및/또는 선발로 구성된다 (Castle 등, (2004) Science 304(5674): 1151-4; 미국 특허 제5,811,238호 및 제6,395,547호).
조절 인자/조절 서열/프로모터
용어 "조절 인자", "조절 서열" 및 "프로모터"는 본 발명에서 상호 호환적으로 사용되며, 결합되는 서열의 발현에 영향을 미칠 수 있는 조절 핵산 서열을 말하는 것으로 사용된다. 용어 "프로모터"는 전형적으로 유전자의 전사개시점의 업스트림에 있으며, RNA 중합효소 및 다른 단백질의 인지 및 결합에 관여하여 작동가능하게 연결된 핵산의 전사를 지시하는 핵산 조절 서열을 말한다. 상기 언급한 용어에는 전형적인 진핵세포 게놈 유전자 (CCAAT 박스 서열이 있거나 없이 정확한 전사 개시에 필요한 TATA 박스를 포함) 및 발달 및/또는 외부 자극에 반응하여 또는 조직 특이적 방식으로 유전자 발현을 변경하는 부가적인 조절 인자 (즉, 업스트림 활성화 서열, 인핸서 및 사일런서)로부터 유래한 전사 조절 서열이 포함된다. 또한 상기 용어에는 -35 박스 서열 및/또는 -10 박스 전사 조절 서열을 포함하는 전형적인 원핵생물 유전자의 전사 조절 서열이 포함된다. 용어 "조절인자"는 또한 세포, 조직 또는 기관에 핵산분자의 발현을 하게 하거나 활성화 또는 증가시키는 합성 융합 분자 또는 유도체를 포함한다.
"식물 프로모터"는 식물 세포에 암호화 서열 단편의 발현을 중재하는 조절 인자를 포함한다. 따라서, 식물 프로모터는 식물에서 유래해야 하는 것은 아니며, 예를 들면 식물 세포에 침범하는 바이러스 또는 미생물 기원일 수도 있다. "식물 프로모터"는 식물 세포, 예를 들면, 본 발명의 방법에서 발현되며, 본 발명에 기재된 핵산 서열로 형질전환된 식물 기원일 수 있다. 이는 또한 "식물" 종결신호 같은 "식물" 조절 신호에도 해당된다. 본 발명의 방법에 유용한 뉴클레오티드 서열의 프로모터 업스트림은 프로모터, 개방형해독틀 (ORF) 또는 종결신호 또는 ORF로부터 떨어져 있는 다른 3' 조절 영역 같은 3'-조절 영역의 기능성 또는 활성을 방해하지 않고 하나 이상의 뉴클레오티드 치환(들), 삽입(들) 및/또는 결실(들)에 의하여 변형될 수 있다. 더욱이 서열의 변형에 의하여 프로모터 활성은 증가될 수 있거나, 또는 보다 활성이 큰 프로모터, 심지어 이종 생물체의 프로모터로 완전히 대체되는 것도 가능하다. 식물체에서의 발현을 위해서는 상기 언급된 것처럼 핵산분자는 올바른 시점에 요구되는 공간적 발현 양상으로 유전자를 발현하는 적절한 프로모터에 작동가능하게 연결되거나 프로모터를 포함해야 한다.
작동가능하게 연결된
본 발명에서 사용된 용어 "작동가능하게 연결된"은 프로모터 서열과 해당 유전자 간의 기능적 연관을 말하는 것으로, 그럼으로써 프로모터 서열이 해당 유전자의 전사를 개시할 수 있다.
구성적 프로모터
"구성적 프로모터"는 반드시 항상은 아니더라도 생장 및 발달의 대부분 기간 중에 그리고 대부분의 환경적 조건하에서 적어도 하나의 세포, 조직 또는 기관에서 전사적으로 활성인 프로모터를 말한다. 하기 표 2a가 구성적 프로모터의 예이다.
표 2a: 구성적 프로모터의 예
편재하는 프로모터
편재하는 프로모터는 생물체의 실질적으로 모든 조직이나 세포에서 활성을 가진 것이다.
발달적으로
조절된 프로모터
발달적으로 조절된 프로모터는 특정 발달 단계 중에 또는 발달적 변화가 일어나는 식물체의 부위에서 활성을 가진 것이다.
유도성 프로모터
유도성 프로모터는 화학적 (Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), 환경적 또는 물리적 자극에 반응하여 전사 개시가 유도되거나 증가되거나 또는 식물이 다양한 스트레스 환경에 노출될 때 "스트레스 유도성", 즉 활성화될 수 있거나 또는, 식물이 다양한 병원균에 노출될 때 "병원균 유도성", 즉 활성화될 수 있다.
기관 특이적/조직 특이적 프로모터
기관 특이적 또는 조직 특이적 프로모터는 잎, 뿌리, 종자조직 등과 같이 특정 기관 또는 조직에서 우선적으로 발현 개시가 가능한 것이다. 예를 들면, "뿌리 특이적 프로모터"는 식물의 다른 부위에 약간 누설된(leaky) 발현을 허용하지만, 실질적으로 식물의 다른 부위를 제외하고 식물 뿌리에서 우세하게 전사적으로 활성이 있는 프로모터이다. 특정 세포에서만 전사를 개시할 수 있는 프로모터는 본 발명에서 "세포 특이적"이라 한다.
뿌리 특이적 프로모터의 예는 하기 표 2b에 열거된다:
표 2b: 뿌리 특이적 프로모터의 예
종자 특이적 프로모터는 종자 조직에서만 반드시 배타적으로는 아니지만 (누설 발현의 경우) 종자조직에서 우세하게 전사적으로 활성인 것이다. 종자 특이적 프로모터는 종자발달 및/또는 발아 중에 활성일 것이다. 종자 특이적 프로모터는 배유 및/또는 호분층 및/또는 배(embryo) 특이적일 수 있다. 종자 특이적 프로모터 (배유/호분층/배 특이적)의 예는 하기 표 2c, d, e, f에 제시된다. 종자 특이적 프로모터의 추가적인 예는 Qing Qu 및 Takaiwa (Plant Biotechnol. J. 2, 1 13-125, 2004)에 제시되며, 이의 개시는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다.
표 2c: 종자 특이적 프로모터의 예
표 2d: 배유 특이적 프로모터의 예
표 2e: 배(embryo) 특이적 프로모터의 예
표 2f: 호분층 특이적 프로모터의 예
본 발명에서 정의된 녹색 조직 특이적 프로모터는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 실질적으로 식물의 다른 부위를 제외하고 녹색 조직에서 우세하게 전사적으로 활성이 있는 프로모터이다.
본 발명의 방법을 수행하는데 사용될 수 있는 녹색 조직 특이적 프로모터의 예는 하기의 표 2g에 있다.
표 2g: 녹색 조직 특이적 프로모터의 예
조직 특이적 프로모터의 다른 예는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 실질적으로 식물의 다른 부위를 제외하고 분열조직에서 우세하게 전사적으로 활성이 있는 분열조직 특이적 프로모터이다. 본 발명의 방법을 수행하는데 사용될 수 있는 녹색 분열조직 특이적 프로모터의 예는 하기의 표 2h에 있다.
표 2h: 분열조직 특이적 프로모터의 예
종결신호(Term
inator
)
용어 "종결신호"는 일차 전사체의 3' 프로세싱 및 폴리아데닐화와 전사 종결의 신호가 되는 전사 단위의 말단에 있는 DNA 서열인 조절 서열이다. 종결신호는 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 첨가된 종결신호는 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
선발
마커
(유전자)/리포터 유전자
"선발 마커", "선발 마커 유전자" 또는 "리포터 유전자"는 본 발명의 핵산 구축물로 감염되거나 형질전환된 세포의 동정 및/또는 선발을 촉진하기 위하여 발현된 세포에 표현형을 부여하는 임의의 유전자를 포함한다. 이들 마커 유전자는 일련의 상이한 원리를 통해 핵산 분자의 성공적인 전달을 확인 가능하게 한다. 적절한 마커는 항생제나 제초제 저항성을 주거나 새로운 대사 형질을 도입하거나 또는 시각적인 선발을 가능하게 하는 마커로부터 선택된다. 선발 마커 유전자의 예는 항생제 (네오마이신 및 카나마이신을 인산화하는 nptII, 하이그로마이신을 인산화하는 hpt, 또는 예를 들면, 블레오마이신, 스트렙토마이신, 테트라사이클린, 클로람페니콜, 앰피실린, 겐타마이신, 제네티신 (G418), 스펙티노마이신, 블라스티시딘에 저항성을 주는 유전자), 제초제 (예를 들면, Basta에 저항성을 제공하는 bar; 글리포제이트에 대한 저항성을 제공하는 aroA 또는 gox, 또는 예를 들면, 이미다졸리논, 포스피노트리신, 설포닐우레아에 저항성을 주는 유전자)에 저항성을 주는 유전자 또는 대사적 형질을 제공하는 유전자 (식물이 유일한 탄소원으로 만노즈를 이용하게 하는 manA 또는 자일로스 이용을 위한 자일로스 이성화효소, 또는 2-데옥시글루코스에 대한 저항성 같은 반영양적 마커)를 포함한다. 가시적 마커 유전자의 발현으로 발색 (예를 들면 베타-글루쿠로니다제, GUS, 또는 발색된 기질, 예를 들면 X-Gal을 가진 베타-갈락토시다제), 발광 (루시페린/루시파라제 시스템 같은) 또는 형광 (녹색 형광 단백질, GFP, 및 이의 유도체)이 형성된다. 이 목록은 소수의 가능한 마커만을 나타낸다. 당업자는 상기 마커에 친숙하다. 생물체 및 선발 방법에 따라 다른 마커가 선호된다.
형질전환된(
Transgenic
)/외래도입유전자(
Transgene
)/재조합
본 발명에서 "형질전환된", "외래도입유전자" 또는 "재조합"은 예를 들면, 핵산 서열, 발현카세트, 핵산 서열을 포함하는 유전자 구축물 또는 벡터, 또는 본 발명에 따른 핵산 서열, 발현 카세트나 벡터로 형질전환된 생물체, 하기에 기재된 재조합 방법에 의해 생성된 모든 구조물에 관한 의미이며:
(a) 본 발명의 방법에 유용한 단백질을 암호화하는 핵산서열, 또는
(b) 본 발명에 따른 핵산 서열에 작동가능하게 연결된 유전자 조절 서열(들), 예를 들면 프로모터, 또는
(c) a) 및 b)
자연적인 유전적 환경에 있지 않거나, 재조합 방법으로 변형되어 왔으므로 예를 들면, 하나 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역위 또는 삽입의 유형의 변형이 가능하다. 자연적인 유전적 환경은 원래의 식물에서 자연적인 게놈 또는 염색체상의 위치나 게놈 라이브러리에서의 존재를 의미하는 것으로 이해된다. 게놈 라이브러리의 경우, 핵산 서열의 자연적인 유전적 환경은 바람직하게는 적어도 부분적으로는 보유된다. 환경은 적어도 한 쪽의 핵산서열을 플랭킹하며 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1000 bp, 가장 바람직하게는 적어도 5000 bp 길이의 서열을 갖는다. 자연적으로 발생하는 발현 카세트, 예를 들면 본 발명의 방법에 유용한 폴리펩티드를 암호화하는 해당 핵산 서열과 핵산 서열의 자연적 프로모터의 자연적으로 생긴 조합은 이 발현 카세트가 예를 들면 돌연변이 처리 같은 비자연적인 합성 ("인위적") 방법으로 변형될 때 형질 전환 발현카세트가 된다. 적절한 방법이 예를 들면 US 5,565,350 또는 WO 00/15815에 기재되어 있다.
본 발명의 목적상, 형질전환된 식물은 상기처럼 본 발명의 방법에서 사용된 핵산은 상기 식물의 게놈상의 자연적 위치에 있지 않아 핵산이 동종에서 또는 이종에서 발현될 수 있다는 의미로 이해된다. 그러나, 언급된 바와 같이, "형질전환된"은 또한 본 발명에 있어 또는 본 발명 방법에 사용된 핵산은 식물 게놈 내의 자연적 위치에 있는 반면, 그 서열이 자연적 서열에 대하여 변형되었고 및/또는 자연적 서열의 조절 서열이 변형되었음을 의미한다. "형질전환된"은 핵산의 동종 또는 바람직하게는 이종 발현이 일어나는 게놈 내의 비자연적 위치에서 본 발명에 따른 핵산의 발현을 의미하는 것으로 바람직하게는 이해된다. 바람직한 형질전환된 식물이 본 발명에서 언급된다.
형질전환
본 발명에 언급된 용어 "도입" 또는 "형질전환"은 전달에 사용된 방법에 관계 없이 외래 폴리뉴클레오티드의 숙주 세포로의 전달을 포함한다. 기관 발생이나 배발생에 의하여 연이은 클론 번식이 가능한 식물 조직은 본 발명의 유전자 구축물로 형질전환될 수 있으며, 전체 식물체가 이로부터 재분화된다. 선택된 특정 조직은 형질전환될 특정 종에 이용 가능하며 가장 잘 맞는 클론 번식 시스템에 따라 다양할 것이다. 전형적인 조직 표적은 잎 디스크, 화분, 배, 자엽, 하배축, 대배우체, 캘러스 조직, 기존의 분열조직 (예를 들면, 정단 분열조직, 액아, 및 뿌리 분열조직), 및 유도된 분열조직 (예를 들면, 자엽 분열조직 및 하배축 분열조직)을 포함한다. 폴리뉴클레오티드는 일시적으로 또는 안정적으로 숙주 세포에 도입되며, 예를 들면, 플라스미드처럼 비통합적으로 유지된다. 다르게는, 숙주 게놈으로 통합된다. 결과적인 형질전환 식물 세포는 당업자에게 주지된 방식으로 형질전환 식물을 재분화하는데 사용된다.
외래 유전자의 식물 게놈으로 전달을 형질전환이라 부른다. 식물 종의 형질전환은 지금 꽤 통상적인 기술이다. 유리하게도, 임의의 몇 가지 형질전환 방법이 목적 유전자를 적절한 조상 세포로의 도입에 사용될 수 있다. 식물 조직 또는 식물 세포로부터 식물의 형질전환 및 재분화에 관하여 기재된 방법은 일시적인 또는 안정한 형질전환에 이용될 수 있다. 형질전환 방법은 리포좀, 전기천공법, 유리 DNA 흡수를 증가시키는 화학물질, 식물체 내로 DNA의 직접적인 주입, 입자총 충격법, 바이러스 또는 화분을 이용한 형질전환 및 미세주입(microprojection)을 포함한다. 방법은 원형질에 대한 칼슘/폴리에틸렌 글리콜법 (Krens, F.A. 등, (1982) Nature 296, 72-74; Negrutiu I 등 (1987) Plant Mol Biol 8: 363-373); 원형질의 전기천공법 (Shillito R.D. 등 (1985) Bio/Technol 3, 1099-1102); 식물로 미세주사(microinjection) (Crossway 등, (1986) Mol. Gen Genet 202: 179-185); DNA 또는 RNA 코팅된 입자 충격법 (Klein TM 등, (1987) Nature 327: 70) (비통합적) 바이러스로 감염 등으로부터 선택할 수도 있다. 형질전환 작물을 포함한 형질전환 식물은 바람직하게는 아그로박테리움-매개된 형질전환을 통해 제조된다. 유리한 형질전환방법은 식물체에서의 형질전환이다. 이를 위해, 예를 들면, 아그로박테리아를 식물 종자 상에 작용하게 하거나 식물 분열조직을 아그로박테리아로 접종하는 것이 가능하다. 형질전환된 아그로박테리아의 현탁액을 손상되지 않은 식물이나 적어도 꽃 원기에 작용하게 하는 것이 본 발명에 따라 특히 편리하다는 것이 입증되었다. 처리된 식물의 종자를 얻을 때까지 식물체를 키운다 (Clough and Bent, Plant J. (1998) 16, 735-743). 벼의 아그로박테리움 매개된 형질전환 방법은 하기 임의의 것에 기재된 것처럼 벼 형질전환에 관한 잘 알려진 방법들을 포함한다: 유럽특허출원 EP 1198985 A1, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan 등 (Plant Mol Biol 22 (3): 491-506, 1993), Hiei 등 (Plant J 6 (2): 271-282, 1994), 상기 명세서는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다. 옥수수 형질전환의 경우에, 바람직한 방법은 Ishida 등 (Nat. Biotechnol 14(6): 745-50, 1996) 또는 Frame 등 (Plant Physiol 129(1): 13-22, 2002)에 기재된 것이며, 상기 명세서는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다. 상기 방법들은 [B. Jenes 등, Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143] 및 [Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225]에 예로서 기재되어 있다. 핵산 또는 발현될 구축물은 바람직하게는 아그로박테리움 투머파시엔스 형질전환에 적절한 벡터, 예를 들면 pBin19 내로 클로닝된다 (Bevan 등, Nucl. Acids Res. 12 (1984) 8711). 상기 벡터로 형질전환된 아그로박테리아가 아라비돕시스처럼 모델로 사용된 식물 (본 발명의 범위 내의 아라비돕시스 탈리아나는 작물로 고려되지 않는다)이나 담배 같은 작물의 예를 들면, 상처 내거나 잘게 썬 잎을 아그로박테리아 용액에 적신 후 적절한 배지에 배양하는 것과 같은 작물 형질전환을 위해 알려진 방식으로 사용될 수 있다. 아그로박테리움 투머파시엔스에 의한 식물의 형질전환은 예를 들면, [Hofgen and Willmitzer in Nucl. Acid Res. (1988) 16, 9877]에 의하여 기재되었거나, 특히 [F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38]에 알려져 있다.
온전한 식물로 재생되는 체세포의 형질전환 외에, 식물의 분열조직 특히 배우자로 발달하는 세포의 형질전환이 가능하다. 이 경우에, 형질전환된 배우자는 자연적인 식물 발달 과정을 거쳐 형질전환 식물이 된다. 따라서 예를 들면, 아라비돕시스의 종자가 아그로박테리아로 처리되고, 발달하는 식물체로부터 취한 종자 중의 일부분이 형질전환되어 형질전환 식물체로 된다 [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. 또 다른 방법은 화서의 반복적인 제거에 근거하며 근생엽 중앙의 절단 부위를 형질전환된 아그로박테리아와 함께 배양하면 형질전환된 종자를 이후에 얻을 수 있다 (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). 그러나, 특히 효과적인 방법은 "화서 담그기 (floral dip)" 방법의 변형인 진공 침윤 (vacuum infiltration)이다. 아라비돕시스의 진공 침윤의 경우, 감압 하에 온전한 식물체를 아그로박테리아 현탁액으로 처리하는 것이고 [Bechthold, N (1993). C R Acad Sci Paris Life Sci, 316: 1194-1199], "화서 담그기법"에서는 발달 중인 화서 조직을 계면활성제가 처리된 아그로박테리아 현탁액과 잠깐 배양하는 것이다 [Clough, SJ and Bent AF (1998) Plant J. 16, 735-743]. 양자의 경우에 특정 비율의 형질전환 종자가 수확되며, 이들 종자는 상기 기재된 선발 조건하에서 재배함으로써 형질전환되지 않은 종자와 구분된다. 색소체는 모계로 유전되기 때문에 색소체의 안정적인 형질전환의 잇점은 대부분의 작물에서 화분을 통한 외래도입유전자의 유전이 감소되거나 제거된다는 점이다. 엽록체 게놈의 형질전환은 일반적으로 Klaus 등, 2004 [Nature Biotechnology 22 (2), 225-229]에 도식적으로 표시된 과정에 의하여 수행된다. 간단히, 형질전환될 서열을 선발 마커 유전자와 함께 엽록체 게놈에 상동인 플랭킹 서열 사이에 클론한다. 이들 상동 플랭킹 서열이 플라스톰(plastome) 내로 자리 특이적으로 통합된다. 색소체 형질전환은 많은 다른 식물 종에 대해 기술되어 왔으며, 개관은 [Bock (2001) Transgenic plastids in basic Research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38] 또는 [Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28]에 있다. 추가의 생물공학적 진보는 마커 없는 색소체 형질전환체의 형태로 최근 보고되었으며, 이는 일시적인 동시통합된(co-integrated) 마커 유전자에 의해 생성될 수 있다 (Klaus 등, 2004, Nature Biotechnology 22(2), 225-229).
TILLING
TILLING (Targeted Induced Local Lesions In Genomes)은 변형된 발현 및/또는 활성을 가진 단백질을 암호화하는 핵산을 생성 및/또는 동정하는데 유용한 돌연변이 기술을 말한다. TILLING은 또한 상기 돌연변이체를 가진 식물의 선발을 가능하게 한다. 이들 돌연변이체는 강도나 위치 또는 시기상의 변형된 발현을 보인다 (만일 돌연변이가 프로모터에 영향을 준다면). 이들 돌연변이체는 자체의 자연적 형태의 유전자에 비하여 훨씬 높은 활성을 나타낸다. TILLING은 고밀도 돌연변이 유발과 고속처리 탐색 방법을 조합한 것이다. TILLING의 전형적인 단계는 하기와 같다: (a) EMS 돌연변이유발 (Redei GP 및 Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chu NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 1682; Feldmann 등, (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) DNA 준비 및 개체의 풀링(pooling); (c) 관심 영역의 PCR 증폭; (d) 이형 이중가닥 (heteroduplexes)이 되게 변성 및 어닐링; (e) DHPLC로 풀(pool)에 이형 이중가닥이 있는지를 크로마토그램 상의 여분의 피크로 검출; (f) 돌연변이체 개체의 동정; (g) 돌연변이 PCR 산물의 염기서열결정. TILLING의 방법은 당업계에 주지되어 있다 (McCallum 등, (2000) Nat Biotechnol 18: 455-457; Stemple (2004) Nat Rev Genet 5(2): 145-50).
수확량
일반적인 의미에서의 용어 "수확량"은 경제적 가치 있는 측정 가능한 생산량을 말하며, 전형적으로 특정 작물, 면적, 및 기간에 관련이 있다. 개개 식물체 부분이 직접적으로 수, 크기 및/또는 중량에 근거한 수확량에 기여하거나, 또는 실제 수확량은 작물 에이커 및 년당 수확량이고, 이는 총생산량 (수확된 및 평가된 생산량을 포함)을 재배된 에이커로 나눔으로써 결정된다.
증가/향상/강화
용어 "증가", "향상", 또는 "강화"는 서로 호환성 있게 사용할 수 있으며, 본 발명에서 정의된 대조구 식물과 비교하여 적어도 5%, 6%, 7%, 8%, 9% 또는 10%, 바람직하게는 적어도 15% 또는 20%, 더욱 바람직하게는 25%, 30%, 35% 또는 40% 이상의 수확량 및/또는 생장을 의미한다.
종자 수확량
증가된 종자 수확량은 다음 중 하나 이상으로 나타난다: a) 개별 종자당 및/또는 식물체당 및/또는 헥타르 또는 에이커당 종자 생물량 (총 종자 중량)의 증가; b) 식물체당 꽃 수의 증가; c) 증가된 수의 (충만된(filled)) 종자; d) 증가된 종자 충만도 (충만된 종자 수를 총 종자 수로 나눈 비로 나타냄); e) 증가된 수확 지수 (종자 같은 수확할 수 있는 부분의 수확량을 총 생물량으로 나눈 비율); 및 f) 증가된 천 개 낱알 중량 (TKW) (카운트한 충만된 종자 및 이의 총 중량으로부터 외삽됨). 증가된 TKW는 증가된 종자 크기 및/또는 종자 중량, 및 배 및/또는 배유 크기의 증가에 기인한다.
증가된 종자 수확량은 또한 종자 크기 및/또는 종자 부피의 증가로 나타낼 수 있다. 더욱이, 종자 수확량의 증가는 또한 종자 면적 및/또는 종자 길이 및/또는 종자 폭 및/또는 종자 주계의 증가로 나타난다. 증가된 수확량으로 외형이 변형되거나, 또는 변형된 외형으로 인해 수확량이 증가할 수도 있다.
식물
본 발명에서 사용된 용어 "식물"은 전체식물, 식물 및 종자, 어린 줄기, 줄기, 잎, 뿌리 (괴경 포함), 꽃, 및 조직과 기관을 포함하는 식물 부분의 조상 및 자손을 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다. 용어 "식물"은 또한 식물 세포, 현탁 배양액, 캘러스 조직, 배, 분열 영역, 배우체, 포자체, 화분 및 소포자를 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다.
본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 하기를 포함하는 목록에서 선택된 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다: 에이서 (Acer spp.), 악티니디아 (Actinidia spp.), 아벨모스쿠스 ( Abelmoschus spp.), 아가베 시살라나 ( Agave sisalana ), 아그로피론 (Agropyron spp.), 아그로스티스 스톨로니페라 ( Agrostis stolonifera ), 알리움 (Allium spp.), 아마란투스 ( Amaranthus spp.), 암모필라 아레나리아 ( Ammophila arenaria), 아나나스 코모수스 ( Ananas comosus ), 안노나 (Annona spp.), 아피움 그라베오렌스 (Apium graveolens ), 아라키스 ( Arachis spp.), 알토칼푸스 ( Artocarpus spp.), 아스파라거스 오피시날리스 ( Asparagus officinalis), 아베나 (Avena spp.) (예를 들면, 아베나 사티바 ( Avena sativa ), 아베나 파투아 ( Avena fatua), 아베나 비잔티나 ( Avena byzantina ), 아베나 파투아 var . 사티바 ( Avena fatua var . sativa ), 아베나 하이브리다 ( Avena hybrida )), 아베로아 카람볼라 (Averrhoa carambola ), 뱀부사 ( Bambusa sp .), 베닌카사 히스피다 (Benincasa hispida), 벨톨레티아 엑셀세아 ( Bertholletia excelsea ), 베타 불가리스 (Beta vulgaris), 브라시카 ( Brassica spp.) (예를 들면, 브라시카 나푸스 ( Brassica napus ), 브라시카 라파 ( Brassica rapa ssp.) [캐놀라, 유채, 순무]), 카다바 파리노사 (Cadaba farinosa ), 카멜리아 시넨시스 (Camellia sinensis ), 칸나 인디카 ( Canna indica ), 칸나비스 사티바 (Cannabis sativa ), 캡시쿰 ( Capsicum spp.), 카렉스 엘라타 (Carex elata ), 카리카 파파야 (Carica papaya ), 카리사 마크로칼파 (Carissa macrocarpa ), 카리야 (Carya spp .), 카르타무스 팅크토리우스 (Carthamus tinctorius), 카스타네아 (Castanea spp.), 케이바 펜탄드라 (Ceiba pentandra), 키코리움 엔디비아 (Cichorium endivia ), 신나모뭄 ( Cinnamomum spp .), 시트룰루스 라나투스 (Citrullus lanatus), 시트루스 (Citrus spp.), 코코스 (Cocos spp .), 코페아 ( Coffea spp.), 콜로카시아 에스쿨렌타 (Colocasia esculenta), 콜라 (Cola spp.), 콜코루스 (Corchorus sp.), 코리안드룸 사티붐 (Coriandrum sativum), 코리루스 (Corylus spp.), 크라태구스 (Crataegus spp.), 크로쿠스 사티부스 (Crocus sativus), 쿠쿨비타 (Cucurbita spp .), 쿠쿠미스 ( Cucumis spp.), 키나라 ( Cynara spp.), 다우쿠스 카로타 (Daucus carota ), 데스모디움 ( Desmodium spp.), 디모칼푸스 론간 (Dimocarpus longan ), 디오스코레아 ( Dioscorea spp.), 디오스피로스 (Diospyros spp.), 에키노크로아 (Echinochloa spp .), 엘래이스 ((Elaeis (예를 들면, 엘래이스 귀넨시스 (Elaeis guineensis), 엘레이스 올레이페라 (Elaeis oleifera )), 엘레우신 코라카나 ( Eleusine coracana), 에리안투스 (Erianthus sp .), 에리오보트리아 야포니카 (Eriobotrya japonica), 유카립투스 ( Eucalyptus spp.), 유게니아 유니플로라 ( Eugenia uniflora), 파고피룸 ( Fagopyrum spp.), 파구스 (Fagus spp.), 페스투카 아룬디나케이 (Festuca arundinacea), 피쿠스 카리카 (Ficus carica ), 폴투넬라 ( Fortunella spp.), 프라가리아 ( Fragaria spp.), 깅코 빌로바 ( Ginkgo biloba ), 글라이신 (Glycine spp.) (예를 들면, 글라이신 맥스 (Glycine max ), 소야 히스피다 (Soja hispida ) 또는 소야 맥스 ( Soja max )), 고시피움 힐수툼 ( Gossypium hirsutum), 헬리안투스 ( Helianthus spp.) (예를 들면, 헤리안투스 안누스 (Helianthus annuus)), 헤메로칼리스 풀바 ( Hemerocallis fulva ), 히비스쿠스 (Hibiscus spp.) 홀데움 ( Hordeum spp.) (예를 들면, 홀데움 불가레 ( Hordeum vulgare)), 이포모에아 바타타스 ( Ipomoea batatas ), 주글란스 ( Juglans spp.), 락투카 사티바 (Lactuca sativa), 라티루스 (Lathyrus spp.), 렌스 쿨리나리스 (Lens culinaris), 리눔 우시타티시뭄 (Linum usitatissimum), 리치 키넨시스 (Litchi chinensis), 로투스 ( Lotus spp.), 루파 아쿠탄굴라 ( Luffa acutangula ), 루피누스 ( Lupinus spp.), 루줄라 실바티카 (Luzula sylvatica ), 라이코펠시콘 ( Lycopersicon spp.) (예를 들면, 라이코펠시콘 에스쿨렌툼 (Lycopersicon esculentum ), 라이코펠시콘 라이코펠시쿰 ( Lycopersicon lycopersicum ), 라이코펠시콘 피리폴메 ( Lycopersicon pyriforme)), 마크로틸로마 (Macrotyloma spp.), 말루스 (Malus spp.), 말피기아 에말기나타 ( Malpighia emarginata), 맘메아 아메리카나 (Mammea americana ), 망기페라 인디카 ( Mangifera indica ), 마니호트 ( Manihot spp.), 마닐카라 자포타 (Manilkara zapota), 메디카고 사티바 (Medicago sativa), 메릴로투스 ( Melilotus spp.), 멘타 ( Mentha spp.), 미스칸투스 시넨시스 ( Miscanthus sinensis ), 모몰디카 ( Momordica spp.), 모루스 니그라 (Morus nigra), 무사 (Musa spp.), 니코티아나 ( Nicotiana spp.), 올레아 ( Olea spp.), 오푼티아 (Opuntia spp.), 오르니토푸스 (Ornithopus spp.), 오리자 (Oryza spp.) (예를 들면, 오리자 사티바 (Oryza sativa ), 오리자 라티포리아 (Oryza latifolia )), 패니쿰 미리아케움 ( Panicum miliaceum ), 패니쿰 벌가툼 ( Panicum virgatum ), 파시플로라 에둘리스 ( Passiflora edulis), 파스티나카 사티바 ( Pastinaca sativa ), 페니세툼 (Pennisetum sp .), 펠세아 ( Persea spp.), 페트로셀리눔 크리스품 (Petroselinum crispum), 파라리스 아룬디나케아 (Phalaris arundinacea), 파세올루스 ( Phaseolus spp.), 플레움 프라텐세 ( Phleum pratense), 피닉스 ( Phoenix spp .), 프라그미테스 오스트라리스 (Phragmites australis), 피사리스 (Physalis spp.), 피누스 ( Pinus spp.,) 피스타키아 베라 (Pistacia vera ), 피숨 (Pisum spp.), 포아 ( Poa spp.), 포푸러스 ( Populus spp.), 프로소피스 ( Prosopis spp.), 프루누스 (Prunus spp.), 프시디움 ( Psidium spp.), 푸니카 그라나툼 ( Punica granatum ), 피루스 코무니스 ( Pyrus communis ), 켈쿠스 (Quercus spp.), 라파누스 사티부스 (Raphanus sativus), 레움 라발바룸 (Rheum rhabarbarum), 리베스 (Ribes spp.), 리키누스 콤무니스 ( Ricinus communis ), 루부스 (Rubus spp.), 사카룸 (Saccharum spp.), 살릭스 ( Salix spp.), 삼부쿠스 (Sambucus spp.), 세카레 세레알레 ( Secale cereale ), 세사뭄 ( Sesamum spp.), 시나피스 ( Sinapis sp .), 솔라눔 ( Solanum spp.) (예를 들면, 솔라눔 투베로숨 (Solanum tuberosum ), 솔라눔 인테그리폴리움 ( Solanum integrifolium ) 또는 솔라눔 라이코펠시쿰 (Solanum lycopersicum )), 솔굼 바이칼라 ( Sorghum bicolor ), 스피나시아 ( Spinacia spp.), 시지기움 ( Syzygium spp.), 타게테스 ( Tagetes spp.), 타마린두스 인디카 ( Tamarindus indica ), 테오브로마 카카오 (Theobroma cacao ), 트리폴리움 (Trifolium spp.), 트리티코세칼레 림파우이 (Triticosecale rimpaui ), 트리티쿰 (Triticum spp. (예를 들면, 트리티쿰 아에스티붐 (Triticum aestivum ), 트리티쿰 두룸 (Triticum durum ), 트리티쿰 툴기둠 (Triticum turgidum ), 트리티쿰 하이베르눔 ( Triticum hybernum ), 트리티쿰 마차 (Triticum macha ), 트리티쿰 사티붐 (Triticum sativum ) 또는 트리티쿰 불가레 (Triticum vulgare)), 트로패오룸 미누스 ( Tropaeolum minus ), 트로패오룸 마주스 ( Tropaeolum majus ), 박시니움 ( Vaccinium spp.), 비시아 ( Vicia spp.), 비그나 (Vigna spp.), 비올라 오도라타 ( Viola odorata ), 비티스 ( Vitis spp.), 제아 메이즈 ( Zea mays ), 지자니아 팔루스트리스 (Zizania palustris ), 지지푸스 ( Ziziphus spp.).
발명의 상세한 설명
I.
HARPlN
첫 번째 구현예에 따라, 본 발명은 HpaG(Harpin-associated Factor G) 폴리펩티드를 암호화하는 핵산의 식물에서 발현의 조절을 포함하는 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
HpaG 폴리펩티드를 암호화하는 핵산의 발현을 조절하는 (바람직하게는, 증가) 바람직한 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에의 도입 및 발현이다.
이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 HpaG 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 HpaG 폴리펩티드를 암호화하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산은 (따라서 본 발명의 방법 수행에 유용한) 하기에 기술될 유형의 단백질을 암호화하는 임의의 핵산이며, 이후 또한 "HpaG 핵산" 또는 "HpaG 유전자"라 칭한다.
본 발명에서 정의된 HpaG 폴리펩티드는 하기 특징을 가지는 폴리펩티드를 포함한다:
(i) 서열번호 2로 표시된 HpaG 폴리펩티드 서열에 증가하는 순으로 선호되는, 적어도 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 그 이상의 서열 동일성; 및
(ii) 글리신(glycine) 함량은 약 13% 내지 약 25%, 글루타민(glutamine) 함량은 약 13% 내지 약 20%, 시스테인(cysteine) 함량은 약 0% 내지 약 1 %, 히스티딘(histidine) 함량은 약 0% 내지 약 1 %의 범위이며, 트립토판(tryptophan)은 없는 아미노산 조성.
바람직하게는, HpaG 폴리펩티드의 길이는 약 121 내지 약 143 아미노산의 범위이다.
바람직하게는, HpaG 단백질은 또한 보존된 모티프 1 (서열번호 3):
G (G/E/D) (N/E) X (Q/R/P) Q (A/S) GX (N/D) G
상기에서 4 번째 위치의 X는 임의의 아미노산일 수 있으며, 바람직하게는 S, N, P, R, 또는 Q 중의 하나이며, 상기에서 9 번째 위치의 X는 임의의 아미노산일 수 있으며, 바람직하게는 Q, E, S, 또는 P중의 하나이고;
및/또는 보존된 모티프 2 (서열번호 4)을 포함한다:
(P/A/V) S (P/Q/A) (F/L/Y) TQ (M/A) LM (H/N/Q) IV (G/M) (E/D/Q)
선택적으로, HpaG 단백질은 또한 보존된 모티프 3:
QGISEKQLDQLL
및/또는 보존된 모티프 4를 가진다:
ILQAQN
더욱이, HpaG 폴리펩티드 (적어도 천연 형태에서)는 아라비돕시스 탈리아나 생태형 (Arabidopsis thaliana ecotype) Cvi-0에서 과민성 반응을 유도한다 (Kim 등, J. Bacterid. 185, 3155-3166, 2003).
다르게는, HpaG 단백질의 상동체는 서열번호 2로 표시된 아미노산에 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 전체적인 서열 동일성을 가지며, 단, 상기 상동 단백질은 상기 기재된 보존된 모티프를 포함한다. 전체적인 서열 동일성은 프로그램 GAP (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은 총체적인 정렬 알고리즘(global alignment algorithm)을 사용하여, 바람직하게는 디폴트 매개변수(default parameters)를 이용하여 결정되었다. 서열 동일성은 전체적인 서열 동일성에 비해 일반적으로 보존된 도메인 또는 모티프만이 고려되었을 때 더 높을 것이다.
용어 "도메인" 및 "모티프"는 본 발명의 "정의" 섹션에 정의된 바 있다. 도메인 동정을 위한 전문가 데이터베이스, 예를 들면 SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242- 244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002))이 존재한다. 단백질 서열의 인 실리코 분석용 도구 세트가 ExPASY 프로테오믹스 서버에서 유용하다 (hosted by the Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31: 3784-3788 (2003)). 도메인은 또한 서열정렬과 같은 상투적인 기술을 사용하여서도 동정될 수 있다.
비교를 위한 서열정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는(matches) 수는 최대로, 공백(gaps)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘을 사용한다. BLAST 알고리즘 (Altschul 등 (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 복수 서열정렬 알고리즘 (multiple sequence alignment algorithm; version 1.83)을 사용하여, 디폴트 페어와이즈 정렬 변수(default pairwise alignment parameters) 및 백분율로 스코링(scoring)하는 방법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell et al., BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 서열 동일성 값은 핵산 또는 아미노산 전체 서열에 걸쳐, 또는 선정된 도메인 또는 보존된 모티프(들)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default parameters)를 사용하여 결정될 수 있다.
본 발명은 서열번호 2의 폴리펩티드 서열을 암호화하는 서열번호 1로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 HpaG 암호화 핵산 또는 HpaG 유사 폴리펩티드를 사용하여 수행될 수 있다.
HpaG 폴리펩티드를 암호화하는 핵산의 예는 본 발명의 실시예 1의 표 A에 제시되어 있다. 제시된 핵산이 본 발명의 방법의 수행에 유용하다. 실시예 1의 표 A에 제시된 아미노산 서열은 서열번호 2로 표시된 HpaG 폴리펩티드의 오쏘로그(orthologue) 및 패럴로그(paralogue)의 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에서 정의된 바 있다. 오쏘로그 및 패럴로그는 소위 상호간 블라스트(Reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있다. 전형적으로 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 1의 표 A에 열거된 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열 (조회 서열은 서열번호 1 또는 서열번호 2, 두 번째 BLAST는 따라서 잔토모나스(Xanthomonas)서열과 대조하는 것이다)이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.
높은 ranking hits은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 의미있다 (또는 다른 말로, 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에다가, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 다음에 neighbour joining tree가 사용된다.
핵산 변이체도 본 발명의 방법 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 1의 표 A에 제시된 아미노산 서열 중 임의의 하나의 상동체 및 유도체를 암호화하는 핵산을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 본 발명의 방법에는 실시예 1의 표 A에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 암호화하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 HpaG 폴리펩티드를 암호화하는 핵산의 일부, HpaG 폴리펩티드를 암호화하는 핵산에 혼성화 되는 핵산, 및 유전자 셔플링에 의해 얻은 HpaG 폴리펩티드를 암호화하는 핵산의 변이체를 포함한다. 용어 혼성화 되는 서열 및 유전자 셔플링은 본 발명에 기재된 바 있다.
본 발명의 방법의 수행은 전장 핵산 서열의 사용에 의존하지 않으므로, HpaG 폴리펩티드를 암호화하는 핵산은 전장 핵산일 필요는 없다. 본 발명에서는, 실시예 1의 표 A에 제시된 핵산 서열 중 임의의 하나의 일부, 또는 실시예 1의 표 A에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 일부를 식물에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산의 일부분은 예를 들면, 핵산에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 암호화 (또는 비암호화) 서열에 융합될 수도 있다. 다른 암호화 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.
본 발명의 방법에 유용한 일부분은 본 발명에 정의된 HpaG 폴리펩티드를 암호화하며, 실시예 1의 표 A에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 1의 표 A에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 1의 표 A에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그(orthologue) 또는 패럴로그(paralogue)를 암호화하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 증가하는 순으로 선호되는 적어도 길이 70, 90, 110, 130 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 1의 표 A에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 1의 표 A에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 1의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 도 2에 도시된 바와 같이 계통수 구축에 사용 시, 임의의 다른 그룹과 보다는 서열번호 2로 표시된 아미노산 서열을 포함하는 HpaG 폴리펩티드 그룹과 클러스터되는 경향이 있는 아미노산 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건하에서, 바람직하게는 스트린전트 조건하에서, 본 발명에서 정의된 HpaG 폴리펩티드를 암호화하는 핵산, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산이다.
본 발명에 따라, 실시예 1의 표 A에 제시된 핵산 서열 중 임의의 하나와 혼성화가 가능한 핵산, 또는 실시예 1의 표 A에 제시된 임의의 핵산 서열의 오쏘로그(orthologue), 패럴로그(paralogue) 또는 상동체를 암호화하는 핵산과 혼성화가 가능한 핵산의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다
본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 HpaG 폴리펩티드를 암호화하며, 실시예 1의 표 A에에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 1의 표 A에 제시된 핵산 중의 임의의 하나에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 1의 표 A에에 제시된 임의의 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산과 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 1로 표시된 핵산에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 도 2에 도시된 것과 같은 계통수 구축에 사용 시 임의의 다른 그룹보다 서열번호 2로 표시된 아미노산 서열을 포함하는 HpaG 폴리펩티드의 그룹과 클러스터되는 경향이 있는 아미노산 서열을 암호화한다.
유전자 셔플링 또는 방향진화는 또한 상기 정의된 HpaG 폴리펩티드를 암호화하는 핵산의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에서 정의된 바 있다.
본 발명에 따라, 실시예 1의 표 A에 제시된 핵산 서열 중 임의의 하나의 변이체를 식물에의 도입 및 발현, 또는 실시예 1의 표 A에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 변이체를 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체는 유전자 셔플링으로 얻어진다.
바람직하게는, 유전자 셔플링으로 얻어진 변이체 핵산에 의해 암호화되는 아미노산 서열은 도 2에 도시된 바와 같은 계통수 구축에 사용 시, 임의의 다른 그룹보다는 서열번호 2로 표시된 아미노산 서열을 포함하는 HpaG 폴리펩티드 그룹과 클러스터되는 경향이 있다.
더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이를 유발하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biology. Wiley Eds).
HpaG 폴리펩티드를 암호화하는 핵산은 임의의 자연적 또는 인위적 출처로부터 유래될 수 있다. 핵산은 고의적인 인간의 조작을 통하여 조성 및/또는 게놈 환경에 있어 자연적 형태로부터 변형될 수 있다. 바람직하게는 HpaG 폴리펩티드를 암호화하는 핵산은 원핵생물로부터, 바람직하게는 TTSS를 가진 그람음성 세균으로부터, 더욱 바람직하게는 슈도모나스 과(Pseudomonaceae)로부터, 더더욱 바람직하게는 잔토모나스 속 (Xanthomonas)으로부터, 가장 바람직하게는 잔토모나스 악소노포디스(Xanthomonas axonopodis)로부터의 핵산이다.
본 발명의 방법의 수행으로 수확량 관련 형질이 향상된 식물을 제공한다. 특히 본 발명의 방법의 수행으로 대조구 식물에 비해 수확량이 증가된 식물, 특히 생물량(biomass)이 증가된 및/또는 종자 수확량이 증가된 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재된 바 있다.
본 발명에서 향상된 수확량 관련 형질은 식물체의 한 부분 이상의 생물량 (중량)에 있어서의 증가를 의미하며, 상기 한 부분은 지상부 (수확 가능한) 일부분 및/또는 (수확 가능한) 지하부의 일부분을 포함한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 적절한 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 가진 식물을 제공한다.
옥수수를 예로 들면, 수확량 증가는 다음 중의 하나 이상으로 표시된다: 헥타르 또는 에이커당 식물체의 수 증가; 식물체당 이삭 (열매) 수의 증가; 낱알 줄의 수, 줄당 낱알의 수, 낱알 중량, 천립중량, 열매 길이/직경의 증가; 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가. 벼를 예로 들면, 수확량 증가는 다음 중의 하나 이상의 증가로 표시된다: 헥타르 또는 에이커당 식물체의 수, 식물체당 원추화서의 수, 원추화서당 작은 이삭의 수, 원추화서당 소화의 수 (일차 원추화서에 대한 충만된 종자의 수의 비율로 표시된다); 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가; 천립중량의 증가.
본 발명은 대조구 식물에 비하여 수확량을, 특히 식물의 생물량 및/또는 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절하여, 바람직하게는 발현을 증가시키는 것을 포함한다. 관찰된 수확량 증가는 증가된 생물적 스트레스 저항성의 결과는 아니라는 것을 주목해야 한다.
본 발명에 따른 형질전환 식물은 수확량이 증가하므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 증가된 생장 속도를 나타낼 것 같다 (생활사 중 적어도 일부에서). 증가된 수확량 외에, 증가된 양분 흡수 효율도 수확량 증가에 기여할 수 있다. 본 발명에 따른 식물이 양분 흡수에서 더 높은 효율을 보여준다는 것이 관찰되었다. 증가된 양분 흡수 효율은 식물이 보다 나은 생장을 하게 한다.
증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 실질적으로 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 성숙된 종자로부터 식물체가 출발 물질과 유사한 성숙한 종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 증가된 생장 속도는 생활사 중의 하나 이상의 단계에서 또는 실질적으로 전체 식물 생활사 중에 나타날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가하면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가하면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 에이커당 년간 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 임의의 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에(초기 시기) 또는 수확기에(후기 시기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키는 방법을 제공하며, 상기 방법은 본 발명에 정의된 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다. 관찰된 생장 속도의 증가는 생물적 스트레스 저항성의 결과는 아니라는 것을 주목해야 한다.
식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 비생물적 스트레스에 노출되든지 간에 수확량 및/또는 생장 속도의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 비생물적 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건하의 대조구 식물에 비하여 40%, 35% 또는 30% 미만, 바람직하게는 25%, 20% 또는 15% 미만, 더욱 바람직하게는 14%, 13%, 12%, 11% 또는 10% 미만이다. 실제로는 농업상의 진척 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 용어 "순한 스트레스"는 식물이 노출되는 매일의 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 결빙 온도에 의한 것이다. 비생물적 스트레스는 수분 스트레스 (특히 가뭄으로 인한)로 인한 삼투 스트레스, 염 스트레스, 산화적 스트레스 또는 이온 스트레스이다.
본 발명에서 정의된 용어 "비생물적 스트레스"는 하기 중 임의의 하나 이상을 의미하는 것이다: 수분 스트레스 (가뭄 또는 과도한 수분으로 인한), 혐기적 스트레스, 염분 스트레스, 온도 스트레스 (더운, 추운 또는 결빙 온도에 의한), 화학적 독성 스트레스 및 산화적 스트레스. 본 발명의 한 양상에 있어서, 비생물적 스트레스는 수분 스트레스, 염분 스트레스, 산화적 스트레스 및 이온 스트레스로부터 선택된 삼투 스트레스이다. 바람직하게는, 상기 수분 스트레스는 가뭄 스트레스이다. 용어 염분 스트레스는 통상적인 소금 (NaCl)에 제한되는 것이 아니라, 무엇보다도 NaCl, KCl, LiCl, MgCl2, CaCl2 중 임의의 하나 이상이다.
비생물적 환경 스트레스의 또 다른 예는 생장 및 발달을 위해 식물에 의해 동화되는 하나 이상의 양분의 감소된 이용능력이다. 식물의 수확량 및 생산품의 품질에 미치는 양분 이용 효율의 강력한 영향으로 인해, 식물 생장 및 품질을 최적화하기 위해 다량의 비료가 필드에 뿌려진다. 식물의 생산성은 보통 3 가지 주요 양분, 인, 칼륨 및 질소에 인해 제한되며, 질소가 상기 3 가지 중 식물 생장에 있어 속도 제한 요소이다. 따라서 식물 생장에 필요한 주요 양분 요소는 질소 (N) 이다. 질소는 살아있는 세포에서 발견되는 아미노산, 단백질 (효소), 핵산, 및 엽록소를 포함한 수많은 중요한 화합물의 구성성분이다. 식물 건량의 1.5% 내지 2%가 질소이며, 총 식물 단백질의 약 16%이다. 따라서, 질소 이용능력이 작물 생장 및 생산에 있어 주요 제한 요인이며 (Frink 등 (1999) Proc Natl Acad Sci USA 96(4): 1175-1180), 단백질 축적 및 아미노산 조성에 주요한 영향을 미친다. 따라서, 질소 제한 조건하에서 자랄 때 수확량이 증가된 작물은 관심의 대상이 된다.
생물적 스트레스는 전형적으로 병원균, 예를 들면, 세균, 바이러스, 균류, 선충류 및 곤충에 의한 스트레스이다.
특히, 본 발명의 방법은 대조구 식물에 비하여 증가된 수확량을 갖는 식물을 제공하기 위하여, 스트레스가 없는 조건하에서 또는 가뭄 조건하에서 수행될 수 있다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. Rabbani 등 (Plant Physiol (2003) 133: 1755-1767)은 특히 가뭄 스트레스와 고염도 스트레스 간에 고도의 "혼선"을 기재하고 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 이들 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다.
본 발명에서 사용된 용어 "스트레스가 없는" 조건은 식물의 최적 생장을 허용하는 환경 조건이다. 당업자는 주어진 위치에서 정상적인 토양 조건 및 기후 조건을 인식하고 있다.
본 발명의 방법의 수행으로 스트레스가 없는 조건하에서 또는 가뭄 스트레스 조건하에서 자란 식물이 비교되는 조건하에서 자란 적절한 대조구 식물에 비해 수확량이 증가된 식물로 된다. 따라서, 본 발명에 따라 스트레스가 없는 조건하에서 또는 가뭄 스트레스 조건하에서 키운 식물의 수확량을 증가시키는 방법을 제공하며, 상기 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 증가를 포함한다.
더욱이, 본 발명의 방법 수행은 양분결핍 조건하에서, 특히 질소 결핍 조건하에서 키운 식물이 동등한 조건하에서 키운 대조구 식물에 비하여 증가된 수확량을 갖게 한다. 따라서, 본 발명에 따라, 양분결핍 조건하에서 키운 식물의 수확량을 증가시키는 방법을 제공하며, 그 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 증가시키는 것을 포함한다.
본 발명의 방법 수행은 초기 활력으로 이끄는 특히 식물 발달의 초기 단계 (전형적으로 벼 및 옥수수의 경우에 발아 후 3, 4 주, 그러나 이는 종에 따라 다르다) 중에 대조구 식물에 비하여 활력이 증가된 식물을 제공한다. 따라서, 본 발명에 따라, 식물의 초기 활력을 증가시키는 방법이 제공되며, 상기 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다. 바람직하게는 실생 활력의 증가는 신초(shoot) 특이적 프로모터의 통제 하에서 HpaG 폴리펩티드를 암호화하는 핵산의 발현에 의해 얻어진다. 본 발명은 또한 대조구 식물에 비하여 초기 활력을 가진 식물을 생산하는 방법을 제공하며, 상기 방법은 HpaG 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다.
초기 활력은 또한 예를 들면, 식물이 환경에 보다 잘 적응 (즉, 에너지 자원 사용의 최적화, 및 신초 및 뿌리간의 분배)함으로 인한 식물 적응성의 증가의 결과일 수 있다. 초기 활력을 가진 식물은 실생 생존력의 증가 및 매우 균일한 필드 (균일한 양상으로 자라는 작물, 즉 대다수의 식물이 다양한 발달단계에 실질적으로 거의 동시에 도달함)를 초래하는 작물의 보다 나은 확립, 및 보다 양호한 생장 및 흔히 보다 양호한 수확량을 보여준다. 초기 활력은 천립중량, 발아율, 출현율, 실생 생장, 실생 높이, 뿌리 길이, 뿌리 및 신초(shoot) 생물량 등과 같은 다양한 요인들을 측정함으로써 결정될 수 있다.
본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그 일부분 (종자 포함)을 포함한다. 상기 식물 또는 그 일부분은 상기 정의된 HpaG 폴리펩티드를 암호화하는 핵산 외래도입유전자(transgene)를 포함한다.
본 발명은 또한 HpaG 폴리펩티드를 암호화하는 핵산의 식물에의 도입 및/또는 발현을 용이하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물에의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(a) 상기 정의된 HpaG 폴리펩티드를 암호화하는 핵산;
(b) (a)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로
(c) 전사 종결 서열.
바람직하게는, 상기 HpaG를 암호화하는 핵산은
(i) 서열번호 1로 표시된 핵산 또는 그의 상보체,
(ii) 상기 정의된 HpaG 폴리펩티드를 암호화하는 핵산.
용어 "조절 서열" 및 "전사 종결 서열"은 본 발명에서 정의된 바와 같다.
식물은 상기 기재된 임의의 핵산을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 잘 알고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다.
유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있다. 구성적 프로모터 또는 녹색 조직 특이적 프로모터가 본 발명의 방법에 특히 유용하다. 다양한 유형의 프로모터에 관해 "정의" 섹션에 정의되어 있다.
바람직하게는, HpaG 핵산 또는 그 변이체는 구성적 프로모터에 작동가능하게 연결된다. 바람직한 구성적 프로모터는 실질적으로 어디에서나 발현된다. 더욱 바람직하게는, 프로모터는 식물 유래이며, 보다 더 바람직하게는 단자엽 식물 유래이다. 가장 바람직한 것은 (벼의) GOS2 프로모터 (서열번호 5)의 사용이다. 본 발명의 적용범위가 서열번호 1로 표시된 HpaG 핵산에만 제한된 것이 아니며, 본 발명의 적용범위가 GOS2 프로모터에 의한 구동 시의 HpaG 핵산의 발현에 제한된 것이 아님은 분명하다. HpaG 핵의 추진에 사용될 수 있는 다른 구성적 프로모터의 예는 본 발명의 "정의" 섹션의 표 2a에 제시되어 있다.
바람직하게는, 연속적인 프로모터는 중간 강도이며, CaMV 35S 프로모터보다 더 약한 활성을 가질 수 있다.
다르게는, HpaG 핵산 또는 그의 변이체는 녹색 조직 특이적 프로모터에 작동가능하게 연결된다. 본 발명에서 정의된 어린 녹색 조직 특이적 프로모터는 사실상 식물체의 임의의 다른 부분은 제외하고, 이들 다른 식물 부분에 어떤 누설된 발현은 있더라도 녹색 조직에서 우세하게 전사적으로 활성인 프로모터이다. 녹색 조직 특이적 프로모터는 바람직하게는 프로토클로로필리드 환원효소(protochlorophylid reductase) 프로모터, 더욱 바람직하게는 서열번호 6에 실질적으로 유사한 핵산 서열로 표시된 프로토클로로필리드 환원효소 프로모터, 가장 바람직하게는 서열번호 6으로 표시된 프로모터이다. 본 발명의 적용범위가 서열번호 1로 표시된 HpaG 암호화 핵산에만 제한된 것이 아니며, 본 발명의 적용범위가 프로토클로로필리드 환원효소 프로모터에 의한 구동 시의 HpaG 암호화 핵산의 발현에 제한된 것이 아님은 분명하다. 본 발명의 방법 수행에 사용될 수 있는 다른 녹색 조직 특이적 프로모터의 예는 본 발명의 "정의" 섹션에 제시되어 있다.
기능적으로 동등한 프로모터의 동정을 위해, 후보 프로모터의 프로모터 강도 및/또는 발현 양상은 예를 들면, 리포터 유전자에 프로모터를 작동하게 연결하여 다양한 식물 조직에서 리포터 유전자의 발현 수준 및 양상을 검정함으로써 분석할 수 있다. 적절한 주지된 리포터 유전자는 예를 들면 베타-글루쿠로니다제(beta-glucuronidase) 또는 베타-갈락토시다제(beta-galactosidase)를 포함한다. 프로모터 활성은 베타-글루쿠로니다제 또는 베타-갈락토시다제의 효소 활성을 측정함으로써 검정된다. 프로모터 강도 및/또는 발현 양상은 기준 프로모터 (본 발명의 방법에 사용된 것과 같은 것)의 것에 비교된다. 다르게는, 프로모터 강도는 방사선 사진의 농도계 분석을 이용한 노던 블럿, 정량적 실시간 PCR 또는 RT-PCR 같은 당업계에 공지된 방법을 사용하여, mRNA 수준을 정량화하거나 본 발명의 방법에 사용된 핵산의 mRNA 수준과 18S rRNA 같은 housekeeping 유전자의 mRNA 수준을 비교함으로써 분석될 수 있다 (Heid 등, 1996 Genome Methods 6: 986-994). 일반적으로 "약한 프로모터"는 암호화 서열의 발현을 낮은 수준으로 이끄는 것이다. "낮은 수준"은 세포당 약 1/10,000 전사체 내지 약 1/100,000 전사체, 약 1/500,0000 전사체까지의 수준을 말한다. 역으로, "강력한 프로모터" 는 암호화 서열의 발현을 높은 수준으로 또는 세포당 약 1/10 전사체 내지 약 1/100 전사체 내지 약 1/1000 전사체로 이끄는 것이다.
선택적으로, 하나 이상의 종결신호 서열이 식물에 도입된 구축물에 사용될 수 있다. 부가적인 조절 인자는 해독뿐 아니라 전사 인핸서를 포함한다. 본 발명을 수행함에 있어 사용하기에 적절한 종결신호 및 인핸서 서열이 당업자에게 공지되어 있다. 상기 서열은 알려져 있거나, 당업자는 쉽게 얻을 수 있다.
세포질 내에 축적되는 성숙한 메세지의 양 증가를 위하여 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 식물 및 동물 양자의 발현 구축물에 있어 전사 단위 내에 스플라이스 가능한 인트론이 포함되면 mRNA 및 단백질 수준에서 유전자 발현이 1000 배까지 증가함이 보였다 (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1:1183-1200). 인트론에 의한 유전자 발현의 상승효과는 전형적으로 전사 단위의 5' 말단 가까이에 위치하였을 때 가장 컸다. 옥수수 인트론 Adh1-S 인트론 1, 2, 및 6, Bronze-1 인트론의 사용은 당업계에 주지되어 있다. 전반적인 정보는 하기를 참고한다: Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다. 더욱이, 구축물에 도입될 수 있는 암호화 서열의 코돈 이용성(codon usage)은 구축물이 도입될 숙주 세포에 맞게 최적화될 수 있다. 유전자 암호는 축퇴되어 있으며, 생물체는 한 아미노산에 대해 동일 아미노산에 대한 다른 코돈보다 특정 코돈을 사용하는 경향이 있다. 다양한 생물체에 대한 바람직한 코돈 사용의 표는 당업계에 주지되어 있다.
본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제 서열의 원점을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.
본 발명의 방법에 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다.
식물 세포로 핵산의 안정적인 또는 일시적인 통합시, 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 암호화하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 암호화하는 핵산분자는 본 발명의 또는 본 발명의 방법에 사용된 폴리펩티드를 암호화하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산으로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다).
마커 유전자, 특히 항생제 및 제초제에 저항성이 있는 유전자는 일단 핵산이 성공적으로 도입되면 형질전환 숙주 세포에서 더 이상 필요하지 않거나, 바람직하지 않으므로, 핵산 도입을 위한 본 발명의 방법에서는 이들 마커 유전자가 제거 또는 절단되게 하는 기술을 사용한다. 하나의 상기 방법이 동시형질전환 (co-transformation)으로 알려진 것이다. 동시형질전환 방법은 형질전환을 위해 두 벡터를 동시에 사용하여, 하나의 벡터에는 본 발명에 따른 핵산이 있고, 둘째 벡터에는 마커 유전자(들)이 있다. 대부분의 형질전환체는 양 벡터를 받거나, 식물의 경우 (형질전환체의 40% 이상까지) 포함한다. 아그로박테리아로 형질전환한 경우, 형질전환체는 보통 벡터의 일부, 즉 보통 발현 카세트인 T-DNA에 의해 플랭킹된 서열만을 받는다. 마커 유전자는 연이어 교배를 하여 형질전환 식물체로부터 제거된다. 다른 방법에서는, 트랜스포존(transposon)에 통합되는 마커 유전자는 원하는 핵산과 함께 형질전환에 사용된다 (Ac/Ds 기술로 알려짐). 형질전환체는 트랜스포사제(transposase) 공급원과 교배될 수 있거나 또는 트랜스포사제가 발현되게 하는 핵산 구축물로 일시적으로 또는 안정적으로 형질전환된다. 어떤 경우에 (약 10%), 일단 형질전환이 성공적으로 되면 트랜스포존은 숙주 세포의 게놈 밖으로 튀어나가 소실된다. 더 많은 경우에, 트랜스포존은 다른 영역으로 튄다. 이들 경우에 마커 유전자는 교배에 의하여 제거되어야 한다. 미생물학에서 상기 일이 있어났는지 검출을 가능하게 하거나 용이하게 하는 기술이 개발되었다. 더욱 유리한 방법은 재조합 시스템이라 알려진 것에 의존하는 것으로; 이점은 교배에 의한 제거가 면제될 수 있다는 것이다. 이 유형의 가장 잘 알려진 시스템은 Cre/lox 시스템이다. Cre1은 loxP 서열 사이에 위치한 서열을 제거하는 리콤비나아제이다. 만일 마커 유전자가 loxP 서열 사이에 통합되면, 형질전환이 성공적으로 일어나면, 리콤비나아제의 발현에 의해서 마커 유전자는 제거된다. 다른 재조합 시스템은 HIN/HIX, FLP/FRT 및 REP/STB 시스템 (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566)이다. 본 발명에 따른 핵산 서열의 식물 게놈 내로 위치 특이적 통합이 가능하다. 자연적으로, 이들 방법은 또한 효모, 균류 또는 세균 같은 미생물에 응용될 수 있다.
본 발명은 상기에서 정의된 HpaG 폴리펩티드를 암호화하는 임의의 핵산의 식물에서의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공한다.
더욱 상세하게, 본 발명은 증가된 향상된 수확량, 특히 증가된 생물량 및/또는 종자 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공하며, 상기 방법은 하기를 포함한다:
(i) HpaG 폴리펩티드를 암호화하는 핵산을 식물 또는 식물 세포에의 도입 및 발현; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건하에서 식물 세포를 배양.
상기 (i)의 핵산은 본 발명에서 정의된 HpaG 폴리펩티드를 암호화할 수 있는 임의의 핵산일 수 있다.
상기 핵산은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 핵산은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다.
일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 암호화되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.
DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 두 기술은 당업자에게 주지되어 있다.
생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다.
생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 HpaG 폴리펩티드를 암호화하는 분리된 핵산을 포함하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 본 발명의 방법에 따라 사용된 핵산 또는 벡터, 발현 카세트(cassette) 또는 구축물 또는 벡터에 대한 기주 식물은 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한, 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에 적용될 수 있다.
본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다. 본 발명의 바람직일 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 대두, 해바라기, 캐놀라, 알팔파, 유채, 목화, 토마토, 감자 및 담배를 포함한다. 더욱 바람직하게는, 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다. 더욱 바람직하게는 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 라이밀, 호밀, 수수 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이 부분에 제한되지는 않는다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 식물의 수확 가능한 부분으로부터 바람직하게는 직접적으로 유래된 생산물에 관련된다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화되어 있으며, 예를 들면, 적절한 프로모터에 의한 과발현, 전사 인핸서 또는 해독 인핸서의 사용을 포함한다. 프로모터 또는 인핸서서 인자로 작용하는 분리된 핵산은 비 이질성(non-heterologous) 형태의 폴리뉴클레오티드의 적절한 위치 (전형적으로 업스트림)에 도입되어 발현을 상향 조절한다. 예를 들면, 내재적 프로모터는 돌연변이, 결실, 및/또는 치환에 의해 생체 내에서 변할 수 있거나 (Kmiec, U.S. Pat. No. 5,565,350; Zarling et al., PCT/US93/03868 참고), 또는 분리된 프로모터는 본 발명의 유전자로부터 적절한 거리와 방향으로 식물 세포 내에 도입될 수 있어 해당 유전자의 발현을 조절한다.
폴리펩티드 발현을 원한다면, 일반적으로 폴리뉴클레오티드 암호화 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 폴리아데닐화 영역은 천연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 부가된 3' 말단 서열은 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
본 발명은 또한 본 발명에 기재된 HpaG 폴리펩티드를 암호화하는 핵산의 용도, 및 식물의 임의의 전술한 수확량 관련 형질을 향상시키는 상기 HpaG 폴리펩티드의 용도를 포함한다.
본 발명에 따른 방법은 본 발명에서 기재된 바와 같이 수확량 관련 형질이 향상된 식물을 초래한다. 상기 형질은 또한 추가적인 수확량 증가 형질, 다른 비생물적 및 생물적 스트레스에 대한 내성, 다양한 외형적 특질 및/또는 생화학적 및/또는 생리적 특질을 변형시키는 형질과 같은 다른 경제적으로 유용한 형질과 조합될 수도 있다.
II
.
SNF2
첫 번째 구현예에 따라, 본 발명은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서 발현의 증가를 포함하는, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
SWI2/SNF2 폴리펩티드를 암호화하는 핵산의 발현을 증가시키는 바람직한 방법은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에의 도입 및 발현이다.
이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산 서열"은 상기 SWI2/SNF2 폴리펩티드를 암호화하는 것이 가능한 핵산 서열을 의미한다. 식물에 도입되는 핵산 서열은 (따라서 본 발명의 방법 수행에 유용한) 하기에 기술될 유형의 단백질을 암호화하는 임의의 핵산 서열이며, 이후 또한 "SWI2/SNF2 핵산 서열" 또는 "SWI2/SNF2 유전자"라 칭한다.
본 발명에서 정의된 "SWI2/SNF2 폴리펩티드"는 N-말단으로부터 C-말단으로 하기 모티프 중 적어도 5 개, 바람직하게는 6 개, 보다 바람직하게는 7 개, 가장 바람직하게는 8 개의 ATPase 도메인을 포함하는 임의의 폴리펩티드를 말한다:
(i) 서열번호 103으로 표시된 모티프 I LADDMGLGK(T/S), 또는 모티프 I의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(ii) 서열번호 104로 표시된 모티프 Ia L(L/V/I)(V/I/L)(A/C)P(T/M/V)S(V/I/L)(V/I/L)XNW, 또는 모티프 Ia의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(iii) 서열번호 105로 표시된 모티프 II DEAQ(N/A/H)(V/I/L)KN, 또는 모티프 II의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(iv) 서열번호 106으로 표시된 모티프 III A(L/M)TGTPXEN, 또는 모티프 III의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(v) 서열번호 107로 표시된 모티프 IV (L/I)XF(T/S)Q(F/Y), 또는 모티프 IV의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(vi) 서열번호 108로 표시된 모티프 V S(L/V)KAGG(V/T/L)G(L/I)(N/T)LTXA(N/S/T)HV, 또는 모티프 V의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(vii) 서열번호 109로 표시된 모티프 Va DRWWNPAVE, 또는 모티프 Va의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프; 및
(viii) 서열번호 110으로 표시된 모티프 VI QA(T/S)DR(A/T/V)(F/Y)R(I/L)GQ, 또는 모티프 VI의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프,
모티프 Ia, 모티프 III, 모티프 IV, 및 모티프 V에서 상기 X는 임의의 아미노산이다.
다르게는 또는 부가적으로, 본 발명에서 정의된 "SWI2/SNF2 폴리펩티드"는 도 7 (Flaus 등 (2006)에 기재된, supra)에 도시된 것과 같은 계통수 구축에 사용 시, 임의의 다른 SWI2/SNF2 집단(clade)보다는 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 집단(clade)과 클러스터링(clustering)되는 경향이 있는 임의의 폴리펩티드 서열을 의미한다.
다르게는 또는 부가적으로, 본 발명에서 정의된 "SWI2/SNF2 폴리펩티드"는 서열번호 30에 포함된, 서열번호 111로 표시된 ATPase 도메인에 증가하는 순으로 선호되는 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 ATPase 도메인을 포함하는 임의의 폴리펩티드 서열을 의미한다.
다르게는 또는 부가적으로, 본 발명에서 정의된 "SWI2/SNF2 폴리펩티드"는 서열번호 30으로 표시된 SWI2/SNF2 폴리펩티드 또는 본 발명 표 E에 제시된 임의의 폴리펩티드 서열에 증가하는 순으로 선호되는 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 임의의 폴리펩티드를 의미한다.
용어 "도메인" 및 "모티프"는 본 발명의 "정의" 섹션에 정의된 바 있다. 도메인 동정을 위한 전문가 데이터베이스, 예를 들면 SMART (Schultz 등 (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic 등 (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder 등, (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher 및 Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo 등, Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman 등, Nucleic Acids Research 30(1): 276-280 (2002))가 존재한다. 단백질 서열의 인 실리코(in silico) 분석을 위한 도구 세트는 ExPASY 단백질체 서버 (hosted by the Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31 :3784-3788(2003))에서 이용할 수 있다. 도메인은 또한 서열 정렬과 같은 통상적인 기술을 사용하여서도 동정될 수 있다. 서열번호 30의 폴리펩티드 서열의 분석은 하기 실시예 9 및 11에 기재되어 있다.
비교를 위한 서열 정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는(matches) 수는 최대로, 공백(gaps)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘(algorithm)을 사용한다. BLAST 알고리즘 (Altschul 등 (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 복수 서열 정렬 알고리즘 (multiple sequence alignment algorithm; version 1.83)을 사용하여, 디폴트값 페어와이즈 정렬방식(default pairwise alignment parameters) 및 백분율로 스코링(scoring)하는 방법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell et al., BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 하기 실시예 3에 백분율로 표시된 서열 동일성 값은 핵산 또는 폴리펩티드 전체 서열 (표 F)에 걸쳐, 및/또는 선정된 도메인 (서열번호 30에 포함된, 서열번호 111로 표시된 ATPase 도메인과 같은; 표 F1) 또는 보존된 모티프(들)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default parameters)를 사용하여 결정될 수 있다.
본 발명은 서열번호 30의 폴리펩티드 서열을 암호화하는, 서열번호 29로 표시된 핵산 서열로 식물체를 형질전환하는 것에 의해 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 것과 같은 임의의 SWI2/SNF2 암호화 핵산 서열 또는 SWI2/SNF2 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
식물의 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 예는 본 발명의 실시예 8의 표 E에 제시되어 있다. 상기 핵산 서열은 본 발명의 방법의 수행에 유용하다. 실시예 8의 표 E에 제시된 폴리펩티드 서열은 서열번호 30으로 표시된 SWI2/SNF2 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에서 정의된 바 있다. 오쏘로그 및 패럴로그는 소위 상호간 블라스트(Reciprocal blast) 탐색을 수행하면 용이하게 동정된다. 전형적으로 상기 과정은 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열(예를 들면, 실시예 8의 표 E에 열거된 임의의 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열 (조회 서열은 서열번호 29 또는 서열번호 30, 두 번째 BLAST는 따라서 시네코시스티스(Synechocystis) 서열과 대조하는 것이다)이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.
높은 ranking hits은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 의미있다 (또는 다른 말로 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에 부가적으로, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 후에 neighbour joining tree가 사용된다 (도 7 참고).
핵산 변이체도 본 발명의 방법 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 8의 표 E에 제시된 폴리펩티드 서열 중 임의의 하나의 상동체 및 유도체를 암호화하는 핵산 서열을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의된다. 본 발명의 방법에는 실시예 8의 표 E에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 암호화하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다
본 발명의 방법 수행에 유용한 추가적인 핵산 변이체는 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 일부분, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열에 혼성화되는 핵산 서열, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 스플라이스 변이체, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 대립인자 변이체 및 유전자 셔플링에 의해 얻은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 변이체를 포함한다. 용어 혼성화되는 서열, 스플라이스 변이체, 대립인자 변이체 및 유전자 셔플링은 본 발명에 기재된 것과 같다.
본 발명의 방법의 수행은 전장 핵산 서열의 사용에 의존하지 않으므로, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열은 전장 핵산 서열일 필요는 없다. 본 발명에서는, 실시예 8의 표 E에 제시된 핵산 서열 중 임의의 하나의 일부, 또는 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 일부를 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산 서열의 일부분은 예를 들면, 핵산 서열에 하나 이상의 결실을 만들어서 제조될 수 있다. 상기 일부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 암호화 (또는 비암호화) 서열에 융합될 수도 있다. 다른 암호화 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 일부분에 대해 예측된 것보다 클 것이다.
본 발명의 방법에 유용한 일부분은 본 발명에 정의된 SWI2/SNF2 폴리펩티드를 암호화하며, 실시예 8의 표 E에 제시된 폴리펩티드 서열과 실질적으로 동일한 생물학적 활성 (즉, 향상된 수확량 관련 형질)을 가진다. 바람직하게는, 상기 일부분은 실시예 8의 표 E에 제시된 핵산 서열 중 임의의 하나의 일부분, 또는 실시예 8의 표 E에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열의 일부분이다. 바람직하게는 상기 일부분은 증가하는 순으로 선호되는 적어도 길이 1000, 1100, 1200, 1300 또는 1400 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 8의 표 E에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 8의 표 E에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열이다. 가장 바람직하게는 상기 일부분은 서열번호 29의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 본 발명에서 정의된 임의의 하나 이상의 도메인 또는 모티프를 포함하는 폴리펩티드 서열을 암호화한다. 바람직하게는, 상기 일부분은 도 7에 도시된 바와 같은 계통수 구축에 사용 시, 임의의 다른 SWI2/SNF2 그룹보다는 서열번호 30로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있는 폴리펩티드 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건하에서, 바람직하게는 스트린전트 조건하에서, 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열, 또는 본 발명에서 정의된 그 일부와 혼성화가 가능한 핵산 서열이다.
본 발명에서 따라, 실시예 8의 표 E에 제시된 핵산 서열 중 임의의 하나와 혼성화가 가능한 핵산 서열, 또는 실시예 8의 표 E에 제시된 임의의 핵산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열과 혼성화가 가능한 핵산 서열의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하며, 실시예 8의 표 E에에 제시된 폴리펩티드 서열과 실질적으로 동일한 생물학적 활성 (즉, 향상된 수확량 관련 형질)을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 8의 표 E에 제시된 핵산 서열 중의 임의의 하나에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 8의 표 E에에 제시된 폴리펩티드 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열과 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 29로 표시된 핵산 서열 또는 그 일부에 혼성화가 가능하다. 바람직하게는, 상기 혼성화 서열은 본 발명에서 정의된 임의의 하나 이상의 도메인 또는 모티프를 포함하는 폴리펩티드 서열을 암호화한다. 바람직하게는, 상기 혼성화 서열은 도 7에 도시된 바와 같은 계통수 구축에 사용 시 임의의 다른 SWI2/SNF2 그룹보다 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있는 폴리펩티드 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 스플라이스 변이체이며, 상기 스플라이스 변이체는 본 발명에서 정의된 바 있다.
본 발명에서 따라, 실시예 8의 표 E에 제시된 핵산 서열 중의 임의의 하나의 스플라이스 변이체의, 또는 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 스플라이스 변이체의 식물에의 도입 및 발현을 포함하는, 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 스플라이스 변이체는 서열번호 30의 SWI2/SNF2 폴리펩티드 및 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열과 실질적으로 동일한 생물학적 활성 (즉, 향상된 수확량 관련 형질)을 가진다. 바람직하게는, 스플라이스 변이체에 의해 암호화되는 폴리펩티드 서열은 본 발명에서 정의된 임의의 하나 이상의 도메인 또는 모티프를 포함한다. 바람직하게는 스플라이스 변이체에 의해 암호화되는 폴리펩티드 서열은 도 7에 도시된 바와 같은 계통수 구축에 사용 시 임의의 다른 SWI2/SNF2 그룹보다 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 상기에 정의된 것과 같은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 대립인자 변이체이며, 대립인자 변이체는 본 발명에서 정의된 바 있다.
본 발명에서 따라, 실시예 8의 표 E에 제시된 핵산 서열 중의 임의의 하나의 대립인자 변이체의 식물에의 도입 및 발현을 포함하는, 또는 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 대립인자 변이체의 식물에의 도입 및 발현을 포함하는, 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 대립인자 변이체는 서열번호 30의 SWI2/SNF2 폴리펩티드 및 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열과 사실상 동일한 생물학적 활성 (즉, 향상된 수확량 관련 형질)을 갖는다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법 내에 포함된 것은 이들 자연적인 대립인자의 용도이다. 바람직하게는 대립인자 변이체는 서열번호 29의 대립인자 변이체 또는 서열번호 30의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열의 대립인자 변이체이다. 바람직하게는, 대립인자 변이체에 의해 암호화되는 폴리펩티드 서열은 본 발명에서 정의된 도메인 또는 모티프 중 임의의 하나 이상을 포함한다. 바람직하게는 대립인자 변이체에 의해 암호화되는 폴리펩티드 서열은 도 7에 도시된 것과 같은 계통수 구축에 사용 시, 임의의 다른 SWI2/SNF2 그룹보다 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있다.
유전자 셔플링 또는 방향진화는 또한 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에서 정의된 바 있다.
본 발명에서 따라, 실시예 8의 표 E에 제시된 핵산 서열 중의 임의의 하나의 변이체의 식물에의 도입 및 발현을 포함하는, 또는 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 변이체의 식물에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체 핵산 서열은 유전자 셔플링에 의해 얻어진다.
본 발명의 방법에 유용한 유전자 셔플링에 의해 얻어진 변이체 핵산 서열은 서열번호 30의 SWI2/SNF2 폴리펩티드 및 실시예 8의 표 E에 제시된 임의의 폴리펩티드 서열과 사실상 동일한 생물학적 활성을 갖는다. 바람직하게는, 유전자 셔플링에 의해 얻어진 변이체 핵산 서열은 본 발명에서 정의된 임의의 하나 이상의 도메인 또는 모티프를 포함하는 폴리펩티드 서열을 암호화한다. 바람직하게는 유전자 셔플링에 의해 얻어진 변이체 핵산 서열에 의해 암호화되는 폴리펩티드 서열은 도 7에 도시된 것과 같은 계통수 구축에 사용 시 임의의 다른 SWI2/SNF2 그룹보다 서열번호 30으로 표시된 폴리펩티드 서열을 포함하는 SWI2/SNF2 폴리펩티드의 SSO1653 그룹과 클러스터되는 경향이 있다.
더욱이, 핵산 서열 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이유발에 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biolog. Wiley Eds).
SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열은 임의의 자연적 또는 인위적 출처로부터 유래될 수 있다. 핵산 서열은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연적인 형태로부터 변형될 수 있다. 바람직하게는 SWI2/SNF2 폴리펩티드 암호화 핵산 서열은 미생물 게놈으로부터, 더욱 바람직하게는 고세균(archea) (하기와 같은 문으로부터: 크레나케오타(Crenarcheaota), 유리아케오타(Euryarchaeota) (할로박테리아(Halobacteria), 메타노박테리아(Methanobacteria), 메타노코키(Methanococci), 메타노피리(Methanopyri), 알케오글로비(Archaeoglobi), 써모플라스마타(Thermoplasmata), 및 써모코키(Thermococci) 강을 포함), 코라케오타(Korarchaeota), 또는 나노알케오타(Nanoarchaeota)) 또는 세균 (하기와 같은 문으로부터: 악티노박테리아(Actinobacteria), 아퀴피카에(Aquificae), 박테로이데테스/클로로비(Bacteroidetes/Chlorobi), 클라미디에(Chlamydiae), 클로로플렉시(Chloroflexi), 크리시오게네테스(Chrysiogenetes), 남세균, 데페리박테레스(Deferribacteres), 데이노코쿠스-써무스(Deinococcus-Thermus), 딕티오글로미(Dictyoglomi), 피브로박테레스/아시도박테리아(Fibrobacteres/Acidobacteria), 퍼미쿠테스(Firmicutes), 푸소박테리아(Fusobacteria), 겜마티모나데테스(Gemmatimonadetes), 렌티스페레(Lentisphaerae), 니트로스피레(Nitrospirae), 플란크토미세테스(Planctomycetes), 프로테오박테리아(Proteobacteria), 스피로케테스(Spirochaetes), 써모데술포박테리아(Thermodesulfobacteria), 써모미크로비아(Thermomicrobia), 써모토게(Thermotogae), 베루코미크로비아(Verrucomicrobia)으로부터), 보다 더 바람직하게는 시네코시스티스 (Synechocystis sp.), 노스톡(Nostoc sp.), 시네코코쿠스(Synechococcus sp.), 프로클로로코쿠스(Prochlorococcus sp.), 아나베나(Anaebena sp.), 글로에오박터(Gloeobacter sp.), 또는 써모시네코코쿠스(Thermosynechococcus sp.) 속의 종과 같은 남세균으로부터, 보다 더 바람직하게는 시네코시스티스(Synechocystis sp.)로부터, 가장 바람직하게는 시네코시스티스(Synechocystis) sp. PCC6803 유래이다.
본 발명의 방법의 수행은 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 식물을 제공한다.
본 발명의 "향상된 수확량 관련 형질"은 지상부 (수확 가능한)의 일부분 및/또는 지하부 (수확 가능한)의 일부분을 포함하는, 식물체의 한 부분 이상에 있어 생물량 (중량)의 증가를 의미한다. 특히, 상기 수확 가능한 일부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물에 비해 종자 수확량이 향상된 식물이 초래된다.
옥수수를 예로 들면, 수확량 증가는 하기 중의 하나 이상으로 표시된다: 헥타르 또는 에이커당 식물체 수의 증가; 식물체당 이삭 (열매) 수의 증가; 낱알 줄의 수, 줄당 낱알의 수, 낱알 중량, 천립중량, 열매 길이/직경의 증가; 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가. 벼를 예로 들면, 수확량 증가는 하기 중의 하나 이상의 증가로 표시된다: 헥타르 또는 에이커당 식물체의 수, 식물체당 원추화서의 수, 원추화서당 작은 이삭의 수, 원추화서당 소화의 수 (일차 원추화서 수에 대한 충만된 종자의 수의 비율로 표시된다); 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가; 천립중량의 증가.
본 발명은 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 방법은 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 증가를 포함한다. 바람직하게는 향상된 수확량 관련 형질은 하기 중 하나 이상이다: (i) 원추화서당 증가된 꽃의 수; (ii) 식물체당 증가된 총 종자 중량; (iii) (충만된) 종자의 증가된 수; 또는 (iv) 증가된 수확 지수.
본 발명에 따른 형질전환 식물은 향상된 수확량 관련 형질을 가지므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 증가된 생장 속도 (생활사 중 적어도 일부에서)를 나타낼 것 같다. 증가된 수확량 외에, 증가된 양분 흡수 효율도 수확량 증가에 기여할 수 있다. 본 발명에 따른 식물이 양분 흡수에서 더 높은 효율을 보여준다는 것이 관찰되었다. 증가된 양분 흡수 효율은, 스트레스 하에서 자라든 또는 스트레스가 없는 조건에서 자라든, 식물이 보다 나은 생장을 하게 한다.
증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 실질적으로 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 건조된 성숙된 종자로부터 식물체가 출발 물질과 유사한 건조된 성숙된 종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 생장 속도의 증가는 식물의 생활사 중의 하나 이상 단계에 또는 실질적으로 전체 식물 생활사 중에 일어날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가되면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가되면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 에이커당 일년 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 어떤 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에(초기 시기) 또는 수확기에(후기 시기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라, 식물의 생장 속도를 증가시키는 방법을 제공하며, 상기 방법은 본 발명에서 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현의 증가를 포함한다.
식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 스트레스에 노출되든지 간에 수확량 및/또는 생장 속도의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건하에서 키운 대조구 식물에 비하여 40%, 35% 또는 30% 미만, 바람직하게는 25%, 20% 또는 15% 미만, 더욱 바람직하게는 14%, 13%, 12%, 11% 또는 10% 미만이다. 실제로는 농업상의 진척 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 순한 스트레스는 식물이 노출되는 매일의 생물적 및/또는 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 결빙 온도에 의한 것이다. 비생물적 스트레스는 수분 스트레스 (특히 가뭄으로 인한)로 인한 삼투 스트레스, 염 스트레스, 산화적 스트레스 또는 이온 스트레스이다. 생물적 스트레스는 전형적으로 병원균, 예를 들면, 세균, 바이러스, 균류, 선충 및 곤충에 의한 스트레스이다. 본 발명에서 정의된 용어 "스트레스가 없는" 조건은 바람직하게는 식물이 마주치는 일상적인 기후 및 다른 비생물적 조건의 범위를 크게 벗어나지 않는 환경 조건이며, 가장 바람직하게는 식물의 최적 생장을 허용하는 조건이다. 당업자는 소정의 입지에 대한 정상적인 토양 조건 및 기후 조건을 주지하고 있다 .
본 발명의 방법의 수행으로 스트레스가 없는 조건하에서 또는 순한 가뭄 스트레스 조건하에서 자란 식물이 비교되는 스트레스 조건하에서 자란 적절한 대조구 식물에 비해 수확량 관련 형질의 향상을 가진다. 따라서, 본 발명에 따라 스트레스가 없는 조건하에서 또는 순한 가뭄 스트레스 조건하에서 키운 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 방법은 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현의 증가를 포함한다.
본 발명의 방법 수행으로 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 비생물적 스트레스 조건하에서 자란 식물을 제공한다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 상기 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다. 다양한 환경 스트레스는 비슷한 경로를 활성화시키므로, 가뭄 스트레스로 수행한 본 발명의 실시예는, 일반적으로 비생물적 스트레스에 있어서 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 수확량 관련 형질의 향상에 있어, 가뭄 스트레스에 대한 제한으로 보여지지 않아야 하며, 상기 정의된 SWI2/SNF2 폴리펩티드가 관여됨을 나타내는 스크린으로서이다.
가뭄 스트레스와 고염도 스트레스 간에 특히 고도의 "혼선"이 보고된 바 있다 (Rabbani 등, Plant Physiol (2003) 133: 1755-1767). 따라서, SWI2/SNF2 폴리펩티드는 가뭄 스트레스 조건하에서 자란 대조구 식물에 비해 식물의 수확량 관련 형질의 향상에 있어서의 유용성과 함께, 다양한 다른 비생물적 스트레스 조건하에서 자란 대조구 식물에 비해 식물의 수확량 관련 형질의 향상에도 용도가 있음은 명백하다.
본 발명에서 정의된 용어 "비생물적 스트레스"는 하기 중 임의의 하나 이상을 의미하는 것이다: 수분 스트레스 (가뭄 또는 과도한 수분으로 인한), 혐기적 스트레스, 염분 스트레스, 온도 스트레스 (더운, 추운 또는 결빙 온도에 의한), 화학적 독성 스트레스 및 산화적 스트레스. 본 발명의 한 양상에 있어서, 비생물적 스트레스는 수분 스트레스, 염분 스트레스, 산화적 스트레스 및 이온 스트레스로부터 선택된 삼투 스트레스이다. 바람직하게는, 상기 수분 스트레스는 가뭄 스트레스이다. 용어 염분 스트레스는 통상적인 소금 (NaCl)에 제한되는 것이 아니라, 무엇보다도 NaCl, KCl, LiCl, MgCl2, CaCl2 중 임의의 하나 이상이다.
특히, 비생물적 스트레스 조건 (바람직하게는 가뭄 스트레스 조건) 하에서 자란 식물의, 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 향상된 수확량 관련 형질은 하기 중 하나 이상을 포함한다: (i) 증가된 지상부 면적; (ii) 증가된 총 뿌리 생물량; (iii) 증가된 굵은 뿌리 생물량; (iv) 증가된 가는 뿌리 생물량; (v) 증가된 원추화서당 꽃의 수; (vi) 증가된 종자 충만도; (vii) 식물체당 증가된 총 종자 중량; (viii) 증가된 (충만된) 종자 수; 또는 (ix) 증가된 수확 지수.
본 발명의 방법의 수행으로 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 비생물적 스트레스 조건하에서 향상된 수확량 관련 형질을 가진 식물을 제공한다. 따라서, 본 발명에 따라, 비생물적 스트레스 조건하에서 키운 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 방법은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에서의 발현의 증가를 포함한다. 본 발명의 한 양상에 따라, 비생물적 스트레스는 하기 중 하나 이상으로부터 선택된 삼투 스트레스이다: 수분 스트레스, 염 스트레스, 산화적 스트레스 및 이온 스트레스. 바람직하게는, 상기 수분 스트레스는 가뭄 스트레스이다.
비생물적 환경 스트레스의 또 다른 예는 생장 및 발달을 위해 식물에 의한 동화에 필요한 하나 이상의 양분의 감소된 이용능력이다. 식물의 수확량 및 생산품의 품질에 미치는 양분 이용 효율의 강력한 영향으로 인해, 식물 생장 및 품질을 최적화하기 위해 다량의 비료가 필드에 뿌려진다. 식물의 생산성은 보통 3 가지 주요 양분, 인, 칼륨 및 질소에 인해 제한되며, 질소가 상기 3 가지 중 식물 생장에 있어 속도 제한 요소이다. 따라서 식물 생장에 필요한 주요 양분 요소는 질소 (N) 이다. 질소는 살아있는 세포에서 발견되는 아미노산, 단백질 (효소), 핵산, 및 엽록소를 포함한 수많은 중요한 화합물의 구성성분이다. 식물 건량의 1.5% 내지 2%는 질소이며 및 총 식물 단백질의 약 16%이다. 따라서, 질소 이용능력이 작물 생장 및 생산에 있어 주요 제한 요인이며 (Frink 등 (1999) Proc Natl Acad Sci USA 96(4): 1175-1180), 단백질 축적 및 아미노산 조성에 주요한 영향을 미친다. 따라서, 질소 제한 조건하에서 자랄 때 수확량이 증가된 작물은 관심의 대상이 된다.
본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그 일부분 (종자 포함), 또는 식물 세포를 포함한다. 상기 식물, 그 일부분 또는 식물 세포는 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 분리된 핵산 외래도입유전자를 포함한다.
본 발명은 또한 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에의 도입 및/또는 발현을 추진하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물에의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(d) 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열;
(e) (a)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로
(f) 전사 종결 서열.
용어 "조절 서열" 및 "전사 종결 서열"은 본 발명에서 정의된 바와 같다.
일 구현예에 있어서, 구축물의 조절 서열 중의 하나는 조직 특이적 프로모터이며, 바람직하게는 어린 확장성 조직에서의 발현을 위한 프로모터이다. 어린 확장성 조직에서의 발현을 위한 조직 특이적 프로모터의 예는 베타 익스팬신(beta-expansin) 프로모터, 예를 들면 서열번호 112로 표시된 벼 베타 익스팬신 프로모터이다.
식물은 상기 기재된 임의의 핵산 서열을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 포함하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 주지하고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다.
유리하게, 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있다. 상기 프로모터는 구성적 프로모터일 수 있으며, 상기 구성적 프로모터는 반드시 항상은 아니더라도 생장 및 발달의 대부분 기간 중에 그리고 대부분의 환경적 조건하에서 적어도 하나의 세포, 조직 또는 기관에서 전사적으로 활성인 프로모터를 말한다. 다르게는, 상기 프로모터는 화학적 (검토 위해 Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108 참고), 환경적 또는 물리적 자극에 반응하여 전사 개시가 유도되거나 증가되는 유도성 프로모터일 수 있다. 유도성 프로모터의 또 다른 예는 식물이 다양한 스트레스 조건에 노출될 때 활성화되는 프로모터인 스트레스-유도성 프로모터, 또는 병원균 유도성 프로모터이다.
부가적으로 또는 다르게는, 상기 프로모터는 잎, 뿌리, 종자조직 등과 같이 특정 기관 또는 조직에서 우선적으로 전사의 개시가 가능한, 기관 특이적 또는 조직 특이적 프로모터일 수 있으며; 또는 상기 프로모터는 생물체의 모든 조직 또는 세포에서 실질적으로 활성이 있는 편재하는 프로모터일 수 있으며, 또는 발달적으로 조절되어, 그로 인해 임의의 발달 단계 중에 또는 발달적 변화의 수행 중에 식물체의 일부분에서 활성으로 되는 프로모터일 수 있다. 임의의 기관 또는 조직에서만 전사를 개시할 수 있는 프로모터를 본 발명에서는 각각 "기관 특이적" 또는 "조직 특이적"이라 칭하며, 비슷하게, 임의의 세포에서만 전사를 개시할 수 있는 프로모터를 "세포 특이적"이라 칭한다.
일 구현예에 있어, 서열번호 29로 표시된 핵산 서열과 같은, 상기 정의된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열은 조직 특이적 프로모터에, 바람직하게는 어린 확장성 조직, 또는 정단 분열조직에서 핵산 서열을 우선적으로 발현시키는 것이 가능한 프로모터에 작동가능하게 연결된다. 바람직하게는, 어린 확장성 조직에서 핵산 서열을 우선적으로 발현시키는 것이 가능한 프로모터는 베타 익스팬신(beta-expansin) 프로모터와 동등한 발현 프로파일(profile)을 가진다. 더욱 상세하게는, 어린 확장성 조직에서 핵산 서열을 우선적으로 발현하는 것이 가능한 프로모터는 신초 또는 뿌리의 세포 신장 구간(expansion zone)에서 발현을 추진하는 것이 가능한 프로모터이다. 가장 바람직하게는, 어린 확장성 조직에서 핵산 서열을 우선적으로 발현하는 것이 가능한 프로모터는 베타 익스팬신 프로모터, 예를 들면 서열번호 112로 표시된 벼 베타 익스팬신 프로모터이다.
기능적으로 동등한 프로모터 동정을 위해, 후보 프로모터의 프로모터 강도 및/또는 발현 양상은 예를 들면, 리포터 유전자에 프로모터를 작동하게 연결하여 다양한 식물 조직에서 리포터 유전자의 발현 수준 및 양상을 검정함으로써 분석할 수 있다. 적절한 주지된 리포터 유전자는 예를 들면 베타-글루쿠로니다제 또는 베타-갈락토시다제를 포함한다. 프로모터 활성은 베타-글루쿠로니다제 또는 베타-갈락토시다제의 효소 활성을 측정함으로써 검정된다. 프로모터 강도 및/또는 발현 양상은 기준 프로모터의 것에 비교된다 (본 발명의 방법에 사용된 것과 같은 것). 다르게는, 프로모터 강도는 방사선 사진의 농도계 분석을 이용한 노던 블럿, 정량적 실시간 PCR 또는 RT-PCR 같은 당업계에 공지된 방법을 사용하여, mRNA 수준을 정량화하거나 본 발명의 방법에 사용된 핵산의 mRNA 수준과 18S rRNA 같은 housekeeping 유전자의 mRNA 수준을 비교함으로써 분석될 수 있다 (Heid et al., 1996 Genome Methods 6: 986-994). 일반적으로 "약한 프로모터"는 암호화 서열의 발현을 낮은 수준으로 이끄는 것이다. "낮은 수준"은 세포당 약 1/10,000 전사체 내지 약 1/100,000 전사체, 약 1/500,000 전사체까지의 수준을 말한다. 역으로, "강력한 프로모터" 는 암호화 서열의 발현을 높은 수준으로 또는 세포당 약 1/10 전사체 내지 약 1/100 전사체 내지 약 1/1,000 전사체로 이끄는 것이다.
선택적으로, 하나 이상의 종결신호 서열이 식물에 도입된 구축물에 사용될 수 있다. 부가적인 조절 인자는 해독뿐 아니라 전사 인핸서를 포함한다. 본 발명을 수행함에 있어 용도에 적절한 종결신호 및 인핸서 서열이 당업계에 공지되어 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.
세포질 내에 축적하는 성숙한 메세지의 양 증가를 위하여 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 식물 및 동물 양자의 발현 구축물에 있어 전사 단위 내에 스플라이스 가능한 인트론이 포함되면 mRNA 및 단백질 양자의 수준에서 유전자 발현이 1,000 배까지 증가함이 보였다 (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1:1183-1200). 인트론에 의한 유전자 발현의 상승효과는 전형적으로 전사 단위의 5' 말단 가까이에 위치하였을 때 가장 컸다. 옥수수 인트론 Adh1-S 인트론 1, 2, 및 6, Bronze-1 인트론의 사용은 당업계에 주지되어 있다. 전반적인 정보는 하기를 참고한다: Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.
본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제 서열의 원점을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.
본 발명의 방법에 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산 서열을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다.
식물 세포로 핵산 서열의 안정적인 또는 일시적인 통합시, 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 암호화하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 암호화하는 핵산 서열은 본 발명의 또는 본 발명의 방법에 사용된 폴리펩티드를 암호화하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산 서열로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다).
마커 유전자, 특히 항생제 및 제초제에 저항성이 있는 유전자는 일단 핵산 서열이 성공적으로 도입되면 형질전환 숙주 세포에서 더 이상 필요하지 않거나, 바람직하지 않으므로, 핵산 서열 도입을 위한 본 발명의 방법에서는 이들 마커 유전자가 제거 또는 절단되게 하는 기술을 사용한다. 하나의 상기 방법이 동시형질전환 (co-transformation)으로 알려진 것이다. 동시형질전환 방법은 형질전환을 위해 두 벡터를 동시에 사용하여, 하나의 벡터에는 본 발명에 따른 핵산이 있고, 둘째 벡터에는 마커 유전자(들)이 있다. 대부분의 형질전환체는 양 벡터를 받거나, 식물의 경우 (형질전환체의 40% 이상까지) 포함한다. 아그로박테리아로 형질전환한 경우, 형질전환체는 보통 벡터의 일부, 즉 보통 발현 카세트인 T-DNA에 의해 플랭킹된 서열만을 받는다. 마커 유전자는 연이어 교배를 하여 형질전환 식물체로부터 제거된다. 다른 방법에서는, 트랜스포존에 통합된 마커 유전자는 원하는 핵산 서열과 함께 형질전환에 사용된다 (Ac/Ds 기술로 알려짐). 형질전환체는 트랜스포사제(transposase) 공급원과 교배될 수 있거나 또는 트랜스포사제가 발현되게 하는 핵산 구축물로 일시적으로 또는 안정적으로 형질전환된다. 어떤 경우에 (약 10%), 일단 형질전환이 성공적으로 되면 트랜스포존은 숙주 세포의 게놈 밖으로 튀어나가 소실된다. 더 많은 경우에, 트랜스포존은 다른 영역으로 튄다. 이들 경우에 마커 유전자는 교배에 의하여 제거되어야 한다. 미생물학에서 상기 일이 있어났는지 검출을 가능하게 하거나 용이하게 하는 기술이 개발되었다. 더욱 유리한 방법은 재조합 시스템이라 알려진 것에 의존하는 것으로; 이점은 교배에 의한 제거가 면제될 수 있다는 것이다. 이 유형의 가장 잘 알려진 시스템은 Cre/lox 시스템이다. Cre1은 loxP 서열 사이에 위치한 서열을 제거하는 리콤비나아제이다. 만일 마커 유전자가 loxP 서열 사이에 통합되면, 형질전환이 성공적으로 일어나면, 리콤비나아제의 발현에 의해서 마커 유전자는 제거된다. 다른 재조합 시스템은 HIN/HIX, FLP/FRT 및 REP/STB 시스템 (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566)이다. 본 발명에 따른 핵산 서열의 식물 게놈 내로 위치 특이적 통합이 가능하다. 자연적으로, 이들 방법은 또한 효모, 균류 또는 세균 같은 미생물에 응용될 수 있다.
본 발명은 상기에서 정의된 것과 같은 SWI2/SNF2 폴리펩티드를 암호화하는 임의의 핵산 서열의 식물에서의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공한다.
더욱 상세하게, 본 발명은 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공하며, 상기 방법은 하기를 포함한다:
(i) SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열을 식물 또는 식물 세포에의 도입 및 발현; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건하에서 식물 세포를 배양.
핵산 서열은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따라, 핵산 서열은 바람직하게는 형질전환에 의해 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다.
일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 암호화되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.
DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석 또는 정량 PCR을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 양 기술은 당업자에게 주지되어 있다.
생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다.
생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법에서 양친에 의해 생산된 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 것과 같은 분리된 SWI2/SNF2 폴리펩티드를 암호화하는 분리된 핵산 서열을 포함하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 본 발명의 방법에 따라 사용된 핵산 서열 또는 벡터, 발현 카세트(cassette) 또는 구축물 또는 벡터에 대한 기주 식물은 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한, 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에 적용할 수 있다.
본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다. 본 발명의 바람직일 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 대두, 해바라기, 캐놀라, 알팔파, 유채, 목화, 토마토, 감자 및 담배를 포함한다. 더욱 바람직하게는, 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다. 더욱 바람직하게는 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 라이밀, 호밀, 수수 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이 부분에 제한되지는 않는다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 식물의 수확 가능한 부분으로부터 바람직하게는 직접적으로 유래된 생산물에 관련된다.
핵산 서열 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화되어 있으며, 예를 들면, 적절한 프로모터에 의한 과발현, 전사 인핸서 또는 해독 인핸서의 사용을 포함한다. 프로모터 또는 인핸서 인자로서 작용하는 분리된 핵산 서열은 비이질성(non-heterologous) 형태의 폴리뉴클레오티드의 적절한 위치 (전형적으로 업스트림)에 도입되어 발현을 상향 조절한다. 예를 들면, 내재적 프로모터는 돌연변이, 결실, 및/또는 치환에 의해 생체 내에서 변할 수 있거나 (Kmiec, U.S. Pat. No. 5,565,350; Zarling et al., PCT/US93/03868), 또는 분리된 프로모터는 본 발명의 유전자로부터 적절한 거리와 방향으로 식물 세포 내에 도입될 수 있어 해당 유전자의 발현을 조절한다.
폴리펩티드 발현을 원한다면, 일반적으로 폴리뉴클레오티드 암호화 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 폴리아데닐화 영역은 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래할 수 있다. 부가된 3' 말단 서열은 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
상기에 언급된 바와 같이, SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 발현을 증가시키는 바람직한 방법은 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 식물에의 도입 및 발현이나; 상기 방법의 수행, 즉 수확량 관련 형질의 향상 효과는 또한 다른 잘 알려진 기술을 사용하여서도 얻을 수 있다. 상기 기술의 일부의 기재는 하기에 있다.
상기 기술 중 하나는, 보통 프로모터 (또한 해독 인핸서 또는 인트론)를 함유하는 T-DNA를, 프로모터가 표적 유전자의 발현을 지시하게 배치되어 관심 유전자의 게놈 영역 내로 또는 유전자 암호화 영역의 10 kb 업스트림 또는 다운스트림으로 삽입하는 것을 포함하는 T-DNA 활성화 태깅 (Hayashi et al. Science (1992) 1350-1353)이다. 전형적으로, 자체의 자연 프로모터에 의한 표적 유전자 발현의 조절은 붕괴되어 유전자는 새로 도입된 프로모터의 조절하에 있게 된다. 프로모터는 전형적으로 T-DNA 내에 끼워져 있다. 이 T-DNA는 식물 게놈 내에 예를 들면, 아그로박테리움 감염을 통하여 무작위로 삽입되며 삽입된 T-DNA 인근의 유전자의 발현이 변형되게 된다. 결과적인 형질전환 식물은 도입된 프로모터에 가까운 유전자의 변형된 발현으로 인하여 우성 표현형을 보인다.
본 발명의 효과는 또한 TILLING (Targeted Induced Local Lesions In Genomes) 기술을 이용하여 재현될 수 있으며; 동일 내용에 대해 "정의" 섹션에 기재되어 있다.
본 발명의 효과는 또한 상동 재조합을 이용하여 재현될 수 있으며; 동일 내용에 대해 "정의" 섹션에 기재되어 있다.
본 발명은 또한 본 발명에 기재된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 용도 및 대조구 식물에 비해 식물의 수확량 관련 형질의 향상에 상기 SWI2/SNF2 폴리펩티드의 용도를 포함한다. 바람직하게는, 향상된 수확량 관련 형질은 하기 중 하나 이상이다: (i) 원추화서당 증가된 꽃의 수; (ii) 식물체당 증가된 총 종자 중량; (iii) 증가된 (충만된) 종자 수; 또는 (iv) 증가된 수확 지수.
본 발명은 또한 본 발명에 기재된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열의 용도 및 동등한 스트레스 조건하에서 자란 대조구 식물에 비해 비생물적 스트레스 조건 (바람직하게는 가뭄 스트레스 조건) 하에서 자란 식물의 수확량 관련 형질의 향상에 상기 SWI2/SNF2 폴리펩티드의 용도를 포함한다. 바람직하게는, 향상된 수확량 관련 형질은 하기 중 하나 이상이다: (i) 증가된 지상부 면적; (ii) 증가된 총 뿌리 생물량; (iii) 증가된 굵은 뿌리 생물량; (iv) 증가된 가는 뿌리 생물량; (v) 원추화서당 증가된 꽃의 수; (vi) 증가된 종자 충만도; (vii) 식물체당 증가된 총 종자 중량; (viii) 증가된 (충만된) 종자의 수; 또는 (ix) 증가된 수확 지수.
본 발명에서 기재된 SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열, 또는 SWI2/SNF2 폴리펩티드 그 자체는, SWI2/SNF2 폴리펩티드를 암호화하는 유전자에 유전적으로 연결될 수 있는, DNA 마커가 동정된 육종 프로그램에 사용된다. 유전자/핵산 서열 또는 SWI2/SNF2 폴리펩티드 그 자체는 분자 마커의 정의에 사용될 수 있다. 상기 DNA 또는 단백질 마커는 본 발명의 방법에서 정의된 향상된 수확량 관련 형질을 가진 식물체를 선발하는 육종 프로그램에 사용될 수 있다.
SWI2/SNF2 폴리펩티드를 암호화하는 유전자/핵산 서열의 대립인자 변이체 또한 마커 보조 육종 프로그램에 사용된다. 상기 육종 프로그램은 때때로 예를 들면, EMS 돌연변이 유발을 사용하여 식물에 돌연변이 유발 처리로 대립인자 변이의 도입을 필요로 하며; 다르게는, 상기 프로그램은 자연발생적으로 생성된 "자연적인" 대립인자 변이체의 수집물로부터 시작될 수도 있다. 그러면 예를 들면, PCR로 대립인자 변이체를 동정한다. 문제되는 서열의 우수한 대립인자 변이체의 선발 단계로 증가된 수확량 관련 형질을 얻는다. 선발은 전형적으로 문제되는 서열의 다른 대립인자 변이체를 함유하는 식물의 생장 능력을 관찰함으로써 이루어진다. 생장 능력은 온실 또는 야외에서 관찰할 수 있다. 추가의 선택적인 단계는 우수한 대립인자 변이체가 동정된 식물과 또 다른 식물의 교배를 포함한다. 이는 예를 들면, 흥미로운 표현형적 특징의 조합을 만드는데 사용될 수 있다.
SWI2/SNF2 폴리펩티드를 암호화하는 핵산 서열은 또한 이 유전자를 유전적으로 및 물리적으로 맵핑하기 위한 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다. 상기 SWI2/SNF2 폴리펩티드 암호화 핵산 서열의 사용에는 적어도 길이 15 뉴클레오티드의 핵산 서열만이 필요하다. SWI2/SNF2 폴리펩티드 암호화 핵산 서열은 RFLP(restriction fragment length polymorphism) 마커로 사용될 수 있다. 제한효소 절단된 식물 게놈 DNA의 서던 블럿 (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)은 SWI2/SNF2 폴리펩티드 암호화 핵산 서열이 프로브로 사용된다. 결과로 나온 밴드 분포 양상으로 유전자지도 제작을 위하여 MapMaker (Lander et al. (1987) Genomics 1: 174-181) 같은 컴퓨터 프로그램을 사용하여 유전적 분석을 하게 된다. 또한, 핵산 서열은 지정된 유전적 교배의 양친 및 자손을 나타내는 개체들의 제한 효소 처리된 게놈 DNAs를 포함하는 서던 블럿에 탐침으로 사용될 수 있다. DNA 다형의 분리를 기록하여, 이 집단을 이용하여 이전에 얻었던 유전자 지도상에 SWI2/SNF2 폴리펩티드 암호화 핵산 서열의 위치 계산에 사용한다 (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
유전자 지도 제작에 사용하기 위한 식물 유전자 유래 탐침의 생산 및 사용은 [Bematzky and Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41]에 기재되어 있다. 수많은 공개문헌이 상기 개설된 방법론 또는 이의 변형을 사용하여 특정 cDNA 클론의 유전자 지도 제작을 기술한다. 예를 들면, F2 이종교배 개체군, 역교배 개체군, 무작위 교배 개체군, 근동질유전자계통, 및 다른 세트의 개체가 유전자 지도 제작에 사용될 수 있다. 상기 방법론은 당업자에게 주지되어 있다.
핵산 탐침은 또한 물리 지도에 제작 사용될 수 있다 (즉, 물리 지도상에 서열의 위치; Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, 인용된 문헌 참조).
또 다른 구현예에 있어서, 핵산 탐침은 직접적인 FISH(fluorescence in situ hybridisation) 지도 제작에 사용될 수 있다 (Trask (1991) Trends Genet. 7:149-154). 비록 현 FISH 지도 제작 방법이 큰 클론에 유리하지만 (수 kb 내지 몇 백 kb; Laan et al. (1995) Genome Res. 5:13-20 참고), 감도가 향상되면 보다 짧은 탐침으로 FISH 지도 제작이 가능해진다.
유전자지도 및 물리지도 작성을 위한 핵산증폭에 근거한 다양한 방법이 핵산 서열을 사용하여 수행될 수 있다. 예는 대립인자 특이적 증폭 (allele-specific amplification, Kazazian (1989) J. Lab. Clin. Med 11:95-96), CAPS (polymorphism of PCR-amplified fragments; Sheffield 등 (1993) Genomics 16:325-332), 대립인자 특이적 라이게이션 (allele-specific ligation, Landegren 등 (1988) Science 241:1077-1080), 뉴클레오티드 신장 반응 (nucleotide extension reactions, Sokolov (1990) Nucleic Acid Res. 18:3671), Radiation Hybrid Mapping (Walter et al. (1997) Nat. Genet. 7:22-28) 및 Happy Mapping (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807)을 포함한다. 이들 방법을 위해서 증폭 반응 또는 프라이머 연장 반응에 사용하기 위한 프라이머 쌍을 고안하고 제작하기 위해 핵산 서열이 사용된다. 상기 프라이머의 고안은 당업자에게는 주지되어 있다. PCR에 근거한 유전자 지도 제작에 사용하는 방법에서는 핵산 서열에 해당하는 영역에서 교배 양친 간의 DNA 서열 차이를 알 필요가 있다. 그러나 이는 일반적으로 지도제작 방법에는 필요하지 않다.
본 발명의 방법에 따라, 대조구 식물에 비해 상기에서 기재된 수확량 관련 형질이 향상된 식물이 초래된다. 상기 형질은 또한 추가적인 수확량 향상 형질 (정상적인 또는 스트레스 생장 조건하에서), 다른 비생물적 및 생물적 스트레스에 대한 내성, 다양한 외형적 특질 및/또는 생화학적 및/또는 생리적 특질을 변형시키는 형질과 같은 다른 경제적으로 유용한 형질과 조합될 수도 있다.
도 1은 서열번호 2에 볼드체 및 밑줄로 표시된 모티프 1 및 2를 가진 HpaG 폴리펩티드의 정렬을 보여준다.
도 2는 세균 및 식물 단백질 유래의 HpaG 폴리펩티드의 계통수를 보여준다 (다양한 서열은 GenBank 등록번호 및/또는 gi 번호로 표시되었다).
도 3은 벼 GOS2 프로모터 (pGOS2)의 제어하에서 잔토모나스(Xanthomonas)유래의 HpaG 단백질 암호화 핵산의 벼(Oryza sativa)에서의 발현 증가를 위한 바이너리 벡터를 보여준다.
도 4는 본 발명에 따른 방법의 수행에 유용한 Harpin 서열의 예를 보여준다.
도 5는 본 발명에 따른 방법의 수행에 유용한 SWI2/SNF2 폴리펩티드의 구조를 보여준다. 본 발명에 따른 방법의 수행에 유용한 SWI2/SNF2 폴리펩티드는 속이 빈 박스로 표시된 N-말단 도메인 및 ATPase 도메인을 포함한다. 본 발명에 따른 방법의 수행에 유용한 SWI2/SNF2 폴리펩티드의 ATPase 도메인에 포함된 전형적인 8 개의 모티프, I, Ia, II, III, IV, V, Va 및 VI는 검은 수직선으로 표시되었다.
도 6은 149 SWI2/SNF2 SSO1653 서브패밀리 구성원 (Flaus 등, 2006)의 ATPase 도메인의 서열 로고(logo)를 보여준다. 서열번호 111로 표시되며, 서열번호 30에 포함된 ATPase 도메인은 상기 서열 로고(logo)와 일치한다.
도 7은 Flaus 등 (2006)에 의해 제작된 수많은 SWI2/SNF2 서브패밀리 (149 개의 SWI2/SNF2 SSO1653 서브패밀리 구성원을 포함하여)에 속하는 SWI2/SNF2 폴리펩티드의 unrooted radial neighbor-joining tree를 보여준다. 서열번호 30으로 표시된 폴리펩티드는, 모든 고세균(archea)성 및 세균성 (집합적으로 미생물로 불림) SWI2/SNF2 폴리펩티드와 함께, SSO1653 집단 (그림에서 원으로 둘러쳐짐)내에 포함된다.
도 8은 디폴트값(default values)을 사용한, 다양한 미생물 유래의 SWI2/SNF2 폴리펩티드의 CLUSTAL W (1;83) 복수 서열 정렬을 보여준다. SWI2/SNF2 폴리펩티드는 ATPase 도메인에 포함된, 모티프 I, Ia, II, III, IV, V, Va 및 VI에 필수적인 보존 서열을 공유한다. 이들 부위는 상자로 표시되었다. 강조된 또 다른 특징은, 예를 들어 서열번호 30에 포함되며, 서열번호 111로 표시된 ATPase 도메인이다. ATPase 도메인은 모티프 1의 첫 번째 아미노산 잔기 및 SWI2/SNF2 폴리펩티드 C-말단의 마지막 아미노산 잔기 사이 (N에서 C-말단으로)에 포함된다. ATPase 도메인의 시작점과 종결점이 표시되었으며, ATPase 도메인 그 자체는 정렬된 폴리 펩티드 위에 검은 상자로 표시되었다.
도 9는 베타 익스팬신(beta-expansin) 프로모터의 제어하에서 SWI2/SNF2 폴리펩티드를 암호화하는 시네코시스티스(Synechocystis) sp. PCC6803 핵산 서열의 벼(Oryza sativa)에서의 발현 증가를 위한 바이너리 벡터를 보여준다.
도 10은 본 발명에 따른 방법의 수행에 유용한 SNF2 서열의 예를 보여준다.
본 발명은 단지 예시인 하기 실시예를 참고하여 기재될 것이다. 하기 실시예는 본 발명의 범위를 완전히 한정하거나 제한할 의도는 아니다.
실시예
1:
HpaG
서열의 동정
서열번호 1에 관련된 서열 (전장 cDNA, ESTs 또는 게놈) 및/또는 서열번호 2에 관련된 단백질 서열이 Basic Local Alignment Tool (BLAST) 같은 데이터베이스 서열 탐색 도구를 사용하여 National Center for Biotechnology Information (NCBI)의 Entrez 뉴클레오티드 데이터베이스 (Altschul et al . (1990) J. Mol. Biol. 215:403-410; 및 Altschul et al . (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터 베이스에 비교하거나 필적하는 것의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 서열번호 1에 의해 암호화되는 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교 로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다.
표 A는 서열번호 1로 표시된 핵산 서열 및 서열번호 2로 표시된 단백질 서열에 연관있는 핵산 및 단백질 서열의 목록이다.
표 A: 본 발명의 방법에 유용한 HpaG 암호화 핵산 서열 및 HpaG 폴리펩티드.
실시예
2:
HpaG
폴리펩티드 서열의 정렬(
alignment
)
폴리펩티드 서열의 정렬 (도 1)은 점진적 정렬의 대중적인 Clustal 알고리즘에 근거한 ClustlW 프로그램을 사용하여 수행되었다 (Thompson et al . (1997) Nucleic Acids Res 25:4876-4882; Chenna et al . (2003). Nucleic Acids Res 31:3497-3500). Gap open penalty에 대한 디폴트 값은 10, gap extension penalty에 대한 디폴트 값은 0.1이고, 선택된 가중치 행렬은 Blosum 62 (만일 폴리펩티드가 정렬되면)이다. 정렬(alignment)을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다.
HpaG 폴리펩티드의 계통수 (도 2)는 벡터 NTI (Invitrogen)의 AlignX 프로그램에 제공된 neighbour-joining clustering algorithm을 이용하여 구축되었다 .
실시예
3: 본 발명의 방법 수행에 유용한 폴리펩티드 서열 간에 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (Campanella 등, BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다. 서열 유사성은 구분선 아래 반쪽에 보여지며, 서열 동일성은 대각선 구분선 위 반쪽에 보여진다.
비교에 사용된 매개변수는:
Scoring matrix: Blosum62
첫째 갭: 12
연장 갭: 2
소프트웨어 분석의 결과는 전장 폴리펩티드 서열 (부분적인 폴리펩티드 서열 제외하고)에 걸쳐 전체적인 유사성 및 동일성에 대하여 표 B에 보여진다. 동일성 백분율은 대각선 상부에 볼드체로, 유사성 백분율은 대각선 하부에 있다.
본 발명의 방법을 수행하는데 유용한 HpaG 폴리펩티드 서열 간의 동일성 백분율은 서열번호 9에 비교 시 37% 아미노산 동일성만큼 낮을 수도 있다.
표 B: 폴리펩티드 서열 전장에 걸친 전체적인 유사성 및 동일성에 대한 MatGAT 결과
실시예
4:
클로닝
및 벡터 구축
달리 기술되지 않는 한, 재조합 DNA 기술은 (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) 또는 [Ausubel 등 (1994), Current Protocols in Molecular Biology, Current Protocols]의 Volumes 1 및 2에 기재된 표준 프로토콜에 따라 수행된다. 식물 분자 연구에 대한 표준 재료 및 방법은 BIOS Scientific Publications Ltd (UK) 및 BIOS Scientific Publications (UK)에서 출판된 R.D.D. Croy의 Plant Molecular Biology Labfax (1993)에 기재되어 있다.
잔토모나스(Xanthomonas) HpaG 암호화 서열은 잔토모나스 악소노포디스 DNA 라이브러리로부터 PCR에 의해 증폭되었다. 기대된 길이의 PCR 단편이 정제되어, 표준 기술을 사용하여 연이어 Gateway?벡터로 클론되었다. 서열번호 1을 포함하는 엔트리 클론이 오리자 사티바 형질전환에 사용된 destination 벡터와의 LR 반응에 사 용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클론된 목적 핵산 서열과 LR 생체 내 재조합 의도된 Gateway 카세트. 구성적 발현을 위한 벼 GOS2 프로모터 (서열번호 5)는 이 Gateway 카세트의 업스트림에 위치한다. 다르게는, 프로토클로로필리드 환원효소 프로모터 (서열번호 6)와 같은 녹색 조직 특이적 프로모터가 동일하게 유용하다.
LR 재조합 단계 후, 생성된 발현벡터 pGOS2::HpaG로 당업계에 주지되어 있는 방법에 따라 아그로박테리움 균주 LBA4044를 형질전환하였다.
실시예
5: 식물 형질전환
벼 형질전환
발현 벡터를 함유하는 아그로박테리움이 오리자 사티바 식물의 형질전환에 사용되었다. 벼 야포니카 재배 품종 니폰바레의 성숙한 건조 종자의 껍질을 벗겼다. 70% 에탄올에 1 분, 0.2% HgCl2에 30 분, 멸균된 증류수로 6 회, 15분 세척하여 멸균하였다. 멸균된 종자를 2,4-D 함유 배지 (캘러스 유도배지)에서 발아시켰다. 암소에서 4주간 배양 후, 배, 배반-유래 캘러스를 절단하여 동일한 배지에서 번식시켰다. 2주 후, 캘러스는 계대배양에 의해 동일한 배지 상에서 또 다른 2주간 증식되거나 번식되었다. 배 캘러스 단편은 (세포 분열 활성을 증대시키기 위하여) 공동배양 3일 전에 신선한 배지 상에서 계대배양 되었다.
발현 벡터 함유 아그로박테리움 균주 LBA4404가 공동배양에 사용되었다. 아그로박테리움은 적절한 항생제가 포함된 AB 배지에 접종되어, 28℃에서 3일간 배양되었다. 세균을 수집하여 밀도 (OD600) 약 1이 되게 액체 공동배양 배지에 현탁액을 만들었다. 이 현탁액을 페트리디쉬에 옮겨 캘러스를 현탁액에 15 분간 침지하였다. 캘러스 조직을 필터 페이퍼 상에 옮겨 건조시킨 후, 굳힌 공동배양 배지에 옮겨 25℃, 암소에서 3일간 배양하였다. 공동배양된 캘러스를 선발제의 존재 하에 2,4-D-함유 배지에서 28℃, 암소에서 4주간 키웠다. 이 기간 중에, 급속히 자라는 저항성 캘러스 섬이 발달되었다. 이를 재분화 배지에 옮겨 명소에서 배양 후, 배가 방출되었으며 다음 4 내지 5주 후에 어린 줄기가 발달되었다. 어린 줄기를 캘러스에서 절단하여 옥신 함유 배지에서 2 내지 3주간 배양하여 토양으로 이식하였다. 강해진 어린 줄기를 온실 내 고습도 및 단일에서 키웠다.
약 35 개의 독립적인 T0 벼 형질전환체가 한 구축물당 생성되었다. 일차 형질전환체를 조직 배양실에서 온실로 옮겼다. T-DNA 삽입물의 카피 수를 확인하기 위한 정량적 PCR 분석 후, 선발제에 내성을 보이는 한 카피 형질전환 식물을 T1 종자 수확을 위하여 유지하였다. 이식 3 내지 5 개월 후 종자를 수확하였다. 본 방법으로 한 좌위 형질전환체가 50% 넘는 비율로 생산되었다 (Aldemita and Hodges 1996, Chan 등 1993, Hiei 등 1994).
옥수수
형질전환
옥수수 (Zea mays) 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법을 변형하여 수행하였다. 옥수수에 있어 형질전환은 유전형에 의존하며, 특정 유전형만이 형질전환 및 재분화를 받아들인다. 근교계통 A188 (University of Minnesota) 또는 양친으로서 A188과의 교배는 형질전환을 위한 공여자의 좋은 원천이나 다른 유전형도 성공적으로 사용될 수 있다. 옥수수 알을 미성숙된 배의 길이가 약 1 내지 1.2mm일 때인 수분 후 약 11일된 옥수수 식물체로부터 수확한다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 절단된 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 옥수수 재분화 배지에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 옥수수 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
밀 형질전환
밀의 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법으로 수행하였다. 재배품종 봅화이트 (Bobwhite; CIMMYT, Mexico로부터 입수 가능)가 형질전환에 흔히 사용된다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 아그로박테리움과의 공배양 후 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 재분화 배지에서 시험관 내에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
대두 형질전환
대두는 Texas A&M 특허 US 5,164,310에 기재된 방법을 변형하여 형질전환되었다. 몇 가지 상업적 대두 변종은 이 방법에 의한 형질전환을 수용한다. 재배품종 잭 (Jack; Illinois Seed foundation으로부터 입수 가능)이 흔히 형질전환에 사용된다. 대두 종자는 시험관 내 파종을 위해 멸균된다. 하배축, 유근 및 자엽 하나를 7일 된 어린 실생으로부터 잘라낸다. 상배축 및 나머지 자엽을 엽액 마디가 발달할 때까지 키운다. 이 엽액 마디를 잘라내어 발현벡터를 함유하는 아그로박테리움 투머파시엔스와 배양한다. 공배양 후 잘라낸 식물체 조각을 수세하여 선발 배지로 옮긴다. 재분화된 어린 줄기를 잘라내어 어린 줄기 신장 배지에 둔다. 1 cm가 되지 않는 어린 줄기를 뿌리가 발달하기까지 발근 배지에 둔다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
유채/
캐놀라
형질전환
5 내지 6일된 어린 실생의 자엽 엽병 및 하배축이 조직 배양을 위한 식물절편으로 사용되었으며 Babic 등 (1998, Plant Cell Rep 17: 183-188)에 따라 형질전 환되었다. 상업적 재배종 웨스타 (Westar; Agriculture Canada)가 형질전환을 위한 표준 변종으로 사용되나, 다른 변종도 사용될 수 있다. 캐놀라 종자는 시험관 내 파종을 위해 표면 멸균된다. 자엽이 붙어 있는 자엽 엽병 식물절편을 시험관 내 실생으로부터 절단하여, 엽병 절편의 잘린 끝 부분을 세균 현탁액에 담구어 아그로박테리움 (발현 벡터 포함)을 접종하였다. 식물절편을 3 mg/l BAP, 3 % 수크로스, 0.7 % Phytagar를 함유하는 MSBAP-3 배지에서 23℃에서, 16 시간의 빛 하에서 2일간 배양하였다. 아그로박테리움과의 공배양 2일 후, 엽병 식물 절편을 3mg/l BAP, 세포탁심, 카베니실린, 또는 티멘틴 (300mg/l)을 함유하는 MSBAP-3 배지에 옮겨 7일간 둔 후, 어린 줄기가 재분화될 때까지 세포탁심, 카베니실린, 또는 티멘틴 및 선발제가 든 MSBAP-3 배지에 배양하였다. 어린 줄기의 길이가 5 내지 10 mm일 때 잘라 어린 줄기 신장 배지 (0.5 mg/l BAP 함유 MSBAP-0.5)로 옮긴다. 길이 약 2 cm인 어린 줄기를 뿌리 유도를 위하여 발근 배지(MS0)로 옮긴다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
알팔파
형질전환
알팔파 (Medicago sativa)의 재생 클론이 (McKersie 등, 1999 Plant Physiol 119: 839-847)의 방법으로 형질전환된다. 알팔파의 재생 및 형질전환은 유전형 의존적이므로 재생식물이 요구된다. 재생식물을 얻는 방법이 기재된다. 예를 들면, 이들은 재배품종 랭그랜더 (Rangelander; Agriculture Canada) 또는 Brown DCW 및 A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112)에 의해 기재된 임의의 다른 상업적 알팔파 변종으로부터 선택할 수 있다. 다르게는, RA3 변종 (University of Wisconsin)이 조직배양에 사용하기 위해 선택되었다 (Walker 등, 1978 Am J Bot 65:654-659). 엽병 식물절편은 발현 벡터를 가진 아그로박테리움 투머파시엔스 C58C1 pMP90 (McKersie 등, 1999 Plant Physiol 119: 839-847) 또는 LBA4404와 밤새 공배양된다. 식물절편은 288 mg/L Pro, 53 mg/L 티오프롤린, 4.35 g/L K2SO4, 및 100μM 아세토시링원을 함유하는 SH 유도배지 상에서 암소에서 3일간 공배양된다. 식물절편을 절반 강도의 Murashige-Skoog 배지 (Murashige and Skoog, 1962)로 세척하여 아세토시링원은 없으나 적절한 선발제 및 아그로박테리움 생장을 저해하는 적절한 항생제를 포함하는 동일한 SH 유도배지 상에 둔다. 몇 주 후, 체세포 배를 생장조절제 및 항생제는 없고, 50g/L 수크로스가 함유된 BOi2Y 발생 배지로 옮긴다. 체세포 배는 연이어 절반 강도의 Murashige-Skoog 배지 상에서 발아된다. 발근된 실생을 온실의 토양으로 이식하여 키운다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
목화 형질전환
목화는 US 5,159,135에 기재된 방법에 따라 아그로박테리움 투머파시엔스(Agrobacterium tumefaciens)를 사용하여 형질전환된다. 목화 종자는 3% 차아염소산나트륨(sodium hypochlorite) 용액에서 20 분간 표면 살균되어, 500 ㎍/ml 세포탁심(cefotaxime)이 함유된 증류수로 수세되었다. 상기 종자는 발아를 위해 50㎍/ml 베노밀(benomyl)이 함유된 SH 배지로 옮겼다. 4 내지 6일 된 실생의 상배축을 제거하여, 0.5 cm 조각으로 잘라 0.8% 아가에 두었다. 아그로박테리움 현탁액 (목 적 유전자 및 적절한 선발 마커로 형질전환되어 밤새 배양된 것으로부터 약 108 세포/ml로 희석된)이 상배축 절편체의 접종에 사용되었다. 상온 및 명소에서 3일 후, 조직을 비타민 B5가 든 Murashige 및 Skoog 염 (Gamborg 등, Exp. Cell Res. 50:151-158 (1968)), 0.1 mg/l 2,4-D, 0.1 mg/l 키네틴(6-furfurylaminopurine) 및 750 ㎍/ml MgCL2, 그리고 잔존 세균을 죽이기 위해 50 내지 100 ㎍/ml 세포탁심 및 400-500 ㎍/ml 카르베니실린이 포함된 고체 배지 (1.6 g/l Gelrite) 로 옮겼다. 개개 세포 라인은 2 내지 3달 후에 (4 내지 6주마다 계대배양) 분리되어 조직 증식을 위해 선발 배지에 배양되었다 (30℃, 16 시간 광주기). 형질전환된 조직은 체세포배를 얻기 위해 2 내지 3 달간 비선발배지에서 연이어 배양되었다. 적어도 4 mm 길이의 건강해 보이는 배를 0.1 mg/l 인돌초산, 키네틴(6-furfurylaminopurine) 및 지베렐린산이 함유된, 미세한 질석의 SH 배지가 든 관상 용기로 옮겼다. 배를 30℃에서 16 시간의 광주기로 배양하여, 및 2 내지 3 장의 잎이 달린 단계에서 식물체를 질석 및 양분이 든 화분으로 옮겼다. 식물체가 튼튼해 지면 재배를 위해 온실로 옮겼다.
실시예
6: 표현형 평가 절차
6.1 평가
셋업
약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손 중 6 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자(이형- 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다.
4 개의 T1 events는 T2 세대에서 T1 세대에 대해서와 동일한 평가 절차이나 event당 더 많은 개체로 한층 더 평가되었다. 파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
가뭄 스크린
6 events (T2 종자)로부터의 식물체를 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 모니터하기 위해 무작위로 선택한 화분에 습도 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동적으로 식물에 재급수하였다. 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.
질소 이용 효율 스크린
T2 종자로부터의 벼 식물체를 양분액을 제외하고는 정상적인 조건하에서 화 분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배 (식물 성숙, 종자 수학)의 나머지 부분은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.
염 스트레스 스크린
식물체를 코코넛 섬유(coco fibers) 및 아르젝스(argex) (3:1 비율)로 만들어진 기질에서 키웠다. 정상적인 양분액을 온실에 식물체를 이식 후 처음 2주간 사용하였다. 처음 2주 후, 식물을 수확할 때까지 25 mM 염 (NaCl)를 양분액에 첨가하였다. 종자 관련 매개변수를 측정하였다.
6.2 통계적 분석: F-검정
식물의 표현형적 특징의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 건의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 건에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
중복적인 events의 2 회 실험이 수행되었으므로, 조합된 분석이 수행되었다. 이는 두 실험에 걸친 효과의 일관성을 확인하기에 유용하며, 그렇다면 결론에 대한 자신감을 증가시키기에 양 실험으로부터의 증거를 축적하기에 유용하다. 사용된 방법은 자료의 다층구조를 고려하는 혼합모델 접근(mixed-model approach)이다. P 값은 우도비 검정 (likelihood ratio test)을 카이 제곱 분포에 비교함으로써 구했다.
6.3 측정된 매개변수
생물량
관련 매개변수 측정
파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다. 초기 활력은 발아 후 3 주일 때 식물 (실생) 지상부 면적이다. 뿌리 생물량의 증가는 총 뿌리 생물량 (식물의 수명 중에 관찰된 뿌리의 최대 생물량으로 측정됨)의 증가; 또는 뿌리/어린 줄기 지수 (뿌리 및 어린 줄기의 활발한 생장기간 중에 뿌리 야과 어린 줄기 양 간의 비율로 측정됨)의 증가로 표현된다.
초기 활력은 백그라운드로부터 구분되는 지상부 식물체 부분으로부터 총 픽셀의 수를 세어 결정되었다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 하기 기재된 결과는 발아 후 3 주된 식물체에 대한 것이다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충만된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충만된 깍지는 분석 저울로 무게를 재었다. 충만된 종자의 수는 분리 단계 후 남은 충만된 깍지의 수를 세어 결정하였다. 총 종자 수확량은 식물체로부터 수확된 모든 충만된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립중량 (TKW)은 숫자를 센 충만된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확지수 (HI)는 총 종자 수확량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수 간의 비율이다. 본 발명에서 정의된 종자 충만도(fill rate)는 총 종자 (또는 소화) 수에 대한 충만된 종자 수의 비율 (%)로 표시된다.
실시예
7: 형질전환된 식물의 표현형 평가 결과
스트레스가 없는 조건하에서 HpaG 핵산을 발현하는 형질전환된 벼 식물의 평가결과는 하기와 같다. 지상부 생물량 (AreaMax), 출현 활력 (초기 활력), 총 종자 수확량, 충만된 종자의 수, 충만도, 원추화서당 꽃의 수, 수확 지수, 및 천립중량에 대해 증가가 관찰되었다 (표 C 참고).
표 C: 스트레스가 없는 조건하에서 수확량 증가에 대한 측정 결과
매개변수 | 전체 증가(%) | F-검정의 p-값 |
AreaMax | 13 | 0.0000 |
초기 활력 | 25 | 0.0041 |
총 종자 중량 | 30 | 0.0000 |
충만된 종자 수 | 26 | 0.0000 |
충만도(fill rate) | 9 | 0.0000 |
원추화서당 꽃 | 12 | 0.0371 |
수확 지수 | 18 | 0.0000 |
천립중량 | 4 | 0.0000 |
가뭄 스트레스 조건 하에서 HpaG 핵산을 발현하는 형질전환된 벼 식물의 평가결과는 하기에 기재되었다. 총 종자 중량, 충만된 종자의 수, 충만도, 수확 지수 및 천립중량에 대해 증가가 관찰되었다 (표 D).
표 D: 가뭄 스트레스 조건하에서 수확량 증가 측정 결과
매개변수 | 전체 증가(%) | F-검정의 p-값 |
총 종자 중량 | 40 | 0.0000 |
충만된 종자 수 | 37 | 0.0000 |
충만도(fill rate) | 30 | 0.0000 |
수확 지수 | 37 | 0.0000 |
천립중량 | 3 | 0.0001 |
실시예
8: 서열번호 29 및 서열번호 30에 관련된 서열 동정
서열번호 29에 관련된 서열 (전장 cDNA, ESTs 또는 게놈) 및/또는 서열번호 30에 관련된 단백질 서열은 BLAST (Basic Local Alignment Tool) 같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul et al. (1990) J. Mol. Biol. 215:403-410; 및 Altschul et al . (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터 베이스에 비교하고 필적하는 것의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는데 사용된다. 서열번호 29에 의해 암호화되는 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다.
표 E. 서열번호 29로 표시된 핵산 서열 및 서열번호 30으로 표시된 폴리펩티드 서열에 연관 있는 핵산 및 폴리펩티드 서열의 목록
본 발명의 방법의 수행에 유용한 SWI2/SNF2 폴리펩티드의 부가적인 출처는 Flaus 등 (2006)의 부록 표 S1C에 제시된다. 저자는 24 개의 완전한 고세균(archea) 및 269 개의 세균 게놈을 스캔하였으며, SSO1653 서브패밀리 형의 149 개의 SWI2/SNF2를 동정하였다.
실시예
9:
SWI2
/
SNF2
폴리펩티드 서열의 정렬
폴리펩티드 서열의 정렬은 점진적 정렬의 Clustal 알고리즘 (1.83)으로 디폴트 값(default values)을 사용하여 수행되었다 (Thompson et al . (1997) Nucleic Acids Res 25:4876-4882; Chenna et al . (2003). Nucleic Acids Res 31:3497-3500). 도 8에 도시된 결과는 SWI2/SNF2 폴리펩티드가 하기에 제시된 모티프 I, Ia, II, III, IV, V, Va 및 VI (박스로 표시)에 필수적인 보존서열을 공유하는 것을 보여준다:
(i) 서열번호 103으로 표시된 모티프 I LADDMGLGK(T/S), 또는 모티프 I의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(ii) 서열번호 104로 표시된 모티프 Ia L(L/V/I)(V/I/L)(A/C)P(T/M/V)S(V/I/L)(V/I/L)XNW, 또는 모티프 Ia의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(iii) 서열번호 105로 표시된 모티프 II DEAQ(N/A/H)(V/I/L)KN, 또는 모티프 II의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(iv) 서열번호 106으로 표시된 모티프 III A(L/M)TGTPXEN, 또는 모티프 III의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(v) 서열번호 107로 표시된 모티프 IV (L/I)XF(T/S)Q(F/Y), 또는 모티프 IV의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(vi) 서열번호 108로 표시된 모티프 V S(L/V)KAGG(V/T/L)G(L/I)(N/T)LTXA(N/S/T)HV, 또는 모티프 V의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프;
(vii) 서열번호 109로 표시된 모티프 Va DRWWNPAVE, 또는 모티프 Va의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프; 및
(viii) 서열번호 110으로 표시된 모티프 VI QA(T/S)DR(A/T/V)(F/Y)R(I/L)GQ, 또는 모티프 VI의 서열에 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프,
상기 모티프 Ia, 모티프 III, 모티프 IV, 및 모티프 V에서 X는 임의의 아미 노산이다.
상기 8 개 모티프는 ATPase 도메인 내에 포함된다. ATPase 도메인은 모티프 1의 첫 번째 아미노산 잔기 및 SWI2/SNF2 폴리펩티드 C-말단의 마지막 아미노산 잔기 사이 (N에서 C-말단으로)에 포함된다. ATPase 도메인의 시작점과 종결점이 도 8에 표시되었으며, ATPase 도메인 그 자체는 정렬된 폴리펩티드 위에 검은 상자로 표시되었다. ATPase 도메인의 예는 서열번호 30의 ATPase 도메인이며, 서열번호 111로 나타내었다.
149 개의 SWI2/SNF2 SSO1653 서브패밀리 구성원의 ATPase 도메인의 서열 로고(logo)는 Flaus 등 (2006)에 제시되어 있으며, 도 6에 도시되었다. 서열 로고는 아미노산 또는 핵산의 다중 서열 정렬의 그래픽 표현이다. 각 로고는 기호의 더미(stack)로 이루어지며, 서열상의 각 위치에 대해 하나의 더미로 구성된다. 더미의 전체 높이는 해당 위치에서의 서열이 보존되어 있음을 나타내며, 더미 내에서 기호의 높이는 해당 위치에서 각 아미노산 또는 핵산의 상대 빈도를 나타낸다. 일반적으로, 서열 로고가 일치(consensus) 서열 보다 예를 들면, 결합위치(binding site)의 보다 더 풍부하며 자세한 기재를 제공한다. 이와 같은 로고를 생산하는 알고리즘 (WebLogo)은 California 대학교 (Berkeley)의 서버에서 가능하다. 서열번호 111로 표시되며, 서열번호 30에 포함된 ATPase 도메인은 도 6에 도시된 서열 로고와 일치한다.
수많은 SWI2/SNF2 서브패밀리 (SSO1653 포함)로부터 SWI2/SNF2 폴리펩티드의 unrooted radial neighbor-joining tree가 도 7에 도시된 바와 같이 Flaus 등, (2006)에 의해 구축되었다. 서열번호 30으로 표시된 폴리펩티드는 모든 고세균(archea) 및 세균 (집합적으로 미생물) SWI2/SNF2 폴리펩티드와 함께 SSO1653 집단 (그림에서 원으로 표시)에 포함된다.
실시예 10: 본 발명의 방법 수행에 유용한 폴리펩티드 서열 간에 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타를 사전 정렬할 필요 없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다. 서열 유사성은 구분선 아래 반쪽에 보여지며, 서열 동일성은 대각선 구분선 위 반쪽에 보여진다.
비교에 사용된 매개변수는 하기와 같다:
Scoring matrix: Blosum62
첫째 갭: 12
연장 갭: 2
소프트웨어 분석의 결과는 전장 폴리펩티드 서열 (부분적인 폴리펩티드 서열 제외)에 걸쳐 전체적인 유사성 및 동일성에 대하여 표 F에 보여진다. 동일성 백분율은 대각선 상부에, 유사성 백분율은 대각선 하부에 있다.
본 발명의 방법을 수행하는데 유용한 SSO1653 서브패밀리의 전장 SWI2/SNF2 폴리펩티드 서열 간의 동일성 백분율은 서열번호 30에 비교 시 33% 내지 52% 범위의 아미노산 동일성이다 (표 F).
본 발명의 방법을 수행하는데 유용한 SSO1653 서브패밀리의 SWI2/SNF2 폴리펩티드 서열의 ATPase 도메인 간의 동일성 백분율은 서열번호 111로 표시되고, 서열번호 30에 포함된 ATPase 도메인에 비교 시 45% 내지 70% 범위의 아미노산 동일성이다 (표 F1).
표 F: 전장 SWI2/SNF2 폴리펩티드 서열에 걸쳐 전체적인 유사성 및 동일성에 대한 MatGAT 결과
표 F1: SWI2/SNF2 폴리펩티드 서열의 ATPase 도메인 간 전체적인 유사성 및 동일성에 대한 MatGAT 결과
실시예
11: 본 발명의 방법 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 텍스트 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Interpro는 영국에 있는 European Bioinformatics Institute에서 호스팅된다.
서열번호 30으로 표시된 폴리펩티드 서열의 InterPro 스캔의 결과가 표 G에 제시되어 있다. SWI2/SNF2 폴리펩티드 (또는 리모델링 효소)는 ATP 가수분해를 이용하여 DNA 가닥의 분리를 촉매하는 효소인 헬리카아제 (특히 SF2 헬리카아제)와 서열 유사성을 공유한다. 상기 서열 유사성은 양 유형의 효소의 ATPase 도메인에 제한된다.
표 G: 서열번호 2로 표시된 폴리펩티드 서열의 InterPro scan 결과 (주요 등록번호).
실시예
12: 서열번호 29로 표시된 핵산 서열의
클로닝
달리 기술되지 않는 한, 재조합 DNA 기술은 (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) 또는 Ausubel 등 (1994)의 Current Protocols in Molecular Biology, Current Protocols의 Volumes 1 및 2에 기재된 표준 프로토콜에 따라 수행된다. 식물 분자 연구에 대한 표준 재료 및 방법은 BIOS Scientific Publications Ltd (UK) 및 BIOS Scientific Publications (UK)에서 출판된 R.D.D. Croy의 Plant Molecular Biology Labfax (1993)에 기재되어 있다.
시네코시스티스(Synechocystis) sp. PCC6803 SWI2/SNF2 유전자는 시네코시스티스(Synechocystis) sp. PCC6803 게놈 DNA를 주형으로 하여 PCR로 증폭되었다. Gateway 재조합을 위한 AttB 부위를 포함하는 프라이머 prmO8774 (서열번호 113; 센스,: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgactatccacggtaattgg-3') 및 prmO8779 (서열번호 114; 역방향, 상보적,: 5'-ggggaccactttgtacaagaaagctgggttcaatcggacgcttcggctt- 3')가 PCR 증폭에 사용되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여 수행되었다. 예상된 길이의 PCR 단편이 (attB 부위 포함) 증폭되어, 표준 방법으로 정제되었다. Gateway 용어로 "entry clone"을 생성하기 위해, PCR 단편이 pDONR201 플라스미드로 생체 내(in vivo) 재조합되는 중에 Gateway 과정의 첫 단계인 BP 반응이 수행되었다. 플라스미드 pDONR201는 Gateway?기술의 일부로, Invitrogen으로부터 구입하였다.
실시예 13: 서열번호 29로 표시된 핵산 서열을 사용한 발현 벡터 구축
서열번호 29를 포함하는 엔트리(entry) 클론을 벼 형질전환에 사용된 destination 벡터와의 LR 반응에 사용하였다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 식물 선발 마커, 스크린가능한 마커 발현 카세트, 및 이미 엔트리 클론으로 클론된 목적 핵산 서열과 LR 생체 내 재조합에 계획된 Gateway 카세트를 포함한다. 어린 확장성 조직에서의 발현을 위해 벼 베타 익스팬신(beta-expansin) 프로모터 (서열번호 112)를 상기 Gateway 카세트의 업스트림에 두었다.
LR 재조합 단계 후, 생성된 발현 벡터 pExp::SWI2/SNF2 (도 8)는 당업계에 주지된 방법에 따라 아그로박테리움 균주(Agrobacterium strain) LBA4044로 형질전 환되었다.
실시예
14: 식물 형질전환
벼 형질전환에 대해 상기 실시예 5 참고
실시예 15:
표현형 평가 절차
15.1 평가
셋업
약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손 중 6 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자(이형접합자 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다.
5 개의 T1 events는 T2 세대에서 T1 세대에 대해서와 동일한 평가 절차이나 event당 보다 많은 개체로 한층 더 평가되었다. 파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
가뭄 스크린
5 events (T2 종자)로부터의 식물체를 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 모니터하기 위해 무작위로 선택한 화분에 습도 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동적으로 식물에 재급수하였다. 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.
염 스트레스 스크린
벼 식물체를 코코넛 섬유(coco fibers) 및 아르젝스(argex) (3:1 비율)로 만들어진 기질에서 키웠다. 정상적인 양분액을 온실에 식물체를 이식 후 처음 2주간 사용하였다. 처음 2주 후, 25 mM 염 (NaCl)을 하기 목록의 구성분을 포함하는 양분액에 첨가하였다.
- NPK 양분 혼합물, 1 kg/m3의 농도로 20-20-20 Peters professional (Scotts, Marysville, OH, USA).
- 마그네슘 킬레이트(Magnesium chelate), 333.33 ml/m3로 Chelal Mg (BMS, Bornem, Belgium)
- 철 킬레이트(Iron chelate), 21.67 g/m3로 Libfer (CIBA, Bradford, UK)
- NaCl 1.425 kg/m3
염 농도를 매주 모니터링하여, 필요 시 첨가 하였다. 등숙(grain filling)이 시작될 때까지 상기 조건하에서 식물체를 키웠다. 종자 수확할 때까지, 신선한 물이 매일 급수되는 온실의 다른 구획으로 옮겼다. 생장 및 수확량 매개변수를 정상적인 조건의 생장에서와 같이 기록하였다.
감소된
양분 (질소) 이용률 스크린
벼 식물체를 양분액을 제외하고는 정상적인 조건하에서 화분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배의 나머지 부분 (식물 성숙, 종자 수학)은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 처럼 기록하였다.
15.2 통계적 분석: F-검정
식물의 표현형적 특징의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 건의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 건에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유 의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
15.3 측정된 매개변수
생물량
관련 매개변수 측정
파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다. 초기 활력은 발아 후 3 주일 때 식물 (실생) 지상부 면적이다.
뿌리 관련 매개변수를 측정하기 위해, 뿌리가 보일 수 있게 하부가 투명하게 특별히 고안된 화분에서 식물체를 키웠다. 식물체 생장 중에 화분의 하부의 이미지를 디지털 카메라로 기록하였다. 뿌리 생물량의 증가는 총 뿌리 생물량 (식물체의 수명 중에 관찰된 뿌리의 최대 생물량으로서 측정된)의 증가로; 또는 뿌리/신초 지수 (뿌리 및 신초의 활발한 생장기간에 뿌리 양 및 신초 양 간의 비율로서 측정된) 의 증가로 표현된다. 더욱이, 특정 두께 역치 이하의 뿌리(가는 뿌리)의 최대 생물량 뿐만 아니라, 식물체의 수명 중에 관찰된 임의의 두께 역치 이상의 뿌리(굵은 뿌리)의 최대 생물량이 계산된다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충만된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충만된 깍지는 분석 저울로 무게를 재었다. 충만된 종자의 수는 분리 단계 후 남은 충만된 깍지의 수를 세어 결정하였다. 식물체당 총 종자 중량은 하나의 식물체로부터 수확된 모든 충만된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 하나의 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립중량 (TKW)은 숫자를 센 충만된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확지수 (HI)는 식물체당 총 종자 중량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수 간의 비율이다. 본 발명에서 정의된 종자 충만도는 총 종자 (또는 소화) 수에 대한 충만된 종자 수의 비율 (%)로 표시된다.
실시예
16: 정상적인 조건하에서 자란,
SWI2
/
SNF2
핵산 서열을 발현하는 형질전환된 벼 식물체의 표현형 평가 결과
정상적인 생장 조건하에서 자란, SWI2/SNF2 핵산 서열을 발현하는 형질전환된 벼 식물의 평가 결과는 하기 표 H에 제시된다.
해당 공접합자 (대조구)에 비해 형질전환체의 원추화서당 꽃의 수, 식물체당 총 종자 중량, 총 종자 수, 충만된 종자의 수 및 수확 지수에 있어서의 증가가 있었다.
표 H. 정상적인 생장 조건하에서 자란, SWI2/SNF2 핵산 서열을 발현하는 형질전환된 벼 식물의 평가 결과.
T1 세대에서 best performing events의 평균 증가(%) | T2 세대에서 best performing events의 평균 증가(%) | |
원추화서당 꽃 수 | 11% | 3% |
식물체당 총 종자 중량 | 13% | 28% |
총 종자 수 | 14% | 6% |
충만된 종자 수 | 14% | 25% |
수확 지수 | 10% | 25% |
실시예
17: 가뭄 스트레스 조건하에서 자란 형질전환된 벼 식물체의 표현형 평가결과
가뭄 스트레스 생장 조건하에서 자란, SWI2/SNF2 핵산 서열을 발현하는 형질전환된 벼 식물체의 평가 결과는 표 I에 제시된다.
해당 공접합자(nullizygotes; 대조구)에 비해 형질전환체의 지상부 면적, 총 뿌리 생물량, 원추화서당 꽃의 수, 종자 충만도, 식물체당 총 종자 중량, 총 종자 수, 충만된 종자의 수 및 수확 지수에 있어서의 증가가 있었다.
표 I. 가뭄 스트레스 생장 조건하에서 SWI2/SNF2 핵산 서열을 발현하는 형질전환된 벼 식물체의 평가 결과
T2 세대에서 best performing events의 평균 증가(%) | |
지상부 면적 | 16% |
총 뿌리 생물량 | 13% |
굵은 뿌리 생물량 | 10% |
가는 뿌리 생물량 | 13% |
원추화서당 꽃의 수 | 7% |
종자 충만도 | 28% |
식물체당 총 종자 중량 | 57% |
총 종자 수 | 44% |
충만된 종자의 수 | 54% |
수확 지수 | 31% |
실시예
18: 옥수수,
알팔파
, 목화, 대두, 유채/
캐놀라
, 밀의 형질전환의 예
상기 실시예 5 참고
<110> Cropdesign N.V.
Crop Functional Genomics Center
<120> Plants having enhanced yield-related traits and a method for
making the same
<130> PF58891
<160> 114
<170> PatentIn version 3.3
<210> 1
<211> 402
<212> DNA
<213> Xanthomonas axonopodis
<400> 1
atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60
cagaacacgc aatctagtcc gaaccagggc aaccagggca tctcggaaaa gcaactggac 120
cagctgctga cccagctcat catggccctg cttcagcaga gcaacaatgc cgagcagggt 180
cagggtcaag gccagggtgg tgactctggc ggtcagggcg gcaatccgcg gcaggccggg 240
cagtccaacg gctccccctc gcaatacacc caggcgctga tgaatatcgt cggagacatt 300
ctccaggcgc agaatggtgg cggcttcggc ggcggctttg gtggtggctt cggtggcatc 360
ctcgtcacca gccttgcgag cgacaccgga tcgatgcagt aa 402
<210> 2
<211> 133
<212> PRT
<213> Xanthomonas axonopodis
<400> 2
Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln
1 5 10 15
Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Gln
20 25 30
Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met
35 40 45
Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly
50 55 60
Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro Arg Gln Ala Gly
65 70 75 80
Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala Leu Met Asn Ile
85 90 95
Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Gly Gly Phe Gly Gly Gly
100 105 110
Phe Gly Gly Gly Phe Gly Gly Ile Leu Val Thr Ser Leu Ala Ser Asp
115 120 125
Thr Gly Ser Met Gln
130
<210> 3
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> conserved motif 1
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Glu" /replace = "Asp"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace = "Glu"
<220>
<221> UNSURE
<222> (4)..(4)
<223> Xaa can e any naturally occurring amino acid
<220>
<221> VARIANT
<222> (5)..(5)
<223> /replace = "Arg" /replace = "Pro"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Ser"
<220>
<221> UNSURE
<222> (9)..(9)
<223> Xaa can e any naturally occurring amino acid
<220>
<221> VARIANT
<222> (10)..(10)
<223> /replace = "Asp"
<400> 3
Gly Gly Asn Xaa Gln Gln Ala Gly Xaa Asn Gly
1 5 10
<210> 4
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> conserved motif 2
<220>
<221> VARIANT
<222> (1)..(1)
<223> /replace = "Ala" /replace = "Val"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace = "Gln" /replace = "Ala"
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace = "Leu" /replace = "Tyr"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Ala"
<220>
<221> VARIANT
<222> (10)..(10)
<223> /replace = "Asn" /replace = "Gln"
<220>
<221> VARIANT
<222> (13)..(13)
<223> /replace = "Met"
<220>
<221> VARIANT
<222> (14)..(14)
<223> /replace = "Asp" /replace = "Gln"
<400> 4
Pro Ser Pro Phe Thr Gln Met Leu Met His Ile Val Gly Glu
1 5 10
<210> 5
<211> 2194
<212> DNA
<213> Oryza sativa
<400> 5
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210> 6
<211> 1179
<212> DNA
<213> Oryza sativa
<400> 6
ttgcagttgt gaccaagtaa gctgagcatg cccttaactt cacctagaaa aaagtatact 60
tggcttaact gctagtaaga catttcagaa ctgagactgg tgtacgcatt tcatgcaagc 120
cattaccact ttacctgaca ttttggacag agattagaaa tagtttcgta ctacctgcaa 180
gttgcaactt gaaaagtgaa atttgttcct tgctaatata ttggcgtgta attcttttat 240
gcgttagcgt aaaaagttga aatttgggtc aagttactgg tcagattaac cagtaactgg 300
ttaaagttga aagatggtct tttagtaatg gagggagtac tacactatcc tcagctgatt 360
taaatcttat tccgtcggtg gtgatttcgt caatctccca acttagtttt tcaatatatt 420
cataggatag agtgtgcata tgtgtgttta tagggatgag tctacgcgcc ttatgaacac 480
ctacttttgt actgtatttg tcaatgaaaa gaaaatctta ccaatgctgc gatgctgaca 540
ccaagaagag gcgatgaaaa gtgcaacgga tatcgtgcca cgtcggttgc caagtcagca 600
cagacccaat gggcctttcc tacgtgtctc ggccacagcc agtcgtttac cgcacgttca 660
catgggcacg aactcgcgtc atcttcccac gcaaaacgac agatctgccc tatctggtcc 720
cacccatcag tggcccacac ctcccatgct gcattatttg cgactcccat cccgtcctcc 780
acgcccaaac accgcacacg ggtcgcgata gccacgaccc aatcacacaa cgccacgtca 840
ccatatgtta cgggcagcca tgcgcagaag atcccgcgac gtcgctgtcc cccgtgtcgg 900
ttacgaaaaa atatcccacc acgtgtcgct ttcacaggac aatatctcga aggaaaaaaa 960
tcgtagcgga aaatccgagg cacgagctgc gattggctgg gaggcgtcca gcgtggtggg 1020
gggcccaccc ccttatcctt agcccgtggc gctcctcgct cctcgggtcc gtgtataaat 1080
accctccgga actcactctt gctggtcacc aacacgaagc aaaaggacac cagaaacata 1140
gtacacttga gctcactcca aactcaaaca ctcacacca 1179
<210> 7
<211> 402
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic construct mutant elicitor of hypersensitive response
HpaG_T44C gene
<400> 7
atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60
cagaacacgc aatctagtcc gaaccagggc aaccagggca tctcggaaaa gcaactggac 120
cagctgctgt gccagctcat catggccctg cttcagcaga gcaacaatgc cgagcagggt 180
cagggtcaag gccagggtgg tgactctggc ggtcagggcg gcaatccgcg gcaggccggg 240
cagtccaacg gctccccctc gcaatacacc caggcgctga tgaatatcgt cggagacatt 300
ctccaggcgc agaatggtgg cggcttcggc ggcggctttg gtggtggctt cggtggcatc 360
ctcgtcacca gccttgcgag cgacaccgga tcgatgcagt aa 402
<210> 8
<211> 133
<212> PRT
<213> Artificial sequence
<220>
<223> mutant elicitor of hypersensitive response HpaG_T44C
<400> 8
Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln
1 5 10 15
Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Gln
20 25 30
Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln Leu Ile Met
35 40 45
Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly
50 55 60
Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro Arg Gln Ala Gly
65 70 75 80
Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala Leu Met Asn Ile
85 90 95
Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Gly Gly Phe Gly Gly Gly
100 105 110
Phe Gly Gly Gly Phe Gly Gly Ile Leu Val Thr Ser Leu Ala Ser Asp
115 120 125
Thr Gly Ser Met Gln
130
<210> 9
<211> 378
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic construct mutant elicitor of hypersensitive response
HpaG-T gene
<400> 9
atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60
cagaacacgc aatctagtcc gaaccagggc aaccagggca tctcggaaaa gcaactggac 120
cagctgctga cccagctcat catggccctg cttcagcaga gcaacaatgc cgagcagggt 180
cagggtcaag gccagggtgg tgactctggc ggtcagggcg gcaatccgcg gcaggccggg 240
cagtccaacg gctccccctc gcaatacacc caggcgctga tgaatatcgt cggagacggc 300
ttcggcggcg gctttggtgg tggcttcggt ggcatcctcg tcaccagcct tgcgagcgac 360
accggatcga tgcagtaa 378
<210> 10
<211> 125
<212> PRT
<213> Artificial sequence
<220>
<223> mutant elicitor of hypersensitive response HpaG-T
<400> 10
Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln
1 5 10 15
Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Gln
20 25 30
Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met
35 40 45
Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly
50 55 60
Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro Arg Gln Ala Gly
65 70 75 80
Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala Leu Met Asn Ile
85 90 95
Val Gly Asp Gly Phe Gly Gly Gly Phe Gly Gly Gly Phe Gly Gly Ile
100 105 110
Leu Val Thr Ser Leu Ala Ser Asp Thr Gly Ser Met Gln
115 120 125
<210> 11
<211> 414
<212> DNA
<213> Xanthomonas axonopodis pv. citri
<400> 11
ttactgcatc gatccggtgt cgctcgcaag gctggtgccg aggctggtgc cgaggccgcc 60
gccgaagcca ccaccaaagc cgccgccgaa gccaccacca ttctgcgcct ggagaatgtc 120
tccgacgata ttcatcagca tctgggtgta ttgcgagggg gagccgttgg actgaccggc 180
ctgctgccga ttgccgccct gaccaccaga gtcaccaccc tggccttgac cctgaccctg 240
ctcggcattg ttgctctgct gaagcagggc catgatgagc tgggtcagca gctggtccag 300
ttgcttttcc gagatgccct ggttgccctg gttcgaacca gattgcgtgt tctggctggg 360
gtcaacctga aagaaggacg agttggcgcc gagctgtgtg ttcaaagaat tcat 414
<210> 12
<211> 137
<212> PRT
<213> Xanthomonas axonopodis pv. citri
<400> 12
Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln
1 5 10 15
Val Asp Pro Ser Gln Asn Thr Gln Ser Gly Ser Asn Gln Gly Asn Gln
20 25 30
Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met
35 40 45
Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly
50 55 60
Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Arg Gln Gln Ala Gly
65 70 75 80
Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Met Leu Met Asn Ile
85 90 95
Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Gly Gly Phe Gly Gly Gly
100 105 110
Phe Gly Gly Gly Phe Gly Gly Gly Leu Gly Thr Ser Leu Gly Thr Ser
115 120 125
Leu Ala Ser Asp Thr Gly Ser Met Gln
130 135
<210> 13
<211> 366
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic construct mutant elicitor of hypersensitive response
HpaG-N gene
<400> 13
atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60
cagaacacgc aatctagtcc gaaccagggc aacacccagc tcatcatggc cctgcttcag 120
cagagcaaca atgccgagca gggtcagggt caaggccagg gtggtgactc tggcggtcag 180
ggcggcaatc cgcggcaggc cgggcagtcc aacggctccc cctcgcaata cacccaggcg 240
ctgatgaata tcgtcggaga cattctccag gcgcagaatg gtggcggctt cggcggcggc 300
tttggtggtg gcttcggtgg catcctcgtc accagccttg cgagcgacac cggatcgatg 360
cagtaa 366
<210> 14
<211> 121
<212> PRT
<213> Artificial sequence
<220>
<223> mutant elicitor of hypersensitive response HpaG-N
<400> 14
Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln
1 5 10 15
Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Thr
20 25 30
Gln Leu Ile Met Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly
35 40 45
Gln Gly Gln Gly Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro
50 55 60
Arg Gln Ala Gly Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala
65 70 75 80
Leu Met Asn Ile Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Gly Gly
85 90 95
Phe Gly Gly Gly Phe Gly Gly Gly Phe Gly Gly Ile Leu Val Thr Ser
100 105 110
Leu Ala Ser Asp Thr Gly Ser Met Gln
115 120
<210> 15
<211> 366
<212> DNA
<213> Xanthomonas axonopodis
<400> 15
atgaattctt tgaacacaca gctcggcgcc aactcgtcct tctttcaggt tgaccccggc 60
cagaacacgc aatctagtcc gaaccagggc aaccagggca tctcggaaaa gcaactggac 120
cagctgctga cccagctcat catggccctg cttcagcaga gcaacaatgc cgagcagggt 180
cagggtcaag gccagggtgg tgactctggc ggtcagggcg gcaatccgcg gcaggccggg 240
cagtccaacg gctccccctc gcaatacacc caggcgctga tgaatatcgt cggagacatt 300
ctccaggcgc agaatggctt tatcctcgtc accagccttg cgagcgacac cggatcgatg 360
cagtaa 366
<210> 16
<211> 121
<212> PRT
<213> Xanthomonas axonopodis
<400> 16
Met Asn Ser Leu Asn Thr Gln Leu Gly Ala Asn Ser Ser Phe Phe Gln
1 5 10 15
Val Asp Pro Gly Gln Asn Thr Gln Ser Ser Pro Asn Gln Gly Asn Gln
20 25 30
Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met
35 40 45
Ala Leu Leu Gln Gln Ser Asn Asn Ala Glu Gln Gly Gln Gly Gln Gly
50 55 60
Gln Gly Gly Asp Ser Gly Gly Gln Gly Gly Asn Pro Arg Gln Ala Gly
65 70 75 80
Gln Ser Asn Gly Ser Pro Ser Gln Tyr Thr Gln Ala Leu Met Asn Ile
85 90 95
Val Gly Asp Ile Leu Gln Ala Gln Asn Gly Phe Ile Leu Val Thr Ser
100 105 110
Leu Ala Ser Asp Thr Gly Ser Met Gln
115 120
<210> 17
<211> 402
<212> DNA
<213> Xanthomonas smithii subsp. smithii
<400> 17
atgaattctt tgaacacaca gatcggcgcc aactcgtcct tcttgcaggt cgacccgagc 60
cagaacacgc aattcggtcc gaaccagggc aatcaaggca tctcggaaaa gcagctggac 120
cagctgctga cccagctcat catggccctg cttcagcaga gcaacaatgc cgaccagggt 180
cagggtggtg actctggtgg tcaaggcggc aattcgcggc aggccgggca gcccaatggt 240
tccccctcgg catacaccca gatgctgatg aatatcgtcg gagacattct ccaggcgcag 300
aatggtggtg gcttcggcgg cgggttcggc ggtggctttg gtggcgggct cggcaccagc 360
ctcggcagca gccttgcgag cgacaccgga tcgatgcagt aa 402
<210> 18
<211> 133
<212> PRT
<213> Xanthomonas smithii subsp. smithii
<400> 18
Met Asn Ser Leu Asn Thr Gln Ile Gly Ala Asn Ser Ser Phe Leu Gln
1 5 10 15
Val Asp Pro Ser Gln Asn Thr Gln Phe Gly Pro Asn Gln Gly Asn Gln
20 25 30
Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Thr Gln Leu Ile Met
35 40 45
Ala Leu Leu Gln Gln Ser Asn Asn Ala Asp Gln Gly Gln Gly Gly Asp
50 55 60
Ser Gly Gly Gln Gly Gly Asn Ser Arg Gln Ala Gly Gln Pro Asn Gly
65 70 75 80
Ser Pro Ser Ala Tyr Thr Gln Met Leu Met Asn Ile Val Gly Asp Ile
85 90 95
Leu Gln Ala Gln Asn Gly Gly Gly Phe Gly Gly Gly Phe Gly Gly Gly
100 105 110
Phe Gly Gly Gly Leu Gly Thr Ser Leu Gly Ser Ser Leu Ala Ser Asp
115 120 125
Thr Gly Ser Met Gln
130
<210> 19
<211> 420
<212> DNA
<213> Xanthomonas oryzae pv. oryzae
<400> 19
atgaactctt tgaacacaca attcggcggc agcacgtcca accttcaggt tggcccaagc 60
caggacacaa cgttcggttc gaaccagggc ggcaaccagg gcatctcgga aaagcaactg 120
gaccagttgc tgtgccagct catctcggcc ctgcttcagt cgagcaaaaa tgctgaggag 180
ggtaagggtc agggtggcga taatggcggt ggccagggcg gcaattcgca gcaggccggg 240
cagcagaatg gcccctcgcc attcacccag atgctgatgc atatcgtcgg agagattctc 300
caggcgcaga atggtggtgg tgctggtggc ggcggtttcg gcggcgggtt cggcggcgac 360
tttagtggcg acctcggcct cggcaccaac ctctcgagcg acagcgcatc aatgcagtaa 420
<210> 20
<211> 139
<212> PRT
<213> Xanthomonas oryzae pv. oryzae
<400> 20
Met Asn Ser Leu Asn Thr Gln Phe Gly Gly Ser Thr Ser Asn Leu Gln
1 5 10 15
Val Gly Pro Ser Gln Asp Thr Thr Phe Gly Ser Asn Gln Gly Gly Asn
20 25 30
Gln Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln Leu Ile
35 40 45
Ser Ala Leu Leu Gln Ser Ser Lys Asn Ala Glu Glu Gly Lys Gly Gln
50 55 60
Gly Gly Asp Asn Gly Gly Gly Gln Gly Gly Asn Ser Gln Gln Ala Gly
65 70 75 80
Gln Gln Asn Gly Pro Ser Pro Phe Thr Gln Met Leu Met His Ile Val
85 90 95
Gly Glu Ile Leu Gln Ala Gln Asn Gly Gly Gly Ala Gly Gly Gly Gly
100 105 110
Phe Gly Gly Gly Phe Gly Gly Asp Phe Ser Gly Asp Leu Gly Leu Gly
115 120 125
Thr Asn Leu Ser Ser Asp Ser Ala Ser Met Gln
130 135
<210> 21
<211> 420
<212> DNA
<213> Xanthomonas oryzae pv. oryzae
<400> 21
atgaattctt tgaacacaca attcggcggc agcacgtcca accttcaggt tggcccaagc 60
caggacacaa cgttcggttc gaaccagggc ggcaaccagg gcatctcgga aaagcaactg 120
gaccagttgc tgtgccagct catctcggcc ctgcttcagt cgagcaaaaa tgctgaggag 180
ggtaagggtc agggtggcga taatggcggt ggccagggcg gcaattcgca gcaggctggg 240
cagcagaatg gcccctcgcc attcacccag atgctgatgc atatcgtcgg agagattctc 300
caggcgcaga atggtggtgg tgctggtggc ggcgggttcg gcggcgggtt cggcggtgac 360
tttagtggcg acctcggcct cggcaccaac ctctcgagcg acagcgcatc gatgcagtaa 420
<210> 22
<211> 139
<212> PRT
<213> Xanthomonas oryzae pv. oryzae
<400> 22
Met Asn Ser Leu Asn Thr Gln Phe Gly Gly Ser Thr Ser Asn Leu Gln
1 5 10 15
Val Gly Pro Ser Gln Asp Thr Thr Phe Gly Ser Asn Gln Gly Gly Asn
20 25 30
Gln Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln Leu Ile
35 40 45
Ser Ala Leu Leu Gln Ser Ser Lys Asn Ala Glu Glu Gly Lys Gly Gln
50 55 60
Gly Gly Asp Asn Gly Gly Gly Gln Gly Gly Asn Ser Gln Gln Ala Gly
65 70 75 80
Gln Gln Asn Gly Pro Ser Pro Phe Thr Gln Met Leu Met His Ile Val
85 90 95
Gly Glu Ile Leu Gln Ala Gln Asn Gly Gly Gly Ala Gly Gly Gly Gly
100 105 110
Phe Gly Gly Gly Phe Gly Gly Asp Phe Ser Gly Asp Leu Gly Leu Gly
115 120 125
Thr Asn Leu Ser Ser Asp Ser Ala Ser Met Gln
130 135
<210> 23
<211> 420
<212> DNA
<213> Xanthomonas oryzae pv. oryzae
<400> 23
atgaattctt tgaacacaca attcggcggc agcacgtcca accttcaggt tggcccaagc 60
caggacacaa cgttcggttc gaaccagggc ggcaaccagg gcatctcgga aaagcaactg 120
gaccagttgc tgtgccagct catctcggcc ctgcttcagt cgagcaaaaa tgctgaggag 180
ggtaagggtc agggtggcga taatggcggt ggccagggcg gcaattcgca gcaggccggg 240
cagcagaatg gcccctcgcc attcacccag atgctgatgc atatcgtcgg agagattctc 300
caggcgcaga atggtggtgg tgctggtggc ggcgggttcg gcggcgggtt cggcggtgac 360
tttagtggcg acctcggcct cggcaccaac ctctcgagcg acagcgcatc gatgcagtaa 420
<210> 24
<211> 139
<212> PRT
<213> Xanthomonas oryzae pv. oryzae
<400> 24
Met Asn Ser Leu Asn Thr Gln Phe Gly Gly Ser Thr Ser Asn Leu Gln
1 5 10 15
Val Gly Pro Ser Gln Asp Thr Thr Phe Gly Ser Asn Gln Gly Gly Asn
20 25 30
Gln Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln Leu Ile
35 40 45
Ser Ala Leu Leu Gln Ser Ser Lys Asn Ala Glu Glu Gly Lys Gly Gln
50 55 60
Gly Gly Asp Asn Gly Gly Gly Gln Gly Gly Asn Ser Gln Gln Ala Gly
65 70 75 80
Gln Gln Asn Gly Pro Ser Pro Phe Thr Gln Met Leu Met His Ile Val
85 90 95
Gly Glu Ile Leu Gln Ala Gln Asn Gly Gly Gly Ala Gly Gly Gly Gly
100 105 110
Phe Gly Gly Gly Phe Gly Gly Asp Phe Ser Gly Asp Leu Gly Leu Gly
115 120 125
Thr Asn Leu Ser Ser Asp Ser Ala Ser Met Gln
130 135
<210> 25
<211> 378
<212> DNA
<213> Xanthomonas oryzae pv. oryzicola
<400> 25
atgaattctt tgaacacaca attcggcggc agcgcgtcca acttccaggt tgaccaaagc 60
cagaacgcgc aatccgattc gagccagggc agcaatggca gccagggtat ctcggaaaag 120
caactggacc agttgctgtg ccagctcatc caggccctgc ttcagccgaa caaaaatgct 180
gaggaaggta agggtcagca gggtggcgag aataatcagc aggccgggaa ggagaatggc 240
gcctcgccac tcacccagat gctgatgaat atcgtcggag agattctcca ggcgcagaat 300
gccggcggca gcagcggcgg cgactttggt ggcagtttcg ccagcagctt ctcgaacgac 360
agcggatcga tgcagtaa 378
<210> 26
<211> 125
<212> PRT
<213> Xanthomonas oryzae pv. oryzicola
<400> 26
Met Asn Ser Leu Asn Thr Gln Phe Gly Gly Ser Ala Ser Asn Phe Gln
1 5 10 15
Val Asp Gln Ser Gln Asn Ala Gln Ser Asp Ser Ser Gln Gly Ser Asn
20 25 30
Gly Ser Gln Gly Ile Ser Glu Lys Gln Leu Asp Gln Leu Leu Cys Gln
35 40 45
Leu Ile Gln Ala Leu Leu Gln Pro Asn Lys Asn Ala Glu Glu Gly Lys
50 55 60
Gly Gln Gln Gly Gly Glu Asn Asn Gln Gln Ala Gly Lys Glu Asn Gly
65 70 75 80
Ala Ser Pro Leu Thr Gln Met Leu Met Asn Ile Val Gly Glu Ile Leu
85 90 95
Gln Ala Gln Asn Ala Gly Gly Ser Ser Gly Gly Asp Phe Gly Gly Ser
100 105 110
Phe Ala Ser Ser Phe Ser Asn Asp Ser Gly Ser Met Gln
115 120 125
<210> 27
<211> 366
<212> DNA
<213> Xanthomonas campestris pv. campestris
<400> 27
tcaggcttgg ccggtgatgc tcgacaggtt ggcattgaag ccgccaccca agctggtgcc 60
gcccatgccg gcgccgcctt ggttctgcat cagctgcatc acgatctgca tcagcatctg 120
cgtcaacgga ctcacaccgt cctgttgacc gctctgcggt tgttcgtctc cgcactcctg 180
atcggcatcg ctgccctggc tctgttggag catcatcatg atgaacatgg cgagcagctg 240
atccagctgc tgctcggagt cagccgaagg cgagcgctga ctggagttct gggtttgctg 300
gggcccgatg cccatcgtct gcaggttgat gaagttggaa aatttgtttc cgatagatga 360
gtccat 366
<210> 28
<211> 121
<212> PRT
<213> Xanthomonas campestris pv. campestris
<400> 28
Met Asp Ser Ser Ile Gly Asn Lys Phe Ser Asn Phe Ile Asn Leu Gln
1 5 10 15
Thr Met Gly Ile Gly Pro Gln Gln Thr Gln Asn Ser Ser Gln Arg Ser
20 25 30
Pro Ser Ala Asp Ser Glu Gln Gln Leu Asp Gln Leu Leu Ala Met Phe
35 40 45
Ile Met Met Met Leu Gln Gln Ser Gln Gly Ser Asp Ala Asp Gln Glu
50 55 60
Cys Gly Asp Glu Gln Pro Gln Ser Gly Gln Gln Asp Gly Val Ser Pro
65 70 75 80
Leu Thr Gln Met Leu Met Gln Ile Val Met Gln Leu Met Gln Asn Gln
85 90 95
Gly Gly Ala Gly Met Gly Gly Thr Ser Leu Gly Gly Gly Phe Asn Ala
100 105 110
Asn Leu Ser Ser Ile Thr Gly Gln Ala
115 120
<210> 29
<211> 3282
<212> DNA
<213> Synechocystis sp.
<400> 29
tgttcgttgc acaaattgat gagcaatgct tttttataat gccaactttg tacaaaaaag 60
caggcttaaa caatggcgac tatccacggt aattggcaac cctcccacgg ggaaaacggc 120
ggcaaactgt ttctttgggc ggatacctgg ggtcatcctt tgccagaaac cattggcgat 180
cgccatccct ttgcgttgga tctgccggat ttgctacagg cctggtcgaa tttgcccctg 240
gccttcccca aggcggatgg ggtgacagag gcagccctta ctctgcattt acccagccat 300
cgccagcaaa aaattcccct accctttgtc acagggcaag atccggtggc catggatgcg 360
aaatatctcc actggcgatc gtggcaggta accggggtaa atctgacccc aagccaaacg 420
ttaacgttgc tccaatctat tcccctgggg ggccaagcct tagctaactt aggatcagag 480
ttttactttt acggtcaact gcaccgctgg tgtttagatt tggtgctacg gggtaaattt 540
gtgccgggac tggagcaaag gggggaagac ggtaattact atgcccaatg gattcctatc 600
ctcgatagca tccaagacca aacccattta gcccaattta gccagagagt acctgcctgc 660
gccctggcca acctgactga ctcccaggag ccccaaatgt tggtggtgga tttactacaa 720
aaattattgc aagcccaaat tggtgccgtc agtcccagcc tagccaacgt taaagaagtc 780
tggttgaatg attggctccg gggattaacc catggggggc aaacctccct cggcacaagc 840
aaagctctac aacgattagc cacatcctta gaccattggt atttaccagt ccagaattat 900
ttgggccaaa aaaataacca agctttagcc caacggcaat ggcggggggc tctgcggtta 960
caacctccag cggacgatgg ggggggaacc tggcaactgg attatggttt acaagccctg 1020
gatgacgggg aattttggct cccggcggct tccctctggg ccatggccgg cgatcgcctg 1080
gtgtggcagg gaaggagggt tgaccagggg gcggaaagtt tactgcgggg cttaggggta 1140
gctgcccaaa tttacgaacc cattgctgca agtttgacgg aaaggtgtcc cacgggctgt 1200
gggctagatg ccatccaagc ctacgaattt atcctggcaa tcgcccatca attgcgggat 1260
cgggggttag gggtaatcct cccgccgggg ttagaacggg gcggcaccgc caaacggtta 1320
ggggtaaaag tggtggggga agtgcaacgg caaaggggcc agcggctaac tctgcaaagt 1380
ttaattaatt acgacttgca actaatgatg gggagcgggg acaatgcccg gttattgacg 1440
gccaaggact ttgaagcgtt actagcccaa aaatctcccc tggtggtgct ggacggagaa 1500
tggattaccc tgcaaccggc ggacgtgcgg gcggccaagg tcattttaca gcagcaacaa 1560
tctgccccgc ccctcacagt ggaggatgct ctgcgcctca gcattggtga tttacaaacc 1620
gtctctaaac tgccggtgac ccagtttgct gctcggggca tattacagga attgatcgac 1680
accctccgta acccggaagg agtgaaagcc attgctgacc caccgggctt tcagggtact 1740
ttacggccct accaagctcg gggagtgggc tggttagctt ttctggaacg gtgggggctg 1800
ggggcctgtt tggcagacga tatgggtttg ggaaaaacac cccagttgct ggcttttctg 1860
ctccatttag ccgcggagga tatgttagtt aagccggtgt tgattgtttg tcctacgtcg 1920
gtgctgagca attggggtca tgaaattaat aagtttgcgc cccaacttaa aaccctattg 1980
caccatggcg atcgccggaa aaaagggcaa ccgttggtta aacaggtcaa agaccagcaa 2040
attgtcctca ccagttacgc tttactgcaa cgggatttta gtagtttgaa attggtggac 2100
tggcagggga tcgtgctgga cgaagcccaa aatatcaaaa atccccaagc taaacagtcc 2160
caggcggccc ggcaattgcc agcgggtttt cgcattgccc tcacggggac tccggtggaa 2220
aatcgcctga cggaattgtg gtcaatttta gaatttttaa atcccggttt cctgggtaat 2280
cagagctttt tccaacggcg ctttgccaat cccatcgaaa aatttggcga tcgccagtcg 2340
ttgttaattt tgcggaattt agtgcggccg tttattttgc ggcggttaaa aaccgaccaa 2400
accattattc aagatttacc agaaaaacaa gaaatgaccg tcttctgtga cctttcccaa 2460
gagcaagctg gtttatatca acaattggtg gaggaatccc tccaggcgat cgccgacagc 2520
gaaggcattc aaaggcacgg tttagtttta accctattaa ccaaactcaa acaggtttgt 2580
aaccatcccg atctattgct gaaaaagccc gccatcaccc acgggcacca gtccggcaag 2640
ctaattcgtc tggcggaaat gctggaagaa atcatcagcg aaggcgatcg ggtgttaatt 2700
ttcacccaat ttgccagttg gggtcattta ctcaaaccct atctggaaaa atactttaac 2760
caagaggtgc tctatctcca cgggggcact ccagcagagc aacggcaagc tctggtggaa 2820
cgattccaac aggaccccaa cagtccctat ttatttatcc tttctctcaa ggctggcggc 2880
acagggttga acctcacgag ggctaaccat gtgttccatg tggaccggtg gtggaatccg 2940
gcggtggaaa atcaggctac cgatcgtgct tttcgcattg gccaaactcg caacgtccag 3000
gtgcacaaat ttgtctgtac aggcaccttg gaagaaaaaa ttaacgccat gatggcggat 3060
aaacaacaat tggcagaaca aaccgtggat gccggggaaa attggctcac ccgcctagac 3120
accgataaac tccgtcagtt gcttaccctc tccgccaccc cggtggatta ccaagccgaa 3180
gcgtccgatt gaacccagct ttcttgtaca aagttggcat gataagaaag cattgcttat 3240
caatttgttg caacgaacag gtcactatca gtcaaaataa at 3282
<210> 30
<211> 1039
<212> PRT
<213> Synechocystis sp.
<400> 30
Met Ala Thr Ile His Gly Asn Trp Gln Pro Ser His Gly Glu Asn Gly
1 5 10 15
Gly Lys Leu Phe Leu Trp Ala Asp Thr Trp Gly His Pro Leu Pro Glu
20 25 30
Thr Ile Gly Asp Arg His Pro Phe Ala Leu Asp Leu Pro Asp Leu Leu
35 40 45
Gln Ala Trp Ser Asn Leu Pro Leu Ala Phe Pro Lys Ala Asp Gly Val
50 55 60
Thr Glu Ala Ala Leu Thr Leu His Leu Pro Ser His Arg Gln Gln Lys
65 70 75 80
Ile Pro Leu Pro Phe Val Thr Gly Gln Asp Pro Val Ala Met Asp Ala
85 90 95
Lys Tyr Leu His Trp Arg Ser Trp Gln Val Thr Gly Val Asn Leu Thr
100 105 110
Pro Ser Gln Thr Leu Thr Leu Leu Gln Ser Ile Pro Leu Gly Gly Gln
115 120 125
Ala Leu Ala Asn Leu Gly Ser Glu Phe Tyr Phe Tyr Gly Gln Leu His
130 135 140
Arg Trp Cys Leu Asp Leu Val Leu Arg Gly Lys Phe Val Pro Gly Leu
145 150 155 160
Glu Gln Arg Gly Glu Asp Gly Asn Tyr Tyr Ala Gln Trp Ile Pro Ile
165 170 175
Leu Asp Ser Ile Gln Asp Gln Thr His Leu Ala Gln Phe Ser Gln Arg
180 185 190
Val Pro Ala Cys Ala Leu Ala Asn Leu Thr Asp Ser Gln Glu Pro Gln
195 200 205
Met Leu Val Val Asp Leu Leu Gln Lys Leu Leu Gln Ala Gln Ile Gly
210 215 220
Ala Val Ser Pro Ser Leu Ala Asn Val Lys Glu Val Trp Leu Asn Asp
225 230 235 240
Trp Leu Arg Gly Leu Thr His Gly Gly Gln Thr Ser Leu Gly Thr Ser
245 250 255
Lys Ala Leu Gln Arg Leu Ala Thr Ser Leu Asp His Trp Tyr Leu Pro
260 265 270
Val Gln Asn Tyr Leu Gly Gln Lys Asn Asn Gln Ala Leu Ala Gln Arg
275 280 285
Gln Trp Arg Gly Ala Leu Arg Leu Gln Pro Pro Ala Asp Asp Gly Gly
290 295 300
Gly Thr Trp Gln Leu Asp Tyr Gly Leu Gln Ala Leu Asp Asp Gly Glu
305 310 315 320
Phe Trp Leu Pro Ala Ala Ser Leu Trp Ala Met Ala Gly Asp Arg Leu
325 330 335
Val Trp Gln Gly Arg Arg Val Asp Gln Gly Ala Glu Ser Leu Leu Arg
340 345 350
Gly Leu Gly Val Ala Ala Gln Ile Tyr Glu Pro Ile Ala Ala Ser Leu
355 360 365
Thr Glu Arg Cys Pro Thr Gly Cys Gly Leu Asp Ala Ile Gln Ala Tyr
370 375 380
Glu Phe Ile Leu Ala Ile Ala His Gln Leu Arg Asp Arg Gly Leu Gly
385 390 395 400
Val Ile Leu Pro Pro Gly Leu Glu Arg Gly Gly Thr Ala Lys Arg Leu
405 410 415
Gly Val Lys Val Val Gly Glu Val Gln Arg Gln Arg Gly Gln Arg Leu
420 425 430
Thr Leu Gln Ser Leu Ile Asn Tyr Asp Leu Gln Leu Met Met Gly Ser
435 440 445
Gly Asp Asn Ala Arg Leu Leu Thr Ala Lys Asp Phe Glu Ala Leu Leu
450 455 460
Ala Gln Lys Ser Pro Leu Val Val Leu Asp Gly Glu Trp Ile Thr Leu
465 470 475 480
Gln Pro Ala Asp Val Arg Ala Ala Lys Val Ile Leu Gln Gln Gln Gln
485 490 495
Ser Ala Pro Pro Leu Thr Val Glu Asp Ala Leu Arg Leu Ser Ile Gly
500 505 510
Asp Leu Gln Thr Val Ser Lys Leu Pro Val Thr Gln Phe Ala Ala Arg
515 520 525
Gly Ile Leu Gln Glu Leu Ile Asp Thr Leu Arg Asn Pro Glu Gly Val
530 535 540
Lys Ala Ile Ala Asp Pro Pro Gly Phe Gln Gly Thr Leu Arg Pro Tyr
545 550 555 560
Gln Ala Arg Gly Val Gly Trp Leu Ala Phe Leu Glu Arg Trp Gly Leu
565 570 575
Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Pro Gln Leu
580 585 590
Leu Ala Phe Leu Leu His Leu Ala Ala Glu Asp Met Leu Val Lys Pro
595 600 605
Val Leu Ile Val Cys Pro Thr Ser Val Leu Ser Asn Trp Gly His Glu
610 615 620
Ile Asn Lys Phe Ala Pro Gln Leu Lys Thr Leu Leu His His Gly Asp
625 630 635 640
Arg Arg Lys Lys Gly Gln Pro Leu Val Lys Gln Val Lys Asp Gln Gln
645 650 655
Ile Val Leu Thr Ser Tyr Ala Leu Leu Gln Arg Asp Phe Ser Ser Leu
660 665 670
Lys Leu Val Asp Trp Gln Gly Ile Val Leu Asp Glu Ala Gln Asn Ile
675 680 685
Lys Asn Pro Gln Ala Lys Gln Ser Gln Ala Ala Arg Gln Leu Pro Ala
690 695 700
Gly Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Thr
705 710 715 720
Glu Leu Trp Ser Ile Leu Glu Phe Leu Asn Pro Gly Phe Leu Gly Asn
725 730 735
Gln Ser Phe Phe Gln Arg Arg Phe Ala Asn Pro Ile Glu Lys Phe Gly
740 745 750
Asp Arg Gln Ser Leu Leu Ile Leu Arg Asn Leu Val Arg Pro Phe Ile
755 760 765
Leu Arg Arg Leu Lys Thr Asp Gln Thr Ile Ile Gln Asp Leu Pro Glu
770 775 780
Lys Gln Glu Met Thr Val Phe Cys Asp Leu Ser Gln Glu Gln Ala Gly
785 790 795 800
Leu Tyr Gln Gln Leu Val Glu Glu Ser Leu Gln Ala Ile Ala Asp Ser
805 810 815
Glu Gly Ile Gln Arg His Gly Leu Val Leu Thr Leu Leu Thr Lys Leu
820 825 830
Lys Gln Val Cys Asn His Pro Asp Leu Leu Leu Lys Lys Pro Ala Ile
835 840 845
Thr His Gly His Gln Ser Gly Lys Leu Ile Arg Leu Ala Glu Met Leu
850 855 860
Glu Glu Ile Ile Ser Glu Gly Asp Arg Val Leu Ile Phe Thr Gln Phe
865 870 875 880
Ala Ser Trp Gly His Leu Leu Lys Pro Tyr Leu Glu Lys Tyr Phe Asn
885 890 895
Gln Glu Val Leu Tyr Leu His Gly Gly Thr Pro Ala Glu Gln Arg Gln
900 905 910
Ala Leu Val Glu Arg Phe Gln Gln Asp Pro Asn Ser Pro Tyr Leu Phe
915 920 925
Ile Leu Ser Leu Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Arg Ala
930 935 940
Asn His Val Phe His Val Asp Arg Trp Trp Asn Pro Ala Val Glu Asn
945 950 955 960
Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly Gln Thr Arg Asn Val Gln
965 970 975
Val His Lys Phe Val Cys Thr Gly Thr Leu Glu Glu Lys Ile Asn Ala
980 985 990
Met Met Ala Asp Lys Gln Gln Leu Ala Glu Gln Thr Val Asp Ala Gly
995 1000 1005
Glu Asn Trp Leu Thr Arg Leu Asp Thr Asp Lys Leu Arg Gln Leu
1010 1015 1020
Leu Thr Leu Ser Ala Thr Pro Val Asp Tyr Gln Ala Glu Ala Ser
1025 1030 1035
Asp
<210> 31
<211> 3237
<212> DNA
<213> Anaebena variabilis
<400> 31
atggcaattt tacacggtag ttggatatta agtgagcagg atagttattt atttatttgg 60
ggggaaactt ggcgatcgcc acaagtaaat tttagttttg aggaaatagc cctcaatccc 120
ttggctctgt ctgcatctga attaagcgag tggttgcagt ctcaacatca ggcgatcgct 180
cagattttac cacaacagtt ggcaaaaaaa acctccaaag cagcaagttc cccaacaaca 240
aatttaccaa ttcactcgca aataattgtt ctgccaacgg aaatttctca acctcgtaag 300
aaagaaacaa ttttcatttc tcctgtgcat tctgccgctt tagaatctga tgcagactct 360
gaagtttatt tacaaccttg gcgtgtagaa ggtttttgtc ttcctcctag tgcagcagtt 420
aaatttctaa cttctttacc tttaaatatc actagcacag agaatgcttt tttaggtgga 480
gatttacgtt tttggtcaca aattgcccgt tggagtttag atttaatttc taggtctaag 540
tttctcccaa ttatccaacg acaacctaat aattctgtaa gtgccaaatg gcaagtactg 600
ttagatagtg ctgtagatgg aactcgttta gaaaagttcg ccgcgaagat gcctttggtt 660
tgtcggactt atcagagatt agggaacgag gaattatctc catctcctat atatatagat 720
tttcctagtc agccgcagga attaatattg ggttttctca atagtgcaat agatacgcaa 780
ttacgggaaa tggtggggaa tcagcctgtg gtggaaactc gcttgatggc atctttaccg 840
tcggcggtac gacagtggct gcaagggtta agtggtgcat ctaattcagt tgatgcagat 900
gcagttggtt tggaaaggct ggaagcagcg ctcaaggctt ggacgatgcc gctacaatat 960
caactagcaa gtaaaaatca atttcgcacc tgttttgaat tacgttctcc agaaccagga 1020
gaaactgaat ggacactagc ctatttcctg caagcagccg ataatccaga atttctagta 1080
gatgcgggca ctatttggca acatcctgtt gaacagctaa tttatcaaca gcgatcgatt 1140
caagaacccc aggaaacatt tttacgaggt ttggggttag cttctcgatt gtatccggtc 1200
attgccccca ctttagatac agaatcaccg caattttgtc atctcaaccc catgcaggct 1260
tatgaattta tcaaggctgt ggcttggcga tttgaagata gcggtttagg ggtgatttta 1320
cctcctagtt tggcgaaccg ggaaggctgg gcaaaccgct tgggattgaa aatctccgcc 1380
gaaaccccaa agaaaaagcc aggacgcttg ggattgcaga gtttgcttaa ttttcaatgg 1440
cacttagcaa ttggtgggca aactatttct aaaggggaat ttgacagact agtagcttta 1500
aaaagcccat tggtagaaat aaatggcgaa tgggtggagt tgcgtcccca agatatcaag 1560
acagccgaag ccttttttgc tgcacgtaaa gaccaaatgg ccttatcttt agaagatgct 1620
ttacgtctga gtagtgggga tactcaagta attgagaaat taccagtagt cagctttgaa 1680
gcctctggcg cattacaaga attaattggg gcgctgacaa ataatcaagc agttgcacca 1740
ttacctacgc caaagaactt ccaaggaaag ttgcgtcctt atcaagaaag gggtgcggct 1800
tggttggcat tcctcgaacg ctggggttta ggtgcttgtc tcgccgacga catgggactg 1860
ggaaaaacga tacagttcat tgctttcctt ctccatctta aagaacagga tgtattagaa 1920
aaaccaactt tactagtgtg tcctacttct gttttaggta actgggaacg agaagtgaaa 1980
aaatttgcac ctacacttaa agttctccaa tatcatggtg ataaacgtcc taaaggtaaa 2040
gcttttccag aagcagtaaa aaatcatgat ttagttatca ccagttactc actaattcat 2100
agagacatca aatcattgca gggtctttct tggcagataa ttgttttaga tgaagcccag 2160
aatgtgaaga atgcggaagc caaacaatca caagcagtcc gacaattaga cacaaccttt 2220
cgcattgctt taacggggac accagtcgaa aatagactac aggaactttg gtcaatttta 2280
gatttcctca accctggtta tttaggtaat aagcaattct tccaaagacg ctttgccatg 2340
ccaattgaaa agtatggtga tgcagcatct ttaaatcaat tgcgtgcctt agtacaacca 2400
tttattctgc gtcgcctgaa aacagaccgt gatattattc aagacttgcc agataagcaa 2460
gaaatgacag tattttgcgg tttgactgga gaacaagctg cactttatca aaaagtggta 2520
gaaacatctt tagcagaaat tgaatcggcc gaaggattgc aacgccgagg gatgatttta 2580
gctttattaa ttaaactcaa acaaatctgc aatcatccag cccaatatct gaaaacaaat 2640
accttagaac aatacagttc aggaaaactg caacgattag aagaaatgtt agaagaggtg 2700
ttagcggaga gtaatactta tggtgttgct ggtgcgggac gtgctttaat cttcacccag 2760
tttgcagaat ggggtaagtt actcaaacca catttagaaa aacaactagg gcgggaagta 2820
tttttcttat atggtagtac cagtaaaaag caacgtgaag aaatgattga ccgttttcaa 2880
cacgaccctc aggggccacc aattatgatt ctctctctca aagcaggtgg tgtagggttg 2940
aacttaacca gagcaaatca tgtatttcac tttgatagat ggtggaatcc agccgtagag 3000
aaccaagcca cagaccgcgt atttcgtatt ggtcaaaccc gcaatgtaca ggtgcataaa 3060
tttgtttgca atggtacctt agaagaaaaa atccacgaca tgattgaaag taaaaaacaa 3120
ctagcggaac aggttgttgg tgcaggcgaa gagtggttaa ctgaattaga tacagatcaa 3180
ctccgcaact tactgatact tgatcgtagt gcagtaattg atgaagaagc agagtaa 3237
<210> 32
<211> 1078
<212> PRT
<213> Anaebena variabilis
<400> 32
Met Ala Ile Leu His Gly Ser Trp Ile Leu Ser Glu Gln Asp Ser Tyr
1 5 10 15
Leu Phe Ile Trp Gly Glu Thr Trp Arg Ser Pro Gln Val Asn Phe Ser
20 25 30
Phe Glu Glu Ile Ala Leu Asn Pro Leu Ala Leu Ser Ala Ser Glu Leu
35 40 45
Ser Glu Trp Leu Gln Ser Gln His Gln Ala Ile Ala Gln Ile Leu Pro
50 55 60
Gln Gln Leu Ala Lys Lys Thr Ser Lys Ala Ala Ser Ser Pro Thr Thr
65 70 75 80
Asn Leu Pro Ile His Ser Gln Ile Ile Val Leu Pro Thr Glu Ile Ser
85 90 95
Gln Pro Arg Lys Lys Glu Thr Ile Phe Ile Ser Pro Val His Ser Ala
100 105 110
Ala Leu Glu Ser Asp Ala Asp Ser Glu Val Tyr Leu Gln Pro Trp Arg
115 120 125
Val Glu Gly Phe Cys Leu Pro Pro Ser Ala Ala Val Lys Phe Leu Thr
130 135 140
Ser Leu Pro Leu Asn Ile Thr Ser Thr Glu Asn Ala Phe Leu Gly Gly
145 150 155 160
Asp Leu Arg Phe Trp Ser Gln Ile Ala Arg Trp Ser Leu Asp Leu Ile
165 170 175
Ser Arg Ser Lys Phe Leu Pro Ile Ile Gln Arg Gln Pro Asn Asn Ser
180 185 190
Val Ser Ala Lys Trp Gln Val Leu Leu Asp Ser Ala Val Asp Gly Thr
195 200 205
Arg Leu Glu Lys Phe Ala Ala Lys Met Pro Leu Val Cys Arg Thr Tyr
210 215 220
Gln Arg Leu Gly Asn Glu Glu Leu Ser Pro Ser Pro Ile Tyr Ile Asp
225 230 235 240
Phe Pro Ser Gln Pro Gln Glu Leu Ile Leu Gly Phe Leu Asn Ser Ala
245 250 255
Ile Asp Thr Gln Leu Arg Glu Met Val Gly Asn Gln Pro Val Val Glu
260 265 270
Thr Arg Leu Met Ala Ser Leu Pro Ser Ala Val Arg Gln Trp Leu Gln
275 280 285
Gly Leu Ser Gly Ala Ser Asn Ser Val Asp Ala Asp Ala Val Gly Leu
290 295 300
Glu Arg Leu Glu Ala Ala Leu Lys Ala Trp Thr Met Pro Leu Gln Tyr
305 310 315 320
Gln Leu Ala Ser Lys Asn Gln Phe Arg Thr Cys Phe Glu Leu Arg Ser
325 330 335
Pro Glu Pro Gly Glu Thr Glu Trp Thr Leu Ala Tyr Phe Leu Gln Ala
340 345 350
Ala Asp Asn Pro Glu Phe Leu Val Asp Ala Gly Thr Ile Trp Gln His
355 360 365
Pro Val Glu Gln Leu Ile Tyr Gln Gln Arg Ser Ile Gln Glu Pro Gln
370 375 380
Glu Thr Phe Leu Arg Gly Leu Gly Leu Ala Ser Arg Leu Tyr Pro Val
385 390 395 400
Ile Ala Pro Thr Leu Asp Thr Glu Ser Pro Gln Phe Cys His Leu Asn
405 410 415
Pro Met Gln Ala Tyr Glu Phe Ile Lys Ala Val Ala Trp Arg Phe Glu
420 425 430
Asp Ser Gly Leu Gly Val Ile Leu Pro Pro Ser Leu Ala Asn Arg Glu
435 440 445
Gly Trp Ala Asn Arg Leu Gly Leu Lys Ile Ser Ala Glu Thr Pro Lys
450 455 460
Lys Lys Pro Gly Arg Leu Gly Leu Gln Ser Leu Leu Asn Phe Gln Trp
465 470 475 480
His Leu Ala Ile Gly Gly Gln Thr Ile Ser Lys Gly Glu Phe Asp Arg
485 490 495
Leu Val Ala Leu Lys Ser Pro Leu Val Glu Ile Asn Gly Glu Trp Val
500 505 510
Glu Leu Arg Pro Gln Asp Ile Lys Thr Ala Glu Ala Phe Phe Ala Ala
515 520 525
Arg Lys Asp Gln Met Ala Leu Ser Leu Glu Asp Ala Leu Arg Leu Ser
530 535 540
Ser Gly Asp Thr Gln Val Ile Glu Lys Leu Pro Val Val Ser Phe Glu
545 550 555 560
Ala Ser Gly Ala Leu Gln Glu Leu Ile Gly Ala Leu Thr Asn Asn Gln
565 570 575
Ala Val Ala Pro Leu Pro Thr Pro Lys Asn Phe Gln Gly Lys Leu Arg
580 585 590
Pro Tyr Gln Glu Arg Gly Ala Ala Trp Leu Ala Phe Leu Glu Arg Trp
595 600 605
Gly Leu Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile
610 615 620
Gln Phe Ile Ala Phe Leu Leu His Leu Lys Glu Gln Asp Val Leu Glu
625 630 635 640
Lys Pro Thr Leu Leu Val Cys Pro Thr Ser Val Leu Gly Asn Trp Glu
645 650 655
Arg Glu Val Lys Lys Phe Ala Pro Thr Leu Lys Val Leu Gln Tyr His
660 665 670
Gly Asp Lys Arg Pro Lys Gly Lys Ala Phe Pro Glu Ala Val Lys Asn
675 680 685
His Asp Leu Val Ile Thr Ser Tyr Ser Leu Ile His Arg Asp Ile Lys
690 695 700
Ser Leu Gln Gly Leu Ser Trp Gln Ile Ile Val Leu Asp Glu Ala Gln
705 710 715 720
Asn Val Lys Asn Ala Glu Ala Lys Gln Ser Gln Ala Val Arg Gln Leu
725 730 735
Asp Thr Thr Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg
740 745 750
Leu Gln Glu Leu Trp Ser Ile Leu Asp Phe Leu Asn Pro Gly Tyr Leu
755 760 765
Gly Asn Lys Gln Phe Phe Gln Arg Arg Phe Ala Met Pro Ile Glu Lys
770 775 780
Tyr Gly Asp Ala Ala Ser Leu Asn Gln Leu Arg Ala Leu Val Gln Pro
785 790 795 800
Phe Ile Leu Arg Arg Leu Lys Thr Asp Arg Asp Ile Ile Gln Asp Leu
805 810 815
Pro Asp Lys Gln Glu Met Thr Val Phe Cys Gly Leu Thr Gly Glu Gln
820 825 830
Ala Ala Leu Tyr Gln Lys Val Val Glu Thr Ser Leu Ala Glu Ile Glu
835 840 845
Ser Ala Glu Gly Leu Gln Arg Arg Gly Met Ile Leu Ala Leu Leu Ile
850 855 860
Lys Leu Lys Gln Ile Cys Asn His Pro Ala Gln Tyr Leu Lys Thr Asn
865 870 875 880
Thr Leu Glu Gln Tyr Ser Ser Gly Lys Leu Gln Arg Leu Glu Glu Met
885 890 895
Leu Glu Glu Val Leu Ala Glu Ser Asn Thr Tyr Gly Val Ala Gly Ala
900 905 910
Gly Arg Ala Leu Ile Phe Thr Gln Phe Ala Glu Trp Gly Lys Leu Leu
915 920 925
Lys Pro His Leu Glu Lys Gln Leu Gly Arg Glu Val Phe Phe Leu Tyr
930 935 940
Gly Ser Thr Ser Lys Lys Gln Arg Glu Glu Met Ile Asp Arg Phe Gln
945 950 955 960
His Asp Pro Gln Gly Pro Pro Ile Met Ile Leu Ser Leu Lys Ala Gly
965 970 975
Gly Val Gly Leu Asn Leu Thr Arg Ala Asn His Val Phe His Phe Asp
980 985 990
Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Val Phe
995 1000 1005
Arg Ile Gly Gln Thr Arg Asn Val Gln Val His Lys Phe Val Cys
1010 1015 1020
Asn Gly Thr Leu Glu Glu Lys Ile His Asp Met Ile Glu Ser Lys
1025 1030 1035
Lys Gln Leu Ala Glu Gln Val Val Gly Ala Gly Glu Glu Trp Leu
1040 1045 1050
Thr Glu Leu Asp Thr Asp Gln Leu Arg Asn Leu Leu Ile Leu Asp
1055 1060 1065
Arg Ser Ala Val Ile Asp Glu Glu Ala Glu
1070 1075
<210> 33
<211> 3129
<212> DNA
<213> uncultured methanogenic archaeon
<400> 33
atgattacac ttcacggaac ctggactact gtcgatcccc tgaatggcac atttttcctc 60
tggggagaga gtgatccggc cacgcagcat aaaagaagag gcaggcctcg gaaaagtgca 120
ggggagaaac agcacccgtt tcacgccggc atcaaagagc tggaagctgg agcgggggct 180
atcaattcat cgtgtataag acatatagca gatgcgggag cacgggcgga gcaggtttta 240
attttgccgt cagctacgga caggcccctg agatctgcga gcccttcagc actggagtca 300
ggtgaagaaa ccaaccctga cagcagttta caatttcttc cgtggacggt gaccggcatc 360
aacattaagc ccgggaatgc tctggtactt ctatcctcta tagccgaatc acaaaagcgg 420
atcggagata tggcgatagg cccagacctg ctttactgga gtaaggtagc caagtttacg 480
cttaagctcc tgataagcca gcagttcagg ccggaggttg tcgaagtaat gagcggaaaa 540
gcatatagcc gttggagatt tgcgctcacc gatgaaactg accggaaaca ctatgcctcg 600
ctcgaaaact ccatgccgct ggcatgtatt gcggtttcag gaaaggctgg catttataat 660
cgaaaagaag ccttagattt gttcattaat accgcccttg acacatttat ccgggaccag 720
attgccctgc ccgctgacag caggatgacg aacctgctat cgcaagcatg gctagattcg 780
ctcggcaccg gagagagtat ccgcctgtcg gctcctgaga tgaagaaact caaagattcg 840
gcaggccgct ggacatcccg catgaaaaca gagagcaaac aagctttaaa gacctgcttc 900
atcctggagc cgccagcccc ggatacagag tatcctgaag cgccgtggaa cctacggtac 960
tgcttgcagg catccgatga ccccagtctg gtaattccgg ctgagactgt gtggaaagag 1020
ttgaagaaga cgctgaagta cctgaataag agatacgata accctcagga gcaattgtta 1080
caggatctcg gaaaagcgat gcagatgttt cccgaaatcg agcccagcct caacacgtca 1140
aaacctctgt ccgcaacgct gagcaccagt gaagcctaca agttcctgac agaagcggcg 1200
cctctgctgc aggacagcgg gtatagcatt atcctaccgg aatggtggcg caacagcact 1260
ggcaggctca agctcggcgc caggcttcgc ttcaagccga aagccgaagg taaagcgggt 1320
aaaagccagt tcaccatgga taccctcgtc agctacgact ggcgcctggc gctgggcgat 1380
caggagatca ccgaaacaga gttcaggaag ctggcagccc tgaaagagcc gcttctgcag 1440
ataggcggga aatggtttgc gctgaaaaag gaagacatag acagcatcat gaaagcattc 1500
agggcgaaga agactggaga gatggcttta tcggaggcac tgcgcctcaa cggcgggctg 1560
gaagacttca acggcatccc cgtcagcggc atgaaatcgt caggatggct ggcagaactt 1620
ttcgacaggc tggcagccgg cgaaaaaata acgagccttg ccccgccgga cggtttcaac 1680
ggggagctta gagattacca ggttaaaggc tactcctggc tggccttcat gaaaaagtat 1740
ggcctgggct ccattctggc tgacgacatg ggcctgggta agacgataca gctgctggcg 1800
ttgctcctga aagagaagga aagaggcact aaaggcccta ctctgttgat ctgccccacc 1860
tcgattctcg gaaactggca gcgggaggcg aagaaatttg ccccggccct gaaagtccac 1920
atacaccatg gggcaggaag ggctgataaa gagcagttcg gaaaaatcgt caaggctcac 1980
gacctgatcc tgagcactta cgctcacgcc taccgggacg aggaactgct taaagaggtg 2040
aactggaagc tggtagtgct cgacgaggct cagaatatca agaatcatca tacccggcag 2100
gccagagcta tccgggctct taaggccgat caccgaatag ccatgacggg aacgccgata 2160
gagaacagac tctcggagct gtggtcgatc gtggacttcc tgaaccccgg ctacctgggc 2220
aaggcggaga cattcaggaa acaattcgcc atacctatcg agagatacga tgacgctgcc 2280
cggtcggaaa aattgaagca ggccatcaag cccctggtgc tgcgcagagt gaagacggat 2340
ccggccatca tcaaagacct gccggacaag atcgagatca aggagccctg caacctcacc 2400
aaagaacagg ccacgctcta cgaggccatc gtagagaaca tgctgaaaag tatagataag 2460
gccacggcaa tgcagagacg gggaatcgtc ttagcgtccc tgatgaagct caaacaggtc 2520
tgcgatcacc cgtcgctgta catcaaaacg ggcgctgtga ccgacgataa gacgctgatc 2580
aggtctggca agctgaagcg cctcacggag ctgctcgaag aagcgctggc cgaaggcgac 2640
agcgtgctga tcttcaccca gttcgtggaa atgggggaga tgctgaaagc ctacctgcag 2700
agcacgttcg acgaagaagc cctctttttg cacggcggag taccgcagaa ggccagagac 2760
aagatggtcc tccgtttcgg ggaaaaggac gggccacgga tctttatcgt ctcgctgaaa 2820
gccggcggcg tcggcctcaa cctgacgaag gcaagccacg tgttccactt cgatcgctgg 2880
tggaacccgg cggtcgagaa ccaggcgaca gatcgagctt acaggatagg ccagagcaaa 2940
aatgtactgg tccataaatt cgtctgcgcc ggcacgctgg aagaaaagat cgacgagctg 3000
atcgagagca aaaaggcgct gtcggcgaac atcctcggca cgggagaaga ctggatcacg 3060
gagttgtcga ccgaacagct gagggacatg gtcatgctga gatgggacga ggtagccgat 3120
gatggctaa 3129
<210> 34
<211> 1042
<212> PRT
<213> uncultured methanogenic archaeon
<400> 34
Met Ile Thr Leu His Gly Thr Trp Thr Thr Val Asp Pro Leu Asn Gly
1 5 10 15
Thr Phe Phe Leu Trp Gly Glu Ser Asp Pro Ala Thr Gln His Lys Arg
20 25 30
Arg Gly Arg Pro Arg Lys Ser Ala Gly Glu Lys Gln His Pro Phe His
35 40 45
Ala Gly Ile Lys Glu Leu Glu Ala Gly Ala Gly Ala Ile Asn Ser Ser
50 55 60
Cys Ile Arg His Ile Ala Asp Ala Gly Ala Arg Ala Glu Gln Val Leu
65 70 75 80
Ile Leu Pro Ser Ala Thr Asp Arg Pro Leu Arg Ser Ala Ser Pro Ser
85 90 95
Ala Leu Glu Ser Gly Glu Glu Thr Asn Pro Asp Ser Ser Leu Gln Phe
100 105 110
Leu Pro Trp Thr Val Thr Gly Ile Asn Ile Lys Pro Gly Asn Ala Leu
115 120 125
Val Leu Leu Ser Ser Ile Ala Glu Ser Gln Lys Arg Ile Gly Asp Met
130 135 140
Ala Ile Gly Pro Asp Leu Leu Tyr Trp Ser Lys Val Ala Lys Phe Thr
145 150 155 160
Leu Lys Leu Leu Ile Ser Gln Gln Phe Arg Pro Glu Val Val Glu Val
165 170 175
Met Ser Gly Lys Ala Tyr Ser Arg Trp Arg Phe Ala Leu Thr Asp Glu
180 185 190
Thr Asp Arg Lys His Tyr Ala Ser Leu Glu Asn Ser Met Pro Leu Ala
195 200 205
Cys Ile Ala Val Ser Gly Lys Ala Gly Ile Tyr Asn Arg Lys Glu Ala
210 215 220
Leu Asp Leu Phe Ile Asn Thr Ala Leu Asp Thr Phe Ile Arg Asp Gln
225 230 235 240
Ile Ala Leu Pro Ala Asp Ser Arg Met Thr Asn Leu Leu Ser Gln Ala
245 250 255
Trp Leu Asp Ser Leu Gly Thr Gly Glu Ser Ile Arg Leu Ser Ala Pro
260 265 270
Glu Met Lys Lys Leu Lys Asp Ser Ala Gly Arg Trp Thr Ser Arg Met
275 280 285
Lys Thr Glu Ser Lys Gln Ala Leu Lys Thr Cys Phe Ile Leu Glu Pro
290 295 300
Pro Ala Pro Asp Thr Glu Tyr Pro Glu Ala Pro Trp Asn Leu Arg Tyr
305 310 315 320
Cys Leu Gln Ala Ser Asp Asp Pro Ser Leu Val Ile Pro Ala Glu Thr
325 330 335
Val Trp Lys Glu Leu Lys Lys Thr Leu Lys Tyr Leu Asn Lys Arg Tyr
340 345 350
Asp Asn Pro Gln Glu Gln Leu Leu Gln Asp Leu Gly Lys Ala Met Gln
355 360 365
Met Phe Pro Glu Ile Glu Pro Ser Leu Asn Thr Ser Lys Pro Leu Ser
370 375 380
Ala Thr Leu Ser Thr Ser Glu Ala Tyr Lys Phe Leu Thr Glu Ala Ala
385 390 395 400
Pro Leu Leu Gln Asp Ser Gly Tyr Ser Ile Ile Leu Pro Glu Trp Trp
405 410 415
Arg Asn Ser Thr Gly Arg Leu Lys Leu Gly Ala Arg Leu Arg Phe Lys
420 425 430
Pro Lys Ala Glu Gly Lys Ala Gly Lys Ser Gln Phe Thr Met Asp Thr
435 440 445
Leu Val Ser Tyr Asp Trp Arg Leu Ala Leu Gly Asp Gln Glu Ile Thr
450 455 460
Glu Thr Glu Phe Arg Lys Leu Ala Ala Leu Lys Glu Pro Leu Leu Gln
465 470 475 480
Ile Gly Gly Lys Trp Phe Ala Leu Lys Lys Glu Asp Ile Asp Ser Ile
485 490 495
Met Lys Ala Phe Arg Ala Lys Lys Thr Gly Glu Met Ala Leu Ser Glu
500 505 510
Ala Leu Arg Leu Asn Gly Gly Leu Glu Asp Phe Asn Gly Ile Pro Val
515 520 525
Ser Gly Met Lys Ser Ser Gly Trp Leu Ala Glu Leu Phe Asp Arg Leu
530 535 540
Ala Ala Gly Glu Lys Ile Thr Ser Leu Ala Pro Pro Asp Gly Phe Asn
545 550 555 560
Gly Glu Leu Arg Asp Tyr Gln Val Lys Gly Tyr Ser Trp Leu Ala Phe
565 570 575
Met Lys Lys Tyr Gly Leu Gly Ser Ile Leu Ala Asp Asp Met Gly Leu
580 585 590
Gly Lys Thr Ile Gln Leu Leu Ala Leu Leu Leu Lys Glu Lys Glu Arg
595 600 605
Gly Thr Lys Gly Pro Thr Leu Leu Ile Cys Pro Thr Ser Ile Leu Gly
610 615 620
Asn Trp Gln Arg Glu Ala Lys Lys Phe Ala Pro Ala Leu Lys Val His
625 630 635 640
Ile His His Gly Ala Gly Arg Ala Asp Lys Glu Gln Phe Gly Lys Ile
645 650 655
Val Lys Ala His Asp Leu Ile Leu Ser Thr Tyr Ala His Ala Tyr Arg
660 665 670
Asp Glu Glu Leu Leu Lys Glu Val Asn Trp Lys Leu Val Val Leu Asp
675 680 685
Glu Ala Gln Asn Ile Lys Asn His His Thr Arg Gln Ala Arg Ala Ile
690 695 700
Arg Ala Leu Lys Ala Asp His Arg Ile Ala Met Thr Gly Thr Pro Ile
705 710 715 720
Glu Asn Arg Leu Ser Glu Leu Trp Ser Ile Val Asp Phe Leu Asn Pro
725 730 735
Gly Tyr Leu Gly Lys Ala Glu Thr Phe Arg Lys Gln Phe Ala Ile Pro
740 745 750
Ile Glu Arg Tyr Asp Asp Ala Ala Arg Ser Glu Lys Leu Lys Gln Ala
755 760 765
Ile Lys Pro Leu Val Leu Arg Arg Val Lys Thr Asp Pro Ala Ile Ile
770 775 780
Lys Asp Leu Pro Asp Lys Ile Glu Ile Lys Glu Pro Cys Asn Leu Thr
785 790 795 800
Lys Glu Gln Ala Thr Leu Tyr Glu Ala Ile Val Glu Asn Met Leu Lys
805 810 815
Ser Ile Asp Lys Ala Thr Ala Met Gln Arg Arg Gly Ile Val Leu Ala
820 825 830
Ser Leu Met Lys Leu Lys Gln Val Cys Asp His Pro Ser Leu Tyr Ile
835 840 845
Lys Thr Gly Ala Val Thr Asp Asp Lys Thr Leu Ile Arg Ser Gly Lys
850 855 860
Leu Lys Arg Leu Thr Glu Leu Leu Glu Glu Ala Leu Ala Glu Gly Asp
865 870 875 880
Ser Val Leu Ile Phe Thr Gln Phe Val Glu Met Gly Glu Met Leu Lys
885 890 895
Ala Tyr Leu Gln Ser Thr Phe Asp Glu Glu Ala Leu Phe Leu His Gly
900 905 910
Gly Val Pro Gln Lys Ala Arg Asp Lys Met Val Leu Arg Phe Gly Glu
915 920 925
Lys Asp Gly Pro Arg Ile Phe Ile Val Ser Leu Lys Ala Gly Gly Val
930 935 940
Gly Leu Asn Leu Thr Lys Ala Ser His Val Phe His Phe Asp Arg Trp
945 950 955 960
Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile
965 970 975
Gly Gln Ser Lys Asn Val Leu Val His Lys Phe Val Cys Ala Gly Thr
980 985 990
Leu Glu Glu Lys Ile Asp Glu Leu Ile Glu Ser Lys Lys Ala Leu Ser
995 1000 1005
Ala Asn Ile Leu Gly Thr Gly Glu Asp Trp Ile Thr Glu Leu Ser
1010 1015 1020
Thr Glu Gln Leu Arg Asp Met Val Met Leu Arg Trp Asp Glu Val
1025 1030 1035
Ala Asp Asp Gly
1040
<210> 35
<211> 2757
<212> DNA
<213> Bacillus cereus
<400> 35
atgatcaatc aaactgaagt aacaattagg ctccagcacg ttagtcacgg ttggttcctt 60
tggggagaag atgatagcgg tactccatta tccgtaacaa gttggaaacg aaatgcattt 120
acatggcact ccacttcctt ctacggcacg tttctaaaag aagcaagctt tgaaggaaga 180
caaggtgtta tgctaacaaa cgcacaagca tttgaataca tcgcgaataa accgatgaac 240
tcctttgccc gtattcaaat gaacggccct attacagcac ttacggaaga tgcgaacgaa 300
ttgtgggatg ccttcacaag cggtagcttc gtacctgata tggagcgttg gcctaaacaa 360
ccatcttgga aagttcaaaa tactccaatc gaagatgaaa cattggcatc tcttttctcg 420
gctgcagtaa atgaaagcat attacaagat aaccgttcaa atgacggatg ggaagatgca 480
aagagacttt atgaacatta cgactttacg aaaagacaat tagacgcagc actacatgaa 540
gaagattggc ttcgaaaaat tggttacatt gaagatgacc ttccctttac aatcggacta 600
cgactacaag agccgcaaga agaatttgaa atgtggaagc ttgaaacaat tgttacgcca 660
aagcgcgggg cacatcgcat atatgtatat gagagtatcg attctttacc aaaacgatgg 720
cacgattatg aagaacgtat tctggaaaca caagaaagct tcagtaagct cgtaccgtgg 780
ctaaaagatg gtgatacatt ccgaagtgaa ctctttgaaa cagaagcgtg gaacttctta 840
acagaagcaa gtaacgaatt actcgccgca ggtattacaa tcttattacc atcgtggtgg 900
caaaatttaa aagcgacaaa accaaaatta cgtgtgcaac tgaagcaaaa tgctacacaa 960
acgcaatctt tcttcggcat gaatacactc gttaattttg actggcgcat ttcaacgaac 1020
ggcattgatt tatcagaaag cgaatttttt gaactcgttg aacaaaacaa gcggttattc 1080
aatataaatg gtcaatggat gcgactagat ccagccttta ttgaagaagt acgaaagctc 1140
atgaatcgtg ctgataagta tggacttgaa atgaaagatg tcctgcagca acatttatca 1200
aacacggctg aaacagaaat tgtagaagag gatagtccgt ttacagatat tgaaattgaa 1260
ctagatggat attatgaaga cttattccaa aaactattgc acattggaga tattccgaaa 1320
gtagatgtcc cttcatcact aaacgccaca ctccgtccgt atcaacaaca tggcattgag 1380
tggttattat atttaagaaa gcttggattc ggcgcattgt tagctgacga catgggactt 1440
ggaaagagta ttcaaacgat cacttactta ctatatataa aagaaaacaa tctccaaaca 1500
ggtcctgctt taatcgtggc tccgacatct gttcttggaa attggcaaaa agaatttgag 1560
cgtttcgcac cgaatttacg tgttcagtta cattatggaa gtaaccgagc taaaggggaa 1620
ccctttaaag atttccttca atcagcagat gttgtattaa catcttatgc attagctcag 1680
cttgatgagg aagaacttag tacgttatgc tgggatgctg ttattttgga tgaagcacaa 1740
aatattaaaa acccacatac gaaacagtct aaagcagtac gaaacttaca agcaaatcac 1800
aaaatcgcat taactgggac accgatggaa aaccgccttg ccgagctttg gtctattttc 1860
gacttcatta atcatggata tcttggcagc ttaggacaat tccagcgccg cttcgtctca 1920
ccaattgaaa aggaccgtga cgaaggaaaa atccaacaag ttcaacgttt tatctcaccg 1980
tttttactgc gtcgtacgaa gaaagatcaa acagtcgcat taaacttacc agataaacaa 2040
gaacagaaag cttactgtcc actaactggt gaacaagctt ccttatatga acaacttgtt 2100
caagatacgt tgcaaaatgt agaaggatta agcggaattg aacgacgcgg atttatatta 2160
ctcatgctga acaaacttaa acaaatttgt aatcatcccg ctctttattt aaaagaaaca 2220
gaaccgaaag acatcatcga gcgttccatg aaaacgagca cgctcatgga actcattgaa 2280
aatataaaag atcaaaatga aagttgctta atcttcacgc aatacatcgg tatggggaac 2340
atgctaaaag atgtgttaga agaacatttc ggtcagcgcg tcctcttctt aaacggtagt 2400
gtaccgaaga aagaacgtga caaaatgatc gaacagttcc aaaacggaac gtatgacatc 2460
ttcattttat cgttaaaagc aggtggtaca ggattaaact taacagctgc caaccatgtc 2520
attcactacg atcgttggtg gaatccagcg gtagaaaacc aagcaacaga ccgtgcatat 2580
cgcattggtc aaaagcgctt cgttcacgtt cataaactga ttacaacggg gacacttgaa 2640
gagaaaatcg atgaaatgtt agaaagaaaa caatcattaa acaacgccgt cattacaagc 2700
gatagttgga tgacagaact atctacagat gaactaaaag aattacttgg tgtataa 2757
<210> 36
<211> 918
<212> PRT
<213> Bacillus cereus
<400> 36
Met Ile Asn Gln Thr Glu Val Thr Ile Arg Leu Gln His Val Ser His
1 5 10 15
Gly Trp Phe Leu Trp Gly Glu Asp Asp Ser Gly Thr Pro Leu Ser Val
20 25 30
Thr Ser Trp Lys Arg Asn Ala Phe Thr Trp His Ser Thr Ser Phe Tyr
35 40 45
Gly Thr Phe Leu Lys Glu Ala Ser Phe Glu Gly Arg Gln Gly Val Met
50 55 60
Leu Thr Asn Ala Gln Ala Phe Glu Tyr Ile Ala Asn Lys Pro Met Asn
65 70 75 80
Ser Phe Ala Arg Ile Gln Met Asn Gly Pro Ile Thr Ala Leu Thr Glu
85 90 95
Asp Ala Asn Glu Leu Trp Asp Ala Phe Thr Ser Gly Ser Phe Val Pro
100 105 110
Asp Met Glu Arg Trp Pro Lys Gln Pro Ser Trp Lys Val Gln Asn Thr
115 120 125
Pro Ile Glu Asp Glu Thr Leu Ala Ser Leu Phe Ser Ala Ala Val Asn
130 135 140
Glu Ser Ile Leu Gln Asp Asn Arg Ser Asn Asp Gly Trp Glu Asp Ala
145 150 155 160
Lys Arg Leu Tyr Glu His Tyr Asp Phe Thr Lys Arg Gln Leu Asp Ala
165 170 175
Ala Leu His Glu Glu Asp Trp Leu Arg Lys Ile Gly Tyr Ile Glu Asp
180 185 190
Asp Leu Pro Phe Thr Ile Gly Leu Arg Leu Gln Glu Pro Gln Glu Glu
195 200 205
Phe Glu Met Trp Lys Leu Glu Thr Ile Val Thr Pro Lys Arg Gly Ala
210 215 220
His Arg Ile Tyr Val Tyr Glu Ser Ile Asp Ser Leu Pro Lys Arg Trp
225 230 235 240
His Asp Tyr Glu Glu Arg Ile Leu Glu Thr Gln Glu Ser Phe Ser Lys
245 250 255
Leu Val Pro Trp Leu Lys Asp Gly Asp Thr Phe Arg Ser Glu Leu Phe
260 265 270
Glu Thr Glu Ala Trp Asn Phe Leu Thr Glu Ala Ser Asn Glu Leu Leu
275 280 285
Ala Ala Gly Ile Thr Ile Leu Leu Pro Ser Trp Trp Gln Asn Leu Lys
290 295 300
Ala Thr Lys Pro Lys Leu Arg Val Gln Leu Lys Gln Asn Ala Thr Gln
305 310 315 320
Thr Gln Ser Phe Phe Gly Met Asn Thr Leu Val Asn Phe Asp Trp Arg
325 330 335
Ile Ser Thr Asn Gly Ile Asp Leu Ser Glu Ser Glu Phe Phe Glu Leu
340 345 350
Val Glu Gln Asn Lys Arg Leu Phe Asn Ile Asn Gly Gln Trp Met Arg
355 360 365
Leu Asp Pro Ala Phe Ile Glu Glu Val Arg Lys Leu Met Asn Arg Ala
370 375 380
Asp Lys Tyr Gly Leu Glu Met Lys Asp Val Leu Gln Gln His Leu Ser
385 390 395 400
Asn Thr Ala Glu Thr Glu Ile Val Glu Glu Asp Ser Pro Phe Thr Asp
405 410 415
Ile Glu Ile Glu Leu Asp Gly Tyr Tyr Glu Asp Leu Phe Gln Lys Leu
420 425 430
Leu His Ile Gly Asp Ile Pro Lys Val Asp Val Pro Ser Ser Leu Asn
435 440 445
Ala Thr Leu Arg Pro Tyr Gln Gln His Gly Ile Glu Trp Leu Leu Tyr
450 455 460
Leu Arg Lys Leu Gly Phe Gly Ala Leu Leu Ala Asp Asp Met Gly Leu
465 470 475 480
Gly Lys Ser Ile Gln Thr Ile Thr Tyr Leu Leu Tyr Ile Lys Glu Asn
485 490 495
Asn Leu Gln Thr Gly Pro Ala Leu Ile Val Ala Pro Thr Ser Val Leu
500 505 510
Gly Asn Trp Gln Lys Glu Phe Glu Arg Phe Ala Pro Asn Leu Arg Val
515 520 525
Gln Leu His Tyr Gly Ser Asn Arg Ala Lys Gly Glu Pro Phe Lys Asp
530 535 540
Phe Leu Gln Ser Ala Asp Val Val Leu Thr Ser Tyr Ala Leu Ala Gln
545 550 555 560
Leu Asp Glu Glu Glu Leu Ser Thr Leu Cys Trp Asp Ala Val Ile Leu
565 570 575
Asp Glu Ala Gln Asn Ile Lys Asn Pro His Thr Lys Gln Ser Lys Ala
580 585 590
Val Arg Asn Leu Gln Ala Asn His Lys Ile Ala Leu Thr Gly Thr Pro
595 600 605
Met Glu Asn Arg Leu Ala Glu Leu Trp Ser Ile Phe Asp Phe Ile Asn
610 615 620
His Gly Tyr Leu Gly Ser Leu Gly Gln Phe Gln Arg Arg Phe Val Ser
625 630 635 640
Pro Ile Glu Lys Asp Arg Asp Glu Gly Lys Ile Gln Gln Val Gln Arg
645 650 655
Phe Ile Ser Pro Phe Leu Leu Arg Arg Thr Lys Lys Asp Gln Thr Val
660 665 670
Ala Leu Asn Leu Pro Asp Lys Gln Glu Gln Lys Ala Tyr Cys Pro Leu
675 680 685
Thr Gly Glu Gln Ala Ser Leu Tyr Glu Gln Leu Val Gln Asp Thr Leu
690 695 700
Gln Asn Val Glu Gly Leu Ser Gly Ile Glu Arg Arg Gly Phe Ile Leu
705 710 715 720
Leu Met Leu Asn Lys Leu Lys Gln Ile Cys Asn His Pro Ala Leu Tyr
725 730 735
Leu Lys Glu Thr Glu Pro Lys Asp Ile Ile Glu Arg Ser Met Lys Thr
740 745 750
Ser Thr Leu Met Glu Leu Ile Glu Asn Ile Lys Asp Gln Asn Glu Ser
755 760 765
Cys Leu Ile Phe Thr Gln Tyr Ile Gly Met Gly Asn Met Leu Lys Asp
770 775 780
Val Leu Glu Glu His Phe Gly Gln Arg Val Leu Phe Leu Asn Gly Ser
785 790 795 800
Val Pro Lys Lys Glu Arg Asp Lys Met Ile Glu Gln Phe Gln Asn Gly
805 810 815
Thr Tyr Asp Ile Phe Ile Leu Ser Leu Lys Ala Gly Gly Thr Gly Leu
820 825 830
Asn Leu Thr Ala Ala Asn His Val Ile His Tyr Asp Arg Trp Trp Asn
835 840 845
Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln
850 855 860
Lys Arg Phe Val His Val His Lys Leu Ile Thr Thr Gly Thr Leu Glu
865 870 875 880
Glu Lys Ile Asp Glu Met Leu Glu Arg Lys Gln Ser Leu Asn Asn Ala
885 890 895
Val Ile Thr Ser Asp Ser Trp Met Thr Glu Leu Ser Thr Asp Glu Leu
900 905 910
Lys Glu Leu Leu Gly Val
915
<210> 37
<211> 3141
<212> DNA
<213> Crocosphaera watsonii
<400> 37
atgacaatat tacatggaac ttggattgaa aatacctctg aaaaacattt ttttatttgg 60
ggggaaactt ggcgttcttt atcctctgat atttcctcag atgattctat tttaatgtat 120
ccattttctg tagataaaca gggaattatt gaacaattaa actcgaataa gattaagatt 180
gaaaaaaaca aaaatattga atctgtttct caaatatttt atttgcctag taaatttatt 240
gctaaatcga agcaaagtat ccctttacta tcaacagaat taaaagataa agattttgaa 300
caaggggata ttcagttaat tgcttggaaa atcgaaggga taaaattaaa tgttgatgat 360
acaattaata ttttaagtca gttaccgttg ggattaacca ataatgacga aaattacata 420
ggcgataatt taaaattttg gacacatatt tatcgttgga gtctagattt attaactaga 480
ggtaaatatt taccgcaaat ggaagaacaa gataataact gttatggaca atgggaacct 540
ttactagata gtttagttga tcagcaacgg ttctctaaat ttatacaaac tatgccaaat 600
agttctcttg cttatcataa tttaatggag ggtgaattat cctcttcttt actcaaacaa 660
actactattc ttgatttttt atctactatc attaatcaac aagtacgtca atttattgat 720
gttgctatta cccctagttc atttatccaa aagtggttat actctttaac acaagactta 780
tctaaatttg aagcatcaga agttgaaaga aagggattaa agaatgctat taataattgg 840
aaatcttctt taagtgaata tattataaag tctgataatc aaccattagg aattaaccag 900
tttcgtgttt gttttaaact agaaaatcca gctaaaagtg gtaagaaatt agaacaaagt 960
aattggcagt tacactacta tctccaagct ttagatgatc ctaattttct gatctctgcc 1020
aaggttattt gggaaaatcc tgttactaga ttaatctgca ataatagaac aattaatcat 1080
cctcaagaaa ccttgctaaa aggactaggt ttagcttcac gtctatatta tctaattgaa 1140
gaaagtttac aagacaataa gcctagtttt tctgagttag atcccataca agtctatgaa 1200
tttttacgtt caattgctaa tattcttaaa gataatggct taggggttat cttaccagct 1260
agtctagagc aaggagtcga agaaaaacgc ttaggaatta gtctaaccgc agaagttaag 1320
tcgaaaaaag gacaaagact tagcttacaa agtttgttaa gttataagct aaatttagca 1380
attggtgata aaacaatatc gaaaaaagac tttgaaaaac tattagcgca aaagtcacct 1440
ttagttgaag taaaaggaga atggatagca ttacaacctg ctgatgtcaa ggccgcacaa 1500
caaattttaa ataagtccta tgatccccta gaactttctg tagaagatgc tttacgcttc 1560
agcacaggag atatttcaac tgttgccaaa ctgccgatta ctaactttga agcaaaaggg 1620
gaattagcca atctaattaa tgctataaat aataatgaat caatccctat gatcgaaaat 1680
cccagaggat ttaaaggtca attacgtccc tatcaacagc gaggagtcgg ttggttatcg 1740
ttcttagaaa aatggggttt aggggcttgt cttgccgatg atatgggatt aggaaaaaca 1800
ccacaattaa ttgggtttct cttacattta agaagcgaag gaatgttaga tcaacctacc 1860
ttagttattt gtcctacatc tgttttaaat aactgggaaa gagaagttca aaaatttgcc 1920
ccaacccttt ctactttgat tcatcatgga gataaacgta gtaaagggaa agcttttgtt 1980
aaagcagtta gtaaaaaaaa tgttatcatt actagctatt ctttaattta tcgagatatt 2040
aaaagctttg aacaggtaga atggcaaggt attgtcttag atgaagcaca aaatataaaa 2100
aatccccagg caaaacaatc ccaagcagtg cgtcaaattt ccacacagtt tcgtattgct 2160
ttaacaggaa ctcctgtaga aaatcgccta acagaattat ggtcaattct tgactttctt 2220
aacccaggat ttttagggac acagcagttt ttccgtcgtc gttttgccac tcctatcgaa 2280
aaatatgggg ataaagaatc actgcaaatt atgcgttctt tggtacgtcc tttcattctc 2340
agacgattga aaacagataa aactattatt caagatttac ccgaaaaaca agaaatgacc 2400
attttttgtg ggttatcctc agaacaagga aaactttatc aacaattagt agataattct 2460
ctggtagcaa tagaagagaa aacaggaatt gaacgcaaag gcttaatttt aagcttactg 2520
ctaaaactca aacaaatttg taaccatcct gctcattttc tcaagcaaaa gagcttaaaa 2580
acagcagaac aatctggtaa attattaaga ctagaagaaa tgctagaaga attaatcgaa 2640
gaaggagatc atgctttaat ctttacccaa ttttctgaat ggggtaaact gctgcaacct 2700
tatttacaga aaaaatttca gcaagacgtt ctctttttgt atggtgctac tcgcagagtt 2760
caaagacaag aaatgatcga tcgctttcaa caggatccca acggacccag aatttttatt 2820
ctctccttaa aagcaggggg aaccggatta aatttaaccc gcgctaacca tgtatttcat 2880
attgatcgtt ggtggaaccc agcagtagaa aatcaagcaa ccgatcgcgc gtttcgttta 2940
ggacaaaaac gcaatgttca agtacataaa tttgtctgta caggaaccct agaagaaaaa 3000
attaacgaaa tgttagaaag taaacaaaaa ttagccgaac aaaccgttga cgcaggggaa 3060
caatggttga cagaattaga tacagatcaa ctgcgtaacc tcttattatt ggatcgagat 3120
accattattg acgaacaata a 3141
<210> 38
<211> 1046
<212> PRT
<213> Crocosphaera watsonii
<400> 38
Met Thr Ile Leu His Gly Thr Trp Ile Glu Asn Thr Ser Glu Lys His
1 5 10 15
Phe Phe Ile Trp Gly Glu Thr Trp Arg Ser Leu Ser Ser Asp Ile Ser
20 25 30
Ser Asp Asp Ser Ile Leu Met Tyr Pro Phe Ser Val Asp Lys Gln Gly
35 40 45
Ile Ile Glu Gln Leu Asn Ser Asn Lys Ile Lys Ile Glu Lys Asn Lys
50 55 60
Asn Ile Glu Ser Val Ser Gln Ile Phe Tyr Leu Pro Ser Lys Phe Ile
65 70 75 80
Ala Lys Ser Lys Gln Ser Ile Pro Leu Leu Ser Thr Glu Leu Lys Asp
85 90 95
Lys Asp Phe Glu Gln Gly Asp Ile Gln Leu Ile Ala Trp Lys Ile Glu
100 105 110
Gly Ile Lys Leu Asn Val Asp Asp Thr Ile Asn Ile Leu Ser Gln Leu
115 120 125
Pro Leu Gly Leu Thr Asn Asn Asp Glu Asn Tyr Ile Gly Asp Asn Leu
130 135 140
Lys Phe Trp Thr His Ile Tyr Arg Trp Ser Leu Asp Leu Leu Thr Arg
145 150 155 160
Gly Lys Tyr Leu Pro Gln Met Glu Glu Gln Asp Asn Asn Cys Tyr Gly
165 170 175
Gln Trp Glu Pro Leu Leu Asp Ser Leu Val Asp Gln Gln Arg Phe Ser
180 185 190
Lys Phe Ile Gln Thr Met Pro Asn Ser Ser Leu Ala Tyr His Asn Leu
195 200 205
Met Glu Gly Glu Leu Ser Ser Ser Leu Leu Lys Gln Thr Thr Ile Leu
210 215 220
Asp Phe Leu Ser Thr Ile Ile Asn Gln Gln Val Arg Gln Phe Ile Asp
225 230 235 240
Val Ala Ile Thr Pro Ser Ser Phe Ile Gln Lys Trp Leu Tyr Ser Leu
245 250 255
Thr Gln Asp Leu Ser Lys Phe Glu Ala Ser Glu Val Glu Arg Lys Gly
260 265 270
Leu Lys Asn Ala Ile Asn Asn Trp Lys Ser Ser Leu Ser Glu Tyr Ile
275 280 285
Ile Lys Ser Asp Asn Gln Pro Leu Gly Ile Asn Gln Phe Arg Val Cys
290 295 300
Phe Lys Leu Glu Asn Pro Ala Lys Ser Gly Lys Lys Leu Glu Gln Ser
305 310 315 320
Asn Trp Gln Leu His Tyr Tyr Leu Gln Ala Leu Asp Asp Pro Asn Phe
325 330 335
Leu Ile Ser Ala Lys Val Ile Trp Glu Asn Pro Val Thr Arg Leu Ile
340 345 350
Cys Asn Asn Arg Thr Ile Asn His Pro Gln Glu Thr Leu Leu Lys Gly
355 360 365
Leu Gly Leu Ala Ser Arg Leu Tyr Tyr Leu Ile Glu Glu Ser Leu Gln
370 375 380
Asp Asn Lys Pro Ser Phe Ser Glu Leu Asp Pro Ile Gln Val Tyr Glu
385 390 395 400
Phe Leu Arg Ser Ile Ala Asn Ile Leu Lys Asp Asn Gly Leu Gly Val
405 410 415
Ile Leu Pro Ala Ser Leu Glu Gln Gly Val Glu Glu Lys Arg Leu Gly
420 425 430
Ile Ser Leu Thr Ala Glu Val Lys Ser Lys Lys Gly Gln Arg Leu Ser
435 440 445
Leu Gln Ser Leu Leu Ser Tyr Lys Leu Asn Leu Ala Ile Gly Asp Lys
450 455 460
Thr Ile Ser Lys Lys Asp Phe Glu Lys Leu Leu Ala Gln Lys Ser Pro
465 470 475 480
Leu Val Glu Val Lys Gly Glu Trp Ile Ala Leu Gln Pro Ala Asp Val
485 490 495
Lys Ala Ala Gln Gln Ile Leu Asn Lys Ser Tyr Asp Pro Leu Glu Leu
500 505 510
Ser Val Glu Asp Ala Leu Arg Phe Ser Thr Gly Asp Ile Ser Thr Val
515 520 525
Ala Lys Leu Pro Ile Thr Asn Phe Glu Ala Lys Gly Glu Leu Ala Asn
530 535 540
Leu Ile Asn Ala Ile Asn Asn Asn Glu Ser Ile Pro Met Ile Glu Asn
545 550 555 560
Pro Arg Gly Phe Lys Gly Gln Leu Arg Pro Tyr Gln Gln Arg Gly Val
565 570 575
Gly Trp Leu Ser Phe Leu Glu Lys Trp Gly Leu Gly Ala Cys Leu Ala
580 585 590
Asp Asp Met Gly Leu Gly Lys Thr Pro Gln Leu Ile Gly Phe Leu Leu
595 600 605
His Leu Arg Ser Glu Gly Met Leu Asp Gln Pro Thr Leu Val Ile Cys
610 615 620
Pro Thr Ser Val Leu Asn Asn Trp Glu Arg Glu Val Gln Lys Phe Ala
625 630 635 640
Pro Thr Leu Ser Thr Leu Ile His His Gly Asp Lys Arg Ser Lys Gly
645 650 655
Lys Ala Phe Val Lys Ala Val Ser Lys Lys Asn Val Ile Ile Thr Ser
660 665 670
Tyr Ser Leu Ile Tyr Arg Asp Ile Lys Ser Phe Glu Gln Val Glu Trp
675 680 685
Gln Gly Ile Val Leu Asp Glu Ala Gln Asn Ile Lys Asn Pro Gln Ala
690 695 700
Lys Gln Ser Gln Ala Val Arg Gln Ile Ser Thr Gln Phe Arg Ile Ala
705 710 715 720
Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Thr Glu Leu Trp Ser Ile
725 730 735
Leu Asp Phe Leu Asn Pro Gly Phe Leu Gly Thr Gln Gln Phe Phe Arg
740 745 750
Arg Arg Phe Ala Thr Pro Ile Glu Lys Tyr Gly Asp Lys Glu Ser Leu
755 760 765
Gln Ile Met Arg Ser Leu Val Arg Pro Phe Ile Leu Arg Arg Leu Lys
770 775 780
Thr Asp Lys Thr Ile Ile Gln Asp Leu Pro Glu Lys Gln Glu Met Thr
785 790 795 800
Ile Phe Cys Gly Leu Ser Ser Glu Gln Gly Lys Leu Tyr Gln Gln Leu
805 810 815
Val Asp Asn Ser Leu Val Ala Ile Glu Glu Lys Thr Gly Ile Glu Arg
820 825 830
Lys Gly Leu Ile Leu Ser Leu Leu Leu Lys Leu Lys Gln Ile Cys Asn
835 840 845
His Pro Ala His Phe Leu Lys Gln Lys Ser Leu Lys Thr Ala Glu Gln
850 855 860
Ser Gly Lys Leu Leu Arg Leu Glu Glu Met Leu Glu Glu Leu Ile Glu
865 870 875 880
Glu Gly Asp His Ala Leu Ile Phe Thr Gln Phe Ser Glu Trp Gly Lys
885 890 895
Leu Leu Gln Pro Tyr Leu Gln Lys Lys Phe Gln Gln Asp Val Leu Phe
900 905 910
Leu Tyr Gly Ala Thr Arg Arg Val Gln Arg Gln Glu Met Ile Asp Arg
915 920 925
Phe Gln Gln Asp Pro Asn Gly Pro Arg Ile Phe Ile Leu Ser Leu Lys
930 935 940
Ala Gly Gly Thr Gly Leu Asn Leu Thr Arg Ala Asn His Val Phe His
945 950 955 960
Ile Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg
965 970 975
Ala Phe Arg Leu Gly Gln Lys Arg Asn Val Gln Val His Lys Phe Val
980 985 990
Cys Thr Gly Thr Leu Glu Glu Lys Ile Asn Glu Met Leu Glu Ser Lys
995 1000 1005
Gln Lys Leu Ala Glu Gln Thr Val Asp Ala Gly Glu Gln Trp Leu
1010 1015 1020
Thr Glu Leu Asp Thr Asp Gln Leu Arg Asn Leu Leu Leu Leu Asp
1025 1030 1035
Arg Asp Thr Ile Ile Asp Glu Gln
1040 1045
<210> 39
<211> 3027
<212> DNA
<213> Gloeobacter violaceus
<400> 39
atggctatct tgcacggtat ctgggttcac caaccccccc gggccgggct tttcctttgg 60
ggagaaacct ggaggcaggt cgcaaagcgg cgcaagcgct ccgaagcacc cgctccgcat 120
ccctatgtcc agcaaccggc cgagttgtcc ccccgcctgg ctgcccagtt tccccagata 180
ccgctcagct tgctggtacc cgagacgctt gcactccagt tgcccgccac ggtcgaaaac 240
gtggtctact ccgcaagcat tgctcccgag ggcaagcttt tggagttgga accgtggctg 300
gtggaaggtt tctggctcga cggtcaccag gcttttgaac tgttgctcgg ggtacccctg 360
ggcggcgggg acgcatcgat tggcgacgac ctgcgcttct ggtcgcagtg cgcccgctgg 420
gtgcttgact tgctggtgcg cgccaagtac ctgcccgacc tggagagcgg cgacggccag 480
gaaatcccca cagcccgctg ggtgcccctg ctcgacagcg ccgtcgatca agcccgcctc 540
aaagaatttg ccgcccgttt gccgggcgcc tgccgcgccg ctacccccga actatctccg 600
caccagattc tcaagagttt cctgagcgcc atgctcgacg cgcgggtgcg cacgctgctc 660
gcttgcgagc ctcccgatcc gcgcacgctg cctgccggag cggtgcgccc ctggcttctg 720
gccctggccc atgcccagcc ccagctcaaa tctccggacc cggagacgcc ggctctggcg 780
gaagccctgg ccacctggcg cgcccccctg agctatcagg ttcgctcgcg cacctgcttc 840
cgtctgcagc cgcccgagga gagccagggc gagtggaagc tgcactttct attgcaaaca 900
ggcgacgatc ccgattcgct gatggctgcc cagcaagtct ggagcagcgc gggtgagctg 960
caggaggtgt ttctcgcggg cttgggcctc gcctcgcgta tctttgtgcc cgtcgagcgg 1020
ggattgctcg tcccccagcc cacctgctgc accatgagca ccgtcgaggc gtttcagttt 1080
ctcaaagccg ccacctggcg gttgcgcgac agcggcttcg gggtgttgtt gcccgagagc 1140
ctcgcggacg cgggcagcct gcgcaaccgc ctgggcctca aactcgaagc gaacgcgccg 1200
gggcgcaacg gttcgggcct cggcatgcag agcttgctcg cttttaaatg ggagctgtcg 1260
ctcgcgggca agaccctgag ccgcgccgag ttcgaccgcc tcgccgctag ttctgaaccc 1320
ctggtcaaag tcaacgacaa ctgggtcgaa ttgcgccccc aggacgtgcg cgccgcccac 1380
agctttttgc agtcgcgcaa agatcaggtc ggactctcgt tggaggatgt gctgcgcctc 1440
aacttcggcg acacccccaa aatcgacggt ctccccatcg tcaacttcga cagctccggc 1500
cccattcagc aactgctgga gaccctcacc gatcagcgca aactcacccc catcgacgaa 1560
ccgccggggt tcaagggcac cctgcggccc tatcaaaaaa ttggcgtcgg ctggctcgcc 1620
tttttgcaga agtggggcct gggtgcttgc ctagccgacg acatgggact cgggaagacc 1680
gtagagttga tagcatttct tctttttctc aaatccaaaa atgagctgga cggccctata 1740
ttgttaattt gtccgacttc agtgatggga aactgggaaa gagaaataaa gaaattttct 1800
cctagtttat ctgtacatgt ccatcatggg gcgcggcggc cgaaggggcg caattttgtc 1860
gagacggccc agaaaaagca aatcatcgtc agcagctacg ccctggtaca gcgcgacagc 1920
aaagatctca agcgcgtcga atggttgggc ctggtgctcg acgaagccca gaacatcaaa 1980
aaccccgacg ccaagcagac ccagtcgatt cgggaactga cagcgcgctt tcgcatcgcc 2040
ctcaccggca caccggtcga gaatcgcctc gcggaactgt ggtcgatcct cgattttctc 2100
aatcccggct atctgggggc gcgcaacttc tttcagcgcc gcttcgcagt tccgatcgaa 2160
aagtacgggg atcgctcctc ggcgaacgcc ctcaaagctc tggtgcagcc gtttatcctg 2220
cggcggctca aatccgaccc gcagattatt caagatctgc ccgagaagca ggagacgaat 2280
gtcttctgtc cgctcacacc cgagcaggcg gccctctacg agcgggtggt gaacgaatcg 2340
ctcgccaaga tcgagcagag caccggcatc cagcggcgcg ggacggtgct ggccaccttg 2400
gtcaaactca agcagatctg caaccacccg agccactacc tgggtgacga cggaccgctc 2460
gccaaccgct cgggcaaact cagccgcctg ggcgagatgc tcgaagaagt gctcgccgac 2520
gaggagcggg cgctgatttt tacccagttc gccgagtggg gccacctgct gcaggcgcac 2580
ctgagccgcc agttgggttc agaagtgttt ttcctctacg gcggcaccag caaaaaccag 2640
cgcgaggcga tgatcgagcg cttccagagc gatccgcagg ggccgcggat ttttattctt 2700
tcgctgaagg cagggggtgt cggcctcaac ctcacccgcg ccaaccacgt cttccacttc 2760
gaccgctggt ggaacccggc ggtcgagaat caggccaccg accgcgtctt ccgcatcggc 2820
caaaccaaga acgtacaagt ctacaagtac gtgtgcaccg gcacgctcga agagcgcatc 2880
aacgccctga tcgaaagcaa aaaggccctg gctgagcagg tggtgagcgc cggtgagaac 2940
tggctgtcgg atctaaatac cgatcaactg cggcaactgt tggtactcga tcgctcggag 3000
attatcgaca cggaggacac cgcgtga 3027
<210> 40
<211> 1008
<212> PRT
<213> Gloeobacter violaceus
<400> 40
Met Ala Ile Leu His Gly Ile Trp Val His Gln Pro Pro Arg Ala Gly
1 5 10 15
Leu Phe Leu Trp Gly Glu Thr Trp Arg Gln Val Ala Lys Arg Arg Lys
20 25 30
Arg Ser Glu Ala Pro Ala Pro His Pro Tyr Val Gln Gln Pro Ala Glu
35 40 45
Leu Ser Pro Arg Leu Ala Ala Gln Phe Pro Gln Ile Pro Leu Ser Leu
50 55 60
Leu Val Pro Glu Thr Leu Ala Leu Gln Leu Pro Ala Thr Val Glu Asn
65 70 75 80
Val Val Tyr Ser Ala Ser Ile Ala Pro Glu Gly Lys Leu Leu Glu Leu
85 90 95
Glu Pro Trp Leu Val Glu Gly Phe Trp Leu Asp Gly His Gln Ala Phe
100 105 110
Glu Leu Leu Leu Gly Val Pro Leu Gly Gly Gly Asp Ala Ser Ile Gly
115 120 125
Asp Asp Leu Arg Phe Trp Ser Gln Cys Ala Arg Trp Val Leu Asp Leu
130 135 140
Leu Val Arg Ala Lys Tyr Leu Pro Asp Leu Glu Ser Gly Asp Gly Gln
145 150 155 160
Glu Ile Pro Thr Ala Arg Trp Val Pro Leu Leu Asp Ser Ala Val Asp
165 170 175
Gln Ala Arg Leu Lys Glu Phe Ala Ala Arg Leu Pro Gly Ala Cys Arg
180 185 190
Ala Ala Thr Pro Glu Leu Ser Pro His Gln Ile Leu Lys Ser Phe Leu
195 200 205
Ser Ala Met Leu Asp Ala Arg Val Arg Thr Leu Leu Ala Cys Glu Pro
210 215 220
Pro Asp Pro Arg Thr Leu Pro Ala Gly Ala Val Arg Pro Trp Leu Leu
225 230 235 240
Ala Leu Ala His Ala Gln Pro Gln Leu Lys Ser Pro Asp Pro Glu Thr
245 250 255
Pro Ala Leu Ala Glu Ala Leu Ala Thr Trp Arg Ala Pro Leu Ser Tyr
260 265 270
Gln Val Arg Ser Arg Thr Cys Phe Arg Leu Gln Pro Pro Glu Glu Ser
275 280 285
Gln Gly Glu Trp Lys Leu His Phe Leu Leu Gln Thr Gly Asp Asp Pro
290 295 300
Asp Ser Leu Met Ala Ala Gln Gln Val Trp Ser Ser Ala Gly Glu Leu
305 310 315 320
Gln Glu Val Phe Leu Ala Gly Leu Gly Leu Ala Ser Arg Ile Phe Val
325 330 335
Pro Val Glu Arg Gly Leu Leu Val Pro Gln Pro Thr Cys Cys Thr Met
340 345 350
Ser Thr Val Glu Ala Phe Gln Phe Leu Lys Ala Ala Thr Trp Arg Leu
355 360 365
Arg Asp Ser Gly Phe Gly Val Leu Leu Pro Glu Ser Leu Ala Asp Ala
370 375 380
Gly Ser Leu Arg Asn Arg Leu Gly Leu Lys Leu Glu Ala Asn Ala Pro
385 390 395 400
Gly Arg Asn Gly Ser Gly Leu Gly Met Gln Ser Leu Leu Ala Phe Lys
405 410 415
Trp Glu Leu Ser Leu Ala Gly Lys Thr Leu Ser Arg Ala Glu Phe Asp
420 425 430
Arg Leu Ala Ala Ser Ser Glu Pro Leu Val Lys Val Asn Asp Asn Trp
435 440 445
Val Glu Leu Arg Pro Gln Asp Val Arg Ala Ala His Ser Phe Leu Gln
450 455 460
Ser Arg Lys Asp Gln Val Gly Leu Ser Leu Glu Asp Val Leu Arg Leu
465 470 475 480
Asn Phe Gly Asp Thr Pro Lys Ile Asp Gly Leu Pro Ile Val Asn Phe
485 490 495
Asp Ser Ser Gly Pro Ile Gln Gln Leu Leu Glu Thr Leu Thr Asp Gln
500 505 510
Arg Lys Leu Thr Pro Ile Asp Glu Pro Pro Gly Phe Lys Gly Thr Leu
515 520 525
Arg Pro Tyr Gln Lys Ile Gly Val Gly Trp Leu Ala Phe Leu Gln Lys
530 535 540
Trp Gly Leu Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr
545 550 555 560
Val Glu Leu Ile Ala Phe Leu Leu Phe Leu Lys Ser Lys Asn Glu Leu
565 570 575
Asp Gly Pro Ile Leu Leu Ile Cys Pro Thr Ser Val Met Gly Asn Trp
580 585 590
Glu Arg Glu Ile Lys Lys Phe Ser Pro Ser Leu Ser Val His Val His
595 600 605
His Gly Ala Arg Arg Pro Lys Gly Arg Asn Phe Val Glu Thr Ala Gln
610 615 620
Lys Lys Gln Ile Ile Val Ser Ser Tyr Ala Leu Val Gln Arg Asp Ser
625 630 635 640
Lys Asp Leu Lys Arg Val Glu Trp Leu Gly Leu Val Leu Asp Glu Ala
645 650 655
Gln Asn Ile Lys Asn Pro Asp Ala Lys Gln Thr Gln Ser Ile Arg Glu
660 665 670
Leu Thr Ala Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn
675 680 685
Arg Leu Ala Glu Leu Trp Ser Ile Leu Asp Phe Leu Asn Pro Gly Tyr
690 695 700
Leu Gly Ala Arg Asn Phe Phe Gln Arg Arg Phe Ala Val Pro Ile Glu
705 710 715 720
Lys Tyr Gly Asp Arg Ser Ser Ala Asn Ala Leu Lys Ala Leu Val Gln
725 730 735
Pro Phe Ile Leu Arg Arg Leu Lys Ser Asp Pro Gln Ile Ile Gln Asp
740 745 750
Leu Pro Glu Lys Gln Glu Thr Asn Val Phe Cys Pro Leu Thr Pro Glu
755 760 765
Gln Ala Ala Leu Tyr Glu Arg Val Val Asn Glu Ser Leu Ala Lys Ile
770 775 780
Glu Gln Ser Thr Gly Ile Gln Arg Arg Gly Thr Val Leu Ala Thr Leu
785 790 795 800
Val Lys Leu Lys Gln Ile Cys Asn His Pro Ser His Tyr Leu Gly Asp
805 810 815
Asp Gly Pro Leu Ala Asn Arg Ser Gly Lys Leu Ser Arg Leu Gly Glu
820 825 830
Met Leu Glu Glu Val Leu Ala Asp Glu Glu Arg Ala Leu Ile Phe Thr
835 840 845
Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ala His Leu Ser Arg Gln
850 855 860
Leu Gly Ser Glu Val Phe Phe Leu Tyr Gly Gly Thr Ser Lys Asn Gln
865 870 875 880
Arg Glu Ala Met Ile Glu Arg Phe Gln Ser Asp Pro Gln Gly Pro Arg
885 890 895
Ile Phe Ile Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr
900 905 910
Arg Ala Asn His Val Phe His Phe Asp Arg Trp Trp Asn Pro Ala Val
915 920 925
Glu Asn Gln Ala Thr Asp Arg Val Phe Arg Ile Gly Gln Thr Lys Asn
930 935 940
Val Gln Val Tyr Lys Tyr Val Cys Thr Gly Thr Leu Glu Glu Arg Ile
945 950 955 960
Asn Ala Leu Ile Glu Ser Lys Lys Ala Leu Ala Glu Gln Val Val Ser
965 970 975
Ala Gly Glu Asn Trp Leu Ser Asp Leu Asn Thr Asp Gln Leu Arg Gln
980 985 990
Leu Leu Val Leu Asp Arg Ser Glu Ile Ile Asp Thr Glu Asp Thr Ala
995 1000 1005
<210> 41
<211> 3186
<212> DNA
<213> Lyngbya sp.
<400> 41
atggcaattt tacacggaag ttggctccag caccccaaaa attatttgtt tatttgggga 60
gaaacctggc gtcgcattac acccaatgaa tttaatccgg ctgatggtgt tttgggttat 120
ccttttgctt taagccctgt tgaattggaa aagtggtgca gtgaaaagca gttatctata 180
gagagtaaag ttgtcgttac agaaactctc gcccttccca ctaaactctc cccaaaaata 240
ggactatatc cccttcaatc tacgcctcaa actgattctg aaactgattc tgagtcgatc 300
tgtctttatc cctggaaaat tgaaggtatt tgtctcaaca gtacagaagc ctttgacttt 360
ttacaatccc ttcctctggg aaacctgacc acagaaaact catttattgg ctcagattta 420
cagttttggt ctcatctttc ccgttggagt ttagacttac tcgcccggag taaattttta 480
cccagtctca cttttaaccc ctcaaaagat cactttatcg ctgaatggaa acctttactc 540
gatagtgcga cagatcaagc cagattaatt cgtttttcta aacaaatacc ctctgcttgt 600
cggatctatc aactctggtc aaaagaggct caaaatcaat ttgaaaattt agccctagat 660
ttacctcaaa atccccaaaa cttaattgat gattttttaa cggcaattat tgatagtcaa 720
gtcaagaaag ttgcagaaga aagtgaaaaa aaagcgatta caaatctaac cgctattcaa 780
ccgattgttc agagttggtt acacgcttta gccagtgaat ctaatctagc aaaatccaaa 840
aaatctgaat caaaaaccct agaaaaaatt ctttccaatt ggacggctcc tcttcaacaa 900
actctcgctg aacataattt gtttagaacg ggatttcgac tctctcctcc ggaaaataat 960
caaaaaaatt ggacgctaga ttattgttta caagcaattg atgaacccga atttttagtg 1020
gatgctcaaa ctatttggac tcatccagtc gaagcctttg ttcacaatgg acgtatgatt 1080
aaacgtcctc aagaaaccct cctcaaaggt ttaggtttag cctcaaaact atatcctctc 1140
ctagaaccca gtttacaaga agcccgtcct caaacttgct tattaacgcc cctacaagcc 1200
tatgaattta ttaaaagtat taattggcgg tttacagata gcggtttagg agtgatttta 1260
cccccgagtt tagtcagtca aaatggatgg gcgaaccgtt taggtttaag tgttcaagcg 1320
gcgacatcaa aatccaaaca aaatgttagc ttgggattag atagtctgct gaattttaaa 1380
tgggaattgt caattggggg tcaaacctta tcaaaaacag aatttaaccg tttagtcgct 1440
caagaaagtc cgttagttga aattaatggc gaatgggtgg aattacgtcc tactgatatt 1500
aaagccgcta aagccttctt ttcgagtcgc aaagatcaac tttcacttac ccttgaagat 1560
gctttacgtt tatcgacggg tgactcgcaa atggtggaaa agttaccgat tgttaacttt 1620
gaagcgggtg gaaaattaga agaacttctc aatactttaa cgaataaccg ttcgctcgat 1680
gagatcaaaa ctcctagtaa ttttcaagga gaactacgcc cctatcaagc ccgaggggtg 1740
agttggttag cctttttaga agaatggggt ttaggggctt gtttagctga tgatatgggg 1800
ctaggaaaaa ccatagaatt aattgctttt ctcttgtatt tgcaggaaaa agaaacctta 1860
gacgctcctg ttttactggt ttgtccgaca tcagttttag gaaactggga acgagaagtt 1920
aaacgattta gtccgagttt aaaagttact gttcatcacg gggataaacg ccagaaaggg 1980
aaaaactttg ctcaatttgc ccagaaatat aatttaatta ttaccagtta tccgttaact 2040
tttcgagatg agaaagaact caaaacggta aattggaaag gattagtttt agacgaagct 2100
caaaatatta aaaatcccga ggctaaacaa tcaaaaacgg tgagaaatct acaggcgagt 2160
tttaaaattg ctctgactgg aacacctgtc gaaaaccgtc tgtctgaatt atggtcaatt 2220
atggattttc tcaacccagg ttatttagga cagcgacaat tttttcagcg aagatttgct 2280
attccgattg aaaaatacgg cgatacagac tccttaaaaa cattgcgatc tttggttcaa 2340
ccgtttattt tacggcgctt aaaaacagat agagagatta tccaagactt acccgaaaaa 2400
caggaaaata cgatcttttg ttctctgtct acagaacaag caacgcttta tcaaaagatt 2460
gttgatcagt ctttagctga catagactca gccgcaggaa ttcaacgtcg agggatgatt 2520
ttagcgttgt tagtgaaatt aaaacaggtt tgtaatcatc ccattttatt gaatggaaaa 2580
gcgacaaaaa ctggaaagaa aaaggtcgag actcagggtt taagcctgca aagttcaggg 2640
aagttacaac gcttcaaaga aatgctggaa gaattgttgt cagaaggaga tcgcgccatt 2700
gtatttaccc agtttgcaga atggggaaaa gttttacaac cttatttaga acagcaatta 2760
aaccgagagg tattattttt gtatggcgca actcgtaaaa ataaacgaga agaaatgatt 2820
gatcgttttc aacaagatcc tcaagggcca ccgattttta ttctatcttt aaaagcggga 2880
ggtgtgggtt taaatttgac tcgtgctaat catgtttttc actttgatcg ttggtggaac 2940
cctgcggttg aaaatcaagc aacagatcgg gtgtttagaa ttggtcaaac gcgcaatgtt 3000
caggttcata agtttgtctg taccggaacg ttggaagaaa aaatccatga tttaattgaa 3060
agtaaaaaag tgttggctga acaagttgtg ggttcaggag aaaattggtt aactgaattg 3120
gatacggatc aactcagaaa cttactcatt attgaccgaa atgcggtgat tgatgaagaa 3180
gaataa 3186
<210> 42
<211> 1061
<212> PRT
<213> Lyngbya sp.
<400> 42
Met Ala Ile Leu His Gly Ser Trp Leu Gln His Pro Lys Asn Tyr Leu
1 5 10 15
Phe Ile Trp Gly Glu Thr Trp Arg Arg Ile Thr Pro Asn Glu Phe Asn
20 25 30
Pro Ala Asp Gly Val Leu Gly Tyr Pro Phe Ala Leu Ser Pro Val Glu
35 40 45
Leu Glu Lys Trp Cys Ser Glu Lys Gln Leu Ser Ile Glu Ser Lys Val
50 55 60
Val Val Thr Glu Thr Leu Ala Leu Pro Thr Lys Leu Ser Pro Lys Ile
65 70 75 80
Gly Leu Tyr Pro Leu Gln Ser Thr Pro Gln Thr Asp Ser Glu Thr Asp
85 90 95
Ser Glu Ser Ile Cys Leu Tyr Pro Trp Lys Ile Glu Gly Ile Cys Leu
100 105 110
Asn Ser Thr Glu Ala Phe Asp Phe Leu Gln Ser Leu Pro Leu Gly Asn
115 120 125
Leu Thr Thr Glu Asn Ser Phe Ile Gly Ser Asp Leu Gln Phe Trp Ser
130 135 140
His Leu Ser Arg Trp Ser Leu Asp Leu Leu Ala Arg Ser Lys Phe Leu
145 150 155 160
Pro Ser Leu Thr Phe Asn Pro Ser Lys Asp His Phe Ile Ala Glu Trp
165 170 175
Lys Pro Leu Leu Asp Ser Ala Thr Asp Gln Ala Arg Leu Ile Arg Phe
180 185 190
Ser Lys Gln Ile Pro Ser Ala Cys Arg Ile Tyr Gln Leu Trp Ser Lys
195 200 205
Glu Ala Gln Asn Gln Phe Glu Asn Leu Ala Leu Asp Leu Pro Gln Asn
210 215 220
Pro Gln Asn Leu Ile Asp Asp Phe Leu Thr Ala Ile Ile Asp Ser Gln
225 230 235 240
Val Lys Lys Val Ala Glu Glu Ser Glu Lys Lys Ala Ile Thr Asn Leu
245 250 255
Thr Ala Ile Gln Pro Ile Val Gln Ser Trp Leu His Ala Leu Ala Ser
260 265 270
Glu Ser Asn Leu Ala Lys Ser Lys Lys Ser Glu Ser Lys Thr Leu Glu
275 280 285
Lys Ile Leu Ser Asn Trp Thr Ala Pro Leu Gln Gln Thr Leu Ala Glu
290 295 300
His Asn Leu Phe Arg Thr Gly Phe Arg Leu Ser Pro Pro Glu Asn Asn
305 310 315 320
Gln Lys Asn Trp Thr Leu Asp Tyr Cys Leu Gln Ala Ile Asp Glu Pro
325 330 335
Glu Phe Leu Val Asp Ala Gln Thr Ile Trp Thr His Pro Val Glu Ala
340 345 350
Phe Val His Asn Gly Arg Met Ile Lys Arg Pro Gln Glu Thr Leu Leu
355 360 365
Lys Gly Leu Gly Leu Ala Ser Lys Leu Tyr Pro Leu Leu Glu Pro Ser
370 375 380
Leu Gln Glu Ala Arg Pro Gln Thr Cys Leu Leu Thr Pro Leu Gln Ala
385 390 395 400
Tyr Glu Phe Ile Lys Ser Ile Asn Trp Arg Phe Thr Asp Ser Gly Leu
405 410 415
Gly Val Ile Leu Pro Pro Ser Leu Val Ser Gln Asn Gly Trp Ala Asn
420 425 430
Arg Leu Gly Leu Ser Val Gln Ala Ala Thr Ser Lys Ser Lys Gln Asn
435 440 445
Val Ser Leu Gly Leu Asp Ser Leu Leu Asn Phe Lys Trp Glu Leu Ser
450 455 460
Ile Gly Gly Gln Thr Leu Ser Lys Thr Glu Phe Asn Arg Leu Val Ala
465 470 475 480
Gln Glu Ser Pro Leu Val Glu Ile Asn Gly Glu Trp Val Glu Leu Arg
485 490 495
Pro Thr Asp Ile Lys Ala Ala Lys Ala Phe Phe Ser Ser Arg Lys Asp
500 505 510
Gln Leu Ser Leu Thr Leu Glu Asp Ala Leu Arg Leu Ser Thr Gly Asp
515 520 525
Ser Gln Met Val Glu Lys Leu Pro Ile Val Asn Phe Glu Ala Gly Gly
530 535 540
Lys Leu Glu Glu Leu Leu Asn Thr Leu Thr Asn Asn Arg Ser Leu Asp
545 550 555 560
Glu Ile Lys Thr Pro Ser Asn Phe Gln Gly Glu Leu Arg Pro Tyr Gln
565 570 575
Ala Arg Gly Val Ser Trp Leu Ala Phe Leu Glu Glu Trp Gly Leu Gly
580 585 590
Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Glu Leu Ile
595 600 605
Ala Phe Leu Leu Tyr Leu Gln Glu Lys Glu Thr Leu Asp Ala Pro Val
610 615 620
Leu Leu Val Cys Pro Thr Ser Val Leu Gly Asn Trp Glu Arg Glu Val
625 630 635 640
Lys Arg Phe Ser Pro Ser Leu Lys Val Thr Val His His Gly Asp Lys
645 650 655
Arg Gln Lys Gly Lys Asn Phe Ala Gln Phe Ala Gln Lys Tyr Asn Leu
660 665 670
Ile Ile Thr Ser Tyr Pro Leu Thr Phe Arg Asp Glu Lys Glu Leu Lys
675 680 685
Thr Val Asn Trp Lys Gly Leu Val Leu Asp Glu Ala Gln Asn Ile Lys
690 695 700
Asn Pro Glu Ala Lys Gln Ser Lys Thr Val Arg Asn Leu Gln Ala Ser
705 710 715 720
Phe Lys Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Ser Glu
725 730 735
Leu Trp Ser Ile Met Asp Phe Leu Asn Pro Gly Tyr Leu Gly Gln Arg
740 745 750
Gln Phe Phe Gln Arg Arg Phe Ala Ile Pro Ile Glu Lys Tyr Gly Asp
755 760 765
Thr Asp Ser Leu Lys Thr Leu Arg Ser Leu Val Gln Pro Phe Ile Leu
770 775 780
Arg Arg Leu Lys Thr Asp Arg Glu Ile Ile Gln Asp Leu Pro Glu Lys
785 790 795 800
Gln Glu Asn Thr Ile Phe Cys Ser Leu Ser Thr Glu Gln Ala Thr Leu
805 810 815
Tyr Gln Lys Ile Val Asp Gln Ser Leu Ala Asp Ile Asp Ser Ala Ala
820 825 830
Gly Ile Gln Arg Arg Gly Met Ile Leu Ala Leu Leu Val Lys Leu Lys
835 840 845
Gln Val Cys Asn His Pro Ile Leu Leu Asn Gly Lys Ala Thr Lys Thr
850 855 860
Gly Lys Lys Lys Val Glu Thr Gln Gly Leu Ser Leu Gln Ser Ser Gly
865 870 875 880
Lys Leu Gln Arg Phe Lys Glu Met Leu Glu Glu Leu Leu Ser Glu Gly
885 890 895
Asp Arg Ala Ile Val Phe Thr Gln Phe Ala Glu Trp Gly Lys Val Leu
900 905 910
Gln Pro Tyr Leu Glu Gln Gln Leu Asn Arg Glu Val Leu Phe Leu Tyr
915 920 925
Gly Ala Thr Arg Lys Asn Lys Arg Glu Glu Met Ile Asp Arg Phe Gln
930 935 940
Gln Asp Pro Gln Gly Pro Pro Ile Phe Ile Leu Ser Leu Lys Ala Gly
945 950 955 960
Gly Val Gly Leu Asn Leu Thr Arg Ala Asn His Val Phe His Phe Asp
965 970 975
Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Val Phe
980 985 990
Arg Ile Gly Gln Thr Arg Asn Val Gln Val His Lys Phe Val Cys Thr
995 1000 1005
Gly Thr Leu Glu Glu Lys Ile His Asp Leu Ile Glu Ser Lys Lys
1010 1015 1020
Val Leu Ala Glu Gln Val Val Gly Ser Gly Glu Asn Trp Leu Thr
1025 1030 1035
Glu Leu Asp Thr Asp Gln Leu Arg Asn Leu Leu Ile Ile Asp Arg
1040 1045 1050
Asn Ala Val Ile Asp Glu Glu Glu
1055 1060
<210> 43
<211> 3237
<212> DNA
<213> Methanosarcina acetivorans
<400> 43
atgataattt tgcatgcagg aagagtcgga aaacagttct ttctgtgggg cgaaagcccg 60
gctgaaaatg aaactccgcc tgtccggcgc gggagaaagc ctaagaagcc ggttgcaaaa 120
ccttatcctt acgattcggg tgttgaaaac ctgtcttctg ctcttgagct gctgctgggc 180
agtactggcc ggaaaaaggc agaggaaatc aatgtctgga tcccgacagc aggctggaat 240
ccaatcccct ccagtcctct cgttgctgaa attccggctt cgaaagcaga actttcccta 300
gctccctgga ctgttcacgc atatcctctg gaagctgaag aagctattgt tctcctctgc 360
gcctgtatgg gaaaaaaggt tcttgctccc ggcataatct cgggaaatga tcttctctgg 420
tgggcggatg ccctgaaatt tgcaggctcg ctggtagcag gacagaaata cctgcctggc 480
gtcaggggcg gggaaggaga gtacaaggct ttctgggaac ccgtattttc cggagaagat 540
gcgggggagc tggcaagact tgcaaagcaa atgcctccgg ctgcaaaggc tcttgctctt 600
gaaacctctt ccgtgcagcc ggaaatactt gctgctgtag cggcaaggca gtttatcgaa 660
gaggctcttg actggatagt ccggtccgag atcggggaaa aagagcttgc aaaagaggcg 720
cgtaaaagaa aatcctttga tagcgtccat gacgcctggg tttccgctct taaaagccct 780
gacgggttga tccacggaga agaaaaagaa ctcctgcagc ttgcgttccg gacccgtgaa 840
tggcagcgcc cccttactgt acttacaact tctcccttca ggttctgttt ccggcttgaa 900
gagccagctg cggaagaaga actcgaagaa accgaggaat ccgaagccgg aaaaatggat 960
actaaaaaag gcaggaaagg gatagctgac atagaagttc ccgaagaact ctggtacgtc 1020
cgctatatgc ttcagtccta cgaagaccca agccttctga ttcctgtaaa agaggcctgg 1080
aaaccaaaga agggcagccc gttgaaaaga tatgatgtaa aaaacattcg ccaatttctg 1140
ttatcttccc ttggacaggc tgctggcatc agtgcaggaa ttgcttccag ccttgaagct 1200
cccaacccgt ccggatattc ccttgatacg aaagaagctt accgcttcct gactgaaagt 1260
gcagcggatt taagccaggc gggcttcggg ttacttctcc ccggctggtg gacccgtaaa 1320
ggtacaaaga cccacttaaa agcccaggct aatgttaagg gcaagaagtt gaaggccgga 1380
tacgggctta cactcgataa aatcgtcagc tttgactggg aaattgccct tggagaccgt 1440
gcactcacag tcagggaact gcaggctctt gcaaagctca aagctccgct tgtgaaattc 1500
cgcgggcagt gggtcgaggt caacgatgcg gaaatccggg ctgcccttga gttctggaag 1560
aaaaaccccc acggggaagc aagtctgcgc gaagttctaa aactggctgt gggagtctcc 1620
gaaaaagccg atggtgtaga cgttgaaggg cttaatgcag ccggctggat cgaagaatta 1680
atccgccgcc tgaaggacaa aaccgggttt gaagaacttc cggctcctga cggtttttca 1740
ggcaccctca ggccctacca gttcagaggt tactcctggc tggctttcct gaggcagtgg 1800
ggcataggag cctgccttgc agacgacatg gggcttggta aaaccatcca gacccttgcc 1860
cttatccagc acgacctgga acaggttaaa gggcaggttg aagaaaaggt tatagaaaat 1920
gctgaagaaa aagttgaagg acttaaagct gcaaaaccgg ttcttctggt ctgtccgacc 1980
tctgtcatca acaactggaa aaaagaggcg gctcgcttta ccccggaact ttcggtaatg 2040
gtccaccacg ggaccagccg gaaaaaggaa gaggaattca aaaaggaagc cacgaatcat 2100
tctattgtcg tctcaagcta cgggcttttg cagcgggatc ttaagttttt aaaaggggtt 2160
tcctgggccg gagtggtact tgacgaagcc cagaatatca aaaacccgga aaccaaacag 2220
gcaaaggcag ccagagctct tgaagccgat taccgcatag ctcttacggg gactccggtt 2280
gaaaacaacg tgggagacct ctggtctatc atggagtttt taaaccccgg cttcctaggc 2340
aaccaggcag gtttcaagcg gaatttcttt attcccattc aggccgaaag ggatcaggaa 2400
gctgcaagga ggttaaaaga aattacgggc ccctttatcc tgcgccgtct gaagaccgat 2460
acttcgatta tctccgacct gccggaaaag atggaaatga aaacctattg tacgctgaca 2520
aaagaacagg cttccctcta tgccgcagtc ctcgaagaca tcgaagagac gatggaagag 2580
gctgaagaag gcatccagag aaaaggtata atcctgtccg cccttaccag gctcaaacag 2640
gtctgcaacc atccggcgca gtttttgaag gataactctg ctgtacccgg caggtcagga 2700
aaacttgcaa ggcttaccga aatgctggat gtaatcctgg aaaatgggga aaaagccctt 2760
gtgttcaccc agtttgcgga gatgggaaaa atgctaaaag aacacctgca ggcaagtttt 2820
ggctgtgaag tccttttcct gcacggcggg gtccccagaa agcagaggga tcggatgctt 2880
gagcgtttcc aggagggaaa agaatacctc cctatctttg tcctctccct taaagctgga 2940
ggcacggggc ttaaccttac aggagcgaac cacgttttcc attttgaccg ctggtggaac 3000
cctgctgttg aaaaccaggc tacggacagg gctttccgta taggccagac gaaaaatgta 3060
gaggtgcata agttcatctg tgcgggtacg cttgaagaaa aaatcgatga gattatcgag 3120
cgcaaagtgc aggttgcaga gaacgttgtc ggaacaggtg aaggttggct gacagaactt 3180
tccaacgagg aattgaagga tattcttgct ctccgagaag aagcggtagg tgaataa 3237
<210> 44
<211> 1078
<212> PRT
<213> Methanosarcina acetivorans
<400> 44
Met Ile Ile Leu His Ala Gly Arg Val Gly Lys Gln Phe Phe Leu Trp
1 5 10 15
Gly Glu Ser Pro Ala Glu Asn Glu Thr Pro Pro Val Arg Arg Gly Arg
20 25 30
Lys Pro Lys Lys Pro Val Ala Lys Pro Tyr Pro Tyr Asp Ser Gly Val
35 40 45
Glu Asn Leu Ser Ser Ala Leu Glu Leu Leu Leu Gly Ser Thr Gly Arg
50 55 60
Lys Lys Ala Glu Glu Ile Asn Val Trp Ile Pro Thr Ala Gly Trp Asn
65 70 75 80
Pro Ile Pro Ser Ser Pro Leu Val Ala Glu Ile Pro Ala Ser Lys Ala
85 90 95
Glu Leu Ser Leu Ala Pro Trp Thr Val His Ala Tyr Pro Leu Glu Ala
100 105 110
Glu Glu Ala Ile Val Leu Leu Cys Ala Cys Met Gly Lys Lys Val Leu
115 120 125
Ala Pro Gly Ile Ile Ser Gly Asn Asp Leu Leu Trp Trp Ala Asp Ala
130 135 140
Leu Lys Phe Ala Gly Ser Leu Val Ala Gly Gln Lys Tyr Leu Pro Gly
145 150 155 160
Val Arg Gly Gly Glu Gly Glu Tyr Lys Ala Phe Trp Glu Pro Val Phe
165 170 175
Ser Gly Glu Asp Ala Gly Glu Leu Ala Arg Leu Ala Lys Gln Met Pro
180 185 190
Pro Ala Ala Lys Ala Leu Ala Leu Glu Thr Ser Ser Val Gln Pro Glu
195 200 205
Ile Leu Ala Ala Val Ala Ala Arg Gln Phe Ile Glu Glu Ala Leu Asp
210 215 220
Trp Ile Val Arg Ser Glu Ile Gly Glu Lys Glu Leu Ala Lys Glu Ala
225 230 235 240
Arg Lys Arg Lys Ser Phe Asp Ser Val His Asp Ala Trp Val Ser Ala
245 250 255
Leu Lys Ser Pro Asp Gly Leu Ile His Gly Glu Glu Lys Glu Leu Leu
260 265 270
Gln Leu Ala Phe Arg Thr Arg Glu Trp Gln Arg Pro Leu Thr Val Leu
275 280 285
Thr Thr Ser Pro Phe Arg Phe Cys Phe Arg Leu Glu Glu Pro Ala Ala
290 295 300
Glu Glu Glu Leu Glu Glu Thr Glu Glu Ser Glu Ala Gly Lys Met Asp
305 310 315 320
Thr Lys Lys Gly Arg Lys Gly Ile Ala Asp Ile Glu Val Pro Glu Glu
325 330 335
Leu Trp Tyr Val Arg Tyr Met Leu Gln Ser Tyr Glu Asp Pro Ser Leu
340 345 350
Leu Ile Pro Val Lys Glu Ala Trp Lys Pro Lys Lys Gly Ser Pro Leu
355 360 365
Lys Arg Tyr Asp Val Lys Asn Ile Arg Gln Phe Leu Leu Ser Ser Leu
370 375 380
Gly Gln Ala Ala Gly Ile Ser Ala Gly Ile Ala Ser Ser Leu Glu Ala
385 390 395 400
Pro Asn Pro Ser Gly Tyr Ser Leu Asp Thr Lys Glu Ala Tyr Arg Phe
405 410 415
Leu Thr Glu Ser Ala Ala Asp Leu Ser Gln Ala Gly Phe Gly Leu Leu
420 425 430
Leu Pro Gly Trp Trp Thr Arg Lys Gly Thr Lys Thr His Leu Lys Ala
435 440 445
Gln Ala Asn Val Lys Gly Lys Lys Leu Lys Ala Gly Tyr Gly Leu Thr
450 455 460
Leu Asp Lys Ile Val Ser Phe Asp Trp Glu Ile Ala Leu Gly Asp Arg
465 470 475 480
Ala Leu Thr Val Arg Glu Leu Gln Ala Leu Ala Lys Leu Lys Ala Pro
485 490 495
Leu Val Lys Phe Arg Gly Gln Trp Val Glu Val Asn Asp Ala Glu Ile
500 505 510
Arg Ala Ala Leu Glu Phe Trp Lys Lys Asn Pro His Gly Glu Ala Ser
515 520 525
Leu Arg Glu Val Leu Lys Leu Ala Val Gly Val Ser Glu Lys Ala Asp
530 535 540
Gly Val Asp Val Glu Gly Leu Asn Ala Ala Gly Trp Ile Glu Glu Leu
545 550 555 560
Ile Arg Arg Leu Lys Asp Lys Thr Gly Phe Glu Glu Leu Pro Ala Pro
565 570 575
Asp Gly Phe Ser Gly Thr Leu Arg Pro Tyr Gln Phe Arg Gly Tyr Ser
580 585 590
Trp Leu Ala Phe Leu Arg Gln Trp Gly Ile Gly Ala Cys Leu Ala Asp
595 600 605
Asp Met Gly Leu Gly Lys Thr Ile Gln Thr Leu Ala Leu Ile Gln His
610 615 620
Asp Leu Glu Gln Val Lys Gly Gln Val Glu Glu Lys Val Ile Glu Asn
625 630 635 640
Ala Glu Glu Lys Val Glu Gly Leu Lys Ala Ala Lys Pro Val Leu Leu
645 650 655
Val Cys Pro Thr Ser Val Ile Asn Asn Trp Lys Lys Glu Ala Ala Arg
660 665 670
Phe Thr Pro Glu Leu Ser Val Met Val His His Gly Thr Ser Arg Lys
675 680 685
Lys Glu Glu Glu Phe Lys Lys Glu Ala Thr Asn His Ser Ile Val Val
690 695 700
Ser Ser Tyr Gly Leu Leu Gln Arg Asp Leu Lys Phe Leu Lys Gly Val
705 710 715 720
Ser Trp Ala Gly Val Val Leu Asp Glu Ala Gln Asn Ile Lys Asn Pro
725 730 735
Glu Thr Lys Gln Ala Lys Ala Ala Arg Ala Leu Glu Ala Asp Tyr Arg
740 745 750
Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Asn Val Gly Asp Leu Trp
755 760 765
Ser Ile Met Glu Phe Leu Asn Pro Gly Phe Leu Gly Asn Gln Ala Gly
770 775 780
Phe Lys Arg Asn Phe Phe Ile Pro Ile Gln Ala Glu Arg Asp Gln Glu
785 790 795 800
Ala Ala Arg Arg Leu Lys Glu Ile Thr Gly Pro Phe Ile Leu Arg Arg
805 810 815
Leu Lys Thr Asp Thr Ser Ile Ile Ser Asp Leu Pro Glu Lys Met Glu
820 825 830
Met Lys Thr Tyr Cys Thr Leu Thr Lys Glu Gln Ala Ser Leu Tyr Ala
835 840 845
Ala Val Leu Glu Asp Ile Glu Glu Thr Met Glu Glu Ala Glu Glu Gly
850 855 860
Ile Gln Arg Lys Gly Ile Ile Leu Ser Ala Leu Thr Arg Leu Lys Gln
865 870 875 880
Val Cys Asn His Pro Ala Gln Phe Leu Lys Asp Asn Ser Ala Val Pro
885 890 895
Gly Arg Ser Gly Lys Leu Ala Arg Leu Thr Glu Met Leu Asp Val Ile
900 905 910
Leu Glu Asn Gly Glu Lys Ala Leu Val Phe Thr Gln Phe Ala Glu Met
915 920 925
Gly Lys Met Leu Lys Glu His Leu Gln Ala Ser Phe Gly Cys Glu Val
930 935 940
Leu Phe Leu His Gly Gly Val Pro Arg Lys Gln Arg Asp Arg Met Leu
945 950 955 960
Glu Arg Phe Gln Glu Gly Lys Glu Tyr Leu Pro Ile Phe Val Leu Ser
965 970 975
Leu Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Gly Ala Asn His Val
980 985 990
Phe His Phe Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr
995 1000 1005
Asp Arg Ala Phe Arg Ile Gly Gln Thr Lys Asn Val Glu Val His
1010 1015 1020
Lys Phe Ile Cys Ala Gly Thr Leu Glu Glu Lys Ile Asp Glu Ile
1025 1030 1035
Ile Glu Arg Lys Val Gln Val Ala Glu Asn Val Val Gly Thr Gly
1040 1045 1050
Glu Gly Trp Leu Thr Glu Leu Ser Asn Glu Glu Leu Lys Asp Ile
1055 1060 1065
Leu Ala Leu Arg Glu Glu Ala Val Gly Glu
1070 1075
<210> 45
<211> 3147
<212> DNA
<213> Methanospirillum hungatei
<400> 45
gtgaccgcga aacgaccagc accaatccac gataaagaag aagagaccat acccgatact 60
tcgcttccgg tctttcatgc cctgatttac ccggccgttg aaggggtagc gatatgtgcc 120
gaatatataa ctgataaacc tgcaccggtc aggaaaaaag gctacgcaaa ggataaacct 180
ggcgaatatc catattccct ggatcatacc gcccttaaaa cgctcataga gaactgtttt 240
ggagcatatg atgacctgaa ggctaccaga tggattatct atctccccgc tgaagaaacg 300
gttcctcctt cctctcagtt ctcatcaaaa aagaagccat caccaaagga gaaaaaactc 360
ccccttgttc cgatgtatat ccccgttctt ctctgcccgt atgaaacctt ttttcaaatc 420
tggaaagccg ctcagaatac agataaaaat tatattgctg gcgattcctt ccagtacatc 480
tccattctga tggagagtac cgtccggctc atacaaaacg gacggttcaa accatctcta 540
gaacggacct ttgccggata tcatgccgta tgggtacctg ccctttctcc tcaggatatg 600
gaatgggtat cagatttttc aagccggatg ccaacggtct gcaagtacgc tatcccccgg 660
gtcgcaaaag atccctacat ttataaacct gagaccagat tagagaaatt catcgttgag 720
atgatgcggg tgatcatccg tactgccctt ggtggttata cactgaaaga agagacagat 780
cccttttatg aaccctcaga aaacgagatg cagttcatga ctgaccttct cggggtaacc 840
gacccaataa ggaacaaagg atttgagaga actttcttac gggcgatgca ggactggctg 900
accttctcaa gttcaggacg gtttgctccc tttgagttct gcatgatcat aaaagatcca 960
ccagaaggac agacagaacc atgggatttc actctcgcgg tcagatcaga ggcagaacca 1020
tctcttctca tcccggcaga aataatctgg gaattgcctg atcaccagag cgggctcttc 1080
ccccaggcag cctatctcaa acatatcctc cttgctggta tcgggctctt gacctcatca 1140
tcatcggcat tatggcgtcc cctgtccgga tcgaaaccca ccgggggaag tatgaccctg 1200
aaagaggctg caacgttctt gggttcagac ctcgcaagag ccaggaggaa gggagtaacg 1260
gtgctcctgc cagactggtg gactgatacg acctatacac cacgggttga aatccatgca 1320
aggcggcggg atcccaccca tacgcagaca cggataggac tgcaggaact cctttctttt 1380
gattaccgga ttgcaatcgg tgatgagtca ttttcaccgg atgagttctg ggaaaaggta 1440
aaagaaaagg ctccctttat ctggctgggg aaccggtgga tatcctttca tccggatgcg 1500
atacaacatg ccctggattc tttcagcagg catcagagca aaggagggga tacaatagga 1560
gatctgctcc ggctctccct gaaaaaaatg gaggattccg cggtaccggt atcgattcat 1620
gcaaaagatg actgggttgc ggatcttctg gattttttca ggaccgaaac aaatcaggca 1680
gttccagtcc caaagaaatt taaagggata ctcaggccat accaggaaga ggggttctcc 1740
ttcctttgtc aatgtaccag aaggggcttt ggagcctgcc ttgcagatga catggggctt 1800
ggaaaaactc cccagacact tgcatggctg gtctatctca aggagaaaga aaaacccacg 1860
actccgtccc tccttatatg cccgatgtcg gttgttggga actgggagcg ggagatacag 1920
cggtttgcgc catcactccg ttcatgggtg catcatggga ctgaccgatg caaaggcgat 1980
gattttgtga gacatgtcgg ttcatatgac ctggtcctga ccacctatca tctggcagca 2040
cgggacgtag accacctcaa aaccgttccc tggtctgcaa tcattcttga cgaggcacaa 2100
aatatcaaga acctccatgc aaaccagacc gtagcagtca aatctctcac cggtgagaga 2160
cgggttgctc tgaccggaac cccggtggag aaccggttac tcgaactctg gtctatcatg 2220
gactttttaa atccaggata ccttggttca cagagtgcat ttacaaaccg ctattcccgc 2280
ccgattgagc aggaaaaaaa tacggaactg atacaggaat taaggtccct catccgtccg 2340
ttcctgctca ggcggatgaa aacagacaag catgttatcg atgatcttcc ggaaaagatg 2400
gagaaccggg tatattgcac cctcacaccc gaacaggcaa ccttatatca ggctgttgtg 2460
cttgatatgg caaagaacct tgataaagtg gagggtattg ccaggaaagg ggcaatcctt 2520
gctgcgatca cacgactgaa acagatctgt aaccatccgg gacgtgttgg cagggataaa 2580
acaataaagg ctgagcggtc cgggaaggtg agccggctgc ttgagatgat tgaggagatc 2640
acttccgaag gggactcagc actcatattc agtcagtatg caacatttgc tgaggaactg 2700
gcagggatga tagagaaaca gggagatacg cccgttcttc tcctgaccgg gtcaacacca 2760
cggaaaaaac gggaacagat gatagaggag tttcaggcct caaccacccc gataatcttt 2820
gttatttctc tgaaagccgg gggaacgggt ctgaacctga cgaaagcgac tcatgtgttt 2880
catgtagacc ggtggtggaa tccggcggtt gaagaccagg ctactgaccg gacgtaccgg 2940
atcggacaaa agagaaatgt ccaagttcac ctgatgataa ccgccggaac cctggaggaa 3000
cggatagatc tgataaacca ggagaaacgg acgcttgcaa aggaagtcct tgcacagagt 3060
gatgagtatc tgacaaatct ctcaacaaaa gaacttctgg agattgtatc acttcgtgac 3120
agtctctttc gcggggagga tgcatga 3147
<210> 46
<211> 1048
<212> PRT
<213> Methanospirillum hungatei
<400> 46
Val Thr Ala Lys Arg Pro Ala Pro Ile His Asp Lys Glu Glu Glu Thr
1 5 10 15
Ile Pro Asp Thr Ser Leu Pro Val Phe His Ala Leu Ile Tyr Pro Ala
20 25 30
Val Glu Gly Val Ala Ile Cys Ala Glu Tyr Ile Thr Asp Lys Pro Ala
35 40 45
Pro Val Arg Lys Lys Gly Tyr Ala Lys Asp Lys Pro Gly Glu Tyr Pro
50 55 60
Tyr Ser Leu Asp His Thr Ala Leu Lys Thr Leu Ile Glu Asn Cys Phe
65 70 75 80
Gly Ala Tyr Asp Asp Leu Lys Ala Thr Arg Trp Ile Ile Tyr Leu Pro
85 90 95
Ala Glu Glu Thr Val Pro Pro Ser Ser Gln Phe Ser Ser Lys Lys Lys
100 105 110
Pro Ser Pro Lys Glu Lys Lys Leu Pro Leu Val Pro Met Tyr Ile Pro
115 120 125
Val Leu Leu Cys Pro Tyr Glu Thr Phe Phe Gln Ile Trp Lys Ala Ala
130 135 140
Gln Asn Thr Asp Lys Asn Tyr Ile Ala Gly Asp Ser Phe Gln Tyr Ile
145 150 155 160
Ser Ile Leu Met Glu Ser Thr Val Arg Leu Ile Gln Asn Gly Arg Phe
165 170 175
Lys Pro Ser Leu Glu Arg Thr Phe Ala Gly Tyr His Ala Val Trp Val
180 185 190
Pro Ala Leu Ser Pro Gln Asp Met Glu Trp Val Ser Asp Phe Ser Ser
195 200 205
Arg Met Pro Thr Val Cys Lys Tyr Ala Ile Pro Arg Val Ala Lys Asp
210 215 220
Pro Tyr Ile Tyr Lys Pro Glu Thr Arg Leu Glu Lys Phe Ile Val Glu
225 230 235 240
Met Met Arg Val Ile Ile Arg Thr Ala Leu Gly Gly Tyr Thr Leu Lys
245 250 255
Glu Glu Thr Asp Pro Phe Tyr Glu Pro Ser Glu Asn Glu Met Gln Phe
260 265 270
Met Thr Asp Leu Leu Gly Val Thr Asp Pro Ile Arg Asn Lys Gly Phe
275 280 285
Glu Arg Thr Phe Leu Arg Ala Met Gln Asp Trp Leu Thr Phe Ser Ser
290 295 300
Ser Gly Arg Phe Ala Pro Phe Glu Phe Cys Met Ile Ile Lys Asp Pro
305 310 315 320
Pro Glu Gly Gln Thr Glu Pro Trp Asp Phe Thr Leu Ala Val Arg Ser
325 330 335
Glu Ala Glu Pro Ser Leu Leu Ile Pro Ala Glu Ile Ile Trp Glu Leu
340 345 350
Pro Asp His Gln Ser Gly Leu Phe Pro Gln Ala Ala Tyr Leu Lys His
355 360 365
Ile Leu Leu Ala Gly Ile Gly Leu Leu Thr Ser Ser Ser Ser Ala Leu
370 375 380
Trp Arg Pro Leu Ser Gly Ser Lys Pro Thr Gly Gly Ser Met Thr Leu
385 390 395 400
Lys Glu Ala Ala Thr Phe Leu Gly Ser Asp Leu Ala Arg Ala Arg Arg
405 410 415
Lys Gly Val Thr Val Leu Leu Pro Asp Trp Trp Thr Asp Thr Thr Tyr
420 425 430
Thr Pro Arg Val Glu Ile His Ala Arg Arg Arg Asp Pro Thr His Thr
435 440 445
Gln Thr Arg Ile Gly Leu Gln Glu Leu Leu Ser Phe Asp Tyr Arg Ile
450 455 460
Ala Ile Gly Asp Glu Ser Phe Ser Pro Asp Glu Phe Trp Glu Lys Val
465 470 475 480
Lys Glu Lys Ala Pro Phe Ile Trp Leu Gly Asn Arg Trp Ile Ser Phe
485 490 495
His Pro Asp Ala Ile Gln His Ala Leu Asp Ser Phe Ser Arg His Gln
500 505 510
Ser Lys Gly Gly Asp Thr Ile Gly Asp Leu Leu Arg Leu Ser Leu Lys
515 520 525
Lys Met Glu Asp Ser Ala Val Pro Val Ser Ile His Ala Lys Asp Asp
530 535 540
Trp Val Ala Asp Leu Leu Asp Phe Phe Arg Thr Glu Thr Asn Gln Ala
545 550 555 560
Val Pro Val Pro Lys Lys Phe Lys Gly Ile Leu Arg Pro Tyr Gln Glu
565 570 575
Glu Gly Phe Ser Phe Leu Cys Gln Cys Thr Arg Arg Gly Phe Gly Ala
580 585 590
Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Pro Gln Thr Leu Ala
595 600 605
Trp Leu Val Tyr Leu Lys Glu Lys Glu Lys Pro Thr Thr Pro Ser Leu
610 615 620
Leu Ile Cys Pro Met Ser Val Val Gly Asn Trp Glu Arg Glu Ile Gln
625 630 635 640
Arg Phe Ala Pro Ser Leu Arg Ser Trp Val His His Gly Thr Asp Arg
645 650 655
Cys Lys Gly Asp Asp Phe Val Arg His Val Gly Ser Tyr Asp Leu Val
660 665 670
Leu Thr Thr Tyr His Leu Ala Ala Arg Asp Val Asp His Leu Lys Thr
675 680 685
Val Pro Trp Ser Ala Ile Ile Leu Asp Glu Ala Gln Asn Ile Lys Asn
690 695 700
Leu His Ala Asn Gln Thr Val Ala Val Lys Ser Leu Thr Gly Glu Arg
705 710 715 720
Arg Val Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Leu Glu Leu
725 730 735
Trp Ser Ile Met Asp Phe Leu Asn Pro Gly Tyr Leu Gly Ser Gln Ser
740 745 750
Ala Phe Thr Asn Arg Tyr Ser Arg Pro Ile Glu Gln Glu Lys Asn Thr
755 760 765
Glu Leu Ile Gln Glu Leu Arg Ser Leu Ile Arg Pro Phe Leu Leu Arg
770 775 780
Arg Met Lys Thr Asp Lys His Val Ile Asp Asp Leu Pro Glu Lys Met
785 790 795 800
Glu Asn Arg Val Tyr Cys Thr Leu Thr Pro Glu Gln Ala Thr Leu Tyr
805 810 815
Gln Ala Val Val Leu Asp Met Ala Lys Asn Leu Asp Lys Val Glu Gly
820 825 830
Ile Ala Arg Lys Gly Ala Ile Leu Ala Ala Ile Thr Arg Leu Lys Gln
835 840 845
Ile Cys Asn His Pro Gly Arg Val Gly Arg Asp Lys Thr Ile Lys Ala
850 855 860
Glu Arg Ser Gly Lys Val Ser Arg Leu Leu Glu Met Ile Glu Glu Ile
865 870 875 880
Thr Ser Glu Gly Asp Ser Ala Leu Ile Phe Ser Gln Tyr Ala Thr Phe
885 890 895
Ala Glu Glu Leu Ala Gly Met Ile Glu Lys Gln Gly Asp Thr Pro Val
900 905 910
Leu Leu Leu Thr Gly Ser Thr Pro Arg Lys Lys Arg Glu Gln Met Ile
915 920 925
Glu Glu Phe Gln Ala Ser Thr Thr Pro Ile Ile Phe Val Ile Ser Leu
930 935 940
Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Lys Ala Thr His Val Phe
945 950 955 960
His Val Asp Arg Trp Trp Asn Pro Ala Val Glu Asp Gln Ala Thr Asp
965 970 975
Arg Thr Tyr Arg Ile Gly Gln Lys Arg Asn Val Gln Val His Leu Met
980 985 990
Ile Thr Ala Gly Thr Leu Glu Glu Arg Ile Asp Leu Ile Asn Gln Glu
995 1000 1005
Lys Arg Thr Leu Ala Lys Glu Val Leu Ala Gln Ser Asp Glu Tyr
1010 1015 1020
Leu Thr Asn Leu Ser Thr Lys Glu Leu Leu Glu Ile Val Ser Leu
1025 1030 1035
Arg Asp Ser Leu Phe Arg Gly Glu Asp Ala
1040 1045
<210> 47
<211> 3270
<212> DNA
<213> Methanosarcina mazei
<400> 47
atgataattc ttcatgcagg aagagttgga aaacagttct tcttatgggg tgaaagcccg 60
gcagaaaatg aaactccggt tgttcggcgc gggagaaagc ctaaaacccc tatcgtaaaa 120
ccttaccctt acgattcggg ctttgaaaac ctgtcttctg cccttgagct gctgctgggc 180
agtactgacc ggaaaaaggc ggagaaaatc aacgtctgga ccccaactat cggagggaat 240
cctgtccctt ccagccctct tgttgctgaa atttcggatt cgaaagcaga acctgcactg 300
gctccctgta ctgttcacgc atatcctctg gaagctgaag aagctattgt tctcctctgc 360
acctgtatgg aaaaaaaggt tctggctccc ggtatcatct cgggaaatga ccttctctgg 420
tgggcagatg ccctgaaatt tgcaggctcg ctggtagcag ggcagaaata tttgcctggc 480
gtcaggggcg gggaaggaga gtacagggct ttctgggaac ccgtattttc cggcgaagat 540
gccggaaagc tggcaaaact tgcaaagcaa atgcctcctg ctgcaagggc tcttgctcct 600
gaagcctctt ccatgccgcc ggaaatgcct gctgctttag cggcaaagca gtttattgaa 660
gactctctcg actggatagt ccggtccgag atcggggaaa aaaagcttgc aaaagagacg 720
cgcaaaagaa aatcctttga tagcgtccat gatgcctggg tttctgctct tagaagccct 780
gaagggctga tctatggaga cgaaaacgaa cttctgcagc ttgcggcccg gacccgcgaa 840
tggcagcgcc cactcaccat ccttaccact tctcctttca ggttctgttt ccgtcttgaa 900
gaaccggctt tagaagaaga gatcgaagaa actgaagaaa ccgaagaaat agaagaaaat 960
gaagccggga aaagagatac taaaaaaggc agggaaggga tagctgatat agaagttccc 1020
gaagggctct ggtacgtccg ttatatgctt cagtcctacg aagacccgag ccttctgatc 1080
cctgtaaaag aagcctggaa gccaaaaaaa ggcagcccgt tgaaaaaata cgatgtgaaa 1140
aacattcgcc aattcctgtt atcttccctt ggacaggctt ccagtataag tgcaggaatt 1200
gcttcgagtc ttgaagctcc caacccatct ggatattccc ttgatactaa agaggcttac 1260
cgctttctga ctgaaagtgc agcgaattta agtcaggccg gtttcggggt acttctccct 1320
ggctggtgga cccgtaaagg tacaaagaca cacttaaaag cccaggctaa tgttaagggc 1380
aagaagaagt tgcaggccgg atacgggctt acactcgatg aaatcgtcag ctttgactgg 1440
gaaatcgccc ttggagacag ggtactgaca gtcagagaac tgcaggctct tgcaaagctt 1500
aaagctccgc ttgtgaaatt ccgcgggcag tgggttgagg taaacgatgc ggaaatcagg 1560
gctgcccttg agttctggaa gaaaaatccc aacggtgaag caagtctgcg tgaagttcta 1620
aaactggcag tgggagtttc cgaaaaagcc gatggtgtga acgttgaagg gctcaatgca 1680
accggatgga ttggagaatt aatcagccgc ttaaaagaca aaaccgggtt tgaagaactt 1740
cctgctccca acggcttttc aggcaccctt cggccatatc agttcagagg ttactcctgg 1800
ctggcttttc tgaggcagtg gggtatagga gcctgccttg cagacgatat ggggcttggt 1860
aaaaccgtcc agactcttgc tcttattcag cacgatctgg aacaggctaa agagaaagct 1920
gaagaaaaga ttgaagaacc ggctgaagaa aagattgaag aaaaagttga cggacgtaag 1980
gccccaaaac ctgttcttct ggtttgtcct acctctgtta tcaacaactg gaaaaaagag 2040
gcttcccgct ttacgccaga actttcggta atggtccacc acgggaccag ccggaaaaag 2100
gaagaggaat tcaagaagga agccatgaat catgctattg tcatctcaag ctatggcctt 2160
gtgcagcggg atcttaaatt tttaaaagag gttcattggg caggagttgt acttgacgaa 2220
gcccagaaca tcaaaaaccc ggaaaccaaa caggcaaagg cagccagggc tcttgaatcc 2280
gattaccgct tagctcttac agggactccg gttgaaaata acgtgggaga cctctggtcc 2340
ataatggagt ttttaaaccc cggcttcctc ggaagtcagg cgggtttcaa gcggaatttc 2400
tttatcccca ttcaggcaga aagggatcag gaggctgcaa ggaggctgaa agaaattaca 2460
ggtcccttca tccttcgccg tttgaagact gacacttcga ttatctccga cctgccggaa 2520
aaaatggaga tgaagaccta ttgtacgctg acaaaagaac aggcctccct ctatgctgca 2580
gtccttgaag acatcagaga agcgattgaa ggagccgaag aaggcatcca gaggaaaggt 2640
ataatcctgt ctgccctttc caggctcaag caggtctgca accaccctgc gcagtttttg 2700
aaggacaact ccactatccc cggcaggtcc ggaaaactcg caaggcttac cgaaatgctg 2760
gatgtagtcc tggaaaacgg ggaaaaagcc cttgttttta cccagtttgc ggagatgggc 2820
aaaatggtga aagaacacct gcaagcaagc tttggctgtg aagtcctttt cctgcacggc 2880
ggggtcccca ggaagcagag agaccggatg cttgagaggt tccaggaagg aaaagaatac 2940
ctccctattt ttgtcctctc ccttaaagcc ggcggcacgg ggcttaacct cacaggggca 3000
aaccacgttt tccactttga tcgctggtgg aacccggctg ttgaaaacca ggctacagac 3060
agggcattcc gtataggcca gaagaaaaac gttgaggtcc ataaattcat ctgcgcaggt 3120
acgcttgaag aaaaaatcga tgagattatc gaacgcaaag tgcaggtcgc agagaacgtt 3180
gttgggacag gtgaagactg gctgacagag ctttccaacg atgaactgaa ggatattctt 3240
gctcttagag aagaagcggt aggtgaataa 3270
<210> 48
<211> 1089
<212> PRT
<213> Methanosarcina mazei
<400> 48
Met Ile Ile Leu His Ala Gly Arg Val Gly Lys Gln Phe Phe Leu Trp
1 5 10 15
Gly Glu Ser Pro Ala Glu Asn Glu Thr Pro Val Val Arg Arg Gly Arg
20 25 30
Lys Pro Lys Thr Pro Ile Val Lys Pro Tyr Pro Tyr Asp Ser Gly Phe
35 40 45
Glu Asn Leu Ser Ser Ala Leu Glu Leu Leu Leu Gly Ser Thr Asp Arg
50 55 60
Lys Lys Ala Glu Lys Ile Asn Val Trp Thr Pro Thr Ile Gly Gly Asn
65 70 75 80
Pro Val Pro Ser Ser Pro Leu Val Ala Glu Ile Ser Asp Ser Lys Ala
85 90 95
Glu Pro Ala Leu Ala Pro Cys Thr Val His Ala Tyr Pro Leu Glu Ala
100 105 110
Glu Glu Ala Ile Val Leu Leu Cys Thr Cys Met Glu Lys Lys Val Leu
115 120 125
Ala Pro Gly Ile Ile Ser Gly Asn Asp Leu Leu Trp Trp Ala Asp Ala
130 135 140
Leu Lys Phe Ala Gly Ser Leu Val Ala Gly Gln Lys Tyr Leu Pro Gly
145 150 155 160
Val Arg Gly Gly Glu Gly Glu Tyr Arg Ala Phe Trp Glu Pro Val Phe
165 170 175
Ser Gly Glu Asp Ala Gly Lys Leu Ala Lys Leu Ala Lys Gln Met Pro
180 185 190
Pro Ala Ala Arg Ala Leu Ala Pro Glu Ala Ser Ser Met Pro Pro Glu
195 200 205
Met Pro Ala Ala Leu Ala Ala Lys Gln Phe Ile Glu Asp Ser Leu Asp
210 215 220
Trp Ile Val Arg Ser Glu Ile Gly Glu Lys Lys Leu Ala Lys Glu Thr
225 230 235 240
Arg Lys Arg Lys Ser Phe Asp Ser Val His Asp Ala Trp Val Ser Ala
245 250 255
Leu Arg Ser Pro Glu Gly Leu Ile Tyr Gly Asp Glu Asn Glu Leu Leu
260 265 270
Gln Leu Ala Ala Arg Thr Arg Glu Trp Gln Arg Pro Leu Thr Ile Leu
275 280 285
Thr Thr Ser Pro Phe Arg Phe Cys Phe Arg Leu Glu Glu Pro Ala Leu
290 295 300
Glu Glu Glu Ile Glu Glu Thr Glu Glu Thr Glu Glu Ile Glu Glu Asn
305 310 315 320
Glu Ala Gly Lys Arg Asp Thr Lys Lys Gly Arg Glu Gly Ile Ala Asp
325 330 335
Ile Glu Val Pro Glu Gly Leu Trp Tyr Val Arg Tyr Met Leu Gln Ser
340 345 350
Tyr Glu Asp Pro Ser Leu Leu Ile Pro Val Lys Glu Ala Trp Lys Pro
355 360 365
Lys Lys Gly Ser Pro Leu Lys Lys Tyr Asp Val Lys Asn Ile Arg Gln
370 375 380
Phe Leu Leu Ser Ser Leu Gly Gln Ala Ser Ser Ile Ser Ala Gly Ile
385 390 395 400
Ala Ser Ser Leu Glu Ala Pro Asn Pro Ser Gly Tyr Ser Leu Asp Thr
405 410 415
Lys Glu Ala Tyr Arg Phe Leu Thr Glu Ser Ala Ala Asn Leu Ser Gln
420 425 430
Ala Gly Phe Gly Val Leu Leu Pro Gly Trp Trp Thr Arg Lys Gly Thr
435 440 445
Lys Thr His Leu Lys Ala Gln Ala Asn Val Lys Gly Lys Lys Lys Leu
450 455 460
Gln Ala Gly Tyr Gly Leu Thr Leu Asp Glu Ile Val Ser Phe Asp Trp
465 470 475 480
Glu Ile Ala Leu Gly Asp Arg Val Leu Thr Val Arg Glu Leu Gln Ala
485 490 495
Leu Ala Lys Leu Lys Ala Pro Leu Val Lys Phe Arg Gly Gln Trp Val
500 505 510
Glu Val Asn Asp Ala Glu Ile Arg Ala Ala Leu Glu Phe Trp Lys Lys
515 520 525
Asn Pro Asn Gly Glu Ala Ser Leu Arg Glu Val Leu Lys Leu Ala Val
530 535 540
Gly Val Ser Glu Lys Ala Asp Gly Val Asn Val Glu Gly Leu Asn Ala
545 550 555 560
Thr Gly Trp Ile Gly Glu Leu Ile Ser Arg Leu Lys Asp Lys Thr Gly
565 570 575
Phe Glu Glu Leu Pro Ala Pro Asn Gly Phe Ser Gly Thr Leu Arg Pro
580 585 590
Tyr Gln Phe Arg Gly Tyr Ser Trp Leu Ala Phe Leu Arg Gln Trp Gly
595 600 605
Ile Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Val Gln
610 615 620
Thr Leu Ala Leu Ile Gln His Asp Leu Glu Gln Ala Lys Glu Lys Ala
625 630 635 640
Glu Glu Lys Ile Glu Glu Pro Ala Glu Glu Lys Ile Glu Glu Lys Val
645 650 655
Asp Gly Arg Lys Ala Pro Lys Pro Val Leu Leu Val Cys Pro Thr Ser
660 665 670
Val Ile Asn Asn Trp Lys Lys Glu Ala Ser Arg Phe Thr Pro Glu Leu
675 680 685
Ser Val Met Val His His Gly Thr Ser Arg Lys Lys Glu Glu Glu Phe
690 695 700
Lys Lys Glu Ala Met Asn His Ala Ile Val Ile Ser Ser Tyr Gly Leu
705 710 715 720
Val Gln Arg Asp Leu Lys Phe Leu Lys Glu Val His Trp Ala Gly Val
725 730 735
Val Leu Asp Glu Ala Gln Asn Ile Lys Asn Pro Glu Thr Lys Gln Ala
740 745 750
Lys Ala Ala Arg Ala Leu Glu Ser Asp Tyr Arg Leu Ala Leu Thr Gly
755 760 765
Thr Pro Val Glu Asn Asn Val Gly Asp Leu Trp Ser Ile Met Glu Phe
770 775 780
Leu Asn Pro Gly Phe Leu Gly Ser Gln Ala Gly Phe Lys Arg Asn Phe
785 790 795 800
Phe Ile Pro Ile Gln Ala Glu Arg Asp Gln Glu Ala Ala Arg Arg Leu
805 810 815
Lys Glu Ile Thr Gly Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Thr
820 825 830
Ser Ile Ile Ser Asp Leu Pro Glu Lys Met Glu Met Lys Thr Tyr Cys
835 840 845
Thr Leu Thr Lys Glu Gln Ala Ser Leu Tyr Ala Ala Val Leu Glu Asp
850 855 860
Ile Arg Glu Ala Ile Glu Gly Ala Glu Glu Gly Ile Gln Arg Lys Gly
865 870 875 880
Ile Ile Leu Ser Ala Leu Ser Arg Leu Lys Gln Val Cys Asn His Pro
885 890 895
Ala Gln Phe Leu Lys Asp Asn Ser Thr Ile Pro Gly Arg Ser Gly Lys
900 905 910
Leu Ala Arg Leu Thr Glu Met Leu Asp Val Val Leu Glu Asn Gly Glu
915 920 925
Lys Ala Leu Val Phe Thr Gln Phe Ala Glu Met Gly Lys Met Val Lys
930 935 940
Glu His Leu Gln Ala Ser Phe Gly Cys Glu Val Leu Phe Leu His Gly
945 950 955 960
Gly Val Pro Arg Lys Gln Arg Asp Arg Met Leu Glu Arg Phe Gln Glu
965 970 975
Gly Lys Glu Tyr Leu Pro Ile Phe Val Leu Ser Leu Lys Ala Gly Gly
980 985 990
Thr Gly Leu Asn Leu Thr Gly Ala Asn His Val Phe His Phe Asp Arg
995 1000 1005
Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Phe
1010 1015 1020
Arg Ile Gly Gln Lys Lys Asn Val Glu Val His Lys Phe Ile Cys
1025 1030 1035
Ala Gly Thr Leu Glu Glu Lys Ile Asp Glu Ile Ile Glu Arg Lys
1040 1045 1050
Val Gln Val Ala Glu Asn Val Val Gly Thr Gly Glu Asp Trp Leu
1055 1060 1065
Thr Glu Leu Ser Asn Asp Glu Leu Lys Asp Ile Leu Ala Leu Arg
1070 1075 1080
Glu Glu Ala Val Gly Glu
1085
<210> 49
<211> 3042
<212> DNA
<213> Mycobacterium bovis
<400> 49
atgctggttt tgcacggctt ctggtccaac tccggcggga tgcggctgtg ggcggaggac 60
tccgatctgc tggtgaagag cccgagtcag gcgctgcgct ccgcgcggcc acacccgttc 120
gcggcgcccg ctgacctgat cgccggcata catccgggca aacccgcaac cgccgttttg 180
ctgttgccgt cgttgcgatc ggcgccgctg gactcgccgg agctgatccg gctcgccccg 240
cgcccggccg cgcgaaccga tccgatgctg ttggcgtgga cggtaccggt ggtggacctg 300
gaccccaccg cggcgttggc cgccttcgac cagcccgccc ccgacgtccg ctacggcgcg 360
tccgtcgact acctggccga gctggccgtt ttcgcgcgcg agttggtcga gcgtggtcgc 420
gtgctgcccc agctgcgccg cgacacccac ggcgcggccg cctgctggcg tccggtgttg 480
cagggacgcg acgtggtcgc gatgacctcg ctggtctcgg cgatgccgcc ggtctgccgc 540
gccgaagttg gtgggcacga cccgcacgaa ctggcaacct cggctctgga cgcgatggtc 600
gacgccgccg tgcgcgcggc gctgtcaccg atggacctgc tgcccccgcg acggggtcgc 660
tccaaacggc atcgggccgt ggaggcttgg ctgaccgcgt tgacctgccc ggacggccgg 720
ttcgacgcgg agcccgacga actcgacgcg ctggccgagg cgttgcggcc atgggacgac 780
gtcggtatcg gcaccgtcgg cccggcgcgg gcgacgtttc ggctgtccga agtcgagacc 840
gaaaacgagg agacgcccgc gggctcgttg tggaggctgg agttcttatt gcagtcgacg 900
caggacccca gcctgctggt ccccgccgag caggcatgga acgacgacgg cagcctgcgc 960
cgctggctgg accggccgca ggagctgctg ctgaccgaac tgggccgggc ctctcggatt 1020
ttccccgagc tcgtcccggc gctgcgcacc gcgtgcccgt ccgggcttga gctcgacgcc 1080
gacggcgcct accgattcct gtcgggtacg gccgcggtgc tcgacgaggc tgggtttggc 1140
gtgctgctgc cgtcctggtg ggaccgccgc cgcaagctgg gcttggtcct gtccgcatat 1200
accccggtcg acggcgtggt gggcaaggcc agcaagttcg gccgcgagca gctcgtcgag 1260
ttccgctggg agctggccgt gggcgacgat ccgctcagcg aggaggagat cgcggcgctg 1320
accgaaacca agtccccgct gatccggctg cgtggccagt gggtggcgct cgataccgaa 1380
cagctgcgcc gcgggctgga gtttttggag cgtaagccaa ccggccgcaa gaccaccgcc 1440
gagatcctcg cgctggccgc cagccacccc gacgacgtgg acaccccgct cgaggtcacc 1500
gccgtacgcg ccgacggctg gctcggggac ctgctcgccg gggccgccgc ggcgtcgctg 1560
cagccgttgg acccgcccga cggattcacc gcgacgctgc gtccctacca gcagcgcggt 1620
ctggcgtggc tggcgttttt gtcctcgctc ggtttgggca gctgcctggc cgacgacatg 1680
ggcctgggca agacggtgca gctattggcc ctggaaacct tggaatccgt tcagcgccac 1740
caggatcgcg gcgtcggacc cacactgcta ctgtgcccga tgtcgttggt gggcaactgg 1800
cagcaggaag cggccaggtt tgcacccaac ctgcgggtgt acgcccacca cgggggcgcc 1860
cggctgcacg gcgaggcgtt gcgcgaccac ctcgagcgca ccgacctggt cgtgagcacc 1920
tataccaccg ccacccgcga catcgacgag ctgtcggaat acgaatggaa ccgggtggtg 1980
ctggacgagg cccaggcggt gaagaacagc ctgtcccggg cggccaaggc ggtgcgacgg 2040
ctacgcgcgg cgcaccgggt cgcgctgacc gggacaccga tggagaaccg gctcgccgag 2100
ctgtggtcga tcatggactt cctcaacccg ggcctgctcg gatcctccga acgcttccgc 2160
acccgctacg cgatcccgat cgagcggcac gggcacaccg aaccggccga acggctgcgc 2220
gcatcgacgc ggccctacat cctgcgccgg ctcaagaccg acccggcgat catcgacgat 2280
ctgccggaga agatcgagat caagcagtac tgccaactca ccaccgagca ggcgtcgctg 2340
tatcaggccg tcgtcgccga catgatggaa aagatcgaaa acaccgaagg gatcgagcgg 2400
cgcggcaacg tgctggccgc gatggccaag ctcaaacagg tgtgcaacca ccccgcccag 2460
ctgctgcacg atcgctcccc ggtcggtcgg cggtccggga aggtgatccg gctcgaggag 2520
atcctggaag agatcctggc cgagggcgac cgggtgctgt gttttaccca gttcaccgag 2580
ttcgccgagc tgctggtgcc gcacctggcc gcacgcttcg gccgtgccgc ccgagacatt 2640
gcctacctgc acggtggcac cccgaggaag cggcgtgacg agatggtggc ccggttccag 2700
tccggtgacg gcccgcccat ttttctgctg tcgttgaagg cgggcggtac cgggctgaac 2760
ctcaccgccg ccaatcatgt tgtgcacctg gaccgctggt ggaacccggc ggtcgagaac 2820
caggcgacgg accgggcgtt tcggatcggg cagcggcgca cggtgcaggt ccgcaagttc 2880
atctgcaccg gcaccctcga ggagaagatc gacgaaatga tcgaggagaa aaaggcgctg 2940
gccgacttgg tggtcaccga cggcgaaggc tggctgaccg aactgtccac ccgcgatctg 3000
cgcgaggtgt tcgcgctgtc cgaaggcgcc gtcggtgagt ag 3042
<210> 50
<211> 1013
<212> PRT
<213> Mycobacterium bovis
<400> 50
Met Leu Val Leu His Gly Phe Trp Ser Asn Ser Gly Gly Met Arg Leu
1 5 10 15
Trp Ala Glu Asp Ser Asp Leu Leu Val Lys Ser Pro Ser Gln Ala Leu
20 25 30
Arg Ser Ala Arg Pro His Pro Phe Ala Ala Pro Ala Asp Leu Ile Ala
35 40 45
Gly Ile His Pro Gly Lys Pro Ala Thr Ala Val Leu Leu Leu Pro Ser
50 55 60
Leu Arg Ser Ala Pro Leu Asp Ser Pro Glu Leu Ile Arg Leu Ala Pro
65 70 75 80
Arg Pro Ala Ala Arg Thr Asp Pro Met Leu Leu Ala Trp Thr Val Pro
85 90 95
Val Val Asp Leu Asp Pro Thr Ala Ala Leu Ala Ala Phe Asp Gln Pro
100 105 110
Ala Pro Asp Val Arg Tyr Gly Ala Ser Val Asp Tyr Leu Ala Glu Leu
115 120 125
Ala Val Phe Ala Arg Glu Leu Val Glu Arg Gly Arg Val Leu Pro Gln
130 135 140
Leu Arg Arg Asp Thr His Gly Ala Ala Ala Cys Trp Arg Pro Val Leu
145 150 155 160
Gln Gly Arg Asp Val Val Ala Met Thr Ser Leu Val Ser Ala Met Pro
165 170 175
Pro Val Cys Arg Ala Glu Val Gly Gly His Asp Pro His Glu Leu Ala
180 185 190
Thr Ser Ala Leu Asp Ala Met Val Asp Ala Ala Val Arg Ala Ala Leu
195 200 205
Ser Pro Met Asp Leu Leu Pro Pro Arg Arg Gly Arg Ser Lys Arg His
210 215 220
Arg Ala Val Glu Ala Trp Leu Thr Ala Leu Thr Cys Pro Asp Gly Arg
225 230 235 240
Phe Asp Ala Glu Pro Asp Glu Leu Asp Ala Leu Ala Glu Ala Leu Arg
245 250 255
Pro Trp Asp Asp Val Gly Ile Gly Thr Val Gly Pro Ala Arg Ala Thr
260 265 270
Phe Arg Leu Ser Glu Val Glu Thr Glu Asn Glu Glu Thr Pro Ala Gly
275 280 285
Ser Leu Trp Arg Leu Glu Phe Leu Leu Gln Ser Thr Gln Asp Pro Ser
290 295 300
Leu Leu Val Pro Ala Glu Gln Ala Trp Asn Asp Asp Gly Ser Leu Arg
305 310 315 320
Arg Trp Leu Asp Arg Pro Gln Glu Leu Leu Leu Thr Glu Leu Gly Arg
325 330 335
Ala Ser Arg Ile Phe Pro Glu Leu Val Pro Ala Leu Arg Thr Ala Cys
340 345 350
Pro Ser Gly Leu Glu Leu Asp Ala Asp Gly Ala Tyr Arg Phe Leu Ser
355 360 365
Gly Thr Ala Ala Val Leu Asp Glu Ala Gly Phe Gly Val Leu Leu Pro
370 375 380
Ser Trp Trp Asp Arg Arg Arg Lys Leu Gly Leu Val Leu Ser Ala Tyr
385 390 395 400
Thr Pro Val Asp Gly Val Val Gly Lys Ala Ser Lys Phe Gly Arg Glu
405 410 415
Gln Leu Val Glu Phe Arg Trp Glu Leu Ala Val Gly Asp Asp Pro Leu
420 425 430
Ser Glu Glu Glu Ile Ala Ala Leu Thr Glu Thr Lys Ser Pro Leu Ile
435 440 445
Arg Leu Arg Gly Gln Trp Val Ala Leu Asp Thr Glu Gln Leu Arg Arg
450 455 460
Gly Leu Glu Phe Leu Glu Arg Lys Pro Thr Gly Arg Lys Thr Thr Ala
465 470 475 480
Glu Ile Leu Ala Leu Ala Ala Ser His Pro Asp Asp Val Asp Thr Pro
485 490 495
Leu Glu Val Thr Ala Val Arg Ala Asp Gly Trp Leu Gly Asp Leu Leu
500 505 510
Ala Gly Ala Ala Ala Ala Ser Leu Gln Pro Leu Asp Pro Pro Asp Gly
515 520 525
Phe Thr Ala Thr Leu Arg Pro Tyr Gln Gln Arg Gly Leu Ala Trp Leu
530 535 540
Ala Phe Leu Ser Ser Leu Gly Leu Gly Ser Cys Leu Ala Asp Asp Met
545 550 555 560
Gly Leu Gly Lys Thr Val Gln Leu Leu Ala Leu Glu Thr Leu Glu Ser
565 570 575
Val Gln Arg His Gln Asp Arg Gly Val Gly Pro Thr Leu Leu Leu Cys
580 585 590
Pro Met Ser Leu Val Gly Asn Trp Gln Gln Glu Ala Ala Arg Phe Ala
595 600 605
Pro Asn Leu Arg Val Tyr Ala His His Gly Gly Ala Arg Leu His Gly
610 615 620
Glu Ala Leu Arg Asp His Leu Glu Arg Thr Asp Leu Val Val Ser Thr
625 630 635 640
Tyr Thr Thr Ala Thr Arg Asp Ile Asp Glu Leu Ser Glu Tyr Glu Trp
645 650 655
Asn Arg Val Val Leu Asp Glu Ala Gln Ala Val Lys Asn Ser Leu Ser
660 665 670
Arg Ala Ala Lys Ala Val Arg Arg Leu Arg Ala Ala His Arg Val Ala
675 680 685
Leu Thr Gly Thr Pro Met Glu Asn Arg Leu Ala Glu Leu Trp Ser Ile
690 695 700
Met Asp Phe Leu Asn Pro Gly Leu Leu Gly Ser Ser Glu Arg Phe Arg
705 710 715 720
Thr Arg Tyr Ala Ile Pro Ile Glu Arg His Gly His Thr Glu Pro Ala
725 730 735
Glu Arg Leu Arg Ala Ser Thr Arg Pro Tyr Ile Leu Arg Arg Leu Lys
740 745 750
Thr Asp Pro Ala Ile Ile Asp Asp Leu Pro Glu Lys Ile Glu Ile Lys
755 760 765
Gln Tyr Cys Gln Leu Thr Thr Glu Gln Ala Ser Leu Tyr Gln Ala Val
770 775 780
Val Ala Asp Met Met Glu Lys Ile Glu Asn Thr Glu Gly Ile Glu Arg
785 790 795 800
Arg Gly Asn Val Leu Ala Ala Met Ala Lys Leu Lys Gln Val Cys Asn
805 810 815
His Pro Ala Gln Leu Leu His Asp Arg Ser Pro Val Gly Arg Arg Ser
820 825 830
Gly Lys Val Ile Arg Leu Glu Glu Ile Leu Glu Glu Ile Leu Ala Glu
835 840 845
Gly Asp Arg Val Leu Cys Phe Thr Gln Phe Thr Glu Phe Ala Glu Leu
850 855 860
Leu Val Pro His Leu Ala Ala Arg Phe Gly Arg Ala Ala Arg Asp Ile
865 870 875 880
Ala Tyr Leu His Gly Gly Thr Pro Arg Lys Arg Arg Asp Glu Met Val
885 890 895
Ala Arg Phe Gln Ser Gly Asp Gly Pro Pro Ile Phe Leu Leu Ser Leu
900 905 910
Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Ala Ala Asn His Val Val
915 920 925
His Leu Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp
930 935 940
Arg Ala Phe Arg Ile Gly Gln Arg Arg Thr Val Gln Val Arg Lys Phe
945 950 955 960
Ile Cys Thr Gly Thr Leu Glu Glu Lys Ile Asp Glu Met Ile Glu Glu
965 970 975
Lys Lys Ala Leu Ala Asp Leu Val Val Thr Asp Gly Glu Gly Trp Leu
980 985 990
Thr Glu Leu Ser Thr Arg Asp Leu Arg Glu Val Phe Ala Leu Ser Glu
995 1000 1005
Gly Ala Val Gly Glu
1010
<210> 51
<211> 3042
<212> DNA
<213> Mycobacterium tuberculosis
<400> 51
atgctggttt tgcacggctt ctggtccaac tccggcggga tgcggctgtg ggcggaggac 60
tccgatctgc tggtgaagag cccgagtcag gcgctgcgct ccgcgcggcc acacccgttc 120
gcggcgcccg ctgacctgat cgccggcata catccgggca aacccgcaac cgccgttttg 180
ctgttgccgt cgttgcgatc ggcgccgctg gactcgccgg agctgatccg gctcgccccg 240
cgcccggccg cgcgaaccga tccgatgctg ttggcgtgga cggtaccggt ggtggacctg 300
gaccccaccg cggcgttggc cgccttcgac cagcccgccc ccgacgtccg ctacggcgcg 360
tccgtcgact acctggccga gctggccgtt ttcgcgcgcg agttggtcga gcgtggtcgc 420
gtgctgcccc agctgcgccg cgacacccac ggcgcggccg cctgctggcg tccggtgttg 480
cagggacgcg acgtggtcgc gatgacctcg ctggtctcgg cgatgccgcc ggtctgccgc 540
gccgaagttg gtgggcacga cccgcacgaa ctggcaacct cggctctgga cgcgatggtc 600
gacgccgccg tgcgcgcggc gctgtcaccg atggacctgc tgcccccgcg acggggtcgc 660
tccaaacggc atcgggccgt ggaggcttgg ctgaccgcgt tgacctgccc ggacggccgg 720
ttcgacgcgg agcccgacga actcgacgcg ctggccgagg cgttgcggcc atgggacgac 780
gtcggtatcg gcaccgtcgg cccggcgcgg gcgacgtttc ggctgtccga agtcgagacc 840
gaaaacgagg agacgcccgc gggctcgttg tggaggctgg agttcttatt gcagtcgacg 900
caggacccca gcctgctggt ccccgccgag caggcatgga acgacgacgg cagcctgcgc 960
cgctggctgg accggccgca ggagctgctg ctgaccgaac tgggccgggc ctctcggatt 1020
ttccccgagc tcgtcccggc gctgcgcacc gcgtgcccgt ccgggcttga gctcgacgcc 1080
gacggcgcct accgattcct gtcgggtacg gccgcggtgc tcgacgaggc tgggtttggc 1140
gtgctgctgc cgtcctggtg ggaccgccgc cgcaagctgg gcttggtcct gtccgcatat 1200
accccggtcg acggcgtggt gggcaaggcc agcaagttcg gccgcgagca gctcgtcgag 1260
ttccgctggg agctggccgt gggcgacgat ccgctcagcg aggaggagat cgcggcgctg 1320
accgaaacca agtccccgct gatccggctg cgtggccagt gggtcgcgct cgataccgaa 1380
cagatgcgcc gcgggctgga gtttttggag cgtaagccaa ccggccgcaa gaccaccgcc 1440
gagatcctcg cgctggccgc cagccacccc gacgacgtgg acaccccgct cgaggtcacc 1500
gccgtacgcg ccgacggctg gctcggggac ctgctcgccg gggccgccgc ggcgtcgctg 1560
cagccgttgg acccgcccga cggattcacc gcgacgctgc gtccctacca gcagcgcggt 1620
ctggcgtggc tggcgttttt gtcctcgctc ggtttgggca gctgcctggc cgacgacatg 1680
ggcctgggca agacggtgca gctattggcc ctggaaacct tggaatccgt tcagcgccac 1740
caggatcgcg gcgtcggacc cacactgcta ctgtgcccga tgtcgttggt gggcaactgg 1800
ccgcaggaag cggccaggtt tgcacccaac ctgcgggtgt acgcccacca cgggggcgcc 1860
cggctgcacg gcgaggcgtt gcgcgaccac ctcgagcgca ccgacctggt cgtgagcacc 1920
tataccaccg ccacccgcga catcgacgag ctggcggaat acgaatggaa ccgggtggtg 1980
ctggacgagg cccaggcggt gaagaacagc ctgtcccggg cggccaaggc ggtgcgacgg 2040
ctacgcgcgg cgcaccgggt cgcgctgacc gggacaccga tggagaaccg gctcgccgag 2100
ctgtggtcga tcatggactt cctcaacccg ggcctgctcg gatcctccga acgcttccgc 2160
acccgctacg cgatcccgat cgagcggcac gggcacaccg aaccggccga acggctgcgc 2220
gcatcgacgc ggccctacat cctgcgccgg ctcaagaccg acccggcgat catcgacgat 2280
ctgccggaga agatcgagat caagcagtac tgccaactca ccaccgagca ggcgtcgctg 2340
tatcaggccg tcgtcgccga catgatggaa aagatcgaaa acaccgaagg gatcgagcgg 2400
cgcggcaacg tgctggccgc gatggccaag ctcaaacagg tgtgcaacca ccccgcccag 2460
ctgctgcacg atcgctcccc ggtcggtcgg cggtccggga aggtgatccg gctcgaggag 2520
atcctggaag agatcctggc cgagggcgac cgggtgctgt gttttaccca gttcaccgag 2580
ttcgccgagc tgctggtgcc gcacctggcc gcacgcttcg gccgtgccgc ccgagacatt 2640
gcctacctgc acggtggcac cccgaggaag cggcgtgacg agatggtggc ccggttccag 2700
tccggtgacg gcccgcccat ttttctgctg tcgttgaagg cgggcggtac cgggctgaac 2760
ctcaccgccg ccaatcatgt tgtgcacctg gaccgctggt ggaacccggc ggtcgagaac 2820
caggcgacgg accgggcgtt tcggatcggg cagcggcgca cggtgcaggt ccgcaagttc 2880
atctgcaccg gcaccctcga ggagaagatc gacgaaatga tcgaggagaa aaaggcgctg 2940
gccgacttgg tggtcaccga cggcgaaggc tggctgaccg aactgtccac ccgcgatctg 3000
cgcgaggtgt tcgcgctgtc cgaaggcgcc gtcggtgagt ag 3042
<210> 52
<211> 1013
<212> PRT
<213> Mycobacterium tuberculosis
<400> 52
Met Leu Val Leu His Gly Phe Trp Ser Asn Ser Gly Gly Met Arg Leu
1 5 10 15
Trp Ala Glu Asp Ser Asp Leu Leu Val Lys Ser Pro Ser Gln Ala Leu
20 25 30
Arg Ser Ala Arg Pro His Pro Phe Ala Ala Pro Ala Asp Leu Ile Ala
35 40 45
Gly Ile His Pro Gly Lys Pro Ala Thr Ala Val Leu Leu Leu Pro Ser
50 55 60
Leu Arg Ser Ala Pro Leu Asp Ser Pro Glu Leu Ile Arg Leu Ala Pro
65 70 75 80
Arg Pro Ala Ala Arg Thr Asp Pro Met Leu Leu Ala Trp Thr Val Pro
85 90 95
Val Val Asp Leu Asp Pro Thr Ala Ala Leu Ala Ala Phe Asp Gln Pro
100 105 110
Ala Pro Asp Val Arg Tyr Gly Ala Ser Val Asp Tyr Leu Ala Glu Leu
115 120 125
Ala Val Phe Ala Arg Glu Leu Val Glu Arg Gly Arg Val Leu Pro Gln
130 135 140
Leu Arg Arg Asp Thr His Gly Ala Ala Ala Cys Trp Arg Pro Val Leu
145 150 155 160
Gln Gly Arg Asp Val Val Ala Met Thr Ser Leu Val Ser Ala Met Pro
165 170 175
Pro Val Cys Arg Ala Glu Val Gly Gly His Asp Pro His Glu Leu Ala
180 185 190
Thr Ser Ala Leu Asp Ala Met Val Asp Ala Ala Val Arg Ala Ala Leu
195 200 205
Ser Pro Met Asp Leu Leu Pro Pro Arg Arg Gly Arg Ser Lys Arg His
210 215 220
Arg Ala Val Glu Ala Trp Leu Thr Ala Leu Thr Cys Pro Asp Gly Arg
225 230 235 240
Phe Asp Ala Glu Pro Asp Glu Leu Asp Ala Leu Ala Glu Ala Leu Arg
245 250 255
Pro Trp Asp Asp Val Gly Ile Gly Thr Val Gly Pro Ala Arg Ala Thr
260 265 270
Phe Arg Leu Ser Glu Val Glu Thr Glu Asn Glu Glu Thr Pro Ala Gly
275 280 285
Ser Leu Trp Arg Leu Glu Phe Leu Leu Gln Ser Thr Gln Asp Pro Ser
290 295 300
Leu Leu Val Pro Ala Glu Gln Ala Trp Asn Asp Asp Gly Ser Leu Arg
305 310 315 320
Arg Trp Leu Asp Arg Pro Gln Glu Leu Leu Leu Thr Glu Leu Gly Arg
325 330 335
Ala Ser Arg Ile Phe Pro Glu Leu Val Pro Ala Leu Arg Thr Ala Cys
340 345 350
Pro Ser Gly Leu Glu Leu Asp Ala Asp Gly Ala Tyr Arg Phe Leu Ser
355 360 365
Gly Thr Ala Ala Val Leu Asp Glu Ala Gly Phe Gly Val Leu Leu Pro
370 375 380
Ser Trp Trp Asp Arg Arg Arg Lys Leu Gly Leu Val Leu Ser Ala Tyr
385 390 395 400
Thr Pro Val Asp Gly Val Val Gly Lys Ala Ser Lys Phe Gly Arg Glu
405 410 415
Gln Leu Val Glu Phe Arg Trp Glu Leu Ala Val Gly Asp Asp Pro Leu
420 425 430
Ser Glu Glu Glu Ile Ala Ala Leu Thr Glu Thr Lys Ser Pro Leu Ile
435 440 445
Arg Leu Arg Gly Gln Trp Val Ala Leu Asp Thr Glu Gln Met Arg Arg
450 455 460
Gly Leu Glu Phe Leu Glu Arg Lys Pro Thr Gly Arg Lys Thr Thr Ala
465 470 475 480
Glu Ile Leu Ala Leu Ala Ala Ser His Pro Asp Asp Val Asp Thr Pro
485 490 495
Leu Glu Val Thr Ala Val Arg Ala Asp Gly Trp Leu Gly Asp Leu Leu
500 505 510
Ala Gly Ala Ala Ala Ala Ser Leu Gln Pro Leu Asp Pro Pro Asp Gly
515 520 525
Phe Thr Ala Thr Leu Arg Pro Tyr Gln Gln Arg Gly Leu Ala Trp Leu
530 535 540
Ala Phe Leu Ser Ser Leu Gly Leu Gly Ser Cys Leu Ala Asp Asp Met
545 550 555 560
Gly Leu Gly Lys Thr Val Gln Leu Leu Ala Leu Glu Thr Leu Glu Ser
565 570 575
Val Gln Arg His Gln Asp Arg Gly Val Gly Pro Thr Leu Leu Leu Cys
580 585 590
Pro Met Ser Leu Val Gly Asn Trp Pro Gln Glu Ala Ala Arg Phe Ala
595 600 605
Pro Asn Leu Arg Val Tyr Ala His His Gly Gly Ala Arg Leu His Gly
610 615 620
Glu Ala Leu Arg Asp His Leu Glu Arg Thr Asp Leu Val Val Ser Thr
625 630 635 640
Tyr Thr Thr Ala Thr Arg Asp Ile Asp Glu Leu Ala Glu Tyr Glu Trp
645 650 655
Asn Arg Val Val Leu Asp Glu Ala Gln Ala Val Lys Asn Ser Leu Ser
660 665 670
Arg Ala Ala Lys Ala Val Arg Arg Leu Arg Ala Ala His Arg Val Ala
675 680 685
Leu Thr Gly Thr Pro Met Glu Asn Arg Leu Ala Glu Leu Trp Ser Ile
690 695 700
Met Asp Phe Leu Asn Pro Gly Leu Leu Gly Ser Ser Glu Arg Phe Arg
705 710 715 720
Thr Arg Tyr Ala Ile Pro Ile Glu Arg His Gly His Thr Glu Pro Ala
725 730 735
Glu Arg Leu Arg Ala Ser Thr Arg Pro Tyr Ile Leu Arg Arg Leu Lys
740 745 750
Thr Asp Pro Ala Ile Ile Asp Asp Leu Pro Glu Lys Ile Glu Ile Lys
755 760 765
Gln Tyr Cys Gln Leu Thr Thr Glu Gln Ala Ser Leu Tyr Gln Ala Val
770 775 780
Val Ala Asp Met Met Glu Lys Ile Glu Asn Thr Glu Gly Ile Glu Arg
785 790 795 800
Arg Gly Asn Val Leu Ala Ala Met Ala Lys Leu Lys Gln Val Cys Asn
805 810 815
His Pro Ala Gln Leu Leu His Asp Arg Ser Pro Val Gly Arg Arg Ser
820 825 830
Gly Lys Val Ile Arg Leu Glu Glu Ile Leu Glu Glu Ile Leu Ala Glu
835 840 845
Gly Asp Arg Val Leu Cys Phe Thr Gln Phe Thr Glu Phe Ala Glu Leu
850 855 860
Leu Val Pro His Leu Ala Ala Arg Phe Gly Arg Ala Ala Arg Asp Ile
865 870 875 880
Ala Tyr Leu His Gly Gly Thr Pro Arg Lys Arg Arg Asp Glu Met Val
885 890 895
Ala Arg Phe Gln Ser Gly Asp Gly Pro Pro Ile Phe Leu Leu Ser Leu
900 905 910
Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Ala Ala Asn His Val Val
915 920 925
His Leu Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp
930 935 940
Arg Ala Phe Arg Ile Gly Gln Arg Arg Thr Val Gln Val Arg Lys Phe
945 950 955 960
Ile Cys Thr Gly Thr Leu Glu Glu Lys Ile Asp Glu Met Ile Glu Glu
965 970 975
Lys Lys Ala Leu Ala Asp Leu Val Val Thr Asp Gly Glu Gly Trp Leu
980 985 990
Thr Glu Leu Ser Thr Arg Asp Leu Arg Glu Val Phe Ala Leu Ser Glu
995 1000 1005
Gly Ala Val Gly Glu
1010
<210> 53
<211> 3282
<212> DNA
<213> Myxococcus xanthus
<400> 53
gtgcgagcct ggaggggcgt cctccgctgg gctgccgctg gcctctccct gtccgcggct 60
cggagtccga ccggccacct cccagtgttt tcaggttttt ccgtggcgac cgatggcgtc 120
gggctgttcg cgggtctgtc tgttcgggcc cttgtccatc aagggcctgg aggaggaccg 180
ctacgagcgc ctcacggaca acccggcagg cctgcggctc acggagccgg caatcccgtg 240
caggggcgct cgcaggcctg cttgcgtgtg ccgcttgccc ggacggagtt tacattcgca 300
gcgatgcccc tcgtgttcct gcccgacgcc gagacgctgt tcctctgggg gcccgaccgg 360
ctgccacgtg agctcgccgg cctgccggag acgggggacc gcgcctccgc gctgctcgtg 420
acgcccgagg gattgcgtga atgcgagggg cacgggctgc ccctggccgc caccgtcgag 480
cggctcgcgg tggtgcaaac ctccgaggcc gagtcctttc ctggctccat cgccctgtgg 540
acgctggcca gcaagctcgc gctggagttg gtggcgcgcg agcgcgtggt gcccacgctc 600
ctgcggcggg gcgagcgcat cgaggctcgc tgggcggcgg ccctctccgc caccgaggac 660
gccggccgcg tcgccgcgct cgcccggagc atgccgcccg gcgcgcacgc cgtccccgca 720
ggcgccaggc caggccgcgc cgtctgggcc ccggacgcct tgctgcgcgc cttcctcgac 780
gccaccgtcg acgccttcgt gcgcgccgcg cgcggtgcgc cttcgttgcc ggcccggcgc 840
gcggcctcgt gggacgagcg ctggcgcgag gcgctcaccg gcgcgcgacg cgacttcgcg 900
ccggagggct tcgccgagcg ctccgtcgtc gatgagctga cgcgctggag cgaacccgcg 960
ctcggcgccc gggacaagct gcgcgcctgc ttccggctgg agcccccgac ggaggagcgc 1020
gagcccttcg tgctgagctt ccacctccag tccccggacg acccaagcct gctcgtcccg 1080
gccgcggacg tctggaagac gcgcgggcgc agcctggaga agctcggccg cgccttccgt 1140
gacccgcagg agtccctgct cgaggcactc ggccgcgccg cccggctctt ccccccgctg 1200
gcgctcgtgc tggagagccc acgtccccag gcgctcctgc tcgagcccga caccgcgtgg 1260
acgttcctct cggagggcgc ccgcgtgctc tcagacgccg gcttcggcgt catcgtccct 1320
ggcgagctca ccacctcggg ccgacgccgc ctgcgcctgc gcatgcgcgt gggcgcgagc 1380
acgaaggccg cgggggccgt cggtggcacc gcggggctcg ggctcgacgc gctgctgcgc 1440
gtggactggg acgccgtgct gggcgaccaa cccctctccg cccaggagct ggcgctgctg 1500
gcccagcgca aggccccgct cgtgcgattc cgcggcgagt gggtcgcggt ggatcccctc 1560
gaactcgacg ccatccagcg ccacctcgcc cagggccccg gccgcatggc gctgagcgag 1620
gcggtgcggg tgtccctgct aggcgaaacg cgccacggac agctccccgt caccgttctc 1680
gccaccgggg cgctggagga gcgcctgcgc ctgcttcggg agggcggggc caccgctcag 1740
gacgcccccc gcgcgctgcg cgccacgctg cggccctacc agtcgcgcgg tctgcactgg 1800
ctggacacgc tggcctcatt ggggctcggc gcctgcctcg cggacgacat gggcctgggc 1860
aagacggtgc aggtgctggc cttcctgctg cggcggctcg agcaggcgcc tgacgaggcg 1920
cgccccacgc tgctggtggc ccccacctcc gtggtgggca actgggagcg tgagctcgcc 1980
cgcttcgccc ccaccttgcg cctgacgcgg cactacggcg ccgagcgcgc ccgcgcggcg 2040
aaccgcttcc cccgcgcgcc cggcgccgtc gtgctcacca cctacggctt gctgcgccgg 2100
gacgccgcgc tgctcgcgcg cgtggactgg ggcgcggtgg tgctcgacga ggcgcagaac 2160
atcaagaacg cggcgtcggc taccgcccgc gcggcccggg cgttgcgcgc cagccagcgc 2220
ttcgcgctca cgggcacgcc ggtggagaac cgcctggcgg agctgtggtc catcctcgag 2280
ttcgccaacc cgggcctgct cgggccgctg gagacgttcc ggcgggagct ggcgctgccc 2340
attgaacgcc atggcaatca ggaggcctcg gcccggctgc gccggctcgt gagccccttc 2400
gtcctgcgcc gcctcaagag cgacccgacc atcatcacgg acctgcccgc gaagaatgag 2460
atgaaggtcg tctgcacgct cacgcgcgag caggcctcgc tctacaaggc ggtggtggac 2520
gaggagctgc ggcgcatcga ggaggccgac ggcatggagc gccggggccg cgtgctcgcg 2580
ctgctgctgt acacgaagca gatcgccaac cacccggcgc agtacctcgg ggagtccggg 2640
cccctgccgg ggcgctcggg gaagctggcg cgcgtggtgg agatgctcga ggagtccctg 2700
gccgctggcg acaaggcgct cgtcttcacg cagttccggg agatgggcga caagctggtg 2760
gcgcacctgt cggagtacct gggccacgag gtgctcttcc tccacggcgg cacgccccgc 2820
aaggcgcgcg acgagatggt gcggcgcttc caggaggacg tccacggtcc gcgtgtgttc 2880
gtgctgtccg tcaaggcggg aggcacgggg ctcaacctga cggcggcgag ccatgtgttc 2940
cattacgacc gctggtggaa cccggccgtc gaggaccagg ccaccgaccg cgcgtaccgc 3000
atcgggcaga cgcgcgcggt gcaggtccac aagctggtgt gtgcgggcac tgtcgaggag 3060
aaggtggacc ggctgctcga acagaagcgc cagctcgccg agaaggtcgt gggcgcgggc 3120
gagcactggg tgaccgagct ggacacgacg gcgctgcgcg agctgttctc gctgtccgag 3180
ggcgccgtgg cggacgatgg cgacgcggaa ggggaagacg acgcgcgggt gcgcgccccg 3240
cgacggcgcg gccgtgcgag cgcgaaggcg gtgtcgcgat ga 3282
<210> 54
<211> 1093
<212> PRT
<213> Myxococcus xanthus
<400> 54
Val Arg Ala Trp Arg Gly Val Leu Arg Trp Ala Ala Ala Gly Leu Ser
1 5 10 15
Leu Ser Ala Ala Arg Ser Pro Thr Gly His Leu Pro Val Phe Ser Gly
20 25 30
Phe Ser Val Ala Thr Asp Gly Val Gly Leu Phe Ala Gly Leu Ser Val
35 40 45
Arg Ala Leu Val His Gln Gly Pro Gly Gly Gly Pro Leu Arg Ala Pro
50 55 60
His Gly Gln Pro Gly Arg Pro Ala Ala His Gly Ala Gly Asn Pro Val
65 70 75 80
Gln Gly Arg Ser Gln Ala Cys Leu Arg Val Pro Leu Ala Arg Thr Glu
85 90 95
Phe Thr Phe Ala Ala Met Pro Leu Val Phe Leu Pro Asp Ala Glu Thr
100 105 110
Leu Phe Leu Trp Gly Pro Asp Arg Leu Pro Arg Glu Leu Ala Gly Leu
115 120 125
Pro Glu Thr Gly Asp Arg Ala Ser Ala Leu Leu Val Thr Pro Glu Gly
130 135 140
Leu Arg Glu Cys Glu Gly His Gly Leu Pro Leu Ala Ala Thr Val Glu
145 150 155 160
Arg Leu Ala Val Val Gln Thr Ser Glu Ala Glu Ser Phe Pro Gly Ser
165 170 175
Ile Ala Leu Trp Thr Leu Ala Ser Lys Leu Ala Leu Glu Leu Val Ala
180 185 190
Arg Glu Arg Val Val Pro Thr Leu Leu Arg Arg Gly Glu Arg Ile Glu
195 200 205
Ala Arg Trp Ala Ala Ala Leu Ser Ala Thr Glu Asp Ala Gly Arg Val
210 215 220
Ala Ala Leu Ala Arg Ser Met Pro Pro Gly Ala His Ala Val Pro Ala
225 230 235 240
Gly Ala Arg Pro Gly Arg Ala Val Trp Ala Pro Asp Ala Leu Leu Arg
245 250 255
Ala Phe Leu Asp Ala Thr Val Asp Ala Phe Val Arg Ala Ala Arg Gly
260 265 270
Ala Pro Ser Leu Pro Ala Arg Arg Ala Ala Ser Trp Asp Glu Arg Trp
275 280 285
Arg Glu Ala Leu Thr Gly Ala Arg Arg Asp Phe Ala Pro Glu Gly Phe
290 295 300
Ala Glu Arg Ser Val Val Asp Glu Leu Thr Arg Trp Ser Glu Pro Ala
305 310 315 320
Leu Gly Ala Arg Asp Lys Leu Arg Ala Cys Phe Arg Leu Glu Pro Pro
325 330 335
Thr Glu Glu Arg Glu Pro Phe Val Leu Ser Phe His Leu Gln Ser Pro
340 345 350
Asp Asp Pro Ser Leu Leu Val Pro Ala Ala Asp Val Trp Lys Thr Arg
355 360 365
Gly Arg Ser Leu Glu Lys Leu Gly Arg Ala Phe Arg Asp Pro Gln Glu
370 375 380
Ser Leu Leu Glu Ala Leu Gly Arg Ala Ala Arg Leu Phe Pro Pro Leu
385 390 395 400
Ala Leu Val Leu Glu Ser Pro Arg Pro Gln Ala Leu Leu Leu Glu Pro
405 410 415
Asp Thr Ala Trp Thr Phe Leu Ser Glu Gly Ala Arg Val Leu Ser Asp
420 425 430
Ala Gly Phe Gly Val Ile Val Pro Gly Glu Leu Thr Thr Ser Gly Arg
435 440 445
Arg Arg Leu Arg Leu Arg Met Arg Val Gly Ala Ser Thr Lys Ala Ala
450 455 460
Gly Ala Val Gly Gly Thr Ala Gly Leu Gly Leu Asp Ala Leu Leu Arg
465 470 475 480
Val Asp Trp Asp Ala Val Leu Gly Asp Gln Pro Leu Ser Ala Gln Glu
485 490 495
Leu Ala Leu Leu Ala Gln Arg Lys Ala Pro Leu Val Arg Phe Arg Gly
500 505 510
Glu Trp Val Ala Val Asp Pro Leu Glu Leu Asp Ala Ile Gln Arg His
515 520 525
Leu Ala Gln Gly Pro Gly Arg Met Ala Leu Ser Glu Ala Val Arg Val
530 535 540
Ser Leu Leu Gly Glu Thr Arg His Gly Gln Leu Pro Val Thr Val Leu
545 550 555 560
Ala Thr Gly Ala Leu Glu Glu Arg Leu Arg Leu Leu Arg Glu Gly Gly
565 570 575
Ala Thr Ala Gln Asp Ala Pro Arg Ala Leu Arg Ala Thr Leu Arg Pro
580 585 590
Tyr Gln Ser Arg Gly Leu His Trp Leu Asp Thr Leu Ala Ser Leu Gly
595 600 605
Leu Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Val Gln
610 615 620
Val Leu Ala Phe Leu Leu Arg Arg Leu Glu Gln Ala Pro Asp Glu Ala
625 630 635 640
Arg Pro Thr Leu Leu Val Ala Pro Thr Ser Val Val Gly Asn Trp Glu
645 650 655
Arg Glu Leu Ala Arg Phe Ala Pro Thr Leu Arg Leu Thr Arg His Tyr
660 665 670
Gly Ala Glu Arg Ala Arg Ala Ala Asn Arg Phe Pro Arg Ala Pro Gly
675 680 685
Ala Val Val Leu Thr Thr Tyr Gly Leu Leu Arg Arg Asp Ala Ala Leu
690 695 700
Leu Ala Arg Val Asp Trp Gly Ala Val Val Leu Asp Glu Ala Gln Asn
705 710 715 720
Ile Lys Asn Ala Ala Ser Ala Thr Ala Arg Ala Ala Arg Ala Leu Arg
725 730 735
Ala Ser Gln Arg Phe Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu
740 745 750
Ala Glu Leu Trp Ser Ile Leu Glu Phe Ala Asn Pro Gly Leu Leu Gly
755 760 765
Pro Leu Glu Thr Phe Arg Arg Glu Leu Ala Leu Pro Ile Glu Arg His
770 775 780
Gly Asn Gln Glu Ala Ser Ala Arg Leu Arg Arg Leu Val Ser Pro Phe
785 790 795 800
Val Leu Arg Arg Leu Lys Ser Asp Pro Thr Ile Ile Thr Asp Leu Pro
805 810 815
Ala Lys Asn Glu Met Lys Val Val Cys Thr Leu Thr Arg Glu Gln Ala
820 825 830
Ser Leu Tyr Lys Ala Val Val Asp Glu Glu Leu Arg Arg Ile Glu Glu
835 840 845
Ala Asp Gly Met Glu Arg Arg Gly Arg Val Leu Ala Leu Leu Leu Tyr
850 855 860
Thr Lys Gln Ile Ala Asn His Pro Ala Gln Tyr Leu Gly Glu Ser Gly
865 870 875 880
Pro Leu Pro Gly Arg Ser Gly Lys Leu Ala Arg Val Val Glu Met Leu
885 890 895
Glu Glu Ser Leu Ala Ala Gly Asp Lys Ala Leu Val Phe Thr Gln Phe
900 905 910
Arg Glu Met Gly Asp Lys Leu Val Ala His Leu Ser Glu Tyr Leu Gly
915 920 925
His Glu Val Leu Phe Leu His Gly Gly Thr Pro Arg Lys Ala Arg Asp
930 935 940
Glu Met Val Arg Arg Phe Gln Glu Asp Val His Gly Pro Arg Val Phe
945 950 955 960
Val Leu Ser Val Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Ala Ala
965 970 975
Ser His Val Phe His Tyr Asp Arg Trp Trp Asn Pro Ala Val Glu Asp
980 985 990
Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Arg Ala Val Gln
995 1000 1005
Val His Lys Leu Val Cys Ala Gly Thr Val Glu Glu Lys Val Asp
1010 1015 1020
Arg Leu Leu Glu Gln Lys Arg Gln Leu Ala Glu Lys Val Val Gly
1025 1030 1035
Ala Gly Glu His Trp Val Thr Glu Leu Asp Thr Thr Ala Leu Arg
1040 1045 1050
Glu Leu Phe Ser Leu Ser Glu Gly Ala Val Ala Asp Asp Gly Asp
1055 1060 1065
Ala Glu Gly Glu Asp Asp Ala Arg Val Arg Ala Pro Arg Arg Arg
1070 1075 1080
Gly Arg Ala Ser Ala Lys Ala Val Ser Arg
1085 1090
<210> 55
<211> 2871
<212> DNA
<213> Nocardia farcinica
<400> 55
atggtgggcg ccggcggccc gccgggtgtc ggtgccacct gcttggatgg acggatgctg 60
cacggactgt ggtcgccggg ttccggcctg gtgctgtgga ccgagggcga ggtgccgccc 120
gcgctgcccg acccggccgg tgcgttgctg cgcgcatcgc ggttccggca tcgggcgcag 180
gtgctggtgc cgggccccgc cggcccacag ctcacgcagg tgcgcgcgca cgccctggtg 240
ccacaggccg cggtcgacgt gctgcggcag cggttacccg tcgaatcggt ggcgggtgac 300
ctgcgctttc tcgctcacgt cgccgacggg atcgatcggt gggtgcgggc cggtcgcgtg 360
gtgcccgacc tgcaccgggc cgacggacag tggtgggcgc gctggcggct ggtcggcggt 420
gcccggcagc gggcctggct ggccgaactc gcggtggcga tgcccgcggc gctgcgggtg 480
gccgggcagc ccgcggcggt gctcgacgat ctggtcaccg agctgaccga tccgatcgtg 540
cgcaccaggc tcgccgacgc gccggtgacg cacccgctgg tgcgcgcact ggtgcgggac 600
cagccgctcg agacgggtag ccaccagctg gccgaggtgc tgcggcgctg gcgcgagagc 660
ctcaccgtcg acgagccgga gctggtgttg cggctgctgg aaccggacgg ggagaccggt 720
atcgacgggg acggcgggga cgaccgggac gacaccgtgg cgctgtggcg gctggaggtc 780
tgcctccgca ccgagggcga ggccccggcc ccggtgccgg cgaccgccga cccgaacctg 840
ctgcgcatcg ccgtcgagca gctcggccgg gcgcagcggg cctacccccg gctgcgcgat 900
ctgcccggcg atccgcacag cctcgacctg ctgttgccca ccgaggtggt ggccgatctc 960
gtcgcgcacg gtgcgcaggc gttgcgcgag gcgggggtgc ggctgctgct gccgcgcgcc 1020
tggaccatcg ccgaacccac cctgcggctc gcggtgagca gcgccgcgcc cgccgcggag 1080
agcaccgtgg gcatgcaggg tctgctgtcc tatcggtggg aactggcggt cggcgacaag 1140
gtgctcaccc gcgccgagat ggagcgcctg gtccgcgcca aatccgacct ggtgcagttg 1200
cgcggggaat gggtgcaggc cgaccacaag gtgctcgccg ccgccgcccg ctacgtcgcc 1260
gcgcatctgg acacgtcgcc ggtcaccctc gccgacctgc tcggcgagat cgccgccacc 1320
cgcgtcgaca aggtgccgct caccgaggtc accgccaccg gctgggcggg cgagttgttc 1380
gacggcggcc gcgagccggt ggcgaccccg ggtgggctga aggcgcagct gcgcccgtat 1440
cagctgcgcg gcctgagctg gctggcgacg atgagccgga tgggctgcgg cggcatcctc 1500
gccgacgaca tgggtctcgg caagacggtg caggtgctgg ccctgctggt gcacgagcgc 1560
gagaccagca cggcaccgcc cggcccgaca ctgctggtgt gcccgatgtc ggtggtcggc 1620
aactggcagc gcgaggcgca gcggttcgcc cccgggctgc gggtgctggt gcaccacggc 1680
gccgaccgcc gtcgcgacgc cgaactcgat gccgcggtgg cggattcgga cctggtgctc 1740
accacctacg ccatcctggc cagggatgcg gccgaactgt cgcgccagtc gtgggaccgg 1800
gtggtgctcg acgaggcgca gcacatcaag aacgccgcga ccaggcaggc acgtgccgcc 1860
cgtgccctgc cggcccggca tcgcctggcg ctcaccggaa ccccggtgga gaaccggctc 1920
gaagagttgc gctcgatcat ggatttcgcg gtgcccaagc tgctcggtac cgcaccgacc 1980
ttccgcgccc ggttcgccgt ccccatcgaa cgcgggcagg atcccaacgc cctgtcccgc 2040
ctgcgcttcc tcacccaacc gttcgtgctg cgccgggtca aggccgatcc ggcggtcatc 2100
ggcgatctgc ccgacaagct cgagatgacg gtgcgggcga acctgaccgt cgagcaggcc 2160
gccctgtacc aagccgtcgt cgacgacatg ctggtgaaac tgcgcagtgc caagggcatg 2220
gcccgcaagg gtgcggtgct cggcgcgctc acccggctca agcaggtgtg caaccatccc 2280
gcgcacttcc tcggtgacgg ttccccggtg ctgcatcgcg gcaggcaccg ctccggcaag 2340
ctcgccttgg tcgaggacgt gctcgacacc gtcgtcgcgg acggggagaa ggcgttgctg 2400
ttcacccagt tccgtgagtt cggcgacctg ctcgcgccct atctgtccga gcggttcggc 2460
gcgccgatcc cgttcctgca cggcggcgtg accaagaaga accgggacac gatggtcgag 2520
cgcttccagt ccggcgacgg cccgccggtc atgctgctgt ccctcaaggc cggcggcacc 2580
gggctcaccc tcaccgccgc caatcacgtg gtgcacctgg atcgctggtg gaatccggcg 2640
gtggagaacc aggccaccga tcgcgccttc cgcatcggcc agcgccgcga cgtccaggtg 2700
cgcaagctgg tctgcgtcga caccatcgag gaacggatcg acgagatgat caccggcaag 2760
agcaggctcg cggacctggc cgtggacgcg ggggagaact ggatcaccga gctgggcacc 2820
gaggagctgc gcgagttgtt caccctcggc gccgaggcgg tgggggagtg a 2871
<210> 56
<211> 956
<212> PRT
<213> Nocardia farcinica
<400> 56
Met Val Gly Ala Gly Gly Pro Pro Gly Val Gly Ala Thr Cys Leu Asp
1 5 10 15
Gly Arg Met Leu His Gly Leu Trp Ser Pro Gly Ser Gly Leu Val Leu
20 25 30
Trp Thr Glu Gly Glu Val Pro Pro Ala Leu Pro Asp Pro Ala Gly Ala
35 40 45
Leu Leu Arg Ala Ser Arg Phe Arg His Arg Ala Gln Val Leu Val Pro
50 55 60
Gly Pro Ala Gly Pro Gln Leu Thr Gln Val Arg Ala His Ala Leu Val
65 70 75 80
Pro Gln Ala Ala Val Asp Val Leu Arg Gln Arg Leu Pro Val Glu Ser
85 90 95
Val Ala Gly Asp Leu Arg Phe Leu Ala His Val Ala Asp Gly Ile Asp
100 105 110
Arg Trp Val Arg Ala Gly Arg Val Val Pro Asp Leu His Arg Ala Asp
115 120 125
Gly Gln Trp Trp Ala Arg Trp Arg Leu Val Gly Gly Ala Arg Gln Arg
130 135 140
Ala Trp Leu Ala Glu Leu Ala Val Ala Met Pro Ala Ala Leu Arg Val
145 150 155 160
Ala Gly Gln Pro Ala Ala Val Leu Asp Asp Leu Val Thr Glu Leu Thr
165 170 175
Asp Pro Ile Val Arg Thr Arg Leu Ala Asp Ala Pro Val Thr His Pro
180 185 190
Leu Val Arg Ala Leu Val Arg Asp Gln Pro Leu Glu Thr Gly Ser His
195 200 205
Gln Leu Ala Glu Val Leu Arg Arg Trp Arg Glu Ser Leu Thr Val Asp
210 215 220
Glu Pro Glu Leu Val Leu Arg Leu Leu Glu Pro Asp Gly Glu Thr Gly
225 230 235 240
Ile Asp Gly Asp Gly Gly Asp Asp Arg Asp Asp Thr Val Ala Leu Trp
245 250 255
Arg Leu Glu Val Cys Leu Arg Thr Glu Gly Glu Ala Pro Ala Pro Val
260 265 270
Pro Ala Thr Ala Asp Pro Asn Leu Leu Arg Ile Ala Val Glu Gln Leu
275 280 285
Gly Arg Ala Gln Arg Ala Tyr Pro Arg Leu Arg Asp Leu Pro Gly Asp
290 295 300
Pro His Ser Leu Asp Leu Leu Leu Pro Thr Glu Val Val Ala Asp Leu
305 310 315 320
Val Ala His Gly Ala Gln Ala Leu Arg Glu Ala Gly Val Arg Leu Leu
325 330 335
Leu Pro Arg Ala Trp Thr Ile Ala Glu Pro Thr Leu Arg Leu Ala Val
340 345 350
Ser Ser Ala Ala Pro Ala Ala Glu Ser Thr Val Gly Met Gln Gly Leu
355 360 365
Leu Ser Tyr Arg Trp Glu Leu Ala Val Gly Asp Lys Val Leu Thr Arg
370 375 380
Ala Glu Met Glu Arg Leu Val Arg Ala Lys Ser Asp Leu Val Gln Leu
385 390 395 400
Arg Gly Glu Trp Val Gln Ala Asp His Lys Val Leu Ala Ala Ala Ala
405 410 415
Arg Tyr Val Ala Ala His Leu Asp Thr Ser Pro Val Thr Leu Ala Asp
420 425 430
Leu Leu Gly Glu Ile Ala Ala Thr Arg Val Asp Lys Val Pro Leu Thr
435 440 445
Glu Val Thr Ala Thr Gly Trp Ala Gly Glu Leu Phe Asp Gly Gly Arg
450 455 460
Glu Pro Val Ala Thr Pro Gly Gly Leu Lys Ala Gln Leu Arg Pro Tyr
465 470 475 480
Gln Leu Arg Gly Leu Ser Trp Leu Ala Thr Met Ser Arg Met Gly Cys
485 490 495
Gly Gly Ile Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Val Gln Val
500 505 510
Leu Ala Leu Leu Val His Glu Arg Glu Thr Ser Thr Ala Pro Pro Gly
515 520 525
Pro Thr Leu Leu Val Cys Pro Met Ser Val Val Gly Asn Trp Gln Arg
530 535 540
Glu Ala Gln Arg Phe Ala Pro Gly Leu Arg Val Leu Val His His Gly
545 550 555 560
Ala Asp Arg Arg Arg Asp Ala Glu Leu Asp Ala Ala Val Ala Asp Ser
565 570 575
Asp Leu Val Leu Thr Thr Tyr Ala Ile Leu Ala Arg Asp Ala Ala Glu
580 585 590
Leu Ser Arg Gln Ser Trp Asp Arg Val Val Leu Asp Glu Ala Gln His
595 600 605
Ile Lys Asn Ala Ala Thr Arg Gln Ala Arg Ala Ala Arg Ala Leu Pro
610 615 620
Ala Arg His Arg Leu Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu
625 630 635 640
Glu Glu Leu Arg Ser Ile Met Asp Phe Ala Val Pro Lys Leu Leu Gly
645 650 655
Thr Ala Pro Thr Phe Arg Ala Arg Phe Ala Val Pro Ile Glu Arg Gly
660 665 670
Gln Asp Pro Asn Ala Leu Ser Arg Leu Arg Phe Leu Thr Gln Pro Phe
675 680 685
Val Leu Arg Arg Val Lys Ala Asp Pro Ala Val Ile Gly Asp Leu Pro
690 695 700
Asp Lys Leu Glu Met Thr Val Arg Ala Asn Leu Thr Val Glu Gln Ala
705 710 715 720
Ala Leu Tyr Gln Ala Val Val Asp Asp Met Leu Val Lys Leu Arg Ser
725 730 735
Ala Lys Gly Met Ala Arg Lys Gly Ala Val Leu Gly Ala Leu Thr Arg
740 745 750
Leu Lys Gln Val Cys Asn His Pro Ala His Phe Leu Gly Asp Gly Ser
755 760 765
Pro Val Leu His Arg Gly Arg His Arg Ser Gly Lys Leu Ala Leu Val
770 775 780
Glu Asp Val Leu Asp Thr Val Val Ala Asp Gly Glu Lys Ala Leu Leu
785 790 795 800
Phe Thr Gln Phe Arg Glu Phe Gly Asp Leu Leu Ala Pro Tyr Leu Ser
805 810 815
Glu Arg Phe Gly Ala Pro Ile Pro Phe Leu His Gly Gly Val Thr Lys
820 825 830
Lys Asn Arg Asp Thr Met Val Glu Arg Phe Gln Ser Gly Asp Gly Pro
835 840 845
Pro Val Met Leu Leu Ser Leu Lys Ala Gly Gly Thr Gly Leu Thr Leu
850 855 860
Thr Ala Ala Asn His Val Val His Leu Asp Arg Trp Trp Asn Pro Ala
865 870 875 880
Val Glu Asn Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly Gln Arg Arg
885 890 895
Asp Val Gln Val Arg Lys Leu Val Cys Val Asp Thr Ile Glu Glu Arg
900 905 910
Ile Asp Glu Met Ile Thr Gly Lys Ser Arg Leu Ala Asp Leu Ala Val
915 920 925
Asp Ala Gly Glu Asn Trp Ile Thr Glu Leu Gly Thr Glu Glu Leu Arg
930 935 940
Glu Leu Phe Thr Leu Gly Ala Glu Ala Val Gly Glu
945 950 955
<210> 57
<211> 3264
<212> DNA
<213> Nodularia spumigena
<400> 57
atggcaattt tacacggtaa ttggttagta agaaatcaaa atggttgttt atttatttgg 60
ggtgaaactt ggcgttcatc acgagtcgat tttgctctga atgtatctca agatatacca 120
ctacatccat tggtaatgtc accaattgat ttgagtgagt tgttaagtta tcataatatc 180
aaaattccta gcttaataca gcaatcccaa gttgctttat ctggcactgg gcgaactcgt 240
aaaagtacaa gtactactaa atttagctgg acaactcact ctctaatcat tgatttacca 300
actcatatct cagaaaataa tccccaagaa atagaattta tttccccttt gcattctgct 360
actttgggtt ctgaaataaa ttcaccccaa tatctccaac cgtggcgagt cgagggtttt 420
tgtctcaacc ccactgaagc gataaaattt ctcgctgctg ttcctttaaa tgctgctaga 480
gaagaagata ctttgttcgg tggagattta cgtttttggt cacaaattgc ccgttggagt 540
ttggatttaa tctctcggtg taagtttttg ccaactattc aaagacagtt tgatagttct 600
attgttgcta ggtggcaagt gcttttagac agtgcaatag atggaacacg cctggaaaaa 660
ttttctgcaa aaatgccatt agcttgtcgt acttatcgga agggaatggg gagtggggag 720
tggggagtgg ggagtgggga ggaatcttcc ccatccataa tgtatgtaga ttttccaact 780
gaaccccagg aactattatt aggatttctc aacagtacca tagatgccca agtgcgagaa 840
atgttagctt ctcaacctct actagaaact agagtgatgg catctttacc atctgcggtg 900
cgacagtggt tgcaaggttt aaccagtgca tctcacacag tgaatgcaga tgcaatggaa 960
gtagaaagat tagaagcagc cctgaaatct tggactatgc cgttgcaata tcaactggta 1020
ggaaaaccct cgtttcgcgc ctgttttcaa ctgcttcccc ctgcttctgg ggcaacagat 1080
tggatattgg catattttct ccaagctgcg gatgatgaaa atttattagt ggatgcggca 1140
actatttggc atcacccagt tgaacaatta gtttatcaaa atcgcaccat tgatcaaccc 1200
caagaaactt tattgcgggg cttgggttta gcttcgcgat tatatccagt tcttacaccg 1260
agtttagaaa cagaatatcc ccaatgttgt cgcctcaacc cattacaagc ttatgaattt 1320
atcaagtctg tagcttggcg atttgaagat agtggtttgg gggtaatttt acctcctagt 1380
ttgactaacc gcgaaggatg ggcgaaccgt ttggggttaa aaattagtgc tgaaactcaa 1440
aagaaaaaac agggacgctt gggtttacaa agtttactga attttcaatg gcaattggca 1500
attggtggac aaacaatttc taaaaccgag tttaataaac tggtagcttt aaatagccca 1560
ctggtagaaa ttaacggcga atgggtggaa ttgcgacccc aggatattaa aacagcacag 1620
acattttttg cttctcgtaa agacgaaatg acgctttctt tggaagatgc tttacgcctc 1680
agttctggcg atacccaagc gattgaaaag ttacctgtgg tcagttttga agcatctggg 1740
acattgcaag agttaattgg ggcgttaacc aataatcaag ccatttcacc cctcccaaca 1800
cctgcaaatt ttcaaggaca gttacgacct tatcaagaaa gaggggcggc ttggctggct 1860
ttcttagaac gttggggttt aggtgcttgt ttggctgatg atatggggct gggaaaaaca 1920
attcagttaa ttgccttttt actgcacctc aaagaacaag acgcactgga aaatcccaca 1980
ttacttgttt gtccgacttc tattttaggt aactgggaac gggaaattaa aaaatttgct 2040
cctactctca aagttttaca gcaccacggc gataaacgtc tcaaaggtaa agcgtttgta 2100
gaagcagtca aaaaacacga tgtaattatt accagttact cactcgttca ccgggatatt 2160
aaatctttgc agagtgtcga ttggcaaaca gttgtattag atgaagccca gaatgtgaaa 2220
aatcctgaag ctaaacaatc gcaggctgtg aggggattaa aaactacatt tcgcatagct 2280
ttaacaggga caccagtaga aaacaaactg caagaattgt ggtctatttt agattttctt 2340
aatcctgggt atttgggaaa tcgtcaattt ttccagagac ggtttgctat gccaattgaa 2400
aagtatggtg atacagcatc tttaaatcaa ttgcggggtt tagttcaacc gtttattcta 2460
cgtcgtctga aaacagatcg tgatattatt caagatttgc cagaaaagca agaaatgacg 2520
gttttttgtg ggcttgcggc tgaacaagct gcactttatc aacaagtagt tgaagcatct 2580
ttagtagaaa ttgaatctgc tgagggtttg caacgtcgag ggatgatttt agctttactt 2640
gtgaaactta aacaaatctg taatcatcca gcccaatatt tgaaagccgc gacattacaa 2700
gaacatagtt ctgctaaact gcaacggcta gatgaaatgt taacggtagc tttggaggaa 2760
ggagataggg ctttaatttt cactcaattt gctgaatggg gtaagttatt aaaagctcat 2820
ttacaacaaa cacttgggaa agaaatattc tttttatatg gtggtagcag taaaaaacaa 2880
cgcgaggaaa tgattgaccg tttccaacat gacccccaag gacctccgat tatgattctt 2940
tctttaaaag cgggtggggt aggcttgaat ttaaccaggg ctaatcatgt atttcacttt 3000
gatagatggt ggaatcccgc agtggaaaat caagcgacag atagagtatt tcgtattggt 3060
caaacccgga atgtgcaagt gcataaattt gtctgtactg gcacattaga agaaaaaatt 3120
catgacatga ttgaaagtaa aaaacaatta gcggaacaag tagttggtgc tggtgaggag 3180
tggctgactg aaatgaatac tgaccaattg cgtgatttac tcattcttga tcgcagtgcc 3240
ataattgatg aggatgaagt ttaa 3264
<210> 58
<211> 1087
<212> PRT
<213> Nodularia spumigena
<400> 58
Met Ala Ile Leu His Gly Asn Trp Leu Val Arg Asn Gln Asn Gly Cys
1 5 10 15
Leu Phe Ile Trp Gly Glu Thr Trp Arg Ser Ser Arg Val Asp Phe Ala
20 25 30
Leu Asn Val Ser Gln Asp Ile Pro Leu His Pro Leu Val Met Ser Pro
35 40 45
Ile Asp Leu Ser Glu Leu Leu Ser Tyr His Asn Ile Lys Ile Pro Ser
50 55 60
Leu Ile Gln Gln Ser Gln Val Ala Leu Ser Gly Thr Gly Arg Thr Arg
65 70 75 80
Lys Ser Thr Ser Thr Thr Lys Phe Ser Trp Thr Thr His Ser Leu Ile
85 90 95
Ile Asp Leu Pro Thr His Ile Ser Glu Asn Asn Pro Gln Glu Ile Glu
100 105 110
Phe Ile Ser Pro Leu His Ser Ala Thr Leu Gly Ser Glu Ile Asn Ser
115 120 125
Pro Gln Tyr Leu Gln Pro Trp Arg Val Glu Gly Phe Cys Leu Asn Pro
130 135 140
Thr Glu Ala Ile Lys Phe Leu Ala Ala Val Pro Leu Asn Ala Ala Arg
145 150 155 160
Glu Glu Asp Thr Leu Phe Gly Gly Asp Leu Arg Phe Trp Ser Gln Ile
165 170 175
Ala Arg Trp Ser Leu Asp Leu Ile Ser Arg Cys Lys Phe Leu Pro Thr
180 185 190
Ile Gln Arg Gln Phe Asp Ser Ser Ile Val Ala Arg Trp Gln Val Leu
195 200 205
Leu Asp Ser Ala Ile Asp Gly Thr Arg Leu Glu Lys Phe Ser Ala Lys
210 215 220
Met Pro Leu Ala Cys Arg Thr Tyr Arg Lys Gly Met Gly Ser Gly Glu
225 230 235 240
Trp Gly Val Gly Ser Gly Glu Glu Ser Ser Pro Ser Ile Met Tyr Val
245 250 255
Asp Phe Pro Thr Glu Pro Gln Glu Leu Leu Leu Gly Phe Leu Asn Ser
260 265 270
Thr Ile Asp Ala Gln Val Arg Glu Met Leu Ala Ser Gln Pro Leu Leu
275 280 285
Glu Thr Arg Val Met Ala Ser Leu Pro Ser Ala Val Arg Gln Trp Leu
290 295 300
Gln Gly Leu Thr Ser Ala Ser His Thr Val Asn Ala Asp Ala Met Glu
305 310 315 320
Val Glu Arg Leu Glu Ala Ala Leu Lys Ser Trp Thr Met Pro Leu Gln
325 330 335
Tyr Gln Leu Val Gly Lys Pro Ser Phe Arg Ala Cys Phe Gln Leu Leu
340 345 350
Pro Pro Ala Ser Gly Ala Thr Asp Trp Ile Leu Ala Tyr Phe Leu Gln
355 360 365
Ala Ala Asp Asp Glu Asn Leu Leu Val Asp Ala Ala Thr Ile Trp His
370 375 380
His Pro Val Glu Gln Leu Val Tyr Gln Asn Arg Thr Ile Asp Gln Pro
385 390 395 400
Gln Glu Thr Leu Leu Arg Gly Leu Gly Leu Ala Ser Arg Leu Tyr Pro
405 410 415
Val Leu Thr Pro Ser Leu Glu Thr Glu Tyr Pro Gln Cys Cys Arg Leu
420 425 430
Asn Pro Leu Gln Ala Tyr Glu Phe Ile Lys Ser Val Ala Trp Arg Phe
435 440 445
Glu Asp Ser Gly Leu Gly Val Ile Leu Pro Pro Ser Leu Thr Asn Arg
450 455 460
Glu Gly Trp Ala Asn Arg Leu Gly Leu Lys Ile Ser Ala Glu Thr Gln
465 470 475 480
Lys Lys Lys Gln Gly Arg Leu Gly Leu Gln Ser Leu Leu Asn Phe Gln
485 490 495
Trp Gln Leu Ala Ile Gly Gly Gln Thr Ile Ser Lys Thr Glu Phe Asn
500 505 510
Lys Leu Val Ala Leu Asn Ser Pro Leu Val Glu Ile Asn Gly Glu Trp
515 520 525
Val Glu Leu Arg Pro Gln Asp Ile Lys Thr Ala Gln Thr Phe Phe Ala
530 535 540
Ser Arg Lys Asp Glu Met Thr Leu Ser Leu Glu Asp Ala Leu Arg Leu
545 550 555 560
Ser Ser Gly Asp Thr Gln Ala Ile Glu Lys Leu Pro Val Val Ser Phe
565 570 575
Glu Ala Ser Gly Thr Leu Gln Glu Leu Ile Gly Ala Leu Thr Asn Asn
580 585 590
Gln Ala Ile Ser Pro Leu Pro Thr Pro Ala Asn Phe Gln Gly Gln Leu
595 600 605
Arg Pro Tyr Gln Glu Arg Gly Ala Ala Trp Leu Ala Phe Leu Glu Arg
610 615 620
Trp Gly Leu Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr
625 630 635 640
Ile Gln Leu Ile Ala Phe Leu Leu His Leu Lys Glu Gln Asp Ala Leu
645 650 655
Glu Asn Pro Thr Leu Leu Val Cys Pro Thr Ser Ile Leu Gly Asn Trp
660 665 670
Glu Arg Glu Ile Lys Lys Phe Ala Pro Thr Leu Lys Val Leu Gln His
675 680 685
His Gly Asp Lys Arg Leu Lys Gly Lys Ala Phe Val Glu Ala Val Lys
690 695 700
Lys His Asp Val Ile Ile Thr Ser Tyr Ser Leu Val His Arg Asp Ile
705 710 715 720
Lys Ser Leu Gln Ser Val Asp Trp Gln Thr Val Val Leu Asp Glu Ala
725 730 735
Gln Asn Val Lys Asn Pro Glu Ala Lys Gln Ser Gln Ala Val Arg Gly
740 745 750
Leu Lys Thr Thr Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn
755 760 765
Lys Leu Gln Glu Leu Trp Ser Ile Leu Asp Phe Leu Asn Pro Gly Tyr
770 775 780
Leu Gly Asn Arg Gln Phe Phe Gln Arg Arg Phe Ala Met Pro Ile Glu
785 790 795 800
Lys Tyr Gly Asp Thr Ala Ser Leu Asn Gln Leu Arg Gly Leu Val Gln
805 810 815
Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Arg Asp Ile Ile Gln Asp
820 825 830
Leu Pro Glu Lys Gln Glu Met Thr Val Phe Cys Gly Leu Ala Ala Glu
835 840 845
Gln Ala Ala Leu Tyr Gln Gln Val Val Glu Ala Ser Leu Val Glu Ile
850 855 860
Glu Ser Ala Glu Gly Leu Gln Arg Arg Gly Met Ile Leu Ala Leu Leu
865 870 875 880
Val Lys Leu Lys Gln Ile Cys Asn His Pro Ala Gln Tyr Leu Lys Ala
885 890 895
Ala Thr Leu Gln Glu His Ser Ser Ala Lys Leu Gln Arg Leu Asp Glu
900 905 910
Met Leu Thr Val Ala Leu Glu Glu Gly Asp Arg Ala Leu Ile Phe Thr
915 920 925
Gln Phe Ala Glu Trp Gly Lys Leu Leu Lys Ala His Leu Gln Gln Thr
930 935 940
Leu Gly Lys Glu Ile Phe Phe Leu Tyr Gly Gly Ser Ser Lys Lys Gln
945 950 955 960
Arg Glu Glu Met Ile Asp Arg Phe Gln His Asp Pro Gln Gly Pro Pro
965 970 975
Ile Met Ile Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr
980 985 990
Arg Ala Asn His Val Phe His Phe Asp Arg Trp Trp Asn Pro Ala Val
995 1000 1005
Glu Asn Gln Ala Thr Asp Arg Val Phe Arg Ile Gly Gln Thr Arg
1010 1015 1020
Asn Val Gln Val His Lys Phe Val Cys Thr Gly Thr Leu Glu Glu
1025 1030 1035
Lys Ile His Asp Met Ile Glu Ser Lys Lys Gln Leu Ala Glu Gln
1040 1045 1050
Val Val Gly Ala Gly Glu Glu Trp Leu Thr Glu Met Asn Thr Asp
1055 1060 1065
Gln Leu Arg Asp Leu Leu Ile Leu Asp Arg Ser Ala Ile Ile Asp
1070 1075 1080
Glu Asp Glu Val
1085
<210> 59
<211> 3228
<212> DNA
<213> Nostoc sp.
<400> 59
atggcaattc tacacggtag ttggatatta aatgagcagg agagttgttt atttatttgg 60
ggggaaactt ggcgatcgcc acaagtggat tttaattttg cggagatatc cctcaatccc 120
ttggcgctgt ctgcactgga attaagtgag tggttgcagt ctcaacatca ggcgatcgct 180
aagttgttac cgcaacaatt ggaaaaacga acctccaaag cagcaagttc tgtaaaaata 240
aatttattaa ctcattcaca aataattgcc ctgccaacgg aaatttccca acctcgtaaa 300
aaagaaacca ttttaatttc tcctgtgcat tctgccgctt tagcatctga gtcagactct 360
gaagtttatt tacaaacttg gcgtgtagaa ggtttttgtc ttcctcctag tgcagcaatt 420
aaattgctaa cttctttacc tttaaatata actagtgggg agaatgcttt tttaggtgga 480
gatttacgtt tctggtcaca aattgcccgt tggagtttag atttaatttc taggtctaag 540
tttctcccaa ttatccaacg acaacctaat aattctgtaa gtgctaaatg gcaagtactt 600
ttagatagtg ccgtagatgg aactcgttta gaaaagtttg ctgcgaagat gcccttggtt 660
tgtcggactt atcaagaaat tgggagtggg gaatctccta tatatataga ttttcctagt 720
cagccgcagg atttaatctt gggttttctc aatagtgcga tagatacgca attgcgggag 780
atggtgggga atcagcctgt ggtggaaact cggttgatgg catctttacc atcggcggtg 840
cgacagtggt tgcaagcgtt aattgctgca tctaattcaa ttgatgcaga tgctgttggt 900
ttagaaaggc tggaagcggc gctcaaggct tggacgatgc cgctacaata tcaactagca 960
agtaaaaatc aatttcgcac ttgttttgaa ttacgttctc cagaaccaga cgaaactgaa 1020
tggacgctgg cgtatttcct gcaagcagcc gatgatccag aatttttagt agatgcggcg 1080
actatttggc aaaatcctgt tgaacagcta atttatcaac agcgaacgat tgaagaaccc 1140
caggaaacgt ttttgcgagg tttggggtta gcttctcgat tgtatccggt cattgccccc 1200
actttagata cagaatcacc ccaattttgt catctcaagc ccatgcaggc ttatgaattt 1260
atcaaggctg tggcttggcg atttgaagat agcggcttag gggtgatttt acctcctagt 1320
ttggcgaatc gtgaaggctg ggcaaatcgc ttgggtttga aaatctccgc cgaaacgccg 1380
aagaaaaaac caggacgctt aggattgcag agtttgctca atttccaatg gcacttagcg 1440
attggtgggc aaactatttc taaagctgaa tttgacagac tggtagcttt aaaaagccca 1500
ttggtagaaa ttaacggcga gtgggtggaa ttacgtcccc aagatatcaa aacagctgaa 1560
gcctttttta ctgcgcgtaa agaccaaatg gccttatctt tagaagatgc cttacgtcta 1620
agtagtggcg atacacaagt aattgagaaa ttaccagtag tcagctttga agcctctggc 1680
gcattacaag aattgattgg ggcgctgaca aataatcaag cagttgcacc attacctacg 1740
ccgaaaaact tccaaggaca gttacgtcct tatcaagaaa ggggtgcggc ttggttggcg 1800
ttcctcgaac gctggggttt aggtgcttgt ctcgccgacg acatgggact gggaaaaacg 1860
atacagttca ttgctttcct tctccatctt aaagaacagg atgtattaga aaaaccaact 1920
ttactagtgt gtcctacttc tgttttaggt aactgggaac gagaggtgag aaaatttgca 1980
cctacactta aagttctcca gtatcatggt gacaaacgtc ctaaaggtaa agcatttcaa 2040
gaagcagtaa aaaaacatga tttagttatt acaagttact cattaattca tagagatatc 2100
aaatcattgc agggtattcc ttggcaaata attgttttag atgaagccca aaatgtgaag 2160
aatgcggaag ccaaacaatc acaagcagtc agacaattag aaacaacatt tcgtattgct 2220
ttaacaggta caccagtaga aaatagacta caagaacttt ggtcaatttt agattttctt 2280
aatcctggtt acttaggtaa taagcaattc tttcaaagac gttttgctat gccaattgaa 2340
aagtatggtg atgcagcatc tttaaatcaa ttgcgtgctt tagtgcaacc atttattctg 2400
cgtcggctga aaacagaccg tgatattatt caagacttgc ccgataagca agaaatgaca 2460
gtattttgtg gtttgactgg agaacaagct gcactttatc aaaaagcggt agaaacatct 2520
ttagcagaaa ttgaatcagc cgaaggattg caacgccgag ggatgatttt agctttatta 2580
attaaactca aacaaatctg caatcatcca gcccaatatc tgaaaataaa tacattagaa 2640
caacacagtt ctggaaaact gcaaagatta gaagaaatgt tagaagaggt gttagcagag 2700
agtaatactt acggtgttgc cggtgcggga cgtgctttga tttttaccca atttgcagaa 2760
tggggtaagt tactcaaacc acatttagaa aaacaactag ggcgggaaat atttttctta 2820
tatggtggta cgagtaaaaa gcaacgagaa gaaatgattg accgttttca acacgacccc 2880
caagggccac caattatgat tctctccctc aaagcaggtg gtgtagggtt gaacttaacc 2940
agggcaaatc atgtatttca ctttgataga tggtggaatc cagccgtaga gaatcaagct 3000
acagaccgcg tatttcgcat tggtcaaact cgcaatgtac aggtgcataa atttgtttgt 3060
aatggcacct tagaagagaa aattcacgac atgattgaaa gtaaaaaaca actagcggaa 3120
caggttgttg gagcaggcga agaatggtta actgaattag atacagatca actccgcaac 3180
ttactgatac ttgatcgtag tacagtaatt gatgaagaag cagattga 3228
<210> 60
<211> 1075
<212> PRT
<213> Nostoc sp.
<400> 60
Met Ala Ile Leu His Gly Ser Trp Ile Leu Asn Glu Gln Glu Ser Cys
1 5 10 15
Leu Phe Ile Trp Gly Glu Thr Trp Arg Ser Pro Gln Val Asp Phe Asn
20 25 30
Phe Ala Glu Ile Ser Leu Asn Pro Leu Ala Leu Ser Ala Leu Glu Leu
35 40 45
Ser Glu Trp Leu Gln Ser Gln His Gln Ala Ile Ala Lys Leu Leu Pro
50 55 60
Gln Gln Leu Glu Lys Arg Thr Ser Lys Ala Ala Ser Ser Val Lys Ile
65 70 75 80
Asn Leu Leu Thr His Ser Gln Ile Ile Ala Leu Pro Thr Glu Ile Ser
85 90 95
Gln Pro Arg Lys Lys Glu Thr Ile Leu Ile Ser Pro Val His Ser Ala
100 105 110
Ala Leu Ala Ser Glu Ser Asp Ser Glu Val Tyr Leu Gln Thr Trp Arg
115 120 125
Val Glu Gly Phe Cys Leu Pro Pro Ser Ala Ala Ile Lys Leu Leu Thr
130 135 140
Ser Leu Pro Leu Asn Ile Thr Ser Gly Glu Asn Ala Phe Leu Gly Gly
145 150 155 160
Asp Leu Arg Phe Trp Ser Gln Ile Ala Arg Trp Ser Leu Asp Leu Ile
165 170 175
Ser Arg Ser Lys Phe Leu Pro Ile Ile Gln Arg Gln Pro Asn Asn Ser
180 185 190
Val Ser Ala Lys Trp Gln Val Leu Leu Asp Ser Ala Val Asp Gly Thr
195 200 205
Arg Leu Glu Lys Phe Ala Ala Lys Met Pro Leu Val Cys Arg Thr Tyr
210 215 220
Gln Glu Ile Gly Ser Gly Glu Ser Pro Ile Tyr Ile Asp Phe Pro Ser
225 230 235 240
Gln Pro Gln Asp Leu Ile Leu Gly Phe Leu Asn Ser Ala Ile Asp Thr
245 250 255
Gln Leu Arg Glu Met Val Gly Asn Gln Pro Val Val Glu Thr Arg Leu
260 265 270
Met Ala Ser Leu Pro Ser Ala Val Arg Gln Trp Leu Gln Ala Leu Ile
275 280 285
Ala Ala Ser Asn Ser Ile Asp Ala Asp Ala Val Gly Leu Glu Arg Leu
290 295 300
Glu Ala Ala Leu Lys Ala Trp Thr Met Pro Leu Gln Tyr Gln Leu Ala
305 310 315 320
Ser Lys Asn Gln Phe Arg Thr Cys Phe Glu Leu Arg Ser Pro Glu Pro
325 330 335
Asp Glu Thr Glu Trp Thr Leu Ala Tyr Phe Leu Gln Ala Ala Asp Asp
340 345 350
Pro Glu Phe Leu Val Asp Ala Ala Thr Ile Trp Gln Asn Pro Val Glu
355 360 365
Gln Leu Ile Tyr Gln Gln Arg Thr Ile Glu Glu Pro Gln Glu Thr Phe
370 375 380
Leu Arg Gly Leu Gly Leu Ala Ser Arg Leu Tyr Pro Val Ile Ala Pro
385 390 395 400
Thr Leu Asp Thr Glu Ser Pro Gln Phe Cys His Leu Lys Pro Met Gln
405 410 415
Ala Tyr Glu Phe Ile Lys Ala Val Ala Trp Arg Phe Glu Asp Ser Gly
420 425 430
Leu Gly Val Ile Leu Pro Pro Ser Leu Ala Asn Arg Glu Gly Trp Ala
435 440 445
Asn Arg Leu Gly Leu Lys Ile Ser Ala Glu Thr Pro Lys Lys Lys Pro
450 455 460
Gly Arg Leu Gly Leu Gln Ser Leu Leu Asn Phe Gln Trp His Leu Ala
465 470 475 480
Ile Gly Gly Gln Thr Ile Ser Lys Ala Glu Phe Asp Arg Leu Val Ala
485 490 495
Leu Lys Ser Pro Leu Val Glu Ile Asn Gly Glu Trp Val Glu Leu Arg
500 505 510
Pro Gln Asp Ile Lys Thr Ala Glu Ala Phe Phe Thr Ala Arg Lys Asp
515 520 525
Gln Met Ala Leu Ser Leu Glu Asp Ala Leu Arg Leu Ser Ser Gly Asp
530 535 540
Thr Gln Val Ile Glu Lys Leu Pro Val Val Ser Phe Glu Ala Ser Gly
545 550 555 560
Ala Leu Gln Glu Leu Ile Gly Ala Leu Thr Asn Asn Gln Ala Val Ala
565 570 575
Pro Leu Pro Thr Pro Lys Asn Phe Gln Gly Gln Leu Arg Pro Tyr Gln
580 585 590
Glu Arg Gly Ala Ala Trp Leu Ala Phe Leu Glu Arg Trp Gly Leu Gly
595 600 605
Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Phe Ile
610 615 620
Ala Phe Leu Leu His Leu Lys Glu Gln Asp Val Leu Glu Lys Pro Thr
625 630 635 640
Leu Leu Val Cys Pro Thr Ser Val Leu Gly Asn Trp Glu Arg Glu Val
645 650 655
Arg Lys Phe Ala Pro Thr Leu Lys Val Leu Gln Tyr His Gly Asp Lys
660 665 670
Arg Pro Lys Gly Lys Ala Phe Gln Glu Ala Val Lys Lys His Asp Leu
675 680 685
Val Ile Thr Ser Tyr Ser Leu Ile His Arg Asp Ile Lys Ser Leu Gln
690 695 700
Gly Ile Pro Trp Gln Ile Ile Val Leu Asp Glu Ala Gln Asn Val Lys
705 710 715 720
Asn Ala Glu Ala Lys Gln Ser Gln Ala Val Arg Gln Leu Glu Thr Thr
725 730 735
Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Gln Glu
740 745 750
Leu Trp Ser Ile Leu Asp Phe Leu Asn Pro Gly Tyr Leu Gly Asn Lys
755 760 765
Gln Phe Phe Gln Arg Arg Phe Ala Met Pro Ile Glu Lys Tyr Gly Asp
770 775 780
Ala Ala Ser Leu Asn Gln Leu Arg Ala Leu Val Gln Pro Phe Ile Leu
785 790 795 800
Arg Arg Leu Lys Thr Asp Arg Asp Ile Ile Gln Asp Leu Pro Asp Lys
805 810 815
Gln Glu Met Thr Val Phe Cys Gly Leu Thr Gly Glu Gln Ala Ala Leu
820 825 830
Tyr Gln Lys Ala Val Glu Thr Ser Leu Ala Glu Ile Glu Ser Ala Glu
835 840 845
Gly Leu Gln Arg Arg Gly Met Ile Leu Ala Leu Leu Ile Lys Leu Lys
850 855 860
Gln Ile Cys Asn His Pro Ala Gln Tyr Leu Lys Ile Asn Thr Leu Glu
865 870 875 880
Gln His Ser Ser Gly Lys Leu Gln Arg Leu Glu Glu Met Leu Glu Glu
885 890 895
Val Leu Ala Glu Ser Asn Thr Tyr Gly Val Ala Gly Ala Gly Arg Ala
900 905 910
Leu Ile Phe Thr Gln Phe Ala Glu Trp Gly Lys Leu Leu Lys Pro His
915 920 925
Leu Glu Lys Gln Leu Gly Arg Glu Ile Phe Phe Leu Tyr Gly Gly Thr
930 935 940
Ser Lys Lys Gln Arg Glu Glu Met Ile Asp Arg Phe Gln His Asp Pro
945 950 955 960
Gln Gly Pro Pro Ile Met Ile Leu Ser Leu Lys Ala Gly Gly Val Gly
965 970 975
Leu Asn Leu Thr Arg Ala Asn His Val Phe His Phe Asp Arg Trp Trp
980 985 990
Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Val Phe Arg Ile Gly
995 1000 1005
Gln Thr Arg Asn Val Gln Val His Lys Phe Val Cys Asn Gly Thr
1010 1015 1020
Leu Glu Glu Lys Ile His Asp Met Ile Glu Ser Lys Lys Gln Leu
1025 1030 1035
Ala Glu Gln Val Val Gly Ala Gly Glu Glu Trp Leu Thr Glu Leu
1040 1045 1050
Asp Thr Asp Gln Leu Arg Asn Leu Leu Ile Leu Asp Arg Ser Thr
1055 1060 1065
Val Ile Asp Glu Glu Ala Asp
1070 1075
<210> 61
<211> 3168
<212> DNA
<213> Nostoc sp.
<400> 61
atgaaagtcc ttcatggctc gtggatacca aaccaatata gcgattttgt gcagtctgga 60
gcattttatc tatgggtaga aactccgatt aataacaaaa agcgtactca tacacaagtt 120
catcccggac atctatcttc tcttgaatta ctcaattttc tgactcaaac tttggggatt 180
aaagaaactg aagcgcaatt aaaacaacgg atatgttcta aatattttgc cctaccaact 240
gctaataatg agccattacc ttcaccagag ttagtcaaat atttagaagt agaagttcct 300
gaagagtatg aaaattttca atattggcag gtaacttgtt atgaaactgt tacttctgtg 360
aaagcagtga tagcaattaa tattattaaa ttactcaaag atattcattt tttagccctg 420
tacaatgcta gtgaatttca attagggtca gatttattat tttggtatca ttatacgcaa 480
tcatttagac aaataattac taaggatcaa tatattccat ctttaaaata tagagcgaac 540
gcagcgacta caaagaaaaa acctaaacaa ccacccccag gatttgaaat atatgctggt 600
tgggaaataa tttccgagca atacgaagcc aatattcaaa aatatattga atatatgcca 660
ttgatttgtg tagcaggtaa cagcacacaa actgataaat tagaattttt tgctccagaa 720
actctattac gccacttcag cgagtatctg cttaataatt tagtgagtaa gacaccattg 780
accgcagcat ttgaaaaaca aattgatgat tctttaattc actattgtct ttatccccaa 840
aaacacaacc cactcaaaac ccatactgct ctccaagagt atcagcagtg gttgggatgg 900
aaaaacagga ttatccgtac tcaagctgaa tcaccatttc atctttgctt ccaattacat 960
tcacctgatg ctgaacaaat tgacaattgg cagatgcaat ttttagtatc aagtaaaaaa 1020
gatccgtctc taaaattagc tttggcagat tactggataa tgaattccaa aaccaaagct 1080
ggtgtacata aagagtttgg caaagatttc gatactaatt tactgctgaa tttaggctat 1140
gcagcaagaa tgtatcccaa actttggcaa ggtttagaaa cggactctcc cacaggaatg 1200
cagctaagtt tagatgaggc gtttgatttt ctcaaagata gtgcttgggt gttggaagac 1260
tcaggattta aggtcattgt cccggcttgg tatactccgg ctggtcgtcg tcgtgcgaaa 1320
atccgcctca aagcttctag tggtcgcaag gtagctgcta cggtagggga aagcaaaagt 1380
tatttcggtt tagattcact agtgcagtat cagtatgaat tagcaattgg agagcaaact 1440
ctcacacctc aagaatggga acaattgatt aatactaaag caccactagt gcattttcgc 1500
ggtcaatgga tggaattaga ccgggataaa atgcagcagt tattagaatt ttggcagtcc 1560
cacggcgatg aacagcccca aatgagcttg ttagagttca tgcaacgcag cgcccaaggg 1620
gaagatgact gggaaattga atatgatgca gctttatcag aaataatggc aaagttacaa 1680
gataagagtc agctagagcc aatttctgaa gacttaaatt tgcaaggcaa cctgcgagaa 1740
tatcaaaagc ggggtgtagc ctggttacaa tatttagaaa aattgggatt aaatggctgt 1800
ttagccgatg atatgggact gggtaagtcc gtgcaggtaa ttgcgagatt agtacaggag 1860
aaagatagcc aaagttcccc attaccgaca ttattaattg cgccgacttc ggttgttggt 1920
aactggcaaa gagaaattgc taagtttgca ccccatttaa aaactatggt gcatcatggt 1980
agcgatcgcc tgcaagatgc tgcggagttt aagtccgcct gtcaacagca tgatgtggtg 2040
ataagttcct ttactttggc tcgcttagat gaaaaactcc taaatagtgt gacatggcaa 2100
cggttagttt tagatgaagc acaaaacatt aaaaatccca aagcagcgca gactaaagct 2160
atactcaaac tcagtgctaa acaccgtcta gctttaactg gtacaccagt tgagaaccgc 2220
ttacttgatt tgtggtcaat ttttaatttt ctcaatcccg gttatttagg gaaagaagca 2280
cagtttcgca aatcctttga aattcccatc cagaaggaca acgataaagt aaaatcgact 2340
accttaaaga aactggttga accgttaatt ttacgacggg tcaaaacaga ccaatcaatt 2400
attaaagact taccagataa agttgaacaa aaactctata ccaacctcac caaagaacag 2460
gcttcgctat atgaagtggt agtcagagat gtggaagaaa aattgcaaga agctgaggga 2520
atacaacgca aaggtttaat tctctcaacg ctgatgaaat taaaacagat ttgcaatcat 2580
cccagacagt tcctccaaga taatagcgaa tttttaccgg agcgctcgca caaactttcc 2640
cgcttagtcg aaatggtaga tgaagccatt tctgaaggag aaagtctttt aatatttagt 2700
caatttacag aagtctgcga acaaatagaa aaatatctca aacacaactt acattgcaat 2760
acctactacc tacatggggg tacaagtcgc caacgtcggg aacaaatgat tagtgacttt 2820
caaaatcctg atacggaagc atctgtattt gtcctttccc taaaagctgg cggcgtgggg 2880
attactttaa ctaaagccaa ccacgtcttt cattttgacc gttggtggaa tccagccgtt 2940
gaagaccaag ccacagaccg cgcttttcgc ataggtcaga aaaaaaatgt gtttgtacat 3000
aaatttgtcg cccttgggac tttagaagaa agaatcgacc aaatgattga agataagaaa 3060
aaactttctt ccgccgtagt tggtagtgat gaatcgtggc taaccgaatt agataacgaa 3120
gcctttaaga aactaattgc cttgaataaa agcacaatta tggagtag 3168
<210> 62
<211> 1055
<212> PRT
<213> Nostoc sp.
<400> 62
Met Lys Val Leu His Gly Ser Trp Ile Pro Asn Gln Tyr Ser Asp Phe
1 5 10 15
Val Gln Ser Gly Ala Phe Tyr Leu Trp Val Glu Thr Pro Ile Asn Asn
20 25 30
Lys Lys Arg Thr His Thr Gln Val His Pro Gly His Leu Ser Ser Leu
35 40 45
Glu Leu Leu Asn Phe Leu Thr Gln Thr Leu Gly Ile Lys Glu Thr Glu
50 55 60
Ala Gln Leu Lys Gln Arg Ile Cys Ser Lys Tyr Phe Ala Leu Pro Thr
65 70 75 80
Ala Asn Asn Glu Pro Leu Pro Ser Pro Glu Leu Val Lys Tyr Leu Glu
85 90 95
Val Glu Val Pro Glu Glu Tyr Glu Asn Phe Gln Tyr Trp Gln Val Thr
100 105 110
Cys Tyr Glu Thr Val Thr Ser Val Lys Ala Val Ile Ala Ile Asn Ile
115 120 125
Ile Lys Leu Leu Lys Asp Ile His Phe Leu Ala Leu Tyr Asn Ala Ser
130 135 140
Glu Phe Gln Leu Gly Ser Asp Leu Leu Phe Trp Tyr His Tyr Thr Gln
145 150 155 160
Ser Phe Arg Gln Ile Ile Thr Lys Asp Gln Tyr Ile Pro Ser Leu Lys
165 170 175
Tyr Arg Ala Asn Ala Ala Thr Thr Lys Lys Lys Pro Lys Gln Pro Pro
180 185 190
Pro Gly Phe Glu Ile Tyr Ala Gly Trp Glu Ile Ile Ser Glu Gln Tyr
195 200 205
Glu Ala Asn Ile Gln Lys Tyr Ile Glu Tyr Met Pro Leu Ile Cys Val
210 215 220
Ala Gly Asn Ser Thr Gln Thr Asp Lys Leu Glu Phe Phe Ala Pro Glu
225 230 235 240
Thr Leu Leu Arg His Phe Ser Glu Tyr Leu Leu Asn Asn Leu Val Ser
245 250 255
Lys Thr Pro Leu Thr Ala Ala Phe Glu Lys Gln Ile Asp Asp Ser Leu
260 265 270
Ile His Tyr Cys Leu Tyr Pro Gln Lys His Asn Pro Leu Lys Thr His
275 280 285
Thr Ala Leu Gln Glu Tyr Gln Gln Trp Leu Gly Trp Lys Asn Arg Ile
290 295 300
Ile Arg Thr Gln Ala Glu Ser Pro Phe His Leu Cys Phe Gln Leu His
305 310 315 320
Ser Pro Asp Ala Glu Gln Ile Asp Asn Trp Gln Met Gln Phe Leu Val
325 330 335
Ser Ser Lys Lys Asp Pro Ser Leu Lys Leu Ala Leu Ala Asp Tyr Trp
340 345 350
Ile Met Asn Ser Lys Thr Lys Ala Gly Val His Lys Glu Phe Gly Lys
355 360 365
Asp Phe Asp Thr Asn Leu Leu Leu Asn Leu Gly Tyr Ala Ala Arg Met
370 375 380
Tyr Pro Lys Leu Trp Gln Gly Leu Glu Thr Asp Ser Pro Thr Gly Met
385 390 395 400
Gln Leu Ser Leu Asp Glu Ala Phe Asp Phe Leu Lys Asp Ser Ala Trp
405 410 415
Val Leu Glu Asp Ser Gly Phe Lys Val Ile Val Pro Ala Trp Tyr Thr
420 425 430
Pro Ala Gly Arg Arg Arg Ala Lys Ile Arg Leu Lys Ala Ser Ser Gly
435 440 445
Arg Lys Val Ala Ala Thr Val Gly Glu Ser Lys Ser Tyr Phe Gly Leu
450 455 460
Asp Ser Leu Val Gln Tyr Gln Tyr Glu Leu Ala Ile Gly Glu Gln Thr
465 470 475 480
Leu Thr Pro Gln Glu Trp Glu Gln Leu Ile Asn Thr Lys Ala Pro Leu
485 490 495
Val His Phe Arg Gly Gln Trp Met Glu Leu Asp Arg Asp Lys Met Gln
500 505 510
Gln Leu Leu Glu Phe Trp Gln Ser His Gly Asp Glu Gln Pro Gln Met
515 520 525
Ser Leu Leu Glu Phe Met Gln Arg Ser Ala Gln Gly Glu Asp Asp Trp
530 535 540
Glu Ile Glu Tyr Asp Ala Ala Leu Ser Glu Ile Met Ala Lys Leu Gln
545 550 555 560
Asp Lys Ser Gln Leu Glu Pro Ile Ser Glu Asp Leu Asn Leu Gln Gly
565 570 575
Asn Leu Arg Glu Tyr Gln Lys Arg Gly Val Ala Trp Leu Gln Tyr Leu
580 585 590
Glu Lys Leu Gly Leu Asn Gly Cys Leu Ala Asp Asp Met Gly Leu Gly
595 600 605
Lys Ser Val Gln Val Ile Ala Arg Leu Val Gln Glu Lys Asp Ser Gln
610 615 620
Ser Ser Pro Leu Pro Thr Leu Leu Ile Ala Pro Thr Ser Val Val Gly
625 630 635 640
Asn Trp Gln Arg Glu Ile Ala Lys Phe Ala Pro His Leu Lys Thr Met
645 650 655
Val His His Gly Ser Asp Arg Leu Gln Asp Ala Ala Glu Phe Lys Ser
660 665 670
Ala Cys Gln Gln His Asp Val Val Ile Ser Ser Phe Thr Leu Ala Arg
675 680 685
Leu Asp Glu Lys Leu Leu Asn Ser Val Thr Trp Gln Arg Leu Val Leu
690 695 700
Asp Glu Ala Gln Asn Ile Lys Asn Pro Lys Ala Ala Gln Thr Lys Ala
705 710 715 720
Ile Leu Lys Leu Ser Ala Lys His Arg Leu Ala Leu Thr Gly Thr Pro
725 730 735
Val Glu Asn Arg Leu Leu Asp Leu Trp Ser Ile Phe Asn Phe Leu Asn
740 745 750
Pro Gly Tyr Leu Gly Lys Glu Ala Gln Phe Arg Lys Ser Phe Glu Ile
755 760 765
Pro Ile Gln Lys Asp Asn Asp Lys Val Lys Ser Thr Thr Leu Lys Lys
770 775 780
Leu Val Glu Pro Leu Ile Leu Arg Arg Val Lys Thr Asp Gln Ser Ile
785 790 795 800
Ile Lys Asp Leu Pro Asp Lys Val Glu Gln Lys Leu Tyr Thr Asn Leu
805 810 815
Thr Lys Glu Gln Ala Ser Leu Tyr Glu Val Val Val Arg Asp Val Glu
820 825 830
Glu Lys Leu Gln Glu Ala Glu Gly Ile Gln Arg Lys Gly Leu Ile Leu
835 840 845
Ser Thr Leu Met Lys Leu Lys Gln Ile Cys Asn His Pro Arg Gln Phe
850 855 860
Leu Gln Asp Asn Ser Glu Phe Leu Pro Glu Arg Ser His Lys Leu Ser
865 870 875 880
Arg Leu Val Glu Met Val Asp Glu Ala Ile Ser Glu Gly Glu Ser Leu
885 890 895
Leu Ile Phe Ser Gln Phe Thr Glu Val Cys Glu Gln Ile Glu Lys Tyr
900 905 910
Leu Lys His Asn Leu His Cys Asn Thr Tyr Tyr Leu His Gly Gly Thr
915 920 925
Ser Arg Gln Arg Arg Glu Gln Met Ile Ser Asp Phe Gln Asn Pro Asp
930 935 940
Thr Glu Ala Ser Val Phe Val Leu Ser Leu Lys Ala Gly Gly Val Gly
945 950 955 960
Ile Thr Leu Thr Lys Ala Asn His Val Phe His Phe Asp Arg Trp Trp
965 970 975
Asn Pro Ala Val Glu Asp Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly
980 985 990
Gln Lys Lys Asn Val Phe Val His Lys Phe Val Ala Leu Gly Thr Leu
995 1000 1005
Glu Glu Arg Ile Asp Gln Met Ile Glu Asp Lys Lys Lys Leu Ser
1010 1015 1020
Ser Ala Val Val Gly Ser Asp Glu Ser Trp Leu Thr Glu Leu Asp
1025 1030 1035
Asn Glu Ala Phe Lys Lys Leu Ile Ala Leu Asn Lys Ser Thr Ile
1040 1045 1050
Met Glu
1055
<210> 63
<211> 2856
<212> DNA
<213> Nostoc punctiforme
<400> 63
atggcgattt tacacagtaa ttggttacta aaaagtcaaa aaggttgttt atttatttgg 60
ggagaaactt ggcgatcgcc acgagttaat ttcgagtcta atggatctgg agatatccca 120
ctaaatccat tggcaatgac atcactagag ttgagcgagt ggttggtttc ccagaagatg 180
gccattacca actttatcca gcaaccccaa attgccatcg ctactactgg gcgaacacgt 240
aaagcagcca ctgccactga gataaactta ccaacgcatt cacaaataat tgccttacca 300
acttatattc ccgaagagag tgcagaagga acatctgcaa ttttccctgt gcattctgcc 360
agcttgagac tagaaacaga ctctccgcaa tatttgcaac cgtggctagt tgagggtttt 420
tgtcttaacc ccagcgaagc agtaaaattt ctcgctgctg ttcccctgaa tgctgctaaa 480
ggggaagatg cttttttagg aggagattta cgtttttggt cgcaagtttc ccgatggagt 540
ttagatttaa tctcgcggtg taagttttta ccaagaattg aacggcaatc agacggtgca 600
tttgctgcta aatggcaagt acttctagac agtgctgtag atggaactcg cctagaaaag 660
ttttctgcgg atatgccgtt ggtttgccgc acttatcagg agggagtggg gactggggac 720
tggggactga ggactgggga ggagttttcc caatccctaa tccctaattc ccaatcccta 780
ctttatgtaa acttccctac tgaacctcaa gaattgttgc tgggatttct caacagtacg 840
atagatgccc aagtgcgagg gatggtgggt tctcagcctc caatggaagc taaggcaatg 900
gcatctttac catctggggt gcggcagtgg ttgcaaggct tgactagtac atctggtaca 960
gttaacgcag atgccattga agtggaacga ctggaagcgg cactgaaggc ttggatgatg 1020
ccgctacaat accaattaac tcttaaaact ctatttcgta cctgttttca actgcgttct 1080
ccagaagctg gcgaaacaga ttggacattg gcgtattttc tgcaagcggc tgacgatcct 1140
gattttttgg tggatgcggc aactatttgg aacaatccag ttgaacgttt ggtttatgaa 1200
aatcgaacaa ttgagcaacc acaggaaaca tttttgcgag gtttaggggt agcttcccga 1260
ttatatccag cgatcgcacc cagttttgaa accgaatatc cccaatcttc tcggatcaca 1320
cccatgcaag cttatgagtt tatcaaggct gtagcttgga ggttggaaga cagtggtttg 1380
ggggtaattt tgcctcctag tttagcgaac cgcgaaggat gggcaaatcg tttgggtttg 1440
aaaattactg ctgaaacccc aaagaaaaag cagggacgtt tagggttgca aagtctgctg 1500
aatttccaat ggcaattggc aattggcgga cagactattt ccaaagctga gtttgataaa 1560
cttgtggctt taaatagtcc actagtggaa attaacggtg agtgggtaga attgcggccc 1620
caagatatca agacagccca aacatttttt accactcgca aagaccaaat ggcgctttcc 1680
ttggaagatg ccttgcgttt cagtacagga gatacccagg taattgaaaa attaccagtg 1740
gtcagctttg aggcatctgg ggcattgcaa gagttgattg gggcgctaaa taataatcaa 1800
gcgatcgcac ctttaccgac accagtaggc tttaaaggac agttgcgacc ttatcaagaa 1860
cgtggtgctg cttggctgtc cttcttggaa cgttggggct taggcgcgtg tctcgccgac 1920
gatatgggac tcggtaaaac tattcagttt attgcttttt tgctacatct taaagaacag 1980
gatgcactag aaaattcaac actgctagtt tgtccaactt ctgttttagg caactgggaa 2040
agggaagtca ataaatttgc accaagcctg aaaattttgc aatatcacgg tgacaaacgt 2100
ccaaaaggga aagcgttttt agaagcagtg aaaaatcacg atttaatcgt taccagctac 2160
tcactgcttc atcgggatat caagtcattg caaagtgttc cttggcagat aattgtttta 2220
gacgaagccc agaatgtgaa aaatccagag gcgaagcagt caaaagctgt gcggcaatta 2280
gaagctacat ttcgcattgc attaacgggg acaccagtag aaaatagact gcaagaacta 2340
tggtctattt tggattttct caatccaggg tatttaggta ataagcaatt tttccagcgg 2400
cggtttgcca tgccaattga aaagtatggt gatacggctt ctttgggtca attacgttca 2460
ttagttcagc catttatact gcggcgatta aaaagcgatc gcgaaattat tcaagacttg 2520
ccagataagc aagagatgac cgtattttgc ggtttaactg ccgaccaagc tgcactttat 2580
caacaagttg tagaacaatc tttagtagag atagaatctg ctgaaggatt gcaacgtcgg 2640
gggatgattt tggctttgct aatcaaactg aagcaaatct gcaatcatcc agcccaatat 2700
ttgaaacagg cgacattaga gcaacataat tcagccaaac ttctgcggct agaagaaatg 2760
ttagaagaag ttttagcaga aagtgaccgg gctttaatct ttacacaatt tgcagagtgg 2820
ggtaagttac ttaaacccaa aagtgttgaa tgttaa 2856
<210> 64
<211> 951
<212> PRT
<213> Nostoc punctiforme
<400> 64
Met Ala Ile Leu His Ser Asn Trp Leu Leu Lys Ser Gln Lys Gly Cys
1 5 10 15
Leu Phe Ile Trp Gly Glu Thr Trp Arg Ser Pro Arg Val Asn Phe Glu
20 25 30
Ser Asn Gly Ser Gly Asp Ile Pro Leu Asn Pro Leu Ala Met Thr Ser
35 40 45
Leu Glu Leu Ser Glu Trp Leu Val Ser Gln Lys Met Ala Ile Thr Asn
50 55 60
Phe Ile Gln Gln Pro Gln Ile Ala Ile Ala Thr Thr Gly Arg Thr Arg
65 70 75 80
Lys Ala Ala Thr Ala Thr Glu Ile Asn Leu Pro Thr His Ser Gln Ile
85 90 95
Ile Ala Leu Pro Thr Tyr Ile Pro Glu Glu Ser Ala Glu Gly Thr Ser
100 105 110
Ala Ile Phe Pro Val His Ser Ala Ser Leu Arg Leu Glu Thr Asp Ser
115 120 125
Pro Gln Tyr Leu Gln Pro Trp Leu Val Glu Gly Phe Cys Leu Asn Pro
130 135 140
Ser Glu Ala Val Lys Phe Leu Ala Ala Val Pro Leu Asn Ala Ala Lys
145 150 155 160
Gly Glu Asp Ala Phe Leu Gly Gly Asp Leu Arg Phe Trp Ser Gln Val
165 170 175
Ser Arg Trp Ser Leu Asp Leu Ile Ser Arg Cys Lys Phe Leu Pro Arg
180 185 190
Ile Glu Arg Gln Ser Asp Gly Ala Phe Ala Ala Lys Trp Gln Val Leu
195 200 205
Leu Asp Ser Ala Val Asp Gly Thr Arg Leu Glu Lys Phe Ser Ala Asp
210 215 220
Met Pro Leu Val Cys Arg Thr Tyr Gln Glu Gly Val Gly Thr Gly Asp
225 230 235 240
Trp Gly Leu Arg Thr Gly Glu Glu Phe Ser Gln Ser Leu Ile Pro Asn
245 250 255
Ser Gln Ser Leu Leu Tyr Val Asn Phe Pro Thr Glu Pro Gln Glu Leu
260 265 270
Leu Leu Gly Phe Leu Asn Ser Thr Ile Asp Ala Gln Val Arg Gly Met
275 280 285
Val Gly Ser Gln Pro Pro Met Glu Ala Lys Ala Met Ala Ser Leu Pro
290 295 300
Ser Gly Val Arg Gln Trp Leu Gln Gly Leu Thr Ser Thr Ser Gly Thr
305 310 315 320
Val Asn Ala Asp Ala Ile Glu Val Glu Arg Leu Glu Ala Ala Leu Lys
325 330 335
Ala Trp Met Met Pro Leu Gln Tyr Gln Leu Thr Leu Lys Thr Leu Phe
340 345 350
Arg Thr Cys Phe Gln Leu Arg Ser Pro Glu Ala Gly Glu Thr Asp Trp
355 360 365
Thr Leu Ala Tyr Phe Leu Gln Ala Ala Asp Asp Pro Asp Phe Leu Val
370 375 380
Asp Ala Ala Thr Ile Trp Asn Asn Pro Val Glu Arg Leu Val Tyr Glu
385 390 395 400
Asn Arg Thr Ile Glu Gln Pro Gln Glu Thr Phe Leu Arg Gly Leu Gly
405 410 415
Val Ala Ser Arg Leu Tyr Pro Ala Ile Ala Pro Ser Phe Glu Thr Glu
420 425 430
Tyr Pro Gln Ser Ser Arg Ile Thr Pro Met Gln Ala Tyr Glu Phe Ile
435 440 445
Lys Ala Val Ala Trp Arg Leu Glu Asp Ser Gly Leu Gly Val Ile Leu
450 455 460
Pro Pro Ser Leu Ala Asn Arg Glu Gly Trp Ala Asn Arg Leu Gly Leu
465 470 475 480
Lys Ile Thr Ala Glu Thr Pro Lys Lys Lys Gln Gly Arg Leu Gly Leu
485 490 495
Gln Ser Leu Leu Asn Phe Gln Trp Gln Leu Ala Ile Gly Gly Gln Thr
500 505 510
Ile Ser Lys Ala Glu Phe Asp Lys Leu Val Ala Leu Asn Ser Pro Leu
515 520 525
Val Glu Ile Asn Gly Glu Trp Val Glu Leu Arg Pro Gln Asp Ile Lys
530 535 540
Thr Ala Gln Thr Phe Phe Thr Thr Arg Lys Asp Gln Met Ala Leu Ser
545 550 555 560
Leu Glu Asp Ala Leu Arg Phe Ser Thr Gly Asp Thr Gln Val Ile Glu
565 570 575
Lys Leu Pro Val Val Ser Phe Glu Ala Ser Gly Ala Leu Gln Glu Leu
580 585 590
Ile Gly Ala Leu Asn Asn Asn Gln Ala Ile Ala Pro Leu Pro Thr Pro
595 600 605
Val Gly Phe Lys Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Ala Ala
610 615 620
Trp Leu Ser Phe Leu Glu Arg Trp Gly Leu Gly Ala Cys Leu Ala Asp
625 630 635 640
Asp Met Gly Leu Gly Lys Thr Ile Gln Phe Ile Ala Phe Leu Leu His
645 650 655
Leu Lys Glu Gln Asp Ala Leu Glu Asn Ser Thr Leu Leu Val Cys Pro
660 665 670
Thr Ser Val Leu Gly Asn Trp Glu Arg Glu Val Asn Lys Phe Ala Pro
675 680 685
Ser Leu Lys Ile Leu Gln Tyr His Gly Asp Lys Arg Pro Lys Gly Lys
690 695 700
Ala Phe Leu Glu Ala Val Lys Asn His Asp Leu Ile Val Thr Ser Tyr
705 710 715 720
Ser Leu Leu His Arg Asp Ile Lys Ser Leu Gln Ser Val Pro Trp Gln
725 730 735
Ile Ile Val Leu Asp Glu Ala Gln Asn Val Lys Asn Pro Glu Ala Lys
740 745 750
Gln Ser Lys Ala Val Arg Gln Leu Glu Ala Thr Phe Arg Ile Ala Leu
755 760 765
Thr Gly Thr Pro Val Glu Asn Arg Leu Gln Glu Leu Trp Ser Ile Leu
770 775 780
Asp Phe Leu Asn Pro Gly Tyr Leu Gly Asn Lys Gln Phe Phe Gln Arg
785 790 795 800
Arg Phe Ala Met Pro Ile Glu Lys Tyr Gly Asp Thr Ala Ser Leu Gly
805 810 815
Gln Leu Arg Ser Leu Val Gln Pro Phe Ile Leu Arg Arg Leu Lys Ser
820 825 830
Asp Arg Glu Ile Ile Gln Asp Leu Pro Asp Lys Gln Glu Met Thr Val
835 840 845
Phe Cys Gly Leu Thr Ala Asp Gln Ala Ala Leu Tyr Gln Gln Val Val
850 855 860
Glu Gln Ser Leu Val Glu Ile Glu Ser Ala Glu Gly Leu Gln Arg Arg
865 870 875 880
Gly Met Ile Leu Ala Leu Leu Ile Lys Leu Lys Gln Ile Cys Asn His
885 890 895
Pro Ala Gln Tyr Leu Lys Gln Ala Thr Leu Glu Gln His Asn Ser Ala
900 905 910
Lys Leu Leu Arg Leu Glu Glu Met Leu Glu Glu Val Leu Ala Glu Ser
915 920 925
Asp Arg Ala Leu Ile Phe Thr Gln Phe Ala Glu Trp Gly Lys Leu Leu
930 935 940
Lys Pro Lys Ser Val Glu Cys
945 950
<210> 65
<211> 3024
<212> DNA
<213> Pelodictyon phaeoclathratiforme
<400> 65
atgattgcgc tgcacatctc catcattgac ggagtcccgc tactctggag tgagggaaaa 60
aagatcggga tgctgaagga gttacgcctc gcaacggctg gaatcggcat gttttccctg 120
ctcgacaaca ccacaaaaga gttttgtgtc tggctgccct gccgcgagaa aaaagctgtc 180
ccatcatctc cgcttgtcgg cgccatgccc gacctgagtg atgaagagca actccatgcc 240
tttccgatta ccgcgcttcg gctgaatttc aacgctctgt tcgagctttc cctgcttacg 300
gaaaagggca acatccccgg cagtggcatc atcttcggaa gctctctcca ctgggcacgg 360
caggtagtaa aaattgcact gaacattgtc agaacccagt cgctgctccc ttcgatcatc 420
aaaaacgata cattctggga ggccttgtgg ttgcccctcc ccgacagtgc cacatccctc 480
gcagttgaac agcttgccga tgccatgcct gcggtctgtc gctctctcgg ccgcaccgac 540
acgcaaccgc cggaaacacc aaaaaagtta ctgctcaaag gacttctctc tttccttgtc 600
aatacactgt cacgtacttt tgaaagagca ggggtgccaa aaatcagtga cttcgagagt 660
atccatgacg cgtggcttca tgcattatca aacagtgatc cccggctgaa atggaaaaat 720
gagcaggaga ttgagcagtt tgcctgtcag ctcaacgcat ggcggcgtcc cattgacctg 780
catgagcgat cacccttcag gttttgcctg caactgacag agccaccact gaaagggcgg 840
aaaaaggagc gctggcatgt tgcctatcaa ctgcagttga aagcggatcc aagcctgatt 900
cttgacgccg gggatctctg gaaccccgaa agcgaggcat cacagcacgc tttaacgtat 960
acctccgatt gtaccgaatt cctgcttact tccctgggac aagcctccgg cctctgcccc 1020
gcagtcaccc aaagcctgaa aaagaagcag ccgggtggct ttgatcttga taccgaaggg 1080
gcttacagat ttttgctgga gtatgcggaa ctgttgcgaa gcgcaggatt tgtggtcaag 1140
cttccctcgt ggtggatcgg tcgcagagga gtcaaccgta tcgggatcaa gacaaaagtg 1200
aagcttccct ctatgaaagg aagcgggtcg ggtctcacgc tggatcgcat ggttgcctgc 1260
gattatgctg ctgcacttgg caatgaggag cttgacctgc aggagctgaa aacactggca 1320
aacctgaaag ttccgctggt acgggtgcgc ggacagtgga cacagattga ccataaggag 1380
cttgccaatg ctctccattt tcttgaaaaa catccaactg gtgaactttc tgccagagaa 1440
ctcctctcaa cagctctcgg agcacaaaaa aaggaggatg ctctctttct tcgatcggtt 1500
gaaatcgagg ggtggcttca ggaactgctt gaaaaacttt cctctcaggg acaatttgaa 1560
ctgcttccac cacctgagca tttcgaggga acgcttcgcc tctatcagga gcgaggcttt 1620
tcatggctct catttctccg caagtgggga ctgggcgcct gtcttgccga cgacatgggc 1680
cttggcaaaa ccattcagac gcttgcactg ctgcagcggg agcgtgaact tggagaaaaa 1740
agggcggtgc tcctgatctg ccccacctct gtagtcaaca actggcgaaa ggaggcggag 1800
cggttcactc cggatttagc ggtgctggtg catcatggta tcgaccggat gaaaacagca 1860
gattttcgca aagctgcaag cgcttcagcc cttgtcattt caagctatgg attgttacag 1920
cgcgaccttg aatttctgtc gaaggttccc tgggcaggca ttattctcga tgaagcgcag 1980
aacatcaaaa accctgagac aaaacagtca aaagctgccc gaacaatccg ggctgattac 2040
cgtattgccc tgaccggcac tcccgttgaa aatcatgtcg gcgacctttg ggcactcatg 2100
gattttctca atcccggttt tcttggaacc cagcactttt tcaaacagaa cttctacacg 2160
ccgattcagt ggtatggcga ccctgaggct tcagcacgac tgaagtcgct gaccggcccg 2220
tttattctgc gccgcatgaa aagcgacaag tcgattattt ccgatctgcc cgacaagatc 2280
gaaatgaaag agtattgctc gctgaccaaa gagcaggcat cgctctacaa ggctgttgtc 2340
gatgaactgc aggagaaaat tgaaagcgcc gaagggattg accggcgggg ccttgtactt 2400
gcgctgctgg tcaagctcaa gcaggtctgc aaccatccgg cacatttgct tggcgacaac 2460
tctgccattg cacatcgttc aggaaaaata aaacgcctga ccgaactgct tggcgacatc 2520
cgcgaagctg gcgaaaaaac gctgctcttt acacagttta ccatgatggg aacgatgctc 2580
cagcactatc ttcaggagtt gtacggtgaa gaggtactgt ttctgcacgg tggcgtaacc 2640
aaaaaaaggc gggatgagat ggtagagagc ttccagaagg aagagggcag ttcaccctcc 2700
atctttattc tctcactgaa agccggagga acgggtctta acctgacaac agcgaaccac 2760
gttgttcact ttgaccgatg gtggaacccg gcagtagaga atcaggcaac tgaccgggct 2820
ttccgtatcg ggcagcacaa aaacgttgaa gttcataaat ttattacgac gggcacgctc 2880
gaagagcgca ttgatgagat gattgagaaa aaaacaacgg tcgccggcca ggttctcgga 2940
acgggtgagc agtggctgac cgaactgtcg aacaatgatc tgcgcaagct cattatgctc 3000
ggacaggaag caatgggaga ataa 3024
<210> 66
<211> 1007
<212> PRT
<213> Pelodictyon phaeoclathratiforme
<400> 66
Met Ile Ala Leu His Ile Ser Ile Ile Asp Gly Val Pro Leu Leu Trp
1 5 10 15
Ser Glu Gly Lys Lys Ile Gly Met Leu Lys Glu Leu Arg Leu Ala Thr
20 25 30
Ala Gly Ile Gly Met Phe Ser Leu Leu Asp Asn Thr Thr Lys Glu Phe
35 40 45
Cys Val Trp Leu Pro Cys Arg Glu Lys Lys Ala Val Pro Ser Ser Pro
50 55 60
Leu Val Gly Ala Met Pro Asp Leu Ser Asp Glu Glu Gln Leu His Ala
65 70 75 80
Phe Pro Ile Thr Ala Leu Arg Leu Asn Phe Asn Ala Leu Phe Glu Leu
85 90 95
Ser Leu Leu Thr Glu Lys Gly Asn Ile Pro Gly Ser Gly Ile Ile Phe
100 105 110
Gly Ser Ser Leu His Trp Ala Arg Gln Val Val Lys Ile Ala Leu Asn
115 120 125
Ile Val Arg Thr Gln Ser Leu Leu Pro Ser Ile Ile Lys Asn Asp Thr
130 135 140
Phe Trp Glu Ala Leu Trp Leu Pro Leu Pro Asp Ser Ala Thr Ser Leu
145 150 155 160
Ala Val Glu Gln Leu Ala Asp Ala Met Pro Ala Val Cys Arg Ser Leu
165 170 175
Gly Arg Thr Asp Thr Gln Pro Pro Glu Thr Pro Lys Lys Leu Leu Leu
180 185 190
Lys Gly Leu Leu Ser Phe Leu Val Asn Thr Leu Ser Arg Thr Phe Glu
195 200 205
Arg Ala Gly Val Pro Lys Ile Ser Asp Phe Glu Ser Ile His Asp Ala
210 215 220
Trp Leu His Ala Leu Ser Asn Ser Asp Pro Arg Leu Lys Trp Lys Asn
225 230 235 240
Glu Gln Glu Ile Glu Gln Phe Ala Cys Gln Leu Asn Ala Trp Arg Arg
245 250 255
Pro Ile Asp Leu His Glu Arg Ser Pro Phe Arg Phe Cys Leu Gln Leu
260 265 270
Thr Glu Pro Pro Leu Lys Gly Arg Lys Lys Glu Arg Trp His Val Ala
275 280 285
Tyr Gln Leu Gln Leu Lys Ala Asp Pro Ser Leu Ile Leu Asp Ala Gly
290 295 300
Asp Leu Trp Asn Pro Glu Ser Glu Ala Ser Gln His Ala Leu Thr Tyr
305 310 315 320
Thr Ser Asp Cys Thr Glu Phe Leu Leu Thr Ser Leu Gly Gln Ala Ser
325 330 335
Gly Leu Cys Pro Ala Val Thr Gln Ser Leu Lys Lys Lys Gln Pro Gly
340 345 350
Gly Phe Asp Leu Asp Thr Glu Gly Ala Tyr Arg Phe Leu Leu Glu Tyr
355 360 365
Ala Glu Leu Leu Arg Ser Ala Gly Phe Val Val Lys Leu Pro Ser Trp
370 375 380
Trp Ile Gly Arg Arg Gly Val Asn Arg Ile Gly Ile Lys Thr Lys Val
385 390 395 400
Lys Leu Pro Ser Met Lys Gly Ser Gly Ser Gly Leu Thr Leu Asp Arg
405 410 415
Met Val Ala Cys Asp Tyr Ala Ala Ala Leu Gly Asn Glu Glu Leu Asp
420 425 430
Leu Gln Glu Leu Lys Thr Leu Ala Asn Leu Lys Val Pro Leu Val Arg
435 440 445
Val Arg Gly Gln Trp Thr Gln Ile Asp His Lys Glu Leu Ala Asn Ala
450 455 460
Leu His Phe Leu Glu Lys His Pro Thr Gly Glu Leu Ser Ala Arg Glu
465 470 475 480
Leu Leu Ser Thr Ala Leu Gly Ala Gln Lys Lys Glu Asp Ala Leu Phe
485 490 495
Leu Arg Ser Val Glu Ile Glu Gly Trp Leu Gln Glu Leu Leu Glu Lys
500 505 510
Leu Ser Ser Gln Gly Gln Phe Glu Leu Leu Pro Pro Pro Glu His Phe
515 520 525
Glu Gly Thr Leu Arg Leu Tyr Gln Glu Arg Gly Phe Ser Trp Leu Ser
530 535 540
Phe Leu Arg Lys Trp Gly Leu Gly Ala Cys Leu Ala Asp Asp Met Gly
545 550 555 560
Leu Gly Lys Thr Ile Gln Thr Leu Ala Leu Leu Gln Arg Glu Arg Glu
565 570 575
Leu Gly Glu Lys Arg Ala Val Leu Leu Ile Cys Pro Thr Ser Val Val
580 585 590
Asn Asn Trp Arg Lys Glu Ala Glu Arg Phe Thr Pro Asp Leu Ala Val
595 600 605
Leu Val His His Gly Ile Asp Arg Met Lys Thr Ala Asp Phe Arg Lys
610 615 620
Ala Ala Ser Ala Ser Ala Leu Val Ile Ser Ser Tyr Gly Leu Leu Gln
625 630 635 640
Arg Asp Leu Glu Phe Leu Ser Lys Val Pro Trp Ala Gly Ile Ile Leu
645 650 655
Asp Glu Ala Gln Asn Ile Lys Asn Pro Glu Thr Lys Gln Ser Lys Ala
660 665 670
Ala Arg Thr Ile Arg Ala Asp Tyr Arg Ile Ala Leu Thr Gly Thr Pro
675 680 685
Val Glu Asn His Val Gly Asp Leu Trp Ala Leu Met Asp Phe Leu Asn
690 695 700
Pro Gly Phe Leu Gly Thr Gln His Phe Phe Lys Gln Asn Phe Tyr Thr
705 710 715 720
Pro Ile Gln Trp Tyr Gly Asp Pro Glu Ala Ser Ala Arg Leu Lys Ser
725 730 735
Leu Thr Gly Pro Phe Ile Leu Arg Arg Met Lys Ser Asp Lys Ser Ile
740 745 750
Ile Ser Asp Leu Pro Asp Lys Ile Glu Met Lys Glu Tyr Cys Ser Leu
755 760 765
Thr Lys Glu Gln Ala Ser Leu Tyr Lys Ala Val Val Asp Glu Leu Gln
770 775 780
Glu Lys Ile Glu Ser Ala Glu Gly Ile Asp Arg Arg Gly Leu Val Leu
785 790 795 800
Ala Leu Leu Val Lys Leu Lys Gln Val Cys Asn His Pro Ala His Leu
805 810 815
Leu Gly Asp Asn Ser Ala Ile Ala His Arg Ser Gly Lys Ile Lys Arg
820 825 830
Leu Thr Glu Leu Leu Gly Asp Ile Arg Glu Ala Gly Glu Lys Thr Leu
835 840 845
Leu Phe Thr Gln Phe Thr Met Met Gly Thr Met Leu Gln His Tyr Leu
850 855 860
Gln Glu Leu Tyr Gly Glu Glu Val Leu Phe Leu His Gly Gly Val Thr
865 870 875 880
Lys Lys Arg Arg Asp Glu Met Val Glu Ser Phe Gln Lys Glu Glu Gly
885 890 895
Ser Ser Pro Ser Ile Phe Ile Leu Ser Leu Lys Ala Gly Gly Thr Gly
900 905 910
Leu Asn Leu Thr Thr Ala Asn His Val Val His Phe Asp Arg Trp Trp
915 920 925
Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly
930 935 940
Gln His Lys Asn Val Glu Val His Lys Phe Ile Thr Thr Gly Thr Leu
945 950 955 960
Glu Glu Arg Ile Asp Glu Met Ile Glu Lys Lys Thr Thr Val Ala Gly
965 970 975
Gln Val Leu Gly Thr Gly Glu Gln Trp Leu Thr Glu Leu Ser Asn Asn
980 985 990
Asp Leu Arg Lys Leu Ile Met Leu Gly Gln Glu Ala Met Gly Glu
995 1000 1005
<210> 67
<211> 3189
<212> DNA
<213> Prochlorococcus marinus
<400> 67
atgactctgc tgcacgccac ttggatttca actaattggc atccatctaa tttaggtcaa 60
tcagaattgt tcctttgggc agaccaatgg cgcgtagtaa ctccaaaaca aataatacaa 120
acaccttcac ctcacccgtt tagcctatct tcagatgaat taaaagaatg gctcaatagc 180
aaaaaattat tgcctaatga gagtattaat acatctgcat gtctcactct tcctagtaaa 240
cccattcaca aaaaaaataa ccaaaaatct aagaatcaaa aaactggtat tgaatctgaa 300
tggaagggac tccctttaca agctcatgaa gaaatagcaa cacaatatga atgttggcca 360
tggaaagtag atggaatttc actcactact gtcgaagcaa cagaatggct tacaaaatta 420
cctttatcaa aaaaagattc tgatcttagt gaagaattac tttggtgggc tcatttagag 480
cgttggtctc ttaatctaat tgcgagtgga ctatggctac ctcaagttaa attacacaag 540
aaagaaggaa atgaatatcg tgcatcatgg atacctctgc tgaatcaaga aaatgaaaga 600
aatcgcttag aagagtttgc aaaaaatatt cccttggtcg ctatttgtgc agtcccatgg 660
atagaagcta aaggacaaat agtcaatact gagcaagtct caaattcaaa caataataca 720
ctctctttat ataggccaag acacaatcgc gtagaagtga tggatcttct cgaagaactt 780
attgatgcac aacttcgaaa agattttcaa ccaagaacta aaaacttgga tccattgtta 840
aaagcgtggc aagaagcact tggcacgaaa gatggaataa ttaacctatc gaatgaaaac 900
gctaaaagat tagaaaaagc aagtaagaat tggaaaagag ggttgtctag taatgttcaa 960
cctgcgaaaa catgtctaga gctaattgca ccgattgatg atctagattt atgggactta 1020
aacttttcat tgcaatcaga atcagatccg agtatcagac tagctgcaga tcaaatttgg 1080
gaagcaggcg tagaagtaac caaagttggc ggaataacaa ttgacaaccc aagtgaaatt 1140
cttttagaag gcctaggaag aagtcttgaa attttccctc caattgaaaa aggactagaa 1200
agcccaactc ctcacacaat gaaactgtct gcatcagaag catttgtact tattagaaca 1260
gcagcagcaa aacttcgtga catgggtatt ggtgtaatac tgcctaatag tttgtccaaa 1320
ggatttgcaa gtcgacttgg tcttgctatt caagccgaat taccagagtc ttcactaggc 1380
gtaatgctag gagaaagttt gaactgggat tgggagttaa tgatcggagg tataaattta 1440
agcatgaaag aactagaaat gcttgcaaaa aaaaatagtc ctctactcaa tcacaaaggg 1500
acatggatcg aattacgtcc taatgatctg aaaaatgctt caaaattttt tgctaatact 1560
ccagaattaa acctcgataa agcattaagg cttagtgcta ataaaggcaa cacttttatg 1620
aaacttccag tacatcattt tgaatctgga ccaagattac aaagtgtctt agagcaatat 1680
caccatcaga aagcgcctga acctttacca gcacctaatg gattccatgg gcaattaagg 1740
ccttaccaag aaagaggtct tgggtggctt gcatttcttt atcgttttaa gcaaggagca 1800
tgcttagcag atgacatggg gcttggtaaa actattcaat tattatgttt tattcagcac 1860
ctaaaagttc aaaacgagct tactaagcct gtactcctaa ttgcgcctac atctgtgctg 1920
acaaattgga aaagagaggc tgccactttt actccagaac tatgtataca tgaacactat 1980
ggtagtaaga gacattcttc aataccaaaa ttacaaaatt atctaaaaaa agttgacatt 2040
atgatcacaa gttatgggtt actttatcga gatggcgagc tgctacaaga aatcgactgg 2100
caaggaatag ttattgatga agctcaagct attaaaaatt ccaaatcaaa gcaaagtatt 2160
ataactagag caataagcaa aaatctcata agtaatccct ttagaattgc tttaacagga 2220
acgccagtag aaaatcgtat tagtgaacta tgggcactaa tggatttcct taatccaaaa 2280
gtattaggtg aagaagattt ttttaatcag cgatacaagt taccgattga gcattatggc 2340
gacatctctt cattaaaaga tctcaaaaca caggtcagtc cttttatttt aagaagattg 2400
aaaaccgatc aatctattat ttctgatttg cctcaaaaga ttgaattaaa tgagtgggtt 2460
ggactaagcc aagagcaaga gcttctatat aaacaaacgg tagagaaaag cttagatgaa 2520
ctcgcctcat tacccattgg tcaacgccag ggtaaaacat tgggtctact tactcgtctt 2580
aaacaaattt gtaatcatcc agcaattgct ttaaaagaaa ctcaagtcga gaagaatttc 2640
ttattaagat cttcaaaatt acaaagactg gaagaaatac tacaagaagt gaaagaatct 2700
catgatagag ctctgctctt tactcaattt gctgaatggg ggcatttatt gcaagcgtac 2760
ttacaaacaa aatgggaatc agaagtacct ttcctacacg gaggcactcc taaagggaag 2820
cgacaagaaa tgatagatcg ttttcaagat gatcctagag ggccaaatat ctttttactt 2880
tcactaaaag caggaggagt gggtcttaat ctaactcgtg cgaatcatgt ttttcatatt 2940
gatcgttggt ggaatccagc agtagaaaat caagcaacag atcgtgcata ccgaattggt 3000
caaaaaaaaa gtgttatcgt ccataagttt ataaccaccg gcacaatcga agaaaaaatc 3060
aatcaaatga ttctcgaaaa gactgaacta gcagaaaata ttgtcggatc aggagaaagc 3120
tggttagggc aattaagtct tgaaaaattg agtgaattag ttgctttaga tagcaatcca 3180
gaattctaa 3189
<210> 68
<211> 1062
<212> PRT
<213> Prochlorococcus marinus
<400> 68
Met Thr Leu Leu His Ala Thr Trp Ile Ser Thr Asn Trp His Pro Ser
1 5 10 15
Asn Leu Gly Gln Ser Glu Leu Phe Leu Trp Ala Asp Gln Trp Arg Val
20 25 30
Val Thr Pro Lys Gln Ile Ile Gln Thr Pro Ser Pro His Pro Phe Ser
35 40 45
Leu Ser Ser Asp Glu Leu Lys Glu Trp Leu Asn Ser Lys Lys Leu Leu
50 55 60
Pro Asn Glu Ser Ile Asn Thr Ser Ala Cys Leu Thr Leu Pro Ser Lys
65 70 75 80
Pro Ile His Lys Lys Asn Asn Gln Lys Ser Lys Asn Gln Lys Thr Gly
85 90 95
Ile Glu Ser Glu Trp Lys Gly Leu Pro Leu Gln Ala His Glu Glu Ile
100 105 110
Ala Thr Gln Tyr Glu Cys Trp Pro Trp Lys Val Asp Gly Ile Ser Leu
115 120 125
Thr Thr Val Glu Ala Thr Glu Trp Leu Thr Lys Leu Pro Leu Ser Lys
130 135 140
Lys Asp Ser Asp Leu Ser Glu Glu Leu Leu Trp Trp Ala His Leu Glu
145 150 155 160
Arg Trp Ser Leu Asn Leu Ile Ala Ser Gly Leu Trp Leu Pro Gln Val
165 170 175
Lys Leu His Lys Lys Glu Gly Asn Glu Tyr Arg Ala Ser Trp Ile Pro
180 185 190
Leu Leu Asn Gln Glu Asn Glu Arg Asn Arg Leu Glu Glu Phe Ala Lys
195 200 205
Asn Ile Pro Leu Val Ala Ile Cys Ala Val Pro Trp Ile Glu Ala Lys
210 215 220
Gly Gln Ile Val Asn Thr Glu Gln Val Ser Asn Ser Asn Asn Asn Thr
225 230 235 240
Leu Ser Leu Tyr Arg Pro Arg His Asn Arg Val Glu Val Met Asp Leu
245 250 255
Leu Glu Glu Leu Ile Asp Ala Gln Leu Arg Lys Asp Phe Gln Pro Arg
260 265 270
Thr Lys Asn Leu Asp Pro Leu Leu Lys Ala Trp Gln Glu Ala Leu Gly
275 280 285
Thr Lys Asp Gly Ile Ile Asn Leu Ser Asn Glu Asn Ala Lys Arg Leu
290 295 300
Glu Lys Ala Ser Lys Asn Trp Lys Arg Gly Leu Ser Ser Asn Val Gln
305 310 315 320
Pro Ala Lys Thr Cys Leu Glu Leu Ile Ala Pro Ile Asp Asp Leu Asp
325 330 335
Leu Trp Asp Leu Asn Phe Ser Leu Gln Ser Glu Ser Asp Pro Ser Ile
340 345 350
Arg Leu Ala Ala Asp Gln Ile Trp Glu Ala Gly Val Glu Val Thr Lys
355 360 365
Val Gly Gly Ile Thr Ile Asp Asn Pro Ser Glu Ile Leu Leu Glu Gly
370 375 380
Leu Gly Arg Ser Leu Glu Ile Phe Pro Pro Ile Glu Lys Gly Leu Glu
385 390 395 400
Ser Pro Thr Pro His Thr Met Lys Leu Ser Ala Ser Glu Ala Phe Val
405 410 415
Leu Ile Arg Thr Ala Ala Ala Lys Leu Arg Asp Met Gly Ile Gly Val
420 425 430
Ile Leu Pro Asn Ser Leu Ser Lys Gly Phe Ala Ser Arg Leu Gly Leu
435 440 445
Ala Ile Gln Ala Glu Leu Pro Glu Ser Ser Leu Gly Val Met Leu Gly
450 455 460
Glu Ser Leu Asn Trp Asp Trp Glu Leu Met Ile Gly Gly Ile Asn Leu
465 470 475 480
Ser Met Lys Glu Leu Glu Met Leu Ala Lys Lys Asn Ser Pro Leu Leu
485 490 495
Asn His Lys Gly Thr Trp Ile Glu Leu Arg Pro Asn Asp Leu Lys Asn
500 505 510
Ala Ser Lys Phe Phe Ala Asn Thr Pro Glu Leu Asn Leu Asp Lys Ala
515 520 525
Leu Arg Leu Ser Ala Asn Lys Gly Asn Thr Phe Met Lys Leu Pro Val
530 535 540
His His Phe Glu Ser Gly Pro Arg Leu Gln Ser Val Leu Glu Gln Tyr
545 550 555 560
His His Gln Lys Ala Pro Glu Pro Leu Pro Ala Pro Asn Gly Phe His
565 570 575
Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly Trp Leu Ala Phe
580 585 590
Leu Tyr Arg Phe Lys Gln Gly Ala Cys Leu Ala Asp Asp Met Gly Leu
595 600 605
Gly Lys Thr Ile Gln Leu Leu Cys Phe Ile Gln His Leu Lys Val Gln
610 615 620
Asn Glu Leu Thr Lys Pro Val Leu Leu Ile Ala Pro Thr Ser Val Leu
625 630 635 640
Thr Asn Trp Lys Arg Glu Ala Ala Thr Phe Thr Pro Glu Leu Cys Ile
645 650 655
His Glu His Tyr Gly Ser Lys Arg His Ser Ser Ile Pro Lys Leu Gln
660 665 670
Asn Tyr Leu Lys Lys Val Asp Ile Met Ile Thr Ser Tyr Gly Leu Leu
675 680 685
Tyr Arg Asp Gly Glu Leu Leu Gln Glu Ile Asp Trp Gln Gly Ile Val
690 695 700
Ile Asp Glu Ala Gln Ala Ile Lys Asn Ser Lys Ser Lys Gln Ser Ile
705 710 715 720
Ile Thr Arg Ala Ile Ser Lys Asn Leu Ile Ser Asn Pro Phe Arg Ile
725 730 735
Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Ile Ser Glu Leu Trp Ala
740 745 750
Leu Met Asp Phe Leu Asn Pro Lys Val Leu Gly Glu Glu Asp Phe Phe
755 760 765
Asn Gln Arg Tyr Lys Leu Pro Ile Glu His Tyr Gly Asp Ile Ser Ser
770 775 780
Leu Lys Asp Leu Lys Thr Gln Val Ser Pro Phe Ile Leu Arg Arg Leu
785 790 795 800
Lys Thr Asp Gln Ser Ile Ile Ser Asp Leu Pro Gln Lys Ile Glu Leu
805 810 815
Asn Glu Trp Val Gly Leu Ser Gln Glu Gln Glu Leu Leu Tyr Lys Gln
820 825 830
Thr Val Glu Lys Ser Leu Asp Glu Leu Ala Ser Leu Pro Ile Gly Gln
835 840 845
Arg Gln Gly Lys Thr Leu Gly Leu Leu Thr Arg Leu Lys Gln Ile Cys
850 855 860
Asn His Pro Ala Ile Ala Leu Lys Glu Thr Gln Val Glu Lys Asn Phe
865 870 875 880
Leu Leu Arg Ser Ser Lys Leu Gln Arg Leu Glu Glu Ile Leu Gln Glu
885 890 895
Val Lys Glu Ser His Asp Arg Ala Leu Leu Phe Thr Gln Phe Ala Glu
900 905 910
Trp Gly His Leu Leu Gln Ala Tyr Leu Gln Thr Lys Trp Glu Ser Glu
915 920 925
Val Pro Phe Leu His Gly Gly Thr Pro Lys Gly Lys Arg Gln Glu Met
930 935 940
Ile Asp Arg Phe Gln Asp Asp Pro Arg Gly Pro Asn Ile Phe Leu Leu
945 950 955 960
Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Arg Ala Asn His
965 970 975
Val Phe His Ile Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala
980 985 990
Thr Asp Arg Ala Tyr Arg Ile Gly Gln Lys Lys Ser Val Ile Val His
995 1000 1005
Lys Phe Ile Thr Thr Gly Thr Ile Glu Glu Lys Ile Asn Gln Met
1010 1015 1020
Ile Leu Glu Lys Thr Glu Leu Ala Glu Asn Ile Val Gly Ser Gly
1025 1030 1035
Glu Ser Trp Leu Gly Gln Leu Ser Leu Glu Lys Leu Ser Glu Leu
1040 1045 1050
Val Ala Leu Asp Ser Asn Pro Glu Phe
1055 1060
<210> 69
<211> 3204
<212> DNA
<213> Prochlorococcus marinus
<400> 69
atgagtctgc tacacgctac ttggctgcca gcaatgcgaa ccggaagttc gcataatcca 60
ggactactca tctgggctga ttcatggaga gttgcaaaac caagcatagt cagcaatcag 120
cctgtaatac atccatttgc cttatcagca gcagatttac gtatttggct attgcaaaaa 180
aagcttttac ctaaagaaag tattgaatgt acagccttat taactctacc tagtaaatct 240
attaaaaact cattagacaa aaaattaaat ggagtaacgg actcacaaaa tactagcgat 300
caacctcaat ggagtggact acctttacaa gcaggagagc cagtaactaa acaatgtgaa 360
tggtggccct ggcaagttga aggtatagca atcaaaccca gtgaagctgc atcgtggctt 420
gcaaacttac ctctcacgaa aaaagatcct gagcttagtg aagagatcct atggtggagt 480
catttagaac gttggtctct aagtttaatt gctcgtggcc tttggttgcc acaagttgaa 540
ttaaatacaa ttgataatat tggagctaga gctaggtgga gtcctttact taataacgaa 600
aacgagcgca aaagattaga agaattctct atcaggcttc cattagtagc aacatgtgcc 660
ataaaaagag aggaaacttc tgaagaaaat caaaaccata tattaaagac tactcctagg 720
gaaacactcg atgaatacgg acttgcagta tgtcgaccaa tcaatagtcg acttcaagtg 780
gcttatctct tagaagaact cgtggatgga cagctaagaa aagattttga ggaaagttct 840
gaagaccttg atccattgct gaaagcttgg caagaggcat taggatcaca taatggagtc 900
attcgtcttc cgttggaaga ttgtgaaaga ttagccaagg caagtaaaaa ttggaaagaa 960
aatttatcag gcaatgttaa aggtgcaaga gcatgccttg agctttttgc accacttgaa 1020
ggagaagatt tatgggactt acaattctct ttacaagctg aagcagatcc atcactaaag 1080
gtagcagcag aagcagtatg gaatgcagac tcagcagttc tacagattgg tgatattcaa 1140
atagcgcagc ctggagaaat tctactagaa ggtcttggca gagcactcaa tatctttcaa 1200
ccaatagaaa ggggtctgga aaatgctact ccaaataata tgcaactcac acctgcagaa 1260
gcttttgttc tagtacgtac agcctcaaag caattacgtg atattggtat tggtgtaata 1320
ctacctagaa gtttatcagg aggattagca agtcgactag gtatagctat taaagcagag 1380
ttagcgacta gtgccagagg attaacactt cgagagaatc tagaatggag ttgggagcta 1440
atgatagggg gaagcatatt aagccttaaa gatctagaac aactggcaag taaacgcagc 1500
cctctagttc gctataagga ttcatggctt gaattacgtc caaatgatct taaaatcgcc 1560
gaaaaattct gtagcaataa tcctgaatta agcctagatg acgcattaag acttaccgca 1620
actaaagggg agactctaat gaagcttcca gtacatcaat ttaatgctgg gccaaagctc 1680
caaggcgttt tagagcaata ccaccaacat acaagtcctg agcctctagc tgcaccagat 1740
ggcttctatg gacaactgag gccttatcaa gaacgtggca taggatggtt ggctttcttg 1800
catcgtttta atcaaggtgc atgtttagca gatgacatgg gcctgggcaa aacaattcaa 1860
gtgcttgctt ttattcagca cttaaaaagt aacaaggacc tcaagaaacc tgttttgcta 1920
attgcaccta cgtcagtatt aacaaactgg aaacgagaag cttattcatt tacaccagag 1980
ttatctgtat tagagcatta cggtcctaat cgttcatcta catcaacact cttgaaaaag 2040
attctcaaaa aagtagacat tcttattact agctatggcc tactacatag agataaacag 2100
cttctgaaaa caattgattg gcaaggtgta attattgatg aagcacaagc tataaaaaat 2160
ccaaattcaa aacaaagtca aacaactcgt gaaattgtta aaggcggaaa aataatccct 2220
tttcgtattg cattaactgg tacccctata gaaaatcgtg taagtgagct ttggtcatta 2280
atggattttt taaatccatc agtacttgga gaaaaagaat tttttgatca acgctacaaa 2340
ttaccgattg aacgttatgg tgatatttct tcgttaaccg atctcaaagc tcgtgtcagt 2400
ccctttattc ttagaaggtt aaaaagtgat aaatcaatta tctcggatct accaagcaaa 2460
gtcgaactaa aagaatggat tactcttagt caagagcaaa gagctcttta taacaaaact 2520
gtagacaata ccttacagga aatcgcaaga agtcctattg gtcagcgtca tgcgaaaacc 2580
ttaggtctat taacacgtct caaacaaata tgtaatcatc ctgctcttgc cctcaaagaa 2640
aaaaacatta gcgatgattt tggaatacga tcaaccaaac ttcaaaggct ggaagaactt 2700
cttgatgtga tattcgcaac agaggacaga gctcttcttt ttacccaatt cgctgaatgg 2760
ggtcacttac tacaagctta tctagaaaaa aagtggggac atagcatact ttttctacat 2820
ggaggaactc gcaaaataga tagacaatca atggttgatc aatttcaaga agatcccaga 2880
ggcccaaaat tatttttact ttctctcaaa gcaggtggta ttggtctgaa cctgactcga 2940
gctaaccacg tgttgcatat tgatcgatgg tggaaccctg ccgtagaaaa tcaggcaaca 3000
gatcgtgctt atagaattgg tcaaaaaaat agcgtaatgg ttcacaaatt tattgctaca 3060
gggtcagtag aagaaaaaat tgatcaaatg attactgaaa agtctaagct cgcagaaaat 3120
ataattggtg caggtgaaga ttggcttggc aaacttggca tcaatgaatt acgtgaatta 3180
gtttccttag aaaaagagag ttaa 3204
<210> 70
<211> 1067
<212> PRT
<213> Prochlorococcus marinus
<400> 70
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Met Arg Thr Gly Ser
1 5 10 15
Ser His Asn Pro Gly Leu Leu Ile Trp Ala Asp Ser Trp Arg Val Ala
20 25 30
Lys Pro Ser Ile Val Ser Asn Gln Pro Val Ile His Pro Phe Ala Leu
35 40 45
Ser Ala Ala Asp Leu Arg Ile Trp Leu Leu Gln Lys Lys Leu Leu Pro
50 55 60
Lys Glu Ser Ile Glu Cys Thr Ala Leu Leu Thr Leu Pro Ser Lys Ser
65 70 75 80
Ile Lys Asn Ser Leu Asp Lys Lys Leu Asn Gly Val Thr Asp Ser Gln
85 90 95
Asn Thr Ser Asp Gln Pro Gln Trp Ser Gly Leu Pro Leu Gln Ala Gly
100 105 110
Glu Pro Val Thr Lys Gln Cys Glu Trp Trp Pro Trp Gln Val Glu Gly
115 120 125
Ile Ala Ile Lys Pro Ser Glu Ala Ala Ser Trp Leu Ala Asn Leu Pro
130 135 140
Leu Thr Lys Lys Asp Pro Glu Leu Ser Glu Glu Ile Leu Trp Trp Ser
145 150 155 160
His Leu Glu Arg Trp Ser Leu Ser Leu Ile Ala Arg Gly Leu Trp Leu
165 170 175
Pro Gln Val Glu Leu Asn Thr Ile Asp Asn Ile Gly Ala Arg Ala Arg
180 185 190
Trp Ser Pro Leu Leu Asn Asn Glu Asn Glu Arg Lys Arg Leu Glu Glu
195 200 205
Phe Ser Ile Arg Leu Pro Leu Val Ala Thr Cys Ala Ile Lys Arg Glu
210 215 220
Glu Thr Ser Glu Glu Asn Gln Asn His Ile Leu Lys Thr Thr Pro Arg
225 230 235 240
Glu Thr Leu Asp Glu Tyr Gly Leu Ala Val Cys Arg Pro Ile Asn Ser
245 250 255
Arg Leu Gln Val Ala Tyr Leu Leu Glu Glu Leu Val Asp Gly Gln Leu
260 265 270
Arg Lys Asp Phe Glu Glu Ser Ser Glu Asp Leu Asp Pro Leu Leu Lys
275 280 285
Ala Trp Gln Glu Ala Leu Gly Ser His Asn Gly Val Ile Arg Leu Pro
290 295 300
Leu Glu Asp Cys Glu Arg Leu Ala Lys Ala Ser Lys Asn Trp Lys Glu
305 310 315 320
Asn Leu Ser Gly Asn Val Lys Gly Ala Arg Ala Cys Leu Glu Leu Phe
325 330 335
Ala Pro Leu Glu Gly Glu Asp Leu Trp Asp Leu Gln Phe Ser Leu Gln
340 345 350
Ala Glu Ala Asp Pro Ser Leu Lys Val Ala Ala Glu Ala Val Trp Asn
355 360 365
Ala Asp Ser Ala Val Leu Gln Ile Gly Asp Ile Gln Ile Ala Gln Pro
370 375 380
Gly Glu Ile Leu Leu Glu Gly Leu Gly Arg Ala Leu Asn Ile Phe Gln
385 390 395 400
Pro Ile Glu Arg Gly Leu Glu Asn Ala Thr Pro Asn Asn Met Gln Leu
405 410 415
Thr Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala Ser Lys Gln Leu
420 425 430
Arg Asp Ile Gly Ile Gly Val Ile Leu Pro Arg Ser Leu Ser Gly Gly
435 440 445
Leu Ala Ser Arg Leu Gly Ile Ala Ile Lys Ala Glu Leu Ala Thr Ser
450 455 460
Ala Arg Gly Leu Thr Leu Arg Glu Asn Leu Glu Trp Ser Trp Glu Leu
465 470 475 480
Met Ile Gly Gly Ser Ile Leu Ser Leu Lys Asp Leu Glu Gln Leu Ala
485 490 495
Ser Lys Arg Ser Pro Leu Val Arg Tyr Lys Asp Ser Trp Leu Glu Leu
500 505 510
Arg Pro Asn Asp Leu Lys Ile Ala Glu Lys Phe Cys Ser Asn Asn Pro
515 520 525
Glu Leu Ser Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Lys Gly Glu
530 535 540
Thr Leu Met Lys Leu Pro Val His Gln Phe Asn Ala Gly Pro Lys Leu
545 550 555 560
Gln Gly Val Leu Glu Gln Tyr His Gln His Thr Ser Pro Glu Pro Leu
565 570 575
Ala Ala Pro Asp Gly Phe Tyr Gly Gln Leu Arg Pro Tyr Gln Glu Arg
580 585 590
Gly Ile Gly Trp Leu Ala Phe Leu His Arg Phe Asn Gln Gly Ala Cys
595 600 605
Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Val Leu Ala Phe
610 615 620
Ile Gln His Leu Lys Ser Asn Lys Asp Leu Lys Lys Pro Val Leu Leu
625 630 635 640
Ile Ala Pro Thr Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Tyr Ser
645 650 655
Phe Thr Pro Glu Leu Ser Val Leu Glu His Tyr Gly Pro Asn Arg Ser
660 665 670
Ser Thr Ser Thr Leu Leu Lys Lys Ile Leu Lys Lys Val Asp Ile Leu
675 680 685
Ile Thr Ser Tyr Gly Leu Leu His Arg Asp Lys Gln Leu Leu Lys Thr
690 695 700
Ile Asp Trp Gln Gly Val Ile Ile Asp Glu Ala Gln Ala Ile Lys Asn
705 710 715 720
Pro Asn Ser Lys Gln Ser Gln Thr Thr Arg Glu Ile Val Lys Gly Gly
725 730 735
Lys Ile Ile Pro Phe Arg Ile Ala Leu Thr Gly Thr Pro Ile Glu Asn
740 745 750
Arg Val Ser Glu Leu Trp Ser Leu Met Asp Phe Leu Asn Pro Ser Val
755 760 765
Leu Gly Glu Lys Glu Phe Phe Asp Gln Arg Tyr Lys Leu Pro Ile Glu
770 775 780
Arg Tyr Gly Asp Ile Ser Ser Leu Thr Asp Leu Lys Ala Arg Val Ser
785 790 795 800
Pro Phe Ile Leu Arg Arg Leu Lys Ser Asp Lys Ser Ile Ile Ser Asp
805 810 815
Leu Pro Ser Lys Val Glu Leu Lys Glu Trp Ile Thr Leu Ser Gln Glu
820 825 830
Gln Arg Ala Leu Tyr Asn Lys Thr Val Asp Asn Thr Leu Gln Glu Ile
835 840 845
Ala Arg Ser Pro Ile Gly Gln Arg His Ala Lys Thr Leu Gly Leu Leu
850 855 860
Thr Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys Glu
865 870 875 880
Lys Asn Ile Ser Asp Asp Phe Gly Ile Arg Ser Thr Lys Leu Gln Arg
885 890 895
Leu Glu Glu Leu Leu Asp Val Ile Phe Ala Thr Glu Asp Arg Ala Leu
900 905 910
Leu Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ala Tyr Leu
915 920 925
Glu Lys Lys Trp Gly His Ser Ile Leu Phe Leu His Gly Gly Thr Arg
930 935 940
Lys Ile Asp Arg Gln Ser Met Val Asp Gln Phe Gln Glu Asp Pro Arg
945 950 955 960
Gly Pro Lys Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Ile Gly Leu
965 970 975
Asn Leu Thr Arg Ala Asn His Val Leu His Ile Asp Arg Trp Trp Asn
980 985 990
Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln
995 1000 1005
Lys Asn Ser Val Met Val His Lys Phe Ile Ala Thr Gly Ser Val
1010 1015 1020
Glu Glu Lys Ile Asp Gln Met Ile Thr Glu Lys Ser Lys Leu Ala
1025 1030 1035
Glu Asn Ile Ile Gly Ala Gly Glu Asp Trp Leu Gly Lys Leu Gly
1040 1045 1050
Ile Asn Glu Leu Arg Glu Leu Val Ser Leu Glu Lys Glu Ser
1055 1060 1065
<210> 71
<211> 3300
<212> DNA
<213> Prochlorococcus marinus
<400> 71
atgattggtt gtggaactcc tgcgtggatg gttgccgttg atcggcagtg cactcctgct 60
ccaagaaacc caacacatac tttttgcgtc gcggccatga gcctgctgca cgccacctgg 120
cttccagcca tccgtactcc gaccagctcc ggtcgccctg cgctccttgt gtgggcagat 180
acctggcgag tcgctacccc agcaggacca gcagcaactc ccgcactcca ccccttcaca 240
ctcaacccag acgatctacg tgcctggctg attgagcgcg atctactgcc cgatgaaatc 300
atcgacgcca cagcatgtct gaccctgcct agccgaacag tcaaaccgcg cagcaaagcc 360
aagaacgtat ccactgaatc cgacgaagac aaagaccaca aaacaagttg gacaggactg 420
cccttacaag caggcgaacc cattcccaaa cagactgaat ggtggccctg gcaggtgcaa 480
ggcctggcag tggagcctgc tgctgcaacg gcctggcttt cgaaactgcc tctttcagga 540
gatcatcctg atctcgccga tgaattgcgc tggtggagcc atctacagcg ctgggccctg 600
agcatgattg ctcgcggacg ttggctaccc caggtggaac tcagcaaggg agagggctat 660
ccccaccgag cacgctggac accgctactc aaccgtgaag atgatcgccg ccgcctcgaa 720
gaccttgccg ctcagctccc cttagtggcc acctgcgccc tcccctggcg ggagcccacc 780
ggaaggcgta gcaaccgaat gacccgccta agaccagagg cgatgcgagc cgctaaccct 840
gtggcttcat gccgaccccg cagcggtcgc cttcgcgtag ccagcctgct ggaagaactc 900
ttggatgccc aactgcgcac cggatttgaa gcgagtgagc aaggcctaga cccattgctc 960
acagcctggc aggaagcact ggggtcggac agcggcgtga tcaacctccc cgatgaggaa 1020
gccgaacgtc tagcgacagc aagcaaccat tggcgagaag gcgtggctgg caacgtcgca 1080
ccagccaggg cctgcttaga actcttcact cccggcgaag gggaagacct ctgggagctg 1140
cgcttcgcct tacaggctga ggctgatccc acgatcaaag taccggccgc agcagcctgg 1200
gcagcgggtc ccaaggtcct gcaactaggc gaaatccgtg tggaacatcc aggcgaggtg 1260
ctactggaag gcatggggcg agccctcacg gtgtttgcac cgatcgaacg aggcctcgac 1320
agcgccacac cagaagcaat gcagctcacc cctgctgaag cctttgtatt ggtgcgcact 1380
gcagcggccc aactgcgtga tgttggcgtt ggcgtggaat tgcctgccag cctctcggga 1440
gggctggcca gtcgcctagg cctagcgatc aaggcggagc tatcggagag atctagaggt 1500
ttcactttgg gcgaaaccct cgactggagt tgggagctca tgatcggtgg cgtcaccctg 1560
acgcttcgcg agctggagcg actagcaagc aagcgcagcc cgcttgtcaa ccacaagggc 1620
gcctggatcg aattacgccc caacgatctc aaaaatgcgg aacacttctg cagcgtcaat 1680
ccaggcatca gcctcgacga tgccttgcgc cttaccgcaa ccgatggcga cacgctgatg 1740
agactgcccg ttcaccgctt tgaggccggt ccacgactac aggcggtgtt ggagcagtac 1800
caccagcaaa aagctcccga ccccctacct gctcccgaag gcttctgcgg tcagctaagg 1860
ccttatcagg aaaggggtct gggttggctg gccttcctgc atcgcttcga tcaaggggca 1920
tgcctggccg acgacatggg cctgggcaaa acgatccagc tactggcatt cctgcaacat 1980
ctcaaggcgg aacaggaact caaacggccg gtattgctta tcgctcccac atccgtactt 2040
accaactgga agagagaggc attggccttc acaccagagt taaacgtccg agaacactat 2100
gggccgcgtc ggccctctac ccccgccgcc ttaaagaaag cactcaaagg cttagacctc 2160
gttctcacca gttacgggct cctgcagcga gatagtgagc tcctggaaac ggtcgactgg 2220
caaggagtgg tcatcgatga agcccaagcc attaagaacc ccaacgccaa acagagccaa 2280
gcagcacgcg atatgggccg cccagacaaa aacaatcgct tcaggattgc tcttaccggc 2340
acacccgtcg aaaaccgagt cagtgaactt tgggcactga tggacttcct caacccaagg 2400
gttctcggtg aagaagactt cttccgccag cgctaccggc tgccaattga acgctatggc 2460
gacatgtctt ccctgcgaga cctcaaaggc cgtgttggtc ccttcatcct gagacgacta 2520
aaaaccgaca aggcaatcat ctccgaccta cctgaaaagg tagagctgag cgaatgggtg 2580
ggtctgagca aagaacaggc agccctctat cgcaacacag tggatgaaac actggaggcc 2640
attgcccgcg cacccagtgg tcaacgtcat ggcaaggtgc tcggcttgct tacccgactg 2700
aagcaaatct gcaaccatcc cgccctagcc ctcaaagaaa aaaccgttgc aaaaggcttc 2760
atggaccgct ccgccaagct gctgcgtttg gaagaaattc tcgaggaagt gatcgaggca 2820
ggagatcgcg ctctgttatt cacccaattc gcagaatggg gtcatctcct taaggcctac 2880
ctgcaacaac gctggcgctt tgaagttccc ttcctgcacg gcagcacaag caaaactgaa 2940
cgtcaggcca tggttgatcg cttccaggag gatccacgtg gaccccaact gttcctgctg 3000
tcactcaaag ccggtggcgt aggcctaaac ctcacgcggg ctagccatgt gtttcatgtc 3060
gatcgctggt ggaatcctgc cgtagaaaac caggccactg atcgcgctta caggatcgga 3120
caaaccaatc gggtgatggt gcacaaattc atcaccagcg gctcagttga agagaaaatt 3180
gatcgcatga ttcgcgaaaa atctcgactt gccgaagaca tcattggctc tggagaagac 3240
tggttaggtg gcttaggcgt cagtcaattg cgcgaactag tggccctaga agacagctga 3300
<210> 72
<211> 1099
<212> PRT
<213> Prochlorococcus marinus
<400> 72
Met Ile Gly Cys Gly Thr Pro Ala Trp Met Val Ala Val Asp Arg Gln
1 5 10 15
Cys Thr Pro Ala Pro Arg Asn Pro Thr His Thr Phe Cys Val Ala Ala
20 25 30
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Thr
35 40 45
Ser Ser Gly Arg Pro Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val
50 55 60
Ala Thr Pro Ala Gly Pro Ala Ala Thr Pro Ala Leu His Pro Phe Thr
65 70 75 80
Leu Asn Pro Asp Asp Leu Arg Ala Trp Leu Ile Glu Arg Asp Leu Leu
85 90 95
Pro Asp Glu Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
100 105 110
Thr Val Lys Pro Arg Ser Lys Ala Lys Asn Val Ser Thr Glu Ser Asp
115 120 125
Glu Asp Lys Asp His Lys Thr Ser Trp Thr Gly Leu Pro Leu Gln Ala
130 135 140
Gly Glu Pro Ile Pro Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln
145 150 155 160
Gly Leu Ala Val Glu Pro Ala Ala Ala Thr Ala Trp Leu Ser Lys Leu
165 170 175
Pro Leu Ser Gly Asp His Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp
180 185 190
Ser His Leu Gln Arg Trp Ala Leu Ser Met Ile Ala Arg Gly Arg Trp
195 200 205
Leu Pro Gln Val Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala
210 215 220
Arg Trp Thr Pro Leu Leu Asn Arg Glu Asp Asp Arg Arg Arg Leu Glu
225 230 235 240
Asp Leu Ala Ala Gln Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp
245 250 255
Arg Glu Pro Thr Gly Arg Arg Ser Asn Arg Met Thr Arg Leu Arg Pro
260 265 270
Glu Ala Met Arg Ala Ala Asn Pro Val Ala Ser Cys Arg Pro Arg Ser
275 280 285
Gly Arg Leu Arg Val Ala Ser Leu Leu Glu Glu Leu Leu Asp Ala Gln
290 295 300
Leu Arg Thr Gly Phe Glu Ala Ser Glu Gln Gly Leu Asp Pro Leu Leu
305 310 315 320
Thr Ala Trp Gln Glu Ala Leu Gly Ser Asp Ser Gly Val Ile Asn Leu
325 330 335
Pro Asp Glu Glu Ala Glu Arg Leu Ala Thr Ala Ser Asn His Trp Arg
340 345 350
Glu Gly Val Ala Gly Asn Val Ala Pro Ala Arg Ala Cys Leu Glu Leu
355 360 365
Phe Thr Pro Gly Glu Gly Glu Asp Leu Trp Glu Leu Arg Phe Ala Leu
370 375 380
Gln Ala Glu Ala Asp Pro Thr Ile Lys Val Pro Ala Ala Ala Ala Trp
385 390 395 400
Ala Ala Gly Pro Lys Val Leu Gln Leu Gly Glu Ile Arg Val Glu His
405 410 415
Pro Gly Glu Val Leu Leu Glu Gly Met Gly Arg Ala Leu Thr Val Phe
420 425 430
Ala Pro Ile Glu Arg Gly Leu Asp Ser Ala Thr Pro Glu Ala Met Gln
435 440 445
Leu Thr Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala Ala Ala Gln
450 455 460
Leu Arg Asp Val Gly Val Gly Val Glu Leu Pro Ala Ser Leu Ser Gly
465 470 475 480
Gly Leu Ala Ser Arg Leu Gly Leu Ala Ile Lys Ala Glu Leu Ser Glu
485 490 495
Arg Ser Arg Gly Phe Thr Leu Gly Glu Thr Leu Asp Trp Ser Trp Glu
500 505 510
Leu Met Ile Gly Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu
515 520 525
Ala Ser Lys Arg Ser Pro Leu Val Asn His Lys Gly Ala Trp Ile Glu
530 535 540
Leu Arg Pro Asn Asp Leu Lys Asn Ala Glu His Phe Cys Ser Val Asn
545 550 555 560
Pro Gly Ile Ser Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Asp Gly
565 570 575
Asp Thr Leu Met Arg Leu Pro Val His Arg Phe Glu Ala Gly Pro Arg
580 585 590
Leu Gln Ala Val Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro
595 600 605
Leu Pro Ala Pro Glu Gly Phe Cys Gly Gln Leu Arg Pro Tyr Gln Glu
610 615 620
Arg Gly Leu Gly Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala
625 630 635 640
Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala
645 650 655
Phe Leu Gln His Leu Lys Ala Glu Gln Glu Leu Lys Arg Pro Val Leu
660 665 670
Leu Ile Ala Pro Thr Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Leu
675 680 685
Ala Phe Thr Pro Glu Leu Asn Val Arg Glu His Tyr Gly Pro Arg Arg
690 695 700
Pro Ser Thr Pro Ala Ala Leu Lys Lys Ala Leu Lys Gly Leu Asp Leu
705 710 715 720
Val Leu Thr Ser Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu
725 730 735
Thr Val Asp Trp Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys
740 745 750
Asn Pro Asn Ala Lys Gln Ser Gln Ala Ala Arg Asp Met Gly Arg Pro
755 760 765
Asp Lys Asn Asn Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu
770 775 780
Asn Arg Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Arg
785 790 795 800
Val Leu Gly Glu Glu Asp Phe Phe Arg Gln Arg Tyr Arg Leu Pro Ile
805 810 815
Glu Arg Tyr Gly Asp Met Ser Ser Leu Arg Asp Leu Lys Gly Arg Val
820 825 830
Gly Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Lys Ala Ile Ile Ser
835 840 845
Asp Leu Pro Glu Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys
850 855 860
Glu Gln Ala Ala Leu Tyr Arg Asn Thr Val Asp Glu Thr Leu Glu Ala
865 870 875 880
Ile Ala Arg Ala Pro Ser Gly Gln Arg His Gly Lys Val Leu Gly Leu
885 890 895
Leu Thr Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys
900 905 910
Glu Lys Thr Val Ala Lys Gly Phe Met Asp Arg Ser Ala Lys Leu Leu
915 920 925
Arg Leu Glu Glu Ile Leu Glu Glu Val Ile Glu Ala Gly Asp Arg Ala
930 935 940
Leu Leu Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Lys Ala Tyr
945 950 955 960
Leu Gln Gln Arg Trp Arg Phe Glu Val Pro Phe Leu His Gly Ser Thr
965 970 975
Ser Lys Thr Glu Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro
980 985 990
Arg Gly Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly
995 1000 1005
Leu Asn Leu Thr Arg Ala Ser His Val Phe His Val Asp Arg Trp
1010 1015 1020
Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg
1025 1030 1035
Ile Gly Gln Thr Asn Arg Val Met Val His Lys Phe Ile Thr Ser
1040 1045 1050
Gly Ser Val Glu Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ser
1055 1060 1065
Arg Leu Ala Glu Asp Ile Ile Gly Ser Gly Glu Asp Trp Leu Gly
1070 1075 1080
Gly Leu Gly Val Ser Gln Leu Arg Glu Leu Val Ala Leu Glu Asp
1085 1090 1095
Ser
<210> 73
<211> 3300
<212> DNA
<213> Prochlorococcus marinus
<400> 73
atgattggtt gtggaactcc tgcgtggatg gttgccgttg atcggcagtg cactcctgct 60
ccaagaaacc caacacatac tttttgcgtc gcggccatga gcctgctgca cgccacctgg 120
cttccagcca tccgtactcc gaccagctcc ggtcgccctg cgctccttgt gtgggcagat 180
acctggcgag tcgctacccc agcaggacca gcagcaactc ccgcactcca ccccttcacc 240
ctcagcccag acgatctacg tgcctggctc attgagcgcg atctactgcc tgatgaaatc 300
atcgacgcca cagcatgtct gaccctgcct agccgaacag tcaaaccgcg caacaaaacc 360
aagaacgtat ccactgaatc cgacgaagcc aaagacaaca aaacaagttg gacaggactg 420
cccttacaag caggcgaacc cattcccaaa caaacagaat ggtggccctg gcaggtgcaa 480
ggcctggcag tggaacctgc tgccgcaacg gcctggcttt cgaaactgcc tctttcagga 540
aatcatcctg atctggccga tgaattgcgc tggtggagcc atctacagcg ctgggccctg 600
agcatgattg ctcgcggacg ttggctaccc caggtggaac tcagcaaggg agagggctat 660
ccccaccgag cacgctggac accgctactc aaccgtgaag atgatcgccg ccgcctcgaa 720
gaccttgccg ctcagcttcc cttagtggcc acctgcgccc tcccctggcg ggagcccacc 780
ggaaggcgta gcaaccgaat gacccgccta agaccagagg cgatgcgagc cgctaaccct 840
gtggcttcat gccgaccccg cagcggtcgc cttcgcgtag ccagcttgct ggaagaactc 900
ttggatgccc aactgcgcac cggatttgaa gcgagtgagc aaggcctaga cccattgctc 960
acagcctggc aggaagcact ggggtccgac agcggcgtga tcaacctccc cgatgaggaa 1020
gccgaacgtc tagctacagc aagcaaccat tggcgtgaag gcgtggctgg caacgtcgca 1080
ccagccagag cctgcttaga actcttcact cccggagaag gggaagacct ctgggagctg 1140
cgcttctcct tacaggctga ggctgatccc acaatcaaag taccggccgc agcagcctgg 1200
gcagctggtc ccaaggtgtt gcaactaggc gaaatccgtg tggaacatcc aggcgaggtg 1260
ctactggaag gcatggggcg agccctcacg gtgtttgcac cgatcgaacg aggcctcgac 1320
agcgccacac cagaagcaat gcagctcacc cctgctgaag cctttgtatt ggtgcgcact 1380
gcagcgaccc aactgcgtga tgttggcgtt ggcgtggaat tgcctgccag cctctcggga 1440
gggctggcca gtcgcctagg cctagcgatc aaggcggagc tatcggagag atctagaggt 1500
ttcactctgg gcgaaaccct cgactggagt tgggagctca tgatcggtgg cgtcaccctg 1560
acgcttcgcg aactggagcg actagcaagc aagcgcagcc cgcttgtcaa ccacaagggc 1620
gcctggatcg aattacgccc caacgatctc aaacatgcgg aacacttctg cagcgtcaat 1680
ccaggcatca gcctcgacga tgccttgcgc cttaccgcaa cagatggcga cacgctgatg 1740
agactgcccg ttcaccgctt tgaggccggt ccacgactac aggcggtgtt ggagcagtac 1800
caccagcaaa aagcaccaga ccccctacct gctcccgaag gcttctgcgg tcagctaagg 1860
ccttatcagg aaaggggtct gggttggctg gccttcctgc atcgcttcga tcaaggggca 1920
tgcctggccg acgacatggg ccttggcaaa acgatccagc tactggcatt cctgcaacat 1980
ctcaaggcgg aacaggaact caaacggccg gtattgctta tcgctcccac gtccgtactc 2040
accaactgga agagagaggc gttggccttc acaccagagt taaacgtccg cgaacactat 2100
gggccgcgtc ggccctctac ccccgccgcc ttaaagaaag cactcaaagg cttagacctc 2160
gttctcacca gttatgggct cctgcagcga gatagtgagc tcctggaaac ggtcgactgg 2220
caaggcgtgg tcatcgatga agcccaagcc attaagaacc ccaacgccaa acagagccaa 2280
gcagcacgcg atatgggccg cccagacaaa aacaatcgct tcaggattgc tcttaccggc 2340
acacccgtcg aaaaccgagt aagtgaactt tgggcactaa tggacttcct taacccaagg 2400
gttctcggtg aagaagactt cttccgccag cgctaccggc tgccgattga gcgctatggc 2460
gacatgtctt ccctgcgaga cctcaagggc cgtgttggtc ccttcatcct gagacgactc 2520
aaaaccgaca aggcaatcat ctccgaccta cccgaaaaag tagagctgag cgaatgggtg 2580
gggctgagca aagaacaggc agccctctat cgcaacacag tggatgaaac actggaggcc 2640
attgcccgcg cacccagggg tcaacgccat ggcaaggtgc tcggattgct taccagactg 2700
aagcaaatct gcaaccatcc cgccctagcc ctcaaagaac aaaccgttgc aaaagggttc 2760
atggaccgct ccgccaagct gctgcgtttg gaagaaattc tcgaagaagt aatcgaggca 2820
ggagatcgcg ctctgttatt cacccaattc gcagaatggg gtcatctcct taaggcctac 2880
ctgcaacaac gctggcgctt tgaagttccc ttcctgcacg gcagcacaag caaaactgaa 2940
cgtcaggcca tggttgatcg cttccaggag gatccacgtg gaccccaact gttcctgctg 3000
tcactcaaag ccggtggtgt aggcctcaac ctgacgcggg ctagccatgt gtttcatgtt 3060
gatcgctggt ggaatcctgc cgtagaaaac caggccactg atcgcgctta caggatcggg 3120
caaaccagtc gggtgatggt gcacaaattc atcaccagcg gctcagttga agagaaaatt 3180
gatcgcatga ttcgtgaaaa atctcgactt gccgaagaca tcattggctc tggagaagac 3240
tggttaggtg gcttaggcgt cagtcaattg cgcgaactag tggccctaga agacagctga 3300
<210> 74
<211> 1099
<212> PRT
<213> Prochlorococcus marinus
<400> 74
Met Ile Gly Cys Gly Thr Pro Ala Trp Met Val Ala Val Asp Arg Gln
1 5 10 15
Cys Thr Pro Ala Pro Arg Asn Pro Thr His Thr Phe Cys Val Ala Ala
20 25 30
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Thr
35 40 45
Ser Ser Gly Arg Pro Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val
50 55 60
Ala Thr Pro Ala Gly Pro Ala Ala Thr Pro Ala Leu His Pro Phe Thr
65 70 75 80
Leu Ser Pro Asp Asp Leu Arg Ala Trp Leu Ile Glu Arg Asp Leu Leu
85 90 95
Pro Asp Glu Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
100 105 110
Thr Val Lys Pro Arg Asn Lys Thr Lys Asn Val Ser Thr Glu Ser Asp
115 120 125
Glu Ala Lys Asp Asn Lys Thr Ser Trp Thr Gly Leu Pro Leu Gln Ala
130 135 140
Gly Glu Pro Ile Pro Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln
145 150 155 160
Gly Leu Ala Val Glu Pro Ala Ala Ala Thr Ala Trp Leu Ser Lys Leu
165 170 175
Pro Leu Ser Gly Asn His Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp
180 185 190
Ser His Leu Gln Arg Trp Ala Leu Ser Met Ile Ala Arg Gly Arg Trp
195 200 205
Leu Pro Gln Val Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala
210 215 220
Arg Trp Thr Pro Leu Leu Asn Arg Glu Asp Asp Arg Arg Arg Leu Glu
225 230 235 240
Asp Leu Ala Ala Gln Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp
245 250 255
Arg Glu Pro Thr Gly Arg Arg Ser Asn Arg Met Thr Arg Leu Arg Pro
260 265 270
Glu Ala Met Arg Ala Ala Asn Pro Val Ala Ser Cys Arg Pro Arg Ser
275 280 285
Gly Arg Leu Arg Val Ala Ser Leu Leu Glu Glu Leu Leu Asp Ala Gln
290 295 300
Leu Arg Thr Gly Phe Glu Ala Ser Glu Gln Gly Leu Asp Pro Leu Leu
305 310 315 320
Thr Ala Trp Gln Glu Ala Leu Gly Ser Asp Ser Gly Val Ile Asn Leu
325 330 335
Pro Asp Glu Glu Ala Glu Arg Leu Ala Thr Ala Ser Asn His Trp Arg
340 345 350
Glu Gly Val Ala Gly Asn Val Ala Pro Ala Arg Ala Cys Leu Glu Leu
355 360 365
Phe Thr Pro Gly Glu Gly Glu Asp Leu Trp Glu Leu Arg Phe Ser Leu
370 375 380
Gln Ala Glu Ala Asp Pro Thr Ile Lys Val Pro Ala Ala Ala Ala Trp
385 390 395 400
Ala Ala Gly Pro Lys Val Leu Gln Leu Gly Glu Ile Arg Val Glu His
405 410 415
Pro Gly Glu Val Leu Leu Glu Gly Met Gly Arg Ala Leu Thr Val Phe
420 425 430
Ala Pro Ile Glu Arg Gly Leu Asp Ser Ala Thr Pro Glu Ala Met Gln
435 440 445
Leu Thr Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala Ala Thr Gln
450 455 460
Leu Arg Asp Val Gly Val Gly Val Glu Leu Pro Ala Ser Leu Ser Gly
465 470 475 480
Gly Leu Ala Ser Arg Leu Gly Leu Ala Ile Lys Ala Glu Leu Ser Glu
485 490 495
Arg Ser Arg Gly Phe Thr Leu Gly Glu Thr Leu Asp Trp Ser Trp Glu
500 505 510
Leu Met Ile Gly Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu
515 520 525
Ala Ser Lys Arg Ser Pro Leu Val Asn His Lys Gly Ala Trp Ile Glu
530 535 540
Leu Arg Pro Asn Asp Leu Lys His Ala Glu His Phe Cys Ser Val Asn
545 550 555 560
Pro Gly Ile Ser Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Asp Gly
565 570 575
Asp Thr Leu Met Arg Leu Pro Val His Arg Phe Glu Ala Gly Pro Arg
580 585 590
Leu Gln Ala Val Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro
595 600 605
Leu Pro Ala Pro Glu Gly Phe Cys Gly Gln Leu Arg Pro Tyr Gln Glu
610 615 620
Arg Gly Leu Gly Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala
625 630 635 640
Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala
645 650 655
Phe Leu Gln His Leu Lys Ala Glu Gln Glu Leu Lys Arg Pro Val Leu
660 665 670
Leu Ile Ala Pro Thr Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Leu
675 680 685
Ala Phe Thr Pro Glu Leu Asn Val Arg Glu His Tyr Gly Pro Arg Arg
690 695 700
Pro Ser Thr Pro Ala Ala Leu Lys Lys Ala Leu Lys Gly Leu Asp Leu
705 710 715 720
Val Leu Thr Ser Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu
725 730 735
Thr Val Asp Trp Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys
740 745 750
Asn Pro Asn Ala Lys Gln Ser Gln Ala Ala Arg Asp Met Gly Arg Pro
755 760 765
Asp Lys Asn Asn Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu
770 775 780
Asn Arg Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Arg
785 790 795 800
Val Leu Gly Glu Glu Asp Phe Phe Arg Gln Arg Tyr Arg Leu Pro Ile
805 810 815
Glu Arg Tyr Gly Asp Met Ser Ser Leu Arg Asp Leu Lys Gly Arg Val
820 825 830
Gly Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Lys Ala Ile Ile Ser
835 840 845
Asp Leu Pro Glu Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys
850 855 860
Glu Gln Ala Ala Leu Tyr Arg Asn Thr Val Asp Glu Thr Leu Glu Ala
865 870 875 880
Ile Ala Arg Ala Pro Arg Gly Gln Arg His Gly Lys Val Leu Gly Leu
885 890 895
Leu Thr Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys
900 905 910
Glu Gln Thr Val Ala Lys Gly Phe Met Asp Arg Ser Ala Lys Leu Leu
915 920 925
Arg Leu Glu Glu Ile Leu Glu Glu Val Ile Glu Ala Gly Asp Arg Ala
930 935 940
Leu Leu Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Lys Ala Tyr
945 950 955 960
Leu Gln Gln Arg Trp Arg Phe Glu Val Pro Phe Leu His Gly Ser Thr
965 970 975
Ser Lys Thr Glu Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro
980 985 990
Arg Gly Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly
995 1000 1005
Leu Asn Leu Thr Arg Ala Ser His Val Phe His Val Asp Arg Trp
1010 1015 1020
Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg
1025 1030 1035
Ile Gly Gln Thr Ser Arg Val Met Val His Lys Phe Ile Thr Ser
1040 1045 1050
Gly Ser Val Glu Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ser
1055 1060 1065
Arg Leu Ala Glu Asp Ile Ile Gly Ser Gly Glu Asp Trp Leu Gly
1070 1075 1080
Gly Leu Gly Val Ser Gln Leu Arg Glu Leu Val Ala Leu Glu Asp
1085 1090 1095
Ser
<210> 75
<211> 2886
<212> DNA
<213> Rhodococcus sp.
<400> 75
atggcgcgag cagggacttc acgcgctgtc ggtcgcacct gcttggatgg gtgcatgctg 60
cacggcctct ggacaccggg ttcgggtctc atgctgtggg tggaggatcg gaatccggca 120
gctccggagc cgacggacgc ggtcgggcgg atgctggcgc ggaagttccg gcatcacgtg 180
aaggtgccga tgccgacgcc gtcggggccg gagatgctcg agtgggccgc ggttgcgctc 240
gcaccaccgg atgcgacgga gttcctgctg tcggtgtcgt cccgcgaccc ccggatcgcc 300
ggggatctgc gctacctcgc ccacgtcgcc cgcggtgtcg agcggtgggc acgggccggg 360
cgggtggtgc ccgaggtaca ccgggcggag ggcggctggt ggccgcgctg gcggctgctc 420
ggcggtgaac ggcagcgtgc gtggctcacg gagctggccg tggcgatgcc gccggtccag 480
cgtcacggca cgaccccccg ggccgtgctc gacgacatgg tcaccgagct gaccgacccc 540
gtcgcccgcc gtgtcctcga acgacggcac ccggacgatt ccggcggcga cgtggatcat 600
ccgctgatcg acgcgctcgt gcggggtgac cagttcgccg agggcaccgc ccagctgtcg 660
ggatcgctgg acgggtggcg cgacagcctc aaggtggacg agcccgaact ggtgctgcgg 720
ctcctcgagc cggaagacgt ggacgtggag ggggattggg acccggacac ggtgctgtgg 780
cgactggagg tctgccttcg accggaaggc gaagccccgg tgccgattcc gttgcaccgc 840
acggaggcga gtcgtctgca gatcggggtg cgcaagctga cggaggccgt ggccgcctac 900
ccgcgactgc aggacgttcc cagtgacccc gacagcctgg acctgatgtt gcccaccgcc 960
gtggtcatcg accttgtcgg gcacggtgcg gtggcgttga aggagaaggg catcagcctg 1020
ctgctgccgc gggcgtggag tgtggcgtcg ccgtcgatgc gtctgcgggt gagctcgccg 1080
agcactccgg cgagcgcgga gaaccgggcc gtcggcaaag accagttggt gcaatacaac 1140
tgggagctgg cactcggcga cacggtgctc accgccgcgg agatgaatcg actggtcaac 1200
tccaagagcg atctcgtgcg gttgcgcggt gagtgggttc gggcggatca ggaggtgctc 1260
tcccgcgccg cgcgctacgt ggcggagcgg cacgccagcg gcgaccgggc catcgtggac 1320
ctgctgaagg acctgatcgc ggacgatctg tccgatcttc ccgtggagga ggtcacggcc 1380
accggctggg cggccgcgtt gctggacggc gacacgaagc cgcaggacgt gccgaccccg 1440
gacgggttgg acgccacgct gcgcccgtac cagaagcggg ggctcgactg gctggtgttc 1500
atgagccgtc tcggcctcgg ggccgtcctc gccgacgaca tgggactcgg caagacgctg 1560
cagttgctgg cgctgctggc acacgagaag gcgcccacgc ccacgctgct ggtgtgcccg 1620
atgtcggtgg tcggcaactg gcagcgcgag gcagcgcgct tcgtcccctc gctgcgggtg 1680
ctcgtccacc acggtccgca gcggctgagc ggcgcggagt tcaccgccgc cgtgacacag 1740
agcgatctgg tgatcaccac gtatgcgctg ctggcccgcg acgtcgcgca cctgaaggag 1800
caggactggc ggcgtgtcgt gctggacgag gcgcagcaca tcaagaacgc gaagacgtcg 1860
caggcgcggg cggcgcggag cattccggcg gcgcaccgcg tcgcgctgac cggcactccg 1920
gtcgagaacc gcctcgacga actgcgctcg atcctcgact tcgcgaactc gggcatcctg 1980
ggctcggagg tgatgttccg caagcgcttc gtggtgccga tcgagcggga gcaggacgag 2040
acagccgtcg cccggctccg cgcggtcacg tccccgttcg tgctgcgccg ggtcaagacc 2100
gatcccgcgg tcatcgccga cctccccgac aagttcgaga tgacggtgcg cgccaacctc 2160
accgcggagc aggccgcgct gtaccgggcg gtggtcgacg acatgatggc gcagatcaag 2220
gacaagaagg ggatgaagcg caagggcgcc gtcctcgccg ccctgacgaa actcaagcag 2280
gtgtgcaacc acccggcaca cttcctgcgc gacgggtcgg cggtgatgcg gcgcggacag 2340
caccgctccg gcaagctggg gctcgtcgag gacatcctgg attccgtggt cgcggacggc 2400
gagaaggcgt tgctgttcac ccagttccgg gaattcggcg acctcgtcac cccgtacctc 2460
gcggagcgtt tcggtactcc cgtgccgttt ctgcacgggg gcgtgtccaa gcagaagcgc 2520
gacgacatgg tggcctcgtt ccagggcgac gacgggccgc cgatcatgat gctctcgctg 2580
aaggcgggcg ggacgggttt gaacctcacc gcggccaatc acgtcgtcca cctcgaccgg 2640
tggtggaatc cggcggtcga gaaccaggcc acggacaggg cgttccggat cggccagcgg 2700
cgggacgtgc aggtgcgcaa gctcgtgtgc gtcggcaccc tggaggagcg gatcgacgcg 2760
atgatcgcca ccaagcagga gctggccgat ctcgccgtcg ggacgggcga gaactgggtg 2820
acggagatga gcaccgaaca actgggcgaa ctgctccgcc tcggtgacga ggcggtgggc 2880
gaatga 2886
<210> 76
<211> 961
<212> PRT
<213> Rhodococcus sp.
<400> 76
Met Ala Arg Ala Gly Thr Ser Arg Ala Val Gly Arg Thr Cys Leu Asp
1 5 10 15
Gly Cys Met Leu His Gly Leu Trp Thr Pro Gly Ser Gly Leu Met Leu
20 25 30
Trp Val Glu Asp Arg Asn Pro Ala Ala Pro Glu Pro Thr Asp Ala Val
35 40 45
Gly Arg Met Leu Ala Arg Lys Phe Arg His His Val Lys Val Pro Met
50 55 60
Pro Thr Pro Ser Gly Pro Glu Met Leu Glu Trp Ala Ala Val Ala Leu
65 70 75 80
Ala Pro Pro Asp Ala Thr Glu Phe Leu Leu Ser Val Ser Ser Arg Asp
85 90 95
Pro Arg Ile Ala Gly Asp Leu Arg Tyr Leu Ala His Val Ala Arg Gly
100 105 110
Val Glu Arg Trp Ala Arg Ala Gly Arg Val Val Pro Glu Val His Arg
115 120 125
Ala Glu Gly Gly Trp Trp Pro Arg Trp Arg Leu Leu Gly Gly Glu Arg
130 135 140
Gln Arg Ala Trp Leu Thr Glu Leu Ala Val Ala Met Pro Pro Val Gln
145 150 155 160
Arg His Gly Thr Thr Pro Arg Ala Val Leu Asp Asp Met Val Thr Glu
165 170 175
Leu Thr Asp Pro Val Ala Arg Arg Val Leu Glu Arg Arg His Pro Asp
180 185 190
Asp Ser Gly Gly Asp Val Asp His Pro Leu Ile Asp Ala Leu Val Arg
195 200 205
Gly Asp Gln Phe Ala Glu Gly Thr Ala Gln Leu Ser Gly Ser Leu Asp
210 215 220
Gly Trp Arg Asp Ser Leu Lys Val Asp Glu Pro Glu Leu Val Leu Arg
225 230 235 240
Leu Leu Glu Pro Glu Asp Val Asp Val Glu Gly Asp Trp Asp Pro Asp
245 250 255
Thr Val Leu Trp Arg Leu Glu Val Cys Leu Arg Pro Glu Gly Glu Ala
260 265 270
Pro Val Pro Ile Pro Leu His Arg Thr Glu Ala Ser Arg Leu Gln Ile
275 280 285
Gly Val Arg Lys Leu Thr Glu Ala Val Ala Ala Tyr Pro Arg Leu Gln
290 295 300
Asp Val Pro Ser Asp Pro Asp Ser Leu Asp Leu Met Leu Pro Thr Ala
305 310 315 320
Val Val Ile Asp Leu Val Gly His Gly Ala Val Ala Leu Lys Glu Lys
325 330 335
Gly Ile Ser Leu Leu Leu Pro Arg Ala Trp Ser Val Ala Ser Pro Ser
340 345 350
Met Arg Leu Arg Val Ser Ser Pro Ser Thr Pro Ala Ser Ala Glu Asn
355 360 365
Arg Ala Val Gly Lys Asp Gln Leu Val Gln Tyr Asn Trp Glu Leu Ala
370 375 380
Leu Gly Asp Thr Val Leu Thr Ala Ala Glu Met Asn Arg Leu Val Asn
385 390 395 400
Ser Lys Ser Asp Leu Val Arg Leu Arg Gly Glu Trp Val Arg Ala Asp
405 410 415
Gln Glu Val Leu Ser Arg Ala Ala Arg Tyr Val Ala Glu Arg His Ala
420 425 430
Ser Gly Asp Arg Ala Ile Val Asp Leu Leu Lys Asp Leu Ile Ala Asp
435 440 445
Asp Leu Ser Asp Leu Pro Val Glu Glu Val Thr Ala Thr Gly Trp Ala
450 455 460
Ala Ala Leu Leu Asp Gly Asp Thr Lys Pro Gln Asp Val Pro Thr Pro
465 470 475 480
Asp Gly Leu Asp Ala Thr Leu Arg Pro Tyr Gln Lys Arg Gly Leu Asp
485 490 495
Trp Leu Val Phe Met Ser Arg Leu Gly Leu Gly Ala Val Leu Ala Asp
500 505 510
Asp Met Gly Leu Gly Lys Thr Leu Gln Leu Leu Ala Leu Leu Ala His
515 520 525
Glu Lys Ala Pro Thr Pro Thr Leu Leu Val Cys Pro Met Ser Val Val
530 535 540
Gly Asn Trp Gln Arg Glu Ala Ala Arg Phe Val Pro Ser Leu Arg Val
545 550 555 560
Leu Val His His Gly Pro Gln Arg Leu Ser Gly Ala Glu Phe Thr Ala
565 570 575
Ala Val Thr Gln Ser Asp Leu Val Ile Thr Thr Tyr Ala Leu Leu Ala
580 585 590
Arg Asp Val Ala His Leu Lys Glu Gln Asp Trp Arg Arg Val Val Leu
595 600 605
Asp Glu Ala Gln His Ile Lys Asn Ala Lys Thr Ser Gln Ala Arg Ala
610 615 620
Ala Arg Ser Ile Pro Ala Ala His Arg Val Ala Leu Thr Gly Thr Pro
625 630 635 640
Val Glu Asn Arg Leu Asp Glu Leu Arg Ser Ile Leu Asp Phe Ala Asn
645 650 655
Ser Gly Ile Leu Gly Ser Glu Val Met Phe Arg Lys Arg Phe Val Val
660 665 670
Pro Ile Glu Arg Glu Gln Asp Glu Thr Ala Val Ala Arg Leu Arg Ala
675 680 685
Val Thr Ser Pro Phe Val Leu Arg Arg Val Lys Thr Asp Pro Ala Val
690 695 700
Ile Ala Asp Leu Pro Asp Lys Phe Glu Met Thr Val Arg Ala Asn Leu
705 710 715 720
Thr Ala Glu Gln Ala Ala Leu Tyr Arg Ala Val Val Asp Asp Met Met
725 730 735
Ala Gln Ile Lys Asp Lys Lys Gly Met Lys Arg Lys Gly Ala Val Leu
740 745 750
Ala Ala Leu Thr Lys Leu Lys Gln Val Cys Asn His Pro Ala His Phe
755 760 765
Leu Arg Asp Gly Ser Ala Val Met Arg Arg Gly Gln His Arg Ser Gly
770 775 780
Lys Leu Gly Leu Val Glu Asp Ile Leu Asp Ser Val Val Ala Asp Gly
785 790 795 800
Glu Lys Ala Leu Leu Phe Thr Gln Phe Arg Glu Phe Gly Asp Leu Val
805 810 815
Thr Pro Tyr Leu Ala Glu Arg Phe Gly Thr Pro Val Pro Phe Leu His
820 825 830
Gly Gly Val Ser Lys Gln Lys Arg Asp Asp Met Val Ala Ser Phe Gln
835 840 845
Gly Asp Asp Gly Pro Pro Ile Met Met Leu Ser Leu Lys Ala Gly Gly
850 855 860
Thr Gly Leu Asn Leu Thr Ala Ala Asn His Val Val His Leu Asp Arg
865 870 875 880
Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Phe Arg
885 890 895
Ile Gly Gln Arg Arg Asp Val Gln Val Arg Lys Leu Val Cys Val Gly
900 905 910
Thr Leu Glu Glu Arg Ile Asp Ala Met Ile Ala Thr Lys Gln Glu Leu
915 920 925
Ala Asp Leu Ala Val Gly Thr Gly Glu Asn Trp Val Thr Glu Met Ser
930 935 940
Thr Glu Gln Leu Gly Glu Leu Leu Arg Leu Gly Asp Glu Ala Val Gly
945 950 955 960
Glu
<210> 77
<211> 3153
<212> DNA
<213> Salinispora tropica
<400> 77
gtgctggttg tccacgggtc gtggcggctc ggcatcgggc tcgccatctg ggccgaggac 60
agcgcgtcgc cgcctcgggc gccgcgccgg gccgggcggg cgccccgcga gcgaccccac 120
ccgttcgccg ccggtcaccc cgtgcttgcg gcagctctgg ccgaggtcgc cgagccgacc 180
gagcccggca cggcactgct caccctgccc acccgagctg gttcgccgct ggactcgccg 240
gagctggtcc gcaccgcgtc ggtcgagccg ctccgtgggc cggtcacgtt ggccgggtgg 300
cgggtgcccg ccctggttta cgccccggac gccgccctgt cgctgctctc ccagatcacc 360
gcggccggcg ctctacctga cgccgtaccc ggtgccactc tgcgtcacct cgcggagctg 420
gcggccttcg ccgtggacct cgccgcccgt ggtcgggtcc tgcccggcgt ccggccaccg 480
aaggaacgtg ccagcgccgc ctgggcggtg tggcagcccc tgctcaccgg cgtggacgct 540
ggctgggccc gggccctcgc cctcgccctg ccgcccgcgg tccgtgccgc cgtcgagatc 600
gatccggctc cactcgccgt acccggcgga ccggaaacgc ccgccaacgg tggtgtgccg 660
ccgcaggctc gtacgaggcg accgaccgca gccgccgggg aaccaggtga actggtggtc 720
gaggcgctcg acgcgctcac cgacgcggcc gtacgggctg ccctcgcgga gacctccctt 780
acccggggag cccgtccgcg gggcgcggtc gcggcctggc tcgcggcgct caccggcccg 840
cgtcgtgact tcaccgccga ctcggcggag ctcgacaccc tgcgcggtga gttggacgcc 900
tggcagcgcg acgctgtggg aggttcggtc cgggccagct tccggctggt ggagccgccg 960
acggacggac tctttgaggc ggcggccggg gggctggccg cggccgaggg gtcgtggcgg 1020
gtcgagttcg gcctacagcc ggccgaccag ccgggtctgc atgttgacgc cgtgcggatc 1080
tggcacgagt cggcggccct accgggcccg gccgctccgc aggaggccct gctgaccgag 1140
ttggggcggg ccagccgact ctggccggag ctgaactcgg ccctgcgcac cgccactcca 1200
gaggcgctgg agctggacgc cgcgggcgcg catcgctttc tacgcgacgg cgcgccggtg 1260
ctgcacgcag ccgggttcgc ggtgctgttg ccctcgtggt ggcagcgtcc gtcgtcccgg 1320
ctcggcgctc gactacaggc ccagagccgt accgccccgg gcaccgtcgc cggggctggc 1380
gacggggtgg ggttggatgc cctggtcgac taccgctggg aggtgtccct cggcgaccag 1440
ccgctgaccg ccgaggaact ggagtcgctg gccgcgctga aatctccgtt ggtccgcctg 1500
cgtgggcgct gggtggagct ggacccgaaa cgtctcgccg ccggcctgcg gctgctccgt 1560
tccgccggcg agctgaccgt cggcgacctg ctgcggctcg gcctctccga ccctgctacc 1620
gacgcgctgc cggtgctcga ggtggcggcc gacggtgcgt tgggtgactt gctcgccgga 1680
gctgtggagc ggcaactcac cccggtggac gcggttccgt cgttccaggg cgttctccgc 1740
ccctaccagc ggcgagggct ggcctggctg tcctttctgc agtccctcgg cctcggcggg 1800
gtgctcgctg acgacatggg tctcggcaag acggtacagc tactcgcgtt gctcgctggt 1860
gacccgccgg gcgtcggtcc gaccctgttg gtctgtccga tgtcactggt cggtaactgg 1920
cagcgggagg cggcgacctt caccccgggc gtacgggtcc atgtgcatca cggcgccgag 1980
cgggcccgcg gggcggcgtt caccgcggcg gtggaggcag cggacctggt cctcaccacc 2040
tacacggtgg ctgcccgcga tgcgggggag ctggccgggg tcgactggca tcgggtggtg 2100
gtggacgagg cacaggccat caagaacgcc tcgacgcggc aagccgaggc ggtccgggcg 2160
ttgcccgccc ggcatcggat cgcggtcacc ggcaccccgg tggagaatcg gctcgccgac 2220
ctctggtcga tcatgcagtt cgccaatccc ggtctgctcg gcccggccgc cgagttcaag 2280
aagcggtacg ccgaaccgat cgagcgacac ggcgacgcgg aggcggccga gcggctgcgc 2340
cggatcaccg gcccgttcgt gctgcgtcgc ctcaagaccg actcttcggt tatctccgac 2400
ctgccagaga agctggagat ggaggtggtg tgcaacctga ccgcggaaca ggctgccctc 2460
taccgtgcgg tggtggacga catgatggcc cagatcgagt ccagcgaggg catcgagcga 2520
cgtgggctcg tgctggccgc catgacccgg ctcaagcagg tctgcaacca cccggcgcac 2580
ctgctgcggg acaactcggc gctggtcggc cgctccggca agctggcccg gctggaggag 2640
atcctcgacg aggtgcttgt cgcgggggag aaggccctgc tcttcaccca gtacgccgag 2700
ttcggcggca tgctgcgcgg ccacctgtcg gcccggttcg gacaggagac gctgttcctg 2760
cacggcggcg tcggtaaggc cgaccgggac gcgatggtga cgcggttcca gtccccggac 2820
ggccccgcgc tcttcgtact ctcgctcaag gccggtggta ccggtctcac cctgaccgcg 2880
gccaaccatg tcgtgcacgt tgaccgctgg tggaatccgg cggtggagga ccaggccacg 2940
gaccgggcgt tccgcatcgg gcagcggcgg cgcgttcagg tccgcaagtt tgtctgcgcc 3000
ggcacggtgg aggagaaggt cgccgcgctc atcgccgaca agcgtcggct cgcctcgacg 3060
gtggtgggtg ccggtgagca gtgggttacc gagctgtcca cggcgcagct gcgggagctg 3120
ttccagctgg agtccggggc ggtggccgaa tga 3153
<210> 78
<211> 1050
<212> PRT
<213> Salinispora tropica
<400> 78
Val Leu Val Val His Gly Ser Trp Arg Leu Gly Ile Gly Leu Ala Ile
1 5 10 15
Trp Ala Glu Asp Ser Ala Ser Pro Pro Arg Ala Pro Arg Arg Ala Gly
20 25 30
Arg Ala Pro Arg Glu Arg Pro His Pro Phe Ala Ala Gly His Pro Val
35 40 45
Leu Ala Ala Ala Leu Ala Glu Val Ala Glu Pro Thr Glu Pro Gly Thr
50 55 60
Ala Leu Leu Thr Leu Pro Thr Arg Ala Gly Ser Pro Leu Asp Ser Pro
65 70 75 80
Glu Leu Val Arg Thr Ala Ser Val Glu Pro Leu Arg Gly Pro Val Thr
85 90 95
Leu Ala Gly Trp Arg Val Pro Ala Leu Val Tyr Ala Pro Asp Ala Ala
100 105 110
Leu Ser Leu Leu Ser Gln Ile Thr Ala Ala Gly Ala Leu Pro Asp Ala
115 120 125
Val Pro Gly Ala Thr Leu Arg His Leu Ala Glu Leu Ala Ala Phe Ala
130 135 140
Val Asp Leu Ala Ala Arg Gly Arg Val Leu Pro Gly Val Arg Pro Pro
145 150 155 160
Lys Glu Arg Ala Ser Ala Ala Trp Ala Val Trp Gln Pro Leu Leu Thr
165 170 175
Gly Val Asp Ala Gly Trp Ala Arg Ala Leu Ala Leu Ala Leu Pro Pro
180 185 190
Ala Val Arg Ala Ala Val Glu Ile Asp Pro Ala Pro Leu Ala Val Pro
195 200 205
Gly Gly Pro Glu Thr Pro Ala Asn Gly Gly Val Pro Pro Gln Ala Arg
210 215 220
Thr Arg Arg Pro Thr Ala Ala Ala Gly Glu Pro Gly Glu Leu Val Val
225 230 235 240
Glu Ala Leu Asp Ala Leu Thr Asp Ala Ala Val Arg Ala Ala Leu Ala
245 250 255
Glu Thr Ser Leu Thr Arg Gly Ala Arg Pro Arg Gly Ala Val Ala Ala
260 265 270
Trp Leu Ala Ala Leu Thr Gly Pro Arg Arg Asp Phe Thr Ala Asp Ser
275 280 285
Ala Glu Leu Asp Thr Leu Arg Gly Glu Leu Asp Ala Trp Gln Arg Asp
290 295 300
Ala Val Gly Gly Ser Val Arg Ala Ser Phe Arg Leu Val Glu Pro Pro
305 310 315 320
Thr Asp Gly Leu Phe Glu Ala Ala Ala Gly Gly Leu Ala Ala Ala Glu
325 330 335
Gly Ser Trp Arg Val Glu Phe Gly Leu Gln Pro Ala Asp Gln Pro Gly
340 345 350
Leu His Val Asp Ala Val Arg Ile Trp His Glu Ser Ala Ala Leu Pro
355 360 365
Gly Pro Ala Ala Pro Gln Glu Ala Leu Leu Thr Glu Leu Gly Arg Ala
370 375 380
Ser Arg Leu Trp Pro Glu Leu Asn Ser Ala Leu Arg Thr Ala Thr Pro
385 390 395 400
Glu Ala Leu Glu Leu Asp Ala Ala Gly Ala His Arg Phe Leu Arg Asp
405 410 415
Gly Ala Pro Val Leu His Ala Ala Gly Phe Ala Val Leu Leu Pro Ser
420 425 430
Trp Trp Gln Arg Pro Ser Ser Arg Leu Gly Ala Arg Leu Gln Ala Gln
435 440 445
Ser Arg Thr Ala Pro Gly Thr Val Ala Gly Ala Gly Asp Gly Val Gly
450 455 460
Leu Asp Ala Leu Val Asp Tyr Arg Trp Glu Val Ser Leu Gly Asp Gln
465 470 475 480
Pro Leu Thr Ala Glu Glu Leu Glu Ser Leu Ala Ala Leu Lys Ser Pro
485 490 495
Leu Val Arg Leu Arg Gly Arg Trp Val Glu Leu Asp Pro Lys Arg Leu
500 505 510
Ala Ala Gly Leu Arg Leu Leu Arg Ser Ala Gly Glu Leu Thr Val Gly
515 520 525
Asp Leu Leu Arg Leu Gly Leu Ser Asp Pro Ala Thr Asp Ala Leu Pro
530 535 540
Val Leu Glu Val Ala Ala Asp Gly Ala Leu Gly Asp Leu Leu Ala Gly
545 550 555 560
Ala Val Glu Arg Gln Leu Thr Pro Val Asp Ala Val Pro Ser Phe Gln
565 570 575
Gly Val Leu Arg Pro Tyr Gln Arg Arg Gly Leu Ala Trp Leu Ser Phe
580 585 590
Leu Gln Ser Leu Gly Leu Gly Gly Val Leu Ala Asp Asp Met Gly Leu
595 600 605
Gly Lys Thr Val Gln Leu Leu Ala Leu Leu Ala Gly Asp Pro Pro Gly
610 615 620
Val Gly Pro Thr Leu Leu Val Cys Pro Met Ser Leu Val Gly Asn Trp
625 630 635 640
Gln Arg Glu Ala Ala Thr Phe Thr Pro Gly Val Arg Val His Val His
645 650 655
His Gly Ala Glu Arg Ala Arg Gly Ala Ala Phe Thr Ala Ala Val Glu
660 665 670
Ala Ala Asp Leu Val Leu Thr Thr Tyr Thr Val Ala Ala Arg Asp Ala
675 680 685
Gly Glu Leu Ala Gly Val Asp Trp His Arg Val Val Val Asp Glu Ala
690 695 700
Gln Ala Ile Lys Asn Ala Ser Thr Arg Gln Ala Glu Ala Val Arg Ala
705 710 715 720
Leu Pro Ala Arg His Arg Ile Ala Val Thr Gly Thr Pro Val Glu Asn
725 730 735
Arg Leu Ala Asp Leu Trp Ser Ile Met Gln Phe Ala Asn Pro Gly Leu
740 745 750
Leu Gly Pro Ala Ala Glu Phe Lys Lys Arg Tyr Ala Glu Pro Ile Glu
755 760 765
Arg His Gly Asp Ala Glu Ala Ala Glu Arg Leu Arg Arg Ile Thr Gly
770 775 780
Pro Phe Val Leu Arg Arg Leu Lys Thr Asp Ser Ser Val Ile Ser Asp
785 790 795 800
Leu Pro Glu Lys Leu Glu Met Glu Val Val Cys Asn Leu Thr Ala Glu
805 810 815
Gln Ala Ala Leu Tyr Arg Ala Val Val Asp Asp Met Met Ala Gln Ile
820 825 830
Glu Ser Ser Glu Gly Ile Glu Arg Arg Gly Leu Val Leu Ala Ala Met
835 840 845
Thr Arg Leu Lys Gln Val Cys Asn His Pro Ala His Leu Leu Arg Asp
850 855 860
Asn Ser Ala Leu Val Gly Arg Ser Gly Lys Leu Ala Arg Leu Glu Glu
865 870 875 880
Ile Leu Asp Glu Val Leu Val Ala Gly Glu Lys Ala Leu Leu Phe Thr
885 890 895
Gln Tyr Ala Glu Phe Gly Gly Met Leu Arg Gly His Leu Ser Ala Arg
900 905 910
Phe Gly Gln Glu Thr Leu Phe Leu His Gly Gly Val Gly Lys Ala Asp
915 920 925
Arg Asp Ala Met Val Thr Arg Phe Gln Ser Pro Asp Gly Pro Ala Leu
930 935 940
Phe Val Leu Ser Leu Lys Ala Gly Gly Thr Gly Leu Thr Leu Thr Ala
945 950 955 960
Ala Asn His Val Val His Val Asp Arg Trp Trp Asn Pro Ala Val Glu
965 970 975
Asp Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly Gln Arg Arg Arg Val
980 985 990
Gln Val Arg Lys Phe Val Cys Ala Gly Thr Val Glu Glu Lys Val Ala
995 1000 1005
Ala Leu Ile Ala Asp Lys Arg Arg Leu Ala Ser Thr Val Val Gly
1010 1015 1020
Ala Gly Glu Gln Trp Val Thr Glu Leu Ser Thr Ala Gln Leu Arg
1025 1030 1035
Glu Leu Phe Gln Leu Glu Ser Gly Ala Val Ala Glu
1040 1045 1050
<210> 79
<211> 2970
<212> DNA
<213> Symbiobacterium thermophilum
<400> 79
atgatcacgg ttcacggcag tttcgtcccc tccggcgcgt ccggcttctt cttcctgtgg 60
ggcctggacg gcgtggccgc ccgggatgcc gctcctcccg gccggcgccg ccgcggggtt 120
ccgcgccacc catgcgcaac cgagccggaa gcgctctacc ccgccctgag aggattgccc 180
tacctgaaca ccctgtccct ggtccagtgg cagcccggac cggacggcgt cagcccggcc 240
cgggtcccgg ggatcgccct gtccgtgccc aacgccgtgc agtggctgtt ggatctgccc 300
gaccacttcc gcggcacgcc cctccggccg gggcacagcc tgcagctctg gtgcgtcgca 360
tccaagctgc ttctggagtt cctggggcgg ggcctgatgc tgccggtgct gcaggccgag 420
gccggggtgc tgagcgcggg ctgggcgctc cacctgaccg acgccgacga cgtccgccgc 480
ctgacccggc tggccgctgg attgccggag gcctgccgcg cccttgtgcc ccccgaccga 540
acccccaaca cctaccccct gccggtcgcc gacggcctgg tccaccagtt catgcgtacg 600
gcggccgccg gcgtgatccg gctcctcctg gaggaagagc ccctgcccga ggcccagtcg 660
ctacaggata ccgccctgcg ccactggctg gcggcgctga ccggggcgga ggcccgggac 720
ctgccgccgg gcctgcccgg cgcgcaggag ctgtacgccg ccctggaccg ctggagcgcc 780
cccgccaccg gcgtgctgag ccacgccagt ctgcggacgg gggtccgcct ccacctgccc 840
ggccccgaga ccgacggcga gtgggagctg gagctcacgc tccatgcgcc ggacgagggt 900
gcgctgcccg tcaccgccga tgcggtctgg gccagcctgg gcgccgaggt ggagatcggc 960
gggcagcggt accagggcgc cgagcagcgg ctgctggccg acctgccggc catggcccgc 1020
ctcttcccgc cactggcgcc gctgctccgg gaccccgcgc ccagccgcat gcgcattccg 1080
gcggacgacg tgctggccct gatccaggaa ggggccatgc tgctccagca ggccggccac 1140
cccgtgctgc tgccggccgc ccttgcgaag cccgccgccc tccgggtcgg aatgcgcctc 1200
agccccgccg ggggcagccc ctccatgttc gggctgcacc agatcgtgaa cgtgcgctgg 1260
gacgtggccc tgggcggcac cccgctcacg ctggacgagc tgcgccacct ggcgcggcag 1320
aagcggcccc tggtacagat gcagggccgg tgggtgcggg tggacgaacg caccctggct 1380
gcggtcctcc gccggatcga gcagcacggc gggcagatgg agctgggcac ggcgctgcgc 1440
ctggcacccg aggcggacga ggccaccgcg accggctgga tcgccgagct gctggagcgg 1500
ctgcaggagc cagcccggat ggagccggtg ccgacccccg ggggcttcgc cggcaccctg 1560
cggccgtacc agcagcgggg cctcgcctgg ctggcgttcc tgcgccgctg gggcctgggc 1620
gcgtgcctcg ccgacgacat ggggctgggc aagaccgtgc agctcatcgc ccttctcctg 1680
cacgagcggg aggccgggtg ggccgcgggc ccgaccctgc tggtctgccc cgtctcggtc 1740
ctgggcaact ggtgccggga gctggcccgc ttcgccccgg gcctgcgggt cctggtgcac 1800
catggccccg ggaggctggg cgagccggac ttcgcccggc aggccggggc ccacgacgtg 1860
gtgctgacca cgtactccct gctggcccgg gatgccgcgc tgctgggcca ggtgacctgg 1920
aacgggatcg tcgccgacga ggcgcagaac ctgaaaaacc ccgacacaca gcacgcccgg 1980
gcgctgcgaa gcctttccgg cggctaccgc atcgccctca ccggtacgcc cgtcgaaaac 2040
cacctgggcg acctgtggtc gctcttccag ttcctcaacc cggggctgct gggcagccgc 2100
gaggagttcg agcggcgcta cgccgtgccg atccagcggt accaggacga ggaggctgcg 2160
gcccggctcc gccggcaggt gggtcccttc atcctgcgcc ggcagaagaa cgaccccgcc 2220
atcgcgccgg acctgcccga caagctggag aacaccgagc tggtgaccct ctcggtggaa 2280
caggcggcgc tgtacgaggc catcgtgcag gagacgctgg agcgggccgc gcaggccgac 2340
ggcatccagc ggcaggcggc ggtcctggca ggcctcacgc ggctgaagca ggtgtgcaac 2400
catcccgcag ccgccaccgg cgacggcccc ctggtggggc ggagcggcaa gatcgaccgg 2460
ctggtgcaac tgctgcagga ggtgctggcg gcgggcgagc aggccctgct cttcacccag 2520
ttcgcccgct tcggcgggcg gctgcaggcc tacctggcgg agacgctggg ctgcgaggtg 2580
ctcttcctgc acggcggcac gccccagccc gagcgggacc ggctcgtcgc ccggttccag 2640
gccggcgagg cgcccctctt catcctctcg ctgaaagccg gcggccttgg cctcaacctc 2700
accgccgcga cccacgtctt tcacgtggac cggtggtgga atccggcggt ggaggatcag 2760
gccacagacc gggcctaccg catcggccag acgcgcaggg tgctggtgca ccggctgatc 2820
accgccggca cgctggagga gcgcatcgac cggctgctgg ccgagaagcg tgccctggcg 2880
ggccaggtga tcatcagcgg cgagtcgtgg ctcggccagc tctccaccga ggagctgcgg 2940
gccctgatcg ccctggaccg ggaggtgtag 2970
<210> 80
<211> 989
<212> PRT
<213> Symbiobacterium thermophilum
<400> 80
Met Ile Thr Val His Gly Ser Phe Val Pro Ser Gly Ala Ser Gly Phe
1 5 10 15
Phe Phe Leu Trp Gly Leu Asp Gly Val Ala Ala Arg Asp Ala Ala Pro
20 25 30
Pro Gly Arg Arg Arg Arg Gly Val Pro Arg His Pro Cys Ala Thr Glu
35 40 45
Pro Glu Ala Leu Tyr Pro Ala Leu Arg Gly Leu Pro Tyr Leu Asn Thr
50 55 60
Leu Ser Leu Val Gln Trp Gln Pro Gly Pro Asp Gly Val Ser Pro Ala
65 70 75 80
Arg Val Pro Gly Ile Ala Leu Ser Val Pro Asn Ala Val Gln Trp Leu
85 90 95
Leu Asp Leu Pro Asp His Phe Arg Gly Thr Pro Leu Arg Pro Gly His
100 105 110
Ser Leu Gln Leu Trp Cys Val Ala Ser Lys Leu Leu Leu Glu Phe Leu
115 120 125
Gly Arg Gly Leu Met Leu Pro Val Leu Gln Ala Glu Ala Gly Val Leu
130 135 140
Ser Ala Gly Trp Ala Leu His Leu Thr Asp Ala Asp Asp Val Arg Arg
145 150 155 160
Leu Thr Arg Leu Ala Ala Gly Leu Pro Glu Ala Cys Arg Ala Leu Val
165 170 175
Pro Pro Asp Arg Thr Pro Asn Thr Tyr Pro Leu Pro Val Ala Asp Gly
180 185 190
Leu Val His Gln Phe Met Arg Thr Ala Ala Ala Gly Val Ile Arg Leu
195 200 205
Leu Leu Glu Glu Glu Pro Leu Pro Glu Ala Gln Ser Leu Gln Asp Thr
210 215 220
Ala Leu Arg His Trp Leu Ala Ala Leu Thr Gly Ala Glu Ala Arg Asp
225 230 235 240
Leu Pro Pro Gly Leu Pro Gly Ala Gln Glu Leu Tyr Ala Ala Leu Asp
245 250 255
Arg Trp Ser Ala Pro Ala Thr Gly Val Leu Ser His Ala Ser Leu Arg
260 265 270
Thr Gly Val Arg Leu His Leu Pro Gly Pro Glu Thr Asp Gly Glu Trp
275 280 285
Glu Leu Glu Leu Thr Leu His Ala Pro Asp Glu Gly Ala Leu Pro Val
290 295 300
Thr Ala Asp Ala Val Trp Ala Ser Leu Gly Ala Glu Val Glu Ile Gly
305 310 315 320
Gly Gln Arg Tyr Gln Gly Ala Glu Gln Arg Leu Leu Ala Asp Leu Pro
325 330 335
Ala Met Ala Arg Leu Phe Pro Pro Leu Ala Pro Leu Leu Arg Asp Pro
340 345 350
Ala Pro Ser Arg Met Arg Ile Pro Ala Asp Asp Val Leu Ala Leu Ile
355 360 365
Gln Glu Gly Ala Met Leu Leu Gln Gln Ala Gly His Pro Val Leu Leu
370 375 380
Pro Ala Ala Leu Ala Lys Pro Ala Ala Leu Arg Val Gly Met Arg Leu
385 390 395 400
Ser Pro Ala Gly Gly Ser Pro Ser Met Phe Gly Leu His Gln Ile Val
405 410 415
Asn Val Arg Trp Asp Val Ala Leu Gly Gly Thr Pro Leu Thr Leu Asp
420 425 430
Glu Leu Arg His Leu Ala Arg Gln Lys Arg Pro Leu Val Gln Met Gln
435 440 445
Gly Arg Trp Val Arg Val Asp Glu Arg Thr Leu Ala Ala Val Leu Arg
450 455 460
Arg Ile Glu Gln His Gly Gly Gln Met Glu Leu Gly Thr Ala Leu Arg
465 470 475 480
Leu Ala Pro Glu Ala Asp Glu Ala Thr Ala Thr Gly Trp Ile Ala Glu
485 490 495
Leu Leu Glu Arg Leu Gln Glu Pro Ala Arg Met Glu Pro Val Pro Thr
500 505 510
Pro Gly Gly Phe Ala Gly Thr Leu Arg Pro Tyr Gln Gln Arg Gly Leu
515 520 525
Ala Trp Leu Ala Phe Leu Arg Arg Trp Gly Leu Gly Ala Cys Leu Ala
530 535 540
Asp Asp Met Gly Leu Gly Lys Thr Val Gln Leu Ile Ala Leu Leu Leu
545 550 555 560
His Glu Arg Glu Ala Gly Trp Ala Ala Gly Pro Thr Leu Leu Val Cys
565 570 575
Pro Val Ser Val Leu Gly Asn Trp Cys Arg Glu Leu Ala Arg Phe Ala
580 585 590
Pro Gly Leu Arg Val Leu Val His His Gly Pro Gly Arg Leu Gly Glu
595 600 605
Pro Asp Phe Ala Arg Gln Ala Gly Ala His Asp Val Val Leu Thr Thr
610 615 620
Tyr Ser Leu Leu Ala Arg Asp Ala Ala Leu Leu Gly Gln Val Thr Trp
625 630 635 640
Asn Gly Ile Val Ala Asp Glu Ala Gln Asn Leu Lys Asn Pro Asp Thr
645 650 655
Gln His Ala Arg Ala Leu Arg Ser Leu Ser Gly Gly Tyr Arg Ile Ala
660 665 670
Leu Thr Gly Thr Pro Val Glu Asn His Leu Gly Asp Leu Trp Ser Leu
675 680 685
Phe Gln Phe Leu Asn Pro Gly Leu Leu Gly Ser Arg Glu Glu Phe Glu
690 695 700
Arg Arg Tyr Ala Val Pro Ile Gln Arg Tyr Gln Asp Glu Glu Ala Ala
705 710 715 720
Ala Arg Leu Arg Arg Gln Val Gly Pro Phe Ile Leu Arg Arg Gln Lys
725 730 735
Asn Asp Pro Ala Ile Ala Pro Asp Leu Pro Asp Lys Leu Glu Asn Thr
740 745 750
Glu Leu Val Thr Leu Ser Val Glu Gln Ala Ala Leu Tyr Glu Ala Ile
755 760 765
Val Gln Glu Thr Leu Glu Arg Ala Ala Gln Ala Asp Gly Ile Gln Arg
770 775 780
Gln Ala Ala Val Leu Ala Gly Leu Thr Arg Leu Lys Gln Val Cys Asn
785 790 795 800
His Pro Ala Ala Ala Thr Gly Asp Gly Pro Leu Val Gly Arg Ser Gly
805 810 815
Lys Ile Asp Arg Leu Val Gln Leu Leu Gln Glu Val Leu Ala Ala Gly
820 825 830
Glu Gln Ala Leu Leu Phe Thr Gln Phe Ala Arg Phe Gly Gly Arg Leu
835 840 845
Gln Ala Tyr Leu Ala Glu Thr Leu Gly Cys Glu Val Leu Phe Leu His
850 855 860
Gly Gly Thr Pro Gln Pro Glu Arg Asp Arg Leu Val Ala Arg Phe Gln
865 870 875 880
Ala Gly Glu Ala Pro Leu Phe Ile Leu Ser Leu Lys Ala Gly Gly Leu
885 890 895
Gly Leu Asn Leu Thr Ala Ala Thr His Val Phe His Val Asp Arg Trp
900 905 910
Trp Asn Pro Ala Val Glu Asp Gln Ala Thr Asp Arg Ala Tyr Arg Ile
915 920 925
Gly Gln Thr Arg Arg Val Leu Val His Arg Leu Ile Thr Ala Gly Thr
930 935 940
Leu Glu Glu Arg Ile Asp Arg Leu Leu Ala Glu Lys Arg Ala Leu Ala
945 950 955 960
Gly Gln Val Ile Ile Ser Gly Glu Ser Trp Leu Gly Gln Leu Ser Thr
965 970 975
Glu Glu Leu Arg Ala Leu Ile Ala Leu Asp Arg Glu Val
980 985
<210> 81
<211> 3114
<212> DNA
<213> Synechococcus sp.
<400> 81
atgagcctgc tgcacgccac ctggctgtcg gccgacaccg ccgccgtgcc cgccctggga 60
ggcggctacc ggccgggctt gctgctctgg gccgacacct ggcgggtggc ggaaccccag 120
acaccggcca gcgaggcgcc ccagcacccc ctcagcctcg accaggacga cctcggcgcc 180
tggcttgagg aggccgacct ctggacggag gatttccgcc cggccggagc caccctctgc 240
ctgcccagcc gccgccaggg ggccaggggg aaaaagaaaa gcgacaccag cagctggagc 300
ggcctgcccc tgcaggcggg cgagccgatc ccgaaatccg tggagtggtg gccctggcgg 360
gtggagggct ggtggctgga gcccggcgcc gccaccctct ggcttgggcg cctgcccctc 420
tcaggcgacc atcccgacct ggccgatgac ctgcgctggt ggagccatct gcagcgctgg 480
tcgctgagcc tgctggcccg gggccggctg ctgccccagg tggagggggg ccgcgcccgc 540
tggctgccgt tgatcaaccg cgaagacgac cggcgccgcc tggaggatct ggcctcgcgt 600
ctgccccagg tggcggtggc ggccctggag cccggccagg gggaggccgg cgtcgcgatg 660
gcgtgctggc ggccgggatc cgggcgtcgg cggctggcct cgatcctcac gcacctggtg 720
gatgcacgca tgcgtgcggg cttcaccccc agcgaagagg ggctggatcc gctgctggcg 780
gcctggcagc gggccctcgg ccccggtgac ggccgcctcg atctcgggga cgacgactgc 840
gaacgcctgc aggtggccac tcaccactgg cgcgaagcgg tggctggccg ggtcgagccg 900
gcccgggcct gtcttgagct cgacacaccc gatgaggggg aagatctctg gcccctgcgc 960
ttcagcctcc aggccgaggc cgatcccagt ctgctgctgc ccgcagccgg ggtctgggcc 1020
gccggggccg gctgcctgca gctgggtgaa accgaactcc agcaacccgg tgaactgctg 1080
ctggaaggcc tcgggagagc cctgcaggtg ttcgagccga tcgagagggg tctcgacacc 1140
gccacaccgg agcggatggc tctcaccccg gccgaagcct tcgtgctggt gcgcaccgcc 1200
gcgctgaagc tgcgtgatgt gggcgtcggc gtggtcctgc cccccagcct cagcggtggc 1260
ctggccagcc ggctcggcct ctcgatcgag gccgatctgc ccgagcgctc ccgcggcttc 1320
agcctcggtg aaagcctgca gtggagctgg gagctgatga tcggcggcgt cacgctcacc 1380
ctgcgggacc tggagcggct ggcgggcaag cgcagcccgc tggtgcagca caagggggcc 1440
tggatcgagc tgcgtccggg tgatctgcgc aatgccgaga agttctgcgc cctcgatccg 1500
gtcctcagcc tcgatgacgc cctgcgcctg accggcaacg agggggagac cctgcagcgg 1560
ctgccggtgc accgcttcac agccggcccg aggctgaagg cggtgctgga gcagtaccac 1620
cagcagaagg cccccgatcc cctgccggcc cccgagggct tcgccggcca gctgcggccc 1680
taccaggagc gcggcctggg ctggctggcc ttcctgcacc gcttcgatca gggggcctgc 1740
ctggccgacg acatgggcct gggcaagaca atccagctgc tggccttcct gcagcacctc 1800
aaggcggagc aggaactgaa gcgtcccgta ctgctggtgg cccccacctc ggtgctcacc 1860
aactggctgc gggaagcgaa ggccttcacg ccggaactga acgtggtgga gcactacggc 1920
ccccggcggc cctccacccc cgccgccctg aagaagaagc tggaggggat ggatctggtg 1980
ctcaccagct acggcctgct gcagcgcgac agcgagttac tgagcagcct cgactggcag 2040
ggggtggtga ttgatgaggc ccaggcgatc aagaattcct cagcgcgcca gtcgcaggca 2100
gcccgcgatc tggcacgccc gctcaagcag agccgcttcc gtatcgcact caccggcacc 2160
ccggtggaga accgggtcag tgagctctgg gccctgatgg acttcctcaa tccgaaggtg 2220
cttggggagg aggagttctt ccgccagcgc taccgcctgc cgatcgagcg ctatggcgac 2280
atggcctcgg tgcgcgacct caaggcccgc gtcggcccgt tcatcctgcg gcgcctcaag 2340
actgaccgct cgatcatctc cgacctgccc gagaaggtgg aactgaagga gtgggttgga 2400
ctctcacccg agcaggtcaa gctctaccgc cgcaccgtgg aggacaccct cgatgcgatc 2460
gcgcgggcac ccgtgggcca gaagcacggc caggtgctgg ggctgctcac caagctcaag 2520
caggtctgca accacccggc cctgatgctc aaggaagggg aggtgggggc cggcttcagc 2580
gcccgctcgg ccaagttgca gcggctcgag gaaatcgtcg aggaggtgat cgcggccggc 2640
gatcgggccc tcctgtttac ccagttcgcc gaatggggcc acctgctcca gacccacctg 2700
cagcagcgct tccaccagga ggtgcccttt ctctatggca gtaccagcaa gggggagcgt 2760
caggcgatgg tggatcgctt ccaggacgac ccccggggac cacagctgtt cctgctctcg 2820
ctcaaggcag gcggcgtggg gctcaacctc acccgggcca gtcatgtgtt ccacatcgac 2880
cgctggtgga atccggcggt ggagaaccag gccaccgacc gggcctaccg catcggccag 2940
accaaccggg tgatggtgca caagttcatc accagcggct cggtggagga gaagatcgac 3000
cgcatgatcc gcgaaaaggc ccgcctggcc gaagacatcg tcggcagcgg tgaggagtgg 3060
ctcggaggcc tcgatcccgg ccagctgcgc gacctggtgg ccctggagga gtga 3114
<210> 82
<211> 1037
<212> PRT
<213> Synechococcus sp.
<400> 82
Met Ser Leu Leu His Ala Thr Trp Leu Ser Ala Asp Thr Ala Ala Val
1 5 10 15
Pro Ala Leu Gly Gly Gly Tyr Arg Pro Gly Leu Leu Leu Trp Ala Asp
20 25 30
Thr Trp Arg Val Ala Glu Pro Gln Thr Pro Ala Ser Glu Ala Pro Gln
35 40 45
His Pro Leu Ser Leu Asp Gln Asp Asp Leu Gly Ala Trp Leu Glu Glu
50 55 60
Ala Asp Leu Trp Thr Glu Asp Phe Arg Pro Ala Gly Ala Thr Leu Cys
65 70 75 80
Leu Pro Ser Arg Arg Gln Gly Ala Arg Gly Lys Lys Lys Ser Asp Thr
85 90 95
Ser Ser Trp Ser Gly Leu Pro Leu Gln Ala Gly Glu Pro Ile Pro Lys
100 105 110
Ser Val Glu Trp Trp Pro Trp Arg Val Glu Gly Trp Trp Leu Glu Pro
115 120 125
Gly Ala Ala Thr Leu Trp Leu Gly Arg Leu Pro Leu Ser Gly Asp His
130 135 140
Pro Asp Leu Ala Asp Asp Leu Arg Trp Trp Ser His Leu Gln Arg Trp
145 150 155 160
Ser Leu Ser Leu Leu Ala Arg Gly Arg Leu Leu Pro Gln Val Glu Gly
165 170 175
Gly Arg Ala Arg Trp Leu Pro Leu Ile Asn Arg Glu Asp Asp Arg Arg
180 185 190
Arg Leu Glu Asp Leu Ala Ser Arg Leu Pro Gln Val Ala Val Ala Ala
195 200 205
Leu Glu Pro Gly Gln Gly Glu Ala Gly Val Ala Met Ala Cys Trp Arg
210 215 220
Pro Gly Ser Gly Arg Arg Arg Leu Ala Ser Ile Leu Thr His Leu Val
225 230 235 240
Asp Ala Arg Met Arg Ala Gly Phe Thr Pro Ser Glu Glu Gly Leu Asp
245 250 255
Pro Leu Leu Ala Ala Trp Gln Arg Ala Leu Gly Pro Gly Asp Gly Arg
260 265 270
Leu Asp Leu Gly Asp Asp Asp Cys Glu Arg Leu Gln Val Ala Thr His
275 280 285
His Trp Arg Glu Ala Val Ala Gly Arg Val Glu Pro Ala Arg Ala Cys
290 295 300
Leu Glu Leu Asp Thr Pro Asp Glu Gly Glu Asp Leu Trp Pro Leu Arg
305 310 315 320
Phe Ser Leu Gln Ala Glu Ala Asp Pro Ser Leu Leu Leu Pro Ala Ala
325 330 335
Gly Val Trp Ala Ala Gly Ala Gly Cys Leu Gln Leu Gly Glu Thr Glu
340 345 350
Leu Gln Gln Pro Gly Glu Leu Leu Leu Glu Gly Leu Gly Arg Ala Leu
355 360 365
Gln Val Phe Glu Pro Ile Glu Arg Gly Leu Asp Thr Ala Thr Pro Glu
370 375 380
Arg Met Ala Leu Thr Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala
385 390 395 400
Ala Leu Lys Leu Arg Asp Val Gly Val Gly Val Val Leu Pro Pro Ser
405 410 415
Leu Ser Gly Gly Leu Ala Ser Arg Leu Gly Leu Ser Ile Glu Ala Asp
420 425 430
Leu Pro Glu Arg Ser Arg Gly Phe Ser Leu Gly Glu Ser Leu Gln Trp
435 440 445
Ser Trp Glu Leu Met Ile Gly Gly Val Thr Leu Thr Leu Arg Asp Leu
450 455 460
Glu Arg Leu Ala Gly Lys Arg Ser Pro Leu Val Gln His Lys Gly Ala
465 470 475 480
Trp Ile Glu Leu Arg Pro Gly Asp Leu Arg Asn Ala Glu Lys Phe Cys
485 490 495
Ala Leu Asp Pro Val Leu Ser Leu Asp Asp Ala Leu Arg Leu Thr Gly
500 505 510
Asn Glu Gly Glu Thr Leu Gln Arg Leu Pro Val His Arg Phe Thr Ala
515 520 525
Gly Pro Arg Leu Lys Ala Val Leu Glu Gln Tyr His Gln Gln Lys Ala
530 535 540
Pro Asp Pro Leu Pro Ala Pro Glu Gly Phe Ala Gly Gln Leu Arg Pro
545 550 555 560
Tyr Gln Glu Arg Gly Leu Gly Trp Leu Ala Phe Leu His Arg Phe Asp
565 570 575
Gln Gly Ala Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln
580 585 590
Leu Leu Ala Phe Leu Gln His Leu Lys Ala Glu Gln Glu Leu Lys Arg
595 600 605
Pro Val Leu Leu Val Ala Pro Thr Ser Val Leu Thr Asn Trp Leu Arg
610 615 620
Glu Ala Lys Ala Phe Thr Pro Glu Leu Asn Val Val Glu His Tyr Gly
625 630 635 640
Pro Arg Arg Pro Ser Thr Pro Ala Ala Leu Lys Lys Lys Leu Glu Gly
645 650 655
Met Asp Leu Val Leu Thr Ser Tyr Gly Leu Leu Gln Arg Asp Ser Glu
660 665 670
Leu Leu Ser Ser Leu Asp Trp Gln Gly Val Val Ile Asp Glu Ala Gln
675 680 685
Ala Ile Lys Asn Ser Ser Ala Arg Gln Ser Gln Ala Ala Arg Asp Leu
690 695 700
Ala Arg Pro Leu Lys Gln Ser Arg Phe Arg Ile Ala Leu Thr Gly Thr
705 710 715 720
Pro Val Glu Asn Arg Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu
725 730 735
Asn Pro Lys Val Leu Gly Glu Glu Glu Phe Phe Arg Gln Arg Tyr Arg
740 745 750
Leu Pro Ile Glu Arg Tyr Gly Asp Met Ala Ser Val Arg Asp Leu Lys
755 760 765
Ala Arg Val Gly Pro Phe Ile Leu Arg Arg Leu Lys Thr Asp Arg Ser
770 775 780
Ile Ile Ser Asp Leu Pro Glu Lys Val Glu Leu Lys Glu Trp Val Gly
785 790 795 800
Leu Ser Pro Glu Gln Val Lys Leu Tyr Arg Arg Thr Val Glu Asp Thr
805 810 815
Leu Asp Ala Ile Ala Arg Ala Pro Val Gly Gln Lys His Gly Gln Val
820 825 830
Leu Gly Leu Leu Thr Lys Leu Lys Gln Val Cys Asn His Pro Ala Leu
835 840 845
Met Leu Lys Glu Gly Glu Val Gly Ala Gly Phe Ser Ala Arg Ser Ala
850 855 860
Lys Leu Gln Arg Leu Glu Glu Ile Val Glu Glu Val Ile Ala Ala Gly
865 870 875 880
Asp Arg Ala Leu Leu Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu
885 890 895
Gln Thr His Leu Gln Gln Arg Phe His Gln Glu Val Pro Phe Leu Tyr
900 905 910
Gly Ser Thr Ser Lys Gly Glu Arg Gln Ala Met Val Asp Arg Phe Gln
915 920 925
Asp Asp Pro Arg Gly Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly
930 935 940
Gly Val Gly Leu Asn Leu Thr Arg Ala Ser His Val Phe His Ile Asp
945 950 955 960
Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr
965 970 975
Arg Ile Gly Gln Thr Asn Arg Val Met Val His Lys Phe Ile Thr Ser
980 985 990
Gly Ser Val Glu Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ala Arg
995 1000 1005
Leu Ala Glu Asp Ile Val Gly Ser Gly Glu Glu Trp Leu Gly Gly
1010 1015 1020
Leu Asp Pro Gly Gln Leu Arg Asp Leu Val Ala Leu Glu Glu
1025 1030 1035
<210> 83
<211> 3090
<212> DNA
<213> Synechococcus sp.
<400> 83
atgagcctgc tgcacgccac ctggcttccc gccattcgta cttccagcag ttccggacaa 60
ccggcactgc tcgtttgggc tgacacctgg cgtgtcgcct caccggaggg acctggactc 120
acacccgctc tgcatccctt cacccttggc tcgaacgatc tcaaggcttg gttgaccgaa 180
cgggacctga tgcctggggg cagcatcgat gccaccgcct gcctcaccct cccaagccgc 240
accgtcaaac cccgcaaaag tcgaacccaa tcgagcgaac cagatccgga ggggccagcc 300
tggaccgggt tgccaatgca agcgggagaa cccattccaa aacaaatgga atggtggcca 360
tggcaagtgc aaggcctggc ggtcgagcca tcggccgcca cggaatggct ggcccgttta 420
cccctatcgg gccgacatcc agaccttggg gatgaactgc gctggtggag tcacctccaa 480
cgttggtccc tcagcttggt ggcccgtggt cgctggattc cccaaatgga attaagcaaa 540
ggcgaggggt acccccaccg agcgcgctgg gttcccctgc tgaaccgtga ggaggatcga 600
cgccggctcg aagacctcgc cgcgacgctg cccctcgtag cgacctgtgc cctcccttgg 660
cgtgagccac tcggacgccg cagcaaccgc accaccaggc ttcgaccgga agcgatgcga 720
gccgccaatc cggtcgcctg ctgtcgccca cgaagcggtc gcctcagggt ggccaccttg 780
cttgaagact tggtggatgc ggagctgcgc aagggatttg aaccaagcac ggaaggcctc 840
gaccccttac tcaccttgtg gcaagaggcc ctggcctcag aaaccggtgt tgtggaggtg 900
ggcaacgaag acgcagaacg cctcaccgcg gcaagcctgc actggcgcga gggaattgcc 960
ggaggcttcg cggccgcccg cacctgcctc gaactcaaca ccccaaacga aggcgaagaa 1020
ctctgggacc tgaagtttgg attgcaagcg gaggccgatc ccagcctcaa gctgccggcc 1080
gccgcggcct gggcctcagg agcggaaacc cttcaactgg gggaaatcca agttgaccag 1140
gcgggggaag tgctgctgga gggtcttggc cgagccctca cggtgttccc tccgatcgaa 1200
cgcggactgg aaagcgcaac accggaaacg atgcagctca ctccagcgga ggcatttgtg 1260
ttggtgcgaa cagcaacgca ccagctccgc aatgccggca tcggcgtcga actgcccccc 1320
agtctttcag ggggcctcgc cagccggctt ggcttagcga ttaaagcgga tctaccggat 1380
cgatccagcg gcttcaccct cggcgaatct cttgactgga gctgggatct catgatcggc 1440
ggcgtcacac tcaccctccg agagctcgaa cgtctcagcg gtaagcgaag tccgctggta 1500
cgccacaagg gcgcctggat cgaactacgg cccaacgatc tccgcaacgc cgaacgcttt 1560
tgtggagcca atccagaact gagcctcgac gacgcactac ggctcacggc cacagaaggg 1620
gagctcatga tgcgcctgcc ggtgcatcgc tttgatgcag ggcctcgtct tcagggagtt 1680
ctcgagcaat accaccagca aaaagccccc gatcccctgc cagctccaga gggattttcc 1740
ggacaactcc gtccctatca agaacgtggc ttgggctggc tggccttcct gcatcgcttc 1800
gatcagggcg cctgcctggc ggacgacatg ggcttgggca agaccatcca gttattggcg 1860
ttcctgcagc acctcaaagc ggaaaacgaa ctcaaacgcc cggtgctgtt ggtggcccca 1920
acctcggtgc tcacgaattg gcgacgggaa gcggaagcct tcacccctga gctgtcggtg 1980
agagagcact acgggccacg ccggccttcc acgccggccg ccttgaaaaa agagctcaaa 2040
ggtgtggatc tggtgctcac cagttacgga ctgatgcaac gcgacagtga gctgctggac 2100
aacctcgact ggcaaggggt tgtgatcgat gaagctcagg cgatcaagaa ccctggggca 2160
aagcaaagcc aagcggcccg agacctagcg cgagccggga agagcagcag gttccgcatt 2220
gcactcacgg gcacaccggt ggaaaaccgc gtcagcgagc tgtgggcgct gatggatttc 2280
ctcaacccca aagtgttggg tgaggaagac ttttttcgtc agcgctaccg catgccaatt 2340
gagcgctacg gcgatatgtc gtcgttacgc gatctcaaag cacgggttgg tcccttcatc 2400
ctgcgccgcc tcaaaaccga caagtcgatc atttccgacc tgcctgaaaa ggtggagctc 2460
agcgaatggg tggggctcag caaagaacag aaatcgctgt acaacaaaac cgttgaagac 2520
accctcgatg ccattgccac cgcacctcga gggcaacgcc atggccaggt gctggcgctc 2580
ttgacccgtt taaaacagat ttgcaatcac ccggccttag cccaacgcga aggtgccgtt 2640
gacgccgaat tccttagccg gtccgccaag ctcatgcggc tggaagaaat ccttgaagag 2700
gtgattgaag ccggcgatcg cgctttgctg ttcacccagt tcgccgaatg gggacacctc 2760
ttgcaggcct ggatgcaaca acgctggaag tctgaggttc cctttctgca cggcggaacc 2820
cgcaaaagtg atcggcaagc gatggtggat cgattccaag aggacccccg gggacctcaa 2880
ctcttccttc tctccctcaa ggccggtggt gttggcctaa acctcacccg ggccagccac 2940
gtgttccacg ttggatcgct ggtggaatcc agcggtggaa aaccaagcca ccgaccgggc 3000
ctatcgaatt ggtcaaacca accgggtgat ggtgcacaaa ttcgtcaccc gtggctcggt 3060
ggaagaaaaa atcgaccaaa tgattcgtga 3090
<210> 84
<211> 1029
<212> PRT
<213> Synechococcus sp.
<400> 84
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Ser Ser
1 5 10 15
Ser Ser Gly Gln Pro Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val
20 25 30
Ala Ser Pro Glu Gly Pro Gly Leu Thr Pro Ala Leu His Pro Phe Thr
35 40 45
Leu Gly Ser Asn Asp Leu Lys Ala Trp Leu Thr Glu Arg Asp Leu Met
50 55 60
Pro Gly Gly Ser Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
65 70 75 80
Thr Val Lys Pro Arg Lys Ser Arg Thr Gln Ser Ser Glu Pro Asp Pro
85 90 95
Glu Gly Pro Ala Trp Thr Gly Leu Pro Met Gln Ala Gly Glu Pro Ile
100 105 110
Pro Lys Gln Met Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val
115 120 125
Glu Pro Ser Ala Ala Thr Glu Trp Leu Ala Arg Leu Pro Leu Ser Gly
130 135 140
Arg His Pro Asp Leu Gly Asp Glu Leu Arg Trp Trp Ser His Leu Gln
145 150 155 160
Arg Trp Ser Leu Ser Leu Val Ala Arg Gly Arg Trp Ile Pro Gln Met
165 170 175
Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro
180 185 190
Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala
195 200 205
Thr Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Leu
210 215 220
Gly Arg Arg Ser Asn Arg Thr Thr Arg Leu Arg Pro Glu Ala Met Arg
225 230 235 240
Ala Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg
245 250 255
Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Glu Leu Arg Lys Gly
260 265 270
Phe Glu Pro Ser Thr Glu Gly Leu Asp Pro Leu Leu Thr Leu Trp Gln
275 280 285
Glu Ala Leu Ala Ser Glu Thr Gly Val Val Glu Val Gly Asn Glu Asp
290 295 300
Ala Glu Arg Leu Thr Ala Ala Ser Leu His Trp Arg Glu Gly Ile Ala
305 310 315 320
Gly Gly Phe Ala Ala Ala Arg Thr Cys Leu Glu Leu Asn Thr Pro Asn
325 330 335
Glu Gly Glu Glu Leu Trp Asp Leu Lys Phe Gly Leu Gln Ala Glu Ala
340 345 350
Asp Pro Ser Leu Lys Leu Pro Ala Ala Ala Ala Trp Ala Ser Gly Ala
355 360 365
Glu Thr Leu Gln Leu Gly Glu Ile Gln Val Asp Gln Ala Gly Glu Val
370 375 380
Leu Leu Glu Gly Leu Gly Arg Ala Leu Thr Val Phe Pro Pro Ile Glu
385 390 395 400
Arg Gly Leu Glu Ser Ala Thr Pro Glu Thr Met Gln Leu Thr Pro Ala
405 410 415
Glu Ala Phe Val Leu Val Arg Thr Ala Thr His Gln Leu Arg Asn Ala
420 425 430
Gly Ile Gly Val Glu Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser
435 440 445
Arg Leu Gly Leu Ala Ile Lys Ala Asp Leu Pro Asp Arg Ser Ser Gly
450 455 460
Phe Thr Leu Gly Glu Ser Leu Asp Trp Ser Trp Asp Leu Met Ile Gly
465 470 475 480
Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ser Gly Lys Arg
485 490 495
Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn
500 505 510
Asp Leu Arg Asn Ala Glu Arg Phe Cys Gly Ala Asn Pro Glu Leu Ser
515 520 525
Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Glu Gly Glu Leu Met Met
530 535 540
Arg Leu Pro Val His Arg Phe Asp Ala Gly Pro Arg Leu Gln Gly Val
545 550 555 560
Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro
565 570 575
Glu Gly Phe Ser Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly
580 585 590
Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp
595 600 605
Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His
610 615 620
Leu Lys Ala Glu Asn Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro
625 630 635 640
Thr Ser Val Leu Thr Asn Trp Arg Arg Glu Ala Glu Ala Phe Thr Pro
645 650 655
Glu Leu Ser Val Arg Glu His Tyr Gly Pro Arg Arg Pro Ser Thr Pro
660 665 670
Ala Ala Leu Lys Lys Glu Leu Lys Gly Val Asp Leu Val Leu Thr Ser
675 680 685
Tyr Gly Leu Met Gln Arg Asp Ser Glu Leu Leu Asp Asn Leu Asp Trp
690 695 700
Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Gly Ala
705 710 715 720
Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Ala Gly Lys Ser Ser
725 730 735
Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser
740 745 750
Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Lys Val Leu Gly Glu
755 760 765
Glu Asp Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly
770 775 780
Asp Met Ser Ser Leu Arg Asp Leu Lys Ala Arg Val Gly Pro Phe Ile
785 790 795 800
Leu Arg Arg Leu Lys Thr Asp Lys Ser Ile Ile Ser Asp Leu Pro Glu
805 810 815
Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln Lys Ser
820 825 830
Leu Tyr Asn Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Thr Ala
835 840 845
Pro Arg Gly Gln Arg His Gly Gln Val Leu Ala Leu Leu Thr Arg Leu
850 855 860
Lys Gln Ile Cys Asn His Pro Ala Leu Ala Gln Arg Glu Gly Ala Val
865 870 875 880
Asp Ala Glu Phe Leu Ser Arg Ser Ala Lys Leu Met Arg Leu Glu Glu
885 890 895
Ile Leu Glu Glu Val Ile Glu Ala Gly Asp Arg Ala Leu Leu Phe Thr
900 905 910
Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ala Trp Met Gln Gln Arg
915 920 925
Trp Lys Ser Glu Val Pro Phe Leu His Gly Gly Thr Arg Lys Ser Asp
930 935 940
Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln
945 950 955 960
Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr
965 970 975
Arg Ala Ser His Val Phe His Val Gly Ser Leu Val Glu Ser Ser Gly
980 985 990
Gly Lys Pro Ser His Arg Pro Gly Leu Ser Asn Trp Ser Asn Gln Pro
995 1000 1005
Gly Asp Gly Ala Gln Ile Arg His Pro Trp Leu Gly Gly Arg Lys
1010 1015 1020
Asn Arg Pro Asn Asp Ser
1025
<210> 85
<211> 3195
<212> DNA
<213> Synechococcus sp.
<400> 85
atgagcctgc tgcacgccac ctggcttccg gccattcgta ctcctaccag ctctggacga 60
gctgcccttt tggtgtgggc cgacacctgg cgcgttgccg agcctgcagg cccaagtaca 120
acccctgcgc ttcacccgtt caccctcagc ccagacgatc tccgggcctt gctcacggaa 180
cgggatcttt tacccgacgg catcattgat gccacggcat gcctcaccct gccgagccgc 240
agcgtgaagc cccgaaaaaa acgcgaaaca gagaccagca gcactgaaca gcccagctgg 300
acaggccttc ccttacaggc tggagaaccg atccccaaac aaacagagtg gtggccttgg 360
caggttcagg ggctcgcaat tgaccccatg gcggccaccg cctggctgtc caaactgcct 420
ctgtcaggac gacatcctga tttggctgat gagttgcgct ggtggagtca catgcagcgt 480
tggtccctca gcctcgtagc ccgaagtcgc tggctccccc aagtggagct gagcaagggc 540
gagggctatc cccatcgcgc ccgctgggta ccgcttctga atcgggaaga agacaggcgc 600
cgtctagaag acttggccgc agggctccct ctcgttgcca cctgtgccct gccttggcga 660
gaaccaacgg gcaaacgcag caaccgaatc accaggctca gaccagaagc catgcgcgcc 720
gcgaatcccg tggcttgctg caggcctcgc agcggacgac taagggttgc cacgttattg 780
gccgacctga tggacgcgca gctgcgcaag ggctttactc ctgaccctga cggcttggac 840
cccctgctac gcgcctggga ggaggccttg agctcggata caggtgaaat ccaactcagc 900
gatgaagaaa ccgaacgcct agccaccgcc agtaatcatt ggcgtgaagg ggtcgctgga 960
aatgttgctg cagcccgcgc ctgcctggag ctggcaacac cagcggacga tgaggacctt 1020
tggccactgc gcttctttct gcaggcggaa gcagatccaa ccctcaagct gcccgcagga 1080
gcggcatggg ctgcaggccc cagcggcctc caacttgggg aaatcaaggt ggagcacccc 1140
agcgaggtct tgctcgaggg tatggggcga gccctgaccg tgttccaacc gatcgagcgc 1200
ggactggaca gtgccacgcc agagagcatg cagctcacac cagctgaagc gtttgttttg 1260
gtgcgcacag cagtccgaca actgcgggat gtgggcgttg gcgttgacct gccaccaagc 1320
ctgtctggag ggctggctag caggcttggc ctcgccatca aggcagaact ctccgagcgt 1380
tcgcgaggct tcacgctcgg tgaaaacctt gactggagct gggagctgat gatcggcggg 1440
gtgacgctga ccttgcgaga gcttgagcga ttggctggta agcgcagccc tctggtgcgt 1500
cacaaagggg cttggatcga actacggccc aatgacctca aaaatgccga gcgcttttgc 1560
gccgccaatc cagacctgag cctcgacgac gcgcttcggc tcaccgccac cgaaggcgac 1620
acgatgatgc gcctgcccgt gcatcaattt gatgccggtc cgcggctgca agccgtgctg 1680
gagcagtacc accagcagaa agcgccagac ccactccccg ctcccgaggg cttttcgggt 1740
caactcaggc cctatcaaga gagaggactc ggctggcttg ccttcctgca tcgcttcgac 1800
caaggcgcct gcttggccga tgacatgggc cttggcaaaa ccatccagct gctggctttt 1860
ctgcaacacc tcaaggcaga aaacgaactc aagcgatcag tgcttttaat tgcacccaca 1920
tctgtcctta cgaactggaa acgagaggca acagcgttta cacccgagct caaggtgcat 1980
gagcactacg gtccaaaacg cccgagcacc ccagcagcac tgaaaaaggc gctgaaagac 2040
gtggatctcg tgctcaccag ctatggcctg ttacaacgcg acagtgagct cctcgaaagt 2100
cacgattggc aaggcctcgt gatcgatgaa gcgcaggcga taaaaaaccc ctccgcgaag 2160
caaagccaag ccgcccgtga tctggcccgc ccgaaaaaga acagccgttt tcgcatcgca 2220
ctcaccggca caccagttga gaaccgcgtc agcgagctct gggccctgat ggacttcctc 2280
aaccctcggg tactgggaga ggaagaattt ttccgacatc gctatcgcat gccgattgag 2340
cgttacggag acctgtcctc gctgcgcgac ctcaaagccc gagtgggacc tttcatcctc 2400
agacgactca aaacagacaa agcgatcatc tcggatctac ccgagaaggt ggaattgagc 2460
gagtgggttg ggctgagcaa agagcagaag tcgctgtatg ccaaaaccgt tgaagacacc 2520
ttggatgcca ttgcccgcgc gccacgcggc aaacgtcatg gtcaggtgtt gggtctgctc 2580
accaagctca agcagatttg caaccaccct gcgcttgccc tcaaggagca gggcgccagc 2640
gaagatttcc tcaaacggtc cgtgaagctg caacgtctcg aagaaatttt ggacgaggtt 2700
gtagaagctg gggatcgagc cttgctgttt acccagttcg cggaatgggg caagttgctc 2760
caggattatt tgcaacgacg ctggcgcagc gaagttccct tcctcagcgg cagcaccagc 2820
aaaagtgaac ggcaagccat ggtcgatcgc ttccaggagg atccgcgcgg gccccagctt 2880
ttcctgttat cactcaaagc tggcggagtc ggcctcaacc tcacgcgcgc cagtcatgtc 2940
tttcacatcg accgttggtg gaaccccgcc gttgaaaatc aagccacgga ccgtgcctat 3000
cgcatcggcc aaacgaaccg ggtcatggtg cataagttca tcaccagcgg ctccgttgag 3060
gagaaaattg accgcatgat ccgcgagaag tccagactgg cggaagacat cattggctcc 3120
ggcgaagact ggcttggagg cctggaaatg ggacaactca aagagctagt gagcctggag 3180
gacaaccaag catga 3195
<210> 86
<211> 1064
<212> PRT
<213> Synechococcus sp.
<400> 86
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Thr
1 5 10 15
Ser Ser Gly Arg Ala Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val
20 25 30
Ala Glu Pro Ala Gly Pro Ser Thr Thr Pro Ala Leu His Pro Phe Thr
35 40 45
Leu Ser Pro Asp Asp Leu Arg Ala Leu Leu Thr Glu Arg Asp Leu Leu
50 55 60
Pro Asp Gly Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
65 70 75 80
Ser Val Lys Pro Arg Lys Lys Arg Glu Thr Glu Thr Ser Ser Thr Glu
85 90 95
Gln Pro Ser Trp Thr Gly Leu Pro Leu Gln Ala Gly Glu Pro Ile Pro
100 105 110
Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Ile Asp
115 120 125
Pro Met Ala Ala Thr Ala Trp Leu Ser Lys Leu Pro Leu Ser Gly Arg
130 135 140
His Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His Met Gln Arg
145 150 155 160
Trp Ser Leu Ser Leu Val Ala Arg Ser Arg Trp Leu Pro Gln Val Glu
165 170 175
Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro Leu
180 185 190
Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala Gly
195 200 205
Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Thr Gly
210 215 220
Lys Arg Ser Asn Arg Ile Thr Arg Leu Arg Pro Glu Ala Met Arg Ala
225 230 235 240
Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg Val
245 250 255
Ala Thr Leu Leu Ala Asp Leu Met Asp Ala Gln Leu Arg Lys Gly Phe
260 265 270
Thr Pro Asp Pro Asp Gly Leu Asp Pro Leu Leu Arg Ala Trp Glu Glu
275 280 285
Ala Leu Ser Ser Asp Thr Gly Glu Ile Gln Leu Ser Asp Glu Glu Thr
290 295 300
Glu Arg Leu Ala Thr Ala Ser Asn His Trp Arg Glu Gly Val Ala Gly
305 310 315 320
Asn Val Ala Ala Ala Arg Ala Cys Leu Glu Leu Ala Thr Pro Ala Asp
325 330 335
Asp Glu Asp Leu Trp Pro Leu Arg Phe Phe Leu Gln Ala Glu Ala Asp
340 345 350
Pro Thr Leu Lys Leu Pro Ala Gly Ala Ala Trp Ala Ala Gly Pro Ser
355 360 365
Gly Leu Gln Leu Gly Glu Ile Lys Val Glu His Pro Ser Glu Val Leu
370 375 380
Leu Glu Gly Met Gly Arg Ala Leu Thr Val Phe Gln Pro Ile Glu Arg
385 390 395 400
Gly Leu Asp Ser Ala Thr Pro Glu Ser Met Gln Leu Thr Pro Ala Glu
405 410 415
Ala Phe Val Leu Val Arg Thr Ala Val Arg Gln Leu Arg Asp Val Gly
420 425 430
Val Gly Val Asp Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser Arg
435 440 445
Leu Gly Leu Ala Ile Lys Ala Glu Leu Ser Glu Arg Ser Arg Gly Phe
450 455 460
Thr Leu Gly Glu Asn Leu Asp Trp Ser Trp Glu Leu Met Ile Gly Gly
465 470 475 480
Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ala Gly Lys Arg Ser
485 490 495
Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn Asp
500 505 510
Leu Lys Asn Ala Glu Arg Phe Cys Ala Ala Asn Pro Asp Leu Ser Leu
515 520 525
Asp Asp Ala Leu Arg Leu Thr Ala Thr Glu Gly Asp Thr Met Met Arg
530 535 540
Leu Pro Val His Gln Phe Asp Ala Gly Pro Arg Leu Gln Ala Val Leu
545 550 555 560
Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro Glu
565 570 575
Gly Phe Ser Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly Trp
580 585 590
Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp Asp
595 600 605
Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His Leu
610 615 620
Lys Ala Glu Asn Glu Leu Lys Arg Ser Val Leu Leu Ile Ala Pro Thr
625 630 635 640
Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Thr Ala Phe Thr Pro Glu
645 650 655
Leu Lys Val His Glu His Tyr Gly Pro Lys Arg Pro Ser Thr Pro Ala
660 665 670
Ala Leu Lys Lys Ala Leu Lys Asp Val Asp Leu Val Leu Thr Ser Tyr
675 680 685
Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu Ser His Asp Trp Gln
690 695 700
Gly Leu Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Ser Ala Lys
705 710 715 720
Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Pro Lys Lys Asn Ser Arg
725 730 735
Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser Glu
740 745 750
Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Arg Val Leu Gly Glu Glu
755 760 765
Glu Phe Phe Arg His Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly Asp
770 775 780
Leu Ser Ser Leu Arg Asp Leu Lys Ala Arg Val Gly Pro Phe Ile Leu
785 790 795 800
Arg Arg Leu Lys Thr Asp Lys Ala Ile Ile Ser Asp Leu Pro Glu Lys
805 810 815
Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln Lys Ser Leu
820 825 830
Tyr Ala Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Arg Ala Pro
835 840 845
Arg Gly Lys Arg His Gly Gln Val Leu Gly Leu Leu Thr Lys Leu Lys
850 855 860
Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys Glu Gln Gly Ala Ser
865 870 875 880
Glu Asp Phe Leu Lys Arg Ser Val Lys Leu Gln Arg Leu Glu Glu Ile
885 890 895
Leu Asp Glu Val Val Glu Ala Gly Asp Arg Ala Leu Leu Phe Thr Gln
900 905 910
Phe Ala Glu Trp Gly Lys Leu Leu Gln Asp Tyr Leu Gln Arg Arg Trp
915 920 925
Arg Ser Glu Val Pro Phe Leu Ser Gly Ser Thr Ser Lys Ser Glu Arg
930 935 940
Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln Leu
945 950 955 960
Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Arg
965 970 975
Ala Ser His Val Phe His Ile Asp Arg Trp Trp Asn Pro Ala Val Glu
980 985 990
Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Asn Arg Val
995 1000 1005
Met Val His Lys Phe Ile Thr Ser Gly Ser Val Glu Glu Lys Ile
1010 1015 1020
Asp Arg Met Ile Arg Glu Lys Ser Arg Leu Ala Glu Asp Ile Ile
1025 1030 1035
Gly Ser Gly Glu Asp Trp Leu Gly Gly Leu Glu Met Gly Gln Leu
1040 1045 1050
Lys Glu Leu Val Ser Leu Glu Asp Asn Gln Ala
1055 1060
<210> 87
<211> 3198
<212> DNA
<213> Synechococcus sp.
<400> 87
atgagcctgc tgcacgccac ctggcttccc gccatccgca cctccagcag ttccggtcaa 60
ccggcactgc tcgtttgggc tgacacctgg cgggtggcca caccggaagg cccgggcctt 120
accccagcgc tgcacccctt caccctaagc catgaagacc tcagggcctg gctgagcgaa 180
cgcgacctct tgcccggcgg ctgcatcgat gccacggcgt gcctcaccct gccgagccgc 240
acggtgaagc tgcgcaaaag ccgcagcaca aaagaggagc caacaccgga accaccgggt 300
tggaccgggc taccgatgca ggccggcgaa ccgatcccca agcaaaccga atggtggccc 360
tggcaggtgc aggggctcgc ggtggaaccg tcggcagcca cggagtggct gtcccgattg 420
ccgctctccg gcaccaatcc agacctggct gatgaactgc gctggtggag ccatctgcag 480
cgctgggcct tgagtctggt ggcccggggc cgctggattc cccagatgga gttcagcaaa 540
ggggagggct atccccatcg ggcccgttgg gtgccgcttc tcaaccggga agaagaccgg 600
cgccggctgg aggatctggc ggccagcctg ccgctggtgg ccacctgcgc cttgccctgg 660
cgggaacccc tggggcgccg cagcaaccgc accacccggt tacgaccgga ggcgatgcga 720
gccgccaacc ctgtggccag ctgccggccc cgcagcggac gcctgcgggt ggcgacgctg 780
ctggaagatc tagtggacgc gcagctgcgc aaggactttg aaccctccac cgatgggctt 840
gatcccctgc tgaccctctg gcaggaggcc ctggggtcgg agaccggggt gatcgagatc 900
ggcgatgaag aggccgaacg cctggccacc gccagccatc actggcggga gggcatcgcc 960
ggcgattttg ctgcggcccg cacctgcctt gaactgcaca ccccaccgga tggggaggat 1020
ctctgggagc tgcgcttcgg gctgcaggcg gaagctgacc ccagcctgaa gctcccggcc 1080
gccgcggcct gggcggctgg tgcggaaccg ctacagcttg gagagatccg ggtggaccaa 1140
ccgggtgaag tgctgctgga aggcatgggc cgcgccctga gcgtgtttcc ggcaattgag 1200
cggggtctgg agagcgccac acctgaaacg atgcagctca ccccggccga ggccttcgtg 1260
ctggtgcgca cggccgcccg gcagctgcgg gatgccggcg tgggagtgga gctgccgccc 1320
agcctctccg gtggcctggc cagccgactg ggcctgtcga tcaaagcgga actgcccgaa 1380
cgctcgagcg gtttcacgtt gggtgagtgt ctggcctggg agtgggatct gatgatcggc 1440
ggggtgacgc tcaccctgcg ggaattggag cgcctgagcg gcaagcgcag ccccctggtg 1500
cgccacaagg gggcctggat cgaactgcgg cccaacgacc tcaaaaatgc cgaacgcttc 1560
tgtggggcga aacctgaact gagcctcgac gacgcgctgc ggctgacggg gacggaaggg 1620
gaactgttga tgcggatgcc ggtgcaccgc ttcgacgccg gcccacggct gcaatcggtg 1680
ttgcagcaat accaccagca gaaggccccc gaccccttgc cggccccgga aggattcagc 1740
gggcagctgc ggccttatca ggagcggggc ctcggctggc tcgccttcct gcaccgcttc 1800
gatcaagggg cctgtctagc tgacgacatg ggcttgggca aaaccattca gttgctagcg 1860
ttcctgcagc acctcaaagc ggagcaagaa ctgaaacgcc cggtgctgct ggtggccccc 1920
acatcggtgc tcaccaactg gcgacgggag gcggaatcgt tcactccaga gttgaaggtc 1980
accgagcatt acgggcctcg ccggccctcc acacccgccg aactcaaaaa agcgttgaag 2040
gaggtggatc tggtgctcac cagctacggg ctgctgcagc gtgacagcga actgctggaa 2100
acccaggact ggcagggggt ggtgattgac gaagcccagg cgatcaagaa ccctggcgcc 2160
aaacagagcc aagccgcccg ggatctggcc cgcaccggcc gcatcaagag caaccgcttc 2220
cgcatcgcac tcaccggcac ccccgtggaa aaccgggtga gcgaactgtg ggccttgatg 2280
gacttcctca acccaaaggt gcttggggaa gaagacttct tccgccagcg ctatcggatg 2340
ccgattgagc gctacggcga catgtcgtcc ctgcgggacc tgaaaggccg cgtgggtccg 2400
ttcatcctgc gccggctgaa aaccgacaag acgatcattt ccgacctgcc tgaaaaggtg 2460
gagctgagcg aatgggtggg gctgagcaag gagcagaaat ctctgtacag caagaccgtg 2520
gaagacaccc tcgatgccat tgcccgggcg ccgcgcgggc agcgccacgg gcaggtgctg 2580
gccctgctca cccggctgaa acagatctgc aaccatcccg ccctggccct gagcgaaggg 2640
gccgtggacg atggcttcct gggccgttcg gccaagctgc agcggctgga ggagatcctc 2700
gatgaggtga tcgaagcggg cgatcgggcc ctgctgttca cccagttcgc cgaatggggg 2760
catttgctaa gggcctggat gcagcagcgc tggaaatcag aagtgccctt cctgcacggc 2820
ggcacccgca agaacgaacg ccaggcgatg gtggatcgct tccaggagga tccccgcggt 2880
ccacagctgt tcctgctctc gctcaaggcc ggtggtgtgg gcctcaacct cacgcgggcc 2940
agccatgtgt tccacatcga tcgctggtgg aaccctgccg tggaaaacca ggccaccgac 3000
cgggcctatc ggatcggcca aacgaaccga gtgatggttc ataaattcat caccagcggt 3060
tcggtggagg aaaaaatcga tcgcatgatc cgcgagaaat cacgcctggc cgaagatgtg 3120
atcggctccg gcgaagattg gctgggaagc ctcggtggcg atcaattgcg cgatctcgtt 3180
tctttggagg acacctga 3198
<210> 88
<211> 1065
<212> PRT
<213> Synechococcus sp.
<400> 88
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Ser Ser
1 5 10 15
Ser Ser Gly Gln Pro Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val
20 25 30
Ala Thr Pro Glu Gly Pro Gly Leu Thr Pro Ala Leu His Pro Phe Thr
35 40 45
Leu Ser His Glu Asp Leu Arg Ala Trp Leu Ser Glu Arg Asp Leu Leu
50 55 60
Pro Gly Gly Cys Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
65 70 75 80
Thr Val Lys Leu Arg Lys Ser Arg Ser Thr Lys Glu Glu Pro Thr Pro
85 90 95
Glu Pro Pro Gly Trp Thr Gly Leu Pro Met Gln Ala Gly Glu Pro Ile
100 105 110
Pro Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val
115 120 125
Glu Pro Ser Ala Ala Thr Glu Trp Leu Ser Arg Leu Pro Leu Ser Gly
130 135 140
Thr Asn Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His Leu Gln
145 150 155 160
Arg Trp Ala Leu Ser Leu Val Ala Arg Gly Arg Trp Ile Pro Gln Met
165 170 175
Glu Phe Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro
180 185 190
Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala
195 200 205
Ser Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Leu
210 215 220
Gly Arg Arg Ser Asn Arg Thr Thr Arg Leu Arg Pro Glu Ala Met Arg
225 230 235 240
Ala Ala Asn Pro Val Ala Ser Cys Arg Pro Arg Ser Gly Arg Leu Arg
245 250 255
Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Gln Leu Arg Lys Asp
260 265 270
Phe Glu Pro Ser Thr Asp Gly Leu Asp Pro Leu Leu Thr Leu Trp Gln
275 280 285
Glu Ala Leu Gly Ser Glu Thr Gly Val Ile Glu Ile Gly Asp Glu Glu
290 295 300
Ala Glu Arg Leu Ala Thr Ala Ser His His Trp Arg Glu Gly Ile Ala
305 310 315 320
Gly Asp Phe Ala Ala Ala Arg Thr Cys Leu Glu Leu His Thr Pro Pro
325 330 335
Asp Gly Glu Asp Leu Trp Glu Leu Arg Phe Gly Leu Gln Ala Glu Ala
340 345 350
Asp Pro Ser Leu Lys Leu Pro Ala Ala Ala Ala Trp Ala Ala Gly Ala
355 360 365
Glu Pro Leu Gln Leu Gly Glu Ile Arg Val Asp Gln Pro Gly Glu Val
370 375 380
Leu Leu Glu Gly Met Gly Arg Ala Leu Ser Val Phe Pro Ala Ile Glu
385 390 395 400
Arg Gly Leu Glu Ser Ala Thr Pro Glu Thr Met Gln Leu Thr Pro Ala
405 410 415
Glu Ala Phe Val Leu Val Arg Thr Ala Ala Arg Gln Leu Arg Asp Ala
420 425 430
Gly Val Gly Val Glu Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser
435 440 445
Arg Leu Gly Leu Ser Ile Lys Ala Glu Leu Pro Glu Arg Ser Ser Gly
450 455 460
Phe Thr Leu Gly Glu Cys Leu Ala Trp Glu Trp Asp Leu Met Ile Gly
465 470 475 480
Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ser Gly Lys Arg
485 490 495
Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn
500 505 510
Asp Leu Lys Asn Ala Glu Arg Phe Cys Gly Ala Lys Pro Glu Leu Ser
515 520 525
Leu Asp Asp Ala Leu Arg Leu Thr Gly Thr Glu Gly Glu Leu Leu Met
530 535 540
Arg Met Pro Val His Arg Phe Asp Ala Gly Pro Arg Leu Gln Ser Val
545 550 555 560
Leu Gln Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro
565 570 575
Glu Gly Phe Ser Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly
580 585 590
Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp
595 600 605
Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His
610 615 620
Leu Lys Ala Glu Gln Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro
625 630 635 640
Thr Ser Val Leu Thr Asn Trp Arg Arg Glu Ala Glu Ser Phe Thr Pro
645 650 655
Glu Leu Lys Val Thr Glu His Tyr Gly Pro Arg Arg Pro Ser Thr Pro
660 665 670
Ala Glu Leu Lys Lys Ala Leu Lys Glu Val Asp Leu Val Leu Thr Ser
675 680 685
Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu Thr Gln Asp Trp
690 695 700
Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Gly Ala
705 710 715 720
Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Thr Gly Arg Ile Lys
725 730 735
Ser Asn Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg
740 745 750
Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Lys Val Leu
755 760 765
Gly Glu Glu Asp Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg
770 775 780
Tyr Gly Asp Met Ser Ser Leu Arg Asp Leu Lys Gly Arg Val Gly Pro
785 790 795 800
Phe Ile Leu Arg Arg Leu Lys Thr Asp Lys Thr Ile Ile Ser Asp Leu
805 810 815
Pro Glu Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln
820 825 830
Lys Ser Leu Tyr Ser Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala
835 840 845
Arg Ala Pro Arg Gly Gln Arg His Gly Gln Val Leu Ala Leu Leu Thr
850 855 860
Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Ser Glu Gly
865 870 875 880
Ala Val Asp Asp Gly Phe Leu Gly Arg Ser Ala Lys Leu Gln Arg Leu
885 890 895
Glu Glu Ile Leu Asp Glu Val Ile Glu Ala Gly Asp Arg Ala Leu Leu
900 905 910
Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Arg Ala Trp Met Gln
915 920 925
Gln Arg Trp Lys Ser Glu Val Pro Phe Leu His Gly Gly Thr Arg Lys
930 935 940
Asn Glu Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly
945 950 955 960
Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn
965 970 975
Leu Thr Arg Ala Ser His Val Phe His Ile Asp Arg Trp Trp Asn Pro
980 985 990
Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr
995 1000 1005
Asn Arg Val Met Val His Lys Phe Ile Thr Ser Gly Ser Val Glu
1010 1015 1020
Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ser Arg Leu Ala Glu
1025 1030 1035
Asp Val Ile Gly Ser Gly Glu Asp Trp Leu Gly Ser Leu Gly Gly
1040 1045 1050
Asp Gln Leu Arg Asp Leu Val Ser Leu Glu Asp Thr
1055 1060 1065
<210> 89
<211> 3192
<212> DNA
<213> Synechococcus sp.
<400> 89
atgagcctgc tgcacgccac ctggcttccc gccattcgta cttccagcag ttccggacag 60
ccggcactgc tcatttgggc tgacacctgg cgtgtcgcct caccggaggg gcccggactc 120
acacccgctc tgcatccctt cacccttggc tcggacgatc tcaaagcttg gttgaccgaa 180
cgggacctga tgcctggggg cagcatcgat gccaccgcct gcctcaccct cccaagccgc 240
agcgtcaaac cccgcaaaag tcgaacccaa ccgagcgaac cagccccaga gggaccggcc 300
tggaccggat tgccaatgca agcaggagag cccattccga agcaaatgga atggtggccc 360
tggcaggtac aaggcctcgc ggtggagcca tcggccgcaa cggaatggct cgcccgttta 420
cccctatcgg gccgacatcc agacctcgga gatgaattgc gctggtggag ccatctccaa 480
cgttggtccc tcagcttggt ggcccggggg cgctggattc cccagatgga attaagcaaa 540
ggcgagggtt acccccaccg agcgcgctgg gttcccttgt tgaaccgtga ggaagatcga 600
cgacggctcg aagacctcgc ggccacgctg cccctcgtgg cgacctgtgc cctcccttgg 660
cgtgagccac ttggacgccg tagcaaccgc accaccaggc ttcgaccgga agcgatgcga 720
gccgccaacc cggtggcttg ctgccgcccc cggagcggtc gcctcagggt ggccaccttg 780
cttgaagact tggtggatgc agagctgcgc aagggatttg aacccaccac agaggggctc 840
gaccccctac tcaccctgtg gcaagaggcc ctggcctcag aaaccggtgt tgtggaggtg 900
ggcaacgagg atgcagaacg ccttaccgcg gcaagcctgc actggcgcga agggattgcc 960
ggaggcttcg ctgctgcccg cacctgcctc gaactaaaca ccccaaacga aggcgaagaa 1020
ctctgggacc tgaagtttgg cttgcaagcg gaggccgatc ccagcctcaa gctgccggcc 1080
gccgcggcct gggcctcagg agccgaaaca ctccagctcg gggagatcaa agttgaccag 1140
gcgggggaag tgctgctgga gggtcttggc cgagccctca cggtgttccc tccgatcgaa 1200
cgcggactgg aaagcgcaac gccagaaacg atgcagctca cgccagcgga ggcgtttgtc 1260
ttggtgcgaa cagcaacgca ccagctccgc aatgccggca tcggcgtcga actgcccccc 1320
agcctttcag ggggcctcgc cagccggctt ggtttagcca tcaaggcaga tttaccagat 1380
cgatccagcg gcttcaccct cggagaatct ctggactgga gctgggatct gatgatcggc 1440
ggcgtcacac tcaccctgcg agagctcgaa cggctcagcg gtaagcgcag tccgcttgtg 1500
cgccacaagg gagcctggat cgaactgcga cccaacgatc tccgcaacgc cgaacgcttc 1560
tgtggagcca atccagaact gagcctcgac gatgccctaa ggctcacggc cacagaaggg 1620
gagctaatga tgcgcttgcc ggtgcatcgc tttgatgcgg ggcctcggct tcagggagtt 1680
ctcgagcaat atcaccagca aaaagccccc gatccccttc ccgctccaga gggattttcc 1740
ggacaactgc gtccttatca agaacgtggc ttgggctggc tggccttctt acatcgcttc 1800
gatcaaggcg cctgcctggc ggacgacatg ggcttgggca agaccatcca attgttggcc 1860
ttcctgcagc acctcaaagc cgagcacgaa ctcaaacgcc cggtgctgtt ggtggcccca 1920
acctcggtgc tcacgaattg gcgacgggag gcggaagcct tcacccccga gctgtcggtg 1980
aaagagcact acggcccacg ccggccttcc acgccggccg ccttgaaaaa agaactcaaa 2040
gatgtggatc tggtgctcac cagttacggc ctgatgcaac gcgacagcga gctgctggac 2100
agcgtcgact ggcaaggggt tgtgatcgac gaagcgcagg cgatcaaaaa ccctggggcg 2160
aaacaaagcc aagcagcccg agacctggcc cgagctggaa agagcagcag gttccgcatc 2220
gcactcaccg gcacaccggt ggaaaaccgc gtcagcgagc tgtgggcgct gatggatttc 2280
ctcaacccaa aggtgttggg agaggaagac ttctttcgtc agcgctaccg catgccaatt 2340
gagcgctacg gcgatatgtc gtcgttacgc gatctcaaag cgcgggtcgg ccccttcatc 2400
ctgcgccgtc tcaaaaccga caagtcgatc atttccgacc tgcctgaaaa ggtggagctc 2460
agtgaatggg tgggtctcag caaagaacag aaatcgctgt acaacaaaac cgttgaagac 2520
accctcgacg ccattgccac cgcaccgcgg gggcaacgcc atggccaggt gctagccctc 2580
ttgacccggt taaagcagat ttgcaatcac ccggctttag cccaacgcga aggggccgtt 2640
gacagcgaat tccttggccg ttccgccaag ctgatgcgac tcgaagaaat cctcgaagag 2700
gtgattgaag ccggcgatcg cgctttgcta ttcacccaat tcgccgaatg ggggcatctc 2760
ctgcaggcct ggatgcaaca acgctggaag tctgaggttc ccttcctgca cggcggaacc 2820
cgcaagagtg atcggcaagc gatggtggat cgattccaag aggacccccg gggacctcaa 2880
ctctttcttc tgtccctcaa ggccggtggt gtaggcctca acctcacccg ggccagtcat 2940
gtgttccacg tcgatcgctg gtggaatcca gcggtggaaa accaagccac cgaccgggcc 3000
tatcgaattg gtcaaaccaa ccgggtaatg gtgcacaaat tcgtcacccg tggctcggtg 3060
gaagaaaaaa tcgaccaaat gattcgtgaa aaagctcgaa tggctgaaga cgtgatcggc 3120
tccggtgaag actggctcgg gagccttggc ggcgatcagc tgcgcaatct tgttgccctc 3180
gaggacacct aa 3192
<210> 90
<211> 1063
<212> PRT
<213> Synechococcus sp.
<400> 90
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Ser Ser
1 5 10 15
Ser Ser Gly Gln Pro Ala Leu Leu Ile Trp Ala Asp Thr Trp Arg Val
20 25 30
Ala Ser Pro Glu Gly Pro Gly Leu Thr Pro Ala Leu His Pro Phe Thr
35 40 45
Leu Gly Ser Asp Asp Leu Lys Ala Trp Leu Thr Glu Arg Asp Leu Met
50 55 60
Pro Gly Gly Ser Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
65 70 75 80
Ser Val Lys Pro Arg Lys Ser Arg Thr Gln Pro Ser Glu Pro Ala Pro
85 90 95
Glu Gly Pro Ala Trp Thr Gly Leu Pro Met Gln Ala Gly Glu Pro Ile
100 105 110
Pro Lys Gln Met Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val
115 120 125
Glu Pro Ser Ala Ala Thr Glu Trp Leu Ala Arg Leu Pro Leu Ser Gly
130 135 140
Arg His Pro Asp Leu Gly Asp Glu Leu Arg Trp Trp Ser His Leu Gln
145 150 155 160
Arg Trp Ser Leu Ser Leu Val Ala Arg Gly Arg Trp Ile Pro Gln Met
165 170 175
Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro
180 185 190
Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala
195 200 205
Thr Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Leu
210 215 220
Gly Arg Arg Ser Asn Arg Thr Thr Arg Leu Arg Pro Glu Ala Met Arg
225 230 235 240
Ala Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg
245 250 255
Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Glu Leu Arg Lys Gly
260 265 270
Phe Glu Pro Thr Thr Glu Gly Leu Asp Pro Leu Leu Thr Leu Trp Gln
275 280 285
Glu Ala Leu Ala Ser Glu Thr Gly Val Val Glu Val Gly Asn Glu Asp
290 295 300
Ala Glu Arg Leu Thr Ala Ala Ser Leu His Trp Arg Glu Gly Ile Ala
305 310 315 320
Gly Gly Phe Ala Ala Ala Arg Thr Cys Leu Glu Leu Asn Thr Pro Asn
325 330 335
Glu Gly Glu Glu Leu Trp Asp Leu Lys Phe Gly Leu Gln Ala Glu Ala
340 345 350
Asp Pro Ser Leu Lys Leu Pro Ala Ala Ala Ala Trp Ala Ser Gly Ala
355 360 365
Glu Thr Leu Gln Leu Gly Glu Ile Lys Val Asp Gln Ala Gly Glu Val
370 375 380
Leu Leu Glu Gly Leu Gly Arg Ala Leu Thr Val Phe Pro Pro Ile Glu
385 390 395 400
Arg Gly Leu Glu Ser Ala Thr Pro Glu Thr Met Gln Leu Thr Pro Ala
405 410 415
Glu Ala Phe Val Leu Val Arg Thr Ala Thr His Gln Leu Arg Asn Ala
420 425 430
Gly Ile Gly Val Glu Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser
435 440 445
Arg Leu Gly Leu Ala Ile Lys Ala Asp Leu Pro Asp Arg Ser Ser Gly
450 455 460
Phe Thr Leu Gly Glu Ser Leu Asp Trp Ser Trp Asp Leu Met Ile Gly
465 470 475 480
Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ser Gly Lys Arg
485 490 495
Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn
500 505 510
Asp Leu Arg Asn Ala Glu Arg Phe Cys Gly Ala Asn Pro Glu Leu Ser
515 520 525
Leu Asp Asp Ala Leu Arg Leu Thr Ala Thr Glu Gly Glu Leu Met Met
530 535 540
Arg Leu Pro Val His Arg Phe Asp Ala Gly Pro Arg Leu Gln Gly Val
545 550 555 560
Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro
565 570 575
Glu Gly Phe Ser Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly
580 585 590
Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp
595 600 605
Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His
610 615 620
Leu Lys Ala Glu His Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro
625 630 635 640
Thr Ser Val Leu Thr Asn Trp Arg Arg Glu Ala Glu Ala Phe Thr Pro
645 650 655
Glu Leu Ser Val Lys Glu His Tyr Gly Pro Arg Arg Pro Ser Thr Pro
660 665 670
Ala Ala Leu Lys Lys Glu Leu Lys Asp Val Asp Leu Val Leu Thr Ser
675 680 685
Tyr Gly Leu Met Gln Arg Asp Ser Glu Leu Leu Asp Ser Val Asp Trp
690 695 700
Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Gly Ala
705 710 715 720
Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Ala Gly Lys Ser Ser
725 730 735
Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser
740 745 750
Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Lys Val Leu Gly Glu
755 760 765
Glu Asp Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly
770 775 780
Asp Met Ser Ser Leu Arg Asp Leu Lys Ala Arg Val Gly Pro Phe Ile
785 790 795 800
Leu Arg Arg Leu Lys Thr Asp Lys Ser Ile Ile Ser Asp Leu Pro Glu
805 810 815
Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln Lys Ser
820 825 830
Leu Tyr Asn Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Thr Ala
835 840 845
Pro Arg Gly Gln Arg His Gly Gln Val Leu Ala Leu Leu Thr Arg Leu
850 855 860
Lys Gln Ile Cys Asn His Pro Ala Leu Ala Gln Arg Glu Gly Ala Val
865 870 875 880
Asp Ser Glu Phe Leu Gly Arg Ser Ala Lys Leu Met Arg Leu Glu Glu
885 890 895
Ile Leu Glu Glu Val Ile Glu Ala Gly Asp Arg Ala Leu Leu Phe Thr
900 905 910
Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ala Trp Met Gln Gln Arg
915 920 925
Trp Lys Ser Glu Val Pro Phe Leu His Gly Gly Thr Arg Lys Ser Asp
930 935 940
Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln
945 950 955 960
Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr
965 970 975
Arg Ala Ser His Val Phe His Val Asp Arg Trp Trp Asn Pro Ala Val
980 985 990
Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Asn Arg
995 1000 1005
Val Met Val His Lys Phe Val Thr Arg Gly Ser Val Glu Glu Lys
1010 1015 1020
Ile Asp Gln Met Ile Arg Glu Lys Ala Arg Met Ala Glu Asp Val
1025 1030 1035
Ile Gly Ser Gly Glu Asp Trp Leu Gly Ser Leu Gly Gly Asp Gln
1040 1045 1050
Leu Arg Asn Leu Val Ala Leu Glu Asp Thr
1055 1060
<210> 91
<211> 3198
<212> DNA
<213> Synechococcus sp.
<400> 91
atgagcctgc tgcacgccac ctggctcccg gccatccgta cacccaccag ttccgggcgt 60
gccgccctgc tggtgtgggc ggacacctgg cgtgtggcgg agccggcggg ccccggcgtg 120
accccggcca cccatccctt caccctcagc gccgatgacc tgcgcgcctg gctgagcgaa 180
cgggagctgc tgcccgacgg catcatcgat gccaccgcct gcctcaccct gcccagccgc 240
acggtgaaac cgaagcggaa gcgtggcgag accgcccctg tggatgaggg ctggacgggt 300
ctgcccctgc aggcgggaga accgattccg aagcagaccg aatggtggcc ctggcaggta 360
cagggcctgg cggtcgaacc cggtgcagcc accgcctggc tggcccgctt gcccctctcc 420
ggccgccacc ccgacctcgc cgatgagctg cgctggtgga gccacatgca gcgctgggcc 480
ctcagcctga ttgctcgcag tcgctggatt ccccaggtgg agctgagcaa aggggagggc 540
tacccccacc gcgcccgttg ggtgcctctg ctcaatcgcg aagacgatcg ccgccgcctg 600
gaagacatgg cggcccgcct gccgctggtg gccacctgcg ctctcccctg gcgcgaaccc 660
accgggaagc gcagcaaccg caccacccgg ctgcggcctg aggcgatgcg ggcggccaat 720
ccggtggcct gttgtcgtcc ccgcagcggc cgactgcgcg tcgccaccct gctcgaagac 780
ctggtggatg cccagctgcg cacgggtttc acagcccaga cggacgggct cgatcccctg 840
cttgccgcct gggaggaggc cctcggcagc gacaccggcg tgatccacct gggcgatgaa 900
gacgcagagc gtctggccac cgccagccat cactggcgcg aaggggtggc cggcactgtg 960
gcggcggcgc gggcctgcct ggaactggag acccccgacg acggcgatga cctctggacc 1020
ctgcggttcg cactgcaggc cgaagcggat cccacgctca aggtgccggc cgccctcgcc 1080
tgggcggccg gtccgaaggg actccagctc ggcgaaatcg ccgtggagca tccgggcgaa 1140
ctgctgctgg aaggcatggg ccgggcgctc acggtgtttc caccgatcga acgcggtctc 1200
gacagcgcca cgccggaagg gatgcaactc acccccgccg aagccttcgt gctggtgcgc 1260
accgcagccc gcgaactccg cgatgtgggg gtgggcgtgg agcttccagc cagcctctcg 1320
ggtggcctgg cgagcaggct cggcctggcg attcaggcgg aactaccgga gaaatcccgc 1380
ggtttcacgc tgggcgaaac cctcgactgg agctgggagc tgatgatcgg cggcgtcacc 1440
ctgacgctgc gggaactgga gcgcctggcg ggcaagcgca gccccctggt gcggcacaag 1500
ggcacctgga tcgagctgcg ccccaacgat ctcaagaatg cggagcggtt tttcgccgcg 1560
aagcccgatc tcagcctcga cgatgccctg cgcctcaccg ccagcgaagg cgacacgctg 1620
atgcgcatgc cggtgcaccg cctggaagcg ggcccacggc tgcaggcggt gctcgagcag 1680
tatcaccaac agaaagctcc cgatcccctg ccggcgccgg agggcttctg cggccagctg 1740
cggccttacc aggagcgggg cctcggctgg ctggcctttc tgcaccgctt tgatcaaggc 1800
gcctgcctgg ccgacgacat gggtctgggc aagaccatcc agctgctcgc ctttctgcag 1860
cacctgaagg ccgagcagga gctgaagagg ccggtgttgc tcgtggcgcc cacctcggtg 1920
ctcaccaact ggaagcggga ggccgccgcc ttcacgccgg agctcgaggt gaaggagcac 1980
tacgggccca ggcgccctgc cacccctgca gcactcaaga agagcctcaa ggatgtggat 2040
ctggtgctca ccagctacgg cctgctccaa cgcgacagcg aactgctcga aagtctcgat 2100
tggcaggggg tggtgatcga cgaagcgcag gcaatcaaga atccgagcgc caaacagagc 2160
atggcggccc gagacctggc ccgcgcagga cgcagcagcc gtttccgcat tgccctcacc 2220
ggcacgccgg tggagaaccg ggtgagcgag ctctgggcct tgatggattt cctcaacccg 2280
cgggtgctcg gcgaagagga cttcttccgc cagcgctacc gcatgccgat tgagcgctat 2340
ggcgacatgt cgtcgctgcg ggatctgaaa tcccgcgtgg gacctttcat tcttcgccgg 2400
ctcaaaaccg acaaagcgat catttccgac ctgcccgaaa aggtggaact gagcgaatgg 2460
gtgggattga gcagggagca gaaagcgctc tatgccaaaa ccgtcgagga caccctcgat 2520
gcgattgccc gggcgccccg cggacaacgg catggccagg tgctggggtt gctcaccaag 2580
ctgaagcaga tctgtaacca tcccgccctg gccctgaaag aggaggcggc cggcgacgag 2640
ttcctgcagc gctccatgaa actgcagcgc ctggaggaaa tcctcgagga ggtgatcgac 2700
gccggcgacc gcgccctgct cttcacccag ttcgccgaat ggggccatct gctgcagggt 2760
tacctgcaac ggcgctggcg cagcgaagtg ccgttcctga acggcagcac cagcaagagc 2820
gaacgccagg cgatggtcga tcgcttccag gaagacccgc gggggcctca gctgttcctg 2880
ctgtcactga aagccggtgg tgtgggcctc aacctcaccc gcgccagcca tgtgtttcac 2940
atcgatcgct ggtggaatcc ggcggtggaa aaccaggcca ccgaccgcgc ctaccggatc 3000
ggccagacga accgggtgat ggtgcacaag ttcatcacca gtggatcggt cgaagaaaaa 3060
atcgaccgga tgatccgcga gaaatcacgc ctcgccgaag acatcatcgg ctcaggcgaa 3120
gattggctcg gcgggctcga catgggccag ctgaaggaac tggtgagcct cgacgacaac 3180
ggatcacttt cagcatga 3198
<210> 92
<211> 1065
<212> PRT
<213> Synechococcus sp.
<400> 92
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Thr
1 5 10 15
Ser Ser Gly Arg Ala Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val
20 25 30
Ala Glu Pro Ala Gly Pro Gly Val Thr Pro Ala Thr His Pro Phe Thr
35 40 45
Leu Ser Ala Asp Asp Leu Arg Ala Trp Leu Ser Glu Arg Glu Leu Leu
50 55 60
Pro Asp Gly Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
65 70 75 80
Thr Val Lys Pro Lys Arg Lys Arg Gly Glu Thr Ala Pro Val Asp Glu
85 90 95
Gly Trp Thr Gly Leu Pro Leu Gln Ala Gly Glu Pro Ile Pro Lys Gln
100 105 110
Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val Glu Pro Gly
115 120 125
Ala Ala Thr Ala Trp Leu Ala Arg Leu Pro Leu Ser Gly Arg His Pro
130 135 140
Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His Met Gln Arg Trp Ala
145 150 155 160
Leu Ser Leu Ile Ala Arg Ser Arg Trp Ile Pro Gln Val Glu Leu Ser
165 170 175
Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro Leu Leu Asn
180 185 190
Arg Glu Asp Asp Arg Arg Arg Leu Glu Asp Met Ala Ala Arg Leu Pro
195 200 205
Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Thr Gly Lys Arg
210 215 220
Ser Asn Arg Thr Thr Arg Leu Arg Pro Glu Ala Met Arg Ala Ala Asn
225 230 235 240
Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg Val Ala Thr
245 250 255
Leu Leu Glu Asp Leu Val Asp Ala Gln Leu Arg Thr Gly Phe Thr Ala
260 265 270
Gln Thr Asp Gly Leu Asp Pro Leu Leu Ala Ala Trp Glu Glu Ala Leu
275 280 285
Gly Ser Asp Thr Gly Val Ile His Leu Gly Asp Glu Asp Ala Glu Arg
290 295 300
Leu Ala Thr Ala Ser His His Trp Arg Glu Gly Val Ala Gly Thr Val
305 310 315 320
Ala Ala Ala Arg Ala Cys Leu Glu Leu Glu Thr Pro Asp Asp Gly Asp
325 330 335
Asp Leu Trp Thr Leu Arg Phe Ala Leu Gln Ala Glu Ala Asp Pro Thr
340 345 350
Leu Lys Val Pro Ala Ala Leu Ala Trp Ala Ala Gly Pro Lys Gly Leu
355 360 365
Gln Leu Gly Glu Ile Ala Val Glu His Pro Gly Glu Leu Leu Leu Glu
370 375 380
Gly Met Gly Arg Ala Leu Thr Val Phe Pro Pro Ile Glu Arg Gly Leu
385 390 395 400
Asp Ser Ala Thr Pro Glu Gly Met Gln Leu Thr Pro Ala Glu Ala Phe
405 410 415
Val Leu Val Arg Thr Ala Ala Arg Glu Leu Arg Asp Val Gly Val Gly
420 425 430
Val Glu Leu Pro Ala Ser Leu Ser Gly Gly Leu Ala Ser Arg Leu Gly
435 440 445
Leu Ala Ile Gln Ala Glu Leu Pro Glu Lys Ser Arg Gly Phe Thr Leu
450 455 460
Gly Glu Thr Leu Asp Trp Ser Trp Glu Leu Met Ile Gly Gly Val Thr
465 470 475 480
Leu Thr Leu Arg Glu Leu Glu Arg Leu Ala Gly Lys Arg Ser Pro Leu
485 490 495
Val Arg His Lys Gly Thr Trp Ile Glu Leu Arg Pro Asn Asp Leu Lys
500 505 510
Asn Ala Glu Arg Phe Phe Ala Ala Lys Pro Asp Leu Ser Leu Asp Asp
515 520 525
Ala Leu Arg Leu Thr Ala Ser Glu Gly Asp Thr Leu Met Arg Met Pro
530 535 540
Val His Arg Leu Glu Ala Gly Pro Arg Leu Gln Ala Val Leu Glu Gln
545 550 555 560
Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro Glu Gly Phe
565 570 575
Cys Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly Trp Leu Ala
580 585 590
Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp Asp Met Gly
595 600 605
Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His Leu Lys Ala
610 615 620
Glu Gln Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro Thr Ser Val
625 630 635 640
Leu Thr Asn Trp Lys Arg Glu Ala Ala Ala Phe Thr Pro Glu Leu Glu
645 650 655
Val Lys Glu His Tyr Gly Pro Arg Arg Pro Ala Thr Pro Ala Ala Leu
660 665 670
Lys Lys Ser Leu Lys Asp Val Asp Leu Val Leu Thr Ser Tyr Gly Leu
675 680 685
Leu Gln Arg Asp Ser Glu Leu Leu Glu Ser Leu Asp Trp Gln Gly Val
690 695 700
Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Ser Ala Lys Gln Ser
705 710 715 720
Met Ala Ala Arg Asp Leu Ala Arg Ala Gly Arg Ser Ser Arg Phe Arg
725 730 735
Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser Glu Leu Trp
740 745 750
Ala Leu Met Asp Phe Leu Asn Pro Arg Val Leu Gly Glu Glu Asp Phe
755 760 765
Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly Asp Met Ser
770 775 780
Ser Leu Arg Asp Leu Lys Ser Arg Val Gly Pro Phe Ile Leu Arg Arg
785 790 795 800
Leu Lys Thr Asp Lys Ala Ile Ile Ser Asp Leu Pro Glu Lys Val Glu
805 810 815
Leu Ser Glu Trp Val Gly Leu Ser Arg Glu Gln Lys Ala Leu Tyr Ala
820 825 830
Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Arg Ala Pro Arg Gly
835 840 845
Gln Arg His Gly Gln Val Leu Gly Leu Leu Thr Lys Leu Lys Gln Ile
850 855 860
Cys Asn His Pro Ala Leu Ala Leu Lys Glu Glu Ala Ala Gly Asp Glu
865 870 875 880
Phe Leu Gln Arg Ser Met Lys Leu Gln Arg Leu Glu Glu Ile Leu Glu
885 890 895
Glu Val Ile Asp Ala Gly Asp Arg Ala Leu Leu Phe Thr Gln Phe Ala
900 905 910
Glu Trp Gly His Leu Leu Gln Gly Tyr Leu Gln Arg Arg Trp Arg Ser
915 920 925
Glu Val Pro Phe Leu Asn Gly Ser Thr Ser Lys Ser Glu Arg Gln Ala
930 935 940
Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln Leu Phe Leu
945 950 955 960
Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Arg Ala Ser
965 970 975
His Val Phe His Ile Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln
980 985 990
Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Asn Arg Val Met Val
995 1000 1005
His Lys Phe Ile Thr Ser Gly Ser Val Glu Glu Lys Ile Asp Arg
1010 1015 1020
Met Ile Arg Glu Lys Ser Arg Leu Ala Glu Asp Ile Ile Gly Ser
1025 1030 1035
Gly Glu Asp Trp Leu Gly Gly Leu Asp Met Gly Gln Leu Lys Glu
1040 1045 1050
Leu Val Ser Leu Asp Asp Asn Gly Ser Leu Ser Ala
1055 1060 1065
<210> 93
<211> 3213
<212> DNA
<213> Synechococcus sp.
<400> 93
atgagcctgc tgcacgccac ctggctaccc gccatccgca ctcccagcag ctccggaagg 60
gctgctttgc tggtatgggc tgacacctgg cgtgtggccg accccctcgg ccccggggcc 120
acacccgccc ttcatccgtt caccctgagc gcggaggatc tgcgcgcctg gctcacagag 180
cgcgatttgc ttccggacgg aatcatcgat gcgaccgcat gcctcaccct gccgagccgc 240
agtgtgaaac cacggcggcc ccgtggctca gctgccgcca ccccctcatc agaagagcag 300
cccccttggt gcgggctgcc gctgcaagcc ggcgaaccga tcccgaaaac caccgagtgg 360
tggccatggc aggtgcaggg gctggcgatc gaaccgatgg ccgccacggc atggctggcc 420
aagcttccac tgtcaggcca tcaccctgat ctggccgatg agttgcgctg gtggagtcac 480
atgcagcgat gggccctcag tcttgtggct agggggcgct ggctgcccca ggtggaattg 540
agccgaggtg aggggtatcc acaccgggcc cgctgggtcc cgcttctcaa tcgagaggaa 600
gaccggcgcc gcctggagga ccttgccgcc cgtctgcccc tggttgccac gtgtgcgttg 660
ccctggagag agcccacagg aaagcgcagc aatcgcatca ccaggctgcg cccagaggcc 720
atgcgcgctg ccaatcccgt ggcctgctgt cgtccccgca gcggtcgatt gcgggtggcc 780
acattgctgg aggatctggt agatgcccag ctgcgcaagg gcttccatcc cgatgacgag 840
gggctcgacc ccctgctctg cgcctgggaa aacgccctga gttcggagac cggggtgatc 900
gatctgaatg atgaagatgc cgaacgcctt gccacggcga gccaccactg gcgcgaggga 960
gtggctggca atgtggcggc tgccagggcc tgccttgaac tcgccacacc gaacgagggg 1020
gaagagctct gggatctgcg cttctatctg caggccgaag ccgatccaac gctgaaggta 1080
ccggccggag cagcctgggc cgctggaccc gaaggccttc aactcgggga gattcctgtg 1140
gagcatcccg gtgaggtgct gctcgaaggc atggggcgtg ctctcacggt gttcgaacca 1200
atcgaacggg gcctggatag cgccacgccg gaagcgatgc agctcacccc ggcggaagcc 1260
ttcgtgctgg tgcgcaccgc cgcccgtcag ctccgggacg tgggcgttgg tgtggatctc 1320
cctcccagcc tctcgggagg cctggccagc cgcctcggtc tggcgatcaa ggccgaacta 1380
cccaaacgct cgcgggggtt cacccttggg gaaaatctcg actggaactg ggagctgatg 1440
atcgggggcg tcaccctgac gctgcgggag ctggaacggc tggccggcaa gcgcagcccc 1500
ttggtgcgcc acaagggggc ctggatcgaa ctcaggccca atgatctcaa aaatgcagaa 1560
cgattctgtg ccgccaatcc tgatctgagc ctggacgatg cccttcgcct gacggccagc 1620
gaaggggaca cgctgatgcg cctccccgtt catgcctttg atgctggccc tcgccttcaa 1680
ggggtgttgg agcaatacca ccagcagaaa gcaccggatc cacttcctgc gcccgagggt 1740
ttctgcggtc agcttcgccc ttaccaggaa cgaggcctgg gctggctggc cttcctgcac 1800
cgcttcgatc agggagcctg cctcgccgac gacatgggcc tgggcaagac gatccagctg 1860
ctggccttcc tccagcacct gaagatggaa caagaactga aacggccggt gctgctggtg 1920
gctcccacct ccgtgctcac caactggaaa cgggaagccg cggccttcac ccccgagctc 1980
acagtgcatg agcactacgg ccccaaacga ccctccaccc cagcagcact gaaaaaagcc 2040
ctgaaagacg ttgacctggt gctcaccagc tacgggcttc tgcaaagaga cagtgaactg 2100
cttgaaagtt tcgactggca gggaaccgtg atcgatgaag ctcaggcgat caagaaccct 2160
tcggccaagc aaagccaggc agcccgtgat ctggctcgca cccgcaaggg ctccaggttc 2220
cgcattgccc tcactggcac accggttgaa aacagagtga gcgagctctg ggccctgatg 2280
gatttcctca atccgaacgt gctcggcgaa gaggaatttt tccggcagcg ctaccgcatg 2340
ccgatcgaac gctatggcga tatgtcgtcg cttcgcgatc tcaagtcgcg ggtgggacca 2400
ttcattctgc ggcgcttgaa aaccgacaag gcgatcatct ccgacctccc cgaaaaagtg 2460
gagctgagtg aatgggtggg gctgagcaag gaacagaagt ccctttacgc gaaaaccgtg 2520
gagaacaccc tcgatgccat cgcccgagct ccccgaggca agcgtcacgg ccaggtgctg 2580
ggactgctga cgcgcctcaa acagatctgc aatcacccgg ctctggcctt aaaggaagag 2640
gtggcaggcg acgacttcct gcagcgatcg gtgaagctgc agcggctcga agagattctc 2700
gaagaggtga ttgcagcggg ggatcgagcc ctgctgttca cccagttcgc ggaatggggg 2760
catctgctgc agggctacct gcaacgccgc tggcgcagcg aggtgccgtt cctgagcggc 2820
agcactagca aaggagaacg tcaggccatg gtggatcgct tccaggaaga cccgcgcggc 2880
ccccagctgt tcctgttgtc cctcaaagcc ggcggtgtgg gattgaacct gacccgggcc 2940
agccacgtgt tccacatcga ccgctggtgg aatcctgcag ttgaaaacca ggccactgac 3000
cgtgcttacc ggattggcca gaccaatcgg gtgatggtgc ataagttcat caccagtggc 3060
tcagtggaag agaagatcga ccggatgatc cgggagaagt ccagactggc ggaagacatc 3120
gtgggctccg gcgaggagtg gctcggtggc ttcgacatgg gccaactcaa ggagctggtg 3180
agcctcgagg acaacgaaac acgcaaccca tga 3213
<210> 94
<211> 1070
<212> PRT
<213> Synechococcus sp.
<400> 94
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Pro Ser
1 5 10 15
Ser Ser Gly Arg Ala Ala Leu Leu Val Trp Ala Asp Thr Trp Arg Val
20 25 30
Ala Asp Pro Leu Gly Pro Gly Ala Thr Pro Ala Leu His Pro Phe Thr
35 40 45
Leu Ser Ala Glu Asp Leu Arg Ala Trp Leu Thr Glu Arg Asp Leu Leu
50 55 60
Pro Asp Gly Ile Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
65 70 75 80
Ser Val Lys Pro Arg Arg Pro Arg Gly Ser Ala Ala Ala Thr Pro Ser
85 90 95
Ser Glu Glu Gln Pro Pro Trp Cys Gly Leu Pro Leu Gln Ala Gly Glu
100 105 110
Pro Ile Pro Lys Thr Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu
115 120 125
Ala Ile Glu Pro Met Ala Ala Thr Ala Trp Leu Ala Lys Leu Pro Leu
130 135 140
Ser Gly His His Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His
145 150 155 160
Met Gln Arg Trp Ala Leu Ser Leu Val Ala Arg Gly Arg Trp Leu Pro
165 170 175
Gln Val Glu Leu Ser Arg Gly Glu Gly Tyr Pro His Arg Ala Arg Trp
180 185 190
Val Pro Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu
195 200 205
Ala Ala Arg Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu
210 215 220
Pro Thr Gly Lys Arg Ser Asn Arg Ile Thr Arg Leu Arg Pro Glu Ala
225 230 235 240
Met Arg Ala Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg
245 250 255
Leu Arg Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Gln Leu Arg
260 265 270
Lys Gly Phe His Pro Asp Asp Glu Gly Leu Asp Pro Leu Leu Cys Ala
275 280 285
Trp Glu Asn Ala Leu Ser Ser Glu Thr Gly Val Ile Asp Leu Asn Asp
290 295 300
Glu Asp Ala Glu Arg Leu Ala Thr Ala Ser His His Trp Arg Glu Gly
305 310 315 320
Val Ala Gly Asn Val Ala Ala Ala Arg Ala Cys Leu Glu Leu Ala Thr
325 330 335
Pro Asn Glu Gly Glu Glu Leu Trp Asp Leu Arg Phe Tyr Leu Gln Ala
340 345 350
Glu Ala Asp Pro Thr Leu Lys Val Pro Ala Gly Ala Ala Trp Ala Ala
355 360 365
Gly Pro Glu Gly Leu Gln Leu Gly Glu Ile Pro Val Glu His Pro Gly
370 375 380
Glu Val Leu Leu Glu Gly Met Gly Arg Ala Leu Thr Val Phe Glu Pro
385 390 395 400
Ile Glu Arg Gly Leu Asp Ser Ala Thr Pro Glu Ala Met Gln Leu Thr
405 410 415
Pro Ala Glu Ala Phe Val Leu Val Arg Thr Ala Ala Arg Gln Leu Arg
420 425 430
Asp Val Gly Val Gly Val Asp Leu Pro Pro Ser Leu Ser Gly Gly Leu
435 440 445
Ala Ser Arg Leu Gly Leu Ala Ile Lys Ala Glu Leu Pro Lys Arg Ser
450 455 460
Arg Gly Phe Thr Leu Gly Glu Asn Leu Asp Trp Asn Trp Glu Leu Met
465 470 475 480
Ile Gly Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ala Gly
485 490 495
Lys Arg Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg
500 505 510
Pro Asn Asp Leu Lys Asn Ala Glu Arg Phe Cys Ala Ala Asn Pro Asp
515 520 525
Leu Ser Leu Asp Asp Ala Leu Arg Leu Thr Ala Ser Glu Gly Asp Thr
530 535 540
Leu Met Arg Leu Pro Val His Ala Phe Asp Ala Gly Pro Arg Leu Gln
545 550 555 560
Gly Val Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro
565 570 575
Ala Pro Glu Gly Phe Cys Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly
580 585 590
Leu Gly Trp Leu Ala Phe Leu His Arg Phe Asp Gln Gly Ala Cys Leu
595 600 605
Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu
610 615 620
Gln His Leu Lys Met Glu Gln Glu Leu Lys Arg Pro Val Leu Leu Val
625 630 635 640
Ala Pro Thr Ser Val Leu Thr Asn Trp Lys Arg Glu Ala Ala Ala Phe
645 650 655
Thr Pro Glu Leu Thr Val His Glu His Tyr Gly Pro Lys Arg Pro Ser
660 665 670
Thr Pro Ala Ala Leu Lys Lys Ala Leu Lys Asp Val Asp Leu Val Leu
675 680 685
Thr Ser Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu Ser Phe
690 695 700
Asp Trp Gln Gly Thr Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro
705 710 715 720
Ser Ala Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Thr Arg Lys
725 730 735
Gly Ser Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg
740 745 750
Val Ser Glu Leu Trp Ala Leu Met Asp Phe Leu Asn Pro Asn Val Leu
755 760 765
Gly Glu Glu Glu Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg
770 775 780
Tyr Gly Asp Met Ser Ser Leu Arg Asp Leu Lys Ser Arg Val Gly Pro
785 790 795 800
Phe Ile Leu Arg Arg Leu Lys Thr Asp Lys Ala Ile Ile Ser Asp Leu
805 810 815
Pro Glu Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln
820 825 830
Lys Ser Leu Tyr Ala Lys Thr Val Glu Asn Thr Leu Asp Ala Ile Ala
835 840 845
Arg Ala Pro Arg Gly Lys Arg His Gly Gln Val Leu Gly Leu Leu Thr
850 855 860
Arg Leu Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Lys Glu Glu
865 870 875 880
Val Ala Gly Asp Asp Phe Leu Gln Arg Ser Val Lys Leu Gln Arg Leu
885 890 895
Glu Glu Ile Leu Glu Glu Val Ile Ala Ala Gly Asp Arg Ala Leu Leu
900 905 910
Phe Thr Gln Phe Ala Glu Trp Gly His Leu Leu Gln Gly Tyr Leu Gln
915 920 925
Arg Arg Trp Arg Ser Glu Val Pro Phe Leu Ser Gly Ser Thr Ser Lys
930 935 940
Gly Glu Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly
945 950 955 960
Pro Gln Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn
965 970 975
Leu Thr Arg Ala Ser His Val Phe His Ile Asp Arg Trp Trp Asn Pro
980 985 990
Ala Val Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr
995 1000 1005
Asn Arg Val Met Val His Lys Phe Ile Thr Ser Gly Ser Val Glu
1010 1015 1020
Glu Lys Ile Asp Arg Met Ile Arg Glu Lys Ser Arg Leu Ala Glu
1025 1030 1035
Asp Ile Val Gly Ser Gly Glu Glu Trp Leu Gly Gly Phe Asp Met
1040 1045 1050
Gly Gln Leu Lys Glu Leu Val Ser Leu Glu Asp Asn Glu Thr Arg
1055 1060 1065
Asn Pro
1070
<210> 95
<211> 3192
<212> DNA
<213> Synechococcus sp.
<400> 95
atgagcctgc tgcacgccac ctggcttccc gccatccgta cctctggcag ttccggccaa 60
ccggcactgc tcatttgggc tgacacctgg cgggtggcga caccagaggg ccccgggcta 120
actccggcgc tgcacccgtt caccctggaa cccgacgacc tcaaggcctg gcttcaggaa 180
cgcgacctgt tgccaggcgg cagcatcgat gccaccgcct gcctcaccct gcccagtcgc 240
acggtaaaac cccgcaagag ccgcagcaaa acggccgaac cagcgcccga agagcccatc 300
tggaccggtc tgccgatgca ggccggagag ccgattccga aacagacaga atggtggccg 360
tggcaagtcc agggcctcgc tgtcgagccc tctgccgcca cggagtggct ctcacgcctt 420
cccctgtcag gacggaatcc agacctggcc gatgagctgc gctggtggag ccacctgcag 480
cgctgggccc tcagccttgt ggcccggggg cgctggattc cccagatgga actgagcaaa 540
ggcgagggat atccccaccg ggcccgttgg gtgcctctgc tcaaccgcga ggaggaccgg 600
cgacgtctgg aggatctggc cgccagcctg ccgctggtgg ccacctgcgc cctgccctgg 660
cgggaaccga tgggtcggcg cagcaaccgc atgacacggc tgcgtccgga ggccatgcgt 720
gccgccaacc cggtggcctg ctgccggccc cgcagtggcc gcctgcgggt ggccacgctg 780
ctggaggatc tggtcgacgc acagctgcgc aaggactttg aaccatccac cgacggcctc 840
gatcccctgt tgaccctgtg gcaagacgcc ctgggctccg aaacaggggt gattgagatc 900
ggtgatgaac aggccgaacg gctggccagc gccagcttcc attggcgcga gggcatcgct 960
ggagatttcg ccgctgcacg cacctgcctg gaactgcaga cacctgcaga gggagaagag 1020
ctctgggagc tgcggtttgg gctgcaggcg gagtcggatc cgagcctcaa gctgcccgcc 1080
gctgcggcct gggcctccgg tgccgaccaa ctccagttgg gagaagtgac agtcgagcag 1140
cccggtgaag tgctgctgga gggtctggga cgcgccctca ccgtgttccc accgatcgaa 1200
aggggcctgg agaccgctac gcctgacacg atgcagctga cccccgccga agccttcgtg 1260
ctggtgcgga ccgcagcgcg gcagctgcgg gatgccggcg tcggcgtcga ccttcccccc 1320
agcctgtcgg ggggcctggc cagccgcctg ggtctggcga tcaaggcgga gctgccagag 1380
cgctccagcg gcttcagcct cggcgaatcc ctcgactgga gctgggatct gatgatcggc 1440
ggggtgacgc tcaccctgcg ggaactggag cggttgagcg gcaaacgcag ccccctcgtg 1500
cgccacaagg gggcctggat cgaattgcga ccgaacgatc tgagaaacgc cgaacgcttc 1560
tgcggtgcca acccggagct cagcctggac gatgccctgc ggatcaccgc caccgaaggc 1620
gatctgctga tgcgtctgcc ggtgcatcgc tttgaggccg gccccaggct gcaggcggtg 1680
ctggagcagt accaccagca gaaggccccg gatccgttgc cagcgccgga ggggttctgc 1740
ggccagctgc ggccttacca ggagcgtggc ctgggctggc tggccttcct caaccgcttc 1800
gaccaaggcg cctgcctggc ggacgacatg ggtctgggta agaccatcca gctgctggcc 1860
ttcctgcagc acctgaaagc agagcaggaa ctgaagcgcc cggtgctgct ggtggccccc 1920
acatcggtgc tcacaaactg gcgacgggaa gcggaagcct tcacccccga actggcggtg 1980
cgcgagcact acggaccgcg gcgtccctcc actccggctg cgctgaagaa ggcgttgaag 2040
gatgtcgact tagtcctcac cagctacggc ctactgcaga gggacagtga attgctggag 2100
tctcaggatt ggcagggggt tgtgatcgat gaagcccaag cgatcaagaa tcccagtgcc 2160
aagcagagcc aggcagcccg agacctggcc agaccagcca aaggcaaccg cttccgcatc 2220
gccctcacgg gcacaccggt ggagaacagg gtcagcgagc tctgggcttt gatggatttc 2280
ctcagtccca aggtgctggg agaagaagac ttcttccgtc agcgctaccg gatgccgatc 2340
gagcgctatg gcgacatggc atccctacgg gacttaaaag ccagggtcgg ccccttcatc 2400
ctgcgccggc tgaaaaccga caagacgatc atttccgatc tgcccgagaa ggtggaactc 2460
agcgaatggg tggggttgag caaggagcag aaatcgctgt acagcaaaac cgttgaagac 2520
accctggatg ccattgcccg ggcgcctcgt ggacagcgcc atggtcaggt gctgggactg 2580
ctcacccgcc tgaagcagat ctgcaaccat ccggccctgg cattgagtga aaacgctgtt 2640
gacgacggct ttctggggcg ctccgccaag ttgcaacggc ttgaggaaat cctcgatgag 2700
gtgatcgaag caggggatcg ggcgctgctg ttcacccagt tcgccgagtg gggccatctg 2760
ctgcagtcct ggatgcaaca acgttggaag gcggatgtgc ccttcctgca tggagggacg 2820
cgcaaaaacg aacggcaggc catggtggat cgttttcagg aggacccccg cggcccgcag 2880
ctgttcctgc tgtcgctcaa agccggcggg gtgggtctga acctgaccag ggccagccac 2940
gtgttccaca tcgatcgctg gtggaaccct gcggtagaga accaggccac cgaccgtgct 3000
tatcggatcg gccagaccaa ccgggtgatg gtgcacaaat tcatcacaag cggatccgta 3060
gaagaaaaaa ttgaccggat gatccgagag aagtcgcgcc tggcagagga tgtgatcggt 3120
tccggtgaag actggctcgg gtgcctggcc ggtgatcagc tgcgcaatct cgttgccctg 3180
gaggacacct ga 3192
<210> 96
<211> 1063
<212> PRT
<213> Synechococcus sp.
<400> 96
Met Ser Leu Leu His Ala Thr Trp Leu Pro Ala Ile Arg Thr Ser Gly
1 5 10 15
Ser Ser Gly Gln Pro Ala Leu Leu Ile Trp Ala Asp Thr Trp Arg Val
20 25 30
Ala Thr Pro Glu Gly Pro Gly Leu Thr Pro Ala Leu His Pro Phe Thr
35 40 45
Leu Glu Pro Asp Asp Leu Lys Ala Trp Leu Gln Glu Arg Asp Leu Leu
50 55 60
Pro Gly Gly Ser Ile Asp Ala Thr Ala Cys Leu Thr Leu Pro Ser Arg
65 70 75 80
Thr Val Lys Pro Arg Lys Ser Arg Ser Lys Thr Ala Glu Pro Ala Pro
85 90 95
Glu Glu Pro Ile Trp Thr Gly Leu Pro Met Gln Ala Gly Glu Pro Ile
100 105 110
Pro Lys Gln Thr Glu Trp Trp Pro Trp Gln Val Gln Gly Leu Ala Val
115 120 125
Glu Pro Ser Ala Ala Thr Glu Trp Leu Ser Arg Leu Pro Leu Ser Gly
130 135 140
Arg Asn Pro Asp Leu Ala Asp Glu Leu Arg Trp Trp Ser His Leu Gln
145 150 155 160
Arg Trp Ala Leu Ser Leu Val Ala Arg Gly Arg Trp Ile Pro Gln Met
165 170 175
Glu Leu Ser Lys Gly Glu Gly Tyr Pro His Arg Ala Arg Trp Val Pro
180 185 190
Leu Leu Asn Arg Glu Glu Asp Arg Arg Arg Leu Glu Asp Leu Ala Ala
195 200 205
Ser Leu Pro Leu Val Ala Thr Cys Ala Leu Pro Trp Arg Glu Pro Met
210 215 220
Gly Arg Arg Ser Asn Arg Met Thr Arg Leu Arg Pro Glu Ala Met Arg
225 230 235 240
Ala Ala Asn Pro Val Ala Cys Cys Arg Pro Arg Ser Gly Arg Leu Arg
245 250 255
Val Ala Thr Leu Leu Glu Asp Leu Val Asp Ala Gln Leu Arg Lys Asp
260 265 270
Phe Glu Pro Ser Thr Asp Gly Leu Asp Pro Leu Leu Thr Leu Trp Gln
275 280 285
Asp Ala Leu Gly Ser Glu Thr Gly Val Ile Glu Ile Gly Asp Glu Gln
290 295 300
Ala Glu Arg Leu Ala Ser Ala Ser Phe His Trp Arg Glu Gly Ile Ala
305 310 315 320
Gly Asp Phe Ala Ala Ala Arg Thr Cys Leu Glu Leu Gln Thr Pro Ala
325 330 335
Glu Gly Glu Glu Leu Trp Glu Leu Arg Phe Gly Leu Gln Ala Glu Ser
340 345 350
Asp Pro Ser Leu Lys Leu Pro Ala Ala Ala Ala Trp Ala Ser Gly Ala
355 360 365
Asp Gln Leu Gln Leu Gly Glu Val Thr Val Glu Gln Pro Gly Glu Val
370 375 380
Leu Leu Glu Gly Leu Gly Arg Ala Leu Thr Val Phe Pro Pro Ile Glu
385 390 395 400
Arg Gly Leu Glu Thr Ala Thr Pro Asp Thr Met Gln Leu Thr Pro Ala
405 410 415
Glu Ala Phe Val Leu Val Arg Thr Ala Ala Arg Gln Leu Arg Asp Ala
420 425 430
Gly Val Gly Val Asp Leu Pro Pro Ser Leu Ser Gly Gly Leu Ala Ser
435 440 445
Arg Leu Gly Leu Ala Ile Lys Ala Glu Leu Pro Glu Arg Ser Ser Gly
450 455 460
Phe Ser Leu Gly Glu Ser Leu Asp Trp Ser Trp Asp Leu Met Ile Gly
465 470 475 480
Gly Val Thr Leu Thr Leu Arg Glu Leu Glu Arg Leu Ser Gly Lys Arg
485 490 495
Ser Pro Leu Val Arg His Lys Gly Ala Trp Ile Glu Leu Arg Pro Asn
500 505 510
Asp Leu Arg Asn Ala Glu Arg Phe Cys Gly Ala Asn Pro Glu Leu Ser
515 520 525
Leu Asp Asp Ala Leu Arg Ile Thr Ala Thr Glu Gly Asp Leu Leu Met
530 535 540
Arg Leu Pro Val His Arg Phe Glu Ala Gly Pro Arg Leu Gln Ala Val
545 550 555 560
Leu Glu Gln Tyr His Gln Gln Lys Ala Pro Asp Pro Leu Pro Ala Pro
565 570 575
Glu Gly Phe Cys Gly Gln Leu Arg Pro Tyr Gln Glu Arg Gly Leu Gly
580 585 590
Trp Leu Ala Phe Leu Asn Arg Phe Asp Gln Gly Ala Cys Leu Ala Asp
595 600 605
Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Gln His
610 615 620
Leu Lys Ala Glu Gln Glu Leu Lys Arg Pro Val Leu Leu Val Ala Pro
625 630 635 640
Thr Ser Val Leu Thr Asn Trp Arg Arg Glu Ala Glu Ala Phe Thr Pro
645 650 655
Glu Leu Ala Val Arg Glu His Tyr Gly Pro Arg Arg Pro Ser Thr Pro
660 665 670
Ala Ala Leu Lys Lys Ala Leu Lys Asp Val Asp Leu Val Leu Thr Ser
675 680 685
Tyr Gly Leu Leu Gln Arg Asp Ser Glu Leu Leu Glu Ser Gln Asp Trp
690 695 700
Gln Gly Val Val Ile Asp Glu Ala Gln Ala Ile Lys Asn Pro Ser Ala
705 710 715 720
Lys Gln Ser Gln Ala Ala Arg Asp Leu Ala Arg Pro Ala Lys Gly Asn
725 730 735
Arg Phe Arg Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Val Ser
740 745 750
Glu Leu Trp Ala Leu Met Asp Phe Leu Ser Pro Lys Val Leu Gly Glu
755 760 765
Glu Asp Phe Phe Arg Gln Arg Tyr Arg Met Pro Ile Glu Arg Tyr Gly
770 775 780
Asp Met Ala Ser Leu Arg Asp Leu Lys Ala Arg Val Gly Pro Phe Ile
785 790 795 800
Leu Arg Arg Leu Lys Thr Asp Lys Thr Ile Ile Ser Asp Leu Pro Glu
805 810 815
Lys Val Glu Leu Ser Glu Trp Val Gly Leu Ser Lys Glu Gln Lys Ser
820 825 830
Leu Tyr Ser Lys Thr Val Glu Asp Thr Leu Asp Ala Ile Ala Arg Ala
835 840 845
Pro Arg Gly Gln Arg His Gly Gln Val Leu Gly Leu Leu Thr Arg Leu
850 855 860
Lys Gln Ile Cys Asn His Pro Ala Leu Ala Leu Ser Glu Asn Ala Val
865 870 875 880
Asp Asp Gly Phe Leu Gly Arg Ser Ala Lys Leu Gln Arg Leu Glu Glu
885 890 895
Ile Leu Asp Glu Val Ile Glu Ala Gly Asp Arg Ala Leu Leu Phe Thr
900 905 910
Gln Phe Ala Glu Trp Gly His Leu Leu Gln Ser Trp Met Gln Gln Arg
915 920 925
Trp Lys Ala Asp Val Pro Phe Leu His Gly Gly Thr Arg Lys Asn Glu
930 935 940
Arg Gln Ala Met Val Asp Arg Phe Gln Glu Asp Pro Arg Gly Pro Gln
945 950 955 960
Leu Phe Leu Leu Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr
965 970 975
Arg Ala Ser His Val Phe His Ile Asp Arg Trp Trp Asn Pro Ala Val
980 985 990
Glu Asn Gln Ala Thr Asp Arg Ala Tyr Arg Ile Gly Gln Thr Asn Arg
995 1000 1005
Val Met Val His Lys Phe Ile Thr Ser Gly Ser Val Glu Glu Lys
1010 1015 1020
Ile Asp Arg Met Ile Arg Glu Lys Ser Arg Leu Ala Glu Asp Val
1025 1030 1035
Ile Gly Ser Gly Glu Asp Trp Leu Gly Cys Leu Ala Gly Asp Gln
1040 1045 1050
Leu Arg Asn Leu Val Ala Leu Glu Asp Thr
1055 1060
<210> 97
<211> 3060
<212> DNA
<213> Synechococcus elongatus
<400> 97
atggcagtgc tgcacggtgg ctggctcggc gatcgcttct gcgtttgggc cgaggcttgg 60
caggctggtg agcctcagtc ggcagcagaa attgcgattc atccctacgc gatcgcggcc 120
actgacttaa atgattggtg ccagaagtac cgtctgggat ccctgacggg gacgccaaca 180
gaagtcctgc tctctattcc cagtgacctg aagaaagagg cggttctacc gtttctgagt 240
ggtcaggaaa ttccagatgg ggcgctgctt tggtcttggc agatccccgt gctgtcgcta 300
gaagccgcga tcgccggtca atggctggcg accttgccgc tgggttcggc ggaggatcat 360
ccttggctgg ggccagatct acgcttttgg agccacatct accgctgggc acaaagtttg 420
ctggctcggg ggcgctttta tccggcgctg gagtcgagcg atcgcggttt aacggcagtt 480
tggttgccac tgtttaatca agcgggcgat cgccagcgct tcgatcgcta tagtcagcag 540
ctgcccttta gtcagttttg ctatcaggca atcgaaacag cggcagcttg tccttggcag 600
cctcaaccgc aggatctgtt gctgcgagtc ctacagactt ggttgacagc acgactacaa 660
ccggcgatcg cggcgggaac tctcgtgtct gctgatctgc tggcggcttg gcagcaatcg 720
ctagcgaatg gaaaaccgct aaagctagaa gacagtgaag ccagtcgctt gcaaacggcg 780
atcgatcgct ggttactacc agtgcagaat ggcgcagctc aggcttggcg gatggttttg 840
cgccttgtcc cgcctacgga gcaagagcag ccctggcaat tggagtttgg cttacaagca 900
gcgaccgatc ccgatcgctt tcggccggcc tctctcctct ggcaggatcc gctgccacct 960
gggctaccag atcaatctca ggaattgctg ttacgcggct tgggacaggc ttgtcggctc 1020
tatccccaat tgcaaaccag tctggcgaca gcctgtccag aattccatcc actgaccaca 1080
gcggaggtct atcagctgct caagcaggtg attcctcagt ggcaagagca gggcattgaa 1140
gtgcaactgc cgccgggctt gcgtggtcaa gggcgacacc ggctgggagt ggaagtcagc 1200
gccacgttgc cgagcgatcg cccgagtgtg gggctggaag cactactgca gtttcgttgg 1260
gagctgagtc tgggcggtca gcggctgacc aaagcagaag tggaacgctt ggcagccctg 1320
gaaacgccct tggtggaaat caacggcgac tggattgagg tgcggccgca ggatattgag 1380
tcggcgcgag agtttttccg taagcgcaag gatcagccaa atttgacctt ggcggatgcg 1440
atcgcgatcg ccagtggtga gtcgccgaat gttggtcgcc tgccggtggt caattttgaa 1500
gcggcgggct tactcgaaga agccttggcc gtgtttcagg ggcagcgatc gcctgcggct 1560
ttgcccgctc cgcccacctt tcagggcgag ctgcgaccct atcaagagcg gggggtgggc 1620
tggctcagct ttttgcagcg cttcgggatt ggggcttgcc tcgccgacga catgggcttg 1680
ggtaagacga ttcagctgct ggccttttta ctgcatctca aacacagcaa cgagctgacg 1740
cggccggtgc tgctagtctg tccgacttcg gtgctgggca actgggaacg ggaggtgcag 1800
aaatttgcac cggagcttcg ctggaagctg cactatggcc ccgatcgcgc tcagggtaag 1860
gctttggcga cagcgctcaa ggactgcgat ttggtgctga ccagttactc cttggtggcg 1920
cgagatcaga aagcgatcgc ggcgatcgac tggcaaggca ttgtgctgga tgaagcccag 1980
aacatcaaga atgaccaggc gaaacagacg caggcggtgc gagcgatcgc ccaaagtccg 2040
acgcaaaagc cccgctttcg gattgccctg acagggacgc cggttgagaa tcgcctcagt 2100
gagttgtggt cgattgtcga gtttttgcag ccgggacatt taggcaccaa gccattcttt 2160
caaaagcgct ttgtcacgcc gatcgagcgt tttggcgatg cggattcgct gacagcattg 2220
cggcagcgcg tgcaaccgtt aatcctacgg cgactgaaaa ccgatcgcag cattattgcc 2280
gacttgcctg agaagcaaga aatgacggtc ttttgtccgt tggtacagga gcaggccgat 2340
cgctatcagg tgctagtcaa tgaagcgcta gccaatattg aagcaagtga aggcattcag 2400
cggcgcggcc agattttggc attgctaacg cgactgaagc agctctgtaa tcatccgtcg 2460
ttgttgctcg aaaagccgaa gctcgatccg aattttggcg atcgctcagc caagttgcag 2520
cgcttactag aaatgttggc ggagctaacg gatgcgggcg atcgcgcttt ggtgtttacg 2580
cagtttgcgg gctggggtag tttgctgcag caatttttgc aggaacagct agggcgagag 2640
gtgctgtttt tgtcgggcag taccaagaag ggcgatcgcc aacagatggt tgatcgcttc 2700
caaaatgatc cgcaggcacc ggcaattttc atcctgtcat tgaaggctgg cggggtgggg 2760
ctcaacctga cgaaagccaa tcatgtcttt cattacgatc gctggtggaa tccggcagtt 2820
gaaaaccaag cgaccgatcg cgcgtttcgg attgggcaac gacgcaatgt acaggtgcac 2880
aagtttgtct gcgctggcac tctagaagaa aaaattgatc agatgatcgc tagcaagcaa 2940
gcattagcac agcagattgt cggtagtggt gaggattggc taacggaact agacaccaat 3000
caactccggc aactcttgat cctcgatcgc tcagcttggg tagaagagga agagccttag 3060
<210> 98
<211> 1019
<212> PRT
<213> Synechococcus elongatus
<400> 98
Met Ala Val Leu His Gly Gly Trp Leu Gly Asp Arg Phe Cys Val Trp
1 5 10 15
Ala Glu Ala Trp Gln Ala Gly Glu Pro Gln Ser Ala Ala Glu Ile Ala
20 25 30
Ile His Pro Tyr Ala Ile Ala Ala Thr Asp Leu Asn Asp Trp Cys Gln
35 40 45
Lys Tyr Arg Leu Gly Ser Leu Thr Gly Thr Pro Thr Glu Val Leu Leu
50 55 60
Ser Ile Pro Ser Asp Leu Lys Lys Glu Ala Val Leu Pro Phe Leu Ser
65 70 75 80
Gly Gln Glu Ile Pro Asp Gly Ala Leu Leu Trp Ser Trp Gln Ile Pro
85 90 95
Val Leu Ser Leu Glu Ala Ala Ile Ala Gly Gln Trp Leu Ala Thr Leu
100 105 110
Pro Leu Gly Ser Ala Glu Asp His Pro Trp Leu Gly Pro Asp Leu Arg
115 120 125
Phe Trp Ser His Ile Tyr Arg Trp Ala Gln Ser Leu Leu Ala Arg Gly
130 135 140
Arg Phe Tyr Pro Ala Leu Glu Ser Ser Asp Arg Gly Leu Thr Ala Val
145 150 155 160
Trp Leu Pro Leu Phe Asn Gln Ala Gly Asp Arg Gln Arg Phe Asp Arg
165 170 175
Tyr Ser Gln Gln Leu Pro Phe Ser Gln Phe Cys Tyr Gln Ala Ile Glu
180 185 190
Thr Ala Ala Ala Cys Pro Trp Gln Pro Gln Pro Gln Asp Leu Leu Leu
195 200 205
Arg Val Leu Gln Thr Trp Leu Thr Ala Arg Leu Gln Pro Ala Ile Ala
210 215 220
Ala Gly Thr Leu Val Ser Ala Asp Leu Leu Ala Ala Trp Gln Gln Ser
225 230 235 240
Leu Ala Asn Gly Lys Pro Leu Lys Leu Glu Asp Ser Glu Ala Ser Arg
245 250 255
Leu Gln Thr Ala Ile Asp Arg Trp Leu Leu Pro Val Gln Asn Gly Ala
260 265 270
Ala Gln Ala Trp Arg Met Val Leu Arg Leu Val Pro Pro Thr Glu Gln
275 280 285
Glu Gln Pro Trp Gln Leu Glu Phe Gly Leu Gln Ala Ala Thr Asp Pro
290 295 300
Asp Arg Phe Arg Pro Ala Ser Leu Leu Trp Gln Asp Pro Leu Pro Pro
305 310 315 320
Gly Leu Pro Asp Gln Ser Gln Glu Leu Leu Leu Arg Gly Leu Gly Gln
325 330 335
Ala Cys Arg Leu Tyr Pro Gln Leu Gln Thr Ser Leu Ala Thr Ala Cys
340 345 350
Pro Glu Phe His Pro Leu Thr Thr Ala Glu Val Tyr Gln Leu Leu Lys
355 360 365
Gln Val Ile Pro Gln Trp Gln Glu Gln Gly Ile Glu Val Gln Leu Pro
370 375 380
Pro Gly Leu Arg Gly Gln Gly Arg His Arg Leu Gly Val Glu Val Ser
385 390 395 400
Ala Thr Leu Pro Ser Asp Arg Pro Ser Val Gly Leu Glu Ala Leu Leu
405 410 415
Gln Phe Arg Trp Glu Leu Ser Leu Gly Gly Gln Arg Leu Thr Lys Ala
420 425 430
Glu Val Glu Arg Leu Ala Ala Leu Glu Thr Pro Leu Val Glu Ile Asn
435 440 445
Gly Asp Trp Ile Glu Val Arg Pro Gln Asp Ile Glu Ser Ala Arg Glu
450 455 460
Phe Phe Arg Lys Arg Lys Asp Gln Pro Asn Leu Thr Leu Ala Asp Ala
465 470 475 480
Ile Ala Ile Ala Ser Gly Glu Ser Pro Asn Val Gly Arg Leu Pro Val
485 490 495
Val Asn Phe Glu Ala Ala Gly Leu Leu Glu Glu Ala Leu Ala Val Phe
500 505 510
Gln Gly Gln Arg Ser Pro Ala Ala Leu Pro Ala Pro Pro Thr Phe Gln
515 520 525
Gly Glu Leu Arg Pro Tyr Gln Glu Arg Gly Val Gly Trp Leu Ser Phe
530 535 540
Leu Gln Arg Phe Gly Ile Gly Ala Cys Leu Ala Asp Asp Met Gly Leu
545 550 555 560
Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Leu His Leu Lys His Ser
565 570 575
Asn Glu Leu Thr Arg Pro Val Leu Leu Val Cys Pro Thr Ser Val Leu
580 585 590
Gly Asn Trp Glu Arg Glu Val Gln Lys Phe Ala Pro Glu Leu Arg Trp
595 600 605
Lys Leu His Tyr Gly Pro Asp Arg Ala Gln Gly Lys Ala Leu Ala Thr
610 615 620
Ala Leu Lys Asp Cys Asp Leu Val Leu Thr Ser Tyr Ser Leu Val Ala
625 630 635 640
Arg Asp Gln Lys Ala Ile Ala Ala Ile Asp Trp Gln Gly Ile Val Leu
645 650 655
Asp Glu Ala Gln Asn Ile Lys Asn Asp Gln Ala Lys Gln Thr Gln Ala
660 665 670
Val Arg Ala Ile Ala Gln Ser Pro Thr Gln Lys Pro Arg Phe Arg Ile
675 680 685
Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Ser Glu Leu Trp Ser
690 695 700
Ile Val Glu Phe Leu Gln Pro Gly His Leu Gly Thr Lys Pro Phe Phe
705 710 715 720
Gln Lys Arg Phe Val Thr Pro Ile Glu Arg Phe Gly Asp Ala Asp Ser
725 730 735
Leu Thr Ala Leu Arg Gln Arg Val Gln Pro Leu Ile Leu Arg Arg Leu
740 745 750
Lys Thr Asp Arg Ser Ile Ile Ala Asp Leu Pro Glu Lys Gln Glu Met
755 760 765
Thr Val Phe Cys Pro Leu Val Gln Glu Gln Ala Asp Arg Tyr Gln Val
770 775 780
Leu Val Asn Glu Ala Leu Ala Asn Ile Glu Ala Ser Glu Gly Ile Gln
785 790 795 800
Arg Arg Gly Gln Ile Leu Ala Leu Leu Thr Arg Leu Lys Gln Leu Cys
805 810 815
Asn His Pro Ser Leu Leu Leu Glu Lys Pro Lys Leu Asp Pro Asn Phe
820 825 830
Gly Asp Arg Ser Ala Lys Leu Gln Arg Leu Leu Glu Met Leu Ala Glu
835 840 845
Leu Thr Asp Ala Gly Asp Arg Ala Leu Val Phe Thr Gln Phe Ala Gly
850 855 860
Trp Gly Ser Leu Leu Gln Gln Phe Leu Gln Glu Gln Leu Gly Arg Glu
865 870 875 880
Val Leu Phe Leu Ser Gly Ser Thr Lys Lys Gly Asp Arg Gln Gln Met
885 890 895
Val Asp Arg Phe Gln Asn Asp Pro Gln Ala Pro Ala Ile Phe Ile Leu
900 905 910
Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Lys Ala Asn His
915 920 925
Val Phe His Tyr Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala
930 935 940
Thr Asp Arg Ala Phe Arg Ile Gly Gln Arg Arg Asn Val Gln Val His
945 950 955 960
Lys Phe Val Cys Ala Gly Thr Leu Glu Glu Lys Ile Asp Gln Met Ile
965 970 975
Ala Ser Lys Gln Ala Leu Ala Gln Gln Ile Val Gly Ser Gly Glu Asp
980 985 990
Trp Leu Thr Glu Leu Asp Thr Asn Gln Leu Arg Gln Leu Leu Ile Leu
995 1000 1005
Asp Arg Ser Ala Trp Val Glu Glu Glu Glu Pro
1010 1015
<210> 99
<211> 3060
<212> DNA
<213> Synechococcus elongatus
<400> 99
atggcagtgc tgcacggtgg ctggctcggc gatcgcttct gcgtttgggc cgaggcttgg 60
caggctggtg agcctcagtc ggcagcagaa attgcgattc atccctacgc gatcgcggcc 120
actgacttaa atgattggtg ccagaagtac cgtctgggat ccctgacggg gacgccaaca 180
gaagtcctgc tctctattcc cagtgacctg aagaaagagg cggttctacc gtttctgagt 240
ggtcaggaaa ttccagatgg ggcgctgctt tggtcttggc agatccccgt gctgtcacta 300
gaagccgcga tcgccggtca atggctggcg accttgccgc tgggttcggc ggaggatcat 360
ccttggctgg ggccagatct acgcttttgg agccacatct accgctgggc acaaagtttg 420
ctggctcggg ggcgctttta tccggcgctg gagtcgagcg atcgcggttt aacggcagtt 480
tggttgccac tgtttaatca agcgggcgat cgccagcgct tcgatcgcta tagtcagcag 540
ctgcccttta gtcagttttg ctatcaggca atcgaaacag cggcagcttg tccttggcag 600
cctcaaccgc aggatctgtt gctgcgagtc ctacagactt ggttgacagc acgactacaa 660
ccggcgatcg cggcgggaac tctcgtgtct gctgatctgc tggcggcttg gcagcaatcg 720
ctagcgaatg gaaaaccgct aaagctagaa gacagtgaag ccagtcgctt gcaaacggcg 780
atcgatcgct ggttactacc agtgcagaat ggcgcagctc aggcttggcg gatggttttg 840
cgccttgtcc cgcctacgga gcaagagcag ccctggcaat tggagtttgg cttacaagca 900
gcgaccgatc ccgatcgctt ttggccggcc tctctcctct ggcaggatcc gctgccacct 960
gggctaccag atcaatctca ggaattgctg ttacgcggct tgggacaggc ttgtcggctc 1020
tatccccaat tgcaaaccag tctggcgaca gcctgtccag aattccatcc actgaccaca 1080
gcggaggtct atcagctgct caagcaggtg attcctcagt ggcaagagca gggcattgaa 1140
gtgcaactgc cgccgggctt gcgtggtcaa gggcgacacc ggctgggagt ggaagtcagc 1200
gccacgttgc cgagcgatcg cccgagtgtg gggctggaag cactactgca gtttcgttgg 1260
gagctgagtc tgggcggtca gcggctgacc aaagcagaag tggaacgctt ggcagccctg 1320
gaaacgccct tggtggaaat caacggcgac tggattgagg tgcggccgca ggatattgag 1380
tcggcgcgag agtttttccg taagcgcaag gatcagccaa atttgacctt ggcggatgcg 1440
atcgcgatcg ccagtggtga gtcgccgaat gttggtcgcc tgccggtggt caattttgaa 1500
gcggcgggct tactcgaaga agccttggcc gtgtttcagg ggcagcgatc gcctgcggct 1560
ttgcccgctc cgcccacctt tcagggcgag ctgcgaccct atcaagagcg gggggtgggc 1620
tggctcagct ttttgcagcg cttcgggatt ggggcttgcc tcgccgacga catgggcttg 1680
ggtaagacga ttcagctgct ggccttttta ctgcatctca aacacagcaa cgagctgacg 1740
cggccggtgc tgctagtctg tccgacttcg gtgctgggca actgggaacg ggaggtgcag 1800
aaatttgcac cggagcttcg ctggaagctg cactatggcc ccgatcgcgc tcagggtaag 1860
gctttggcga cagcgctcaa ggactgcgat ttggtgctga ccagttactc cttggtggcg 1920
cgagatcaga aagcgatcgc ggcgatcgac tggcaaggca ttgtgctgga tgaagcccag 1980
aacatcaaga atgaccaggc gaaacagacg caggcggtgc gagcgatcgc ccaaagtccg 2040
acgcaaaagc cccgctttcg gattgccctg acagggacgc cggttgagaa tcgcctcagt 2100
gagttgtggt cgattgtcga gtttttgcag ccgggacatt taggcaccaa gccattcttt 2160
caaaagcgct ttgtcacgcc gatcgagcgt tttggcgatg cggattcgct gacagcattg 2220
cggcagcgcg tgcaaccgtt aatcctacgg cgactgaaaa ccgatcgcag cattattgcc 2280
gacttgcctg agaagcaaga aatgacggtc ttttgtccgt tggtacagga gcaggccgat 2340
cgctatcagg tgctagtcaa tgaagcgcta gccaatattg aagcaagtga aggcattcag 2400
cggcgcggcc agattttggc attgctaacg cgactgaagc agctctgtaa tcatccgtcg 2460
ttgttgctcg aaaagccgaa gctcgatccg aattttggcg atcgctcagc caagttgcag 2520
cgcttactag aaatgttggc ggagctaacg gatgcgggcg atcgcgcttt ggtgtttacg 2580
cagtttgcgg gctggggtag tttgctgcag caatttttgc aggaacagct agggcgagag 2640
gtgctgtttt tgtcgggcag taccaagaag ggcgatcgcc aacagatggt tgatcgcttc 2700
caaaatgatc cgcaggcacc ggcaattttc atcctgtcat tgaaggctgg cggggtgggg 2760
ctcaacctga cgaaagccaa tcatgtcttt cattacgatc gctggtggaa tccggcagtt 2820
gaaaaccaag cgaccgatcg cgcgtttcgg attgggcaac gacgcaatgt acaggtgcac 2880
aagtttgtct gcgctggcac tctagaagaa aaaattgatc agatgatcgc tagcaagcaa 2940
gcattagcac agcagattgt cggtagtggt gaggattggc taacggaact agacaccaat 3000
caactccggc aactcttgat cctcgatcgc tcagcttggg tagaagagga agagccttag 3060
<210> 100
<211> 1019
<212> PRT
<213> Synechococcus elongatus
<400> 100
Met Ala Val Leu His Gly Gly Trp Leu Gly Asp Arg Phe Cys Val Trp
1 5 10 15
Ala Glu Ala Trp Gln Ala Gly Glu Pro Gln Ser Ala Ala Glu Ile Ala
20 25 30
Ile His Pro Tyr Ala Ile Ala Ala Thr Asp Leu Asn Asp Trp Cys Gln
35 40 45
Lys Tyr Arg Leu Gly Ser Leu Thr Gly Thr Pro Thr Glu Val Leu Leu
50 55 60
Ser Ile Pro Ser Asp Leu Lys Lys Glu Ala Val Leu Pro Phe Leu Ser
65 70 75 80
Gly Gln Glu Ile Pro Asp Gly Ala Leu Leu Trp Ser Trp Gln Ile Pro
85 90 95
Val Leu Ser Leu Glu Ala Ala Ile Ala Gly Gln Trp Leu Ala Thr Leu
100 105 110
Pro Leu Gly Ser Ala Glu Asp His Pro Trp Leu Gly Pro Asp Leu Arg
115 120 125
Phe Trp Ser His Ile Tyr Arg Trp Ala Gln Ser Leu Leu Ala Arg Gly
130 135 140
Arg Phe Tyr Pro Ala Leu Glu Ser Ser Asp Arg Gly Leu Thr Ala Val
145 150 155 160
Trp Leu Pro Leu Phe Asn Gln Ala Gly Asp Arg Gln Arg Phe Asp Arg
165 170 175
Tyr Ser Gln Gln Leu Pro Phe Ser Gln Phe Cys Tyr Gln Ala Ile Glu
180 185 190
Thr Ala Ala Ala Cys Pro Trp Gln Pro Gln Pro Gln Asp Leu Leu Leu
195 200 205
Arg Val Leu Gln Thr Trp Leu Thr Ala Arg Leu Gln Pro Ala Ile Ala
210 215 220
Ala Gly Thr Leu Val Ser Ala Asp Leu Leu Ala Ala Trp Gln Gln Ser
225 230 235 240
Leu Ala Asn Gly Lys Pro Leu Lys Leu Glu Asp Ser Glu Ala Ser Arg
245 250 255
Leu Gln Thr Ala Ile Asp Arg Trp Leu Leu Pro Val Gln Asn Gly Ala
260 265 270
Ala Gln Ala Trp Arg Met Val Leu Arg Leu Val Pro Pro Thr Glu Gln
275 280 285
Glu Gln Pro Trp Gln Leu Glu Phe Gly Leu Gln Ala Ala Thr Asp Pro
290 295 300
Asp Arg Phe Trp Pro Ala Ser Leu Leu Trp Gln Asp Pro Leu Pro Pro
305 310 315 320
Gly Leu Pro Asp Gln Ser Gln Glu Leu Leu Leu Arg Gly Leu Gly Gln
325 330 335
Ala Cys Arg Leu Tyr Pro Gln Leu Gln Thr Ser Leu Ala Thr Ala Cys
340 345 350
Pro Glu Phe His Pro Leu Thr Thr Ala Glu Val Tyr Gln Leu Leu Lys
355 360 365
Gln Val Ile Pro Gln Trp Gln Glu Gln Gly Ile Glu Val Gln Leu Pro
370 375 380
Pro Gly Leu Arg Gly Gln Gly Arg His Arg Leu Gly Val Glu Val Ser
385 390 395 400
Ala Thr Leu Pro Ser Asp Arg Pro Ser Val Gly Leu Glu Ala Leu Leu
405 410 415
Gln Phe Arg Trp Glu Leu Ser Leu Gly Gly Gln Arg Leu Thr Lys Ala
420 425 430
Glu Val Glu Arg Leu Ala Ala Leu Glu Thr Pro Leu Val Glu Ile Asn
435 440 445
Gly Asp Trp Ile Glu Val Arg Pro Gln Asp Ile Glu Ser Ala Arg Glu
450 455 460
Phe Phe Arg Lys Arg Lys Asp Gln Pro Asn Leu Thr Leu Ala Asp Ala
465 470 475 480
Ile Ala Ile Ala Ser Gly Glu Ser Pro Asn Val Gly Arg Leu Pro Val
485 490 495
Val Asn Phe Glu Ala Ala Gly Leu Leu Glu Glu Ala Leu Ala Val Phe
500 505 510
Gln Gly Gln Arg Ser Pro Ala Ala Leu Pro Ala Pro Pro Thr Phe Gln
515 520 525
Gly Glu Leu Arg Pro Tyr Gln Glu Arg Gly Val Gly Trp Leu Ser Phe
530 535 540
Leu Gln Arg Phe Gly Ile Gly Ala Cys Leu Ala Asp Asp Met Gly Leu
545 550 555 560
Gly Lys Thr Ile Gln Leu Leu Ala Phe Leu Leu His Leu Lys His Ser
565 570 575
Asn Glu Leu Thr Arg Pro Val Leu Leu Val Cys Pro Thr Ser Val Leu
580 585 590
Gly Asn Trp Glu Arg Glu Val Gln Lys Phe Ala Pro Glu Leu Arg Trp
595 600 605
Lys Leu His Tyr Gly Pro Asp Arg Ala Gln Gly Lys Ala Leu Ala Thr
610 615 620
Ala Leu Lys Asp Cys Asp Leu Val Leu Thr Ser Tyr Ser Leu Val Ala
625 630 635 640
Arg Asp Gln Lys Ala Ile Ala Ala Ile Asp Trp Gln Gly Ile Val Leu
645 650 655
Asp Glu Ala Gln Asn Ile Lys Asn Asp Gln Ala Lys Gln Thr Gln Ala
660 665 670
Val Arg Ala Ile Ala Gln Ser Pro Thr Gln Lys Pro Arg Phe Arg Ile
675 680 685
Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Ser Glu Leu Trp Ser
690 695 700
Ile Val Glu Phe Leu Gln Pro Gly His Leu Gly Thr Lys Pro Phe Phe
705 710 715 720
Gln Lys Arg Phe Val Thr Pro Ile Glu Arg Phe Gly Asp Ala Asp Ser
725 730 735
Leu Thr Ala Leu Arg Gln Arg Val Gln Pro Leu Ile Leu Arg Arg Leu
740 745 750
Lys Thr Asp Arg Ser Ile Ile Ala Asp Leu Pro Glu Lys Gln Glu Met
755 760 765
Thr Val Phe Cys Pro Leu Val Gln Glu Gln Ala Asp Arg Tyr Gln Val
770 775 780
Leu Val Asn Glu Ala Leu Ala Asn Ile Glu Ala Ser Glu Gly Ile Gln
785 790 795 800
Arg Arg Gly Gln Ile Leu Ala Leu Leu Thr Arg Leu Lys Gln Leu Cys
805 810 815
Asn His Pro Ser Leu Leu Leu Glu Lys Pro Lys Leu Asp Pro Asn Phe
820 825 830
Gly Asp Arg Ser Ala Lys Leu Gln Arg Leu Leu Glu Met Leu Ala Glu
835 840 845
Leu Thr Asp Ala Gly Asp Arg Ala Leu Val Phe Thr Gln Phe Ala Gly
850 855 860
Trp Gly Ser Leu Leu Gln Gln Phe Leu Gln Glu Gln Leu Gly Arg Glu
865 870 875 880
Val Leu Phe Leu Ser Gly Ser Thr Lys Lys Gly Asp Arg Gln Gln Met
885 890 895
Val Asp Arg Phe Gln Asn Asp Pro Gln Ala Pro Ala Ile Phe Ile Leu
900 905 910
Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Lys Ala Asn His
915 920 925
Val Phe His Tyr Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala
930 935 940
Thr Asp Arg Ala Phe Arg Ile Gly Gln Arg Arg Asn Val Gln Val His
945 950 955 960
Lys Phe Val Cys Ala Gly Thr Leu Glu Glu Lys Ile Asp Gln Met Ile
965 970 975
Ala Ser Lys Gln Ala Leu Ala Gln Gln Ile Val Gly Ser Gly Glu Asp
980 985 990
Trp Leu Thr Glu Leu Asp Thr Asn Gln Leu Arg Gln Leu Leu Ile Leu
995 1000 1005
Asp Arg Ser Ala Trp Val Glu Glu Glu Glu Pro
1010 1015
<210> 101
<211> 3000
<212> DNA
<213> Thermosynechococcus elongatus
<400> 101
atggctattt tccatggcac atggctccca gagccggcgc cacagttttt catttgggcg 60
gaagaatggc gatcgctggc tcaggcaatc acgccttggg ctcccccggc gattccggtt 120
tatccctacg ccacccagag aaaaacacct cttaggaaga cagcccgccc aagtgccacc 180
tacgttgctt taccggccca gattcagggg catcaactgt taccaccacc gctggcggaa 240
gtgcaggggg aactcctatt tttgtggcag gtgcccggct ggtcaattcc cgcttcagaa 300
gttttagaac aactgcatca actgagtctt cacggccaag acagtggcag tattggcgat 360
gatttgcgct attggctgca cgtgagtcgc tggttgctgg atttaattgt gcgtggccaa 420
tacctgccaa caccagaggg ctggcggatt ctgctgaccc acgggggcga tcgcgatcgc 480
ctgcgccact tcagccaatt gatgccggat ctgtgtcgct gttatcaagc cgatggcaca 540
gcgttgcagt tgccacccca tgctgcagat ctcctggcgg attttctaca gcacacccta 600
cagggttatc tccacactgc ccttgctgac ctcgaattgc ccaaagtagg cttagccaaa 660
gaacatggcc actggctagc cttcctgaaa acgggtcaaa ccccggaact gccacctccc 720
ctcattgaac gcctgcaccg ctggcaagaa ccctaccgcg agcagttgca tctgcgtccc 780
caatggcgac tggctctgca attggttccc ccagatactg ccgatggtga ctggcacttg 840
gcctttgggc tgcaaacgga aggggaaacg gacaccatgc taagggccgc cgagatttgg 900
caatgcaccc aagaggccct cctctatcaa gggcaggtgc tctggcagcc ccaagaaacc 960
ctgttgcggg gactgggctt ggcctcccgc atctatcgtc ccctcgatcg cagtcttcaa 1020
gaacgctccc ccgtggctct gactttgcac accacggaag tttatgcctt cttgcaaagt 1080
gcaattgcgc cccttgagca gcagggggtt gcgatcattt tgccaccgag tctgcgccgc 1140
aatagcgccc aacatcgctt gggtctgaaa ataattgcca cattgccgcc gccggccact 1200
aacggcttga cgattgacag cttgatgcag tttcagtggc agttgcagtt ggggcagcat 1260
cccctctcgg aggcggattt tgatcaactg cgccgccaag ggacgcccct ggtttatctc 1320
aatggtgagt gggtcttgct gcgcccccaa gaggtcaagg ccgctcaaga gtttctccag 1380
tctcccccaa agacccaact ctcccttgca gagacactgc gcattgctac gggggatacg 1440
gtaacggtgg ccaagttgcc gattcttggc ttagacacca atgatgcact ccagaccctc 1500
ttggatggcc tcacgggcaa acaaagcctt gatccagtgc caacaccgca ggagttttgc 1560
ggtgaactgc gcccctacca ggcacggggg gtggcgtggc tgagtttctt ggaacgctgg 1620
cggctggggg cttgcttggc ggacgatatg ggcttgggga aaaccattca actgttggcc 1680
tttttgctcc acctcaagga aacgggacgg gcctaccgac cgacactgtt gatctgtcct 1740
acctcggtgc tggggaactg gctgcgggag tgccaaaagt ttgccccaac cttgcgggcc 1800
tatgtccacc atgggagcga tcgccccaag ggcaaggcat ttctgaaaaa ggttgaaact 1860
cacgatctaa ttttgaccag ttatgccctc ctccagcgcg atcgcaccac cttgcagcag 1920
gttctgtggc agcatttggt actggatgaa gcccaaaaca tcaagaatgc caacacccag 1980
cagtcccaag cagcgcggga actttccgcc cagtttcgca ttgccctgac gggaaccccc 2040
ctagaaaacc gcctcctcga actttggtcc attatggact tcctccatcc ggggtacttg 2100
ggccatcgca cctactttca acaccgctat gtccgtccca ttgaacgcta tggcgacacc 2160
acctccctca atgctctgcg cacctatgtc cagcccttta ttctgcggcg cctgaaaacc 2220
gaccgcagta ttattcaaga cctgccggaa aaacaggaga tgctggtgta ttgtggcctc 2280
accctagagc agatgcagct ttacactgct gtggtggaag actcccttgc tgctatcgaa 2340
aatagtcaag gcattcagcg gcggggcaat atcttggcca ccctgaccaa gttgaagcaa 2400
atctgtaacc atcccgccca gtatctcaag caagaagact atgcccccga tcgctcaggt 2460
aaattgcaac ggcttataga aatgctgcaa gcgcttcagg aagtgggcga tcgcgccctt 2520
gtctttaccc aatttgccga gtttggcacc cacctgaaaa cctatctgga aaaggcgctc 2580
cagcaggagg tgtttttcct ctcaggacgc acccccaaag cccagcggga actcatggtg 2640
gaacgctttc aacacgatcc cgaggccccc agggtcttta ttctttccct caaggcaggg 2700
ggcgtcggtc tcaatttgac tcgcgctaac catgtctttc actacgatcg ctggtggaac 2760
ccagcggtag aaaatcaggc cagcgatcgc gtcttccgca ttggtcaggc ccgcaatgtc 2820
caaatccata aatttatctg cacgggtacc ctcgaagaaa agatccacga gcaaatcgaa 2880
cagaaaaaag cccttgcgga aatgattgtg ggtagtggcg aacactggct gactgaactc 2940
aacctcgacc agttgcggca actgctcacc ttagacaaag agcggctgat caccctctag 3000
<210> 102
<211> 999
<212> PRT
<213> Thermosynechococcus elongatus
<400> 102
Met Ala Ile Phe His Gly Thr Trp Leu Pro Glu Pro Ala Pro Gln Phe
1 5 10 15
Phe Ile Trp Ala Glu Glu Trp Arg Ser Leu Ala Gln Ala Ile Thr Pro
20 25 30
Trp Ala Pro Pro Ala Ile Pro Val Tyr Pro Tyr Ala Thr Gln Arg Lys
35 40 45
Thr Pro Leu Arg Lys Thr Ala Arg Pro Ser Ala Thr Tyr Val Ala Leu
50 55 60
Pro Ala Gln Ile Gln Gly His Gln Leu Leu Pro Pro Pro Leu Ala Glu
65 70 75 80
Val Gln Gly Glu Leu Leu Phe Leu Trp Gln Val Pro Gly Trp Ser Ile
85 90 95
Pro Ala Ser Glu Val Leu Glu Gln Leu His Gln Leu Ser Leu His Gly
100 105 110
Gln Asp Ser Gly Ser Ile Gly Asp Asp Leu Arg Tyr Trp Leu His Val
115 120 125
Ser Arg Trp Leu Leu Asp Leu Ile Val Arg Gly Gln Tyr Leu Pro Thr
130 135 140
Pro Glu Gly Trp Arg Ile Leu Leu Thr His Gly Gly Asp Arg Asp Arg
145 150 155 160
Leu Arg His Phe Ser Gln Leu Met Pro Asp Leu Cys Arg Cys Tyr Gln
165 170 175
Ala Asp Gly Thr Ala Leu Gln Leu Pro Pro His Ala Ala Asp Leu Leu
180 185 190
Ala Asp Phe Leu Gln His Thr Leu Gln Gly Tyr Leu His Thr Ala Leu
195 200 205
Ala Asp Leu Glu Leu Pro Lys Val Gly Leu Ala Lys Glu His Gly His
210 215 220
Trp Leu Ala Phe Leu Lys Thr Gly Gln Thr Pro Glu Leu Pro Pro Pro
225 230 235 240
Leu Ile Glu Arg Leu His Arg Trp Gln Glu Pro Tyr Arg Glu Gln Leu
245 250 255
His Leu Arg Pro Gln Trp Arg Leu Ala Leu Gln Leu Val Pro Pro Asp
260 265 270
Thr Ala Asp Gly Asp Trp His Leu Ala Phe Gly Leu Gln Thr Glu Gly
275 280 285
Glu Thr Asp Thr Met Leu Arg Ala Ala Glu Ile Trp Gln Cys Thr Gln
290 295 300
Glu Ala Leu Leu Tyr Gln Gly Gln Val Leu Trp Gln Pro Gln Glu Thr
305 310 315 320
Leu Leu Arg Gly Leu Gly Leu Ala Ser Arg Ile Tyr Arg Pro Leu Asp
325 330 335
Arg Ser Leu Gln Glu Arg Ser Pro Val Ala Leu Thr Leu His Thr Thr
340 345 350
Glu Val Tyr Ala Phe Leu Gln Ser Ala Ile Ala Pro Leu Glu Gln Gln
355 360 365
Gly Val Ala Ile Ile Leu Pro Pro Ser Leu Arg Arg Asn Ser Ala Gln
370 375 380
His Arg Leu Gly Leu Lys Ile Ile Ala Thr Leu Pro Pro Pro Ala Thr
385 390 395 400
Asn Gly Leu Thr Ile Asp Ser Leu Met Gln Phe Gln Trp Gln Leu Gln
405 410 415
Leu Gly Gln His Pro Leu Ser Glu Ala Asp Phe Asp Gln Leu Arg Arg
420 425 430
Gln Gly Thr Pro Leu Val Tyr Leu Asn Gly Glu Trp Val Leu Leu Arg
435 440 445
Pro Gln Glu Val Lys Ala Ala Gln Glu Phe Leu Gln Ser Pro Pro Lys
450 455 460
Thr Gln Leu Ser Leu Ala Glu Thr Leu Arg Ile Ala Thr Gly Asp Thr
465 470 475 480
Val Thr Val Ala Lys Leu Pro Ile Leu Gly Leu Asp Thr Asn Asp Ala
485 490 495
Leu Gln Thr Leu Leu Asp Gly Leu Thr Gly Lys Gln Ser Leu Asp Pro
500 505 510
Val Pro Thr Pro Gln Glu Phe Cys Gly Glu Leu Arg Pro Tyr Gln Ala
515 520 525
Arg Gly Val Ala Trp Leu Ser Phe Leu Glu Arg Trp Arg Leu Gly Ala
530 535 540
Cys Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Ile Gln Leu Leu Ala
545 550 555 560
Phe Leu Leu His Leu Lys Glu Thr Gly Arg Ala Tyr Arg Pro Thr Leu
565 570 575
Leu Ile Cys Pro Thr Ser Val Leu Gly Asn Trp Leu Arg Glu Cys Gln
580 585 590
Lys Phe Ala Pro Thr Leu Arg Ala Tyr Val His His Gly Ser Asp Arg
595 600 605
Pro Lys Gly Lys Ala Phe Leu Lys Lys Val Glu Thr His Asp Leu Ile
610 615 620
Leu Thr Ser Tyr Ala Leu Leu Gln Arg Asp Arg Thr Thr Leu Gln Gln
625 630 635 640
Val Leu Trp Gln His Leu Val Leu Asp Glu Ala Gln Asn Ile Lys Asn
645 650 655
Ala Asn Thr Gln Gln Ser Gln Ala Ala Arg Glu Leu Ser Ala Gln Phe
660 665 670
Arg Ile Ala Leu Thr Gly Thr Pro Leu Glu Asn Arg Leu Leu Glu Leu
675 680 685
Trp Ser Ile Met Asp Phe Leu His Pro Gly Tyr Leu Gly His Arg Thr
690 695 700
Tyr Phe Gln His Arg Tyr Val Arg Pro Ile Glu Arg Tyr Gly Asp Thr
705 710 715 720
Thr Ser Leu Asn Ala Leu Arg Thr Tyr Val Gln Pro Phe Ile Leu Arg
725 730 735
Arg Leu Lys Thr Asp Arg Ser Ile Ile Gln Asp Leu Pro Glu Lys Gln
740 745 750
Glu Met Leu Val Tyr Cys Gly Leu Thr Leu Glu Gln Met Gln Leu Tyr
755 760 765
Thr Ala Val Val Glu Asp Ser Leu Ala Ala Ile Glu Asn Ser Gln Gly
770 775 780
Ile Gln Arg Arg Gly Asn Ile Leu Ala Thr Leu Thr Lys Leu Lys Gln
785 790 795 800
Ile Cys Asn His Pro Ala Gln Tyr Leu Lys Gln Glu Asp Tyr Ala Pro
805 810 815
Asp Arg Ser Gly Lys Leu Gln Arg Leu Ile Glu Met Leu Gln Ala Leu
820 825 830
Gln Glu Val Gly Asp Arg Ala Leu Val Phe Thr Gln Phe Ala Glu Phe
835 840 845
Gly Thr His Leu Lys Thr Tyr Leu Glu Lys Ala Leu Gln Gln Glu Val
850 855 860
Phe Phe Leu Ser Gly Arg Thr Pro Lys Ala Gln Arg Glu Leu Met Val
865 870 875 880
Glu Arg Phe Gln His Asp Pro Glu Ala Pro Arg Val Phe Ile Leu Ser
885 890 895
Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Arg Ala Asn His Val
900 905 910
Phe His Tyr Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Ser
915 920 925
Asp Arg Val Phe Arg Ile Gly Gln Ala Arg Asn Val Gln Ile His Lys
930 935 940
Phe Ile Cys Thr Gly Thr Leu Glu Glu Lys Ile His Glu Gln Ile Glu
945 950 955 960
Gln Lys Lys Ala Leu Ala Glu Met Ile Val Gly Ser Gly Glu His Trp
965 970 975
Leu Thr Glu Leu Asn Leu Asp Gln Leu Arg Gln Leu Leu Thr Leu Asp
980 985 990
Lys Glu Arg Leu Ile Thr Leu
995
<210> 103
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> motif 1
<220>
<221> VARIANT
<222> (10)..(10)
<223> /replace = "Ser"
<400> 103
Leu Ala Asp Asp Met Gly Leu Gly Lys Thr
1 5 10
<210> 104
<211> 12
<212> PRT
<213> Artificial sequence
<220>
<223> motif 1a
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Val" /replace = "Ile"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace = "Ile" /replace = "Leu"
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace = "Cys"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Met" /replace = "Val"
<220>
<221> VARIANT
<222> (8)..(8)
<223> /replace = "Ile" /replace = "Leu"
<220>
<221> VARIANT
<222> (9)..(9)
<223> /replace = "Ile" /replace = "Leu"
<220>
<221> UNSURE
<222> (10)..(10)
<400> 104
Leu Leu Val Ala Pro Thr Ser Val Val Xaa Asn Trp
1 5 10
<210> 105
<211> 8
<212> PRT
<213> Artificial sequence
<220>
<223> motif 2
<220>
<221> VARIANT
<222> (5)..(5)
<223> /replace = "Ala" /replace = "His"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Ile" /replace = "Leu"
<400> 105
Asp Glu Ala Gln Asn Val Lys Asn
1 5
<210> 106
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> motif 3
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Met"
<220>
<221> UNSURE
<222> (7)..(7)
<400> 106
Ala Leu Thr Gly Thr Pro Xaa Glu Asn
1 5
<210> 107
<211> 6
<212> PRT
<213> Artificial sequence
<220>
<223> motif 4
<220>
<221> VARIANT
<222> (1)..(1)
<223> /replace = "Ile"
<220>
<221> UNSURE
<222> (2)..(2)
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace = "Ser"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Tyr"
<400> 107
Leu Xaa Phe Thr Gln Phe
1 5
<210> 108
<211> 17
<212> PRT
<213> Artificial sequence
<220>
<223> motif 5
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Val"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Thr" /replace = "Leu"
<220>
<221> VARIANT
<222> (9)..(9)
<223> /replace = "Ile"
<220>
<221> VARIANT
<222> (10)..(10)
<223> /replace = "Ile"
<220>
<221> UNSURE
<222> (13)..(13)
<220>
<221> UNSURE
<222> (13)..(13)
<400> 108
Ser Leu Lys Ala Gly Gly Val Gly Leu Asn Leu Thr Xaa Ala Asn His
1 5 10 15
Val
<210> 109
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> motif 5a
<400> 109
Asp Arg Trp Trp Asn Pro Ala Val Glu
1 5
<210> 110
<211> 11
<212> PRT
<213> Artificial sequence
<220>
<223> motif 6
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace = "Ser"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Thr" /replace = "Val"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Tyr"
<220>
<221> VARIANT
<222> (9)..(9)
<223> /replace = "Leu"
<400> 110
Gln Ala Thr Asp Arg Ala Phe Arg Ile Gly Gln
1 5 10
<210> 111
<211> 460
<212> PRT
<213> Artificial sequence
<220>
<223> ATPase domain of SEQ ID NO: 2
<400> 111
Leu Ala Asp Asp Met Gly Leu Gly Lys Thr Pro Gln Leu Leu Ala Phe
1 5 10 15
Leu Leu His Leu Ala Ala Glu Asp Met Leu Val Lys Pro Val Leu Ile
20 25 30
Val Cys Pro Thr Ser Val Leu Ser Asn Trp Gly His Glu Ile Asn Lys
35 40 45
Phe Ala Pro Gln Leu Lys Thr Leu Leu His His Gly Asp Arg Arg Lys
50 55 60
Lys Gly Gln Pro Leu Val Lys Gln Val Lys Asp Gln Gln Ile Val Leu
65 70 75 80
Thr Ser Tyr Ala Leu Leu Gln Arg Asp Phe Ser Ser Leu Lys Leu Val
85 90 95
Asp Trp Gln Gly Ile Val Leu Asp Glu Ala Gln Asn Ile Lys Asn Pro
100 105 110
Gln Ala Lys Gln Ser Gln Ala Ala Arg Gln Leu Pro Ala Gly Phe Arg
115 120 125
Ile Ala Leu Thr Gly Thr Pro Val Glu Asn Arg Leu Thr Glu Leu Trp
130 135 140
Ser Ile Leu Glu Phe Leu Asn Pro Gly Phe Leu Gly Asn Gln Ser Phe
145 150 155 160
Phe Gln Arg Arg Phe Ala Asn Pro Ile Glu Lys Phe Gly Asp Arg Gln
165 170 175
Ser Leu Leu Ile Leu Arg Asn Leu Val Arg Pro Phe Ile Leu Arg Arg
180 185 190
Leu Lys Thr Asp Gln Thr Ile Ile Gln Asp Leu Pro Glu Lys Gln Glu
195 200 205
Met Thr Val Phe Cys Asp Leu Ser Gln Glu Gln Ala Gly Leu Tyr Gln
210 215 220
Gln Leu Val Glu Glu Ser Leu Gln Ala Ile Ala Asp Ser Glu Gly Ile
225 230 235 240
Gln Arg His Gly Leu Val Leu Thr Leu Leu Thr Lys Leu Lys Gln Val
245 250 255
Cys Asn His Pro Asp Leu Leu Leu Lys Lys Pro Ala Ile Thr His Gly
260 265 270
His Gln Ser Gly Lys Leu Ile Arg Leu Ala Glu Met Leu Glu Glu Ile
275 280 285
Ile Ser Glu Gly Asp Arg Val Leu Ile Phe Thr Gln Phe Ala Ser Trp
290 295 300
Gly His Leu Leu Lys Pro Tyr Leu Glu Lys Tyr Phe Asn Gln Glu Val
305 310 315 320
Leu Tyr Leu His Gly Gly Thr Pro Ala Glu Gln Arg Gln Ala Leu Val
325 330 335
Glu Arg Phe Gln Gln Asp Pro Asn Ser Pro Tyr Leu Phe Ile Leu Ser
340 345 350
Leu Lys Ala Gly Gly Thr Gly Leu Asn Leu Thr Arg Ala Asn His Val
355 360 365
Phe His Val Asp Arg Trp Trp Asn Pro Ala Val Glu Asn Gln Ala Thr
370 375 380
Asp Arg Ala Phe Arg Ile Gly Gln Thr Arg Asn Val Gln Val His Lys
385 390 395 400
Phe Val Cys Thr Gly Thr Leu Glu Glu Lys Ile Asn Ala Met Met Ala
405 410 415
Asp Lys Gln Gln Leu Ala Glu Gln Thr Val Asp Ala Gly Glu Asn Trp
420 425 430
Leu Thr Arg Leu Asp Thr Asp Lys Leu Arg Gln Leu Leu Thr Leu Ser
435 440 445
Ala Thr Pro Val Asp Tyr Gln Ala Glu Ala Ser Asp
450 455 460
<210> 112
<211> 1244
<212> DNA
<213> Oryza sativa
<400> 112
aaaaccaccg agggacctga tctgcaccgg ttttgatagt tgagggaccc gttgtgtctg 60
gttttccgat cgagggacga aaatcggatt cggtgtaaag ttaagggacc tcagatgaac 120
ttattccgga gcatgattgg gaagggagga cataaggccc atgtcgcatg tgtttggacg 180
gtccagatct ccagatcact cagcaggatc ggccgcgttc gcgtagcacc cgcggtttga 240
ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gtagcttccg ccggaagcga 300
gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc cttgcacgcg atacatcggg 360
atagatagct actactctct ccgtttcaca atgtaaatca ttctactatt ttccacattc 420
atattgatgt taatgaatat agacatatat atctatttag attcattaac atcaatatga 480
atgtaggaaa tgctagaatg acttacattg tgaattgtga aatggacgaa gtacctacga 540
tggatggatg caggatcatg aaagaattaa tgcaagatcg tatctgccgc atgcaaaatc 600
ttactaattg cgctgcatat atgcatgaca gcctgcatgc gggcgtgtaa gcgtgttcat 660
ccattaggaa gtaaccttgt cattacttat accagtacta catactatat agtattgatt 720
tcatgagcaa atctacaaaa ctggaaagca ataagaaata cgggactgga aaagactcaa 780
cattaatcac caaatatttc gccttctcca gcagaatata tatctctcca tcttgatcac 840
tgtacacact gacagtgtac gcataaacgc agcagccagc ttaactgtcg tctcaccgtc 900
gcacactggc cttccatctc aggctagctt tctcagccac ccatcgtaca tgtcaactcg 960
gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc aaatcaaaac caccggagaa 1020
gaatcgctcc cgcgcgcggc ggcgacgcgc acgtacgaac gcacgcacgc acgcccaacc 1080
ccacgacacg atcgcgcgcg acgccggcga caccggccgt ccacccgcgc cctcacctcg 1140
ccgactataa atacgtaggc atctgcttga tcttgtcatc catctcacca ccaaaaaaaa 1200
aaggaaaaaa aaacaaaaca caccaagcca aataaaagcg acaa 1244
<210> 113
<211> 59
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm08774
<400> 113
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gactatccac ggtaattgg 59
<210> 114
<211> 49
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm08779
<400> 114
ggggaccact ttgtacaaga aagctgggtt caatcggacg cttcggctt 49
Claims (47)
- 서열번호 2로 표시된 HpaG 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계를 포함하는, 대조구 식물에 비해 식물의 종자 수확량을 증가시키는 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항에 있어서, 상기 증가된 종자 수확량은 스트레스가 없는 조건하에서 얻어진 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 증가된 종자 수확량은 비생물적 스트레스 조건하에서 얻어진 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 핵산은 구성적 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 핵산은 녹색 조직 특이적 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
- 삭제
- HpaG 폴리펩티드를 암호화하는 재조합 핵산을 포함하는 것을 특징으로 하는, 제1항에 따른 방법에 의해 수득 가능한 종자를 포함하는 식물.
- 삭제
- 삭제
- 삭제
- 삭제
- 하기 단계를 포함하는 대조구 식물에 비해 증가된 종자 수확량을 가진 형질전환 식물의 제조 방법:(i) 제1항에 정의된 HpaG 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계; 및(ii) 식물 세포를 배양하는 단계.
- 제1항에 정의된 HpaG 폴리펩티드를 암호화하는 핵산의 증가된 발현으로 인해, 대조구 식물에 비하여 증가된 종자 수확량을 가진 형질전환 식물.
- 식물이 작물 식물 또는 단자엽 식물 또는 곡물인 것을 특징으로 하는, 제12항에 따른 형질전환 식물.
- 수확 가능한 부분이 종자인 것을 특징으로 하는, 제19항에 따른 식물의 수확 가능한 부분.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP07103271.8 | 2007-02-28 | ||
EP07103271 | 2007-02-28 | ||
EP07104197 | 2007-03-15 | ||
EP07104197.4 | 2007-03-15 | ||
US89605007P | 2007-03-21 | 2007-03-21 | |
US60/896,050 | 2007-03-21 | ||
US90951007P | 2007-04-02 | 2007-04-02 | |
US60/909,510 | 2007-04-02 | ||
PCT/EP2008/052450 WO2008104598A2 (en) | 2007-02-28 | 2008-02-28 | Plants having enhanced yield-related traits and a method for making the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090119884A KR20090119884A (ko) | 2009-11-20 |
KR101227432B1 true KR101227432B1 (ko) | 2013-01-31 |
Family
ID=39420317
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097018675A KR101227432B1 (ko) | 2007-02-28 | 2008-02-28 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
Country Status (11)
Country | Link |
---|---|
US (2) | US8440881B2 (ko) |
EP (2) | EP2711425A1 (ko) |
KR (1) | KR101227432B1 (ko) |
AR (1) | AR065552A1 (ko) |
AU (1) | AU2008220715B8 (ko) |
BR (1) | BRPI0808415A2 (ko) |
CA (1) | CA2679077A1 (ko) |
DE (1) | DE112008000521T5 (ko) |
ES (1) | ES2574981T3 (ko) |
MX (1) | MX2009008600A (ko) |
WO (1) | WO2008104598A2 (ko) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102811617A (zh) | 2010-01-22 | 2012-12-05 | 拜耳知识产权有限责任公司 | 杀螨和/或杀虫活性物质结合物 |
FR2970968A1 (fr) * | 2011-02-01 | 2012-08-03 | Isp Investments Inc | Nouveaux peptides intervenant dans la voie de signalisation scf c-kit et compositions les comprenant |
US9364414B2 (en) | 2011-02-01 | 2016-06-14 | Isp Investments Inc. | Method to protect skin from ultraviolet radiation using novel peptides involved in the improvement of microparasol organization in keratinocytes |
CN103717076B (zh) | 2011-08-10 | 2016-04-13 | 拜耳知识产权股份有限公司 | 含有特定特特拉姆酸衍生物的活性化合物组合物 |
KR20170065583A (ko) | 2014-10-01 | 2017-06-13 | 플랜트 헬스 케어, 인코포레이티드 | 과민성 반응 유발제 펩타이드 및 이의 용도 |
MX2017004278A (es) | 2014-10-01 | 2018-03-28 | Plant Health Care Inc | Peptidos inductores que tienen una caja de respuesta de hipersensibilidad interrumpida y su uso. |
US10793608B2 (en) | 2016-04-06 | 2020-10-06 | Plant Health Care, Inc. | Hypersensitive response elicitor-derived peptides and use thereof |
US11371011B2 (en) | 2016-04-06 | 2022-06-28 | Plant Health Care, Inc. | Beneficial microbes for delivery of effector peptides or proteins and use thereof |
CN109788736B (zh) | 2016-08-09 | 2022-05-27 | 先正达参股股份有限公司 | 杀昆虫蛋白 |
US11720638B2 (en) | 2019-05-30 | 2023-08-08 | Onlineseedsales Llc | Embryonic plant listing system |
US11198885B1 (en) * | 2020-09-28 | 2021-12-14 | Inari Agriculture Technology, Inc. | Genetic regulatory element |
CN112592392B (zh) * | 2020-12-28 | 2022-03-15 | 安徽科技学院 | 多效性基因SbSnf4在提高甘蔗糖产量、株高、茎杆鲜重和/或汁液量中的应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030068302A (ko) * | 2002-02-15 | 2003-08-21 | 황인규 | 잰토모나스 악소노포디스 유래의 과민성 반응 유발인자 및그 용도 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4962028A (en) | 1986-07-09 | 1990-10-09 | Dna Plant Technology Corporation | Plant promotors |
US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
AU3756889A (en) | 1988-06-01 | 1990-01-05 | The Texas A & M University System | Method for transforming plants via the shoot apex |
AU4115693A (en) | 1992-04-24 | 1993-11-29 | Sri International | In vivo homologous sequence targeting in eukaryotic cells |
US5401836A (en) | 1992-07-16 | 1995-03-28 | Pioneer Hi-Bre International, Inc. | Brassica regulatory sequence for root-specific or root-abundant gene expression |
WO1994012015A1 (en) | 1992-11-30 | 1994-06-09 | Chua Nam Hai | Expression motifs that confer tissue- and developmental-specific expression in plants |
AU687961B2 (en) | 1993-11-19 | 1998-03-05 | Biotechnology Research And Development Corporation | Chimeric regulatory regions and gene cassettes for expression of genes in plants |
EP0733059B1 (en) | 1993-12-09 | 2000-09-13 | Thomas Jefferson University | Compounds and methods for site-directed mutations in eukaryotic cells |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US7390937B2 (en) | 1996-02-14 | 2008-06-24 | The Governors Of The University Of Alberta | Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof |
JP3267237B2 (ja) | 1998-03-27 | 2002-03-18 | 松下電器産業株式会社 | 映像記録媒体および映像記録装置および映像検索装置 |
US6153741A (en) * | 1998-04-30 | 2000-11-28 | Washington University | DNA methylation gene from plants |
US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
US20030233670A1 (en) * | 2001-12-04 | 2003-12-18 | Edgerton Michael D. | Gene sequences and uses thereof in plants |
GB9914623D0 (en) * | 1999-06-23 | 1999-08-25 | Novartis Ag | Organic compounds |
CA2366104C (en) | 1999-07-22 | 2010-07-06 | Japan As Represented By Director General Of National Institute Of Agrobiological Resources, Ministry Of Agriculture, Forestry And Fisheries | Ultra-fast transformation technique for monocotyledons |
AU780117B2 (en) | 1999-08-26 | 2005-03-03 | Basf Plant Science Gmbh | Plant gene expression, controlled by constitutive plant V-ATpase promoters |
CN1126817C (zh) | 2000-12-15 | 2003-11-05 | 南京农业大学 | 一种编码植物生长调节剂的基因、表达产物及其用法 |
US20050108791A1 (en) * | 2001-12-04 | 2005-05-19 | Edgerton Michael D. | Transgenic plants with improved phenotypes |
CN1225559C (zh) | 2002-12-23 | 2005-11-02 | 南京农业大学 | 水稻黄单胞hrf3基因、重组载体及用于植物转基因育种方法 |
CN1219059C (zh) | 2002-12-23 | 2005-09-14 | 南京农业大学 | 水稻黄单胞hrf2基因、重组载体及用于植物转基因育种的方法 |
WO2004065596A2 (en) | 2003-01-21 | 2004-08-05 | Cropdesign N.V. | Use of the regulatory sequence of the rice gos2 gene for the gene expression in dicotyledonous plants or plant cells |
DE602004006477T2 (de) | 2003-02-04 | 2008-02-14 | Cropdesign N.V. | Promotor aus reis |
NL1033850C2 (nl) | 2007-05-15 | 2008-11-18 | 3Force B V | Brandersysteem met voorgemengde branders en vlam-overdrachtsmiddelen. |
-
2008
- 2008-02-28 ES ES08717232.6T patent/ES2574981T3/es active Active
- 2008-02-28 MX MX2009008600A patent/MX2009008600A/es active IP Right Grant
- 2008-02-28 AU AU2008220715A patent/AU2008220715B8/en not_active Ceased
- 2008-02-28 BR BRPI0808415-7A patent/BRPI0808415A2/pt not_active Application Discontinuation
- 2008-02-28 US US12/528,809 patent/US8440881B2/en not_active Expired - Fee Related
- 2008-02-28 AR ARP080100848A patent/AR065552A1/es unknown
- 2008-02-28 DE DE112008000521T patent/DE112008000521T5/de not_active Ceased
- 2008-02-28 KR KR1020097018675A patent/KR101227432B1/ko not_active IP Right Cessation
- 2008-02-28 WO PCT/EP2008/052450 patent/WO2008104598A2/en active Application Filing
- 2008-02-28 EP EP13195950.4A patent/EP2711425A1/en not_active Withdrawn
- 2008-02-28 EP EP08717232.6A patent/EP2118286B1/en not_active Not-in-force
- 2008-02-28 CA CA002679077A patent/CA2679077A1/en not_active Abandoned
-
2013
- 2013-04-25 US US13/861,814 patent/US20130298287A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030068302A (ko) * | 2002-02-15 | 2003-08-21 | 황인규 | 잰토모나스 악소노포디스 유래의 과민성 반응 유발인자 및그 용도 |
Also Published As
Publication number | Publication date |
---|---|
EP2711425A1 (en) | 2014-03-26 |
DE112008000521T5 (de) | 2010-03-04 |
KR20090119884A (ko) | 2009-11-20 |
EP2118286A2 (en) | 2009-11-18 |
AU2008220715B8 (en) | 2014-06-12 |
US20130298287A1 (en) | 2013-11-07 |
AU2008220715B2 (en) | 2014-05-15 |
EP2118286B1 (en) | 2016-04-13 |
US20100064386A1 (en) | 2010-03-11 |
AR065552A1 (es) | 2009-06-17 |
MX2009008600A (es) | 2009-08-21 |
WO2008104598A2 (en) | 2008-09-04 |
AU2008220715A8 (en) | 2014-06-12 |
US8440881B2 (en) | 2013-05-14 |
WO2008104598A3 (en) | 2008-11-13 |
ES2574981T3 (es) | 2016-06-23 |
CA2679077A1 (en) | 2008-09-04 |
AU2008220715A1 (en) | 2008-09-04 |
BRPI0808415A2 (pt) | 2014-07-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101227432B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR101662483B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR101255415B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101842489B (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
KR101647732B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR101255413B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101415829B (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN101365786B (zh) | 具有改良的生长特征的植物及其生产方法 | |
KR101754083B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR20120126061A (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101952441B (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101583720A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
BRPI0718977A2 (pt) | Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico | |
CN101495640A (zh) | 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法 | |
KR101429468B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101868544A (zh) | 具有提高的产量相关性状的植物和用于制备该植物的方法 | |
CN101883783A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
WO2006131547A1 (en) | Plants having improved growth characteristics and method for making the same | |
CN101563461A (zh) | 具有改良特征的植物及其制备方法 | |
CN101969759A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101778942A (zh) | 产率相关性状增强的植物及制备其的方法 | |
CN101595222B (zh) | 具有改良的种子产量相关性状的植物及其制备方法 | |
CN101668859A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101541970A (zh) | 包含作为转基因的a类itcp或clavata1(clv1)或cah3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法 | |
BRPI0619242A2 (pt) | proteìna, métodos para aumentar produção de semente e/ou aumentar taxa de crescimento de plantas e taxa de crescimento, célula vegetal, construção, e, métodos para produzir uma planta transgenica, para melhorar caracterìsticas de crescimento de plantas e caracterìsticas de crescimento em relação a correspondentes plantas do tipo selvagem, para aumentar produção vegetal, número de sementes em plantas e produção de semente em plantas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160108 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170117 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |