KR20100040939A

KR20100040939A - 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법

Info

Publication number: KR20100040939A
Application number: KR1020107004117A
Authority: KR
Inventors: 김우택; 조석근; 황인규; 문제선; 좌남수; 최옥희; 최양도; 박연일; 정석원
Original assignee: 바스프 플랜트 사이언스 게엠베하; 재단법인 작물유전체기능연구사업단
Priority date: 2007-07-31
Filing date: 2008-07-31
Publication date: 2010-04-21
Also published as: CN101952441A; EP2503000A1; MX2010001128A; CN103397049A; KR101269929B1; EP2183372A2; US20110023188A1; KR20120096924A; CN101952441B; AR067766A1; WO2009016232A8; KR20120034773A; KR101269930B1; KR101269931B1; DE112008002020T5; BRPI0813884A2; WO2009016232A3; IN2010KN00318A; WO2009016232A2; AU2008281698A1

Abstract

본 발명은 일반적으로 분자생물학 분야에 관한 것이며, PEPC (phosphoenolpyruvate carboxylase), Class III U-Box 단백질 및 PQQC 단백질로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 PEPC (phosphoenolpyruvate carboxylase), Class III U-Box 단백질 및 PQQC 단백질로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 해당 야생형 식물 또는 다른 대조구 식물에 비하여 수확량 관련 형질이 향상된 것이다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.

Description

향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법{Plants having enhanced yield-related traits and a method for making the same}

본 발명은 일반적으로 분자생물학 분야에 관한 것이며, PEPC (phosphoenolpyruvate carboxylase), Class III U-Box 단백질 및 PQQC 단백질로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 해당 야생형 식물 또는 다른 대조구 식물에 비하여 수확량 관련 형질이 향상된 것이다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.

세계 인구의 증가와 농업에 유용한 경작지의 감소는 농업의 효율성을 증가시키는 연구에 박차를 가하게 만들었다. 작물 및 원예농업 향상을 위한 전통적인 방식은 바람직한 특성을 갖는 식물체를 동정하기 위하여 선택적 육종기법을 이용한다. 그러나, 상기 선택적 육종기법에는 몇가지 약점이 있는데, 즉 노동집약적이며 양친으로부터 원하는 형질이 항상 전해지는 것이 아닌 이종의 유전적 요소를 갖는 식물로 귀착된다는 것이다. 분자생물학의 진보는 인간이 동물 및 식물의 생식질 (germplasm)을 변형하게 허용했다. 식물유전공학은 유전물질 (전형적으로 DNA 또는 RNA 형태)의 분리와 조작 및 이 유전물질을 식물체 내로 도입하게 했다. 상기 기술은 다양한 향상된 경제적, 농업적, 원예적 형질을 갖는 작물 또는 식물을 제공하는 능력이 있다.

특히 경제적으로 중요한 형질은 증가된 수확량이다. 수확량은 보통 작물로부터 경제적 가치의 측정할 수 있는 산물로 정의된다. 이는 양 및/또는 질의 면에서 정의될 수 있다. 수확량은 몇가지 요인에 직접적으로 의존되는데, 예를 들면 기관의 수와 크기, 식물체 형상 (예를 들면, 가지의 수), 종자 생산, 잎의 노화 등이다. 뿌리 발달, 양분 흡수, 스트레스 내성, 및 초기 활력 또한 수확량 결정에 중요한 요인일 수 있다. 상기 요인들을 최적화하는 것이 작물 수확량 증가에 기여할 수 있다.

많은 식물의 종자는 인간과 동물의 영양에 중요하므로 종자 수확량이 특히 중요한 형질이다. 옥수수, 벼, 밀, 캐놀라 및 대두와 같은 작물이 종자 자체의 직접적인 소비 또는 가공종자로 육성된 육류 소비를 통해서 전체 인간 칼로리 흡수량의 절반 이상을 차지한다. 상기 작물들은 설탕, 기름 및 산업적 가공공정에 사용되는 많은 종류의 대사물의 재료이기도 하다. 종자는 배 (어린 줄기와 뿌리의 근원) 및 배유 (발아 동안 및 실생의 초기 생장 동안 배 생장의 양분 공급원)를 포함한다. 종자 발달에는 많은 유전자가 관여되며, 뿌리, 잎 및 줄기로부터 생장하는 종자로 대사물의 이동이 필요하다. 특히 배유는 탄수화물, 오일 및 단백질의 대사 전구체를 동화하여, 이들을 알곡을 채우기 위한 저장성 고분자로 합성한다.

많은 작물에 있어 또 다른 중요한 형질은 초기 활력 (early vigour)이다. 초기 활력을 향상시키는 것은 온대 및 열대 벼 품종에 있어 현대 벼 육종의 중요한 목표이다. 긴 뿌리는 물에 파종하는 벼에서는 적절하게 토양에 박히기 위하여 중요하다. 벼를 직접 논에 파종한 곳에서와 식물이 물 밖으로 급속히 나와야 하는 곳에서는 긴 어린 줄기가 강도와 연관되어 있다. 조파지에서는 긴 중배축과 자엽초가 실생이 나오기에 좋다. 식물체가 초기활력을 갖게 하는 기술은 농업에서 매우 중요하다. 예를 들면, 빈약한 초기 활력은 유럽 연안국의 콘벨트(Corn Belt) 유전자원에 기반한 옥수수 (Zea mays L.) 잡종의 도입에 제한이 되었다.

추가적으로 중요한 형질은 향상된 비생물적 스트레스 내성이다. 비생물적 스트레스는 대다수 주요 작물의 평균 수확량을 50% 이상 감소시키는 전세계적인 작물 손실의 주요 원인이다 (Wang 등, Planta (2003) 218: 1-14). 비생물적 스트레스는 건조, 염분, 극단적인 기온, 화학적 독성 및 산화적 스트레스에 의해 야기될 수 있다. 비생물적 스트레스에 대한 식물의 내성을 향상시키는 것은 전세계의 농부들에게 매우 경제적 가치가 있는 것이며, 불리한 상황에서 그리고 작물재배가 가능하지 않은 곳에서도 작물재배를 가능하게 한다.

작물 수확량은 따라서 상기 요인들 중 어느 하나를 최적화함으로써 증가시킬 수 있다.

최종 목적에 따라, 임의의 수확량 형질의 변형이 다른 것에 비해 월등히 유리할 수 있다. 사료 또는 목재 생산, 또는 바이오연료 생산과 같은 경우의 적용에 대해 예를 들면, 식물체의 영양기관 부분의 증가가 바람직하며, 곡분, 전분 또는 유지 생산과 같은 경우에는 종자에 관련된 매개변수의 증가 또는 향상이 특히 바람직하다. 종자 매개변수 중에서도 용도에 따라 특정한 일부의 것이 다른 것에 비해 훨씬 중요하다. 종자 크기의 증가 또는 종자 수의 또는 임의의 다른 종자관련 형질의 증가의 형태로 다양한 기작이 종자 수확량 증가에 영향을 미칠 수 있다.

식물의 수확량 (종자 수확량 및/또는 생물량(biomass))의 증가는 세포 주기 또는 식물 생장 또는 방어 기작에 관련된 다양한 신호전달 경로와 같은 식물의 내재적 생장 기작의 변형을 통해서 가능하다.

하기로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물체에서의 발현을 조절함으로써, 식물의 수확량 관련 형질이 향상될 수 있다는 것이 밝혀졌다:

PEPC (phosphoenolpyruvate carboxylase),

Class III U-Box 단백질 및

PQQC 단백질.

포스포에놀피루베이트 카르복실라제 (또한 PEP 카르복실라제, PEPCase, PEPC로 알려짐; EC 4.1.1.31)는 포스포에놀피루베이트 (PEP)에 CO₂를 부가하여 4-탄소 화합물인 옥살로아세테이트 형성을 촉매하는 카르복시-리아제(carboxy-lyases) 패밀리에 속하는 효소이다.

PEP + CO₂ → 옥살로아세테이트 + Pi

상기 반응은 광합성에서 핵심 역할을 하는 소위 "CAM" 및 "C4" 식물에 있어 탄소고정 과정에서 일어난다. 식물 외에도, 상기 효소는 또한 일부 세균에서는 발견되나, 동물 또는 균류에서는 발견되지 않는다.

PEP 카르복실라제를 통한 탄소 고정은 유용한 CO₂를 저장되거나 또는 식물 세포 사이를 왕래할 수 있는 4-탄소 화합물 (옥살로아세테이트, 이는 이후 말레이트로 전환)로 동화한다. 상기 과정은 공기와의 접촉에 의한 초기 CO₂ 고정과 광합성의 광 독립적 반응 중에 RuBisCO에 의한 당(sugars)으로의 2차 CO₂ 고정이 서로 분리되게 한다.

매우 건조한 조건에서 생장에 적응한 다육성 CAM 식물에 있어, PEP 카르복실라제는 식물체가 기공을 열어 가스 교환을 하는 밤에 CO₂를 고정한다. 낮에 식물은 수분을 보존하기 위해 기공을 폐쇄하고, 밤에 생산한 저장 화합물로부터 잎 내부로 CO₂를 방출한다. 상기 과정은 하루 중에 열린 기공을 통해 수분 손실 없이 광합성을 수행함으로써 식물이 건조 기후에 살아남게 한다.

C4 식물, 예를 들면 옥수수에 있어, PEP 카르복실라제는 CO₂를 잎의 엽육조직의 세포 내에 고정하여, 생성된 4-탄소 화합물은 유관속초세포로 이동하여, 여기서 RuBisCO에 의한 고정을 위해 CO₂를 방출한다. 따라서, 두 과정은 공간적으로 분리되어, 광호흡을 우회하여 RuBisCO가 저산소 환경에서 작동하게 한다. 광호흡은 RuBisCO의 내재적인 옥시게나아제 활성으로 인하여 일어나며, 이 과정에서 상기 효소는 이산화탄소 대신 산소를 사용하여, 탄소를 당으로 통합하거나 또는 ATP를 생성하지 않는다. 이처럼, 상기 과정은 식물에서는 낭비적인 반응이다. 비교하자면, PEP 카르복실라제를 통한 C4 탄소 고정이 더욱 효율적이다. Radchuk 등 2007 (The Plant Journal 51, 819-839)는 비시아 나르보넨시스(Vicia narbonensis) 종자에서 코리네박테리움(Corynebacterium) PEPC의 과발현이 종자 대사를 변형시켜 탄소를 유기산으로 이끌어, 종자 저장용량을 더 커지제 하고 단백질 함량을 증가시켰다고 보고한 바 있다.

U-box는 효모에서부터 인간에까지 존재하는 ~70 개 아미노산의 도메인이다. U-box 단백질의 원형(prototype)인 효모 Ufd2는 인공적인 기질에 유비퀴틴쇄(ubiquitin chain) 형성을 촉매하기 위해 유비퀴틴 활성화 효소(ubiquitin-activating enzyme: E1), 유비퀴틴 결합 효소(ubiquitin-conjugating enzyme: E2), 및 E3와 협력하는 ubiquitin chain assembly factor (E4)로서 동정되었다 (Hatakeyama 등 2003 Biochemical and Biophysical Research Communications 302, pp 635-645). Azevedo 등 2001 (Trends in Plant Science Vol. 6 No. 8)은 UFD2가 효모의 유일한 U-box 단백질이며, 인간 게놈과 캐노합디티스 엘레강스(Caenorhabditis elegans) 및 드로소피필라 멜라노가스타(Drosophila melanogaster) 게놈에서 소수만이 동정되긴 하였으나, 데이터베이스상에서 아라비돕시스(Arabidopsis)에서 U- box를 포함하는 것으로 예측되는 37 개의 단백질이 검색된다고 보고한다. 도메인 분석에 근거하여, 식물 U-box (PUB) 단백질은 5 가지의 별개의 종류(subclass)를 이루는 것으로 밝혀졌다. Class III는 ~14% 류신(leucine) 잔기를 포함하는 도메인을 갖는 12 멤버로 이루어진 것으로 밝혀졌다. Class III 멤버의 U-box 도메인은 다른 Class 멤버에서의 위치와는 대조적으로 N-말단 영역에서 발견되었다.

U-box 단백질은 유비퀴틴화 기구(ubiquitination machinery)에서 E3 또는 E4 인자인 것으로 예측된다.

Cho 등 2006 (Plant Physiology, December 2006, Vol. 142, pp.1664-1682)은 수분 스트레스를 받은 고추 (Capsicum annuum L. cv Pukang)에서 N-말단 영역에 하나의 U-box 모티프를 포함하는 단백질을 암호화하는 추정되는 U-box 단백질 1 (CaPUBI)을 분리했다. 인비트로(In vitro) 유비퀴틴화(ubiquitination) 및 자리지정 돌연변이유발(site-directed mutagenesis) 분석은 CaPUB1이 E3 유비퀴틴 리가아제(ubiquitin ligase) 활성을 가지며 U-box 모티프가 효소 활성에 필수적이라는 것을 나타냈다. Cho 등은 콜리플라워 모자이크 35S 프로모터의 조절 하에서 아라비돕시스에서 CaPUB1를 과발현시켰다. 형질전환 아라비돕시스 식물은 현저하게 긴 하배축(hypocotyls) 및 뿌리를 가지고, 야생형 보다 더욱 빨리 자라, 조기 추대(bolting) 표현형으로 되는 것으로 보고되었다. 자엽의 형태는 암소에서 유사한 것으로 밝혀졌다. 35S::CaPUB1의 뿌리에는 작은 크기의 세포의 수가 증가하여 피층, 내피 및 중심주의 세포층에 무질서하게 고도로 밀집되어 있었다. 형질전환 식물은 또한 수분 스트레스 및 약한 염도에 대한 민감성이 증가하였다.

PqqC는 임의의 명백한 보조인자(cofactor) 없이 일어나는 반응에서 3a-(2-아미노-2-카르복시에틸)-4,5-디옥소-4,5,6,7,8,9-헥사히드로퀴놀린-7,9-디카르복실산의 PQQ로의 고리화(cyclization) 및 산화를 촉진한다. 피롤로퀴놀린 퀴논[4,5-디히드로-4,5-디옥소-1H-피롤로-[2,3-f]퀴놀린-2,7,9-트리카르복실산; PQQ]은 몇 세균 탈수소효소(dehydrogenases)에 대해 산화환원 보조인자(redox cofactor)로 역할을 하는 방향족, 3환계 오쏘-퀴논(tricyclic ortho-quinone)이다. 가장 잘 알려진 예 중에는 메탄올 탈수소효소 및 포도당 탈수소효소가 있다. PQQ는 뉴클레오티드- 및 플라빈(flavin)-의존성 보조인자에 이어 산화환원 보조인자의 3 번째 종류(class)로 인식되어 온 퀴논 보조인자의 패밀리에 속한다. 비록 식물 및 동물이 PQQ 자체를 생산하지는 않으나, PQQ가 인체 우유에 존재하며 항산화능이 있는 것으로 인해 상당한 관심을 유발하였다.

PQQ 합성에 관련된 유전자는 아시네토박터 칼코아세티쿠스(Acinetobacter calcoaceticus), 클렙시엘라(Klebsiella), 슈도모나스 플루오레센스(Pseudomonas Fluorescens), 메틸로박테리움 오르가노필룸(Methylobacterium organophilum) 및 메틸로박테리움 엑스토르켄스(Methylobacterium extorquens)에서 클로닝된 바 있다.

PqqC는 PQQ 생합성의 마지막 단계를 촉매한다. PqqC는 겔여과 실험에서 증명된 바와 같이, 용액 상에서 호모다이머(homodimer)를 형성하는 251 개 잔기로 된 단백질 (분자량 28.91 kDa)이다. PqqC는 7 번째 소수성 나선을 부분적으로 에워싸는 6개의 원형으로 배열된 나선을 가진 촘촘한 7개 나선 다발로 접힌다. PqqC의 구조를 분석하여 보면 7 개의 나선이 활성부위의 공간(cavity)에 대한 스캐폴드(scaffold)를 제공하는 것으로 보인다. 상기 공간(cavity)은 다른 세균으로부터 PqqC 단백질 내에서 고도로 보존된 42 개의 주로 친수성 및 방향족 잔기로 되어 있다. 상기 공간은 뚜렷한 전반적인 양전하를 보인다.

발명의 요약

놀랍게도, 이제 하기로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절로 수확량 관련 형질이 향상된, 특히 대조구 식물에 비해 수확량이 증가된 식물을 제공하는 것이 밝혀졌다:

PEPC (phosphoenolpyruvate carboxylase),

Class III U-Box 단백질 및

PQQC 단백질.

특히 놀라운 것은 수확량의 증가가 Radchuck 등 2007의 교시로부터 기대된 것처럼 더욱 큰 종자의 형태로 나타나는 것이 아니라, 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서(panicle)당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가를 포함하나 이에 제한되지 않는 일련의 형태인 각각 대조구 식물에 비해 변경된 수확량 관련 형질로 나타난다는 것이다.

일 구현예에 따라, 본 발명에서는 PEPC 단백질을 암호화하는 핵산의 식물에서의 발현을 조절하는 단계를 포함하는, 대조구 식물에 비해 식물 수확량 관련 형질을 향상시키는 방법을 제공한다.

일 구현예에 따라, 본 발명에서는 Class III U-Box 단백질을 암호화하는 핵산의 식물에서의 발현을 조절하는 단계를 포함하는, 대조구 식물에 비해 식물 수확량 관련 형질, 특히 증가된 수확량을 향상시키는 방법을 제공한다.

일 구현예에 따라, 본 발명에서는 PQQC 단백질을 암호화하는 핵산의 식물에서의 발현을 조절하는 단계를 포함하는, 대조구 식물에 비해 식물 수확량 관련 형질, 특히 증가된 수확량을 향상시키는 방법을 제공한다.

정의

폴리펩티드(들)/단백질(들)

용어 "폴리펩티드" 및 "단백질"은 본 발명에서 상호 교체 사용되며, 펩티드 결합으로 연결된 임의의 길이의 아미노산의 중합형을 말한다.

폴리뉴클레오티드(들)/핵산(들)/ 핵산서열 (들)/뉴클레오티드 서열(들)

용어 "폴리뉴클레오티드(들)", "핵산서열(들)", "뉴클레오티드 서열(들)", "핵산(들)", "핵산분자"는 본 발명에서 상호 교체 사용되며, 임의의 길이의 미분지된 중합형인, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 양자의 조합인 뉴클레오티드를 말한다.

대조구 식물(들)

적절한 대조구 식물의 선택은 실험 셋업에서는 통상적인 부분이며, 상기 식물의 야생형 또는 목적 유전자가 없는 해당 식물을 실험에 포함할 수 있다. 대조구 식물은 전형적으로 평가되는 식물과 동일한 식물 종 또는 동일한 변종이다. 대조구 식물은 또한 평가되는 식물의 공접합자(nullizygote)일 수 있다. 공접합자는 분리에 의하여 트랜스진이 없는 개체이다. 본 발명에서 사용된 "대조구 식물"은 전체 식물뿐 아니라 종자 및 종자의 일부분을 포함한 식물의 일부분을 말한다.

상동체 (들)

단백질의 "상동체"는 문제의 변형되지 않은 단백질에 대해 아미노산 치환, 결실 및/또는 삽입을 가지며, 이들이 유래되는 변형되지 않은 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다.

결실은 단백질로부터 하나 이상의 아미노산의 제거를 말한다.

삽입은 단백질 내의 예정된 위치에 하나 이상의 아미노산 잔기가 도입되는 것을 말한다. 삽입은 하나 또는 다수 아미노산의 서열 내 삽입뿐 아니라 N-말단 및/또는 C-말단 융합을 포함할 수 있다. 일반적으로 아미노산 서열 내 삽입은 N- 또는 C-말단 융합보다 작을 것이며, 약 1 내지 10 개 정도의 잔기이다. N- 또는 C-말단 융합 단백질 또는 펩티드의 예는 효모 two-hybrid 시스템에 사용된 전사 활성제의 결합 도메인 또는 활성화 도메인, 파아지 외피 단백질, (히스티딘)-6-태그, 글루타치온 S-전달효소-태그, 단백질 A, 말토스-결합 단백질, 디히드로폴레이트 환원효소, Tag·100 에피토프, c-myc 에피토프, FLAG^®에피토프, lacZ, CMP (칼모둘린-결합 펩티드), HA 에피토프, 단백질 C 에피토프 및 VSV 에피토프를 포함한다.

치환은 유사한 성질 (유사한 소수성, 친수성, 항원성, 알파 나선 또는 베타 병풍 구조를 형성하거나 파괴하는 경향 같은)을 갖는 다른 아미노산으로 단백질의 아미노산의 치환을 말한다. 아미노산 치환은 전형적으로 한 잔기의 치환이나, 폴리펩티드에 부여된 기능적 제약에 따라 클러스터될 수도 있으며; 삽입은 보통 약 1 내지 10 개 정도의 아미노산 잔기가 삽입된다. 큰 단백질의 경우, 삽입의 수는 50, 100, 150, 200 또는 그 이상일수도 있다. 아미노산 치환은 바람직하게는 보존적 아미노산 치환이다. 보존적 치환 표는 당업계에 주지되어 있다 (예를 들면, Creighton (1984) Proteins, W.H. Freeman 및 Company (Eds) 및 하기 표 1 참고).

보존된 아미노산 치환의 예

잔기	보존적 치환	잔기	보존적 치환
Ala	Ser	Leu	Ile; Val
Arg	Lys	Lys	Arg; Gln
Asn	Gln; His	Met	Leu; Ile
Asp	Glu	Phe	Met; Leu; Tyr
Gln	Asn	Ser	Thr; Gly
Cys	Ser	Thr	Ser; Val
Glu	Asp	Trp	Tyr
Gly	Pro	Tyr	Trp; Phe
His	Asn; Gln	Val	Ile; Leu
Ile	Leu, Val

아미노산 치환, 결실 및/또는 삽입은 고체상 펩티드 합성 등과 같은 당업계에 주지된 펩티드 합성 기술을 이용하거나 또는 재조합 DNA 조작에 의해 용이하게 수행될 수 있다. 단백질의 치환, 삽입 또는 결실 변이체를 제조하기 위한 DNA 서열 조작 방법은 당업계에 주지되어 있다. 예를 들면, DNA 상의 예정된 위치에 치환 돌연변이를 제조하기 위한 기술은 당업자에게 주지되어 있으며, M13 돌연변이유발, T7-Gen 시험관 내 돌연변이유발 (USB, Cleveland, OH), QuickChange 자리지정 돌연변이유발 (Stratagene, San Diego, CA), PCR-매개된 자리지정 돌연변이유발 또는 다른 자리지정 돌연변이유발 프로토콜을 포함한다.

유도체

"유도체"는 목적 단백질과 같이 자연발생 형태의 단백질의 아미노산 서열에 비교하여, 자연적으로 발생하지 않는 아미노산 잔기로 아미노산의 치환 또는 자연적으로 발생하지 않는 아미노산 잔기의 첨가를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 단백질의 "유도체"는 또한 자연발생 형인 폴리펩티드의 아미노산 서열에 비교하여 자연적으로 발생하는 변형된 (글리코실화, 아실화, 프레닐화, 인산화, 미리스토일화, 황화 등) 또는 자연적으로 발생하지 않는 변형된 아미노산 잔기를 포함하는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 유도체는 또한 원래의 아미노산 서열에 비교하여 하나 이상의 비아미노산의 치환 또는 첨가를 포함할 수 있는데, 예를 들면, 이의 검출을 용이하게 하기 위해 결합되는 리포터 분자와 같은 아미노산 서열에 공유적으로 또는 비공유적으로 결합한 리포터 분자나 다른 리간드, 및 자연적으로 발생하는 단백질의 아미노산 서열에 대해 비자연적으로 발생하는 아미노산 잔기이다. 더욱이, "유도체"는 또한 단백질의 자연적으로 발생하는 형태와 FLAG, HIS6 또는 티오레독신 같은 태깅 펩티드 (태깅펩티드에 관하여 Terpe, Appl. Microbiol. Biotechnol. 60, 523-533, 2003 참조)와의 융합을 포함한다.

오쏘로그 (들)/ 패럴로그 (들)

오쏘로그 및 패럴로그는 유전자의 조상관계를 기재하는데 사용되는 진화적 개념을 포함한다. 패럴로그는 조상 유전자의 복제로 생긴 동일한 종 내의 유전자이고; 오쏘로그는 종분화로 인하여 공통 조상 유전자로부터 유래한 다른 생물체의 유전자이다.

도메인

용어 "도메인"은 진화적으로 연관된 단백질의 서열 정렬 시 특정 위치에서 보존된 아미노산의 세트이다. 다른 위치의 아미노산은 상동체들 간에 다양할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 기능에 필수적일 것인 아미노산을 나타낸다. 단백질 상동체 패밀리의 정렬된 서열상에서 고도로 보존된 부분은 임의의 문제되는 폴리펩티드가 이전에 동정된 폴리펩티드 패밀리에 속하는지를 결정하는 동정부위로 사용될 수 있다.

모티프/일치 서열( consensus sequence)/시그너처( Signature )

용어 "모티프", "일치 서열" 또는 "시그너처"는 진화적으로 연관된 단백질의 서열에 있어 짧은 보존된 영역을 말한다. 모티프는 흔히 도메인의 고도로 보존된 부분뿐만 아니라, 도메인의 일부만을 포함할 수도 있거나 또는 보존된 도메인 외부에 있을 수도 있다 (만일 모티프의 아미노산 모두가 지정된 도메인 외부에 있으면).

혼성화

본 발명에 정의된 용어 "혼성화"는 사실상 상동인 상보적인 뉴클레오티드 서열이 서로 어닐링하는 과정이다. 혼성화 과정은 전적으로 용액 내에서, 즉 상보적인 양 핵산이 용액 내에 있을 때 일어날 수 있다. 혼성화 과정은 또한 상보적인 핵산의 하나가 자성 비드, Sepharose 비드 또는 어떤 다른 수지(resin) 같은 기질에 고정되었을 때도 일어날 수 있다. 혼성화 과정은 더욱이 상보적인 핵산 중의 하나가 니트로셀룰로스 또는 나일론 막 같은 고체 지지체에 고정되었거나 또는 사진석판술에 의하여 규산질의 유리 지지체 (핵산 어레이, 마이크로어레이 또는 핵산 칩이라 알려짐)에 고정되었을 때에도 일어날 수 있다. 혼성화가 일어나게 하기 위하여, 핵산분자는 일반적으로 열적으로 또는 화학적으로 변성되어 이중가닥을 2개의 단일가닥으로 녹이고/녹이거나 단일가닥 핵산으로부터 헤어핀 또는 기타 이차 구조를 제거한다.

용어 "스트린전시"는 혼성화가 일어나는 조건을 말한다. 혼성화의 스트린전시는 온도, 염 농도, 이온 강도 및 혼성화 완충액 조성 같은 조건의 영향을 받는다. 일반적으로 낮은 스트린전시 조건은 정해진 이온강도 및 pH에서 특정 서열에 대한 용해점 (T_m) 보다 약 30℃ 낮은 온도가 선택된다. 중간 스트린전시 조건은 T_m 보다 20℃ 낮은 온도일 때, 높은 스트린전시 조건은 T_m 보다 10℃ 낮은 온도이다. 높은 스트린전시 혼성화 조건은 전형적으로 표적 핵산 서열에 높은 서열 유사성을 갖는 혼성화 서열을 분리하기 위해 사용된다. 그러나, 핵산은 서열 상의 차이가 있더라도 유전암호의 축퇴로 인하여 실제로는 동일한 폴리펩티드를 코딩할 수 있다. 그러므로, 중간 스트린전시 혼성화 조건은 종종 상기 핵산분자를 동정하는데 필요할 수 있다.

Tm은 정해진 이온 강도 및 pH 하에서 표적 서열의 50%가 완벽하게 매치된 탐침에 혼성화하는 온도이다. Tm은 용액 조건, 염기 조성 및 탐침의 길이에 의존적이다. 예를 들면, 보다 긴 서열일수록 보다 높은 온도에서 특이적으로 혼성화한다. 최대 혼성화율은 Tm보다 약 16℃에서 32℃까지 낮을 때 얻어진다. 1가 양이온이 혼성액에 있으면 두 핵산 가닥 간에 정전기적 반발이 감소하여 혼성화가 촉진되고; 이 효과는 0.4M (보다 높은 농도에서는 이 효과가 무시될 수 있다)까지의 나트륨 농도에서 보여진다. 포름아미드는 DNA-DNA 및 DNA-RNA 이중가닥의 용해 온도를 포름아미드 퍼센트 당 0.6 내지 0.7℃ 내리며, 50% 포름아미드의 첨가는 혼성화율은 낮아지더라도 혼성화가 30 내지 45℃에서 일어나게 한다. 염기쌍 미스매치는 혼성화율 및 이중가닥의 온도 안정성을 감소시킨다. 평균적으로 그리고 큰 탐침에 대하여, Tm은 염기 미스매치 % 당 약 1℃ 감소한다. Tm은 혼성체의 유형에 따라 하기의 식으로 계산할 수 있다:

1) DNA-DNA 혼성체 (Meinkoth 및 Wahl, Anal. Biochem., 138: 267-284, 1984):

T_m=81.5℃+16.6xlog₁₀[Na⁺]^a+0.41x%[G/C^b]-500x[L^c]^-1-0.61x%포름아미드

2) DNA-RNA 또는 RNA-RNA 혼성체:

Tm= 79.8 + 18.5 (log₁₀[Na⁺]^a)+0.58(%G/C^b)+11.8(%G/C^b)²-820/L^c

3) 올리고-DNA 또는 올리고-RNA^d 혼성체:

20개 뉴클레오티드 미만에 대해: T_m=2(I_n)

20-35개 뉴클레오티드에 대해: T_m=22+1.46(I_n)

^a 또는 다른 1가 양이온에 대하여, 0.01-0.4 M 범위 내에서만 정확.

^b30% 내지 75% 범위 내에서 %GC에 대하여만 정확.

^c L = bp으로 표시된 이중가닥의 길이.

^d 올리고, 올리고뉴클레오티드; I_n,= 효과적인 프라이머 길이 = 2x(G/C의 수)+(A/T의 수)

비특이적 결합은 예를 들면, 단백질 함유 용액으로 막을 차단하고, 혼성화 완충액에 이종의 RNA, DNA, 및 SDS를 첨가하고, RNAse 처리하는 것과 같은 많은 알려진 기술 중 임의의 하나를 사용하여 조절할 수 있다. 비상동 탐침에 대하여, 일련의 혼성화 과정은 (i) 점차적으로 어닐링 온도를 낮추거나 (예를 들면 68℃에서 42℃까지) (ii) 점차적으로 포름아미드 농도를 낮추거나 (예를 들면 50%에서 0%까지) 중 하나를 변화시킴으로써 수행될 수 있다. 당업자는 혼성화 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.

혼성화 조건 외에, 혼성화의 특이성은 또한 전형적으로 혼성화 후 세척 기능에 의존한다. 비특이적 혼성화로 생기는 백그라운드를 제거하기 위하여, 시료를 묽은 염 용액으로 세척한다. 이런 세척의 결정적인 요인은 최종 세척액의 이온 강도 및 온도를 포함한다: 염 농도가 낮고 세척 온도가 높을수록 세척의 스트린전시는 높아진다. 세척 조건은 전형적으로 혼성화 스트린전시에서 또는 보다 낮게 수행된다. 양성 혼성화는 적어도 백그라운드의 2 배의 신호로 나타난다. 일반적으로 핵산 혼성화 분석이나 유전자 증폭 검출 과정에 적절한 스트린전트 조건은 상기와 같다. 다소 스트린전트한 조건 또한 선택될 수 있다. 당업자는 세척 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.

예를 들면, 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 전형적인 높은 스트린전시 혼성화 조건은 65℃, 1x SSC에서 또는 42℃, 1x SSC 및 50% 포름아미드에서 혼성화 후 65℃, 0.3x SSC에서 세척하는 것이다. 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 중간 스트린전시 혼성화 조건은 50℃, 4x SSC 또는 40℃, 6x SSC 및 50% 포름아미드에서 혼성화 후, 50℃, 2x SSC에서 세척하는 것이다. 혼성체의 길이는 혼성화하는 핵산에 대해 예측된 길이이다. 알려진 서열의 핵산이 혼성화 될 때 혼성체의 길이는 서열을 정렬하고 본 발명에서 기재된 보존된 영역을 동정하면 결정될 수 있다. 1X SSC는 0.15M NaCl 및 15mM 소듐 시트레이트이며; 혼성액 및 세척액에는 부가적으로 5x Denhardt's reagent, 0.5-1.0% SDS, 100 ㎍/ml 변성된, 단편화된 연어 정자 DNA, 0.5% 소듐 피로포스페이트가 포함된다.

스트린전시 수준을 결정하기 위해서는 [Sambrook 등 (2001) Molecular Cloning: laboratory manual, 3^rdEdition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989, 매년 개정됨)]을 참조하면 된다.

스플라이스 변이체

본 발명에서 사용된 용어 "스플라이스 변이체"는 선택된 인트론 및/또는 엑손이 절단되거나, 치환되거나, 대체되거나, 부가된, 또는 인트론이 짧아지거나 길어진 핵산 서열의 변이체를 포함한다. 상기 변이체는 단백질의 생물학적 활성이 사실상 보유되며; 이는 단백질의 기능적 단편을 선택적으로 보유함으로써 달성될 수 있다. 상기 스플라이스 변이체는 자연계에서 발견되거나 인공적으로 만들 수도 있다. 상기 스플라이스 변이체를 예측하고 분리하는 방법은 당업계에 주지되어 있다 (예를 들면 Foissac 및 Schiex (2005) BMC Bioinformatics 6: 25 참고).

대립인자 변이체

대립인자 또는 대립인자 변이체는 동일한 염색체 상에 위치한 해당 유전자의 또 다른 형태이다. 대립인자 변이체는 작은 삽입/결실 다형성 (삽입/Deletion Polymorphisms, INDELs)뿐 아니라 단일염기다형성 (Single Nucleotide Polymorphisms, SNPs)을 포함한다. INDELs의 크기는 보통 100 bp 미만이다. SNPs 및 INDELs이 대부분의 생물체의 자연적으로 발생하는 다형 균주에 있어 가장 큰 서열 변이체를 형성한다.

유전자 셔플링 ( shuffling )/방향진화( directed evolution )

유전자 셔플링 또는 방향진화는 DNA 셔플링의 반복에 이은 변형된 생물학적 활성을 갖는 단백질을 코딩하는 핵산이나 그 일부분의 변이체 생성을 위해 적절한 탐색 및/또는 선발로 구성된다 (Castle 등, (2004) Science 304(5674): 1151-4; 미국 특허 제5,811,238호 및 제6,395,547호).

조절 인자/조절 서열/프로모터

용어 "조절 인자", "조절 서열" 및 "프로모터"는 본 발명에서 상호 호환적으로 사용되며, 결합되는 서열의 발현에 영향을 미칠 수 있는 조절 핵산 서열을 말하는 것으로 사용된다. 용어 "프로모터"는 전형적으로 유전자의 전사개시점의 업스트림에 있으며, RNA 중합효소 및 다른 단백질의 인지 및 결합에 관여하여 작동가능하게 연결된 핵산의 전사를 지시하는 핵산 조절 서열을 말한다. 상기 언급한 용어에는 전형적인 진핵세포 게놈 유전자 (CCAAT 박스 서열이 있거나 없이 정확한 전사 개시에 필요한 TATA 박스를 포함) 및 발달 및/또는 외부 자극에 반응하여 또는 조직 특이적 방식으로 유전자 발현을 변경하는 부가적인 조절 인자 (즉, 업스트림 활성화 서열, 인핸서 및 사일런서)로부터 유래한 전사 조절 서열이 포함된다. 또한 상기 용어에는 -35 박스 서열 및/또는 -10 박스 전사 조절 서열을 포함하는 전형적인 원핵생물 유전자의 전사 조절 서열이 포함된다. 용어 "조절인자"는 또한 세포, 조직 또는 기관에 핵산분자의 발현을 하게 하거나 활성화 또는 증가시키는 합성 융합 분자 또는 유도체를 포함한다.

"식물 프로모터"는 식물 세포에 코딩 서열 단편의 발현을 중재하는 조절 인자를 포함한다. 따라서, 식물 프로모터는 식물에서 유래해야 하는 것은 아니며, 예를 들면 식물 세포에 침범하는 바이러스 또는 미생물 기원일 수도 있다. "식물 프로모터"는 식물 세포, 예를 들면, 본 발명의 방법에서 발현되며, 본 발명에 기재된 핵산 서열로 형질전환된 식물 기원일 수 있다. 이는 또한 "식물" 종결신호 같은 "식물" 조절 신호에도 해당된다. 본 발명의 방법에 유용한 뉴클레오티드 서열의 프로모터 업스트림은 프로모터, 개방형해독틀 (ORF) 또는 종결신호 또는 ORF로부터 떨어져 있는 다른 3' 조절 영역 같은 3'-조절 영역의 기능성 또는 활성을 방해하지 않고 하나 이상의 뉴클레오티드 치환(들), 삽입(들) 및/또는 결실(들)에 의하여 변형될 수 있다. 더욱이 서열의 변형에 의하여 프로모터 활성은 증가될 수 있거나, 또는 보다 활성이 큰 프로모터, 심지어 이종 생물체의 프로모터로 완전히 대체되는 것도 가능하다. 식물체에서의 발현을 위해서는 상기 언급된 것처럼 핵산분자는 올바른 시점에 요구되는 공간적 발현 양상으로 유전자를 발현하는 적절한 프로모터에 작동가능하게 연결되거나 프로모터를 포함해야 한다.

기능적으로 동등한 프로모터 동정을 위해, 후보 프로모터의 프로모터 강도 및/또는 발현 양상은 예를 들면, 리포터 유전자에 프로모터를 작동하게 연결하여 다양한 식물 조직에서 리포터 유전자의 발현 수준 및 양상을 검정함으로써 분석할 수 있다. 적절한 주지된 리포터 유전자는 예를 들면 베타-글루쿠로니다제 또는 베타-갈락토시다제를 포함한다. 프로모터 활성은 베타-글루쿠로니다제 또는 베타-갈락토시다제의 효소 활성을 측정함으로써 검정된다. 프로모터 강도 및/또는 발현 양상은 기준 프로모터의 것에 비교된다 (본 발명의 방법에 사용된 것과 같은 것). 다르게는, 프로모터 강도는 방사선 사진의 농도계 분석을 이용한 노던 블럿, 정량적 실시간 PCR 또는 RT-PCR 같은 당업계에 공지된 방법을 사용하여, mRNA 수준을 정량화하거나 본 발명의 방법에 사용된 핵산의 mRNA 수준과 18S rRNA 같은 housekeeping 유전자의 mRNA 수준을 비교함으로써 분석될 수 있다 (Heid 등, 1996 Genome 방법 6: 986-994). 일반적으로 "약한 프로모터"는 코딩 서열의 발현을 낮은 수준으로 이끄는 것이다. "낮은 수준"은 세포당 약 1/10,000 전사체 내지 약 1/100,000 전사체, 약 1/500,0000 전사체까지의 수준을 말한다. 역으로, "강력한 프로모터" 는 코딩 서열의 발현을 높은 수준으로 또는 세포당 약 1/10 전사체 내지 약 1/100 전사체 내지 약 1/1000 전사체로 이끄는 것이다.

작동가능하게 연결된

본 발명에서 사용된 용어 "작동가능하게 연결된"은 프로모터 서열과 해당 유전자 간의 기능적 연관을 말하는 것으로, 그럼으로써 프로모터 서열이 해당 유전자의 전사를 개시할 수 있다.

구성적 프로모터

"구성적 프로모터"는 반드시 항상은 아니더라도 생장 및 발달의 대부분 기간 중에 그리고 대부분의 환경적 조건 하에서 적어도 하나의 세포, 조직 또는 기관에서 전사적으로 활성인 프로모터를 말한다. 하기 표 2가 구성적 프로모터의 예이다.

구성적 프로모터의 예

유전자 출처	참고문헌
액틴	McElroy 등, Plant Cell, 2: 163-171, 1990
HMGP	WO 2004/070039
CAMV 35S	Odell 등, Nature, 313: 810-812, 1985
CaMV 19S	Nilsson 등, Physiol. Plant. 100:456-462, 1997
GOS2	de Pater 등, Plant J Nov;2(6):837-44, 1992, WO 2004/065596
유비퀴틴	Christensen 등, Plant Mol. Biol. 18: 675-689, 1992
벼 사이클로필린	Buchholz 등, Plant Mol Biol. 25(5): 837-43, 1994
옥수수 H3 히스톤	Lepetit 등, Mol. Gen. Genet. 231:276-285, 1992
알팔파 H3 히스톤	Wu 등 Plant Mol. Biol. 11:641-649, 1988
액틴 2	An 등, Plant J. 10(1); 107-121, 1996
34S FMV	Sanger 등, Plant. Mol. Biol., 14, 1990: 433-443
Rubisco small subunit	US 4,962,028
OCS	Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553
SAD1	Jain 등, Crop Science, 39 (6), 1999: 1696
SAD2	Jain 등, Crop Science, 39 (6), 1999: 1696
nos	Shaw 등 (1984) Nucleic Acid Res. 12(20):7831-7846
V-ATPase	WO 01/14572
Super 프로모터	WO 95/14098
G-box 단백질	WO 94/12015

편재하는 프로모터

편재하는 프로모터는 생물체의 사실상 모든 조직이나 세포에서 활성을 갖는 것이다.

발달적으로 조절된 프로모터

발달적으로 조절된 프로모터는 특정 발달 단계 중에 또는 발달적 변화가 일어나는 식물체의 부위에서 활성을 갖는 것이다.

유도성 프로모터

유도성 프로모터는 화학적 (Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), 환경적 또는 물리적 자극에 반응하여 전사 개시가 유도되거나 증가되거나 또는 식물이 다양한 스트레스 환경에 노출될 때 "스트레스 유도성", 즉 활성화될 수 있거나 또는, 식물이 다양한 병원균에 노출될 때 "병원균 유도성", 즉 활성화될 수 있다.

기관 특이적/조직 특이적 프로모터

기관 특이적 또는 조직 특이적 프로모터는 잎, 뿌리, 종자조직 등과 같이 특정 기관 또는 조직에서 우선적으로 발현 개시가 가능한 것이다. 예를 들면, "뿌리 특이적 프로모터"는 식물의 다른 부위에 약간 누설된(leaky) 발현을 허용하지만, 사실상 식물의 다른 부위를 제외하고 식물 뿌리에서 우세하게 전사적으로 활성이 있는 프로모터이다. 특정 세포에서만 전사를 개시할 수 있는 프로모터는 본 발명에서 "세포 특이적"이라 한다.

뿌리 특이적 프로모터의 예는 하기 표 3에 열거된다:

뿌리 특이적 프로모터의 예

유전자 출처	참고문헌
RCc3	Plant Mol Biol. 1995 Jan;27(2):237-48
Arabidopsis phosphate transporter PHT1	Kovama et al ., 2005
Medicago phosphate transporter	Xiao et al ., 2006
Arabidopsis Pyk10	Nitz et al ., (2001) Plant Sci 161(2): 337-346

종자 특이적 프로모터는 종자 조직에서만 반드시 배타적으로는 아니지만 (누설 발현의 경우) 종자조직에서 우세하게 전사적으로 활성인 것이다. 종자 특이적 프로모터는 종자발달 및/또는 발아 중에 활성일 것이다. 종자 특이적 프로모터는 배유/호분층/배 특이적일 수 있다. 종자 특이적 프로모터의 예는 하기 표 4, 5, 6, 7에 제시된다. 종자 특이적 프로모터의 추가적인 예는 Qing Qu 및 Takaiwa (Plant Biotechnol. J. 2, 113-125, 2004)에 제시되며, 이의 개시는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다.

종자 특이적 프로모터의 예

유전자 출처	참고문헌
종자 특이적 유전자	Simon et al., Plant Mol. Biol. 5: 191, 1985;
	Scofield et al., J. Biol. Chem. 262: 12202, 1987.;
	Baszczynski et al., Plant Mol. Biol. 14: 633, 1990.
Brazil Nut 알부민	Pearson et al., Plant Mol. Biol. 18: 235-245, 1992.
레규민(legumin)	Ellis et al., Plant Mol. Biol. 10: 203-214, 1988.
글루텔린(벼)	Takaiwa et al., Mol. Gen. Genet. 208: 15-22, 1986;
	Takaiwa et al., FEBS Letts. 221: 43-47, 1987.
제인(zein)	Matzke et al Plant Mol Biol, 14(3):323-32 1990
napA	Stalberg et al, Planta 199: 515-519, 1996.
밀 LMW 및 HMW 글루테닌-1	Mol Gen Genet 216:81-90, 1989; NAR 17:461-2, 1989
밀 SPA	Albani et al, Plant Cell, 9: 171-184, 1997
밀 α,β,γ,-글리아딘	EMBO J. 3:1409-15, 1984
보리 Itr1 프로모터	Diaz et al. (1995) Mol Gen Genet 248(5):592-8
보리 B1, C, D, 호데인(hordein)	Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-60, 1996
보리 DOF	Mena et al, Plant Journal, 116(1): 53-62, 1998
blz2	EP99106056.7
합성 프로모터	Vicente-Carbajosa et al., Plant J. 13: 629-640, 1998.
벼 프롤라민 NRP33	Wu et al, Plant Cell Physiology 39(8) 885-889, 1998
벼 a-글로불린 Glb-1	Wu et al, Plant Cell Physiology 39(8) 885-889, 1998
벼 OSH1	Sato et al, Proc. Natl. Acad. Sci. USA, 93: 8117-8122, 1996
벼 a-글로불린 REB/OHP-1	Nakase et al. Plant Mol. Biol. 33: 513-522, 1997
벼 ADP-글루코스 파이로포스포릴라아제	Trans Res 6:157-68, 1997
옥수수 ESR 유전자 패밀리	Plant J 12:235-46, 1997
수수(Sorghum) α-kafirin	DeRose et al., Plant Mol. Biol 32:1029-35, 1996
KNOX	Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999
벼 올레오신	Wu et al, J. Biochem. 123:386, 1998
해바라기 올레오신	Cummins et al., Plant Mol. Biol. 19: 873-876, 1992
PRO0117, 추정 벼 40S 리보좀 단백질	WO 2004/070039
PRO0136, 벼 알라닌 아미노트랜스퍼라제	미공개
PRO0147, 트립신 저해제 ITR1 (보리)	미공개
PRO0151, 벼 WSI18	WO 2004/070039
PRO0175, 벼 RAB21	WO 2004/070039
PRO005	WO 2004/070039
PRO0095	WO 2004/070039
α-아밀라아제 (Amy32b)	Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991
카텝신(cathepsin) β-유사 유전자	Cejudo et al, Plant Mol Biol 20:849-856, 1992
보리 Ltp2	Kalla et al., Plant J. 6:849-60, 1994
Chi26	Leah et al., Plant J. 4:579-89, 1994
옥수수 B-Peru	Selinger et al., Genetics 149;1125-38,1998

배유 특이적 프로모터의 예

유전자 출처	참고문헌
글루텔린 (벼)	Takaiwa et al. (1986) Mol Gen Genet 208:15-22; Takaiwa et al. (1987) FEBS Letts. 221:43-47
제인(zein)	Matzke et al., (1990) Plant Mol Biol 14(3): 323-32
밀 LMW 및 HMW 글루테닌-1	Colot et al. (1989) Mol Gen Genet 216:81-90; Anderson et al. (1989) NAR 17:461-2
밀 SPA	Albani et al. (1997) Plant Cell 9:171-184
밀 글리아딘	Rafalski et al. (1984) EMBO 3:1409-15
보리 Itr1 프로모터	Diaz et al. (1995) Mol Gen Genet 248(5):592-8
보리 B1, C, D, 호데인(hordein)	Cho et al. (1999) Theor Appl Genet 98:1253-62; Muller et al. (1993) Plant J 4:343-55; Sorenson et al. (1996) Mol Gen Genet 250:750-60
보리 DOF	Mena et al, (1998) Plant J 116(1): 53-62
blz2	Onate et al. (1999) J Biol Chem 274(14):9175-82
합성 프로모터	Vicente-Carbajosa et al. (1998) Plant J 13:629-640
벼 프롤라민 NRP33	Wu et al, (1998) Plant Cell Physiol 39(8) 885-889
벼 글로불린 Glb-1	Wu et al. (1998) Plant Cell Physiol 39(8) 885-889
벼 글로불린 REB/OHP-1	Nakase et al. (1997) Plant Molec Biol 33: 513-522
벼 ADP-글루코스 파이로포스포릴라아제	Russell et al. (1997) Trans Res 6:157-68
옥수수 ESR 유전자 패밀리	Opsahl-Ferstad et al. (1997) Plant J 12:235-46
수수(sorghum) kafirin	DeRose et al. (1996) Plant Mol Biol 32:1029-35

배(embryo) 특이적 프로모터의 예

유전자 출처	참고문헌
벼 OSH1	Sato et al, Proc. Natl. Acad. Sci. USA, 93: 8117-8122, 1996
KNOX	Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999
PRO0151	WO 2004/070039
PRO0175	WO 2004/070039
PRO005	WO 2004/070039
PRO0095	WO 2004/070039

호분층 특이적 프로모터의 예

유전자 출처	참고문헌
α-아밀라아제 (Amy32b)	Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991
카텝신 β-유사 유전자	Cejudo et al, Plant Mol Biol 20:849-856, 1992
보리 Ltp2	Kalla et al., Plant J. 6:849-60, 1994
Chi26	Leah et al., Plant J. 4:579-89, 1994
옥수수 B-Peru	Selinger et al., Genetics 149;1125-38,1998

본 발명에서 정의된 녹색 조직 특이적 프로모터는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 식물의 다른 부위를 제외하고 실질적으로 녹색 조직에서 우세하게 전사적으로 활성이 있는 프로모터이다.

본 발명의 방법을 수행하는데 사용될 수 있는 녹색 조직 특이적 프로모터의 예는 하기의 표 8에 있다.

녹색 조직 특이적 프로모터의 예

유전자 출처	발현	참고문헌
옥수수 오쏘포스페이트 디키나아제(Orthophosphate dikinase)	잎 특이적	Fukavama et al., 2001
옥수수 포스포에놀피루베이트 카르복실라아제	잎 특이적	Kausch et al., 2001
벼 포스포에놀피루베이트 카르복실라아제	잎 특이적	Liu et al., 2003
벼 small subunit Rubisco	잎 특이적	Nomura et al., 2000
벼 베타 익스팬신(expansin) EXBP9	어린줄기 특이적	WO 2004/070039
Pigeonpea small subunit Rubisco	잎 특이적	Panguluri et al., 2005
완두 RBCS3A	잎 특이적

조직 특이적 프로모터의 다른 예는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 식물의 다른 부위를 제외하고 실질적으로 분열조직에서 우세하게 전사적으로 활성이 있는 분열조직 특이적 프로모터이다.

종결신호( terminator )

용어 "종결신호"는 일차 전사체의 3' 프로세싱 및 폴리아데닐화와 전사 종결의 신호가 되는 전사 단위의 말단에 있는 DNA 서열인 조절 서열이다. 종결신호는 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 첨가된 종결신호는 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.

조절( modulation )

용어 "조절"은 발현 또는 유전자 발현에 관한 것으로, 대조구 식물에 비하여 발현 수준이 상기 유전자 발현에 의하여 변화되는, 바람직하게는 발현 수준이 증가되는 과정이다. 원래의 조절되지 않은 발현은 구조 RNA (rRNA, tRNA) 또는 연이어 해독되는 mRNA 같이 임의의 종류의 발현일 수 있다. 용어 "활성 조절"은 식물의 증가된 수확량 관련 형질(예를 들면, 증가된 수확량 및/또는 증가된 생장)로 이끄는, 본 발명의 핵산 서열 또는 암호화된 단백질의 발현의 임의의 변화를 의미한다.

발현

용어 "발현" 또는 "유전자 발현"은 특정 유전자 또는 특정 유전자들 또는 특정 유전자 구축물의 전사를 의미한다. 용어 "발현" 또는 "유전자 발현"은 특히 유전자 또는 유전자들 또는 유전자 구축물의 구조 RNA (rRNA, tRNA), 또는 단백질로의 이은 해독이 있거나 없는 mRNA로의 전사를 의미한다. 상기 과정은 DNA의 전사 및 생성된 mRNA 산물의 가공을 포함한다.

증가된 발현/과발현

본 발명에 사용된 용어 "증가된 발현" 또는 "과발현"은 원래의 야생형 발현 수준에 부가적인 임의의 형태의 발현을 의미한다.

유전자 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화 되어 있으며, 예를 들면, 적절한 프로모터에 의한 과발현, 전사 인핸서 또는 해독 인핸서의 사용을 포함한다. 프로모터 또는 인핸서 인자로 작용하는 분리된 핵산 서열은 비이질성 형태의 폴리뉴클레오티드의 적절한 위치 (전형적으로 업스트림)에 도입되어 해당 폴리펩티드를 암호화하는 핵산 서열의 발현을 상향 조절한다. 예를 들면, 내재적 프로모터는 돌연변이, 결실, 및/또는 치환에 의해 생체 내에서 변할 수 있거나 (Kmiec, US 5,565,350; Zarling 등, WO9322443), 또는 분리된 프로모터는 본 발명의 유전자로부터 적절한 거리와 방향으로 식물 세포 내에 도입될 수 있어 해당 유전자의 발현을 조절한다.

폴리펩티드 발현을 원한다면, 일반적으로 폴리뉴클레오티드 암호화 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 폴리아데닐화 영역은 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래할 수 있다. 부가된 3' 말단 서열은 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.

세포질 내에 축적되는 성숙된 메세지 양의 증가를 위하여 인트론 서열이 또한 부분적인 암호화 서열의 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 식물 및 동물 발현 구축물에 있어 전사 단위 내에 스플라이스 가능한 인트론이 포함되면 mRNA 및 단백질 수준에서 유전자 발현이 1000 배까지 증가함이 보였다 (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis 등 (1987) Genes Dev 1:1183-1200). 인트론에 의한 유전자 발현의 상승효과는 전형적으로 전사 단위의 5' 말단 가까이에 위치하였을 때 가장 컸다. 옥수수 인트론 Adh1-S 인트론 1, 2, 및 6, Bronze-1 인트론의 사용은 당업계에 주지되어 있다. 전반적인 정보는 하기를 참고한다: Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).

내재적 유전자

본 발명에서 "내재적" 유전자는 자연적 형태 (즉, 임의의 인간의 개입이 없는)로 식물에서 발견되는 것으로서 문제의 유전자뿐 아니라, 분리된 형태로 연이어 식물체에 (재)도입된 (트랜스진) 동일한 유전자 (사실상 상동인 핵산/유전자)를 말한다. 예를 들면, 상기 트랜스진을 갖는 형질전환 식물체에서는 트랜스진 발현의 실질적인 감소 및/또는 내재적 유전자 발현의 실질적인 감소가 있을 수 있다. 분리된 유전자는 생물체로부터 분리되거나, 또는 예를 들면 화학적 합성에 의하여 인위적으로 만들 수도 있다.

감소된 발현

본 발명에서 "감소된 발현" 또는 발현의 "감소 또는 실질적인 제거"는 대조구에 비하여 내재적 유전자 발현 및/또는 폴리펩티드 수준 및/또는 폴리펩티드 활성의 감소를 의미한다. 감소 또는 실질적인 제거는 대조구 식물에 비하여 증가하는 순으로 선호되는 적어도 10%, 20%, 30%, 40% 또는 50%, 60%, 70%, 80%, 85%, 90%, 또는 95%, 96%, 97%, 98%, 99% 이상 감소된 것이다.

식물체에 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위해서는 충분한 길이의 핵산 서열의 상당히 연속적인 뉴클레오티드가 필요하다. 유전자 침묵을 수행하기 위한 뉴클레오티드는 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 개 또는 더 소수의 뉴클레오티드만큼 적을 수도 있고, 전체 유전자 (5' 및/또는 3' UTR을 포함하여, 일부분 또는 전체)만큼 많을 수도 있다. 상당한 길이의 연속적인 뉴클레오티드는 관심있는 단백질을 암호화하는 핵산 서열 (표적 유전자)로부터, 또는 관심있는 단백질의 오쏘로그(orthologue), 패럴로그(paralogue) 또는 상동체(homologue)를 암호화하는 것이 가능한 임의의 핵산 서열로부터 유래할 수 있다. 바람직하게는, 상당한 길이의 연속적인 뉴클레오티드는 표적 유전자 (센스 또는 안티센스 가닥)와 수소결합을 형성할 수 있으며, 더욱 바람직하게는, 상당한 길이의 연속적인 뉴클레오티드는 표적 유전자 (센스 또는 안티센스 가닥)에 증가하는 순으로 선호되는, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% 동일한 서열을 갖는다. (기능성) 폴리펩티드를 암호화하는 핵산 서열은 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위해 본 발명에서 논의된 다양한 방법에 대한 필요조건은 아니다.

상기 발현의 감소 또는 실질적인 제거는 통상적인 수단 및 기술을 사용하여 이룰 수 있다. 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위한 바람직한 방법은 핵산 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)이 스페이서 (spacer: non-coding DNA)로 분리되어 역반복 (inverted repeat: 부분적으로 또는 완전히)으로 클로닝된 유전자 구축물의 식물체로의 도입 및 발현이다.

상기 바람직한 방법에 있어, 내재적 유전자의 발현은 핵산 또는 그 일부 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)의, 바람직하게는 헤어핀(hairpin) 구조를 형성하는 것이 가능한 역반복을 사용한 RNA 매개된 침묵에 의해 감소되거나 또는 실질적으로 제거된다. 상기 역반복(inverted repeat)은 조절서열을 포함하는 발현벡터로 클로닝된다. 비암호화 DNA 핵산 서열 (스페이서, 예를 들면 matrix attachment region fragment (MAR), 인트론, 폴리링커 등)은 두 역위 핵산 사이에 위치하여 역반복을 형성한다. 역반복의 전사 후, 자체 상보적인(self-complementary) 구조를 가진 키메릭(chimeric) RNA가 형성된다 (부분적인 또는 완전한). 상기 이중가닥 RNA 구조를 hpRNA (hairpin RNA)라고 한다. 상기 hpRNA는 식물에 의해 RISC (RNA-induced silencing complex)로 통합되는 siRNA로 가공된다. 상기 RISC는 mRNA 전사물로 쪼개어져, 폴리펩티드로 해독될 mRNA 전사물의 수를 실질적으로 감소시킨다. 더욱 상세한 내용은 예를 들면, Grierson 등 (1998) WO 98/53083; Waterhouse 등 (1999) WO 99/53050를 참고하면 된다.

본 발명의 방법의 수행은 핵산이 역반복으로 클로닝된 유전자 구축물의 식물로의 도입 및 발현에 의존하지 않으나, 임의의 하나 이상의 몇가지 공지된 "유전자 침묵(gene silencing)" 방법이 동일한 효과를 얻기 위해 사용될 수 있다.

내재적 유전자 발현의 감소를 위한 상기 방법 중 하나는 유전자 발현의 RNA-매개된 침묵 (하향조절(downregulation))이다. 상기의 경우 침묵(Silencing)은 표적 내재적 유전자에 실질적으로 유사한 이중가닥 RNA 서열 (dsRNA)에 의해 식물체에서 유발된다. 상기 dsRNA는 식물에 의해 siRNAs (short interfering RNAs)라는 약 20 내지 약 26 개의 뉴클레오티드로 더 가공된다. 상기 siRNAs는 내재적 표적 유전자의 mRNA 전사물을 쪼개는 RISC (RNA-induced silencing complex)로 통합되며, 그로 인하여 실질적으로 폴리펩티드로 해독될 mRNA 전사물의 수를 감소시킨다. 바람직하게는, 이중가닥 RNA 서열이 표적 유전자에 해당한다.

RNA 침묵 방법의 또 다른 예는 핵산 서열 또는 그 일부 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)를 센스 방향으로 식물체로의 도입을 포함한다. "센스 방향"은 해당 mRNA 전사물에 상동인 DNA 서열을 말한다. 식물로 도입되면 따라서 적어도 한 카피의 핵산 서열이다. 부가적인 핵산 서열은 내재적 유전자의 발현을 감소시켜, 공억제(co-suppression)라 알려진 현상이 생긴다. 높은 전사물 수준 및 공억제(co-suppression)의 유발 간에는 양의 상관관계가 있으므로 유전자 발현의 감소는 몇 부가적인 카피의 핵산 서열이 식물체 내로 도입되면 더욱 현저해질 것이다.

RNA 침묵 방법의 또 다른 예는 안티센스(antisense) 핵산 서열의 사용을 포함한다. "안티센스" 핵산 서열은 단백질을 암호화하는 "센스(sense)" 핵산 서열에 상보적인, 즉 이중가닥 cDNA 분자의 코딩 가닥에 상보적인 또는 mRNA 전사물 서열에 상보적인 뉴클레오티드 서열을 포함한다. 안티센스 핵산 서열은 바람직하게는 사일런싱(silencing)될 내재적 유전자에 상보적이다. 상기 상보성은 유전자의 "코딩 영역" 및/또는 "비코딩 영역(non-coding region)"에 위치할 수 있다. 용어 "코딩 영역"은 아미노산 잔기로 해독되는 코돈(codon)을 포함하는 뉴클레오티드 서열의 영역을 말한다. "비코딩 영역(non-coding region)"은 전사는 되나 아미노산으로 해독되지 않는, 코딩 영역을 플랭킹하는 5' 및 3' 서열을 말한다 (또한 5' 및 3' 비해독 영역이라 한다).

안티센스 핵산 서열은 Watson 및 Crick 염기 페어링(base pairing)의 방식에 따라 디자인될 수 있다. 안티센스 핵산 서열은 전체 핵산 서열 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)에 상보적일 수 있으나, 또한 핵산 서열의 일부 (mRNA 5' 및 3' UTR 포함)에 대해서만 안티센스인 올리고뉴클레오티드일 수 있다. 예를 들면, 안티센스 올리고뉴클레오티드 서열은 폴리펩티드를 암호화하는 mRNA 전사물의 해독 개시부위 주변의 영역에 상보적일 수 있다. 적절한 안티센스 올리고뉴클레오티드 서열의 길이는 당업계에 공지되어 있으며 약 50, 45, 40, 35, 30, 25, 20, 15 또는 10 개의 뉴클레오티드 길이 또는 그 이하일 수 있다. 본 발명에 따른 안티센스 핵산 서열은 당업계에 공지된 방법을 사용하여 화학적 합성 및 효소적 라이게이션 반응으로 구축될 수 있다. 예를 들면, 안티센스 핵산 서열 (예를 들면, 안티센스 올리고뉴클레오티드 서열)은 자연적으로 발생하는 뉴클레오티드 또는 분자의 생물학적 안정성을 증가시키기 위해 또는 안티센스 및 센스 핵산 서열 간에 형성된 이중선(duplex)의 물리적 안정성을 증가시키기 위해 디자인된 다양하게 변형된 뉴클레오티드를 사용하여 화학적으로 합성될 수 있으며, 예를 들면, 포스포로티오에이트(phosphorothioate) 유도체 및 아크리딘(acridine) 치환된 뉴클레오티드가 사용될 수 있다. 안티센스 핵산 서열의 생성에 사용될 수 있는 변형된 뉴클레오티드의 예는 당업계에 주지되어 있다. 알려진 뉴클레오티드 변형은 메틸화(methylation), 고리화(cyclization) 및 '캡(caps)' 및 하나 이상의 자연적으로 발생하는 뉴클레오티드의 이노신(inosine)과 같은 유사체(analogue)로의 치환을 포함한다. 뉴클레오티드 변형의 다른 경우는 당업계에 주지되어 있다.

안티센스 핵산 서열은 핵산 서열이 안티센스 방향으로 서브클로닝된 (즉, 삽입된 핵산으로부터 전사된 RNA는 관심있는 표적 핵산에 대해 안티센스 방향일 수 있다) 발현 벡터를 사용하여 생물학적으로 생산될 수 있다. 바람직하게는, 식물에서 안티센스 핵산 서열은 프로모터, 작동가능하게 연결된 안티센스 올리고뉴클레오티드, 및 종결신호(terminator)를 포함하여 안정적으로 통합된 핵산 구축물을 통해 생산된다.

본 발명의 방법에서 사일런싱에 사용된 핵산 분자 (식물로 도입되거나 또는 인 시튜로 생성되거나)는 mRNA 전사물 및/또는 폴리펩티드를 암호화하는 게놈 DNA와 혼성화하거나 또는 이들에 결합하여, 그로 인하여 예를 들면, 전사 및/또는 해독을 저해함으로서 단백질의 발현을 저해한다. 상기 혼성화는 안정적인 이중선(duplex)를 형성하기 위해 전형적인 뉴클레오티드 상보성에 의해 이루어질 수 있거나, 또는, 예를 들면, DNA 이중선(duplexes)에 결합하는 안티센스 핵산 서열의 경우에, 이중 나선(double helix)의 깊은 홈(major groove)에서의 특정 상호작용을 통해 이루어질 수 있다. 안티센스 핵산 서열은 형질전환에 의해 또는 특정 조직 부위에서 직접적인 주입에 의해 식물체로 도입될 수 있다. 대안으로는, 안티센스 핵산 서열은 선발된 세포를 표적화하기 위해 변형되어, 체계적으로 도입될 있다. 예를 들면, 체계적인 도입을 위해, 안티센스 핵산 서열은 변형될 수 있어, 상기 서열은 예를 들면, 안티센스 핵산 서열을 세포 표면 수용체 또는 항원에 결합하는 펩티드 또는 항원에 연결함으로써 선발된 세포 표면상에 발현된 수용체 또는 항원에 특이적으로 결합한다. 상기 안티센스 핵산 서열은 또한 본 발명에서 기재된 벡터를 사용하여 세포로 전달될 수 있다.

추가적인 양상에 따라, 상기 안티센스 핵산 서열은 a-아노머 핵산 서열이다. a-아노머 핵산 서열은 상보적인 RNA와 특정 이중가닥 혼성체(hybrid)를 형성하며, 상기에서 보통의 b-units와 달리 상기 이중가닥은 서로 평행이다 (Gaultier 등 (1987) Nucl Ac Res 15: 6625-6641). 상기 안티센스 핵산 서열은 또한 2'-o-메틸리보뉴클레오티드 (Inoue 등 (1987) Nucl Ac Res 15, 6131-6148) 또는 키메릭(chimeric) RNA-DNA 유사체(analogue) (Inoue 등 (1987) FEBS Lett. 215, 327-330)를 포함할 수 있다.

내재적 유전자 발현의 감소 또는 사실상의 제거는 또한 리보자임(ribozyme)을 사용하여 수행될 수 있다. 리보자임(ribozyme)은 상보적인 영역을 갖는 부위에서 mRNA와 같은 단일가닥인 핵산 서열을 절단할 수 있는 리보핵산가수분해효소(ribonuclease) 활성을 가진 촉매성 RNA 분자이다. 따라서, 리보자임 (예를 들면, 햄머헤드(hammerhead) 리보자임 (Haselhoff 및 Gerlach (1988) Nature 334, 585-591 참조)은 폴리펩티드를 암호화하는 mRNA 전사물의 촉매적 절단에 사용될 수 있어, 그로 인하여 폴리펩티드로 해독될 mRNA 전사물의 수를 실질적으로 줄인다. 핵산 서열에 대해 특이성을 가진 리보자임이 디자인될 수 있다 (예를 들면: Cech 등 U.S. Patent No. 4,987,071; 및 Cech 등 U.S. Patent No. 5,116,742 참고). 대안으로는, 핵산 서열에 해당하는 mRNA 전사물이 RNA 분자의 풀(pool)로부터 특정 리보핵산가수분해효소(ribonuclease) 활성을 가진 촉매성 RNA의 선발에 사용될 수 있다 (Bartel 및 Szostak (1993) Science 261, 1411 -1418). 식물에서 유전자 침묵(gene silencing)을 위한 리보자임의 사용은 당업계에 공지되어 있다 (예를 들면, Atkins 등 (1994) WO 94/00012; Lenne 등 (1995) WO 95/03404; Lutziger 등 (2000) WO 00/00619; Prinsen 등 (1997) WO 97/13865 및 Scott 등 (1997) WO 97/38116).

유전자 침묵(gene silencing)은 또한 삽입 돌연변이 유발 (예를 들면, T-DNA 삽입 또는 트렌스포존 삽입)에 의해 또는 Angell 및 Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS WO 98/36083), 또는 Baulcombe (WO 99/15682)에 기재된 전략에 의해서도 수행될 수 있다.

유전자 침묵은 또한 내재적 유전자상에 돌연변이 및/또는 실질적으로 식물체로 도입될 분리된 유전자/핵산에 돌연변이의 존재 시 발생할 수 있다. 상기 감소 또는 사실상의 제거는 기능이 없는 폴리펩티드에 의해서도 야기될 수 있다. 예를 들면, 폴리펩티드가 다양한 상호작용하는 단백질에 결합할 수 있다; 하나 이상의 돌연변이(들) 및/또는 절단(들)은 따라서, 상호작용하는 단백질 (수용체 단백질과 같은)에 결합할 수는 있으나 정상적인 기능을 나타낼 수 없는 (신호전달 리간드와 같은) 폴리펩티드를 제공할 수 있다.

유전자 침묵의 또 다른 방법은 표적 세포 내 유전자의 전사를 막는 3중나선(triple helical) 구조를 형성하기 위해 유전자의 조절 영역 (예를 들면, 프로모터 및/또는 인핸서)에 상보적인 핵산 서열을 표적화하는 것이다. [Helene, C, Anticancer Drug Res. 6, 569-84, 1991; Helene 등 Ann. N.Y. Acad. Sci. 660, 27-36 1992; 및 Maher, LJ. Bioassays 14, 807-15, 1992]을 참조하면 된다.

식물체 내에서의 기능 저해를 위해 내재적 폴리펩티드에 대한 항체의 사용, 또는 폴리펩티드가 관여되는 신호전달 경로(signalling pathway)의 방해와 같은 다른 방법들이 당업자에게 주지되어 있다. 특히, 인공합성 분자가 표적 폴리펩티드의 생물학적 기능을 저해하거나 또는 표적 폴리펩티드가 관여되는 신호전달 경로의 방해에 유용할 수 있다는 것을 고려할 수 있다.

대안으로는, 유전자의 식물 개체군 자연 변이체를 동정하기 위해 스크리닝 프로그램이 셋업될 수도 있으며, 상기 변이체는 활성이 감소된 폴리펩티드를 암호화한다. 상기 자연 변이체는 또한 예를 들면, 상동 재조합의 수행에 사용될 수 있다.

인공적인 및/또는 자연적인 miRNAs (microRNAs)가 유전자 발현 및/또는 mRNA 해독을 녹아웃(knock out)하는 데 사용될 수 있다. 내재적 miRNAs는 전형적으로 19-24 뉴클레오티드 길이의 단일가닥의 작은 RNAs이며, 주로 유전자 발현 및/또는 mRNA 해독을 조절하는 작용을 한다. 대부분의 식물 miRNAs (microRNAs)는 표적 서열에 완전한 또는 완전에 가까운 상보성을 가진다. 그러나, 5 개까지의 미스매치(mismatches)를 가진 자연적인 표적이 있으며, 다이서(Dicer) 패밀리의 이중가닥 특정 RNases에 의해 특징적인 폴더백(fold-back) 구조를 가진 더욱 긴 넌코딩(non-coding) RNAs로부터 가공될 수 있다. 가공(processing)으로, 주성분인 Argonaute 단백질에 결합함으로써 RISC (RNA-induced silencing complex)로 통합된다. MiRNAs는 세포질 내에서 표적 핵산, 대개 mRNAs와 염기쌍을 이루므로 RISC의 특이성 요소로서 작용한다. 연이은 조절은 표적 mRNA 절단 및 붕괴 및/또는 해독 저해를 포함한다. miRNA 과발현의 효과는 따라서 표적 유전자의 mRNA 수준의 감소로 흔히 반영된다.

전형적으로 21 뉴클레오티드 길이인 인공적인 microRNAs (amiRNAs)가 하나 또는 다수의 관심 유전자의 유전자 발현을 특이적으로 음으로 조절되도록 유전공학적으로 조작될 수 있다. 식물 microRNA 표적 선발의 결정인자는 당업계에 주지되어 있다. 표적 인지에 대한 경험적 매개변수는 정해져 있으며, 특정 amiRNAs의 디자인에 도움이 되게 사용될 수 있다 (Schwab 등 Dev. Cell 8, 517-527, 2005). amiRNAs의 디자인 및 생성을 위한 편리한 수단 및 이의 전구체는 또한 공개되어 있다 (Schwab 등 Plant Cell 18, 1 121-1 133, 2006).

최적의 수행을 위해, 내재적 유전자의 식물에서의 발현을 감소시키는 유전자 침묵 기술에서 단자엽 식물의 형질전환을 위해서는 단자엽 식물 유래의 핵산 서열을, 쌍자엽 식물의 형질전환을 위해서는 쌍자엽 식물 유래의 핵산 서열을 사용할 것이 요구된다. 바람직하게는, 임의의 해당 식물 종의 핵산 서열이 동일 생물종에 도입된다. 예를 들면, 벼 유래의 핵산 서열은 벼 식물로 형질전환된다. 그러나, 도입될 핵산 서열이 도입될 식물과 동일 식물 종으로부터 유래해야 한다는 것은 절대적인 필요조건은 아니다. 내재적 표적 유전자 및 도입될 핵산 간에 실질적인 상동성이 있으면 충분하다.

상기 기재된 것은 내재적 유전자의 식물에서의 발현의 감소 또는 실질적인 제거를 위한 다양한 방법의 예이다. 당업자는 전체 식물 또는 그 일부에서 내재적 유전자의 발현을 감소시키기 위한 침묵을 위해, 예를 들면, 적절한 프로모터를 사용하여 상기 언급된 방법을 용이하게 변형할 수 있다.

선발 마커 (유전자)/리포터 유전자

"선발 마커", "선발 마커 유전자" 또는 "리포터 유전자"는 본 발명의 핵산 구축물로 감염되거나 형질전환된 세포의 동정 및/또는 선발을 촉진하기 위하여 발현된 세포에 표현형을 부여하는 임의의 유전자를 포함한다. 이들 마커 유전자는 일련의 상이한 원리를 통해 핵산분자의 성공적인 전달을확인 가능하게 한다. 적절한 마커는 항생제나 제초제 저항성을 주거나 새로운 대사 형질을 도입하거나 또는 시각적인 선발을 가능하게 하는 마커로부터 선택된다. 선발 마커 유전자의 예는 항생제 (네오마이신 및 카나마이신을 인산화하는 nptII, hpt, 인산화 하이그로마이신, 또는 예를 들면, 블레오마이신, 스트렙토마이신, 테트라사이클린, 클로람페니콜, 앰피실린, 겐타마이신, 제네티신 (G418), 스펙티노마이신, 블라스티시딘에 저항성을 주는 유전자), 제초제 (예를 들면, 바스타 (Basta

)에 저항성을 제공하는 bar; 글리포제이트에 대한 저항성을 제공하는 aroA 또는 gox, 또는 예를 들면, 이미다졸리논, 포스피노트리신, 설포닐우레아에 저항성을 주는 유전자)에 저항성을 주는 유전자 또는 대사적 형질을 제공하는 유전자 (식물이 유일한 탄소원으로 만노즈를 이용하게 하는 manA 또는 자일로스 이용을 위한 자일로스 이성화효소, 또는 2-데옥시글루코스에 대한 저항성 같은 반영양적 마커)를 포함한다. 가시적 마커 유전자의 발현으로 발색 (예를 들면 베타-글루쿠로니다제, GUS, 또는 발색된 기질, 예를 들면 X-Gal을 갖는 베타-갈락토시다제), 발광 (루시페린/루시파라제 시스템 같은) 또는 형광 (녹색 형광 단백질, GFP, 및 이의 유도체)이 형성된다. 이 목록은 소수의 가능한 마커만을 나타낸다. 당업자는 상기 마커에 친숙하다. 생물체 및 선발 방법에 따라 다른 마커가 선호된다.

식물 세포로 핵산의 안정적인 또는 일시적인 통합에 따라 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 암호화하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 암호화하는 핵산분자는 본 발명의 또는 본 발명의 방법에 유용한 사용된 폴리펩티드를 암호화하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산으로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다).

마커 유전자, 특히 항생제 및 제초제에 저항성이 있는 유전자는 일단 핵산이 성공적으로 도입되면 형질전환 숙주 세포에서 더 이상 필요하지 않거나, 바람직하지 않으므로, 핵산 도입을 위한 본 발명의 방법에 유용한서는 이들 마커 유전자가 제거 또는 절단되게 하는 기술을 사용한다. 하나의 상기 방법이 동시형질전환 (co-transformation)으로 알려진 것이다. 동시형질전환 방법은 형질전환을 위해 두 벡터를 동시에 사용하여, 하나의 벡터에는 본 발명에 따른 핵산이 있고, 둘째 벡터에는 마커 유전자(들)이 있다. 대부분의 형질전환체는 양 벡터를 받거나, 식물의 경우 (형질전환체의 40% 이상까지) 포함한다. 아그로박테리아로 형질전환한 경우, 형질전환체는 보통 벡터의 일부, 즉 보통 발현 카세트인 T-DNA에 의해 플랭킹된 서열만을 받는다. 마커 유전자는 연이어 교배를 하여 형질전환 식물체로부터 제거된다. 다른 방법에서는, 마커 유전자가 트랜스포손에 통합되어 원하는 핵산과 함께 형질전환에 사용된다 (Ac/Ds 기술로 알려짐). 형질전환체는 트랜스포자제(transposase) 공급원과 교배될 수 있거나 또는 트랜스포자제가 발현되게 하는 핵산 구축물로 일시적으로 또는 안정적으로 형질전환된다. 어떤 경우에 (약 10%), 일단 형질전환이 성공적으로 되면 트랜스포존은 숙주 세포의 게놈 밖으로 튀어나가 소실된다. 더 많은 경우에, 트랜스포존은 다른 구역으로 튄다. 이들 경우에 마커 유전자는 교배에 의하여 제거되어야 한다. 미생물학에서 상기 일이 있어났는지 검출을 가능하게 하거나 용이하게 하는 기술이 개발되었다. 더욱 편리한 방법은 재조합 시스템이라 알려진 것에 의존하는 것으로 이점은 교배에 의한 제거가 면제될 수 있다는 것이다. 이 유형의 가장 잘 알려진 시스템은 Cre/lox 시스템이다. Cre1은 loxP 서열 사이에 위치한 서열을 제거하는 리콤비나아제이다. 만일 마커 유전자가 loxP 서열 사이에 통합되면 리콤비나아제의 발현에 의해서 마커 유전자는 제거된다. 다른 재조합 시스템은 HIN/HIX, FLP/FRT 및 REP/STB 시스템 (Tribble 등, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan 등, J. Cell Biol., 149, 2000: 553-566)이다. 본 발명에 따른 핵산 서열의 식물 게놈 내로 위치 특이적 통합이 가능하다. 자연적으로, 이들 방법은 또한 효모, 균류 또는 세균 같은 미생물에 응용될 수 있다.

트랜스제닉 /트랜스진/재조합

본 발명에서 "트랜스제닉", "트랜스진" 또는 "재조합"은 예를 들면, 핵산 서열, 발현카세트, 핵산 서열을 포함하는 유전자 구축물 또는 벡터, 또는 본 발명에 따른 핵산 서열, 발현 카세트나 벡터로 형질전환된 생물체, 하기에 기재된 재조합 방법에 의해 생성된 모든 구조물에 관한 의미이다:

(a) 본 발명의 방법에 유용한 단백질을 암호화하는 핵산서열, 또는

(b) 본 발명에 따른 핵산 서열에 작동가능하게 연결된 유전자 조절 서열(들), 예를 들면 프로모터, 또는

(c) a) 및 b)

가 자연적인 유전적 환경에 있지 않거나, 재조합 방법으로 변형되어 왔으므로 예를 들면, 하나 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역위 또는 삽입의 유형의 변형이 가능하다. 자연적인 유전적 환경은 원래의 식물에서 자연적인 게놈 또는 염색체 상의 위치나 게놈 라이브러리에서의 존재를의미하는 것으로 이해된다. 게놈 라이브러리의 경우, 핵산 서열의 자연적인 유전적 환경은 바람직하게는 적어도 부분적으로는 보유된다. 환경은 적어도 한 쪽의 핵산서열을 플랭킹하며 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1000 bp, 가장 바람직하게는 적어도 5000 bp 길이의 서열을 갖는다. 자연적으로 발생하는 발현 카세트, 예를 들면 본 발명의 방법에 유용한 폴리펩티드를 암호화하는 해당 핵산 서열과 핵산 서열의 자연적 프로모터의 자연적으로 생긴 조합은 이 발현 카세트가 예를 들면 돌연변이 처리 같은 비자연적인 합성 ("인위적") 방법으로 변형될 때 형질 전환 발현카세트가 된다. 적절한 방법이 예를 들면 US 5,565,350 또는 WO 00/15815에 기재되어 있다.

본 발명의 목적상, 트랜스제닉 식물은 상기처럼 본 발명의 방법에 유용한서 사용된 핵산은 상기 식물의 게놈상의 자연적 위치에 있지 않아 핵산이 동종에서 또는 이종에서 발현될 수 있다는 의미로 이해된다. 그러나, 언급된 바와 같이, 트랜스제닉은 또한 본 발명에 있어 또는 본 발명 방법에 사용된 핵산은 식물 게놈 내의 자연적 위치에 있는 반면, 그 서열이 자연적 서열에 대하여 변형되었고 및/또는 자연적 서열의 조절 서열이 변형되었음을 의미한다. 트랜스제닉은 핵산의 동종 또는 바람직하게는 이종 발현이 일어나는 게놈 내의 비자연적 위치에서 본 발명에 따른 핵산의 발현을 의미하는 것으로 바람직하게는 이해된다. 바람직한 트랜스제닉 식물이 본 발명에서 언급된다.

형질전환

본 발명에 언급된 용어 "도입" 또는 "형질전환"은 전달에 사용된 방법에 관계 없이 외래 폴리뉴클레오티드의 숙주 세포로의 전달을 포함한다. 기관 발생이나 배발생에 의하여 연이은 클론 번식이 가능한 식물 조직은 본 발명의 유전자 구축물로 형질전환될 수 있으며, 전체 식물체가 이로부터 재생된다. 선택된 특정 조직은 형질전환될 특정 종에 이용 가능하며 가장 잘 맞는 클론 번식 시스템에 따라 다양할 것이다. 전형적인 조직 표적은 잎 디스크, 화분, 배, 자엽, 하배축, 대배우체, 캘러스 조직, 분열조직 (예를 들면, 정단 분열조직, 액아, 및 뿌리 분열조직), 및 유도된 분열조직 (예를 들면, 자엽 분열조직 및 하배축 분열조직)을 포함한다. 폴리뉴클레오티드는 일시적으로 또는 안정적으로 숙주 세포에 도입되며 예를 들면, 플라스미드처럼 비통합적으로 유지된다. 다르게는, 숙주 게놈으로 통합된다. 결과적인 형질전환 식물 세포는 당업자에게 주지된 방식으로 형질전환 식물을 재생하는데 사용된다.

외래 유전자의 식물 게놈으로 전달을 형질전환이라 부른다. 식물 종의 형질전환은 일상적인 기술이다. 유리하게도, 임의의 몇가지 형질전환 방법이 목적 유전자를 적절한 조상 세포로의 도입에 사용될 수 있다. 식물 조직 또는 식물 세포로부터 식물의 형질전환 및 재생에 관하여 기재된 방법은 일시적인 또는 안정한 형질전환에 이용될 수 있다. 형질전환 방법은 리포좀, 전기천공법, 유리 DNA 흡수를 증가시키는 화학물질, 식물체 내로 DNA의 직접적인 주입, 입자총 충격법, 바이러스 또는 화분을 이용한 형질전환 및 미세주입(microprojection)을 포함한다. 방법은 원형질에 대한 칼슘/폴리에틸렌 글리콜법 (Krens, F.A. 등, (1982) Nature 296, 72-74; Negrutiu I 등 (1987) Plant Mol Biol 8: 363-373); 원형질의 전기천공법 (Shillito R.D. 등 (1985) Bio/Technol 3, 1099-1102); 식물로 미세주사(microinjection) (Crossway 등, (1986) Mol. Gen Genet 202: 179-185); DNA 또는 RNA 코팅된 입자 충격법 (Klein TM 등, (1987) Nature 327: 70) (비통합적) 바이러스로 감염 등으로부터 선택할 수도 있다. 형질전환 작물을 포함한 형질전환 식물은 바람직하게는 아그로박테리움-매개된형질전환을 통해 제조된다. 편리한 형질전환방법은 식물체에서의 형질전환이다. 이를 위해, 예를 들면, 아그로박테리아를 식물 종자 상에 작용하게 하거나 식물 분열조직을 아그로박테리아로 접종하는 것이 가능하다. 형질전환된 아그로박테리아의 현탁액을 손상되지 않은 식물이나 적어도 꽃 원기에 작용하게 하는 것이 본 발명에 따라 특히 편리하다는 것이 입증되었다. 처리된 식물의 종자를 얻을 때까지 식물체를 키운다 (Clough and Bent, Plant J. (1998) 16, 735-743). 벼의 아그로박테리움 매개된형질전환 방법은 하기 임의의 것에 기재된 것처럼 벼 형질전환에 관한 잘 알려진 방법들을 포함한다: 유럽특허출원 EP 1198985 A1, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan 등 (Plant Mol Biol 22 (3): 491-506, 1993), Hiei 등 (Plant J 6 (2): 271-282, 1994), 상기 명세서는 충분히 설명한 것처럼 본 발명에 참조문헌으로 통합된다. 옥수수 형질전환의 경우에, 바람직한 방법은 Ishida 등 (Nat. Biotechnol 14(6): 745-50, 1996) 또는 Frame 등 (Plant Physiol 129(1): 13-22, 2002)에 기재된 것이며, 상기 명세서는 충분히 설명한 것처럼 본 발명에 참조문헌으로 통합된다. 상기 방법들은 [B. Jenes 등, Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143] 및 [Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225]에 예로서 기재되어 있다. 핵산 또는 발현될 구축물은 바람직하게는 아그로박테리움 투머파시엔스 형질전환에 적절한 벡터, 예를 들면 pBin19 내로 클론된다 (Bevan 등, Nucl. Acids Res. 12 (1984) 8711). 상기 벡터로 형질전환된 아그로박테리아가 아라비돕시스처럼 모델로 사용된 식물 (본 발명의 범위 내의 아라비돕시스 탈리아나는 작물로 고려되지 않는다)이나 예로서 담배 같은 작물의 예를 들면, 상처 내거나 잘게 썬 잎을 아그로박테리아 용액에 적신 후 적절한 배지에 배양하는 것과 같은 식물 형질전환을 위해 알려진 방식으로 사용될 수 있다. 아그로박테리움 투머파시엔스에 의한 식물의 형질전환은 예를 들면, [Hofgen and Willmitzer in Nucl. Acid Res. (1988) 16, 9877]에 의하여 기재되었거나, 특히 [F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38]에 알려져 있다.

온전한 식물로 재생되는 체세포의 형질전환외에, 식물의 분열조직 특히 배우자로 발달하는 세포의 형질전환이 가능하다. 이 경우에, 형질전환된 배우자는 자연적인 식물 발달 과정을 거쳐 형질전환 식물이 된다. 따라서 예를 들면, 아라비돕시스의 종자가 아그로박테리아로 처리되고, 발달하는 식물체로부터 취한 종자 중의 일부분이 형질전환되어 형질전환 식물체로 된다 [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. 또 다른 방법은 화서의 반복적인 제거에 근거하며 근생엽 중앙의 절단 부위를 형질전환된 아그로박테리아와 함께 배양하면 형질전환된 종자를 이후에 얻을 수 있다 (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). 그러나, 특히 효과적인 방법은 화서 담그기 ("floral dip") 방법의 변형인 진공 침윤 (vacuum infiltration)이다. 아라비돕시스의 진공 침윤의 경우, 감압 하에 온전한 식물체를 아그로박테리아 현탁액으로 처리하는 것이고 [Bechthold, N (1993). C R Acad Sci Paris Life Sci, 316: 1194-1199], "화서 담그기법"에서는 발달 중인 화서 조직을 계면활성제가 처리된 아그로박테리아 현탁액과 잠깐 배양하는 것이다 [Clough, SJ and Bent AF (1998) Plant J. 16, 735-743]. 양 경우에 특정 비율의 형질전환 종자가 수확되며, 이들 종자는 상기 기재된 선발 조건 하에서 재배함으로써 형질전환되지 않은 종자와 구분된다. 색소체는 모계로 유전되기 때문에 색소체의 안정적인 형질전환의 잇점은 대부분의 작물에서 화분을 통한 트랜스진의 유전이 감소되거나 제거된다는 점이다. 엽록체 게놈의 형질전환은 일반적으로 Klaus 등, 2004 [Nature Biotechnology 22 (2), 225-229]에 체계적으로 표시된 과정에 의하여 수행된다. 간단히, 형질전환될 서열을 선발 마커 유전자와 함께 엽록체 게놈에 상동인 플랭킹 서열 사이에 클론한다. 이들 상동 플랭킹 서열이 플라스톰(plastome) 내로 특이적으로 통합된다. 색소체 형질전환은 많은 다른 식물 종에 대해 기술되어 왔으며, 개관은 [Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 or Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28]에 있다. 추가의 생물공학적 진보는 마커 없는 색소체 형질전환체의 형태로 최근 보고되었으며, 이는 일시적인 동시통합된(co-integrated) 마커 유전자에 의해 생성될 수 있다 (Klaus 등, 2004, Nature Biotechnology 22(2), 225-229).

T- DNA 활성화 태깅

T-DNA 활성화 태깅 (Hayashi 등 Science (1992) 1350-1353)은 보통 프로모터 (또한 해독 인핸서 또는 인트론)를 함유하는 T-DNA를 프로모터가 표적 유전자의 발현을 지시하게 배치되어 관심 유전자의 게놈 영역 내로 또는 유전자 암호화 영역의 10 kb 업스트림 또는 다운스트림으로 삽입하는 것을 포함한다. 전형적으로, 자체의 자연 프로모터에 의한 표적 유전자 발현의 조절은 붕괴되고 유전자는 새로 도입된 프로모터의 조절하에 있게 된다. 프로모터는 전형적으로 T-DNA 내에 끼워져 있다. 이 T-DNA는 식물 게놈 내에 예를 들면, 아그로박테리움 감염을 통하여 무작위로 삽입되며 삽입된 T-DNA 인근의 유전자의 발현이 변형되게 된다. 결과적인 형질전환 식물은 도입된 프로모터에 가까운 유전자의 변형된 발현으로 인하여 우성 표현형을 보인다.

틸링( TILLING )

용어 "틸링(TILLING)"은 "Targeted Induced Local Lesions In Genomes"의 약어이며 변형된 발현 및/또는 활성을 갖는 단백질을 암호화하는 핵산 서열을 생성 및/또는 동정하는데 유용한 돌연변이 기술을 말한다. 틸링(TILLING)은 또한 상기 돌연변이체를 갖는 식물의 선발을 가능하게 한다. 이들 돌연변이체는 강도나 위치 또는 시기상의 변형된 발현을 보인다 (만일 돌연변이가 프로모터에 영향을 준다면). 이들 돌연변이체는 자체의 자연적 형태의 유전자에 비하여 훨씬 높은 활성을 나타낸다. 틸링(TILLING)은 고밀도 돌연변이 유발과 고속처리 탐색 방법을 조합한 것이다. 틸링(TILLING)의 전형적인 단계는 하기와 같다: (a) EMS 돌연변이유발 (Redei GP 및 Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chu NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 1682; Feldmann 등, (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) DNA 준비 및 개체의 풀링(pooling); (c) 관심 영역의 PCR 증폭 (d) 이형 이중가닥 (heteroduplexes)이 되게 변성 및 어닐링 (e) DHPLC로 이형 이중가닥이 있는지를 크로마토그램 상의 여분의 정점으로 검출 (f) 돌연변이체 개체의 동정 (g) 돌연변이 PCR 산물의 염기서열결정. 틸링(TILLING)의 방법은 당업계에 주지되어 있다 (McCallum 등, (2000) Nat Biotechnol 18: 455-457; Stemple (2004) Nat Rev Genet 5(2): 145-50).

상동 재조합

상동 재조합은 정해진 위치에 선택된 핵산 서열이 게놈 내로 도입되게 한다. 상동 재조합은 생물학에서 효모 또는 선류 (Physcomitrella) 같은 하등생물에 대해 일상적으로 사용되는 표준기술이다. 식물에 있어 상동 재조합을 수행하는 방법은 모델 식물 (Offringa 등 (1990) EMBO J 9(10): 3077-84)에 대해서 뿐 아니라 작물 예를 들면, 벼 (Terad 등 (2002) Nat Biotech 20(10): 1030-4; Iid and Terad (2004) Curr Opin Biotech 15(2): 132-8)에 대해서도 기재되어 있다.

수확량

일반적인 의미에서의 용어 "수확량"은 경제적 가치 있는 측정 가능한 생산량을 말하며, 전형적으로 특정 작물, 면적, 및 기간에 관련이 있다. 개개 식물체 부분이 직접적으로 수, 크기 및/또는 중량에 근거한 수확량에 기여하거나, 또는 실제 수확량은 작물 에이커 및 년 당 수확량이고, 이는 총생산량 (수확된 및 평가된 생산량을 포함)을 재배된 에이커로 나눔으로써 결정된다. 식물의 "수확량"은 식물체의 영양조직 생물량 (뿌리 및/또는 어린 줄기 생물량), 생식 기관, 및/또는 번식체 (예를 들면, 종자)에 관련될 수 있다.

초기 활력

"초기 활력" 특히 식물 생장의 초기 단계 중에 활기차고 건강하게 잘 균형을 이룬 생장을 말하며, 예를 들면, 식물이 환경에 보다 잘 적응함으로 인한 (즉, 에너지 자원 사용이 최적화되고 어린 줄기와 뿌리 간에 분배됨) 식물체의 적응성 증가의 결과일 것이다. 초기 활력을 갖는 식물은 또한 증가된 실생 생존 및 보다 나은 작물 생성을 보여주며, 이는 흔히 고도로 균일한 밭 (균일한 양상으로 자라는 작물, 즉 대다수의 식물이 사실상 거의 동시에 다양한 발달단계에 이르는)과 흔히 보다 낫고 보다 높은 수확량이 된다. 따라서, 초기 활력은 천 개 낱알의 중량, 발아율, 출현율, 실생 생장, 실생 높이, 뿌리 길이, 뿌리 및 어린 줄기 생물량 등과 같은 다양한 요인들을 측정함으로써 결정될 수 있다.

증가/향상/강화

용어 "증가", "향상", 또는 "강화"는 서로 호환성 있게 사용할 수 있으며, 본 발명에서 정의된 대조구 식물과 비교하여 적어도 3%, 4%, 5%, 6%, 7%, 8%, 9% 또는 10%, 바람직하게는 적어도 15% 또는 20%, 더욱 바람직하게는 25%, 30%, 35% 또는 40% 이상의 수확량 및/또는 생장을 의미한다.

종자 수확량

증가된 종자 수확량은 다음 중 하나 이상으로 나타난다: a) 개별 종자 당 및/또는 식물체 당 및/또는 헥타르 또는 에이커 당의 종자 생물량 (총 종자 중량)의 증가 b) 식물체 당 꽃 수의 증가 c) 증가된 수의 (충전된) 종자 d) 증가된 종자 충전율 (충전된 종자 수를 총 종자 수로 나눈 비로 나타냄); e) 증가된 수확 지수 (종자 같은 수확할 수 있는 부분의 수확량을 총 생물량으로 나눈 비율); 및 f) 증가된 천 개 낱알 중량 (TKW) (카운트한 충전된 종자 및 이의 총 중량으로부터 외삽됨). 증가된 TKW는 증가된 종자 크기 및/또는 종자 중량, 및 배 및/또는 배유 크기의 증가로 인한다.

증가된 종자 수확량은 또한 종자 크기 및/또는 종자 부피의 증가로 나타낼 수 있다. 더욱이, 종자 수확량의 증가는 또한 종자 면적 및/또는 종자 길이 및/또는 종자 폭 및/또는 종자 주계의 증가로 나타난다. 증가된 수확량으로 외형이 변형되거나, 또는 변형된 외형으로 인해 수확량이 증가할 수도 있다.

녹색 지수

본 발명에 사용된 "녹색 지수(greenness index)"는 식물의 디지탈 화상으로부터 계산된다. 화상 상에 식물 대상에 속하는 각 화소에 대하여, 녹색 값 대 적색 값의 비율 (암호화 색상에 대하여 RGB 모델에서)이 계산된다. 녹색 지수는 녹색 대 적색의 비율이 주어진 역치를 능가하는 화소의 백분율로 표시된다. 정상적인 생장 조건 하에서, 염분 스트레스가 있는 생장 조건 하에서, 양분 이용도가 감소된 생장 조건 하에서 식물의 녹색 지수는 개화 전 마지막 화상에서 측정된다. 대조적으로, 가뭄 스트레스 생장 조건 하에서 식물의 녹색 지수는 가뭄 후의 첫 번째 화상에서 측정된다.

식물

본 발명에서 사용된 용어 "식물"은 전체식물, 식물 및 종자, 어린 줄기, 줄기, 잎, 뿌리 (괴경 포함), 꽃, 및 조직과 기관을 포함하는 식물 부분의 조상 및 자손을 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다. 용어 "식물"은 또한 식물 세포, 현탁 배양액, 캘러스 조직, 배, 분열조직, 배우체, 포자체, 화분 및 소포자를 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다.

본 발명의 방법에 유용한 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 하기를 포함하는 목록에서 선택된 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다: 에이서 (Acer spp.), 악티니디아 (Actinidia spp.), 아벨모스쿠스 (Abelmoschus spp.), 아가베 시살라나 (Agave sisalana), 아그로피론 (Agropyron spp.), 아그로스티스 스톨로니페라 ( Agrostis stolonifera ), 알리움 ( Allium spp.), 아마란투스 (Amaranthus spp.), 암모필라 아레나리아 (Ammophila arenaria ), 아나나스 코모수스 ( Ananas comosus ), 안노나 (Annona spp.), 아피움 그라베오렌스 (Apium graveolens), 아라키스 ( Arachis spp.), 알토칼푸스 ( Artocarpus spp.), 아스파라거스 오피시날리스 (Asparagus officinalis ), 아베나 ( Avena spp.) (예를 들면, 아베나 사티바 ( Avena sativa ), 아베나 파투아 ( Avena fatua), 아베나 비잔티나 (Avena byzantina), 아베나 파투아 var . 사티바 (Avena fatua var . sativa), 아베나 하이브리다 (Avena hybrida)), 아베로아 카람볼라 (Averrhoa carambola), 뱀부사 (Bambusa sp .), 베닌카사 히스피다 (Benincasa hispida ), 벨톨레티아 엑셀세아 (Bertholletia excelsea), 베타 불가리스 (Beta vulgaris ), 브라시카 (Brassica spp.) (예를 들면, 브라시카 나푸스 ( Brassica napus ), 브라시카 라파 (Brassica rapa ssp.) [캐놀라, 유채, 순무]), 카다바 파리노사 (Cadaba farinosa), 카멜리아 시넨시스 (Camellia sinensis), 칸나 인디카 (Canna indica), 칸나비스 사티바 (Cannabis sativa), 캡시쿰 ( Capsicum spp.), 카렉스 엘라타 (Carex elata), 카리카 파파야 (Carica papaya), 카리사 마크로칼파 (Carissa macrocarpa), 카리야 (Carya spp .), 카르타무스 팅크토리우스 (Carthamus tinctorius), 카스타네아 (Castanea spp.), 케이바 펜탄드라 (Ceiba pentandra), 키코리움 엔디비아 (Cichorium endivia ), 신나모뭄 (Cinnamomum spp .), 시트룰루스 라나투스 (Citrullus lanatus), 시트루스 (Citrus spp.), 코코스 (Cocos spp .), 코페아 ( Coffea spp.), 콜로카시아 에스쿨렌타 (Colocasia esculenta), 콜라 (Cola spp.), 콜코루스 (Corchorus sp.), 코리안드룸 사티붐 (Coriandrum sativum), 코리루스 (Corylus spp.), 크라태구스 (Crataegus spp.), 크로쿠스 사티부스 (Crocus sativus), 쿠쿨비타 (Cucurbita spp .), 쿠쿠미스 ( Cucumis spp.), 키나라 ( Cynara spp.), 다우쿠스 카로타 (Daucus carota), 데스모디움 ( Desmodium spp.), 디모칼푸스 론간 (Dimocarpus longan), 디오스코레아 (Dioscorea spp.), 디오스피로스 (Diospyros spp.), 에키노크로아 (Echinochloa spp .), 엘래이스 ((Elaeis (예를 들면, 엘래이스 귀넨시스 (Elaeis guineensis), 엘레이스 올레이페라 (Elaeis oleifera)), 엘레우신 코라카나 (Eleusine coracana), 에리안투스 (Erianthus sp .), 에리오보트리아 야포니카 (Eriobotrya japonica), 유카립투스 (Eucalyptus spp.), 유게니아 유니플로라 (Eugenia uniflora), 파고피룸 (Fagopyrum spp.), 파구스 (Fagus spp.), 페스투카 아룬디나케아 (Festuca arundinacea), 피쿠스 카리카 (Ficus carica), 폴투넬라 (Fortunella spp.), 프라가리아 (Fragaria spp.), 깅코 빌로바 (Ginkgo biloba), 글라이신 (Glycine spp.) (예를 들면, 글라이신 맥스 (Glycine max), 소야 히스피다 (Soja hispida) 또는 소야 맥스 (Soja max)), 고시피움 힐수툼 (Gossypium hirsutum), 헬리안투스 (Helianthus spp.) (예를 들면, 헬리안투스 안누스 (Helianthus annuus)), 헤메로칼리스 풀바 (Hemerocallis fulva), 히비스쿠스 (Hibiscus spp.) 홀데움 (Hordeum spp.) (예를 들면, 홀데움 불가레 (Hordeum vulgare)), 이포모에아 바타타스 (Ipomoea batatas ), 주글란스 (Juglans spp.), 락투카 사티바 (Lactuca sativa), 라티루스 (Lathyrus spp.), 렌스 쿨리나리스 (Lens culinaris), 리눔 우시타티시뭄 (Linum usitatissimum), 리치 키넨시스 (Litchi chinensis), 로투스 ( Lotus spp.), 루파 아쿠탄굴라 ( Luffa acutangula ), 루피누스 (Lupinus spp.), 루줄라 실바티카 (Luzula sylvatica), 라이코펠시콘 (Lycopersicon spp.) (예를 들면, 라이코펠시콘 에스쿨렌툼 (Lycopersicon esculentum ), 라이코펠시콘 라이코펠시쿰 (Lycopersicon lycopersicum), 라이코펠시콘 피리폴메 (Lycopersicon pyriforme)), 마크로틸로마 (Macrotyloma spp.), 말루스 (Malus spp.), 말피기아 에말기나타 (Malpighia emarginata), 맘메아 아메리카나 (Mammea americana), 망기페라 인디카 (Mangifera indica), 마니호트 ( Manihot spp.), 마닐카라 자포타 (Manilkara zapota), 메디카고 사티바 (Medicago sativa), 메릴로투스 (Melilotus spp.), 멘타 ( Mentha spp.), 미스칸투스 시넨시스 ( Miscanthus sinensis), 모몰디카 (Momordica spp.), 모루스 니그라 (Morus nigra), 무사 (Musa spp.), 니코티아나 ( Nicotiana spp.), 올레아 ( Olea spp.), 오푼티아 (Opuntia spp.), 오르니토푸스 (Ornithopus spp.), 오리자 (Oryza spp.) (예를 들면, 오리자 사티바 (Oryza sativa ), 오리자 라티포리아 ( Oryza latifolia)), 패니쿰 미리아케움 (Panicum miliaceum), 패니쿰 벌가툼 ( Panicum virgatum ), 파시플로라 에둘리스 (Passiflora edulis), 파스티나카 사티바 (Pastinaca sativa), 페니세툼 (Pennisetum sp .), 펠세아 (Persea spp.), 페트로셀리눔 크리스품 (Petroselinum crispum), 파라리스 아룬디나케아 (Phalaris arundinacea), 파세올루스 (Phaseolus spp.), 플레움 프라텐세 (Phleum pratense), 피닉스 (Phoenix spp .), 프라그미테스 오스트라리스 (Phragmites australis), 피사리스 (Physalis spp.), 피누스 ( Pinus spp.,) 피스타키아 베라 (Pistacia vera ), 피숨 (Pisum spp.), 포아 (Poa spp.), 포푸러스 ( Populus spp.), 프로소피스 ( Prosopis spp.), 프루누스 (Prunus spp.), 프시디움 (Psidium spp.), 푸니카 그라나툼 (Punica granatum), 피루스 코무니스 (Pyrus communis), 켈쿠스 (Quercus spp.), 라파누스 사티부스 (Raphanus sativus), 레움 라발바룸 (Rheum rhabarbarum), 리베스 (Ribes spp.), 리키누스 코무니스 ( Ricinus communis), 루부스 (Rubus spp.), 사카룸 (Saccharum spp.), 살릭스 ( Salix spp.), 삼부쿠스 ( Sambucus spp.), 세카레 세레알레 ( Secale cereale ), 세사뭄 ( Sesamum spp.), 시나피스 ( Sinapis sp .), 솔라눔 (Solanum spp.) (예를 들면, 솔라눔 투베로숨 ( Solanum tuberosum ), 솔라눔 인테그리폴리움 (Solanum integrifolium) 또는 솔라눔 라이코펠시쿰 (Solanum lycopersicum)), 솔굼 바이칼라 ( Sorghum bicolor ), 스피나시아 (Spinacia spp.), 시지기움 (Syzygium spp.), 타게테스 ( Tagetes spp.), 타마린두스 인디카 ( Tamarindus indica ), 테오브로마 카카오 (Theobroma cacao ), 트리폴리움 (Trifolium spp.), 트리티코세칼레 림파우이 ( Triticosecale rimpaui ), 트리티쿰 (Triticum spp. (예를 들면, 트리티쿰 아에스티붐 (Triticum aestivum ), 트리티쿰 두룸 (Triticum durum ), 트리티쿰 툴기둠 (Triticum turgidum ), 트리티쿰 하이베르눔 (Triticum hybernum ), 트리티쿰 마차 (Triticum macha ), 트리티쿰 사티붐 (Triticum sativum ) 또는 트리티쿰 불가레 (Triticum vulgare)), 트로패오룸 미누스 (Tropaeolum minus), 트로패오룸 마주스 (Tropaeolum majus), 박시니움 (Vaccinium spp.), 비시아 (Vicia spp.), 비그나 (Vigna spp.), 비올라 오도라타 (Viola odorata), 비티스 ( Vitis spp.), 제아 메이즈 (Zea mays), 지자니아 팔루스트리스 (Zizania palustris), 지지푸스 (Ziziphus spp.).

발명의 상세한 설명

놀랍게도, 이제 하기로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절로 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 발견되었다:

PEPC (phosphoenolpyruvate carboxylase),

Class III U-Box 단백질 및

PQQC 단백질.

첫 번째 구현예에 따라, 본 발명은 PEPC 단백질을 암호화하는 핵산의 식물에서의 발현의 조절을 포함하는, 대조구 식물에 비하여 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.

일 구현예에서, PEPC 단백질을 암호화하는 핵산의 발현을 조절하는 (바람직하게는, 증가시키는) 방법은 PEPC 단백질을 암호화하는 핵산을 식물에 도입 및 발현시키는 것이다

일 구현예에서, Class III U-Box 단백질을 암호화하는 핵산의 발현을 조절하는 (바람직하게는, 증가시키는) 방법은 Class III U-Box 단백질을 암호화하는 핵산을 식물에 도입 및 발현시키는 것이다

일 구현예에서, PQQC 단백질을 암호화하는 핵산의 발현을 조절하는 (바람직하게는, 증가시키는) 방법은 PQQC 단백질을 암호화하는 핵산을 식물에 도입 및 발현시키는 것이다

일 구현예에서, 이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 PEPC 단백질을 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 PEPC 단백질을 암호화하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산은 (따라서 본 발명의 방법의 수행에 유용한) 하기에 기재될 유형의 단백질을 암호화하는 임의의 핵산이며, 이후 또한 "PEPC 핵산" 또는 "PEPC 유전자"라 칭한다.

일 구현예에서, 이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 Class III U-Box 단백질을 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 Class III U-Box 단백질을 암호화하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산은 (따라서 본 발명의 방법의 수행에 유용한) 하기에 기재될 유형의 단백질을 암호화하는 임의의 핵산이며, 이후 또한 "Class III U-Box 핵산" 또는 "Class III U-Box 유전자"라 칭한다.

일 구현예에서, 이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 PQQC 단백질을 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 PQQC 단백질을 암호화하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산은 (따라서 본 발명의 방법의 수행에 유용한) 하기에 기재될 유형의 단백질을 암호화하는 임의의 핵산이며, 이후 또한 "PQQC 핵산" 또는 "PQQC 유전자"라 칭한다.

본 발명에서 정의된 "PEPC 폴리펩티드"는 서열번호 2로 표시된 PEPC 폴리펩티드 및 PEPC 폴리펩티드의 오쏘로그 및 패럴로그를 말한다. 서열번호 2의 오쏘로그 및 패럴로그는 소위 상호간 블라스트(reciprocal blast) 탐색을 수행하면 동정될 수 있다. 전형적으로, 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 1의 표 9 내지 표 11에 열거된 임의의 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST)(조회 서열은 서열번호 1 또는 서열번호 2이며, 두 번째 BLAST는 따라서 시네코시스티스(Synechocystis) 서열과 대조하는 것이다). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.

Class III U-Box 폴리펩티드를 암호화하는 핵산의 예는 본 발명의 실시예 1의 표 9 내지 표 11에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열이 서열번호 75로 표시된 Class III U-Box 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 소위 상호간 블라스트(reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있다. 전형적으로, 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 1의 표 9 내지 표 11에 열거된 임의의 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST)(조회 서열은 서열번호 74 또는 서열번호 75, 두 번째 BLAST는 따라서 캡시쿰(Capsicum) 서열과 대조하는 것이다). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.

본 발명에서 정의된 "PQQC 폴리펩티드"는 서열번호 105로 표시된 PQQC 폴리펩티드 및 PQQC 폴리펩티드의 오쏘로그 및 패럴로그를 말한다. 서열번호 105의 오쏘로그 및 패럴로그는 소위 상호간 블라스트(reciprocal blast) 탐색을 수행하면 동정될 수 있다. 전형적으로, 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 1의 표 9 내지 표 11에 열거된 임의의 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST)(조회 서열은 서열번호 104 또는 서열번호 105, 두 번째 BLAST는 따라서 슈도모나스(Pseudomonas) 서열과 대조하는 것이다). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.

높은 ranking hits은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 의미있다 (또는 다른 말로, 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에다가, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 다음에 neighbour joining tree가 사용된다.

바람직하게는, PEPC 폴리펩티드는 서열번호 2로 표시된 폴리펩티드에, 증가하는 순으로 선호되는, 적어도 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 가진다.

바람직하게는, PEPC 폴리펩티드는 서열번호 2로 표시된 폴리펩티드의 C-말단 영역에, 증가하는 순으로 선호되는, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 가진 보존된 C-말단 영역을 가진다. 당업자는 단백질의 C-말단 영역의 한도를 주지하고 있다. C-말단 영역은 단백질의 말단 약 3분의 1인 것으로 간주될 수 있다.

PEPC 폴리펩티드는 PEPC를 포함하는 종들 간에 잘 보존된 몇 모티프를 포함한다. 예를 들면, 하기 모티프 I에서 IV까지는 전형적으로 식물 및 미생물 양자의 PEPC에서 발견된다.

모티프 I: QEIMVGYSDSNKD

모티프 II: FHGRGGSVGRGGGPAYKAIL

모티프 III: LRAIPWVF

모티프 IV: GIAAGMRNTG

본 발명의 방법에 유용한 PEPCs는 따라서 바람직하게는 모티프 I 내지 IV 중 임의의 하나 이상을 포함한다.

본 발명의 방법에 유용한 PEPCs는 모티프 I 내지 IV 중 임의의 하나 이상에, 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 가지는 모티프를 포함할 수 있다.

모티프 I은 바람직하게는: QE V/I M I/L/V GYSDS G/N/S K D/F 이다.

모티프 II는 바람직하게는: FHGRGG T/S V/I GRGGGP T/S/A H/Y L/I/E/D/K AI L/Q/V 이다.

모티프 III은 바람직하게는: LRAIPW I/L/V F 이다.

모티프 IV는 바람직하게는: G I/V A/S AG L/M Q/R/K N T/S G 이다.

미생물의 PEPC 폴리펩티드는 또한 미생물계에서 잘 보존된 몇 모티프, 예를 들면, 하기의 모티프 V를 포함한다.

모티프 V: SGFLSSNWE

모티프 V는 바람직하게는: S/G G F/I L/T/V S/T S N/Q/G WE 이다.

모티프 V 또는 모티프 V에, 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 가지는 모티프는 본 발명의 방법의 수행에 유용할 수 있다.

식물의 PEPC 폴리펩티드는 또한 식물계에서 잘 보존된 몇 모티프, 예를 들면, 하기의 모티프 VI를 포함한다.

모티프 VI: SYKEWPEDKR

모티프 VI는 바람직하게는: S/T Y S/L/K/A/R/Q E/K/D W S/P/T/D E E/D R/G/K/Q R/K 이다.

모티프 VI 또는 모티프 VI에, 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%의 동일성을 가지는 모티프는 본 발명의 방법의 수행에 유용할 수 있다.

본 발명에서 정의된 "Class III U-Box 폴리펩티드" 는 하기를 포함하는 임의의 폴리펩티드를 말한다: 단백질의 N-말단 영역에 U-Box 도메인.

바람직하게는, U-box 도메인은, 서열번호 76의 U-box 도메인에, 증가하는 순으로 선호되는, 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지며; 및/또는 모티프 VII: GI T/S YDR E/S/D/A N/S/G/A I E/A K/R/M W L/M/V/I F/L/A 및/또는 모티프 II: Q S/A/G W C/G/A I/R/A/T S/V/I/R/A H/N/R/N/V A/C/S를 포함한다.

가장 바람직하게는, 모티프 VII은: GITYDRENIERWIF (서열번호 77), 또는 모티프 VII에, 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지는 모티프이며;

모티프 VIII은: QSWCTLNA (서열번호 78) 또는 모티프 VIII에, 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지는 모티프이다.

부가적으로, Class III U-Box 폴리펩티드는 C-말단 영역에 하기 모티프 중 하나 이상을 포함할 수 있다:

모티프 IX: GR S/A/L A/E L/F L/V S/K/N/A H

모티프 X: G/A I/L/V A A/I/V V S/C/A/G/T K/C/R R/K/A A/I/V/T M/L/T R V/L/I S/P

모티프 XI: K/R L C/L F/V/M/L V/I/A V/I/A/I Q/R V/A/S D/S/G/E

모티프 XII: S/A/L YP

가장 바람직하게는, 모티프 IX은: GRAELLNH (서열번호 79) 또는 모티프 IX에, 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지는 모티프이며;

모티프 X 은: GLAIVSKKILRVS (서열번호 80) 또는 모티프 X에, 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지는 모티프이며;

모티프 XI 은: KLCLVLQVD (서열번호 81) 또는 모티프 XI에, 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지는 모티프이며; 및

모티프 XII 는: SYP (서열번호 82) 또는 모티프 XII에, 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지는 모티프이다.

Class III U-Box 폴리펩티드는 전장의 U-box 단백질을 포함하는 계통수에서 전형적으로 임의의 다른 종류의 U-box 단백질보다는 다른 Class III U-Box 폴리펩티드와 클러스터한다.

Class III U-Box 폴리펩티드 전형적으로 서열번호 75로 표시된 Class III U-box 폴리펩티드에, 증가하는 순으로 선호되는, 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가진다.

바람직하게는, PQQC 폴리펩티드는 서열번호 105로 표시된 폴리펩티드에, 증가하는 순으로 선호되는, 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 가진다.

PQQC 폴리펩티드를 암호화하는 핵산의 예는 본 발명의 실시예 1의 표 9 내지 표 11에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열은 서열번호 105로 표시된 PQQC 폴리펩티드의 오쏘로그 및 패럴로그의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다.

용어 "도메인" 및 "모티프"는 본 발명의 "정의" 섹션에 정의되어 있다. 도메인 동정을 위한 전문가 데이터베이스, 예를 들면 SMART (Schultz 등 (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic 등 (2002) Nucleic Acids Research, 30 242- 244), InterPro (Mulder 등, (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher 및 Bairoch (1994), generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo 등, Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman 등, Nucleic Acids Research 30(1): 276-280 (2002))이 존재한다. 단백질 서열의 인 실리코 분석용 도구 세트가 ExPASY 프로테오믹스 서버에서 유용하다 (Swiss Institute of Bioinformatics (Gasteiger 등, ExPASy: proteomics server for in-depth 단백질 knowledge 및 analysis, Nucleic Acids Res. 31: 3784-3788 (2003)). 도메인은 또한 서열 정렬과 같은 통상적인 기술을 사용하여서도 동정될 수 있다.

비교를 위한 서열정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는(matches) 수는 최대로, 공백(gaps)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘을 사용한다. BLAST 알고리즘 (Altschul 등 (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 복수 서열정렬 알고리즘 (multiple sequence alignment algorithm; version 1.83)을 사용하여, 디폴트 페어와이즈 정렬 변수(default pairwise alignment 매개변수) 및 백분율로 스코링(scoring)하는 방법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell 등, BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 서열 동일성 값은 핵산 또는 아미노산 전체 서열에 걸쳐, 또는 선택된 도메인 또는 보존된 모티프(들)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default 매개변수)를 사용하여 결정될 수 있다.

PEPC 폴리펩티드를 암호화하는 핵산의 예는 본 발명의 실시예 1의 표 9 내지 표 11 에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열은 서열번호 2로 표시된 PEPC 폴리펩티드의 오쏘로그(orthologue) 및 패럴로그(paralogue)의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다.

PEPC의 또 다른 바람직한 특징은 포스포에놀피루베이트 (PEP)에 CO₂의 부가를 촉매하여 4-탄소 화합물인 옥살로아세테이트를 형성하는 것이다:

PEP + CO₂ → 옥살로아세테이트 + Pi

PEPC 활성의 측정은, Chen 등 2002 (Plant Cell Physiol 43(2): 159-169); 및 Chen 등 2004 (Planta 219 pp440-449)에 기재되어 있다.

PEPC의 또 다른 특징은 효소 분류 코드 EC 4.1.1.31 하에 있다.

본 발명의 일 구현예는 서열번호 2의 폴리펩티드 서열을 암호화하는 서열번호 1로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 PEPC 암호화 핵산 또는 PEPC 폴리펩티드를 사용하여 수행될 수 있다.

더욱이, Class III U-Box 폴리펩티드 (적어도 자연형에서)는 전형적으로 E3 유비퀴틴 리가아제(ubiquitin ligase) 활성을 가진다 (Cho 등 2006 참고).

본 발명의 일 구현예는 서열번호 75의 폴리펩티드 서열을 암호화하는 서열번호 74로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 Class III U-Box 암호화 핵산 또는 Class III U-Box 폴리펩티드를 사용하여 수행될 수 있다.

PQQC의 또 다른 특징은 PQQ 생합성의 마지막 단계를 촉매하는 것이다.

본 발명의 일 구현예는 서열번호 105의 폴리펩티드 서열을 암호화하는 서열번호 104로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 PQQC 암호화 핵산 또는 PQQC 폴리펩티드를 사용하여 수행될 수 있다.

핵산 변이체도 본 발명의 방법의 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중 임의의 하나의 상동체 및 유도체를 암호화하는 핵산을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 본 발명의 방법에는 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 암호화하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다.

본 발명의 방법의 수행에 유용한 또 다른 핵산 변이체는 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 일부, PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산에 혼성화하는 핵산, PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 스플라이스 변이체, PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 대립인자 변이체, 및 유전자 셔플링에 의해 얻은 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 변이체를 포함한다. 용어 혼성화하는 서열, 스플라이스 변이체, 대립인자 변이체, 및 유전자 셔플링은 본 발명에 기재되어 있다.

본 발명의 방법의 수행은 전장 핵산 서열의 사용에 의존하지 않으므로, PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산은 전장 핵산일 필요는 없다. 본 발명에서는, 실시예 1의 표 9 내지 표 11에 제시된 핵산 서열 중 임의의 하나의 일부, 또는 실시예 1의 표 9 내지 표 11에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 일부를 식물에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.

핵산의 일부분은 예를 들면, 핵산에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 암호화 (또는 비암호화) 서열에 융합될 수도 있다. 다른 암호화 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.

일 구현예에서, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 PEPC 폴리펩티드를 암호화하며, 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 1의 표 9 내지 표 11에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그(orthologue) 또는 패럴로그(paralogue)를 암호화하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 2000, 2250, 2500, 2750, 3000, 3100 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 1의 표 9 내지 표 11에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 1의 핵산의 일부분이다.

일 구현예에서, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 Class III U-Box 폴리펩티드를 암호화하며, 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 1의 표 9 내지 표 11에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그(orthologue) 또는 패럴로그(paralogue)를 암호화하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 1의 표 9 내지 표 11에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 74의 핵산의 일부분이다.

일 구현예에서, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 PQQC 폴리펩티드를 암호화하며, 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 1의 표 9 내지 표 11에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그(orthologue) 또는 패럴로그(paralogue)를 암호화하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 500, 550, 600, 650, 700, 750 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 1의 표 9 내지 표 11에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 104의 핵산의 일부분이다.

본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건 하에서, 바람직하게는 스트린전트 조건 하에서, 본 발명에서 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산이다.

본 발명에 따라, 실시예 1의 표 9 내지 표 11에 제시된 핵산 서열 중 임의의 하나와 혼성화가 가능한 핵산, 또는 실시예 1의 표 9 내지 표 11에 제시된 임의의 핵산 서열의 오쏘로그(orthologue), 패럴로그(paralogue) 또는 상동체를 암호화하는 핵산과 혼성화가 가능한 핵산의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다

본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 PEPC 폴리펩티드를 암호화하며, 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 1의 표 9 내지 표 11에 제시된 핵산 중의 임의의 하나에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 1의 표 9 내지 표 11에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 1, 서열번호 74 및 서열번호 104로 이루어진 그룹에서 선택된 서열로 표시된 핵산에 또는 그 일부에 혼성화가 가능하다.

본 발명의 방법의 수행에 유용한 또 다른 핵산 변이체는 상기에 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 스플라이스 변이체이며, 스플라이스 변이체는 본 발명에 정의되어 있다.

본 발명에 따라, 실시예 1의 표 9 내지 표 11에 제시된 핵산 서열 중 임의의 하나의 스플라이스 변이체, 또는 실시예 1의 표 9 내지 표 11에 제시된 임의의 아미노산 서열의 오쏘로그(orthologue), 패럴로그(paralogue) 또는 상동체를 암호화하는 핵산의 스플라이스 변이체의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다

일 구현예에서, 바람직한 스플라이스 변이체는 서열번호 1에 제시된 핵산의 스플라이스 변이체, 또는 서열번호 2의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 스플라이스 변이체이다.

일 구현예에서, 바람직한 스플라이스 변이체는 서열번호 74에 제시된 핵산의 스플라이스 변이체, 또는 서열번호 75의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 스플라이스 변이체이다.

일 구현예에서, 바람직한 스플라이스 변이체는 서열번호 104에 제시된 핵산의 스플라이스 변이체, 또는 서열번호 105의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 스플라이스 변이체이다.

본 발명의 방법의 수행에 유용한 또 다른 핵산 변이체는 상기 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 대립인자 변이체이며, 대립인자 변이체는 본 발명에 정의되어 있다.

본 발명에 따라, 실시예 1의 표 9 내지 표 11에 제시된 임의의 핵산의 대립인자 변이체의 식물에의 도입 및 발현, 또는 실시예 1의 표 9 내지 표 11에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 대립인자 변이체의 식물에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.

일 구현예에서, 본 발명의 방법에 유용한 대립인자 변이체는 서열번호 2의 PEPC 폴리펩티드 및 실시예 1의 표 9 내지 표 11에 제시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 1의 대립인자 변이체 또는 서열번호 2의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 대립인자 변이체이다.

일 구현예에서, 본 발명의 방법에 유용한 대립인자 변이체는 서열번호 75의 Class III U-Box 폴리펩티드 및 실시예 1의 표 9 내지 표 11에 제시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 74의 대립인자 변이체 또는 서열번호 75의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 대립인자 변이체이다.

일 구현예에서, 본 발명의 방법에 유용한 대립인자 변이체는 서열번호 105의 PQQC 폴리펩티드 및 실시예 1의 표 9 내지 표 11에 제시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 104의 대립인자 변이체 또는 서열번호 105의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 대립인자 변이체이다.

유전자 셔플링 또는 방향진화는 또한 상기 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에 정의되어 있다.

본 발명에 따라, 실시예 1의 표 9 내지 표 11에 제시된 핵산 서열 중의 임의의 하나의 변이체의 식물에의 도입 및 발현을 포함하는, 또는 실시예 1의 표 9 내지 표 11에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 변이체의 식물에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체 핵산은 유전자 셔플링에 의해 얻어진다.

더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이유발을 달성하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biology. Wiley Eds).

일 구현예에서, PEPC 폴리펩티드를 암호화하는 핵산은 자연적인 또는 인공적인 출처로부터 유래될 수 있다. 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 PEPC 폴리펩티드 암호화 핵산은 세균으로부터, 더욱 바람직하게는 시네코코쿠스(Synechococcus), 아나시스티스(Anacystis), 아나베나(Anabaena), 노스톡(Nostoc), 프로클로로코쿠스(Prochlorococcus), 아쓰로박터(Arthrobacter), 스텝토마이세스(Steptomyces), 키네코쿠스(Kineococcus), 니토박터(Nitobacter), 랄스토니아(Ralsstonia), 니트로조모나스(Nitrosomonas), 로도코쿠스(Rhodococcus), 로도슈도모나스(Rhodopseudomonas), 마이코박테리움(Mycobacterium), 네이세리아(Neiseria), 락토바실러스(Lactobacillus), 코리네박테리움(Corynebacterium) 중 임의의 하나로부터, 가장 바람직하게는 시네코시스티스(Synechocystis) 유래이다.

일 구현예에서, Class III U-Box 폴리펩티드를 암호화하는 핵산은 자연적인 또는 인공적인 출처로부터 유래될 수 있다. 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 Class III U-Box 폴리펩티드 암호화 핵산은 식물로부터, 더욱 바람직하게는 쌍자엽 식물로부터, 더욱 바람직하게는 가지과(Solanaceae)로부터, 가장 바람직하게는 상기 핵산은 고추(Capsicum annuum) 유래이다.

일 구현예에서, PQQC 폴리펩티드를 암호화하는 핵산은 자연적인 또는 인공적인 출처로부터 유래될 수 있다. 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 PQQC 폴리펩티드 암호화 핵산은 세균으로부터, 더욱 바람직하게는 슈도모나스(Pseudomonas) 유래이다.

본 발명의 방법의 수행은 향상된 수확량 관련 형질을 갖는 식물을 제공한다. 특히 본 발명의 방법의 수행은 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 상세하게 기재되어 있다.

특히 놀라운 것은 수확량의 증가가 Radchuck 등 2007의 교시로부터 기대된 것처럼, 더욱 큰 종자의 형태로 나타나는 것이 아니라, 각각 대조구 식물에 비해 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가를 포함하나 이에 제한되지 않는 일련의 형태인 변경된 수확량 관련 형질로 나타난다는 것이다.

본 발명에서 향상된 수확량 관련 형질에 대한 기준은 (수확 가능한) 지상부 및/또는 (수확 가능한) 지하부를 포함하여 하나 이상의 식물체의 일부분의 생물량 (중량)의 증가를 의미한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 갖는 식물이 된다.

옥수수를 예로 들면, 수확량 증가는 다음 중의 하나 이상으로 표시된다: 헥타르 또는 에이커당 식물체의 수 증가, 식물체당 이삭 (열매) 수의 증가, 낱알 줄의 수, 줄당 낱알의 수, 낱알 중량, 천립 중량, 열매 길이/직경의 증가, 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가. 벼를 예로 들면, 수확량 증가는 다음 중의 하나 이상의 증가로 표시된다: 헥타르 또는 에이커당 식물체의 수, 식물체당 원추화서의 수, 원추화서당 작은 이삭의 수, 원추화서당 소화의 수 (일차 원추화서 수에 대한 충만된 종자의 수의 비율로 표시된다), 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가, 천립중량의 증가.

본 발명은 대조구 식물에 비하여 수확량, 특히 식물의 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절하는, 바람직하게는 발현을 증가시키는 것을 포함한다.

본 발명에 따른 형질전환 식물은 수확량이 증가하므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 (생활사 중 적어도 일부에서) 증가된 생장 속도를 나타낼 것 같다.

증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 실질적으로 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 성숙된 건종자로부터 식물체가 출발 물질과 유사한 성숙한 건종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 증가된 생장 속도는 식물의 생활사 중의 하나 이상의 단계에서 또는 실질적으로 전체 식물 생활사 중에 나타날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가하면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가하면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 에이커당 년간 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 임의의 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에 (초기) 또는 수확기에 (후기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.

본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키는 방법을 제공하며, 상기 방법은 본 발명에 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다.

일 구현예에서, 식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 스트레스에 노출되든지 간에 수확량의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건하의 대조구 식물에 비하여 40%, 35% 또는 30% 미만, 바람직하게는 25%, 20% 또는 15% 미만, 더욱 바람직하게는 14%, 13%, 12%, 11% 또는 10% 미만이다. 실제로는 농업상의 진척 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 순한 스트레스는 식물이 노출되는 매일의 생물적 및/또는 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 결빙 온도에 의한 것이다. 비생물적 스트레스는 수분 스트레스 (특히 가뭄으로 인한)로 인한 삼투 스트레스, 염 스트레스, 산화적 스트레스 또는 이온 스트레스이다. 생물적 스트레스는 전형적으로 세균, 바이러스, 진균 및 곤충과 같은 병원균에 의해 야기된 스트레스이다.

특히, 본 발명의 방법은 대조구 식물에 비하여 증가된 수확량을 갖는 식물을 제공하기 위하여, 스트레스가 없는 조건 하에서 또는 순한 가뭄 조건 하에서 수행될 수 있다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. Rabbani 등 (Plant Physiol (2003) 133: 1755-1767)은 특히 가뭄 스트레스와 고염도 스트레스 간에 고도의 "혼선"을 기재하고 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 이들 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다. 본 발명에서 사용된 용어 "스트레스가 없는" 조건은 식물의 최적 생장을 허용하는 환경 조건이다. 당업자는 주어진 위치에서 정상적인 토양 조건 및 기후 조건을 인식하고 있다.

일 구현예에서, 식물이 스트레스가 없는 조건 하에 있든지 또는 순한 가뭄 하에 있든지 간에 수확량의 증가는 있었다. 본 발명의 방법의 수행으로 스트레스가 없는 조건 하에서 또는 순한 가뭄 스트레스 조건 하에서 자란 식물은 필적하는 조건 하에서 자란 대조구 식물에 비해 수확량이 증가되었다. 따라서, 본 발명에 따라 스트레스가 없는 조건 하에서 또는 순한 가뭄 스트레스 조건 하에서 키운 식물의 수확량을 증가시키는 방법을 제공하며, 상기 방법은 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 증가를 포함한다.

본 발명의 방법의 수행으로 양분결핍 조건 하에서, 특히 질소 결핍 조건 하에서 자란 식물은 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 갖게 된다. 따라서, 본 발명에 따라, 양분결핍 조건 하에서 키운 식물의 수확량을 증가시키는 방법을 제공하며, 그 방법은 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 증가시키는 것을 포함한다. 양분결핍은 무엇보다도 질소, 인산염 및 다른 인-함유 화합물, 칼륨, 칼슘, 카드뮴, 마그네슘, 망간, 철 및 붕소 같은 양분의 부족의 결과이다.

본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 이의 부분 (종자 포함)을 포함한다. 상기 식물 또는 이의 부분은 상기 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산 외래도입유전자(transgene)를 포함한다.

본 발명은 또한 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에의 도입 및/또는 발현을 용이하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물에의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에서 상기 정의된 유전자 구축물의 용도를 제공한다.

더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:

(a) 상기 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산;

(b) (a)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로

(c) 전사 종결 서열.

바람직하게는, 상기 PEPC 폴리펩티드를 암호화하는 핵산은 상기 정의된 바와 같다.

바람직하게는, 상기 Class III U-Box 폴리펩티드를 암호화하는 핵산은 상기 정의된 바와 같다.

바람직하게는, 상기 PQQC 폴리펩티드를 암호화하는 핵산은 상기 정의된 바와 같다.

용어 "조절 서열" 및 "전사 종결 서열"은 본 발명에서 정의된 바와 같다.

식물은 상기 기재된 임의의 핵산을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 주지하고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다.

유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있다. 본 발명의 "정의" 섹션에 다양한 프로모터 유형에 대해 정의되어 있다.

또한, 본 발명의 방법에 유용한 것은 어린 녹색조직 특이적 프로모터이다.

일 구현예에서, PEPC를 암호화하는 핵산은 본 발명에서 정의된 어린 녹색조직 특이적 프로모터에 작동가능하게 연결된다. 어린 녹색조직 특이적 프로모터는 바람직하게는 PcR (protochlorophyllide reductase) 프로모터이며, 더욱 바람직하게는 PcR 프로모터는 서열번호 71에 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 상기 프로모터는 서열번호 71로 표시된 것이다.

일 구현예에서, Class III U-box를 암호화하는 핵산은 본 발명에서 정의된 어린 녹색조직 특이적 프로모터에 작동가능하게 연결된다. 어린 녹색조직 특이적 프로모터는 바람직하게는 PcR (protochlorophyllide reductase) 프로모터, 더욱 바람직하게는 PcR 프로모터는 서열번호 101에 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 상기 프로모터는 서열번호 101로 표시된 것이다.

일 구현예에서, PQQC를 암호화하는 핵산은 본 발명에서 정의된 어린 녹색조직 특이적 프로모터에 작동가능하게 연결된다. 어린 녹색조직 특이적 프로모터는 바람직하게는 PcR (protochlorophyllide reductase) 프로모터, 더욱 바람직하게는 PcR 프로모터는 서열번호 131에 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 상기 프로모터는 서열번호 131로 표시된 것이다.

더욱이, 구성적 프로모터가 본 발명의 방법에 특히 유용하다. 구성적 프로모터는 바람직하게는 GOS2 프로모터이며, 바람직하게는 벼의 GOS2 프로모터이다. 더욱 바람직하게는 구성적 프로모터는 서열번호 227에 실질적으로 유사한 핵산 서열로 나타내며, 가장 바람직하게는 구성적 프로모터는 서열번호 227로 나타낸 것이다. 구성적 프로모터의 추가적인 예는 본 발명의 "정의" 섹션의 표 2를 참고한다.

본 발명의 적용은 서열번호 1로 나타낸 PEPC 암호화 핵산에 제한되지 않으며, 본 발명의 적용은 PcR 프로모터에 의해 추진 시 상기 PEPC 암호화 핵산의 발현에 제한되지 않는다는 것은 명백하다. 본 발명의 적용은 서열번호 74로 나타낸 U-box 암호화 핵산에 제한되지 않으며, 본 발명의 적용은 PcR 프로모터에 의해 추진 시 상기 U-box 암호화 핵산의 발현에 제한되지 않는다는 것은 명백하다. 본 발명의 적용은 서열번호 104로 나타낸 PQQC 암호화 핵산에 제한되지 않으며, 본 발명의 적용은 PcR 프로모터 또는 GOS2 프로모터에 의해 추진 시 상기 PQQC 암호화 핵산의 발현에 제한되지 않는다는 것은 명백하다.

본 발명의 방법의 수행에 사용될 수 있는 다른 (어린) 녹색 조직 특이적 프로모터의 예는 본 발명의 표 8에 제시되어 있으며, 다른 구성적 프로모터의 예 또한 표 2에 제시되어 있다.

선택적으로, 하나 이상의 종결신호 서열이 식물에 도입된 구축물에 사용될 수 있다. 부가적인 조절 인자는 전사뿐 아니라 해독 인핸서를 포함한다. 본 발명을 수행함에 있어 사용하기에 적절한 종결신호 및 인핸서 서열이 당업자에게 공지되어 있다. "정의" 섹션에 기재된 바와 같이, 세포질 내에 축적되는 성숙한 메시지의 양 증가를 위하여 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.

본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제원점 서열을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.

본 발명의 방법에 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산 서열을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다. 마커 유전자는 더 이상 필요하지 않을 시 형질전환 세포로부터 제거 또는 절단될 수 있다. 마커 제거 기술은 당업계에 공지되어 있으며, 유용한 기술은 상기 정의 섹션에 기재되어 있다.

본 발명은 또한 상기에서 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 임의의 핵산의 식물에서의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 생산하는 방법을 제공한다.

더욱 상세하게, 본 발명은 하기 단계를 포함하는 증가된 향상된 수확량 관련 형질, 특히 증가된 (종자) 수확량을 가진 형질전환 식물을 생산하는 방법을 제공한다:

(i) PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산을 식물 또는 식물 세포에의 도입 및 발현하는 단계; 및

(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.

일 구현예에서, 상기 (i)의 핵산은 본 발명에서 정의된 PEPC 폴리펩티드를 암호화할 수 있는 임의의 핵산일 수 있다.

일 구현예에서, 상기 (i)의 핵산은 본 발명에서 정의된 Class III U-Box 폴리펩티드를 암호화할 수 있는 임의의 핵산일 수 있다.

일 구현예에서, 상기 (i)의 핵산은 본 발명에서 정의된 PQQC 폴리펩티드를 암호화할 수 있는 임의의 핵산일 수 있다.

상기 핵산은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 핵산은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.

유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다

일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 암호화되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.

DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 두 기술은 당업자에게 주지되어 있다.

생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다. 생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.

본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.

본 발명은 또한 상기에 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 분리된 핵산을 포함하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 본 발명의 방법에 따라 사용된 핵산 또는 벡터, 발현 카세트(cassette) 또는 구축물 또는 벡터에 대한 숙주 식물은 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한, 모든 식물이다.

본 발명의 방법은 유리하게 임의의 식물에 적용될 수 있다. 본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다. 본 발명의 바람직한 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 대두, 해바라기, 캐놀라, 알팔파, 유채, 목화, 토마토, 감자 및 담배를 포함한다. 더욱 바람직하게는, 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다. 더욱 바람직하게는 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 라이밀, 호밀, 수수 및 귀리를 포함한다.

본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 뿌리, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이 부분에 제한되지는 않는다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 상기 식물의 수확 가능한 부분으로부터 바람직하게는 직접적으로 유래된 생산물에 관련된다.

본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화되어 있으며, 정의 섹션에 예가 제시되어 있다.

상기 언급된 바와 같이, PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 발현을 조절하는 (바람직하게는 증가시키는) 바람직한 방법은 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물로의 도입 및 발현이다; 그러나 상기 방법의 수행 효과는 즉, 수확량 관련 형질을 향상시키는 방법은 T-DNA 활성화 태깅, 틸링(TILLING), 상동 재조합을 포함하여 다른 잘 알려진 기술을 사용하여 행할 수도 있으며, 이에 제한되지 않는다. 상기 기술은 정의 섹션에 기재되어 있다.

일 구현예에서, 본 발명은 또한 본 발명에 기재된 PEPC 폴리펩티드를 암호화하는 핵산의 용도, 및 식물의 임의의 전술한 수확량 관련 형질을 향상시키는 상기 PEPC 폴리펩티드의 용도를 포함한다.

일 구현예에서, 본 발명은 또한 본 발명에 기재된 Class III U-Box 폴리펩티드를 암호화하는 핵산의 용도, 및 식물의 임의의 전술한 수확량 관련 형질을 향상시키는 상기 Class III U-Box 폴리펩티드의 용도를 포함한다.

일 구현예에서, 본 발명은 또한 본 발명에 기재된 PQQC 폴리펩티드를 암호화하는 핵산의 용도, 및 식물의 임의의 전술한 수확량 관련 형질을 향상시키는 상기 PQQC 폴리펩티드의 용도를 포함한다.

본 발명에서 기재된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산 또는 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드 그 자체는 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드 암호화 유전자에 유전적으로 연결된 DNA 마커가 동정된 육종 프로그램에 용도가 있다. 핵산/유전자, 또는 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드 그 자체는 분자 마커를 정의하는데 사용될 수 있다. 이 DNA 또는 단백질 마커는 상기 본 발명의 방법에 정의된 향상된 수확량 관련 형질을 갖는 식물을 선발하는 육종 프로그램에 사용된다.

PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산/유전자의 대립인자 변이체는 또한 마커 보조 육종 프로그램에 사용된다. 상기 육종 프로그램은 때때로 예를 들면, EMS 돌연변이 유발을 사용하여 식물에 돌연변이 유발 처리로 대립인자 변이의 도입을 필요로 하며 다르게는, 그 프로그램은 자연발생적으로 생성된 "자연적인" 기원의 대립인자 변이체의 수집물로부터 시작될 수도 있다. 그러면 대립인자 변이체의 동정은 예를 들면, PCR로 한다. 문제되는 서열의 수확량을 증가시키는 우수한 대립인자 변이체의 선발 단계가 잇따른다. 선발은 전형적으로 문제되는 서열의 다른 대립인자 변이체를 함유하는 식물의 생장 능력을 관찰함으로써 이루어진다. 생장 능력은 온실 또는 야외에서 관찰할 수 있다. 추가적으로 선택 가능한 단계는 우수한 대립인자 변이체가 동정된 식물과 또 다른 식물의 교배를 포함한다. 이는 예를 들면, 관심을 유발하는 표현형적 특징의 조합을 만드는데 사용될 수 있다.

PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산은 또한 이 유전자에 대한 유전자 및 물리지도 제작용 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다. 상기 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산 서열 사용에는 적어도 길이 15 뉴클레오티드의 핵산 서열만이 필요하다. PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산은 RFLP (restriction fragment length polymorphism) 마커로 사용될 수 있다. 제한효소 절단된 식물 게놈 DNA의 서던 블럿 (Sambrook J, Fritsch EF 및 Maniatis T (1989) Molecular Cloning, Laboratory Manual)은 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산으로 이 프로빙될 수 있다. 생성된 밴드 패턴으로 유전자지도 제작을 위하여 MapMaker (Lander 등 (1987) Genomics 1: 174-181) 같은 컴퓨터 프로그램을 사용하여 유전적 분석을 하게 된다. 또한, 핵산은 지정된 유전적 교배의 양친 및 자손을 나타내는 개체들 세트의 제한 효소 처리된 게놈 DNA를 포함하는 서던 블럿에 탐침으로 사용될 수 있다. DNA 다형성의 분리를 기록하여, 이 집단을 이용하여 이전에 얻었던 유전자 지도상에 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 위치 계산에 사용한다 (Botstein 등 (1980) Am. J. Hum. Genet. 32:314-331).

유전자 지도 제작에 사용하기 위한 식물 유전자 유래 탐침의 생산 및 사용은 [Bematzky 및 Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41]에 기재되어 있다. 수많은 공개문헌이 상기 개설된 방법론 또는 이의 변형을 사용하여 특정 cDNA 클론의 유전자 지도 제작을 기술한다. 예를 들면, F2 이종교배 개체군, 역교배 개체군, 무작위 교배 개체군, 근동질유전자계통, 및 다른 세트의 개체가 유전자 지도 제작에 사용될 수 있다. 상기 방법론은 당업자에게 주지되어 있다.

핵산 탐침은 또한 물리 지도에 제작 사용될 수 있다 (즉, 물리 지도상에 서열의 위치 Hoheisel 등 In: Non-mammalian Genomic Analysis: Practical Guide, Academic press 1996, pp. 319-346, 인용된 문헌 참조).

또 다른 구현예에 있어서, 핵산 탐침은 직접적인 형광 인 시투 혼성화 (fluorescence in situ hybridisation, FISH) 지도 제작에 사용될 수 있다 (Trask (1991) Trends Genet. 7:149-154). 비록 현 FISH 지도 제작 방법이 큰 클론에 유리하지만 (수 kb 내지 몇백 kb; Laan 등 (1995) Genome Res. 5:13-20), 감도가 향상되면 더욱 짧은 탐침으로 FISH 지도 제작이 가능해진다.

유전자지도 및 물리지도 작성을 위한 핵산증폭에 근거한 다양한 방법이 핵산 서열을 사용하여 수행될 수 있다. 예는 대립인자 특이적 증폭 (allele-specific amplification, Kazazian (1989) J. Lab. Clin. Med 11:95-96), CAPS (polymorphism of PCR-amplified fragments; Sheffield 등 (1993) Genomics 16:325-332), 대립인자 특이적 라이게이션 (allele-specific ligation, Landegren 등 (1988) Science 241:1077-1080), 뉴클레오티드 신장 반응 (nucleotide extension reactions, Sokolov (1990) Nucleic Acid Res. 18:3671), Radiation Hybrid Mapping (Walter 등 (1997) Nat. Genet. 7:22-28) 및 Happy Mapping (Dear 및 Cook (1989) Nucleic Acid Res. 17:6795-6807)을 포함한다. 이들 방법을 위해서 증폭 반응 또는 프라이머 연장 반응에 사용하기 위한 프라이머 쌍을 고안하고 제작하기 위해 핵산 서열이 사용된다. 상기 프라이머의 고안은 당업자에게는 주지되어 있다. PCR에 근거한 유전자 지도 제작에 사용하는 방법에서는 핵산 서열에 해당하는 영역에서 교배 양친 간의 DNA 서열 차이를 알 필요가 있다. 그러나 이는 일반적으로 지도제작 방법에는 필요하지 않다.

본 발명의 방법에 따른 방법은 상기에서 기재된 수확량 관련 형질이 향상된 식물을 초래한다. 상기 형질은 또한 추가적인 수확량 향상 형질, 다른 비생물적 및 생물적 스트레스에 대한 내성, 다양한 외형적 특질 및/또는 생화학적 및/또는 생리적 특질을 변형시키는 형질과 같은 다른 경제적으로 유용한 형질과 조합될 수도 있다.

본 명세서에서 사용된 용어 "표 9 내지 표 11"는 표 9, 10 및/또는 11의 내용을 명시한다. 본 명세서에서 사용된 용어 "표 9 "은 표 9 의 내용을 명시한다. 본 명세서에서 사용된 용어 "표 10"는 표 10 의 내용을 명시한다. 본 명세서에서 사용된 용어 "표 11"은 표 11 의 내용을 명시한다.

바람직한 일 구현예에서, 용어 "표 9 내지 표 11"은 표 9을 의미한다. 바람직한 일 구현예에서, 용어 "표 9 내지 표 11"는 표 10를 의미한다. 바람직한 일 구현예에서, 용어 "표 9 내지 표 11"는 표 11을 의미한다.

일 구현예에서, 본 발명은 하기에 요약된 주제에 관한 것이다:

조항(item) 1. PEPC (phosphoenolpyruvate carboxylase) 단백질을 암호화하는 핵산의 식물에서의 발현의 조절을 포함하는, 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.

조항 2. 조항 1에 있어서, 상기 PEPC 단백질은 서열번호 2 및 상기 서열의 오쏘로그(orthologue) 및 패럴로그(paralogue)인 것을 특징으로 하는 방법.

조항 3. 조항 1 또는 조항 2에 있어서, 상기 PEPC 단백질은 서열번호 2로 표시된 폴리펩티드의 C-말단 영역에 증가하는 순으로 선호되는, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 가지는 C-말단 영역을 가지는 것을 특징으로 하는 방법.

조항 4. 조항 1 내지 조항 3 중 어느 한 조항에 있어서, 상기 PEPC 단백질은 하기 모티프 중 임의의 하나 이상을 포함하는 것을 특징으로 하는 방법:

모티프 I: QEIMVGYSDSNKD, 또는 모티프 I에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%를 가지는 모티프;

모티프 II: FHGRGGSVGRGGGPAYKAIL, 또는 모티프 II에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%를 가지는 모티프;

모티프 III: LRAIPWVF, 또는 모티프 III에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%를 가지는 모티프;

모티프 IV: GIAAGMRNTG, 또는 모티프 IV에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%를 가지는 모티프;

모티프 V: SGFLSSNWE, 또는 모티프 V에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%를 가지는 모티프;

모티프 VI: SYKEWPEDKR, 또는 모티프 VI에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99%를 가지는 모티프.

조항 5. 조항 4에 있어서, 상기

모티프 I은 바람직하게는: QE V/I M I/L/V GYSDS G/N/S K D/F;

모티프 II는 바람직하게는: FHGRGG T/S V/I GRGGGP T/S/A H/Y L/I/E/D/K AI L/Q/V;

모티프 III은 바람직하게는: LRAIPW I/L/V F;

모티프 IV는 바람직하게는: G I/V A/S AG L/M Q/R/K N T/S G;

모티프 V는 바람직하게는: S/G G F/I L/T/V S/T S N/Q/G WE;

모티프 VI은 바람직하게는: S/T Y S/L/K/A/R/Q E/K/D W S/P/T/D E E/D R/G/K/Q R/K 인 것을 특징으로 하는 방법.

조항 6. 조항 1 내지 조항 5 중 어느 한 조항에 있어서, 상기 조절된 발현은 PEPC 폴리펩티드를 암호화하는 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.

조항 7. 조항 1 내지 조항 6 중 어느 한 조항에 있어서, 상기 PEPC 폴리펩티드를 암호화하는 핵산은 표 9 내지 표 11에 열거된 단백질 중 임의의 하나를 암호화하거나, 또는 상기 핵산의 부분, 또는 상기 핵산과 혼성화할 수 있는 핵산인 것을 특징으로 하는 방법.

조항 8. 조항 1 내지 조항 7 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비해 각각 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가 중 하나 이상을 포함하는 것을 특징으로 하는 방법.

조항 9. 조항 1 내지 조항 8 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 또는 순한 가뭄 조건 하에서 얻어진 것을 특징으로 하는 방법.

조항 9. 조항 1 내지 조항 8 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 질소 결핍 조건 하에서 얻어진 것을 특징으로 하는 방법.

조항 10. 조항 1 내지 조항 9 중 어느 한 조항에 있어서, 상기 핵산은 어린 녹색 조직 특이적 프로모터에, 바람직하게는 프로토클로로필라이드 환원효소(protochlorophyllide reductase) 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.

조항 11. 조항 1 내지 조항 10 중 어느 한 조항에 있어서, 상기 PEPC 폴리펩티드를 암호화하는 핵산은 세균 유래, 바람직하게는 시네코시스티스(Synechocystis) 유래인 것을 특징으로 하는 방법.

조항 12. PEPC 폴리펩티드를 암호화하는 재조합 핵산을 포함하는 것을 특징으로 하는, 조항 1 내지 조항 11 중 어느 한 조항에 따른 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.

조항 13. 하기를 포함하는 구축물:

(i) 조항 1 내지 조항 5 중 어느 한 조항에 정의된 PEPC 폴리펩티드를 암호화하는 핵산;

(ii) (i)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로

(iii) 전사 종결 서열.

조항 14. 조항 13에 있어서, 상기 조절 서열은 어린 녹색 조직 특이적 프로모터, 바람직하게는 프로토클로로필라이드 환원효소 프로모터인 것을 특징으로 하는 구축물.

조항 15. 대조구 식물에 비해 각각 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가 중 하나 이상을 가진 식물을 생산하기 위한 방법에 있어, 조항 13 또는 조항 14에 따른 구축물의 용도.

조항 16. 조항 13 또는 조항 14에 따른 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.

조항 17. 하기 단계를 포함하는 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:

(i) 조항 1 내지 조항 5 중 어느 한 조항에 정의된 PEPC 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계; 및

조항 18. 조항 1 내지 조항 5 중 어느 한 조항에 정의된 PEPC 폴리펩티드를 암호화하는 핵산의 증가된 발현으로 인해, 대조구 식물에 비하여 각각 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가 중 하나 이상을 가진 형질전환 식물 또는 상기 형질전환 식물 유래의 형질전환 식물 세포.

조항 19. 조항 12, 조항 16, 또는 조항 18 중 어느 한 조항에 있어서, 상기 식물이 작물 식물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호밀, 라이밀, 수수 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물.

조항 20. 수확 가능한 부분이 바람직하게는 신초(shoot) 생물량 및/또는 종자인 것을 특징으로 하는, 조항 19에 따른 식물의 수확 가능한 부분.

조항 21. 조항 19에 따른 식물 및/또는 조항 20에 따른 식물의 수확 가능한 부분 유래의 산물.

조항 22. 대조구 식물에 비해 각각 수확량을 증가시키는, 특히 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가 중 하나 이상을 증가시키는 PEPC 폴리펩티드를 암호화하는 핵산의 용도.

조항 23. N-말단 영역에 U-box 도메인을 포함하는 class III U-box 단백질을 암호화하는 핵산의 식물에서의 발현의 조절을 포함하는, 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.

조항 24. 조항 23에 있어서, 상기 U-box 도메인은 서열번호 76의 U-box 도메인에 증가하는 순으로 선호되는, 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지고/가지거나 모티프 VII: GI T/S YDR E/S/D/A N/S/G/A I E/A K/R/M W L/M/V/I F/L/A 및/또는 모티프 VIII: Q S/A/G W C/G/A I/R/A/T S/V/I/R/A H/N/R/N/V A/C/S를 포함하는 것을 특징으로 하는 방법.

조항 25. 조항 24에 있어서, 상기 모티프 VII은 GITYDRENIERWIF (서열번호 77), 또는 모티프 VII에 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프이고;

모티프 VIII은: QSWCTLNA (서열번호 78) 또는 모티프 VIII에 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프인 것을 특징으로 하는 방법.

조항 26. 조항 23 내지 조항 25 중 어느 한 조항에 있어서, 상기 Class III U-Box 폴리펩티드는 C-말단 영역에 하기 모티프 중 하나 이상을 포함하는 것을 특징으로 하는 방법:

모티프 IX: GR S/A/L A/E L/F L/V S/K/N/A H

모티프 XI: K/R L C/L F/V/M/L V/I/A V/I/A/I Q/R V/A/S D/S/G/E

모티프 XII: S/A/L YP

조항 27. 조항 26에 있어서, 상기 모티프 IX 는 GRAELLNH (서열번호 79) 또는 모티프 IX에 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프이고;

모티프 X은: GLAIVSKKILRVS (서열번호 80) 또는 모티프 X에 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프이고;

모티프 XI은: KLCLVLQVD (서열번호 81) 또는 모티프 XI에 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프이고;

모티프 XII는: SYP (서열번호 82) 또는 모티프 XII에 증가하는 순으로 선호되는, 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가진 모티프인 것을 특징으로 하는 방법.

조항 28. 조항 23 내지 조항 27 중 어느 한 조항에 있어서, 상기 조절된 발현은 Class III U-box 폴리펩티드를 암호화하는 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.

조항 29. 조항 23 내지 조항 28 중 어느 한 조항에 있어서, 상기 Class III U-box 폴리펩티드를 암호화하는 핵산은 표 10에 열거된 단백질 중 임의의 하나를 암호화하거나, 또는 상기 핵산의 부분, 또는 상기 핵산과 혼성화할 수 있는 핵산인 것을 특징으로 하는 방법.

조항 30. 조항 23 내지 조항 29 중 어느 한 조항에 있어서, 상기 핵산 서열은 표 10에 제시된 단백질 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 것을 특징으로 하는 방법.

조항 31. 조항 23 내지 조항 30 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비해 증가된 수확량, 바람직하게는 증가된 생물량 및/또는 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.

조항 32. 조항 23 내지 조항 31 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 또는 순한 가뭄 조건 하에서 얻어진 것을 특징으로 하는 방법.

조항 33. 조항 23 내지 조항 32 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 질소 결핍 조건 하에서 얻어진 것을 특징으로 하는 방법.

조항 34. 조항 23 내지 조항 33 중 어느 한 조항에 있어서, 상기 핵산은 어린 녹색 조직 특이적 프로모터, 바람직하게는 프로토클로로필라이드 환원효소 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.

조항 35. 조항 23 내지 조항 34 중 어느 한 조항에 있어서, 상기 Class III 폴리펩티드를 암호화하는 핵산은 식물 유래이며, 바람직하게는 쌍자엽 식물 유래이며, 더욱 바람직하게는 가지과(Solanaceae) 유래이며, 더 더욱 바람직하게는 캡시쿰 속 (genus Capsicum) 유래이며, 가장 바람직하게는 고추 (Capsicum annuus) 유래인 것을 특징으로 하는 방법.

조항 36. Class III U-box 폴리펩티드를 암호화하는 재조합 핵산을 포함하는 것을 특징으로 하는, 조항 23 내지 조항 35 중 어느 한 조항에 따른 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.

조항 37. 하기를 포함하는 구축물:

(iii) 조항 23 내지 조항 27 중 어느 한 조항에 정의된 Class III U-box 폴리펩티드를 암호화하는 핵산;

(iv) (iii)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로

(v) 전사 종결 서열.

조항 38. 조항 37에 있어서, 상기 조절 서열은 어린 녹색 조직 특이적 프로모터, 바람직하게는 프로토클로로필라이드 환원효소 프로모터인 것을 특징으로 하는 구축물.

조항 39. 대조구 식물에 비해 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 가진 식물을 생산하기 위한 방법에 있어, 조항 37 또는 조항 38에 따른 구축물의 용도.

조항 40. 조항 37 또는 조항 38에 따른 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.

조항 41. 하기 단계를 포함하는 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:

(d) 조항 23 내지 조항 27 중 어느 한 조항에 정의된 Class III U-box 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계; 및

(e) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.

조항 42. 조항 23 내지 조항 27 중 어느 한 조항에 정의된 Class III U-box 폴리펩티드를 암호화하는 핵산의 증가된 발현으로 인해, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 가진 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포.

조항 43. 조항 36, 조항 40 또는 조항 42 중 어느 한 조항에 있어서, 상기 식물은 작물 식물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호밀, 라이밀, 수수 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포.

조항 44. 수확 가능한 부분이 바람직하게는 신초(shoot) 생물량 및/또는 종자인 것을 특징으로 하는, 조항 43에 따른 식물의 수확 가능한 부분.

조항 45. 조항 43에 따른 식물 및/또는 조항 44에 따른 식물의 수확 가능한 부분 유래의 산물.

조항 46. 대조구 식물에 비해 식물에서 수확량을 증가시키는, 특히 종자 수확량 및/또는 신초(shoot) 생물량을 증가시키는 Class III U-box 폴리펩티드를 암호화하는 핵산의 용도.

조항 47. PQQC 단백질을 암호화하는 핵산의 식물에서의 발현의 조절을 포함하는, 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.

조항 48. 조항 47에 있어서, 상기 PQQC 단백질은 서열번호 105로 표시된 서열에 증가하는 순으로 선호되는, 적어도 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 가지는 것을 특징으로 하는 방법.

조항 49. 조항 47 또는 조항 48에 있어서, 상기 조절된 발현은 PQQC 폴리펩티드를 암호화하는 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.

조항 50. 조항 47 내지 조항 49 중 어느 한 조항에 있어서, 상기 PQQC 폴리펩티드를 암호화하는 핵산은 표 11에 열거된 단백질 중 임의의 하나를 암호화하거나, 또는 상기 핵산의 부분, 또는 상기 핵산과 혼성화할 수 있는 핵산인 것을 특징으로 하는 방법.

조항 51. 조항 47 내지 조항 50 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비해 증가된 수확량, 바람직하게는 증가된 생물량 및/또는 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.

조항 52. 조항 47 내지 조항 51 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 또는 순한 가뭄 조건 하에서 얻어진 것을 특징으로 하는 방법.

조항 53. 조항 47 내지 조항 52 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 질소 결핍 조건 하에서 얻어진 것을 특징으로 하는 방법.

조항 54. 조항 47 내지 조항 53 중 어느 한 조항에 있어서, 상기 핵산은 어린 녹색 조직 특이적 프로모터에, 바람직하게는 프로토클로로필라이드 환원효소 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.

조항 55. 조항 47 내지 조항 54 중 어느 한 조항에 있어서, 상기 핵산은 구성적 프로모터에, 바람직하게는 GOS2 프로모터에, 가장 바람직하게는 벼의 GOS2 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.

조항 56. 조항 47 내지 조항 55 중 어느 한 조항에 있어서, 상기 PQQC 폴리펩티드를 암호화하는 핵산은 세균 유래, 바람직하게는 슈도모나스(pseudomonas) 유래인 것을 특징으로 하는 방법.

조항 57. PQQC 폴리펩티드를 암호화하는 재조합 핵산을 포함하는 것을 특징으로 하는, 조항 47 내지 조항 56 중 어느 한 조항에 따른 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.

조항 58. 하기를 포함하는 구축물:

(a) 조항 47 또는 조항 48에 정의된 PQQC 폴리펩티드를 암호화하는 핵산;

(c) 전사 종결 서열.

조항 59. 조항 58에 있어서, 상기 조절 서열은 어린 녹색 조직 특이적 프로모터, 바람직하게는 프로토클로로필라이드 환원효소 프로모터인 것을 특징으로 하는 구축물.

조항 60. 조항 58에 있어서, 상기 조절 서열은 구성적 프로모터, 바람직하게는 GOS2 프로모터, 가장 바람직하게는 벼의 GOS2 프로모터인 것을 특징으로 하는 구축물.

조항 61. 대조구 식물에 비해 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 가진 식물을 생산하기 위한 방법에 있어, 조항 58 내지 조항 60 중 어느 한 조항에 따른 구축물의 용도.

조항 62. 조항 58 내지 조항 61 중 어느 한 조항에 따른 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.

조항 63. 하기 단계를 포함하는 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:

(i) 조항 47 또는 조항 48에 정의된 PQQC 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계; 및

조항 64. 조항 47 또는 조항 48에 정의된 PQQC 폴리펩티드를 암호화하는 핵산의 증가된 발현으로 인해, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 가진 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포.

조항 65. 조항 57, 조항 62, 또는 조항 64 중 어느 한 조항에 있어서, 상기 식물이 작물 식물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호밀, 라이밀, 수수 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포.

조항 66. 수확 가능한 부분이 바람직하게는 신초(shoot) 생물량 및/또는 종자인 것을 특징으로 하는, 조항 65에 따른 식물의 수확 가능한 부분.

조항 67. 조항 65에 따른 식물 및/또는 조항 66에 따른 식물의 수확 가능한 부분 유래의 산물.

조항 68. 대조구 식물에 비해 수확량을 증가시키는, 특히 식물의 종자 수확량 및/또는 신초 생물량(shoot biomass)을 증가시키는 PQQC 폴리펩티드를 암호화하는 핵산의 용도.

도 1은 모티프 I에서 V를 강조한 시네코시스티스(Synechocystis) PEPC 단백질을 보여준다.
도 2 내지 도 3은 선정한 PEPC 단백질을 복수 서열 정렬한 것이다.
도 4는 프로토클로로필라이드 환원효소 프로모터의 조절 하에서 PEPC 암호화 핵산의 벼 (Oryza sativa)에서의 증가된 발현을 위한 발현 벡터를 나타낸다.
도 5 내지 도 7은 본 발명에 따른 방법의 수행에 유용한 서열의 상세한 예를 보여준다.
도 8은 캡시쿰(Capsicum), 아라비돕시스 및 벼 유래 Class III U-box 단백질의 아미노산 서열을 보여주는 것으로, 보존된 모티프 I에서 VI 및 U-box 도메인에 표시를 한 것이다. U-box 도메인은 볼드체; 모티프 I은 이탤릭 볼드체, 모티프 II는 박스형, 모티프 III은 밑줄, 모티프 IV는 밑줄 친 이탤릭체, 모티프 V는 이중선 밑줄 및 모티프 VI는 절단 밑줄로 표시하였다.
도 9는 선정한 Class III U-box 단백질의 복수 서열 정렬을 나타낸다.
도 10은 프로토클로로필라이드 환원효소 프로모터의 조절 하에서 Class III U-box 암호화 핵산의 벼 (Oryza sativa)에서의 증가된 발현을 위한 바이너리 벡터를 나타낸다.
도 11은 본 발명에 따른 방법의 수행에 유용한 서열의 상세한 예를 보여준다.
도 12는 선정한 PQQC 단백질의 복수 서열 정렬을 나타낸다.
도 13은 프로토클로로필라이드 환원효소 프로모터의 조절 하에서 PQQC 암호화 핵산의 벼 (Oryza sativa)에서의 증가된 발현을 위한 바이너리 벡터를 나타낸다.
도 14 내지 도 15는 본 발명에 따른 방법의 수행에 유용한 서열의 상세한 예를 보여준다.

본 발명은 단지 예시인 하기 실시예를 참고하여 기재될 것이다. 하기 실시예는 본 발명의 범위를 완전히 한정하거나 제한할 의도는 아니다.

DNA 조작: 달리 언급되지 않는 한, 재조합 DNA 기술은 Sambrook (2001, Molecular Cloning: laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) 또는 Ausubel 등 (1994, Current Protocols in Molecular Biology, Current Protocols의 Volumes 1 및 2)에 기재된 표준 프로토콜에 따라 수행되었다. 식물 분자작업에 대한 표준 재료 및 방법은 Plant Molecular Biology Labfax (1993, by R.D.D. Croy, published by BIOS Scientific Publications Ltd (UK) 및 Blackwell Scientific Publications (UK))에 기재되어 있다.

실시예 1: 본 발명의 방법에 사용된 핵산 서열에 연관된 서열의 동정

본 발명의 방법에 사용된 핵산 서열에 연관된 서열 (전장 cDNA, ESTs 또는 게놈)이 Basic Local Alignment Tool (BLAST) 같은 데이터베이스 서열 탐색 도구를 사용하여 National Center for Biotechnology Information (NCBI)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터 베이스에 비교하고, 매치(match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 본 발명에서 사용된 핵산에 의해 암호화된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.

표 9 내지 표 11는 본 발명의 방법에 사용된 핵산 서열에 연관된 핵산 서열의 목록이다.

PEPC 폴리펩티드의 예:

유전자 출처	핵산 서열번호:	단백질 서열번호:
도 5 내지 도 7 참고	도 5 내지 도 7 참고	도 5 내지 도 7 참고

Class III U-box 폴리펩티드의 예:

식물 출처	핵산 서열번호:	단백질 서열번호:
고추(Capsicum annuum)	74	75
애기장대(Arabidopsis thaliana)	83	84
애기장대(Arabidopsis thaliana)	85	86
메디카고 트룬카툴라(Medicago truncatula)	87	88
담배(Nicotiana benthamiana)	89	90
벼(Oryza sativa)	91	92
벼(Oryza sativa)	93	94
벼(Oryza sativa)	95	96
벼(Oryza sativa)	97	98
벼(Oryza sativa)	99	100

PQQC 폴리펩티드의 예:

유전자 출처	핵산 서열번호:	단백질 서열번호:
도 14 및 도 15 참고	도 14 및 도 15 참고	도 14 및 도 15 참고

어떤 경우에는, TIGR (The Institute for Genomic Research)과 같은 연구 기관에 의해 연관 서열이 시험적으로 조립되어(assembled), 공개된다. EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다.

하기는 서열번호 2에 관련된 추가적인 PEPC 서열을 보여주는 BLASTP의 결과로, 따라서 본 발명의 방법에 유용하다.

1: NP_441713

phosphoenolpyruvate carboxylase [Synechocystis sp. PCC 6803] gi|16330985|ref|NP_441713.1|[16330985]

2: ZP_01729388

phosphoenolpyruvate carboxylase [Cyanothece sp. CCY0110] gi|126658238|ref|ZP_01729388.1|[126658238]

3: ZP_00517310

Phosphoenolpyruvate carboxylase [Crocosphaera watsonii WH 8501] gi|67923850|ref|ZP_00517310.1|[67923850]

4: ZP_00108354

COG2352: Phosphoenolpyruvate carboxylase [Nostoc punctiforme PCC 73102] gi|23126460|ref|ZP_00108354.1|[23126460]

5: ZP_01631340

phosphoenolpyruvate carboxylase [Nodularia spumigena CCY9414] gi|119512252|ref|ZP_01631340.1|[119512252]

6: YP_322649

phosphoenolpyruvate carboxylase [Anabaena variabilis ATCC 29413] gi|75908353|ref|YP_322649.1|[75908353]

7: AAV90837

phosphoenolpyruvate carboxylase [Synechococcus sp. PCC 7002] gi|56417897|gb|AAV90837.1|[56417897]

8: ZP_01620914

Phosphoenolpyruvate carboxylase [Lyngbya sp. PCC 8106] gi|1 19487042|ref|ZP_01620914.1|[119487042]

9: P28594

Phosphoenolpyruvate carboxylase (PEPCase) (PEPC) gi|25014052|sp|P28594|CAPP_ANASP[25014052]

10: YP_172556

phosphoenolpyruvate carboxylase [Synechococcus elongatus PCC 6301] gi|56751855|ref|YP_172556.1|[56751855]

11: YP_401269

Phosphoenolpyruvate carboxylase [Synechococcus elongatus PCC 7942] gi|81301061|ref|YP_401269.1|[81301061]

12: YP_720722

Phosphoenolpyruvate carboxylase [Trichodesmium erythraeum IMS101] gi|113474661|ref|YP_720722.1|[113474661]

13: NP_682702

phosphoenolpyruvate carboxylase [Thermosynechococcus elongatus BP-1] gi|22299455|ref|NP_682702.1|[22299455]

14: NP_488901

phosphoenolpyruvate carboxylase [Nostoc sp. PCC 7120] gi|17232353|ref|NP_488901.1|[17232353]

15: YP_478060

phosphoenolpyruvate carboxylase [Synechococcus sp. JA-2-3B'a(2-13)] gi|86609298|ref|YP_478060.1|[86609298]

16: ZP_01083776

phosphoenolpyruvate carboxylase [Synechococcus sp. WH 5701] gi|87300934|ref|ZP_01083776.1|[87300934]

17: ZP_01080788

Phosphoenolpyruvate carboxylase [Synechococcus sp. RS9917] gi|87124941|ref|ZP_01080788.1|[87124941]

18: YP_474305

phosphoenolpyruvate carboxylase [Synechococcus sp. JA-3-3Ab] gi|86605542|ref|YP_474305.1|[86605542]

19: ZP_01469854

phosphoenolpyruvate carboxylase [Synechococcus sp. BL107] gi|116072588|ref|ZP_01469854.1|[116072588]

20: NP_876121

phosphoenolpyruvate carboxylase [Prochlorococcus marinus subsp. marinus str. CCMP1375] gi|33241179|ref|NP_876121.1|[33241179]

21: ZP_01473048

phosphoenolpyruvate carboxylase [Synechococcus sp. RS9916] gi|116075789|ref|ZP_01473048.1|[116075789]

22: ZP_01006468

phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. MIT 921 1] gi|84519119|ref|ZP_01006468.1|[84519119]

23: ABE11140

phosphoenolpyruvate carboxylase [uncultured Prochlorococcus marinus clone HF10-11H11] gi|91070220|gb|ABE11140.1|[91070220]

24: YP_001091990

Phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. MIT 9301] gi|126697104|ref|YP_001091990.1|[126697104]

25: YP_377934

phosphoenolpyruvate carboxylase [Synechococcus sp. CC9902] gi|78185499|ref|YP_377934.1|[78185499]

26: YP_398164

Phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. MIT 9312] gi|78780052|ref|YP_398164.1|[78780052]

27: YP_292340

phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. NATL2A] gi|72382985|ref|YP_292340.1|[72382985]

28: YP_001010172

Phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. AS9601] gi|123969314|ref|YP_001010172.1|[123969314]

29: NP_895540

phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. MIT 9313] gi|33863980|ref|NP_895540.1|[33863980]

30: YP_001015841

Phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. NATL1A] gi|124026726|ref|YP_001015841.1|[124026726]

31: YP_001018274

Phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. MIT 9303] gi|124023967|ref|YP_001018274.1|[124023967]

32: ZP_01123374

phosphoenolpyruvate carboxylase [Synechococcus sp. WH 7805] gi|88807863|ref|ZP_01123374.1|[88807863]

33: YP_001224177

Phosphoenolpyruvate carboxylase [Synechococcus sp. WH 7803] gi|148238790|ref|YP_001224177.1|[148238790]

34: NP_898138

phosphoenolpyruvate carboxylase [Synechococcus sp. WH 8102] gi|33866579|ref|NP_898138.1|[33866579]

35: YP_380727

phosphoenolpyruvate carboxylase [Synechococcus sp. CC9605] gi|7821 1948|ref|YP_380727.1|[78211948]

36: NP_893692

phosphoenolpyruvate carboxylase [Prochlorococcus marinus subsp. pastoris str. CCMP1986] gi|33862131|ref|NP_893692.1|[33862131]

37: YP_001012076

Phosphoenolpyruvate carboxylase [Prochlorococcus marinus str. MIT 9515] gi|123966995|ref|YP_001012076.1|[123966995]

38: YP_001228346

Phosphoenolpyruvate carboxylase [Synechococcus sp. RCC307] gi|148243189|ref|YP_001228346.1|[148243189]

39: YP_729688

phosphoenolpyruvate carboxylase [Synechococcus sp. CC9311] gi|113954224|ref|YP_729688.1|[113954224]

40: NP_923360

phosphoenolpyruvate carboxylase [Gloeobacter violaceus PCC 7421] gi|37519983|ref|NP_923360.1|[37519983]

41: ZP_01424999

Phosphoenolpyruvate carboxylase [Herpetosiphon aurantiacus ATCC 23779] gi|113939140|ref|ZP_01424999.1|[113939140]

42: YP_830113

Phosphoenolpyruvate carboxylase [Arthrobacter sp. FB24] gi|116669180|ref|YP_830113.1|[116669180]

43: YP_946565

phosphoenolpyruvate carboxylase [Arthrobacter aurescens TC1] gi|119962288|ref|YP_946565.1|[119962288]

44: ZP_01696337

phosphoenolpyruvate carboxylase [Bacillus coagulans 36D1] gi|124521401|ref|ZP_01696337.1|[124521401]

45: YP_342813

Phosphoenolpyruvate carboxylase [Nitrosococcus oceani ATCC 19707] gi|77164288|ref|YP_342813.1|[77164288]

46: NP_627344

phosphoenolpyruvate carboxylase [Streptomyces coelicolor A3(2)] gi|21221565|ref|NP_627344.1|[21221565]

47: AAY89988

predicted PEP carboxylase [uncultured bacterium BAC13K9BAC] gi|68304977|gb|AAY89988.1|[68304977]

48: NP_824743

phosphoenolpyruvate carboxylase [Streptomyces avermitilis MA-4680] gi|29830109|ref|NP_824743.1|[29830109]

49: ZP_01649489

Phosphoenolpyruvate carboxylase [Salinispora arenicola CNS205] gi|119883229|ref|ZP_01649489.1|[119883229]

50: ZP_00568542

Phosphoenolpyruvate carboxylase [Frankia sp. EANI pec] gi|68229346|ref|ZP_00568542.1|[68229346]

51: YP_001363100

Phosphoenolpyruvate carboxylase [Kineococcus radiotolerans SRS30216] gi|152967316|ref|YP_001363100.1|[152967316]

52: YP_001 157738

Phosphoenolpyruvate carboxylase [Salinispora tropica CNB-440] gi|145593441|ref|YP_001157738.1|[145593441]

53: YP_318884

phosphoenolpyruvate carboxylase [Nitrobacter winogradskyi Nb-255] gi|75676463|ref|YP_318884.1|[75676463]

54: YP_294925

phosphoenolpyruvate carboxylase [Ralstonia eutropha JMP134] gi|73540405|ref|YP_294925.1|[73540405]

55: YP_577930

Phosphoenolpyruvate carboxylase [Nitrobacter hamburgensis X14] gi|92118201|ref|YP_577930.1|[92118201]

56: ZP_02010108

Phosphoenolpyruvate carboxylase [Ralstonia pickettii 12D] gi|153888973|ref|ZP_02010108.1|[153888973]

57: NP_840673

Phosphoenolpyruvate carboxylase [Nitrosomonas europaea ATCC 19718] gi|30248603|ref|NP_840673.1|[30248603]

58: NP_947117

phosphoenolpyruvate carboxylase [Rhodopseudomonas palustris CGA009] gi|39934841|ref|NP_947117.1|[39934841]

59: YP_391787

Phosphoenolpyruvate carboxylase [Thiomicrospira crunogena XCL-2] gi|78485862|ref|YP_391787.1|[78485862]

60: ZP_01661 147

Phosphoenolpyruvate carboxylase [Ralstonia pickettii 12J] gi|121528533|ref|ZP_01661147.1|[121528533]

61: YP_001204637

phosphoenolpyruvate carboxylase [Bradyrhizobium sp. ORS278] gi|146339589|ref|YP_001204637.1|[146339589]

62: YP_932496

probable phosphoenolpyruvate carboxylase [Azoarcus sp. BH72] gi|119897283|ref|YP_932496.1|[119897283]

63: YP_970358

Phosphoenolpyruvate carboxylase [Acidovorax avenae subsp. citrulli AACOO-1] gi|120610680|ref|YP_970358.1|[120610680]

64: ZP_01047635

phosphoenolpyruvate carboxylase [Nitrobacter sp. Nb-31 1A] gi|85716666|ref|ZP_01047635.1|[85716666]

65: YP_369991

phosphoenolpyruvate carboxylase [Burkholderia sp. 383] gi|78067222|ref|YP_369991.1|[78067222]

66: YP_314388

phosphoenolpyruvate carboxylase [Thiobacillus denitrificans ATCC 25259] gi|74316648|ref|YP_314388.1|[74316648]

67: NP_520479

phosphoenolpyruvate carboxylase [Ralstonia solanacearum GM11000] gi|17547077|ref|NP_520479.1|[17547077]

68: YP_727365

phosphoenolpyruvate carboxylase [Ralstonia eutropha H 16] gi|113868876|ref|YP_727365.1|[113868876]

69: YP_001238961

phosphoenolpyruvate carboxylase [Bradyrhizobium sp. BTAiI] gi|148254376|ref|YP_001238961.1|[148254376]

70: YP_001415233

Phosphoenolpyruvate carboxylase [Xanthobacter autotrophicus Py2] gi|154244275|ref|YP_001415233.1|[154244275]

71: YP_487198

Phosphoenolpyruvate carboxylase [Rhodopseudomonas palustris HaA2] gi|86750702|ref|YP_487198.1|[86750702]

72: NP_769595

phosphoenolpyruvate carboxylase [Bradyrhizobium japonicum USDA 110] gi|27378066|ref|NP_769595.1|[27378066]

73: YP_569012

Phosphoenolpyruvate carboxylase [Rhodopseudomonas palustris BisB5] gi|91976353|ref|YP_569012.1|[91976353]

74: ZP_00946208

Phosphoenolpyruvate carboxylase [Ralstonia solanacearum UW551] gi|83749206|ref|ZP_00946208.1|[83749206]

75: YP_780719

Phosphoenolpyruvate carboxylase [Rhodopseudomonas palustris BisA53] gi|115523808|ref|YP_780719.1|[115523808]

76: BAA21835

phosphoenolpyruvate carboxylase [Rhodopseudomonas palustris] gi|2339975|dbj|BAA21835.1|[2339975]

77: Q59757

phosphoenolpyruvate carboxylase (PEPCase) (PEPC) gi|2499464|sp|Q59757|CAPP_RHOMR[2499464]

78: YP_747257

Phosphoenolpyruvate carboxylase [Nitrosomonas eutropha C91] gi|114331035|ref|YP_747257.1|[114331035]

79: ZP_01554849

Phosphoenolpyruvate carboxylase [Burkholderia ambifaria MC40-6] gi|118696768|ref|ZP_01554849.1|[118696768]

80: YP_774359

Phosphoenolpyruvate carboxylase [Burkholderia cepacia AMMD] gi|115352520|ref|YP_774359.1|[115352520]

81: EAY68193

Phosphoenolpyruvate carboxylase [Burkholderia dolosa AUO158] gi|124894313|gb|EAY68193.1|[124894313]

82: YP_621690

Phosphoenolpyruvate carboxylase [Burkholderia cenocepacia AU 1054] gi|107023363|ref|YP_621690.1|[107023363]

83: YP_836069

Phosphoenolpyruvate carboxylase [Burkholderia cenocepacia HI2424] gi|116690446|ref|YP_836069.1|[116690446]

84: ZP_00987174

COG2352: Phosphoenolpyruvate carboxylase [Burkholderia dolosa AUO158] gi|84362555|ref|ZP_00987174.1|[84362555]

85: ZP_01559873

Phosphoenolpyruvate carboxylase [Burkholderia cenocepacia MCO-3] gi|118707287|ref|ZP_01559873.1|[118707287]

86: YP_584892

phosphoenolpyruvate carboxylase [Ralstonia metallidurans CH34] gi|94311682|ref|YP_584892.1|[94311682]

87: YP_987106

Phosphoenolpyruvate carboxylase [Acidovorax sp. JS42] gi|121595210|ref|YP_987106.1|[121595210]

88: ZP_00980295

COG2352: Phosphoenolpyruvate carboxylase [Burkholderia cenocepacia PC184] gi|84355411|ref|ZP_00980295.1|[84355411]

89: EAY64002

Phosphoenolpyruvate carboxylase [Burkholderia cenocepacia PC184] gi|124872286|gb|EAY64002.1|[124872286]

90: YP_531562

Phosphoenolpyruvate carboxylase [Rhodopseudomonas palustris BisB18] gi|90423192|ref|YP_531562.1|[90423192]

91 : YP_710875

Phosphoenolpyruvate carboxylase (PEPCase) (PEPC) [Frankia alni ACN 14a] gi|111220081|ref|YP_710875.1|[111220081]

92: ZP_01325009

hypothetical protein BpseP_03001239 [Burkholderia pseudomallei Pasteur] gi|100063478|ref|ZP_01325009.1|[100063478]

93: YP_995835

Phosphoenolpyruvate carboxylase [Verminephrobacter eiseniae EF01-2] gi|121608028|ref|YP_995835.1|[121608028]

94: CAM76812

Phosphoenolpyruvate carboxylase [Magnetospirillum gryphiswaldense MSR-1] gi|144899948|emb|CAM76812.1|[144899948]

95: ZP_01317342

hypothetical protein Bpse1_03003262 [Burkholderia pseudomallei 1655] gi|99910315|ref|ZP_01317342.1|[99910315]

96: ZP_01213561

hypothetical protein Bpse17_02001265 [Burkholderia pseudomallei 1710a] gi|90293964|ref|ZP_01213561.1|[90293964]

97: YP_001065355

phosphoenolpyruvate carboxylase [Burkholderia pseudomallei 1106a] gi|126451534|ref|YP_001065355.1|[126451534]

98: YP_107641

phosphoenolpyruvate carboxylase [Burkholderia pseudomallei K96243] gi|53718655|ref|YP_107641.1|[53718655]

99: YP_707103

phosphoenolpyruvate carboxylase [Rhodococcus sp. RHA1] gi|111024131|ref|YP_707103.1|[111024131]

100: YP_001058119

phosphoenolpyruvate carboxylase [Burkholderia pseudomallei 668] gi|126440608|ref|YP_001058119.1|[126440608]

실시예 2: PEPC 폴리펩티드 서열의 정렬

폴리펩티드 서열의 정렬은 점진적 정렬의 대중적인 ClustalW 알고리즘 (Thompson 등 (1997) Nucleic Acids Res 25:4876-4882; Chenna 등 (2003) Nucleic Acids Res 31:3497-3500)에 근거한 Vector NTI (Invitrogen)의 AlignX 프로그램을 사용하여 수행되었다. Gap open penalty에 대한 디폴트 값은 10, gap extension penalty에 대한 디폴트 값은 0.1이고, 선택된 가중치 행렬은 Blosum 62 (만일 폴리펩티드가 정렬되면)이다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. 정렬에 대해 도 2 내지 도 3을 참고한다.

실시예 3: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열 간에 전체적인 동일성 백분율 계산

본 발명의 방법의 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (Campanella 등, BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다. 서열 유사성은 구분선 아래 반쪽에 보여지며, 서열 동일성은 대각선 구분선 위 반쪽에 보여진다.

비교에 사용된 매개변수는:

Scoring matrix: Blosum62

첫째 갭: 12

연장 갭: 2

실시예 4: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정

InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 문자 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 많은 일반적인 단백질 도메인 및 패밀리를 포함하는 복수 서열 정렬 및 히든 마코브(hidden Markov) 모델의 큰 집합체이다. Pfam는 영국의 Sanger Institute server에서 호스팅된다. Interpro는 영국의 European Bioinformatics Institute에서 호스팅된다.

PEPC 폴리펩티드에 대한 결과는 INTERPRO 도메인: IPR001449 (phosphoenolpyruvate carboxylase) 및 PFAM: 00311을 제시하였다.

서열번호 75로 표시된 폴리펩티드 서열의 InterPro 스캔의 결과는 하기에 제시되어 있다.

SMART: 00504

InterPro: IPR003613 및 IPR008938

실시예 5: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열의 Topology 예측

TargetP 1.1는 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.

N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.

"식물" 그룹 선정, 정의된 컷오프 없음, 및 요청된 운반 펩티드의 예측된 길이와 같은 많은 매개변수가 선택된다.

하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:

● [Technical University of Denmark]의 서버상에 호스팅된 ChloroP 1.1;

● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;

● [University of Alberta, Edmonton, Alberta, Canada]의 서버상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;

● [Technical University of Denmark]의 서버상에 호스팅된 TMHMM

실시예 6: 본 발명의 폴리펩티드에 대한 기능 분석

PEPC는 포스포에놀피루베이트 (PEP)에 CO₂의 부가를 촉매하여 4-탄소 화합물인 옥살로아세테이트를 형성한다:

PEP + CO₂ → 옥살로아세테이트 + Pi

PEPC 활성의 측정은, Chen 등 2002 (Plant Cell Physiol 43(2): 159-169); 및 Chen 등 2004 (Planta 219 pp 440-449)에 기재되어 있다.

Class III U-box 폴리펩티드는 E3 유비퀴틴 리가아제(ubiquitin ligase) 활성을 나타낸다.

PQQC는 PQQ 생합성의 마지막 단계를 촉매한다.

실시예 7: 본 발명의 방법에 사용된 핵산 서열의 클로닝

본 발명의 방법에 사용된 PEPC 폴리펩티드를 암호화하는 핵산 서열은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 PCR 로 증폭되었다. 사용된 프라이머는 prmO8777 (서열번호 72; 정방향, 개시 코돈은 볼드체): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaacttggcagttcct-3'

및 prmO8782 (서열번호 73; 역방향, 상보적): 5'-ggggaccactttgtacaagaaagctgggttcaaccagtattacgcatt-3'이며,

상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편이 Gateway 용어에 따르면 "entry 클론" pPEPC를 생성하기 위해 pDONR201 플라스미드와 인 비보(in vivo)로 재조합된다. 플라스미드 pDONR201은 Gateway

기술의 일부분으로서, Invitrogen으로부터 구입하였다.

서열번호 1을 포함하는 entry 클론이 벼 (Oryza sativa) 형질전환에 사용된 destination 벡터와 LR 반응에 사용되었다. 상기 벡터는 T-DNA 경계부 내에 기능적 인자로서 하기를 포함한다: 식물 선발 마커; 스크리닝 가능한 마커 발현 카세트; 및 entry 클론에 이미 클로닝된 목적 핵산 서열과 LR 인 비보(in vivo) 재조합 예정된 Gateway 카세트. 어린 녹색 조직 특이적 발현을 위한 프로토클로로필라이드 환원효소 프로모터 (서열번호 71)는 상기 Gateway 카세트의 상부에 위치한다 (도 4 참조).

LR 재조합 단계 후, 생성된 발현 벡터 pPCPR::PEPC (도 4)는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044로 형질전환되었다.

본 발명의 방법에 사용된 Class III U-Box 단백질을 암호화하는 핵산 서열은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 PCR 로 증폭되었다. 사용된 프라이머는 prm9075 (서열번호 102; 정방향, 개시 코돈은 볼드체): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggaagaaattcaagtacc-3' 및

prm8785 (서열번호 103; 역방향, 상보적):

5'-ggggaccactttgtacaagaaagctgggtgctcttttggtcctattttcct-3'이며,

상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편이 Gateway 용어에 따르면 "entry 클론" pU-box를 생성하기 위해 pDONR201 플라스미드와 인 비보(in vivo)로 재조합된다. 플라스미드 pDONR201은 Gateway

기술의 일부분으로서, Invitrogen으로부터 구입하였다.

서열번호 74를 포함하는 entry 클론이 벼 (Oryza sativa) 형질전환에 사용된 destination 벡터와 LR 반응에 사용되었다. 상기 벡터는 T-DNA 경계부 내에 기능적 인자로서 하기를 포함한다: 식물 선발 마커; 스크리닝 가능한 마커 발현 카세트; 및 entry 클론에 이미 클로닝된 목적 핵산 서열과 LR 인 비보(in vivo) 재조합 예정된 Gateway 카세트. 어린 녹색 조직 특이적 발현을 위한 프로토클로로필라이드 환원효소 프로모터 (서열번호 101)는 상기 Gateway 카세트의 상부에 위치한다.

LR 재조합 단계 후, 생성된 발현 벡터 pPCPR::U-BOX (도 10)는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044로 형질전환되었다.

본 발명의 방법에 사용된 PQQC 단백질을 암호화하는 핵산 서열은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 PCR 로 증폭되었다. 사용된 프라이머는 prmO8777 (서열번호 228; 정방향, 개시 코돈은 볼드체):

5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgactgacaccccaatgtc-3'

및 prmO8782 (서열번호 229; 역방향, 상보적):

5'-ggggaccactttgtacaagaaagctgggttcataaggtgattcctttatgc-3'이며,

상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편이 Gateway 용어에 따르면 "entry 클론" pPQQC를 생성하기 위해 pDONR201 플라스미드와 인 비보(in vivo)로 재조합된다. 플라스미드 pDONR201은 Gateway

기술의 일부분으로서, Invitrogen으로부터 구입하였다.

서열번호 104를 포함하는 entry 클론이 벼 (Oryza sativa) 형질전환에 사용된 destination 벡터와 LR 반응에 사용되었다. 상기 벡터는 T-DNA 경계부 내에 기능적 인자로서 하기를 포함한다: 식물 선발 마커; 스크리닝 가능한 마커 발현 카세트; 및 entry 클론에 이미 클로닝된 목적 핵산 서열과 LR 인 비보(in vivo) 재조합 예정된 Gateway 카세트. 어린 녹색 조직 특이적 발현을 위한 프로토클로로필라이드 환원효소 프로모터 (서열번호 226)는 상기 Gateway 카세트 또는 GOS2 프로모터 (서열번호 227)의 상부에 위치한다 (도 12 참조).

LR 재조합 단계 후, 생성된 발현 벡터 pGOS2::PQQC (도 12B)는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044로 형질전환되었다.

LR 재조합 단계 후, 생성된 발현 벡터 pPCPR::PQQC (도 12A)는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044로 형질전환되었다.

실시예 8: 식물 형질전환

벼 형질전환

발현 벡터를 함유하는 아그로박테리움이 벼(Oryza sativa) 식물의 형질전환에 사용되었다. 벼 야포니카 재배 품종 니폰바레의 성숙한 건조 종자의 껍질을 벗겼다. 70% 에탄올에 1 분, 0.2% HgCl₂에 30 분, 멸균된 증류수로 6 회, 15분 세척하여 멸균하였다. 멸균된 종자를 2,4-D 함유 배지 (캘러스 유도배지)에서 발아시켰다. 암소에서 4주간 배양 후, 배, 배반-유래 캘러스를 절단하여 동일한 배지에서 번식시켰다. 2주 후, 캘러스는 계대배양에 의해 동일한 배지 상에서 또 다른 2주간 증식되거나 번식되었다. 배 캘러스 단편은 (세포 분열 활성을 증대시키기 위하여) 공동배양 3일 전에 신선한 배지 상에서 계대배양 되었다.

발현 벡터 함유 아그로박테리움 균주 LBA4404가 공동배양에 사용되었다. 아그로박테리움은 적절한 항생제가 포함된 AB 배지에 접종되어, 28℃에서 3일간 배양되었다. 세균을 수집하여 밀도 (OD₆₀₀) 약 1이 되게 액체 공동배양 배지에 현탁액을 만들었다. 이 현탁액을 페트리디쉬에 옮겨 캘러스를 현탁액에 15 분간 침지하였다. 캘러스 조직을 필터 페이퍼 상에 옮겨 건조시킨 후, 굳힌 공동배양 배지에 옮겨 25℃, 암소에서 3일간 배양하였다. 공동배양된 캘러스를 선발제의 존재 하에 2,4-D-함유 배지에서 28℃, 암소에서 4주간 키웠다. 이 기간 중에, 급속히 자라는 저항성 캘러스 섬이 발달되었다. 이를 재분화 배지에 옮겨 명소에서 배양 후, 배가 방출되었으며 다음 4 내지 5주 후에 어린 줄기가 발달되었다. 어린 줄기를 캘러스에서 절단하여 옥신 함유 배지에서 2 내지 3주간 배양하여 토양으로 이식하였다. 강해진 어린 줄기를 온실 내 고습도 및 단일에서 키웠다.

약 35 개의 독립적인 T0 벼 형질전환체가 한 구축물당 생성되었다. 일차 형질전환체를 조직 배양실에서 온실로 옮겼다. T-DNA 삽입물의 카피 수를 확인하기 위한 정량적 PCR 분석 후, 선발제에 내성을 보이는 한 카피 형질전환 식물을 T1 종자 수확을 위하여 유지하였다. 이식 3 내지 5 개월 후 종자를 수확하였다. 본 방법으로 한 좌위 형질전환체가 50% 넘는 비율로 생산되었다 (Aldemita and Hodges 1996, Chan 등 1993, Hiei 등 1994).

옥수수 형질전환

옥수수 (Zea mays) 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법을 변형하여 수행하였다. 옥수수에 있어 형질전환은 유전형에 의존하며, 특정 유전형만이 형질전환 및 재분화를 받아들인다. 근교계통 A188 (University of Minnesota) 또는 양친으로서 A188과의 교배는 형질전환을 위한 공여자의 좋은 원천이나 다른 유전형도 성공적으로 사용될 수 있다. 옥수수 알을 미성숙된 배의 길이가 약 1 내지 1.2mm일 때인 수분 후 약 11일된 옥수수 식물체로부터 수확한다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 절단된 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 옥수수 재분화 배지에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 옥수수 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.

밀 형질전환

밀의 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법으로 수행하였다. 재배품종 봅화이트 (Bobwhite; CIMMYT, Mexico로부터 입수 가능)가 형질전환에 흔히 사용된다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 아그로박테리움과의 공배양 후 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 재분화 배지에서 시험관 내에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.

대두 형질전환

대두는 Texas A&M 특허 US 5,164,310에 기재된 방법을 변형하여 형질전환되었다. 몇 가지 상업적 대두 변종은 이 방법에 의한 형질전환을 수용한다. 재배품종 잭 (Jack; Illinois Seed foundation으로부터 입수 가능)이 흔히 형질전환에 사용된다. 대두 종자는 시험관 내 파종을 위해 멸균된다. 하배축, 유근 및 자엽 하나를 7일 된 어린 실생으로부터 잘라낸다. 상배축 및 나머지 자엽을 엽액 마디가 발달할 때까지 키운다. 이 엽액 마디를 잘라내어 발현벡터를 함유하는 아그로박테리움 투머파시엔스와 배양한다. 공배양 후 잘라낸 식물체 조각을 수세하여 선발 배지로 옮긴다. 재분화된 어린 줄기를 잘라내어 어린 줄기 신장 배지에 둔다. 1 cm가 되지 않는 어린 줄기를 뿌리가 발달하기까지 발근 배지에 둔다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.

유채/ 캐놀라 형질전환

5 내지 6일된 어린 실생의 자엽 엽병 및 하배축이 조직 배양을 위한 식물절편으로 사용되었으며 Babic 등 (1998, Plant Cell Rep 17: 183-188)에 따라 형질전환되었다. 상업적 재배종 웨스타 (Westar; Agriculture Canada)가 형질전환을 위한 표준 변종으로 사용되나, 다른 변종도 사용될 수 있다. 캐놀라 종자는 시험관 내 파종을 위해 표면 멸균된다. 자엽이 붙어 있는 자엽 엽병 식물절편을 시험관 내 실생으로부터 절단하여, 엽병 절편의 잘린 끝 부분을 세균 현탁액에 담구어 아그로박테리움 (발현 벡터 포함)을 접종하였다. 식물절편을 3 mg/l BAP, 3 % 수크로스, 0.7 % Phytagar를 함유하는 MSBAP-3 배지에서 23℃에서, 16 시간의 빛 하에서 2일간 배양하였다. 아그로박테리움과의 공배양 2일 후, 엽병 식물 절편을 3mg/l BAP, 세포탁심, 카베니실린, 또는 티멘틴 (300mg/l)을 함유하는 MSBAP-3 배지에 옮겨 7일간 둔 후, 어린 줄기가 재분화될 때까지 세포탁심, 카베니실린, 또는 티멘틴 및 선발제가 든 MSBAP-3 배지에 배양하였다. 어린 줄기의 길이가 5 내지 10 mm일 때 잘라 어린 줄기 신장 배지 (0.5 mg/l BAP 함유 MSBAP-0.5)로 옮긴다. 길이 약 2 cm인 어린 줄기를 뿌리 유도를 위하여 발근 배지(MS0)로 옮긴다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.

알팔파 형질전환

알팔파 (Medicago sativa)의 재생 클론이 (McKersie 등, 1999 Plant Physiol 119: 839-847)의 방법으로 형질전환된다. 알팔파의 재생 및 형질전환은 유전형 의존적이므로 재생식물이 요구된다. 재생식물을 얻는 방법이 기재된다. 예를 들면, 이들은 재배품종 랭그랜더 (Rangelander; Agriculture Canada) 또는 Brown DCW 및 A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112)에 의해 기재된 임의의 다른 상업적 알팔파 변종으로부터 선택할 수 있다. 다르게는, RA3 변종 (University of Wisconsin)이 조직배양에 사용하기 위해 선택되었다 (Walker 등, 1978 Am J Bot 65: 654-659). 엽병 식물절편은 발현 벡터를 가진 아그로박테리움 투머파시엔스 C58C1 pMP90 (McKersie 등, 1999 Plant Physiol 119: 839-847) 또는 LBA4404와 밤새 공배양된다. 식물절편은 288 mg/L Pro, 53 mg/L 티오프롤린, 4.35 g/L K2SO4, 및 100μM 아세토시링원을 함유하는 SH 유도배지 상에서 암소에서 3일간 공배양된다. 식물절편을 절반 강도의 Murashige-Skoog 배지 (Murashige and Skoog, 1962)로 세척하여 아세토시링원은 없으나 적절한 선발제 및 아그로박테리움 생장을 저해하는 적절한 항생제를 포함하는 동일한 SH 유도배지 상에 둔다. 몇 주 후, 체세포 배를 생장조절제 및 항생제는 없고, 50g/L 수크로스가 함유된 BOi2Y 발생 배지로 옮긴다. 체세포 배는 연이어 절반 강도의 Murashige-Skoog 배지 상에서 발아된다. 발근된 실생을 온실의 토양으로 이식하여 키운다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.

실시예 9: 표현형 평가 절차

9.1 평가 셋업

약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손 중 6 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자 (이형- 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다.

4 개의 T1 events는 T2 세대에서 T1 세대에 대해서와 동일한 평가 절차이나 event당 더 많은 개체로 한층 더 평가되었다. 파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.

가뭄 스크린

T2 종자로부터의 식물체를 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 모니터하기 위해 무작위로 선택한 화분에 습도 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동적으로 식물에 재급수하였다. 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건 하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.

질소 이용 효율 스크린

T2 종자로부터의 벼 식물체를 양분액을 제외하고는 정상적인 조건 하에서 화분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배의 나머지 부분(식물 성숙, 종자 수학)은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.

9.2 통계적 분석: F-검정

식물의 표현형적 특징의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 건의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 건에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.

중복적인 events의 2 회 실험이 수행되었으므로, 조합된 분석이 수행되었다. 이는 두 실험에 걸친 효과의 일관성을 확인하기에 유용하며, 그렇다면 결론에 대한 자신감을 증가시키기에 양 실험으로부터의 증거를 축적하기에 유용하다. 사용된 방법은 자료의 다층구조(즉, experiment-event-segregant)를 고려하는 혼합모델 접근(mixed-model approach)이다. P 값은 우도비 검정 (likelihood ratio test)을 카이 제곱 분포에 비교함으로써 구했다.

9.3 측정된 매개변수

생물량 관련 매개변수 측정

파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.

식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다. 초기 활력은 발아 후 3 주일 때 식물 (실생) 지상부 면적이다. 뿌리 생물량의 증가는 총 뿌리 생물량 (식물체의 수명 동안에 관찰된 뿌리의 최대 생물량으로 측정) 또는 뿌리/신초(shoot) 지수 (뿌리 및 신초의 활발한 생장 기간에 뿌리 질량 및 신초 질량간의 비율로 측정)의 증가로 표현된다.

초기 활력은 백그라운드로부터 구분되는 지상부 식물체 부분으로부터 총 픽셀의 수를 세어 결정되었다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 하기 기재된 결과는 발아 후 3주 된 식물체에 대한 것이다.

종자 관련 매개변수 측정

성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충만된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충만된 깍지는 분석 저울로 무게를 재었다. 충만된 종자의 수는 분리 단계 후 남은 충만된 깍지의 수를 세어 결정하였다. 총 종자 수확량은 식물체로부터 수확된 모든 충만된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립중량 (TKW)은 숫자를 센 충만된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확지수 (HI)는 총 종자 수확량과 지상부 면적 (mm²) 간의 비율에 10⁶을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수 간의 비율이다. 본 발명에서 정의된 종자 충만도(fill rate)는 총 종자 (또는 소화) 수에 대한 충만된 종자 수의 비율 (%)로 표시된다.

실시예 10: 형질전환된 식물의 표현형 평가 결과

프로토클로로필라이드 환원효소 프로모터의 조절 하에서 PEPC 폴리펩티드를 암호화하는 핵산(서열번호 1)을 발현하는 형질전환 벼는 T1 또는 T2 세대 또는 양 세대에서 하기의 결과를 나타내었다.

변수	정상적인 조건	가뭄
총 종자 중량	4 events 중 4개에서 증가 12% 전체적인 증가	5 events 중 5개에서 증가 28% 전체적인 증가
충만된 종자 수	4 events 중 4개에서 증가 10% 전체적인 증가	5 events 중 5개에서 증가 27% 전체적인 증가
충만률	4 events 중 4개에서 증가 8% 전체적인 증가	5 events 중 5개에서 증가 18% 전체적인 증가
원추화서당 꽃의 수 또는 종자 수	4 events 중 4개에서 증가 8% 전체적인 증가	5 events 중 5개에서 증가 19% 전체적인 증가
수확 지수	4 events 중 4개에서 증가 13% 전체적인 증가	5 events 중 5개에서 증가 22% 전체적인 증가

상기 결과에 부가적으로, 가뭄조건 하에서 PEPC를 과발현하는 식물은 또한 식물체 높이의 증가 (5 라인(lines) 중 2 라인에서 평균 11.5% 증가); 뿌리 굵기의 증가 (5 라인 중 4 라인에서 평균 23.5% 증가); 지상부 면적의 증가 (5 라인 중 2 라인에서 평균 14% 증가); 및 출현 활력의 증가 (5 라인 중 2 라인에서 47.5% 증가)를 보였다.

프로토클로로필라이드 환원효소 프로모터의 조절 하에서 Class III U-box 폴리펩티드를 암호화하는 핵산(서열번호 74)을 발현하는 형질전환 식물은 하기의 결과를 나타내었다.

스트레스가 없는 조건 하에서의 결과:

형질전환 벼는 대조구 식물에 비하여 높이, 지상부 면적, 원추화서의 수, 꽃의 수, TKW (thousand kernel weight), 총 종자 중량, 총 종자의 수 및 충만된 종자의 총수의 증가를 보였다.

(순한) 가뭄 조건 하에서의 결과:

형질전환 벼는 대조구 식물에 비하여 높이, 지상부 면적, 총 종자 중량 및 충만된 종자의 수의 증가를 보였다.

프로토클로로필라이드 환원효소 프로모터의 조절 하에서 PQQC 폴리펩티드를 암호화하는 핵산(서열번호 104)을 발현하는 형질전환 벼는 하기의 결과를 나타내었다.

스트레스가 없는 조건 하에서의 결과:

형질전환 벼는 대조구 식물에 비하여 높이, 지상부 면적, 원추화서의 수, 꽃의 수, 총 종자 중량, 총 종자의 수 및 충만된 종자의 수의 증가를 보였다.

B. 프로토클로로필라이드 환원효소 프로모터의 조절 하에서 PQQC 폴리펩티드를 암호화하는 핵산(서열번호 104)을 발현하는 형질전환 벼는 하기의 결과를 나타내었다. GOS2 프로모터의 조절 하에서 PQQC 폴리펩티드를 암호화하는 핵산(서열번호 104)을 발현하는 형질전환 벼에서도 비슷한 결과를 얻었다.

(순한) 가뭄 조건 하에서의 결과:

형질전환 벼는 대조구 식물에 비하여 높이, 충만률, TKW (thousand kernel weight), 충만된 종자의 수 및 총 종자 중량의 증가를 보였다.

<110> Crop Functional Genomics Center BASF Plant Science GmbH <120> Plants having increased yield and a method for making the same <130> PF59396 <160> 229 <170> PatentIn version 3.3 <210> 1 <211> 3146 <212> DNA <213> Synechocystis sp. <400> 1 tacaaaaaag caggcttaaa caatgaactt ggcagttcct gcattcggtc tttccactaa 60 ctggtctggt aatggcaatg gttccaactc tgaagaagag tcggtgcttt accagcggtt 120 aaagatggtg gaggaattgt gggaaagggt gctccaaagc gaatgtggcc aggaattggt 180 ggatttgctg acggaattaa ggcttcaggg tacccatgag gcgatcacca gcgaaatttc 240 cgaagaagtc atcatgggta ttacccagcg cattgagcat ttagaactca atgatgccat 300 ccgggcggct cgggcctttg ccctatattt ccagttgatc aacatcgttg aacagcacta 360 cgaacaaaac gagcaacaac ggaatcgttg ggaagcttcc caggaaacca acttctatga 420 gcaggcgggc aatgaggaag aaatggtccc cccatcccga ttaggcgcgt caacggaacc 480 attgccagtg ggcattgacc agaatgaatt gcaagcttct gtaggtacgt tccattggtt 540 aatgagggag ctaaaacgcc tcaatgtgcc cccccaacat atccaaaatt tattggatca 600 tctggacatt cgcctggtga tcaccgctca ccccacggaa attgtccgtc acaccatccg 660 gcgcaaacaa agaagggtgg accgcattct tcgtaaacta gatcaactcc agggttctgt 720 gaccggtcgg gactggctca acacctggga tgcaaaaacg gcgatcgccc aattaacgga 780 ggaaattcgc ttttggtggc gtaccgacga acttcatcag ttcaaaccca ctgtgttgga 840 cgaagtggac tattccctcc attattttga tgaagtactg ttcgacgctg taccggaatt 900 gtccaaacgg ttaggacaag ctattaaaga aacctttccc catctgcggg ccccccgggc 960 taatttttgt tattttggct cctgggtcgg tggcgatcgg gacggcaacc cttcggtaac 1020 cccagaagtg acctggcaga cggcctgtta ccagcggggt ttagtgctgg ggaaatattt 1080 gtttagtttg ggggaactgg tggccattct tagcccttcc ctccattggt gcaaagtctc 1140 ccaggaattg ttggactctt tggaacggga ccgcattcaa ttaccggaaa tttacgaaga 1200 actttctctc cgctatcgcc aggaacccta tcggatgaag ctggcctacg ttaccaaacg 1260 gctggaaaac accctgcggc gtaataatcg tctagccaac ccagaagaac ggcaaacgat 1320 gatcaccatg ccggccgaaa atcactatcg cactggggaa gaattattag aggaattaag 1380 actcattcag cgtaatctga ccgaaactgg tttaacctgc ctggagttgg aaaatttgat 1440 tacccagttg gaagtctatg gctttaacct agcccagttg gattttcgcc aggaatcttc 1500 ccgccacgcc gaggcgatcg ccgaaattgc tgagtatatg ggggtactca ccactcccta 1560 cgaagaaatg gccgaagaag ataaattagc ctggttaggg gtagaactgc aaacccgccg 1620 tcctttaatt ccccaggaaa tgcccttttc ggagcggact agggaaacca ttgaaaccct 1680 ccgcaccctg cgccatctac aaatggaatt tggggtggat atttgccaaa cctacatcat 1740 cagcatgacc aacgatgcca gtgatgtgtt ggaagtattg ctgttagcca aggaagccgg 1800 attgtatgac ccggccaccg cctccaattc cctccgcatt gtgcccctgt ttgaaacagt 1860 agaagatctc aaaaacgctc cggggattat ggattctctt ttcagcttgc ctttttaccg 1920 ggctacattg gcgggcagtt accattcctt aaaagagttg caaaatcagc caccggatta 1980 ttaccaaatt cccaccacca cagccctact aaatcccggc aatctccagg aaattatggt 2040 gggctattcc gacagcaata aagactccgg ctttttgagc agtaactggg aaattcataa 2100 ggcccaaaaa tcactgcagg cagtggccca aagccatcgg gtaattctcc ggctgttcca 2160 cggtcgagga ggatctgttg gccggggggg cggcccggcc tataaagcca ttttggccca 2220 gcccgcaggc accgtggacg gtcggatcaa aattaccgaa caaggggaag tgttagcttc 2280 taaatattcc ctgccagagt tggccctcta caacctggaa actttaacca cggcggtcat 2340 ccaagctagt ttacttaaaa gtagttttga tttcattgag ccctggaacc ggattatgga 2400 ggagttggcc tgcactgccc gtcgagccta ccggagtttg atttacgaag aaccggactt 2460 tttagatttc ttcctgacgg ttacccccat tcctgaaatt agcgagttac agattagttc 2520 ccgccctgcc cgacgtaagg ggggtaaagc ggatctcagc agtttgcggg ccattccctg 2580 ggtgttcagt tggacccaaa cccgtttcct gctgccggct tggtatgggg tgggcacggc 2640 gttgaaatcc tttgtggacc aagacccggt caaaaatatg aagttgttgc gttacttcta 2700 tttcaaatgg cctttcttca acatggtgat ctcgaaggtg gaaatgaccc tttccaaggt 2760 ggacctcacc atcgcttccc actatgtgca agagctatct aagccagaag accgggaacg 2820 attcgatcgc ctttttcagc agatcaagca agagtatcaa ttaaccaggg actttgccat 2880 ggaaattacg gcccatcccc acctcctgga cggcgatcgc tctttgcaac ggtcggtact 2940 cctacgaaat cgtactattg ttcccctggg gctactgcag atttccctgc tgaaacgttt 3000 acgccaagta acccaggaag cggagaccag cggcgtgcgt taccgtcgtt attccaaaga 3060 agaactactg cggggagctc tgttaaccat taacggtatt gcggccggaa tgcgtaatac 3120 tggttgaacc cagctttctt gtacaa 3146 <210> 2 <211> 1034 <212> PRT <213> Synechocystis sp. <400> 2 Met Asn Leu Ala Val Pro Ala Phe Gly Leu Ser Thr Asn Trp Ser Gly 1 5 10 15 Asn Gly Asn Gly Ser Asn Ser Glu Glu Glu Ser Val Leu Tyr Gln Arg 20 25 30 Leu Lys Met Val Glu Glu Leu Trp Glu Arg Val Leu Gln Ser Glu Cys 35 40 45 Gly Gln Glu Leu Val Asp Leu Leu Thr Glu Leu Arg Leu Gln Gly Thr 50 55 60 His Glu Ala Ile Thr Ser Glu Ile Ser Glu Glu Val Ile Met Gly Ile 65 70 75 80 Thr Gln Arg Ile Glu His Leu Glu Leu Asn Asp Ala Ile Arg Ala Ala 85 90 95 Arg Ala Phe Ala Leu Tyr Phe Gln Leu Ile Asn Ile Val Glu Gln His 100 105 110 Tyr Glu Gln Asn Glu Gln Gln Arg Asn Arg Trp Glu Ala Ser Gln Glu 115 120 125 Thr Asn Phe Tyr Glu Gln Ala Gly Asn Glu Glu Glu Met Val Pro Pro 130 135 140 Ser Arg Leu Gly Ala Ser Thr Glu Pro Leu Pro Val Gly Ile Asp Gln 145 150 155 160 Asn Glu Leu Gln Ala Ser Val Gly Thr Phe His Trp Leu Met Arg Glu 165 170 175 Leu Lys Arg Leu Asn Val Pro Pro Gln His Ile Gln Asn Leu Leu Asp 180 185 190 His Leu Asp Ile Arg Leu Val Ile Thr Ala His Pro Thr Glu Ile Val 195 200 205 Arg His Thr Ile Arg Arg Lys Gln Arg Arg Val Asp Arg Ile Leu Arg 210 215 220 Lys Leu Asp Gln Leu Gln Gly Ser Val Thr Gly Arg Asp Trp Leu Asn 225 230 235 240 Thr Trp Asp Ala Lys Thr Ala Ile Ala Gln Leu Thr Glu Glu Ile Arg 245 250 255 Phe Trp Trp Arg Thr Asp Glu Leu His Gln Phe Lys Pro Thr Val Leu 260 265 270 Asp Glu Val Asp Tyr Ser Leu His Tyr Phe Asp Glu Val Leu Phe Asp 275 280 285 Ala Val Pro Glu Leu Ser Lys Arg Leu Gly Gln Ala Ile Lys Glu Thr 290 295 300 Phe Pro His Leu Arg Ala Pro Arg Ala Asn Phe Cys Tyr Phe Gly Ser 305 310 315 320 Trp Val Gly Gly Asp Arg Asp Gly Asn Pro Ser Val Thr Pro Glu Val 325 330 335 Thr Trp Gln Thr Ala Cys Tyr Gln Arg Gly Leu Val Leu Gly Lys Tyr 340 345 350 Leu Phe Ser Leu Gly Glu Leu Val Ala Ile Leu Ser Pro Ser Leu His 355 360 365 Trp Cys Lys Val Ser Gln Glu Leu Leu Asp Ser Leu Glu Arg Asp Arg 370 375 380 Ile Gln Leu Pro Glu Ile Tyr Glu Glu Leu Ser Leu Arg Tyr Arg Gln 385 390 395 400 Glu Pro Tyr Arg Met Lys Leu Ala Tyr Val Thr Lys Arg Leu Glu Asn 405 410 415 Thr Leu Arg Arg Asn Asn Arg Leu Ala Asn Pro Glu Glu Arg Gln Thr 420 425 430 Met Ile Thr Met Pro Ala Glu Asn His Tyr Arg Thr Gly Glu Glu Leu 435 440 445 Leu Glu Glu Leu Arg Leu Ile Gln Arg Asn Leu Thr Glu Thr Gly Leu 450 455 460 Thr Cys Leu Glu Leu Glu Asn Leu Ile Thr Gln Leu Glu Val Tyr Gly 465 470 475 480 Phe Asn Leu Ala Gln Leu Asp Phe Arg Gln Glu Ser Ser Arg His Ala 485 490 495 Glu Ala Ile Ala Glu Ile Ala Glu Tyr Met Gly Val Leu Thr Thr Pro 500 505 510 Tyr Glu Glu Met Ala Glu Glu Asp Lys Leu Ala Trp Leu Gly Val Glu 515 520 525 Leu Gln Thr Arg Arg Pro Leu Ile Pro Gln Glu Met Pro Phe Ser Glu 530 535 540 Arg Thr Arg Glu Thr Ile Glu Thr Leu Arg Thr Leu Arg His Leu Gln 545 550 555 560 Met Glu Phe Gly Val Asp Ile Cys Gln Thr Tyr Ile Ile Ser Met Thr 565 570 575 Asn Asp Ala Ser Asp Val Leu Glu Val Leu Leu Leu Ala Lys Glu Ala 580 585 590 Gly Leu Tyr Asp Pro Ala Thr Ala Ser Asn Ser Leu Arg Ile Val Pro 595 600 605 Leu Phe Glu Thr Val Glu Asp Leu Lys Asn Ala Pro Gly Ile Met Asp 610 615 620 Ser Leu Phe Ser Leu Pro Phe Tyr Arg Ala Thr Leu Ala Gly Ser Tyr 625 630 635 640 His Ser Leu Lys Glu Leu Gln Asn Gln Pro Pro Asp Tyr Tyr Gln Ile 645 650 655 Pro Thr Thr Thr Ala Leu Leu Asn Pro Gly Asn Leu Gln Glu Ile Met 660 665 670 Val Gly Tyr Ser Asp Ser Asn Lys Asp Ser Gly Phe Leu Ser Ser Asn 675 680 685 Trp Glu Ile His Lys Ala Gln Lys Ser Leu Gln Ala Val Ala Gln Ser 690 695 700 His Arg Val Ile Leu Arg Leu Phe His Gly Arg Gly Gly Ser Val Gly 705 710 715 720 Arg Gly Gly Gly Pro Ala Tyr Lys Ala Ile Leu Ala Gln Pro Ala Gly 725 730 735 Thr Val Asp Gly Arg Ile Lys Ile Thr Glu Gln Gly Glu Val Leu Ala 740 745 750 Ser Lys Tyr Ser Leu Pro Glu Leu Ala Leu Tyr Asn Leu Glu Thr Leu 755 760 765 Thr Thr Ala Val Ile Gln Ala Ser Leu Leu Lys Ser Ser Phe Asp Phe 770 775 780 Ile Glu Pro Trp Asn Arg Ile Met Glu Glu Leu Ala Cys Thr Ala Arg 785 790 795 800 Arg Ala Tyr Arg Ser Leu Ile Tyr Glu Glu Pro Asp Phe Leu Asp Phe 805 810 815 Phe Leu Thr Val Thr Pro Ile Pro Glu Ile Ser Glu Leu Gln Ile Ser 820 825 830 Ser Arg Pro Ala Arg Arg Lys Gly Gly Lys Ala Asp Leu Ser Ser Leu 835 840 845 Arg Ala Ile Pro Trp Val Phe Ser Trp Thr Gln Thr Arg Phe Leu Leu 850 855 860 Pro Ala Trp Tyr Gly Val Gly Thr Ala Leu Lys Ser Phe Val Asp Gln 865 870 875 880 Asp Pro Val Lys Asn Met Lys Leu Leu Arg Tyr Phe Tyr Phe Lys Trp 885 890 895 Pro Phe Phe Asn Met Val Ile Ser Lys Val Glu Met Thr Leu Ser Lys 900 905 910 Val Asp Leu Thr Ile Ala Ser His Tyr Val Gln Glu Leu Ser Lys Pro 915 920 925 Glu Asp Arg Glu Arg Phe Asp Arg Leu Phe Gln Gln Ile Lys Gln Glu 930 935 940 Tyr Gln Leu Thr Arg Asp Phe Ala Met Glu Ile Thr Ala His Pro His 945 950 955 960 Leu Leu Asp Gly Asp Arg Ser Leu Gln Arg Ser Val Leu Leu Arg Asn 965 970 975 Arg Thr Ile Val Pro Leu Gly Leu Leu Gln Ile Ser Leu Leu Lys Arg 980 985 990 Leu Arg Gln Val Thr Gln Glu Ala Glu Thr Ser Gly Val Arg Tyr Arg 995 1000 1005 Arg Tyr Ser Lys Glu Glu Leu Leu Arg Gly Ala Leu Leu Thr Ile 1010 1015 1020 Asn Gly Ile Ala Ala Gly Met Arg Asn Thr Gly 1025 1030 <210> 3 <211> 3182 <212> DNA <213> Anacystis nidulans <400> 3 ctgggtctcc ttgagatcgt atgctcgctg tatctctcag ggatcacggc ttcccgtcag 60 caactgtcca gatccgccct gcgttctgtg tccagtcaga cgtggtggga tcagggaatc 120 cacctagaat gaattactgc cagaacgctc gaactgccat gagtgctgct ctccagtcat 180 ccgacgatgc tttccgaacc gtttcgagtc ccctcgccac ggatttggat ctgtcgtctc 240 cgctggagtt tttccttcgc catcgcttga cggtggttga agaactctgg gaagtggttt 300 tgcgccaaga gtgcggccaa gagctggtcg atattctgac tcagctgcgt gacttgacct 360 cgccggaagg ccaagcccca gaagtgggcg gcgaagcctt ggttcaggtg attgaaaccc 420 tagagttgag cgatgcgatt cgggctgccc gtgcctttgc gctctacttt cagctgatca 480 atattgttga gcagcactac gagcaaactc aatatcaact cgcctacgag cgatcgcggt 540 tggaaccctt gccaggacca gatgaaagtc cggagggatt gcacaccatt gaaattcctc 600 agcatcagct cgatcccttt gctgcggtga ttccgctcaa ccaagatccg gcaaccttcc 660 aaacgctgtt cccgcgcctg cgccagctca atgtgccgcc gcaaatgatc caagagctga 720 ccgatcgcct cgatattcgg ctggttttca ccgctcaccc gacggaaatt gtccgccaca 780 cgattcgcga caaacaacgc cgaattgcct acctgctgcg gcaactggat gagctcgaaa 840 caggcaaaaa ccgaggcttt cgagagcttg aagcgcagaa tattcgtcag cagctgaccg 900 aggagattcg gctctggtgg cggacggatg agctccacca gttcaagcca acggtgttgg 960 atgaggtgga ctacgcgctc cactacttcc aagaagtcct ctttgaggcc attcctctgc 1020 tctatcagcg ctttcggctc gcgctgcagg ggactttccc cgacctacaa ccgccccgct 1080 acaacttctg ccagttcggc tcttgggtcg gctccgatcg cgatggcaat ccttcagtga 1140 cctctgccgt cacttggcaa accgcttgct atcagcgcag tctcgtcctc gatcgctaca 1200 tcacagcggt tgaacatctc cgcaatgtgc tcagcctctc gatgcactgg agcgaggtgc 1260 tgccggagtt gctcagctcg ttggaacagg agagcatgct cttcccggag acctatgagc 1320 agctagcggt ccgctatcgc caagagccct atcgcctcaa gctctcctat attctggagc 1380 gcctgcacaa cacccgcgat cgcaataccc gcctccaaca gcagcaagaa aaagatccca 1440 ccacgcccct gcccgaatat cgggatggca ccctctacca ggctggtacg gcctttctcg 1500 aagatctcaa gctgattcag cacaacctta agcagacggg actgagctgt tacgagctag 1560 agaagttgat ctgccaggtc gagatctttg gtttcaacct ggtccatctc gacattcgcc 1620 aagaaagctc gcgccattcc gacgcgatca acgaaatctg tgaatacctc caaattcttc 1680 cccagcccta caacgagctg agcgaagcag aacgaactgc ctggctggtt caagagctga 1740 aaacccgtcg gccgctggta ccagcgcgca tgccgttctc agaatcgacc cgcgagatca 1800 ttgaaaccct gcggatggtc aagcagctac aggaagaatt tggggaggcg gcttgccaaa 1860 cctacatcat cagcatgagc cgcgagctga gcgacctgct ggaagtgctg ctgctggcca 1920 aggaggttgg tctctacgac ccagtcaccg gcaagagttc gcttcaggtg attccgctgt 1980 ttgaaactgt ggaggactta caaaatgccc cgcgggtgat gacggcgctg tttgagctgc 2040 ccttctacac ccagctcaac cccacccagt ctgaaccgct gcaggaagtg atgctggggt 2100 attccgacag taacaaggac tcgggcttcc tcagcagtaa ctgggagatc cacaaggccc 2160 agaaagccct agggacggta gcccgcgacc accgcgtcaa gctgcggatc ttccacggcc 2220 gcgggggctc cgtcggtcga ggtggtggcc ctgcctacga ggcgatcttg gcccagccgg 2280 gtcgcaccac agatggccga atcaagatta cggaacaggg cgaggtcttg gcttcgaaat 2340 acgccctgcc cgaactggcg ctctataacc ttgagacgat cacgacggcg gtgattcagt 2400 ccagcctgct gggtagcggc tttgatgaca ttgagccgtg gaaccaaatt atggaagagt 2460 tggcggcgcg atcgcggcga cattaccgcg ctttggtgta cgagcagccc gacctggttg 2520 acttcttcaa tcaggtaacg ccgattgagg agatcagcaa actgcaaatc agctcgcgac 2580 cggctcgacg caaaaccggc aagcgcgatc tgggcagtct acgtgccatc ccctgggtct 2640 ttagctggac gcagagtcgt tttctgctgc cctcttggta tggcgtcggc acagcacttc 2700 aggagttttt gcaggagcgc ccggagcaga acctcaacct gctgcgctac ttctacgaga 2760 agtggccgtt cttccgcatg gtgatctcga aggtcgagat gaccctagcg aaggtcgatt 2820 tgcagattgc tcatcactac gtgcatgagc tggccaatcc tgaggatcaa gagcggtttg 2880 aacgagtgtt cagccaaatc gctgcagagt ttcagctgac ttgtcatctc gtgttgacga 2940 ttaccaacca cggtcgcttg ctggatggcg accccgaact gcagcgatcg gtgcagctgc 3000 gcaacggtac gatcgtgccc ctcggcttct tgcaagtcgc cctgcttaaa cgcctgcggc 3060 agtatcgcca gcaaacggaa acgacgggat tgatgcgatc gcgctatagc aaaggggaac 3120 tgctgcgcgg agcattgctg acgatcaacg gcattgcggc tggcatgcgc aatacaggtt 3180 ga 3182 <210> 4 <211> 1053 <212> PRT <213> Synechococcus elongatus <400> 4 Met Leu Ala Val Ser Leu Arg Asp His Gly Phe Pro Ser Ala Thr Val 1 5 10 15 Gln Ile Arg Pro Ala Phe Cys Val Gln Ser Asp Val Val Gly Ser Gly 20 25 30 Asn Pro Pro Arg Met Asn Tyr Cys Gln Asn Ala Arg Thr Ala Met Ser 35 40 45 Ala Ala Leu Gln Ser Ser Asp Asp Ala Phe Arg Thr Val Ser Ser Pro 50 55 60 Leu Ala Thr Asp Leu Asp Leu Ser Ser Pro Leu Glu Phe Phe Leu Arg 65 70 75 80 His Arg Leu Thr Val Val Glu Glu Leu Trp Glu Val Val Leu Arg Gln 85 90 95 Glu Cys Gly Gln Glu Leu Val Asp Ile Leu Thr Gln Leu Arg Asp Leu 100 105 110 Thr Ser Pro Glu Gly Gln Ala Pro Glu Val Gly Gly Glu Ala Leu Val 115 120 125 Gln Val Ile Glu Thr Leu Glu Leu Ser Asp Ala Ile Arg Ala Ala Arg 130 135 140 Ala Phe Ala Leu Tyr Phe Gln Leu Ile Asn Ile Val Glu Gln His Tyr 145 150 155 160 Glu Gln Thr Gln Tyr Gln Leu Ala Tyr Glu Arg Ser Arg Leu Glu Pro 165 170 175 Leu Pro Gly Pro Asp Glu Ser Pro Glu Gly Leu His Thr Ile Glu Ile 180 185 190 Pro Gln His Gln Leu Asp Pro Phe Ala Ala Val Ile Pro Leu Asn Gln 195 200 205 Asp Pro Ala Thr Phe Gln Thr Leu Phe Pro Arg Leu Arg Gln Leu Asn 210 215 220 Val Pro Pro Gln Met Ile Gln Glu Leu Thr Asp Arg Leu Asp Ile Arg 225 230 235 240 Leu Val Phe Thr Ala His Pro Thr Glu Ile Val Arg His Thr Ile Arg 245 250 255 Asp Lys Gln Arg Arg Ile Ala Tyr Leu Leu Arg Gln Leu Asp Glu Leu 260 265 270 Glu Thr Gly Lys Asn Arg Gly Phe Arg Glu Leu Glu Ala Gln Asn Ile 275 280 285 Arg Gln Gln Leu Thr Glu Glu Ile Arg Leu Trp Trp Arg Thr Asp Glu 290 295 300 Leu His Gln Phe Lys Pro Thr Val Leu Asp Glu Val Asp Tyr Ala Leu 305 310 315 320 His Tyr Phe Gln Glu Val Leu Phe Glu Ala Ile Pro Leu Leu Tyr Gln 325 330 335 Arg Phe Arg Leu Ala Leu Gln Gly Thr Phe Pro Asp Leu Gln Pro Pro 340 345 350 Arg Tyr Asn Phe Cys Gln Phe Gly Ser Trp Val Gly Ser Asp Arg Asp 355 360 365 Gly Asn Pro Ser Val Thr Ser Ala Val Thr Trp Gln Thr Ala Cys Tyr 370 375 380 Gln Arg Ser Leu Val Leu Asp Arg Tyr Ile Thr Ala Val Glu His Leu 385 390 395 400 Arg Asn Val Leu Ser Leu Ser Met His Trp Ser Glu Val Leu Pro Glu 405 410 415 Leu Leu Ser Ser Leu Glu Gln Glu Ser Met Leu Phe Pro Glu Thr Tyr 420 425 430 Glu Gln Leu Ala Val Arg Tyr Arg Gln Glu Pro Tyr Arg Leu Lys Leu 435 440 445 Ser Tyr Ile Leu Glu Arg Leu His Asn Thr Arg Asp Arg Asn Thr Arg 450 455 460 Leu Gln Gln Gln Gln Glu Lys Asp Pro Thr Thr Pro Leu Pro Glu Tyr 465 470 475 480 Arg Asp Gly Thr Leu Tyr Gln Ala Gly Thr Ala Phe Leu Glu Asp Leu 485 490 495 Lys Leu Ile Gln His Asn Leu Lys Gln Thr Gly Leu Ser Cys Tyr Glu 500 505 510 Leu Glu Lys Leu Ile Cys Gln Val Glu Ile Phe Gly Phe Asn Leu Val 515 520 525 His Leu Asp Ile Arg Gln Glu Ser Ser Arg His Ser Asp Ala Ile Asn 530 535 540 Glu Ile Cys Glu Tyr Leu Gln Ile Leu Pro Gln Pro Tyr Asn Glu Leu 545 550 555 560 Ser Glu Ala Glu Arg Thr Ala Trp Leu Val Gln Glu Leu Lys Thr Arg 565 570 575 Arg Pro Leu Val Pro Ala Arg Met Pro Phe Ser Glu Ser Thr Arg Glu 580 585 590 Ile Ile Glu Thr Leu Arg Met Val Lys Gln Leu Gln Glu Glu Phe Gly 595 600 605 Glu Ala Ala Cys Gln Thr Tyr Ile Ile Ser Met Ser Arg Glu Leu Ser 610 615 620 Asp Leu Leu Glu Val Leu Leu Leu Ala Lys Glu Val Gly Leu Tyr Asp 625 630 635 640 Pro Val Thr Gly Lys Ser Ser Leu Gln Val Ile Pro Leu Phe Glu Thr 645 650 655 Val Glu Asp Leu Gln Asn Ala Pro Arg Val Met Thr Ala Leu Phe Glu 660 665 670 Leu Pro Phe Tyr Thr Gln Leu Asn Pro Thr Gln Ser Glu Pro Leu Gln 675 680 685 Glu Val Met Leu Gly Tyr Ser Asp Ser Asn Lys Asp Ser Gly Phe Leu 690 695 700 Ser Ser Asn Trp Glu Ile His Lys Ala Gln Lys Ala Leu Gly Thr Val 705 710 715 720 Ala Arg Asp His Arg Val Lys Leu Arg Ile Phe His Gly Arg Gly Gly 725 730 735 Ser Val Gly Arg Gly Gly Gly Pro Ala Tyr Glu Ala Ile Leu Ala Gln 740 745 750 Pro Gly Arg Thr Thr Asp Gly Arg Ile Lys Ile Thr Glu Gln Gly Glu 755 760 765 Val Leu Ala Ser Lys Tyr Ala Leu Pro Glu Leu Ala Leu Tyr Asn Leu 770 775 780 Glu Thr Ile Thr Thr Ala Val Ile Gln Ser Ser Leu Leu Gly Ser Gly 785 790 795 800 Phe Asp Asp Ile Glu Pro Trp Asn Gln Ile Met Glu Glu Leu Ala Ala 805 810 815 Arg Ser Arg Arg His Tyr Arg Ala Leu Val Tyr Glu Gln Pro Asp Leu 820 825 830 Val Asp Phe Phe Asn Gln Val Thr Pro Ile Glu Glu Ile Ser Lys Leu 835 840 845 Gln Ile Ser Ser Arg Pro Ala Arg Arg Lys Thr Gly Lys Arg Asp Leu 850 855 860 Gly Ser Leu Arg Ala Ile Pro Trp Val Phe Ser Trp Thr Gln Ser Arg 865 870 875 880 Phe Leu Leu Pro Ser Trp Tyr Gly Val Gly Thr Ala Leu Gln Glu Phe 885 890 895 Leu Gln Glu Arg Pro Glu Gln Asn Leu Asn Leu Leu Arg Tyr Phe Tyr 900 905 910 Glu Lys Trp Pro Phe Phe Arg Met Val Ile Ser Lys Val Glu Met Thr 915 920 925 Leu Ala Lys Val Asp Leu Gln Ile Ala His His Tyr Val His Glu Leu 930 935 940 Ala Asn Pro Glu Asp Gln Glu Arg Phe Glu Arg Val Phe Ser Gln Ile 945 950 955 960 Ala Ala Glu Phe Gln Leu Thr Cys His Leu Val Leu Thr Ile Thr Asn 965 970 975 His Gly Arg Leu Leu Asp Gly Asp Pro Glu Leu Gln Arg Ser Val Gln 980 985 990 Leu Arg Asn Gly Thr Ile Val Pro Leu Gly Phe Leu Gln Val Ala Leu 995 1000 1005 Leu Lys Arg Leu Arg Gln Tyr Arg Gln Gln Thr Glu Thr Thr Gly 1010 1015 1020 Leu Met Arg Ser Arg Tyr Ser Lys Gly Glu Leu Leu Arg Gly Ala 1025 1030 1035 Leu Leu Thr Ile Asn Gly Ile Ala Ala Gly Met Arg Asn Thr Gly 1040 1045 1050 <210> 5 <211> 2988 <212> DNA <213> Synechococcus sp. <400> 5 atgaaccaag tcatgcatcc ccccagtgcc gaagctgaac ttttgtccac ttcccaatct 60 ctcctccggc aacgcctcac gctggttgaa gacatttggc aggcggtgtt gcagaaagaa 120 tgtggtcaaa aactcgtcga acggctcaat catctccggg caacccgaac cgccgatggc 180 caaagcctaa acttctctcc aagtagtatt tctgagctga tcgaaaccct agatctagaa 240 gatgcgatcc gggcagcacg ggcttttgcc ctctatttcc agctgatcaa tagcgtcgag 300 caacattacg aacagcgcga acaacaacaa tttcggcgga acctcgcctc tgccaatgcc 360 agcgaagcca acggtaacag cgtccataca gaaattgccc ccacccaagc cggcaccttt 420 gattggttgt ttccccatct caagcaccaa aatatgccgc cccagacgat ccagcgtctt 480 ctcaatcagt tggatattcg actggtattt acggcccacc ccacggagat tgtccgccac 540 acgattcgca ataagcagcg gcggattgcg gggatcctac ggcaactgga tcaaaccgaa 600 gaagggctga aaagcttggg gacaagcgat tcttgggaaa ttgaaaatat tcagcagcaa 660 cttaccgaag aaattcggct ctggtggcgc accgatgagc tgcaccaatt taaaccccag 720 gtgttggacg aagtggacta tgcgttgcat tattttgagg aagttctgtt tgacaccctg 780 cccgaattat cggtacggct ccaacaggcc ctaaaggcat ctttcccaac cctcaaggtg 840 cccaccacca atttttgtaa ttttggctct tgggtcgggg gcgatcgcga tggcaaccct 900 tctgtcactc ctgacgttac gtggaagaca gcttgctatc aacggggttt ggtgctggaa 960 cgctacatcg cctcggtgga atccctctcg gatgtgttga gcttatcgct gcactggagt 1020 aatgtgctgc cggatctgct gcattcatcg taccaagatc agaatatttt ccccgacgtc 1080 tatcaaagcc tggccagtcg tcaccgtcaa gaaccctatc gtctcaagtc agcctacatt 1140 aagcggcgct tggaaaatac cttggagcgc aaccgtcgtc tagcgaatat gcccgcctgg 1200 gaaaataaag tagaagcggc cgatgacaag gtttatattt gtggccagga gtttctcgca 1260 gacctaaaac tgatccgcga aagcctggta cagacggaaa tcaactgtgc ggccctggat 1320 aaactcattt gccaagtcga aatttttagc tttgtgctca ctcgccttga ttttcgccaa 1380 gaatcaacgc gccactccga tgcgatcgcc gaaattgttg actacctgag tattgcccaa 1440 atcctacaac gacctaagcg acgcagaaaa aaccaccttg gtctagtgca ggaattaaaa 1500 acccgccgtc ccttgattcc gaaggaaatg cacttttcgg aaagaaccgt cgagacgatc 1560 caaacgctcc aggtgctgcg ccgtctccag caggaatttg gcatcggcat ttgccagacc 1620 tacatcatca gcatgaccaa cgaagtcagt gatgtcttag aggtgctgct cttggcccag 1680 gaagcgggtt tgtatgaccc cctcacaggg atgaccacca tccgcattgc ccccctcttt 1740 gagacggtgg acgacctgcg taacgccccg gaaatcatgc aggcgttgtt tgaaattccc 1800 ctctatcgcg cttgtttagc tggtggctat gaaccccccg ccgatggccg ctgtgatgaa 1860 acctttggcg atcgcctggt gccgaatctc caggaaatta tgctcggcta ttccgacagc 1920 aacaaagatt ccggcttcct cagtagtaat tgggaaatcc acaaagccca gaaaaatctc 1980 caacaagtgg ccgatcccta cggcattgac ctccgcattt tccatggtcg cggtggttcc 2040 gttggtcggg gcggcggccc tgcctacgcc gctattttgg cccaaccgcc caacaccatc 2100 aatggccgga ttaaaatcac cgaacagggg gaagtgctgg cgtctaaata ttccctccca 2160 gacttggcgc tatatcacct cgaaagcgtt tctacggcgg tgattcaatc gagtttgtta 2220 gccagtggct ttgatgatat tcagccctgg aaccggatta tggaagacct ctcccagcga 2280 tcgcgggcgg cttaccgggc gttaatttac gaagaacccg acttcctcga ctttttcatg 2340 tccgtgacgc cgattccgga aattagccaa ctgcaaatca gttcccgtcc ggcccgtcgc 2400 aaaaaaggca ataaagattt gagtagtctc cgggcgattc cctgggtctt tagctggacc 2460 caaagccgct tcctcgtgcc cgcttggtat ggtgtgggta ccgcgctcca gggctttttt 2520 gaagaggatc ccgtcgagaa cctgaagtta atgcgctatt tctacagtaa atggcccttt 2580 ttccggatgg tgatctcaaa ggtagagatg accctttcta aggtggactt acaaatggcg 2640 agccactatg tccacgaact ggcggaaaaa gaagatattc cccggtttga aaagcttcta 2700 gagcagattt cccaggaata caacctcacg aagcggctaa tcctcgaaat taccgaaaat 2760 gaagccctcc tcgatggcga tcgccccctc cagcgttctg tccaactgag aaatggcacc 2820 attgtccccc tcggtttcct gcaagtctca ttgctcaaac ggctacgtca atacaccagg 2880 gaaacccaag ccagtatcgt tcacttccgc tacagcaaag aagaactcct gcggggcgcc 2940 cttttaacca tcaatggcat cgccgccgga atgcggaaca cgggttga 2988 <210> 6 <211> 995 <212> PRT <213> Synechococcus sp. <400> 6 Met Asn Gln Val Met His Pro Pro Ser Ala Glu Ala Glu Leu Leu Ser 1 5 10 15 Thr Ser Gln Ser Leu Leu Arg Gln Arg Leu Thr Leu Val Glu Asp Ile 20 25 30 Trp Gln Ala Val Leu Gln Lys Glu Cys Gly Gln Lys Leu Val Glu Arg 35 40 45 Leu Asn His Leu Arg Ala Thr Arg Thr Ala Asp Gly Gln Ser Leu Asn 50 55 60 Phe Ser Pro Ser Ser Ile Ser Glu Leu Ile Glu Thr Leu Asp Leu Glu 65 70 75 80 Asp Ala Ile Arg Ala Ala Arg Ala Phe Ala Leu Tyr Phe Gln Leu Ile 85 90 95 Asn Ser Val Glu Gln His Tyr Glu Gln Arg Glu Gln Gln Gln Phe Arg 100 105 110 Arg Asn Leu Ala Ser Ala Asn Ala Ser Glu Ala Asn Gly Asn Ser Val 115 120 125 His Thr Glu Ile Ala Pro Thr Gln Ala Gly Thr Phe Asp Trp Leu Phe 130 135 140 Pro His Leu Lys His Gln Asn Met Pro Pro Gln Thr Ile Gln Arg Leu 145 150 155 160 Leu Asn Gln Leu Asp Ile Arg Leu Val Phe Thr Ala His Pro Thr Glu 165 170 175 Ile Val Arg His Thr Ile Arg Asn Lys Gln Arg Arg Ile Ala Gly Ile 180 185 190 Leu Arg Gln Leu Asp Gln Thr Glu Glu Gly Leu Lys Ser Leu Gly Thr 195 200 205 Ser Asp Ser Trp Glu Ile Glu Asn Ile Gln Gln Gln Leu Thr Glu Glu 210 215 220 Ile Arg Leu Trp Trp Arg Thr Asp Glu Leu His Gln Phe Lys Pro Gln 225 230 235 240 Val Leu Asp Glu Val Asp Tyr Ala Leu His Tyr Phe Glu Glu Val Leu 245 250 255 Phe Asp Thr Leu Pro Glu Leu Ser Val Arg Leu Gln Gln Ala Leu Lys 260 265 270 Ala Ser Phe Pro Thr Leu Lys Val Pro Thr Thr Asn Phe Cys Asn Phe 275 280 285 Gly Ser Trp Val Gly Gly Asp Arg Asp Gly Asn Pro Ser Val Thr Pro 290 295 300 Asp Val Thr Trp Lys Thr Ala Cys Tyr Gln Arg Gly Leu Val Leu Glu 305 310 315 320 Arg Tyr Ile Ala Ser Val Glu Ser Leu Ser Asp Val Leu Ser Leu Ser 325 330 335 Leu His Trp Ser Asn Val Leu Pro Asp Leu Leu His Ser Ser Tyr Gln 340 345 350 Asp Gln Asn Ile Phe Pro Asp Val Tyr Gln Ser Leu Ala Ser Arg His 355 360 365 Arg Gln Glu Pro Tyr Arg Leu Lys Ser Ala Tyr Ile Lys Arg Arg Leu 370 375 380 Glu Asn Thr Leu Glu Arg Asn Arg Arg Leu Ala Asn Met Pro Ala Trp 385 390 395 400 Glu Asn Lys Val Glu Ala Ala Asp Asp Lys Val Tyr Ile Cys Gly Gln 405 410 415 Glu Phe Leu Ala Asp Leu Lys Leu Ile Arg Glu Ser Leu Val Gln Thr 420 425 430 Glu Ile Asn Cys Ala Ala Leu Asp Lys Leu Ile Cys Gln Val Glu Ile 435 440 445 Phe Ser Phe Val Leu Thr Arg Leu Asp Phe Arg Gln Glu Ser Thr Arg 450 455 460 His Ser Asp Ala Ile Ala Glu Ile Val Asp Tyr Leu Ser Ile Ala Gln 465 470 475 480 Ile Leu Gln Arg Pro Lys Arg Arg Arg Lys Asn His Leu Gly Leu Val 485 490 495 Gln Glu Leu Lys Thr Arg Arg Pro Leu Ile Pro Lys Glu Met His Phe 500 505 510 Ser Glu Arg Thr Val Glu Thr Ile Gln Thr Leu Gln Val Leu Arg Arg 515 520 525 Leu Gln Gln Glu Phe Gly Ile Gly Ile Cys Gln Thr Tyr Ile Ile Ser 530 535 540 Met Thr Asn Glu Val Ser Asp Val Leu Glu Val Leu Leu Leu Ala Gln 545 550 555 560 Glu Ala Gly Leu Tyr Asp Pro Leu Thr Gly Met Thr Thr Ile Arg Ile 565 570 575 Ala Pro Leu Phe Glu Thr Val Asp Asp Leu Arg Asn Ala Pro Glu Ile 580 585 590 Met Gln Ala Leu Phe Glu Ile Pro Leu Tyr Arg Ala Cys Leu Ala Gly 595 600 605 Gly Tyr Glu Pro Pro Ala Asp Gly Arg Cys Asp Glu Thr Phe Gly Asp 610 615 620 Arg Leu Val Pro Asn Leu Gln Glu Ile Met Leu Gly Tyr Ser Asp Ser 625 630 635 640 Asn Lys Asp Ser Gly Phe Leu Ser Ser Asn Trp Glu Ile His Lys Ala 645 650 655 Gln Lys Asn Leu Gln Gln Val Ala Asp Pro Tyr Gly Ile Asp Leu Arg 660 665 670 Ile Phe His Gly Arg Gly Gly Ser Val Gly Arg Gly Gly Gly Pro Ala 675 680 685 Tyr Ala Ala Ile Leu Ala Gln Pro Pro Asn Thr Ile Asn Gly Arg Ile 690 695 700 Lys Ile Thr Glu Gln Gly Glu Val Leu Ala Ser Lys Tyr Ser Leu Pro 705 710 715 720 Asp Leu Ala Leu Tyr His Leu Glu Ser Val Ser Thr Ala Val Ile Gln 725 730 735 Ser Ser Leu Leu Ala Ser Gly Phe Asp Asp Ile Gln Pro Trp Asn Arg 740 745 750 Ile Met Glu Asp Leu Ser Gln Arg Ser Arg Ala Ala Tyr Arg Ala Leu 755 760 765 Ile Tyr Glu Glu Pro Asp Phe Leu Asp Phe Phe Met Ser Val Thr Pro 770 775 780 Ile Pro Glu Ile Ser Gln Leu Gln Ile Ser Ser Arg Pro Ala Arg Arg 785 790 795 800 Lys Lys Gly Asn Lys Asp Leu Ser Ser Leu Arg Ala Ile Pro Trp Val 805 810 815 Phe Ser Trp Thr Gln Ser Arg Phe Leu Val Pro Ala Trp Tyr Gly Val 820 825 830 Gly Thr Ala Leu Gln Gly Phe Phe Glu Glu Asp Pro Val Glu Asn Leu 835 840 845 Lys Leu Met Arg Tyr Phe Tyr Ser Lys Trp Pro Phe Phe Arg Met Val 850 855 860 Ile Ser Lys Val Glu Met Thr Leu Ser Lys Val Asp Leu Gln Met Ala 865 870 875 880 Ser His Tyr Val His Glu Leu Ala Glu Lys Glu Asp Ile Pro Arg Phe 885 890 895 Glu Lys Leu Leu Glu Gln Ile Ser Gln Glu Tyr Asn Leu Thr Lys Arg 900 905 910 Leu Ile Leu Glu Ile Thr Glu Asn Glu Ala Leu Leu Asp Gly Asp Arg 915 920 925 Pro Leu Gln Arg Ser Val Gln Leu Arg Asn Gly Thr Ile Val Pro Leu 930 935 940 Gly Phe Leu Gln Val Ser Leu Leu Lys Arg Leu Arg Gln Tyr Thr Arg 945 950 955 960 Glu Thr Gln Ala Ser Ile Val His Phe Arg Tyr Ser Lys Glu Glu Leu 965 970 975 Leu Arg Gly Ala Leu Leu Thr Ile Asn Gly Ile Ala Ala Gly Met Arg 980 985 990 Asn Thr Gly 995 <210> 7 <211> 3333 <212> DNA <213> Anabaena variabilis <400> 7 cgcctgccta ttttaccctt ccctgatgac gatgaatcaa ccaattaaag tttaaaaata 60 tacttcaaaa atatgctcac ataagtagat aagagcataa gttaccaaaa atcaatctgt 120 taaacagtaa ttggctttac aagagaagca agtatgggtt ctgttttata ctctttatct 180 gaatctgcta atttatatcc agcatcggaa ttattcttgc gtcatcgtct ccaaatagta 240 gaagaactgt gggagtcggt actgcggcaa gaatgcggcc aaaatatggt ggatttgtta 300 cggcagttgc gtgatttgtg ttcaccagaa gggcaagcca caaaagacca agcagtttct 360 gctgtcaagt taattgaaca gttgaatatt aatgaagcca ttcgggcagc tagggctttt 420 gctttgtatt ttcagctgat caacatcata gagcaggaat atgagcaaag gcagcaatta 480 actcgctatt ctgacttaga agcggaaaca gcacccctaa atggttccga aaacattacc 540 tcatcctcta accacaacga agatgatgtt attttcaacc ggggtttagg gactgatttc 600 ttaggaaaaa attggactaa tcgtggacaa gggaaacaaa aaggtacttt tgcagcgtta 660 tttcccttat tgtctaaatt gaatgtccca ccccaacaaa ttcaacgcct gatttcccaa 720 ctagatgtcc gtttggtatt cactgcccac ccaacggaaa ttgtccgcca caccattcgg 780 gacaaacaac ggcaagtagt agatttgttg caacaactcg atgaggtgga aaatcgagct 840 aaggacggcg gcggctatcc ttgggaagcg ggggaaattc gggaaaaatt gctagaagaa 900 attcgcttgt ggtggcgtac agacgaactc caccagttta agcccactgt gctggatgaa 960 gtggattatg ctttgcatta cttccaagaa gttttatttg atgggattcc ccaactgtat 1020 aagcgtttca aatacgccct aaatcaaact ttctcctggt tagaaccacc aagcaaagat 1080 ttctgttcct ttggttcttg ggtaggttca gacagagatg gtaatccatc ggtaacaccg 1140 gaaattacct ggcagacagc ttgttatcag cgcaaaatgg tgctggaaag atatatcaag 1200 tctgtcaccc aattgattga attattaagt atctccatgc actggagtga cgttttacca 1260 gacttattgg aatccttgga gttagatcag tcccagttaa gtgaagtata cgatgctctg 1320 gcgctgagat atcgccaaga accctatcgt ctcaaactag cttacgtcct caagcgcctg 1380 gaaaataccc gcgatcgcaa tttagcttta tataaaggtg aaacccccac aaatgaagat 1440 agccccatgt atcgttcggg gtcggaattt ttggcggaac tgcgattaat tcagcataac 1500 ttgacggaaa caggtttaag ctgccgagaa ttggataatt tgatctgtca agtggaaatt 1560 tttgacttta acctgacaaa attagacatc cgtcaagaat ccaccagaca ttcggacgcg 1620 ttaaacgaga ttctcgacta tctccaatta ttaccccagc catacaacga cctctccgaa 1680 gaacagcgag ttgcttggct aacaaccgaa ctgcaaaccc gtcgcccatt aatttcgtca 1740 gaactaccat tctctgacaa aactaatgat gtcattaaaa ctttccgcgt agtgcgatcg 1800 ctccaacaag aatttggcat taatatctgc caaacttaca tcattagtat gtgtcgtcaa 1860 gtcagcgatg tcttagaagt tttgcttcta gccaaagaag ccagactttt tgacccagcg 1920 atcgccgtcg gtacaattca ggttgtacca ttatttgaga ctgtcgaaga tttacaacgt 1980 tctcgcagcg tcatgcgaca gttatttgaa ttacctctat accgcgcttt gctagctggt 2040 ggttacaaaa ataccgaagt aaaagtaccg aatactgagc taacacccca atccccagcc 2100 cccagtcccc agtccgtact cacccccgac ttacaagaag tcatgctggg atattccgac 2160 agcaacaaag actccggctt cttgagtagc aattgggaaa ttcataaagc ccaaaaatca 2220 ttacagcaaa tcgccgaaga atatggcgta aatttgcgga ttttccacgg gcgcggcggt 2280 tctgtaggac gaggcggcgg cccagcccac gaggcgattt tggctcaacc aggacacagc 2340 atcaacgggc ggattaaaat taccgaacaa ggggaagtat tagcctccaa gtactccttg 2400 ctagatttag ccctgtacaa cttggaaacc atcaccacgg cggtgattca agccagcctc 2460 ctgcgaactg ggtttgatga tatcgaacct tggaacgaaa ttatggaaga attagcagcg 2520 cgatcgcggc aacattatcg tggtttaatt tacgaacagc ctgatttcat tgactttttc 2580 caccaagtca cacccattga agaaatcagt caactacaaa ttagttctcg tcccgcccgt 2640 cgtccttctg gtaagaaaga tttaagcagt ctccgcgcca ttccttgggt atttagctgg 2700 acacaaacac gattcttact accttcttgg tacggtgtcg gtacagcttt acaagaattt 2760 ttcaacgaag aaccagaaga acatctcaaa ttgatgcgct acttttatgt caagtggcct 2820 ttcttcaaga tggtgatttc taaagtagaa atgaccttgg cgaaagtaga tatgcaaatg 2880 gctggtcact acgtacaaga attgtctgac cctgaagaca aaccccggtt tgagaaagta 2940 tttgagcaaa tcgccaacga atattatctc accagagatt tagtcttaaa aatcaccgac 3000 cacggtcggc ttttagatgg tgatcctgta ctccagcgtt ctgtacagtt acgcaatggt 3060 acaatcgtcc cactagggtt tatccaagtt tccctcctca agcgcctacg ccagtccaaa 3120 aataatactg caacctctgg tgtcattcac tctcgttaca gtaagggaga attattgcgc 3180 ggcgcactgt taaccattaa tggtattgcc gcagggatga gaaatacagg ttgatttgtg 3240 agttgtcagt agttagtggt cagtggtaaa acacatacaa ctgacaactg acaaccgaac 3300 aaatggtcaa aaataaaatc ttaatctgta ctg 3333 <210> 8 <211> 982 <212> PRT <213> Anabaena variabilis <400> 8 Met Val Asp Leu Leu Arg Gln Leu Arg Asp Leu Cys Ser Pro Glu Gly 1 5 10 15 Gln Ala Thr Lys Asp Gln Ala Val Ser Ala Val Lys Leu Ile Glu Gln 20 25 30 Leu Asn Ile Asn Glu Ala Ile Arg Ala Ala Arg Ala Phe Ala Leu Tyr 35 40 45 Phe Gln Leu Ile Asn Ile Ile Glu Gln Glu Tyr Glu Gln Arg Gln Gln 50 55 60 Leu Thr Arg Tyr Ser Asp Leu Glu Ala Glu Thr Ala Pro Leu Asn Gly 65 70 75 80 Ser Glu Asn Ile Thr Ser Ser Ser Asn His Asn Glu Asp Asp Val Ile 85 90 95 Phe Asn Arg Gly Leu Gly Thr Asp Phe Leu Gly Lys Asn Trp Thr Asn 100 105 110 Arg Gly Gln Gly Lys Gln Lys Gly Thr Phe Ala Ala Leu Phe Pro Leu 115 120 125 Leu Ser Lys Leu Asn Val Pro Pro Gln Gln Ile Gln Arg Leu Ile Ser 130 135 140 Gln Leu Asp Val Arg Leu Val Phe Thr Ala His Pro Thr Glu Ile Val 145 150 155 160 Arg His Thr Ile Arg Asp Lys Gln Arg Gln Val Val Asp Leu Leu Gln 165 170 175 Gln Leu Asp Glu Val Glu Asn Arg Ala Lys Asp Gly Gly Gly Tyr Pro 180 185 190 Trp Glu Ala Gly Glu Ile Arg Glu Lys Leu Leu Glu Glu Ile Arg Leu 195 200 205 Trp Trp Arg Thr Asp Glu Leu His Gln Phe Lys Pro Thr Val Leu Asp 210 215 220 Glu Val Asp Tyr Ala Leu His Tyr Phe Gln Glu Val Leu Phe Asp Gly 225 230 235 240 Ile Pro Gln Leu Tyr Lys Arg Phe Lys Tyr Ala Leu Asn Gln Thr Phe 245 250 255 Ser Trp Leu Glu Pro Pro Ser Lys Asp Phe Cys Ser Phe Gly Ser Trp 260 265 270 Val Gly Ser Asp Arg Asp Gly Asn Pro Ser Val Thr Pro Glu Ile Thr 275 280 285 Trp Gln Thr Ala Cys Tyr Gln Arg Lys Met Val Leu Glu Arg Tyr Ile 290 295 300 Lys Ser Val Thr Gln Leu Ile Glu Leu Leu Ser Ile Ser Met His Trp 305 310 315 320 Ser Asp Val Leu Pro Asp Leu Leu Glu Ser Leu Glu Leu Asp Gln Ser 325 330 335 Gln Leu Ser Glu Val Tyr Asp Ala Leu Ala Leu Arg Tyr Arg Gln Glu 340 345 350 Pro Tyr Arg Leu Lys Leu Ala Tyr Val Leu Lys Arg Leu Glu Asn Thr 355 360 365 Arg Asp Arg Asn Leu Ala Leu Tyr Lys Gly Glu Thr Pro Thr Asn Glu 370 375 380 Asp Ser Pro Met Tyr Arg Ser Gly Ser Glu Phe Leu Ala Glu Leu Arg 385 390 395 400 Leu Ile Gln His Asn Leu Thr Glu Thr Gly Leu Ser Cys Arg Glu Leu 405 410 415 Asp Asn Leu Ile Cys Gln Val Glu Ile Phe Asp Phe Asn Leu Thr Lys 420 425 430 Leu Asp Ile Arg Gln Glu Ser Thr Arg His Ser Asp Ala Leu Asn Glu 435 440 445 Ile Leu Asp Tyr Leu Gln Leu Leu Pro Gln Pro Tyr Asn Asp Leu Ser 450 455 460 Glu Glu Gln Arg Val Ala Trp Leu Thr Thr Glu Leu Gln Thr Arg Arg 465 470 475 480 Pro Leu Ile Ser Ser Glu Leu Pro Phe Ser Asp Lys Thr Asn Asp Val 485 490 495 Ile Lys Thr Phe Arg Val Val Arg Ser Leu Gln Gln Glu Phe Gly Ile 500 505 510 Asn Ile Cys Gln Thr Tyr Ile Ile Ser Met Cys Arg Gln Val Ser Asp 515 520 525 Val Leu Glu Val Leu Leu Leu Ala Lys Glu Ala Arg Leu Phe Asp Pro 530 535 540 Ala Ile Ala Val Gly Thr Ile Gln Val Val Pro Leu Phe Glu Thr Val 545 550 555 560 Glu Asp Leu Gln Arg Ser Arg Ser Val Met Arg Gln Leu Phe Glu Leu 565 570 575 Pro Leu Tyr Arg Ala Leu Leu Ala Gly Gly Tyr Lys Asn Thr Glu Val 580 585 590 Lys Val Pro Asn Thr Glu Leu Thr Pro Gln Ser Pro Ala Pro Ser Pro 595 600 605 Gln Ser Val Leu Thr Pro Asp Leu Gln Glu Val Met Leu Gly Tyr Ser 610 615 620 Asp Ser Asn Lys Asp Ser Gly Phe Leu Ser Ser Asn Trp Glu Ile His 625 630 635 640 Lys Ala Gln Lys Ser Leu Gln Gln Ile Ala Glu Glu Tyr Gly Val Asn 645 650 655 Leu Arg Ile Phe His Gly Arg Gly Gly Ser Val Gly Arg Gly Gly Gly 660 665 670 Pro Ala His Glu Ala Ile Leu Ala Gln Pro Gly His Ser Ile Asn Gly 675 680 685 Arg Ile Lys Ile Thr Glu Gln Gly Glu Val Leu Ala Ser Lys Tyr Ser 690 695 700 Leu Leu Asp Leu Ala Leu Tyr Asn Leu Glu Thr Ile Thr Thr Ala Val 705 710 715 720 Ile Gln Ala Ser Leu Leu Arg Thr Gly Phe Asp Asp Ile Glu Pro Trp 725 730 735 Asn Glu Ile Met Glu Glu Leu Ala Ala Arg Ser Arg Gln His Tyr Arg 740 745 750 Gly Leu Ile Tyr Glu Gln Pro Asp Phe Ile Asp Phe Phe His Gln Val 755 760 765 Thr Pro Ile Glu Glu Ile Ser Gln Leu Gln Ile Ser Ser Arg Pro Ala 770 775 780 Arg Arg Pro Ser Gly Lys Lys Asp Leu Ser Ser Leu Arg Ala Ile Pro 785 790 795 800 Trp Val Phe Ser Trp Thr Gln Thr Arg Phe Leu Leu Pro Ser Trp Tyr 805 810 815 Gly Val Gly Thr Ala Leu Gln Glu Phe Phe Asn Glu Glu Pro Glu Glu 820 825 830 His Leu Lys Leu Met Arg Tyr Phe Tyr Val Lys Trp Pro Phe Phe Lys 835 840 845 Met Val Ile Ser Lys Val Glu Met Thr Leu Ala Lys Val Asp Met Gln 850 855 860 Met Ala Gly His Tyr Val Gln Glu Leu Ser Asp Pro Glu Asp Lys Pro 865 870 875 880 Arg Phe Glu Lys Val Phe Glu Gln Ile Ala Asn Glu Tyr Tyr Leu Thr 885 890 895 Arg Asp Leu Val Leu Lys Ile Thr Asp His Gly Arg Leu Leu Asp Gly 900 905 910 Asp Pro Val Leu Gln Arg Ser Val Gln Leu Arg Asn Gly Thr Ile Val 915 920 925 Pro Leu Gly Phe Ile Gln Val Ser Leu Leu Lys Arg Leu Arg Gln Ser 930 935 940 Lys Asn Asn Thr Ala Thr Ser Gly Val Ile His Ser Arg Tyr Ser Lys 945 950 955 960 Gly Glu Leu Leu Arg Gly Ala Leu Leu Thr Ile Asn Gly Ile Ala Ala 965 970 975 Gly Met Arg Asn Thr Gly 980 <210> 9 <211> 3241 <212> DNA <213> Thermosynechococcus vulcanus <400> 9 gtgaattatg gcgttcgcga tcgcctgcaa cacctggaac tgattctgag cagcaaaaca 60 gcttagaact gttaacaaat ccttaatacg cctgttatca attgttgtac cgccctggtt 120 caggattggg taaagtaagg agtattatct ttgcaggctg gggtaaatat gacatcagtc 180 ctcgatgtga ccaatcgcga tcgcttaatt gaaagtgaaa gtttggcagc ccgtacccta 240 caggaacggt tgcgactggt ggaagaggtc ttggtcgatg tcttggcggc agaatcgggt 300 caagaattgg ttgatctatt gcggcgcttg ggggctctct cttcgccgga aggtcatgtg 360 ctccatgccc cagaagggga attgctgaag gttattgaat ccctcgaact caatgaggcc 420 attagagcgg cccgggcttt taacctctac tttcaaatta tcaacatcgt tgagcagcat 480 tacgaacaac aatacaaccg tgaacgcgct gcccaagagg gattgcgccg ccgcagtgtc 540 atgagtgaac caatttccgg tgtcagtggt gaaggctttc cgctgcctca tactgctgcc 600 aacgcaacgg atgtgcgcag tgggccgagt gaacgcctag agcatagtct ctacgaagcc 660 attcccgcta ctcagcagta tggttccttt gcttggctct ttcctcggct gcagatgctg 720 aatgtgccgc cgcgccatat tcaaaagctt ttggatcaac tggacattaa gttggttttc 780 actgctcacc cgacggagat tgtgcggcaa acgattcgtg ataagcagcg gcgggttgcc 840 cgattacttg agcaactgga tgtgctggag ggggcttctc cacacctaac ggattggaac 900 gcccaaactt tacgggcaca actgatggag gaaattcgcc tctggtggcg caccgatgag 960 ttgcaccaat ttaagccgga ggtgctcgat gaggtggaat acaccctcca ctacttcaag 1020 gaggtcattt ttgctgtcat tcccaagctc tatcgccgtc tggagcagtc attacatgaa 1080 acctttcccg cgcttcagcc cccccgtcac cgtttctgcc gctttggctc ttgggtgggg 1140 ggcgatcgcg atggcaatcc ctatgtcaaa ccagaagtaa cgtggcaaac ggcctgctat 1200 cagcgcaact tagttcttga ggagtatatt aagtccgttg agcgcttaat caatttgctc 1260 agcctgtccc tgcactggtg cgatgtgctg ccagatttgc tagattccct tgagcaggat 1320 caacggcaac tcccgagtat ctatgagcag tatgcggtgc gctatcggca ggaaccctac 1380 cgcctgaaac tggcctatgt gctcaaacgg ctgcaaaata cccgcgatcg caaccgggcg 1440 ctgcaaacct attgcattcg ccgcaatgag gcggaagagt taaataatgg acagttttac 1500 cgccacggtg aagaattctt ggcagaactg ctgctcattc agcgtaacct caaggaaacg 1560 ggattggcct gccgcgaatt ggatgatttg atttgccagg tggaggtctt tggctttaat 1620 ctagcagcct tggatattcg ccaagaaagt acctgtcacg ctgaggccct caatgaaatt 1680 accgcctatt tgggtattct cccctgtccc tatacagaac tctcagaagc cgaacgcacc 1740 cgctggctcc tcagtgaact ctcgacccgt cgccccttga ttccagggga actccccttt 1800 agcgatcgca ccaatgaaat cattgaaaca ttccgcatgg tgcggcaact ccagcaggaa 1860 tttggcaccg atttgtgcaa tacctacatc atcagcatga gccatgaggt cagcgatctg 1920 ttggaggtac tcctctttgc taaggaggca ggcctttttg atccagccac tggcgctagt 1980 accctgcaag ccattcccct gtttgaaacg gtggaggatc tcaagcacgc cccagcggtg 2040 ctgacccaac tattctctct ccccttttgc cggagctatc ttggaagcaa cagtaccccc 2100 tttctgcagg aggtcatgct gggctattcc gacagcaata aggattcggg cttcctcagt 2160 agcaactggg aaatttataa ggcacaacaa cagctgcaga aaattgctga gagttttggc 2220 ttccaactgc gcattttcca cggtcggggt ggttcagtgg gtcggggtgg tggacctgcc 2280 tatgcggcga ttttggcaca gccagcacaa acgattaagg gacgaatcaa gattactgag 2340 cagggggagg tactggcttc caaatactcg ttgccggaac tcgcgctctt taacctcgaa 2400 acagtggcca cagcggtcat ccaagctagt ttgctccgca gtagtattga tgagattgag 2460 ccttggcacg agattatgga ggagttggct acgcgatcgc gccagtgcta tcgccatctc 2520 atctatgagc agccagaatt cattgaattc tttaacgaag tcaccccaat ccaagagatt 2580 agccaactgc aaattagctc acggccaaca cggcgggggg ggaagaaaac ccttgagagc 2640 ctgcgggcaa ttccttgggt ctttagttgg acgcaaaccc gtttcctgct gccggcttgg 2700 tatggcgtgg gtactgccct gaaggaattc cttgaggaaa aacccgctga gcatctctcc 2760 ctcttgcgct acttctacta taagtggcct ttcttccgca tggtgatctc taaggttgag 2820 atgacccttg ccaaggttga tctagagatt gcccgctact atgtccaaga actcagccag 2880 ccccaaaacc gtgaagcctt ctgccgcctc tacgatcaga ttgctcagga atatcgcctg 2940 accacggaat tagtcctcac gattactggc catgagcggc tactcgatgg ggatccggcg 3000 cttcagcgat cggtgcaact gcgcaatcgc accattgttc ctttgggctt cctgcaagta 3060 tctcttttga aacggctgcg ccagcacaat agccaaacca cctctggggc aattttgcgc 3120 tcccgctatg gtcggggtga attgctacgg ggggcactct tgaccatcaa tggcatagca 3180 gcggggatgc gcaatacagg ctaagcaacg gcgagggtga atcatggacc cgacgacccg 3240 c 3241 <210> 10 <211> 1011 <212> PRT <213> Thermosynechococcus vulcanus <400> 10 Met Thr Ser Val Leu Asp Val Thr Asn Arg Asp Arg Leu Ile Glu Ser 1 5 10 15 Glu Ser Leu Ala Ala Arg Thr Leu Gln Glu Arg Leu Arg Leu Val Glu 20 25 30 Glu Val Leu Val Asp Val Leu Ala Ala Glu Ser Gly Gln Glu Leu Val 35 40 45 Asp Leu Leu Arg Arg Leu Gly Ala Leu Ser Ser Pro Glu Gly His Val 50 55 60 Leu His Ala Pro Glu Gly Glu Leu Leu Lys Val Ile Glu Ser Leu Glu 65 70 75 80 Leu Asn Glu Ala Ile Arg Ala Ala Arg Ala Phe Asn Leu Tyr Phe Gln 85 90 95 Ile Ile Asn Ile Val Glu Gln His Tyr Glu Gln Gln Tyr Asn Arg Glu 100 105 110 Arg Ala Ala Gln Glu Gly Leu Arg Arg Arg Ser Val Met Ser Glu Pro 115 120 125 Ile Ser Gly Val Ser Gly Glu Gly Phe Pro Leu Pro His Thr Ala Ala 130 135 140 Asn Ala Thr Asp Val Arg Ser Gly Pro Ser Glu Arg Leu Glu His Ser 145 150 155 160 Leu Tyr Glu Ala Ile Pro Ala Thr Gln Gln Tyr Gly Ser Phe Ala Trp 165 170 175 Leu Phe Pro Arg Leu Gln Met Leu Asn Val Pro Pro Arg His Ile Gln 180 185 190 Lys Leu Leu Asp Gln Leu Asp Ile Lys Leu Val Phe Thr Ala His Pro 195 200 205 Thr Glu Ile Val Arg Gln Thr Ile Arg Asp Lys Gln Arg Arg Val Ala 210 215 220 Arg Leu Leu Glu Gln Leu Asp Val Leu Glu Gly Ala Ser Pro His Leu 225 230 235 240 Thr Asp Trp Asn Ala Gln Thr Leu Arg Ala Gln Leu Met Glu Glu Ile 245 250 255 Arg Leu Trp Trp Arg Thr Asp Glu Leu His Gln Phe Lys Pro Glu Val 260 265 270 Leu Asp Glu Val Glu Tyr Thr Leu His Tyr Phe Lys Glu Val Ile Phe 275 280 285 Ala Val Ile Pro Lys Leu Tyr Arg Arg Leu Glu Gln Ser Leu His Glu 290 295 300 Thr Phe Pro Ala Leu Gln Pro Pro Arg His Arg Phe Cys Arg Phe Gly 305 310 315 320 Ser Trp Val Gly Gly Asp Arg Asp Gly Asn Pro Tyr Val Lys Pro Glu 325 330 335 Val Thr Trp Gln Thr Ala Cys Tyr Gln Arg Asn Leu Val Leu Glu Glu 340 345 350 Tyr Ile Lys Ser Val Glu Arg Leu Ile Asn Leu Leu Ser Leu Ser Leu 355 360 365 His Trp Cys Asp Val Leu Pro Asp Leu Leu Asp Ser Leu Glu Gln Asp 370 375 380 Gln Arg Gln Leu Pro Ser Ile Tyr Glu Gln Tyr Ala Val Arg Tyr Arg 385 390 395 400 Gln Glu Pro Tyr Arg Leu Lys Leu Ala Tyr Val Leu Lys Arg Leu Gln 405 410 415 Asn Thr Arg Asp Arg Asn Arg Ala Leu Gln Thr Tyr Cys Ile Arg Arg 420 425 430 Asn Glu Ala Glu Glu Leu Asn Asn Gly Gln Phe Tyr Arg His Gly Glu 435 440 445 Glu Phe Leu Ala Glu Leu Leu Leu Ile Gln Arg Asn Leu Lys Glu Thr 450 455 460 Gly Leu Ala Cys Arg Glu Leu Asp Asp Leu Ile Cys Gln Val Glu Val 465 470 475 480 Phe Gly Phe Asn Leu Ala Ala Leu Asp Ile Arg Gln Glu Ser Thr Cys 485 490 495 His Ala Glu Ala Leu Asn Glu Ile Thr Ala Tyr Leu Gly Ile Leu Pro 500 505 510 Cys Pro Tyr Thr Glu Leu Ser Glu Ala Glu Arg Thr Arg Trp Leu Leu 515 520 525 Ser Glu Leu Ser Thr Arg Arg Pro Leu Ile Pro Gly Glu Leu Pro Phe 530 535 540 Ser Asp Arg Thr Asn Glu Ile Ile Glu Thr Phe Arg Met Val Arg Gln 545 550 555 560 Leu Gln Gln Glu Phe Gly Thr Asp Leu Cys Asn Thr Tyr Ile Ile Ser 565 570 575 Met Ser His Glu Val Ser Asp Leu Leu Glu Val Leu Leu Phe Ala Lys 580 585 590 Glu Ala Gly Leu Phe Asp Pro Ala Thr Gly Ala Ser Thr Leu Gln Ala 595 600 605 Ile Pro Leu Phe Glu Thr Val Glu Asp Leu Lys His Ala Pro Ala Val 610 615 620 Leu Thr Gln Leu Phe Ser Leu Pro Phe Cys Arg Ser Tyr Leu Gly Ser 625 630 635 640 Asn Ser Thr Pro Phe Leu Gln Glu Val Met Leu Gly Tyr Ser Asp Ser 645 650 655 Asn Lys Asp Ser Gly Phe Leu Ser Ser Asn Trp Glu Ile Tyr Lys Ala 660 665 670 Gln Gln Gln Leu Gln Lys Ile Ala Glu Ser Phe Gly Phe Gln Leu Arg 675 680 685 Ile Phe His Gly Arg Gly Gly Ser Val Gly Arg Gly Gly Gly Pro Ala 690 695 700 Tyr Ala Ala Ile Leu Ala Gln Pro Ala Gln Thr Ile Lys Gly Arg Ile 705 710 715 720 Lys Ile Thr Glu Gln Gly Glu Val Leu Ala Ser Lys Tyr Ser Leu Pro 725 730 735 Glu Leu Ala Leu Phe Asn Leu Glu Thr Val Ala Thr Ala Val Ile Gln 740 745 750 Ala Ser Leu Leu Arg Ser Ser Ile Asp Glu Ile Glu Pro Trp His Glu 755 760 765 Ile Met Glu Glu Leu Ala Thr Arg Ser Arg Gln Cys Tyr Arg His Leu 770 775 780 Ile Tyr Glu Gln Pro Glu Phe Ile Glu Phe Phe Asn Glu Val Thr Pro 785 790 795 800 Ile Gln Glu Ile Ser Gln Leu Gln Ile Ser Ser Arg Pro Thr Arg Arg 805 810 815 Gly Gly Lys Lys Thr Leu Glu Ser Leu Arg Ala Ile Pro Trp Val Phe 820 825 830 Ser Trp Thr Gln Thr Arg Phe Leu Leu Pro Ala Trp Tyr Gly Val Gly 835 840 845 Thr Ala Leu Lys Glu Phe Leu Glu Glu Lys Pro Ala Glu His Leu Ser 850 855 860 Leu Leu Arg Tyr Phe Tyr Tyr Lys Trp Pro Phe Phe Arg Met Val Ile 865 870 875 880 Ser Lys Val Glu Met Thr Leu Ala Lys Val Asp Leu Glu Ile Ala Arg 885 890 895 Tyr Tyr Val Gln Glu Leu Ser Gln Pro Gln Asn Arg Glu Ala Phe Cys 900 905 910 Arg Leu Tyr Asp Gln Ile Ala Gln Glu Tyr Arg Leu Thr Thr Glu Leu 915 920 925 Val Leu Thr Ile Thr Gly His Glu Arg Leu Leu Asp Gly Asp Pro Ala 930 935 940 Leu Gln Arg Ser Val Gln Leu Arg Asn Arg Thr Ile Val Pro Leu Gly 945 950 955 960 Phe Leu Gln Val Ser Leu Leu Lys Arg Leu Arg Gln His Asn Ser Gln 965 970 975 Thr Thr Ser Gly Ala Ile Leu Arg Ser Arg Tyr Gly Arg Gly Glu Leu 980 985 990 Leu Arg Gly Ala Leu Leu Thr Ile Asn Gly Ile Ala Ala Gly Met Arg 995 1000 1005 Asn Thr Gly 1010 <210> 11 <211> 2736 <212> DNA <213> Streptomyces coelicolor <400> 11 gtgagcagtg ccgacgacca gaccaccacg acgaccagca gtgaactgcg cgccgacatc 60 cgccggctgg gtgatctcct cggggagacc ctggtccggc aggagggccc cgaactgctg 120 gaactcgtcg agaaggtacg ccgactcacc cgagaggacg gcgaggccgc cgccgaactg 180 ctgcgcggca ccgaactgga gaccgccgcc aagctcgtcc gcgccttctc cacctacttc 240 cacctggcca acgtcaccga gcaggtccac cgcggccgcg agctgggcgc caagcgcgcc 300 gccgagggcg gactgctcgc ccgtacggcc gaccggctga aggacgccga ccccgagcac 360 ctgcgcgaga cggtccgcaa cctcaacgtg cgccccgtgt tcaccgcgca ccccaccgag 420 gccgcccgcc gctccgtcct caacaagctg cgccgcatcg ccgccctcct ggacaccccg 480 gtcaacgagt cggaccggcg ccgcctggac acccgcctcg ccgagaacat cgacctcgtc 540 tggcagaccg acgagctgcg cgtcgtgcgc cccgagcccg ccgacgaggc ccgcaacgcc 600 atctactacc tcgacgagct gcacctgggc gccgtcggcg acgtcctcga agacctcacc 660 gccgagctgg agcgggccgg cgtcaagctc cccgacgaca cccgccccct caccttcggc 720 acctggatcg gcggcgaccg cgacggcaac cccaacgtca ccccccaggt gacctgggac 780 gtcctcatcc tccagcacga gcacggcatc aacgacgccc tggagatgat cgacgagctg 840 cgcggcttcc tctctaactc catccggtac gccggtgcga ccgaggaact gctcgcctcg 900 ctccaggccg acctggaacg cctccccgag atcagccccc gctacaagcg cctcaacgcc 960 gaggagccct accggctcaa ggccacctgc atccgccaga agctggagaa caccaagcag 1020 cgcctcgcca agggcacccc ccacgaggac ggccgcgact acctcggcac cgcccagctc 1080 atcgacgacc tgcgcatcgt ccagacctcg ctgcgcgaac accgcggcgg cctgttcgcc 1140 gacgggcgcc tcgcccgcac catccgcacc ctggccgcct tcggcctcca gctcgccacc 1200 atggacgtcc gcgagcacgc cgacgcccac caccacgccc tcggccagct cttcgaccgg 1260 ctcggcgagg agtcctggcg ctacgccgac atgccgcgcg agtaccgcac caagctcctc 1320 gccaaggaac tgcgctcccg caggccgctg gcccccagcc ccgcccccgt cgacgcgccc 1380 ggcgagaaga ccctcggcgt cttccagacc gtccgccgcg ccctggaggt cttcggcccc 1440 gaggtcatcg agtcctacat catctccatg tgccagggcg ccgacgacgt cttcgccgcg 1500 gcggtactgg cccgcgaggc cgggctgatc gacctgcacg ccggctgggc gaagatcggc 1560 atcgtgccgc tgctggagac caccgacgag ctgaaggccg ccgacaccat cctggaggac 1620 ctgctcgccg acccctccta ccggcgcctg gtcgcgctgc gcggcgacgt ccaggaggtc 1680 atgctcggct actccgactc ctccaagttc ggcggcatca ccaccagcca gtgggagatc 1740 caccgcgccc agcgccggct gcgcgacgtc gcccaccgct acggcgtacg gctgcgcctc 1800 ttccacggcc gcggcggcac cgtcggccgc ggcggcggcc ccacccacga cgccatcctc 1860 gcccagccct ggggcaccct ggagggcgag atcaaggtca ccgagcaggg cgaggtcatc 1920 tccgacaagt acctcatccc cgccctcgcc cgggagaacc tggagctgac cgtcgcggcc 1980 accctccagg cctccgccct gcacaccgcg ccccgccagt ccgacgaggc cctggcccgc 2040 tgggacgccg cgatggacgt cgtctccgac gccgcccaca ccgcctaccg gcacctggtc 2100 gaggaccccg acctgccgac ctacttcctg gcctccaccc cggtcgacca gctcgccgac 2160 ctgcacctgg gctcgcggcc ctcccgccgc cccggctcgg gcgtctcgct cgacggactg 2220 cgcgccatcc cgtgggtgtt cggctggacc cagtcccggc agatcgtccc cggctggtac 2280 ggcgtcggct ccggcctcaa ggccctgcgc gaggcgggcc tggacaccgt gctcgacgag 2340 atgcaccagc agtggcactt cttccgcaac ttcatctcca acgtcgagat gaccctcgcc 2400 aagaccgacc tgcgcatcgc ccagcactac gtcgacaccc tcgtcccgga cgagctcaag 2460 cacgtcttcg acaccatcaa ggccgagcac gagctcaccg tcgccgaggt cctgcgcgtc 2520 accggcgaga gtgaactgct ggacgccgac ccggtcctca agcagacctt caccatccgc 2580 gacgcctacc tcgaccccat ctcctacctc caggtcgccc tcctcggccg tcagcgcgag 2640 gccgccgccg cgaacgagga cccggacccc ctcctcgccc gagccctcct cctcaccgtc 2700 aacggcgtgg cagcgggcct gcgcaacacc ggctga 2736 <210> 12 <211> 911 <212> PRT <213> Streptomyces coelicolor <400> 12 Met Ser Ser Ala Asp Asp Gln Thr Thr Thr Thr Thr Ser Ser Glu Leu 1 5 10 15 Arg Ala Asp Ile Arg Arg Leu Gly Asp Leu Leu Gly Glu Thr Leu Val 20 25 30 Arg Gln Glu Gly Pro Glu Leu Leu Glu Leu Val Glu Lys Val Arg Arg 35 40 45 Leu Thr Arg Glu Asp Gly Glu Ala Ala Ala Glu Leu Leu Arg Gly Thr 50 55 60 Glu Leu Glu Thr Ala Ala Lys Leu Val Arg Ala Phe Ser Thr Tyr Phe 65 70 75 80 His Leu Ala Asn Val Thr Glu Gln Val His Arg Gly Arg Glu Leu Gly 85 90 95 Ala Lys Arg Ala Ala Glu Gly Gly Leu Leu Ala Arg Thr Ala Asp Arg 100 105 110 Leu Lys Asp Ala Asp Pro Glu His Leu Arg Glu Thr Val Arg Asn Leu 115 120 125 Asn Val Arg Pro Val Phe Thr Ala His Pro Thr Glu Ala Ala Arg Arg 130 135 140 Ser Val Leu Asn Lys Leu Arg Arg Ile Ala Ala Leu Leu Asp Thr Pro 145 150 155 160 Val Asn Glu Ser Asp Arg Arg Arg Leu Asp Thr Arg Leu Ala Glu Asn 165 170 175 Ile Asp Leu Val Trp Gln Thr Asp Glu Leu Arg Val Val Arg Pro Glu 180 185 190 Pro Ala Asp Glu Ala Arg Asn Ala Ile Tyr Tyr Leu Asp Glu Leu His 195 200 205 Leu Gly Ala Val Gly Asp Val Leu Glu Asp Leu Thr Ala Glu Leu Glu 210 215 220 Arg Ala Gly Val Lys Leu Pro Asp Asp Thr Arg Pro Leu Thr Phe Gly 225 230 235 240 Thr Trp Ile Gly Gly Asp Arg Asp Gly Asn Pro Asn Val Thr Pro Gln 245 250 255 Val Thr Trp Asp Val Leu Ile Leu Gln His Glu His Gly Ile Asn Asp 260 265 270 Ala Leu Glu Met Ile Asp Glu Leu Arg Gly Phe Leu Ser Asn Ser Ile 275 280 285 Arg Tyr Ala Gly Ala Thr Glu Glu Leu Leu Ala Ser Leu Gln Ala Asp 290 295 300 Leu Glu Arg Leu Pro Glu Ile Ser Pro Arg Tyr Lys Arg Leu Asn Ala 305 310 315 320 Glu Glu Pro Tyr Arg Leu Lys Ala Thr Cys Ile Arg Gln Lys Leu Glu 325 330 335 Asn Thr Lys Gln Arg Leu Ala Lys Gly Thr Pro His Glu Asp Gly Arg 340 345 350 Asp Tyr Leu Gly Thr Ala Gln Leu Ile Asp Asp Leu Arg Ile Val Gln 355 360 365 Thr Ser Leu Arg Glu His Arg Gly Gly Leu Phe Ala Asp Gly Arg Leu 370 375 380 Ala Arg Thr Ile Arg Thr Leu Ala Ala Phe Gly Leu Gln Leu Ala Thr 385 390 395 400 Met Asp Val Arg Glu His Ala Asp Ala His His His Ala Leu Gly Gln 405 410 415 Leu Phe Asp Arg Leu Gly Glu Glu Ser Trp Arg Tyr Ala Asp Met Pro 420 425 430 Arg Glu Tyr Arg Thr Lys Leu Leu Ala Lys Glu Leu Arg Ser Arg Arg 435 440 445 Pro Leu Ala Pro Ser Pro Ala Pro Val Asp Ala Pro Gly Glu Lys Thr 450 455 460 Leu Gly Val Phe Gln Thr Val Arg Arg Ala Leu Glu Val Phe Gly Pro 465 470 475 480 Glu Val Ile Glu Ser Tyr Ile Ile Ser Met Cys Gln Gly Ala Asp Asp 485 490 495 Val Phe Ala Ala Ala Val Leu Ala Arg Glu Ala Gly Leu Ile Asp Leu 500 505 510 His Ala Gly Trp Ala Lys Ile Gly Ile Val Pro Leu Leu Glu Thr Thr 515 520 525 Asp Glu Leu Lys Ala Ala Asp Thr Ile Leu Glu Asp Leu Leu Ala Asp 530 535 540 Pro Ser Tyr Arg Arg Leu Val Ala Leu Arg Gly Asp Val Gln Glu Val 545 550 555 560 Met Leu Gly Tyr Ser Asp Ser Ser Lys Phe Gly Gly Ile Thr Thr Ser 565 570 575 Gln Trp Glu Ile His Arg Ala Gln Arg Arg Leu Arg Asp Val Ala His 580 585 590 Arg Tyr Gly Val Arg Leu Arg Leu Phe His Gly Arg Gly Gly Thr Val 595 600 605 Gly Arg Gly Gly Gly Pro Thr His Asp Ala Ile Leu Ala Gln Pro Trp 610 615 620 Gly Thr Leu Glu Gly Glu Ile Lys Val Thr Glu Gln Gly Glu Val Ile 625 630 635 640 Ser Asp Lys Tyr Leu Ile Pro Ala Leu Ala Arg Glu Asn Leu Glu Leu 645 650 655 Thr Val Ala Ala Thr Leu Gln Ala Ser Ala Leu His Thr Ala Pro Arg 660 665 670 Gln Ser Asp Glu Ala Leu Ala Arg Trp Asp Ala Ala Met Asp Val Val 675 680 685 Ser Asp Ala Ala His Thr Ala Tyr Arg His Leu Val Glu Asp Pro Asp 690 695 700 Leu Pro Thr Tyr Phe Leu Ala Ser Thr Pro Val Asp Gln Leu Ala Asp 705 710 715 720 Leu His Leu Gly Ser Arg Pro Ser Arg Arg Pro Gly Ser Gly Val Ser 725 730 735 Leu Asp Gly Leu Arg Ala Ile Pro Trp Val Phe Gly Trp Thr Gln Ser 740 745 750 Arg Gln Ile Val Pro Gly Trp Tyr Gly Val Gly Ser Gly Leu Lys Ala 755 760 765 Leu Arg Glu Ala Gly Leu Asp Thr Val Leu Asp Glu Met His Gln Gln 770 775 780 Trp His Phe Phe Arg Asn Phe Ile Ser Asn Val Glu Met Thr Leu Ala 785 790 795 800 Lys Thr Asp Leu Arg Ile Ala Gln His Tyr Val Asp Thr Leu Val Pro 805 810 815 Asp Glu Leu Lys His Val Phe Asp Thr Ile Lys Ala Glu His Glu Leu 820 825 830 Thr Val Ala Glu Val Leu Arg Val Thr Gly Glu Ser Glu Leu Leu Asp 835 840 845 Ala Asp Pro Val Leu Lys Gln Thr Phe Thr Ile Arg Asp Ala Tyr Leu 850 855 860 Asp Pro Ile Ser Tyr Leu Gln Val Ala Leu Leu Gly Arg Gln Arg Glu 865 870 875 880 Ala Ala Ala Ala Asn Glu Asp Pro Asp Pro Leu Leu Ala Arg Ala Leu 885 890 895 Leu Leu Thr Val Asn Gly Val Ala Ala Gly Leu Arg Asn Thr Gly 900 905 910 <210> 13 <211> 3481 <212> DNA <213> Rhodopseudomonas palustris <400> 13 ctgcaggtga cgcgccagct cagcggcctt gccgccgcgc tcggcgtgct gaccctgctg 60 gcgctcggca ccttcacggc cggtttgcac atccgcgcct ggaagatcgc ggtggtcggc 120 gtcatccttg gcgtcagcgt cccggcgatc gccttcctgc agcaatcggc gctgctgatc 180 ctgctggtga tcggcctgat catcgccatc gtggtgccgt tcgtttgggc caagcgccgg 240 cccgcgccgg cttcggagcc gttattccag ccgccgttca cccgcaccac cacgccgccg 300 acctcggcca gctcgcggcc ggtgccgcag ccgccgctgt acgaaacgcc ggtcgcggcc 360 ccgatgccgg tcgcgccgcc gccggccccg acgcccagcg ctgccgagcc ggcctcgccg 420 ccgccgccgg cggacagcaa cacgccgccg gacaacgtcc gcaacatctc gggcgcgcgc 480 taactacgct tcgaccggcc cgcgcgacgt gcaccgccga ttcttgatct tgcgtgcggt 540 gccaaaatcc ttcaggatac cgatctgatc ctggagtgct gcgatgtcgt cgttgaacct 600 gtccgccggt cctgagccgg tttccgaacg tcctgacgac gcggccgcga tcgaggccga 660 gacccggctg cgcaacgaca tccggctgct cggccggatc ctcggcgaca ctgtgcgcga 720 gcaggaagga cagaccgtgt tcgatctggt cgagaacatc cgccagacct cgatccgatt 780 ccaccgcgac gacgacaaga ccgcacgcgc cgagctcgaa gccatcctgg acgggatgtc 840 gatccccgac acgatgcgga tcgttcgcgc cttcagctat ttctcacacc tcgccaacat 900 cgccgaagac cagaacaaca tccgccagat gcgcgccggc tcgaccgcgg gctcggcgcc 960 gcgtgccgga ctgctcgcca agacgctggc gcacgcgcgg caggaaggca tcagcgccgc 1020 ggagctgcgc aagttctttg cgaccgcgct ggtgagcccg gtgctgaccg cgcatccgac 1080 cgaagtgcgc cgcaagagca cgatggaccg cgaaatgcag atcgcttcgc tgctcgatca 1140 gcgcgaccgc gttcagctca ccgccgacga atgggccgac aacgaggagc ggctgcgccg 1200 cgccgtcgag acgctgtgga agaccaacct gctgcgccgg acaaagctga cggtgctgga 1260 tgaagtcacc aacggcctgt cgttctacga ctacaccttc ctgcgcgagg tgccgcggct 1320 gcacagtgcg ctggaagacc ggcttgccga tgcggccaag gccgaaggcg tcaacagcga 1380 cggcgagctg gcgagcttcc tgcggatggg aagctggatc ggcggcgatc gcgatggcaa 1440 tccgttcgtc actgccgagg tgctgcacgg caccttgaag ctgcagagca cgcgcgtgct 1500 gcgctattat ctcgacgagc tgcacgagct tggctcggag ttgtcgctgg cgtcgcatct 1560 cgccggcacc accgacaccg tcaaggcgct ggccgaaacc tcgcccgaca cctcaccgca 1620 tcgcaaatac gagccgtatc gcctcgcggt gtccggcatc tacgcgcggc tggcagcgac 1680 cgcgctcaag ctcgaggtcg agaacctccg cgcgccggtc ggcgaggccg agccttacgc 1740 cagcgcgcag gacttcaaag ccgatctcga cgcgatccat ctgtcgctca cccagcacaa 1800 ttccggtgtg atcgcgcgcg gccggctgcg ccagctccgc cgcgcgatcg actgctttgg 1860 cttccatctc gccagcctcg acatgcggca gaactcggcg gtgcacgagc gcaccattac 1920 cgagctgatg gacgcggcgc ggcccggcac ctcctatgcg atgctcgacg aggaagcgcg 1980 gatcgcgctc ttgatcagcg agctgcgcag cacccggccg ctgacctcga tgttcgtcaa 2040 atacagcgac gagacggtcg gcgagcttgc agtgttccgc gaagccgcga aggcgcacgc 2100 gacctacggg gcggcggcga tcccccaatg catcatctcg atgaccaagg gcgtttccga 2160 cctcttggag gtcgcggtgc tgctcaagga agtcgggctg atcgatccgt cggggcgcag 2220 cgccatcaac gtggtgccgc tgttcgagac catcgaggac ctgcaggcct gcgccaagat 2280 catggaccgg ctgctgtcga tcccggaata tcgccggctg gtcgacagcc gcggctcggt 2340 gcaggaggtg atgctcggct actccgacag caataaggac ggcggcttcg tcacctcggg 2400 ctgggagctg tacaaggccg agatcggact gatcgagatc ttcgagcacc atggcgtgcg 2460 gttgcggctg ttccacggcc gcggcggctc ggtcggccgc ggcggcggcc cgagctacga 2520 cgccatcgtg gcgcagccgg gtggggcggt gaacggccag atccgcatca ccgagcaggg 2580 cgagatcatc accaggaaat attccaacgt cgaagtcggc cgcaacaacc tcgagatcct 2640 cgccgccgcg acgttggaag caagcctgct gcagccgaag cgggtggcgc cgcatcgcga 2700 ttatctcgag gcgatggagc agctctccgc gctcgccttc aaggcgtatc gcggcctggt 2760 gtacgagacc gacggattcg tcgactactt ctgggcctcg acggtgatca acgagatctc 2820 gacgctgaac atcggcagcc gtccggcctc gcgcaagaaa acgcgcgcga tcgaggacct 2880 gcgcgcgatc ccctgggtat tctcgtgggc gcagtgccgg ctgatgctgc cgggctggta 2940 cggtttcggc agcgcggtgt cggcctgggt caccgcgcat cccgagacgg gcatcgcctt 3000 cctgcaaaag atgtatcagg agtggccgtt ctttcgcacg ctgctgtcga acatggacat 3060 ggtgctgtcg aagagctcga tcggcatcgc ctcgcgatat gccgagctgg tggaggacgt 3120 cgatgttcgc gagcgcatct tcggccgcat ccgcgccgaa tggcattcct cgatcgagta 3180 tctgttcgcg atcatgcagc aggaccgcct gctgcagagc aacccgctgc tcgaacgctc 3240 gatccgccac cgcttcccgt atctcgaccc cctgaaccac gtccaggtcc agctgctgcg 3300 cgaacaccgc acccacgacc cagacgaaca ggtgctccgc ggcgtgcaac tgacgatcaa 3360 cgggatttcg gcggggctgc ggaatagcgg gtgagggcgg gccgccgctg ggattggatt 3420 gggctgattt agccggtgga aaggcgcgcc tgttagattg gcggcgatgc tgaagcgggc 3480 g 3481 <210> 14 <211> 936 <212> PRT <213> Rhodopseudomonas palustris <400> 14 Met Ser Ser Leu Asn Leu Ser Ala Gly Pro Glu Pro Val Ser Glu Arg 1 5 10 15 Pro Asp Asp Ala Ala Ala Ile Glu Ala Glu Thr Arg Leu Arg Asn Asp 20 25 30 Ile Arg Leu Leu Gly Arg Ile Leu Gly Asp Thr Val Arg Glu Gln Glu 35 40 45 Gly Gln Thr Val Phe Asp Leu Val Glu Asn Ile Arg Gln Thr Ser Ile 50 55 60 Arg Phe His Arg Asp Asp Asp Lys Thr Ala Arg Ala Glu Leu Glu Ala 65 70 75 80 Ile Leu Asp Gly Met Ser Ile Pro Asp Thr Met Arg Ile Val Arg Ala 85 90 95 Phe Ser Tyr Phe Ser His Leu Ala Asn Ile Ala Glu Asp Gln Asn Asn 100 105 110 Ile Arg Gln Met Arg Ala Gly Ser Thr Ala Gly Ser Ala Pro Arg Ala 115 120 125 Gly Leu Leu Ala Lys Thr Leu Ala His Ala Arg Gln Glu Gly Ile Ser 130 135 140 Ala Ala Glu Leu Arg Lys Phe Phe Ala Thr Ala Leu Val Ser Pro Val 145 150 155 160 Leu Thr Ala His Pro Thr Glu Val Arg Arg Lys Ser Thr Met Asp Arg 165 170 175 Glu Met Gln Ile Ala Ser Leu Leu Asp Gln Arg Asp Arg Val Gln Leu 180 185 190 Thr Ala Asp Glu Trp Ala Asp Asn Glu Glu Arg Leu Arg Arg Ala Val 195 200 205 Glu Thr Leu Trp Lys Thr Asn Leu Leu Arg Arg Thr Lys Leu Thr Val 210 215 220 Leu Asp Glu Val Thr Asn Gly Leu Ser Phe Tyr Asp Tyr Thr Phe Leu 225 230 235 240 Arg Glu Val Pro Arg Leu His Ser Ala Leu Glu Asp Arg Leu Ala Asp 245 250 255 Ala Ala Lys Ala Glu Gly Val Asn Ser Asp Gly Glu Leu Ala Ser Phe 260 265 270 Leu Arg Met Gly Ser Trp Ile Gly Gly Asp Arg Asp Gly Asn Pro Phe 275 280 285 Val Thr Ala Glu Val Leu His Gly Thr Leu Lys Leu Gln Ser Thr Arg 290 295 300 Val Leu Arg Tyr Tyr Leu Asp Glu Leu His Glu Leu Gly Ser Glu Leu 305 310 315 320 Ser Leu Ala Ser His Leu Ala Gly Thr Thr Asp Thr Val Lys Ala Leu 325 330 335 Ala Glu Thr Ser Pro Asp Thr Ser Pro His Arg Lys Tyr Glu Pro Tyr 340 345 350 Arg Leu Ala Val Ser Gly Ile Tyr Ala Arg Leu Ala Ala Thr Ala Leu 355 360 365 Lys Leu Glu Val Glu Asn Leu Arg Ala Pro Val Gly Glu Ala Glu Pro 370 375 380 Tyr Ala Ser Ala Gln Asp Phe Lys Ala Asp Leu Asp Ala Ile His Leu 385 390 395 400 Ser Leu Thr Gln His Asn Ser Gly Val Ile Ala Arg Gly Arg Leu Arg 405 410 415 Gln Leu Arg Arg Ala Ile Asp Cys Phe Gly Phe His Leu Ala Ser Leu 420 425 430 Asp Met Arg Gln Asn Ser Ala Val His Glu Arg Thr Ile Thr Glu Leu 435 440 445 Met Asp Ala Ala Arg Pro Gly Thr Ser Tyr Ala Met Leu Asp Glu Glu 450 455 460 Ala Arg Ile Ala Leu Leu Ile Ser Glu Leu Arg Ser Thr Arg Pro Leu 465 470 475 480 Thr Ser Met Phe Val Lys Tyr Ser Asp Glu Thr Val Gly Glu Leu Ala 485 490 495 Val Phe Arg Glu Ala Ala Lys Ala His Ala Thr Tyr Gly Ala Ala Ala 500 505 510 Ile Pro Gln Cys Ile Ile Ser Met Thr Lys Gly Val Ser Asp Leu Leu 515 520 525 Glu Val Ala Val Leu Leu Lys Glu Val Gly Leu Ile Asp Pro Ser Gly 530 535 540 Arg Ser Ala Ile Asn Val Val Pro Leu Phe Glu Thr Ile Glu Asp Leu 545 550 555 560 Gln Ala Cys Ala Lys Ile Met Asp Arg Leu Leu Ser Ile Pro Glu Tyr 565 570 575 Arg Arg Leu Val Asp Ser Arg Gly Ser Val Gln Glu Val Met Leu Gly 580 585 590 Tyr Ser Asp Ser Asn Lys Asp Gly Gly Phe Val Thr Ser Gly Trp Glu 595 600 605 Leu Tyr Lys Ala Glu Ile Gly Leu Ile Glu Ile Phe Glu His His Gly 610 615 620 Val Arg Leu Arg Leu Phe His Gly Arg Gly Gly Ser Val Gly Arg Gly 625 630 635 640 Gly Gly Pro Ser Tyr Asp Ala Ile Val Ala Gln Pro Gly Gly Ala Val 645 650 655 Asn Gly Gln Ile Arg Ile Thr Glu Gln Gly Glu Ile Ile Thr Arg Lys 660 665 670 Tyr Ser Asn Val Glu Val Gly Arg Asn Asn Leu Glu Ile Leu Ala Ala 675 680 685 Ala Thr Leu Glu Ala Ser Leu Leu Gln Pro Lys Arg Val Ala Pro His 690 695 700 Arg Asp Tyr Leu Glu Ala Met Glu Gln Leu Ser Ala Leu Ala Phe Lys 705 710 715 720 Ala Tyr Arg Gly Leu Val Tyr Glu Thr Asp Gly Phe Val Asp Tyr Phe 725 730 735 Trp Ala Ser Thr Val Ile Asn Glu Ile Ser Thr Leu Asn Ile Gly Ser 740 745 750 Arg Pro Ala Ser Arg Lys Lys Thr Arg Ala Ile Glu Asp Leu Arg Ala 755 760 765 Ile Pro Trp Val Phe Ser Trp Ala Gln Cys Arg Leu Met Leu Pro Gly 770 775 780 Trp Tyr Gly Phe Gly Ser Ala Val Ser Ala Trp Val Thr Ala His Pro 785 790 795 800 Glu Thr Gly Ile Ala Phe Leu Gln Lys Met Tyr Gln Glu Trp Pro Phe 805 810 815 Phe Arg Thr Leu Leu Ser Asn Met Asp Met Val Leu Ser Lys Ser Ser 820 825 830 Ile Gly Ile Ala Ser Arg Tyr Ala Glu Leu Val Glu Asp Val Asp Val 835 840 845 Arg Glu Arg Ile Phe Gly Arg Ile Arg Ala Glu Trp His Ser Ser Ile 850 855 860 Glu Tyr Leu Phe Ala Ile Met Gln Gln Asp Arg Leu Leu Gln Ser Asn 865 870 875 880 Pro Leu Leu Glu Arg Ser Ile Arg His Arg Phe Pro Tyr Leu Asp Pro 885 890 895 Leu Asn His Val Gln Val Gln Leu Leu Arg Glu His Arg Thr His Asp 900 905 910 Pro Asp Glu Gln Val Leu Arg Gly Val Gln Leu Thr Ile Asn Gly Ile 915 920 925 Ser Ala Gly Leu Arg Asn Ser Gly 930 935 <210> 15 <211> 2832 <212> DNA <213> Welwitschia mirabilis <220> <221> misc_feature <222> (1741)..(1743) <223> n is a, c, g, or t <400> 15 agcatcgacg cgcaactgcg gcttttggtc ccaacgaagg tttccgaaga tgataagctt 60 attgagtatg acgctcttct gatggaccgc tttctggata tcttgcaaga cctacatgga 120 gaagaaatta gagaaacggt tcaagagtgc tatgagcttt caggagaata cgaaggaaag 180 tttgacacgg caaagttgga ggagcttgga ggagtgttaa caagtctaga tgctggagac 240 tccattgttg ttgcagctct ttctcacatg cttaacctag cgaacttggc tgaggaggtt 300 cagatagcat accgaagacg aattaaacac aaaaagaaag gggatttcgc ggatgagaat 360 tccgcaacga cggaatcaga cattgaagaa acctttaaaa ggcttgtaaa tcagcttgga 420 aggtctcctc aagaagtttt tgacgctctc aaaaatcaaa caattgattt ggtcttgact 480 gcacatccaa cgcatcagtc ggtatccctg ctacaaaagc atggcaggat ccgaaactgc 540 ttgtctcagt tgtatgcgaa agacattacg cccgatgaaa aacaggagct tgatgaagct 600 ttacagaggg agattcaagc tgccttcaga actgatgaaa ttcggcgcac tcctcccacc 660 cctcaagatg agatgcgagc aggaatgagt tatttccatg aaaccatatg gaaaggtgtc 720 cctaagttct tacgtcgtgt tgacactgct ctaaagtcga ttggtataaa tgagagactt 780 ccttacaatg cccccctaat acaattctcg tcgtggatgg gcggcgaccg cgacgggaat 840 cctagagtca ctccagaagt cacgcgagac gtttgtctcc ttgcgaggat gatggctaca 900 aatttatact actctcagat agaggacctt atgtttgagt tgtcaatgtg gcgatgtagc 960 gatgagcttc ggcaacgtgc tctgcagctt cataattctg caaagagaga tgcaaaacat 1020 tacatagagt tttggaagca agtacctccc aatgagccat ttagggtaat tttgggagat 1080 gttagggaca agttatataa cactcgggaa cgcactcgcc agttgcttgc caatggtttc 1140 tcagatgtgc cagaagaagc acttacgagt gtagatcagt tgttggaacc gttagagttg 1200 tgctatcgat ctctgtgctc taccggcgat caacccattg cagatggcag tcttcttgat 1260 ttcatgcgtc aagtctcaac ctttggctta actcttgtga agttggatat tagacaagaa 1320 tcagatcgac acactgatgt tatcgacgca ataacaagac atctaggcct tgggtcctat 1380 aaagagtggc cagaagacaa acgacaggag tggctgttgg ctgaactacg tggaaaacgt 1440 ccactatttg gacccgacct tccaactaca gatgaaataa gagaagttct tgacacattc 1500 cacgtggtag ctgaacttcc tccagacaac tttggagctt acatcatatc aatggctact 1560 gctccttcag atgttttagt cgttgagtta ctgcagaggg aatgccgtgt gaaaaagcct 1620 ctgcgagttg tgcctttgtt tgagaagctt gctgatttag agaatcgtcc cgcggctttg 1680 gcaaggctgt tctcaattga ttggtataga aacagaattg atggaaagca agaagtaatg 1740 nnnggttact cagactccgg caaggatgcc ggaagactat ctgcagcatg gcaattatac 1800 aaggctcaag aggaattgat caaggttgca aaacagtttg gaattaagct gacaatgttt 1860 catggtcgtg gagggaccgt tggaagagga ggtggtccaa cccatctggc tatattatct 1920 caacctccag acacaattca cgggtcattg cgagttaccg tccaagggga ggttattgag 1980 cagtgttttg gggaggaaca tctgtgtttc cgaactcttc agcgctttac tgctgccaca 2040 ttggaacatg gaatgcatcc tccaattgca cctaagcccg aatggcgtca actgatggat 2100 gaaatggctg ttgttgctac tcaagagtat aggtcttatg ttttccacaa caagagattt 2160 gtggagtatt tccgatccgc aactcccgag ttggagtatg gacggatgaa tataggcagt 2220 cgtccatcaa aaagaaagcc cagtggaggc attgaatcac ttcgtgcaat tccatggata 2280 tttgcttgga cacagaccag attccatctt cctgtttggc ttggatttgg tgctgctttc 2340 aagagtgtta tcgagaagga cattcgaaat cttcacacgc tgcaacaaat gtataacgaa 2400 tggccatttt tccgtgtcac cattgaccta gttgaaatgg tgtttgccaa gcaccctgaa 2460 attgctgcat tatacgataa actgcttgta tcatcagtct tgtgggcttt cggggaacaa 2520 ctaagaaaaa actatgtaga gactaagacc cttctgctgc aggttgctgg acacaaagaa 2580 gtcttagaag gcgacccata tctgaaacaa cgattgagac ttcgtgactc atatatcaca 2640 accttgaatg cacttcaggc atatacttta aaacggatac gagatccaag ctaccatgtc 2700 accctcaggc ctcatttatc taaagaaagc tcaaccaagc cagcagcaga attggtaaaa 2760 ttaaacccaa ccagtgagta tgcaccggga ttagaagata cattgatctt aaccatgaag 2820 ggcattgctg cc 2832 <210> 16 <211> 944 <212> PRT <213> Welwitschia mirabilis <220> <221> UNSURE <222> (581)..(581) <223> Xaa can be any naturally occurring amino acid <400> 16 Ser Ile Asp Ala Gln Leu Arg Leu Leu Val Pro Thr Lys Val Ser Glu 1 5 10 15 Asp Asp Lys Leu Ile Glu Tyr Asp Ala Leu Leu Met Asp Arg Phe Leu 20 25 30 Asp Ile Leu Gln Asp Leu His Gly Glu Glu Ile Arg Glu Thr Val Gln 35 40 45 Glu Cys Tyr Glu Leu Ser Gly Glu Tyr Glu Gly Lys Phe Asp Thr Ala 50 55 60 Lys Leu Glu Glu Leu Gly Gly Val Leu Thr Ser Leu Asp Ala Gly Asp 65 70 75 80 Ser Ile Val Val Ala Ala Leu Ser His Met Leu Asn Leu Ala Asn Leu 85 90 95 Ala Glu Glu Val Gln Ile Ala Tyr Arg Arg Arg Ile Lys His Lys Lys 100 105 110 Lys Gly Asp Phe Ala Asp Glu Asn Ser Ala Thr Thr Glu Ser Asp Ile 115 120 125 Glu Glu Thr Phe Lys Arg Leu Val Asn Gln Leu Gly Arg Ser Pro Gln 130 135 140 Glu Val Phe Asp Ala Leu Lys Asn Gln Thr Ile Asp Leu Val Leu Thr 145 150 155 160 Ala His Pro Thr His Gln Ser Val Ser Leu Leu Gln Lys His Gly Arg 165 170 175 Ile Arg Asn Cys Leu Ser Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp 180 185 190 Glu Lys Gln Glu Leu Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala 195 200 205 Phe Arg Thr Asp Glu Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu 210 215 220 Met Arg Ala Gly Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val 225 230 235 240 Pro Lys Phe Leu Arg Arg Val Asp Thr Ala Leu Lys Ser Ile Gly Ile 245 250 255 Asn Glu Arg Leu Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp 260 265 270 Met Gly Gly Asp Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr 275 280 285 Arg Asp Val Cys Leu Leu Ala Arg Met Met Ala Thr Asn Leu Tyr Tyr 290 295 300 Ser Gln Ile Glu Asp Leu Met Phe Glu Leu Ser Met Trp Arg Cys Ser 305 310 315 320 Asp Glu Leu Arg Gln Arg Ala Leu Gln Leu His Asn Ser Ala Lys Arg 325 330 335 Asp Ala Lys His Tyr Ile Glu Phe Trp Lys Gln Val Pro Pro Asn Glu 340 345 350 Pro Phe Arg Val Ile Leu Gly Asp Val Arg Asp Lys Leu Tyr Asn Thr 355 360 365 Arg Glu Arg Thr Arg Gln Leu Leu Ala Asn Gly Phe Ser Asp Val Pro 370 375 380 Glu Glu Ala Leu Thr Ser Val Asp Gln Leu Leu Glu Pro Leu Glu Leu 385 390 395 400 Cys Tyr Arg Ser Leu Cys Ser Thr Gly Asp Gln Pro Ile Ala Asp Gly 405 410 415 Ser Leu Leu Asp Phe Met Arg Gln Val Ser Thr Phe Gly Leu Thr Leu 420 425 430 Val Lys Leu Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Ile 435 440 445 Asp Ala Ile Thr Arg His Leu Gly Leu Gly Ser Tyr Lys Glu Trp Pro 450 455 460 Glu Asp Lys Arg Gln Glu Trp Leu Leu Ala Glu Leu Arg Gly Lys Arg 465 470 475 480 Pro Leu Phe Gly Pro Asp Leu Pro Thr Thr Asp Glu Ile Arg Glu Val 485 490 495 Leu Asp Thr Phe His Val Val Ala Glu Leu Pro Pro Asp Asn Phe Gly 500 505 510 Ala Tyr Ile Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Val Val 515 520 525 Glu Leu Leu Gln Arg Glu Cys Arg Val Lys Lys Pro Leu Arg Val Val 530 535 540 Pro Leu Phe Glu Lys Leu Ala Asp Leu Glu Asn Arg Pro Ala Ala Leu 545 550 555 560 Ala Arg Leu Phe Ser Ile Asp Trp Tyr Arg Asn Arg Ile Asp Gly Lys 565 570 575 Gln Glu Val Met Xaa Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg 580 585 590 Leu Ser Ala Ala Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Ile Lys 595 600 605 Val Ala Lys Gln Phe Gly Ile Lys Leu Thr Met Phe His Gly Arg Gly 610 615 620 Gly Thr Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser 625 630 635 640 Gln Pro Pro Asp Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly 645 650 655 Glu Val Ile Glu Gln Cys Phe Gly Glu Glu His Leu Cys Phe Arg Thr 660 665 670 Leu Gln Arg Phe Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro 675 680 685 Ile Ala Pro Lys Pro Glu Trp Arg Gln Leu Met Asp Glu Met Ala Val 690 695 700 Val Ala Thr Gln Glu Tyr Arg Ser Tyr Val Phe His Asn Lys Arg Phe 705 710 715 720 Val Glu Tyr Phe Arg Ser Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met 725 730 735 Asn Ile Gly Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu 740 745 750 Ser Leu Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe 755 760 765 His Leu Pro Val Trp Leu Gly Phe Gly Ala Ala Phe Lys Ser Val Ile 770 775 780 Glu Lys Asp Ile Arg Asn Leu His Thr Leu Gln Gln Met Tyr Asn Glu 785 790 795 800 Trp Pro Phe Phe Arg Val Thr Ile Asp Leu Val Glu Met Val Phe Ala 805 810 815 Lys His Pro Glu Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Ser 820 825 830 Val Leu Trp Ala Phe Gly Glu Gln Leu Arg Lys Asn Tyr Val Glu Thr 835 840 845 Lys Thr Leu Leu Leu Gln Val Ala Gly His Lys Glu Val Leu Glu Gly 850 855 860 Asp Pro Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr 865 870 875 880 Thr Leu Asn Ala Leu Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro 885 890 895 Ser Tyr His Val Thr Leu Arg Pro His Leu Ser Lys Glu Ser Ser Thr 900 905 910 Lys Pro Ala Ala Glu Leu Val Lys Leu Asn Pro Thr Ser Glu Tyr Ala 915 920 925 Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala 930 935 940 <210> 17 <211> 4776 <212> DNA <213> Chlamydomonas reinhardtii <400> 17 atgacggact ccacatatga ttttggagcc gtgagggacg atctgacgcc gcttgaggat 60 gactgcaagc ttctcggtag cctgcttgac gactgtctcc gcgtcgaaat cggcgagacc 120 atgttcaaga agattgaacg catccgagca ctggcgcaat gtgcctcaaa tctgtcgatc 180 aagggagacg cgggcgcctc cgacatgctg tcgcaccggc tggcggagga gctgatgaac 240 ctggacatgg acgaggcggt gccgctcaca cgcgcctgcg gccactacct caacctgtcc 300 ggcatcgcag agctgcacca cggagtgcgc cgcgaccgcg ccactcgcga gcccaacccc 360 aacagctgcg acgcggtgtt tgcgcggctg atcacggagg gcgtggaccc cgaggagctg 420 taccgggcgg tgtcggagca gaacgtggag gtggtgctca ccgcgcaccc cacacaggtg 480 aaccggcgca cgctgcagta caagcacact cgcattgcgg cgctgctgca gcagcacgac 540 cgctccgacc tgacggcgga ggagcggcgc aacatggtga gcgagctgca gcgggaggtg 600 gcggcgctgt ggcagacgga cgagctgagg aggcagaagc ccacgccgct ggacgaggcg 660 cgcggcggtc tgcacattgt ggagcagtcg ctgtgggccg cggtgccgca gtacatgcgc 720 cgcctcagcg ccgcgctcaa gaaacacacc gggcacgacc tgccgctgca ggccacgccc 780 ttccgcttcg gcagctggat gggcggcgac cgcgatggca accccaacgt gaccgccaag 840 gtgacggcgc acgtgacggc cctggcgcgc tggatggcgg cggatctgta cctgcgtgag 900 atcgacacgc tgaggtttga gctgtccatg aaccagtgca gtgcggcggt gtggaagatg 960 gcccgccgca tcatcgccga gggccacacc aagcgcgccg gcgtggtccg ggccaaggcc 1020 gccgccgccc tgcaccagac cgcaacagac gcagccagcc atggcggctc cgccgcctcg 1080 gcggccgccg ccgccgccgc aggcggcgac gtcgtcgctg acggcaccag cggcggcggc 1140 gctgccgccg ccgccggccc cgccgccgct gccgcggcgg acgacgcgtt caccttcagc 1200 cggttggggc ggccccggcc ggagcggccg agcacggacg tgcggagtgt gggcgtgctg 1260 gcgggcggcg agggcgcggc gttcccgggc ggcatgatcc tgggcacgca gccggtgtcg 1320 gcgcacacgg cggcggaggt gtcggtgccg cacgagctgc cgggacagga cgtggagggc 1380 ggctcggaga tggacttcaa cgagtcccgc cgcgcctcgg acgccggaga cctgggcgcc 1440 tcgcagcacc ccatgctggg cgggccctcc gccggcgcct ccgccgagcc caccgcccac 1500 ggctacacca ccaccgccac cgccgccgcc gccgccgccg acggcacgca gcccgagccc 1560 gaagtccccg gcacgcccag ctacgccgac cccggcaccc ccgaccgcct tggcgcgctg 1620 cccggcccct tcacgcccgg ccccacgccc ttccgcgagg cggccaacgc cgccatgagc 1680 accgccgcca gcggcggcgc gggcggcggc ggcggcggcg gcgcgaaccg cgcggcctcg 1740 ggcctgggcg gcgaccccac cttcacgcgt cgcagcctga tggcgcagcg gctgggaacc 1800 agctcggtgc agttcgcgcg cgcgcacgag caccccggct tccaccccta ccgcatcgtg 1860 ttgggccacg tgcgcgacag gctggcggcc acgcggcggc gcatggagga cctgctgagc 1920 ggccgcgagc cggcgggcga ggcgcacggc ggcgtggggg cgggcggcgg cggcggcggc 1980 ggcgcggcgc cgtggtatga gagcgaggac gagctggcgg agccgctgat ggcgtgctac 2040 tggtcgctgt gggagtgcgg cggcggcgtc attgcggacg ggcggctgct ggacctcatc 2100 cgccgcgtgt acaccttcgg catgtgcctc atgaagctag acctgcgcca ggagtccacc 2160 cgccacgccg aggccctgga cgccgtgacc agctacctgg gtctgggctc ctacctggag 2220 tggagcgagg accagaaaat cgagtggctc acaaaggagc tgcagggccg gcggccgctc 2280 atccccgccg acatgcccat gagcgccgag gtgcgcgagg tgctggacac cttcaaggtg 2340 gccgcccatc tgggccgtga caacctgggc gcctacgtca tctccatgac caagggcgcc 2400 tcggacgtga tggcggtgga gctgctgcag cgcgaggcgc gcatgcaggt gggcgccgag 2460 gcgggcggcc gcggcggcgg cgggcccgag gacggcggct cgctgcgcgt ggtgccgctg 2520 ttcgagacgc tggaggacct ggacgcggcg gaggacgtga tgacgcggct gctgaccaac 2580 ccctggtacc gcgagcacct gcgggcagtg cacggcgacg cgcaggaggt gatgctggga 2640 tacagcgaca gcggcaagga cgccggccgc ctggctgcca actgggcgct gtacaagtgt 2700 caggagcggc tggtggccat caccaaggcc aacaacgtca agctcacgct gttccacggc 2760 cgcggcggca ccgtgggccg cggcggcggg cccacccaca tcgccatcca gtcgcagccg 2820 cccggctctg tggaggggac cttccgcatc accgagcagg gcgagatggt ccaggccaag 2880 ttcggcatca gcggcgtggc tctgagccag ctggagacct acaccaccgc tgtgctgctg 2940 gccaccatgc gcccgcccag cccgccgcgc cgcgaggagt ggcgcgccgt gatggagatg 3000 ctcagccgcg tcagctgcga gagctaccgc aacatcgtgc accacagccc gctcttcctg 3060 cgctacttca agcacgccac gcccgaggcc gagctgggca acctctacat cggctctcgc 3120 ccggctcggc ggcgcaacaa ggacgcctcc atctccacgc tgcgcgccat cccctggatc 3180 ttcgcctgga cgcagaaccg cctcatcctg ccctcctggc tgggcattgg cgccgccctc 3240 accgcggcca tgacccaggg ccacctgccc acgctgcagg ccatgtaccg cgagtggccc 3300 ttcttcggat ccacagtgga tctgattgag atgatcctgg ccaagaccga cccgcgcatc 3360 gcggcgctgt acgaggaggt gctggtcaac gaccccgagg agaagaagct gggagccgag 3420 ctgcgcgagc ggctgcagcg ctgccagggc gccatcctca aggtgaccgg gcacgagaac 3480 ctgctgtcca acaaccccac attgagcaag ctcatctcca tgcgctcgcc cttcgtggac 3540 cccatcaaca tcctgcaggt ggaggtgctg cggcgcctgc gccaggaccc caacaacatg 3600 cgcctgcgcg acgcgctgct catctccatc aacggcatcg ccgccggcat gcgcaacacc 3660 ggctaagcag cggcggcgct gctgctggtg atggaggtgg aggtggagat ggacgtggtg 3720 cgcaccaggc acaaggcgga ggcaggtgcc agtggaggtg gggcgtcccg ggcggaggca 3780 tgagcggcgt cgacggctgg cgccgcggta tgatgtgctg cggcacgagc gacggcacgt 3840 gcggtctaaa gctgctggat gtgcttggca cggcgcgcaa gaggggtgtg ctgggggcgg 3900 aggtggtgct gaaaatgttt ggttagttgg ttggatgttt gggctagctg gtgcgctgga 3960 gcgggtaagg caagtggtgg gtggggtatg cgggtgcgct ggggtgtcca gggcggctgc 4020 gatcaatgcg ggttggtggg caaccccgtc ccggcgctga atcgctgcgt ggatctgacc 4080 tttgcggaat tcctgcctgc cttccgcgcc tggcaattta ggaactcgtt tgagcgtttg 4140 acgttgtcct agggcggcat gaccgagcat cgcgtgcatg gcagcggggc tgcgatcgcg 4200 cgtggtgagc cacagacgtt gatagtgata tttgaggcag cccagaacgc atggcggaat 4260 ggcgtggtct ttgagagctg agtgtgtcag actggcatag ggcgctgtgg ctgactaacg 4320 tcccgcacgt gtgcgactgc agaccatgtt tgcaggggca ggtactttac ttgatgtgca 4380 tggcattctc acataaagct ccgaaggatc atttgtggcg caccaaccag agacctagcc 4440 cagagcagag tgtcagcagc gatatcaaag tcattttgtg ggtggttgtc tgggtactcc 4500 gaggcgcgta cgttgagcgc gtgctcgctg cataccgcat acggaatcgg ataagtgaaa 4560 ggaggtcaca tggccagggg ctgcagatgc tggtgagggc tgcctgccta agcggcgtgt 4620 ccgggacggc agggaagcac gcatgccatt cgacgtgtgc ggtgcaaatg agaccgtgga 4680 gtcctcgggc agggcttgac agcacaagcg tggagcgcgc acacagcgca cagactatgt 4740 tttccttgtg ctctttaaca cagcgcacag aaaaaa 4776 <210> 18 <211> 1221 <212> PRT <213> Chlamydomonas reinhardtii <400> 18 Met Thr Asp Ser Thr Tyr Asp Phe Gly Ala Val Arg Asp Asp Leu Thr 1 5 10 15 Pro Leu Glu Asp Asp Cys Lys Leu Leu Gly Ser Leu Leu Asp Asp Cys 20 25 30 Leu Arg Val Glu Ile Gly Glu Thr Met Phe Lys Lys Ile Glu Arg Ile 35 40 45 Arg Ala Leu Ala Gln Cys Ala Ser Asn Leu Ser Ile Lys Gly Asp Ala 50 55 60 Gly Ala Ser Asp Met Leu Ser His Arg Leu Ala Glu Glu Leu Met Asn 65 70 75 80 Leu Asp Met Asp Glu Ala Val Pro Leu Thr Arg Ala Cys Gly His Tyr 85 90 95 Leu Asn Leu Ser Gly Ile Ala Glu Leu His His Gly Val Arg Arg Asp 100 105 110 Arg Ala Thr Arg Glu Pro Asn Pro Asn Ser Cys Asp Ala Val Phe Ala 115 120 125 Arg Leu Ile Thr Glu Gly Val Asp Pro Glu Glu Leu Tyr Arg Ala Val 130 135 140 Ser Glu Gln Asn Val Glu Val Val Leu Thr Ala His Pro Thr Gln Val 145 150 155 160 Asn Arg Arg Thr Leu Gln Tyr Lys His Thr Arg Ile Ala Ala Leu Leu 165 170 175 Gln Gln His Asp Arg Ser Asp Leu Thr Ala Glu Glu Arg Arg Asn Met 180 185 190 Val Ser Glu Leu Gln Arg Glu Val Ala Ala Leu Trp Gln Thr Asp Glu 195 200 205 Leu Arg Arg Gln Lys Pro Thr Pro Leu Asp Glu Ala Arg Gly Gly Leu 210 215 220 His Ile Val Glu Gln Ser Leu Trp Ala Ala Val Pro Gln Tyr Met Arg 225 230 235 240 Arg Leu Ser Ala Ala Leu Lys Lys His Thr Gly His Asp Leu Pro Leu 245 250 255 Gln Ala Thr Pro Phe Arg Phe Gly Ser Trp Met Gly Gly Asp Arg Asp 260 265 270 Gly Asn Pro Asn Val Thr Ala Lys Val Thr Ala His Val Thr Ala Leu 275 280 285 Ala Arg Trp Met Ala Ala Asp Leu Tyr Leu Arg Glu Ile Asp Thr Leu 290 295 300 Arg Phe Glu Leu Ser Met Asn Gln Cys Ser Ala Ala Val Trp Lys Met 305 310 315 320 Ala Arg Arg Ile Ile Ala Glu Gly His Thr Lys Arg Ala Gly Val Val 325 330 335 Arg Ala Lys Ala Ala Ala Ala Leu His Gln Thr Ala Thr Asp Ala Ala 340 345 350 Ser His Gly Gly Ser Ala Ala Ser Ala Ala Ala Ala Ala Ala Ala Gly 355 360 365 Gly Asp Val Val Ala Asp Gly Thr Ser Gly Gly Gly Ala Ala Ala Ala 370 375 380 Ala Gly Pro Ala Ala Ala Ala Ala Ala Asp Asp Ala Phe Thr Phe Ser 385 390 395 400 Arg Leu Gly Arg Pro Arg Pro Glu Arg Pro Ser Thr Asp Val Arg Ser 405 410 415 Val Gly Val Leu Ala Gly Gly Glu Gly Ala Ala Phe Pro Gly Gly Met 420 425 430 Ile Leu Gly Thr Gln Pro Val Ser Ala His Thr Ala Ala Glu Val Ser 435 440 445 Val Pro His Glu Leu Pro Gly Gln Asp Val Glu Gly Gly Ser Glu Met 450 455 460 Asp Phe Asn Glu Ser Arg Arg Ala Ser Asp Ala Gly Asp Leu Gly Ala 465 470 475 480 Ser Gln His Pro Met Leu Gly Gly Pro Ser Ala Gly Ala Ser Ala Glu 485 490 495 Pro Thr Ala His Gly Tyr Thr Thr Thr Ala Thr Ala Ala Ala Ala Ala 500 505 510 Ala Asp Gly Thr Gln Pro Glu Pro Glu Val Pro Gly Thr Pro Ser Tyr 515 520 525 Ala Asp Pro Gly Thr Pro Asp Arg Leu Gly Ala Leu Pro Gly Pro Phe 530 535 540 Thr Pro Gly Pro Thr Pro Phe Arg Glu Ala Ala Asn Ala Ala Met Ser 545 550 555 560 Thr Ala Ala Ser Gly Gly Ala Gly Gly Gly Gly Gly Gly Gly Ala Asn 565 570 575 Arg Ala Ala Ser Gly Leu Gly Gly Asp Pro Thr Phe Thr Arg Arg Ser 580 585 590 Leu Met Ala Gln Arg Leu Gly Thr Ser Ser Val Gln Phe Ala Arg Ala 595 600 605 His Glu His Pro Gly Phe His Pro Tyr Arg Ile Val Leu Gly His Val 610 615 620 Arg Asp Arg Leu Ala Ala Thr Arg Arg Arg Met Glu Asp Leu Leu Ser 625 630 635 640 Gly Arg Glu Pro Ala Gly Glu Ala His Gly Gly Val Gly Ala Gly Gly 645 650 655 Gly Gly Gly Gly Gly Ala Ala Pro Trp Tyr Glu Ser Glu Asp Glu Leu 660 665 670 Ala Glu Pro Leu Met Ala Cys Tyr Trp Ser Leu Trp Glu Cys Gly Gly 675 680 685 Gly Val Ile Ala Asp Gly Arg Leu Leu Asp Leu Ile Arg Arg Val Tyr 690 695 700 Thr Phe Gly Met Cys Leu Met Lys Leu Asp Leu Arg Gln Glu Ser Thr 705 710 715 720 Arg His Ala Glu Ala Leu Asp Ala Val Thr Ser Tyr Leu Gly Leu Gly 725 730 735 Ser Tyr Leu Glu Trp Ser Glu Asp Gln Lys Ile Glu Trp Leu Thr Lys 740 745 750 Glu Leu Gln Gly Arg Arg Pro Leu Ile Pro Ala Asp Met Pro Met Ser 755 760 765 Ala Glu Val Arg Glu Val Leu Asp Thr Phe Lys Val Ala Ala His Leu 770 775 780 Gly Arg Asp Asn Leu Gly Ala Tyr Val Ile Ser Met Thr Lys Gly Ala 785 790 795 800 Ser Asp Val Met Ala Val Glu Leu Leu Gln Arg Glu Ala Arg Met Gln 805 810 815 Val Gly Ala Glu Ala Gly Gly Arg Gly Gly Gly Gly Pro Glu Asp Gly 820 825 830 Gly Ser Leu Arg Val Val Pro Leu Phe Glu Thr Leu Glu Asp Leu Asp 835 840 845 Ala Ala Glu Asp Val Met Thr Arg Leu Leu Thr Asn Pro Trp Tyr Arg 850 855 860 Glu His Leu Arg Ala Val His Gly Asp Ala Gln Glu Val Met Leu Gly 865 870 875 880 Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ala Ala Asn Trp Ala 885 890 895 Leu Tyr Lys Cys Gln Glu Arg Leu Val Ala Ile Thr Lys Ala Asn Asn 900 905 910 Val Lys Leu Thr Leu Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly 915 920 925 Gly Gly Pro Thr His Ile Ala Ile Gln Ser Gln Pro Pro Gly Ser Val 930 935 940 Glu Gly Thr Phe Arg Ile Thr Glu Gln Gly Glu Met Val Gln Ala Lys 945 950 955 960 Phe Gly Ile Ser Gly Val Ala Leu Ser Gln Leu Glu Thr Tyr Thr Thr 965 970 975 Ala Val Leu Leu Ala Thr Met Arg Pro Pro Ser Pro Pro Arg Arg Glu 980 985 990 Glu Trp Arg Ala Val Met Glu Met Leu Ser Arg Val Ser Cys Glu Ser 995 1000 1005 Tyr Arg Asn Ile Val His His Ser Pro Leu Phe Leu Arg Tyr Phe 1010 1015 1020 Lys His Ala Thr Pro Glu Ala Glu Leu Gly Asn Leu Tyr Ile Gly 1025 1030 1035 Ser Arg Pro Ala Arg Arg Arg Asn Lys Asp Ala Ser Ile Ser Thr 1040 1045 1050 Leu Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Asn Arg Leu 1055 1060 1065 Ile Leu Pro Ser Trp Leu Gly Ile Gly Ala Ala Leu Thr Ala Ala 1070 1075 1080 Met Thr Gln Gly His Leu Pro Thr Leu Gln Ala Met Tyr Arg Glu 1085 1090 1095 Trp Pro Phe Phe Gly Ser Thr Val Asp Leu Ile Glu Met Ile Leu 1100 1105 1110 Ala Lys Thr Asp Pro Arg Ile Ala Ala Leu Tyr Glu Glu Val Leu 1115 1120 1125 Val Asn Asp Pro Glu Glu Lys Lys Leu Gly Ala Glu Leu Arg Glu 1130 1135 1140 Arg Leu Gln Arg Cys Gln Gly Ala Ile Leu Lys Val Thr Gly His 1145 1150 1155 Glu Asn Leu Leu Ser Asn Asn Pro Thr Leu Ser Lys Leu Ile Ser 1160 1165 1170 Met Arg Ser Pro Phe Val Asp Pro Ile Asn Ile Leu Gln Val Glu 1175 1180 1185 Val Leu Arg Arg Leu Arg Gln Asp Pro Asn Asn Met Arg Leu Arg 1190 1195 1200 Asp Ala Leu Leu Ile Ser Ile Asn Gly Ile Ala Ala Gly Met Arg 1205 1210 1215 Asn Thr Gly 1220 <210> 19 <211> 3099 <212> DNA <213> Glycine max <400> 19 atgactgaca tcactggtga tattgctgag gaaatctcct tccagagctt cgatgatgac 60 tgcaggttgc ttggtaatct cctcaatgac attctccagc gtgaagttgg caccaacttg 120 cttgacaaga tcgaaaggac tcgagtcctt gctcagagtg gttgtaatat gaggcaggcg 180 ggtattgtaa acatggcaga gatgcttgag aagcagttgg cttcggagtt atcaaagatg 240 acactagaag aagctttcac ccttgctcgt gccttcagcc attatcttac tttgatgggt 300 atagctgaga cccaccatag ggttcgtaaa ggagggaata tggcacaaat tgcaaaatct 360 tgcgatgata tatttaacca gctggtgcag ggtggagtcc ccccagaaga actttatgac 420 acagtctgca agcgggaggt tgaaattgtt ctcactgctc atcccacaca gattaaccgt 480 cgaaccttac agtttaaaca cattagaatt gctcatcttt tggattacaa tgatcgacct 540 gatcttagca ctgaagatcg agaaatggtg attgaagatc tggtgagaga gataacttca 600 atatggcaga cagatgagct taggcgccag aaacccactc cagttgatga agctagagct 660 ggtttcaata ttgtggagca gtcactctgg aaagctgtcc ctcattattt acgtcgtgtc 720 agcaatgcat taaagaagca tacaggaaag ccacttcctt tgacttgcac tcccataaag 780 tttggatctt ggatgggagg tgatagagat ggaaacccaa atgtgacagc aaaggtcaca 840 aaagatgttt cacttctatc tagatggatg gcgattgacc tctatattcg ggaagtggat 900 agcctcagat ttgagctatc catgaaccag tgcagtgata ggttgtcaag attggcacat 960 gaaattctag aagccaagca tgagaatcgc cgtgagaatt ggaatcagtc tgcgaataga 1020 agtctcacac ttccaacaca acttccagct agagctcatt taccttctat tgctgaaaat 1080 ggtgaatctc ggcatcccag actagacatt ccagcacctg attacatgca atccaatcac 1140 aaggatggtg gggtttctgt aagttcaact acatcaaaac ttgccaatcc caatactcga 1200 ttaccaggaa caagttcagc aaattccagt gcttcttcag ctgcacttgg tcaaaagaaa 1260 ttgtatgcag aatcccagac aggaaagtcc acttttcaaa agcttttgga gccaatgctt 1320 cctcaacttc ctggaattgc tccttataga attgtcctgg ggaatgttaa ggataagctt 1380 gagaaaagtc gtagacggtt agaaattctt cttgaggatg ttgcatgtga ctatgatcct 1440 ttggattact atgaaacatc tgatcagctt ttggaacctc tgctcctctg ttatgaatct 1500 ctgcaatcgt gtggatctgg ggtgctagct gatggtcgac ttgctgatct gattcgtaga 1560 gttgctacct ttggaatggt gttaatgaag cttgacttgc gtcaggaatc tgggagacat 1620 gcagaagcac ttgatgcaat aacacagtac ttagatatgg gtacttacag tgaatgggat 1680 gaagaaaaga agttggactt cttaacaaga gaacttaaag ggaagaggcc tcttgttcct 1740 gttagtatag aggttcatcc tgatgttaaa gaagtcttgg atacattccg aattgccgct 1800 gaactgggga gtgattcact tggagcttat gtgatctcta tggcctcaaa tgcaagtgat 1860 gtccttgcag tagagctttt acagaaggat gcacggcttg ctgctattgg ggagttggga 1920 aaagcatgtc ctggtggaac gttgcgggtt gtccctctgt ttgaaactgt gaaagacctg 1980 agaggagctg gttcagttat ccggaaactt ttatcaatag actggtacca tgaacacatc 2040 gttaagaacc ataatggaca tcaagaggtt atggttggat attctgattc tggtaaagat 2100 gctggtcgct ttactgctgc ttgggaactt tacaaagctc aggaggatgt tgtagctgct 2160 tgcaatgatt atggaataaa ggttactcta ttccatggtc gtggaggcag tattggtcgt 2220 ggtggtggcc caacatatct ggctattcag tcccaacccc ctggctctgt gatgggaacg 2280 cttcggtcta ctgagcaggg agagatggta gaggctaagt ttgggttgcc acagatagct 2340 gttagacaac ttgagatata cacaacagct gtactacttg caacccttcg tccacctatc 2400 ccaccccgag aagaaaaatg gcgtaatgtc atggaagaga tctcaaacat cagttgtcag 2460 tgtgaccgca atgtagtgta tgaaaatcca gaattcctgg cctacttcca tgaagccaca 2520 ccagaggcag aacttggctt ccttaacata ggtagccgcc ctacaagaag gaagagctca 2580 gtaggaatcg gacaccttcg tgcaattccc tggttatttg catggacaca aacaagattc 2640 gttcttccag cttggcttgg agtcggagca ggtttaaaag gagcttgcga gaaaggttac 2700 accgaagagc taaaagccat gtacaaagaa tggcccttct ttcaaagtac catagatctt 2760 attgagatgg ttttggggaa agctgacatt cctatagcca agcactatga tgaagtcctt 2820 gtgacaaagg agaggcaaga gcttggccat gaactaagaa gtgagctcat gacagctgaa 2880 aagtttgtca tggttattag tgggcacgag aaacttcagc agaataatag gagcttgagg 2940 aggctaattg agaatagact tcccttcctt aatcccttga acatgttgca ggtggagata 3000 ctcaagaggt taagacgtga tgatgacaac cgtaagatca gagatgcttt gcttatcacc 3060 ataaatggga ttgctgcagg gatgaagaat acaggttga 3099 <210> 20 <211> 1032 <212> PRT <213> Glycine max <400> 20 Met Thr Asp Ile Thr Gly Asp Ile Ala Glu Glu Ile Ser Phe Gln Ser 1 5 10 15 Phe Asp Asp Asp Cys Arg Leu Leu Gly Asn Leu Leu Asn Asp Ile Leu 20 25 30 Gln Arg Glu Val Gly Thr Asn Leu Leu Asp Lys Ile Glu Arg Thr Arg 35 40 45 Val Leu Ala Gln Ser Gly Cys Asn Met Arg Gln Ala Gly Ile Val Asn 50 55 60 Met Ala Glu Met Leu Glu Lys Gln Leu Ala Ser Glu Leu Ser Lys Met 65 70 75 80 Thr Leu Glu Glu Ala Phe Thr Leu Ala Arg Ala Phe Ser His Tyr Leu 85 90 95 Thr Leu Met Gly Ile Ala Glu Thr His His Arg Val Arg Lys Gly Gly 100 105 110 Asn Met Ala Gln Ile Ala Lys Ser Cys Asp Asp Ile Phe Asn Gln Leu 115 120 125 Val Gln Gly Gly Val Pro Pro Glu Glu Leu Tyr Asp Thr Val Cys Lys 130 135 140 Arg Glu Val Glu Ile Val Leu Thr Ala His Pro Thr Gln Ile Asn Arg 145 150 155 160 Arg Thr Leu Gln Phe Lys His Ile Arg Ile Ala His Leu Leu Asp Tyr 165 170 175 Asn Asp Arg Pro Asp Leu Ser Thr Glu Asp Arg Glu Met Val Ile Glu 180 185 190 Asp Leu Val Arg Glu Ile Thr Ser Ile Trp Gln Thr Asp Glu Leu Arg 195 200 205 Arg Gln Lys Pro Thr Pro Val Asp Glu Ala Arg Ala Gly Phe Asn Ile 210 215 220 Val Glu Gln Ser Leu Trp Lys Ala Val Pro His Tyr Leu Arg Arg Val 225 230 235 240 Ser Asn Ala Leu Lys Lys His Thr Gly Lys Pro Leu Pro Leu Thr Cys 245 250 255 Thr Pro Ile Lys Phe Gly Ser Trp Met Gly Gly Asp Arg Asp Gly Asn 260 265 270 Pro Asn Val Thr Ala Lys Val Thr Lys Asp Val Ser Leu Leu Ser Arg 275 280 285 Trp Met Ala Ile Asp Leu Tyr Ile Arg Glu Val Asp Ser Leu Arg Phe 290 295 300 Glu Leu Ser Met Asn Gln Cys Ser Asp Arg Leu Ser Arg Leu Ala His 305 310 315 320 Glu Ile Leu Glu Ala Lys His Glu Asn Arg Arg Glu Asn Trp Asn Gln 325 330 335 Ser Ala Asn Arg Ser Leu Thr Leu Pro Thr Gln Leu Pro Ala Arg Ala 340 345 350 His Leu Pro Ser Ile Ala Glu Asn Gly Glu Ser Arg His Pro Arg Leu 355 360 365 Asp Ile Pro Ala Pro Asp Tyr Met Gln Ser Asn His Lys Asp Gly Gly 370 375 380 Val Ser Val Ser Ser Thr Thr Ser Lys Leu Ala Asn Pro Asn Thr Arg 385 390 395 400 Leu Pro Gly Thr Ser Ser Ala Asn Ser Ser Ala Ser Ser Ala Ala Leu 405 410 415 Gly Gln Lys Lys Leu Tyr Ala Glu Ser Gln Thr Gly Lys Ser Thr Phe 420 425 430 Gln Lys Leu Leu Glu Pro Met Leu Pro Gln Leu Pro Gly Ile Ala Pro 435 440 445 Tyr Arg Ile Val Leu Gly Asn Val Lys Asp Lys Leu Glu Lys Ser Arg 450 455 460 Arg Arg Leu Glu Ile Leu Leu Glu Asp Val Ala Cys Asp Tyr Asp Pro 465 470 475 480 Leu Asp Tyr Tyr Glu Thr Ser Asp Gln Leu Leu Glu Pro Leu Leu Leu 485 490 495 Cys Tyr Glu Ser Leu Gln Ser Cys Gly Ser Gly Val Leu Ala Asp Gly 500 505 510 Arg Leu Ala Asp Leu Ile Arg Arg Val Ala Thr Phe Gly Met Val Leu 515 520 525 Met Lys Leu Asp Leu Arg Gln Glu Ser Gly Arg His Ala Glu Ala Leu 530 535 540 Asp Ala Ile Thr Gln Tyr Leu Asp Met Gly Thr Tyr Ser Glu Trp Asp 545 550 555 560 Glu Glu Lys Lys Leu Asp Phe Leu Thr Arg Glu Leu Lys Gly Lys Arg 565 570 575 Pro Leu Val Pro Val Ser Ile Glu Val His Pro Asp Val Lys Glu Val 580 585 590 Leu Asp Thr Phe Arg Ile Ala Ala Glu Leu Gly Ser Asp Ser Leu Gly 595 600 605 Ala Tyr Val Ile Ser Met Ala Ser Asn Ala Ser Asp Val Leu Ala Val 610 615 620 Glu Leu Leu Gln Lys Asp Ala Arg Leu Ala Ala Ile Gly Glu Leu Gly 625 630 635 640 Lys Ala Cys Pro Gly Gly Thr Leu Arg Val Val Pro Leu Phe Glu Thr 645 650 655 Val Lys Asp Leu Arg Gly Ala Gly Ser Val Ile Arg Lys Leu Leu Ser 660 665 670 Ile Asp Trp Tyr His Glu His Ile Val Lys Asn His Asn Gly His Gln 675 680 685 Glu Val Met Val Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Phe 690 695 700 Thr Ala Ala Trp Glu Leu Tyr Lys Ala Gln Glu Asp Val Val Ala Ala 705 710 715 720 Cys Asn Asp Tyr Gly Ile Lys Val Thr Leu Phe His Gly Arg Gly Gly 725 730 735 Ser Ile Gly Arg Gly Gly Gly Pro Thr Tyr Leu Ala Ile Gln Ser Gln 740 745 750 Pro Pro Gly Ser Val Met Gly Thr Leu Arg Ser Thr Glu Gln Gly Glu 755 760 765 Met Val Glu Ala Lys Phe Gly Leu Pro Gln Ile Ala Val Arg Gln Leu 770 775 780 Glu Ile Tyr Thr Thr Ala Val Leu Leu Ala Thr Leu Arg Pro Pro Ile 785 790 795 800 Pro Pro Arg Glu Glu Lys Trp Arg Asn Val Met Glu Glu Ile Ser Asn 805 810 815 Ile Ser Cys Gln Cys Asp Arg Asn Val Val Tyr Glu Asn Pro Glu Phe 820 825 830 Leu Ala Tyr Phe His Glu Ala Thr Pro Glu Ala Glu Leu Gly Phe Leu 835 840 845 Asn Ile Gly Ser Arg Pro Thr Arg Arg Lys Ser Ser Val Gly Ile Gly 850 855 860 His Leu Arg Ala Ile Pro Trp Leu Phe Ala Trp Thr Gln Thr Arg Phe 865 870 875 880 Val Leu Pro Ala Trp Leu Gly Val Gly Ala Gly Leu Lys Gly Ala Cys 885 890 895 Glu Lys Gly Tyr Thr Glu Glu Leu Lys Ala Met Tyr Lys Glu Trp Pro 900 905 910 Phe Phe Gln Ser Thr Ile Asp Leu Ile Glu Met Val Leu Gly Lys Ala 915 920 925 Asp Ile Pro Ile Ala Lys His Tyr Asp Glu Val Leu Val Thr Lys Glu 930 935 940 Arg Gln Glu Leu Gly His Glu Leu Arg Ser Glu Leu Met Thr Ala Glu 945 950 955 960 Lys Phe Val Met Val Ile Ser Gly His Glu Lys Leu Gln Gln Asn Asn 965 970 975 Arg Ser Leu Arg Arg Leu Ile Glu Asn Arg Leu Pro Phe Leu Asn Pro 980 985 990 Leu Asn Met Leu Gln Val Glu Ile Leu Lys Arg Leu Arg Arg Asp Asp 995 1000 1005 Asp Asn Arg Lys Ile Arg Asp Ala Leu Leu Ile Thr Ile Asn Gly 1010 1015 1020 Ile Ala Ala Gly Met Lys Asn Thr Gly 1025 1030 <210> 21 <211> 3159 <212> DNA <213> Ricinus communis <400> 21 atgacggaca ccacagatga tattgcagag gaaatctcat ttcagagttt tgatgatgat 60 tgtaagcttc ttggcaattt gttaaacgat gttttgcaga gagaagttgg ttctaaattc 120 atggagaagc ttgaacgcaa tcgcatccta gctcagagtg cttgtaatat gagattggcg 180 gggatagaag ataccgctga attgctggag aagcagctgg cattggagat atcaaggatg 240 acattagagg aagcattgac acttgctcgt gcctttagtc attaccttaa tttgatgggc 300 attgctgaga cccatcacag ggttcgtaag gcacggagta tgacacatct atcaaaatct 360 tgtgatgaca tatttaatca gctgctgcag agtggcatat ctgcagagga gctttatgac 420 acagtttgca agcaggaggt tgaaattgtg ctcactgcac atcctactca aattaatcgt 480 cgtaccttgc aatataagca catcagaatt gctcatcttt tagattataa tgaccggcct 540 gatcttactc atgaagatcg agaaatgctg attgaagatc tggtgagaga aattacttca 600 atatggcaga cagatgagct taggcgccac aagcctacac cagtagatga agctagggct 660 ggcttgaaca ttgtggagca gtccctgtgg aaagctcttc cccattattt acgtcgtgtc 720 agtactgccc taaagaagca tacaggaaag ccacttcctt tgacttgcac gccaataagg 780 tttgggtctt ggatgggggg tgatagagat ggtaatccga atgtaacagc aaaggtcaca 840 agagatgttt ctcttttatc taggtggatg gctgttgacc tttacattcg agaagttgat 900 agcctgagat ttgaactatc catggttcaa tgcagtgata gattgttgaa agtggcaaat 960 gacattttaa tagaagaaac ttcatctgaa gatcaccatg agagttggaa tcaacctgca 1020 agcagaagtc aaacaaagtt tcctagaaaa tctcttccta cacaacttcc acctagagct 1080 gatcttcctg cttgcactga atgtaatgat ggtgaatctc agtatcccaa actagaactt 1140 ccaggaactg attacatgcc ctttaatcgc caggaagctc taggttcttc atattcagaa 1200 tcttcatccc aggatatcaa tcatggttta cctaaaacaa ctggaaatgg aagtgttgct 1260 aattctagtg gatctccgcg ggcatctttc agctctgctc aactggttgc acagaggaaa 1320 ctatttgcag aatccaagat aggaagatct agcttccaga agcttctaga accaagtctg 1380 cctcaacgtc ctggaattgc tccttataga attgttcttg gaaatgtaaa agataagctt 1440 atgaggacaa gaagacgtct ggaacttctt ctagaggatc ttccttgtga atatgatcaa 1500 tgggattact atgagacaac agatcaatta ttggatccac tgcttctgtg ctacgagtct 1560 cttcaatcat gtggagctgg ggttctagct gatggtcggc tagctgacct gataagaaga 1620 gttgctacat ttgggatggt gttaatgaag ctagacttgc gccaggaatc tggtagacat 1680 gctgatactc ttgatgcaat caccaaatat ttggaaatgg gcacgtatag tgagtgggat 1740 gaagaaaaga agctggaatt tctgacaaga gaactgaaag gaaaacggcc actggttcct 1800 cctactattg aggttgctcc tgatgttaaa gaagtcttgg atgctttccg tgttgctgct 1860 gagctgggga gtgattcact tggagcttat gtgatttcta tggcatccaa tgcaagtgat 1920 gtccttgctg tggagcttct gcagaaggat gcccggcttg ctgttagtgg ggagctagga 1980 agaccatgcc ctggtggaac gttgcgagta gttccgttgt ttgaaactgt gaaagacctg 2040 agaggtgctg gttcggtgat cagaaaactg ttatcaattg actggtatag agaacacata 2100 attaagaacc ataacgggca tcaggaggtg atggttggct attctgattc tggtaaagat 2160 gctggacgct ttactgctgc atgggaactt tacaaagccc aagaggatgt tgtggcagcc 2220 tgtaatgatt ttggtatcaa agtaacacta ttccatgggc gtggagggag tattggtcgt 2280 ggtggtggcc ccacatatct tgccattcaa tcccaaccac ctggttcagt tatgggtact 2340 cttcggtcaa ctgagcaagg agaaatggtg caggccaagt ttgggctgcc acatactgcc 2400 atcagacaac tagagatata cacaactgct gtgctgcttg caacccttcg tcctccacat 2460 ccacctcgag aagaacaatg gcgcaatgtc atggaggaga tttcaaaaat cagttgccag 2520 aattaccgga gcacagtcta tgaaaaccca gaattcctcg cctacttcca tgaggctact 2580 ccccaggctg agcttggctt tcttaacata ggaagccgcc ccacaagaag aaagagctca 2640 actggtattg gacatcttcg tgccattcca tgggtattcg catggaccca gaccagattt 2700 gttcttcctg cttggcttgg agttggagca ggtttaaagg gtgcttgtga gaagggattt 2760 actgaagact tgaaagcaat gtacaaagaa tggcctttct tccaatctac tattgatctt 2820 atagagatgg tactagggaa ggcagacatt cctatagcca agcactatga tgaagttctt 2880 gtatctgaga gcaggcgaga gcttggagct gagcttagga gtgagctctt aacaacagaa 2940 aagtatgtgt tggtggttag tgggcatgag aaactatctc agaacaaccg cagcctgcgg 3000 aggctaatag agagcaggct gccttatctc aatcctatga atatgttgca ggtggaggtt 3060 ctaaagaggt tgaggcggga cgacgacaac aataagctca gagatgccct gcttattacc 3120 ataaatggga ttgctgctgg aatgaggaac acaggctga 3159 <210> 22 <211> 1052 <212> PRT <213> Ricinus communis <400> 22 Met Thr Asp Thr Thr Asp Asp Ile Ala Glu Glu Ile Ser Phe Gln Ser 1 5 10 15 Phe Asp Asp Asp Cys Lys Leu Leu Gly Asn Leu Leu Asn Asp Val Leu 20 25 30 Gln Arg Glu Val Gly Ser Lys Phe Met Glu Lys Leu Glu Arg Asn Arg 35 40 45 Ile Leu Ala Gln Ser Ala Cys Asn Met Arg Leu Ala Gly Ile Glu Asp 50 55 60 Thr Ala Glu Leu Leu Glu Lys Gln Leu Ala Leu Glu Ile Ser Arg Met 65 70 75 80 Thr Leu Glu Glu Ala Leu Thr Leu Ala Arg Ala Phe Ser His Tyr Leu 85 90 95 Asn Leu Met Gly Ile Ala Glu Thr His His Arg Val Arg Lys Ala Arg 100 105 110 Ser Met Thr His Leu Ser Lys Ser Cys Asp Asp Ile Phe Asn Gln Leu 115 120 125 Leu Gln Ser Gly Ile Ser Ala Glu Glu Leu Tyr Asp Thr Val Cys Lys 130 135 140 Gln Glu Val Glu Ile Val Leu Thr Ala His Pro Thr Gln Ile Asn Arg 145 150 155 160 Arg Thr Leu Gln Tyr Lys His Ile Arg Ile Ala His Leu Leu Asp Tyr 165 170 175 Asn Asp Arg Pro Asp Leu Thr His Glu Asp Arg Glu Met Leu Ile Glu 180 185 190 Asp Leu Val Arg Glu Ile Thr Ser Ile Trp Gln Thr Asp Glu Leu Arg 195 200 205 Arg His Lys Pro Thr Pro Val Asp Glu Ala Arg Ala Gly Leu Asn Ile 210 215 220 Val Glu Gln Ser Leu Trp Lys Ala Leu Pro His Tyr Leu Arg Arg Val 225 230 235 240 Ser Thr Ala Leu Lys Lys His Thr Gly Lys Pro Leu Pro Leu Thr Cys 245 250 255 Thr Pro Ile Arg Phe Gly Ser Trp Met Gly Gly Asp Arg Asp Gly Asn 260 265 270 Pro Asn Val Thr Ala Lys Val Thr Arg Asp Val Ser Leu Leu Ser Arg 275 280 285 Trp Met Ala Val Asp Leu Tyr Ile Arg Glu Val Asp Ser Leu Arg Phe 290 295 300 Glu Leu Ser Met Val Gln Cys Ser Asp Arg Leu Leu Lys Val Ala Asn 305 310 315 320 Asp Ile Leu Ile Glu Glu Thr Ser Ser Glu Asp His His Glu Ser Trp 325 330 335 Asn Gln Pro Ala Ser Arg Ser Gln Thr Lys Phe Pro Arg Lys Ser Leu 340 345 350 Pro Thr Gln Leu Pro Pro Arg Ala Asp Leu Pro Ala Cys Thr Glu Cys 355 360 365 Asn Asp Gly Glu Ser Gln Tyr Pro Lys Leu Glu Leu Pro Gly Thr Asp 370 375 380 Tyr Met Pro Phe Asn Arg Gln Glu Ala Leu Gly Ser Ser Tyr Ser Glu 385 390 395 400 Ser Ser Ser Gln Asp Ile Asn His Gly Leu Pro Lys Thr Thr Gly Asn 405 410 415 Gly Ser Val Ala Asn Ser Ser Gly Ser Pro Arg Ala Ser Phe Ser Ser 420 425 430 Ala Gln Leu Val Ala Gln Arg Lys Leu Phe Ala Glu Ser Lys Ile Gly 435 440 445 Arg Ser Ser Phe Gln Lys Leu Leu Glu Pro Ser Leu Pro Gln Arg Pro 450 455 460 Gly Ile Ala Pro Tyr Arg Ile Val Leu Gly Asn Val Lys Asp Lys Leu 465 470 475 480 Met Arg Thr Arg Arg Arg Leu Glu Leu Leu Leu Glu Asp Leu Pro Cys 485 490 495 Glu Tyr Asp Gln Trp Asp Tyr Tyr Glu Thr Thr Asp Gln Leu Leu Asp 500 505 510 Pro Leu Leu Leu Cys Tyr Glu Ser Leu Gln Ser Cys Gly Ala Gly Val 515 520 525 Leu Ala Asp Gly Arg Leu Ala Asp Leu Ile Arg Arg Val Ala Thr Phe 530 535 540 Gly Met Val Leu Met Lys Leu Asp Leu Arg Gln Glu Ser Gly Arg His 545 550 555 560 Ala Asp Thr Leu Asp Ala Ile Thr Lys Tyr Leu Glu Met Gly Thr Tyr 565 570 575 Ser Glu Trp Asp Glu Glu Lys Lys Leu Glu Phe Leu Thr Arg Glu Leu 580 585 590 Lys Gly Lys Arg Pro Leu Val Pro Pro Thr Ile Glu Val Ala Pro Asp 595 600 605 Val Lys Glu Val Leu Asp Ala Phe Arg Val Ala Ala Glu Leu Gly Ser 610 615 620 Asp Ser Leu Gly Ala Tyr Val Ile Ser Met Ala Ser Asn Ala Ser Asp 625 630 635 640 Val Leu Ala Val Glu Leu Leu Gln Lys Asp Ala Arg Leu Ala Val Ser 645 650 655 Gly Glu Leu Gly Arg Pro Cys Pro Gly Gly Thr Leu Arg Val Val Pro 660 665 670 Leu Phe Glu Thr Val Lys Asp Leu Arg Gly Ala Gly Ser Val Ile Arg 675 680 685 Lys Leu Leu Ser Ile Asp Trp Tyr Arg Glu His Ile Ile Lys Asn His 690 695 700 Asn Gly His Gln Glu Val Met Val Gly Tyr Ser Asp Ser Gly Lys Asp 705 710 715 720 Ala Gly Arg Phe Thr Ala Ala Trp Glu Leu Tyr Lys Ala Gln Glu Asp 725 730 735 Val Val Ala Ala Cys Asn Asp Phe Gly Ile Lys Val Thr Leu Phe His 740 745 750 Gly Arg Gly Gly Ser Ile Gly Arg Gly Gly Gly Pro Thr Tyr Leu Ala 755 760 765 Ile Gln Ser Gln Pro Pro Gly Ser Val Met Gly Thr Leu Arg Ser Thr 770 775 780 Glu Gln Gly Glu Met Val Gln Ala Lys Phe Gly Leu Pro His Thr Ala 785 790 795 800 Ile Arg Gln Leu Glu Ile Tyr Thr Thr Ala Val Leu Leu Ala Thr Leu 805 810 815 Arg Pro Pro His Pro Pro Arg Glu Glu Gln Trp Arg Asn Val Met Glu 820 825 830 Glu Ile Ser Lys Ile Ser Cys Gln Asn Tyr Arg Ser Thr Val Tyr Glu 835 840 845 Asn Pro Glu Phe Leu Ala Tyr Phe His Glu Ala Thr Pro Gln Ala Glu 850 855 860 Leu Gly Phe Leu Asn Ile Gly Ser Arg Pro Thr Arg Arg Lys Ser Ser 865 870 875 880 Thr Gly Ile Gly His Leu Arg Ala Ile Pro Trp Val Phe Ala Trp Thr 885 890 895 Gln Thr Arg Phe Val Leu Pro Ala Trp Leu Gly Val Gly Ala Gly Leu 900 905 910 Lys Gly Ala Cys Glu Lys Gly Phe Thr Glu Asp Leu Lys Ala Met Tyr 915 920 925 Lys Glu Trp Pro Phe Phe Gln Ser Thr Ile Asp Leu Ile Glu Met Val 930 935 940 Leu Gly Lys Ala Asp Ile Pro Ile Ala Lys His Tyr Asp Glu Val Leu 945 950 955 960 Val Ser Glu Ser Arg Arg Glu Leu Gly Ala Glu Leu Arg Ser Glu Leu 965 970 975 Leu Thr Thr Glu Lys Tyr Val Leu Val Val Ser Gly His Glu Lys Leu 980 985 990 Ser Gln Asn Asn Arg Ser Leu Arg Arg Leu Ile Glu Ser Arg Leu Pro 995 1000 1005 Tyr Leu Asn Pro Met Asn Met Leu Gln Val Glu Val Leu Lys Arg 1010 1015 1020 Leu Arg Arg Asp Asp Asp Asn Asn Lys Leu Arg Asp Ala Leu Leu 1025 1030 1035 Ile Thr Ile Asn Gly Ile Ala Ala Gly Met Arg Asn Thr Gly 1040 1045 1050 <210> 23 <211> 3350 <212> DNA <213> Arabidopsis thaliana <400> 23 acacttgtta gatttacttt tcctccgcac tatcagcaga tttttctcat ctgggtctgt 60 ttgtttctgt tgactcaaag tttccgactt tcttattttc tgtctccgat ttcatcgccg 120 aaatctcagt caattttgtc tttagatctt taatttttgg atccctttaa ttattttgtt 180 tggtcttact tcagagcgaa gcaggtgaaa aaatggcgaa tcggaagtta gagaagatgg 240 catcgattga tgttcatctt cgtcaactgg ttcctggcaa agttagtgaa gacgacaagc 300 ttgttgagta tgatgctttg cttctagatc ggtttctcga tatcctccag gatttgcacg 360 gtgaagatct ccgtgaaact gttcaagagc tttatgagca ttctgcagaa tacgaaggga 420 agcatgaacc taagaagcta gaggagctag ggagtgtgct aacgagttta gatccaggag 480 attccattgt tatcgctaaa gctttctctc atatgcttaa cttagccaat ttggctgagg 540 aagtgcagat tgcttatcgc cgtaggatca agaagctgaa gaaaggtgat tttgttgatg 600 agagctctgc tactactgaa tctgatcttg aagaaacttt caagaagctt gttggagatc 660 tgaacaagtc tcctgaagag atctttgatg ctctcaagaa tcagactgtg gatttggttt 720 tgactgctca tcctactcag tctgtgagaa gatcattgct tcagaaacat gggaggataa 780 gagactgtct ggctcaacta tatgctaagg atattactcc tgatgacaag caagagctcg 840 atgaggctct tcagagagag attcaagctg cattccgaac agatgaaatc aaaagaacac 900 cacctactcc tcaagatgag atgagagcgg gaatgagtta tttccatgaa actatctgga 960 aaggtgttcc taagtttctg cgccgtgttg acacggcttt gaaaaacata gggatcgaag 1020 aacgtgttcc atataatgct ccattgattc agttctcttc ttggatgggt ggtgatcgtg 1080 acggtaaccc aagggttaca cctgaagtca ccagagatgt ttgcttgtta gctagaatga 1140 tggctgctac tatgtacttt aaccaaatcg aagatcttat gtttgagatg tctatgtggc 1200 gttgcaatga cgagctgcgt gcgcgagctg atgaagttca tgcaaattcg aggaaagatg 1260 ctgcaaaaca ttacatagaa ttctggaagt caattcctac aactgagcca taccgtgtga 1320 ttcttggcga tgtaagggac aagctttatc acacacgtga acgcgctcat caactgctca 1380 gcaatggaca ctctgatgtc cctgtagagg ctactttcat taacttggaa cagttcttgg 1440 aacctcttga gctctgttac cgatctctgt gttcatgtgg tgatcgtcca atagcagatg 1500 gaagccttct tgatttcttg aggcaagtct caacctttgg gctctctctt gtgagacttg 1560 acataaggca agaatctgac cgccacactg atgtattgga tgctatcacc acgcatttag 1620 atatcggatc ctacagagag tggtctgaag aacgccgcca agaatggctt ttatctgagc 1680 taagtggcaa acgtccgctt ttcggttctg atcttcctaa aaccgaagaa atagctgatg 1740 ttctggacac gtttcatgtc atagccgagc taccagcaga tagctttggt gcttacatta 1800 tctctatggc aactgcacct tctgatgtat tagctgttga gcttttacag cgtgaatgcc 1860 gagtgaaaca gcctttgaga gttgttccgc tctttgagaa gctagcagat ctggaagcag 1920 ctcctgctgc agttgctagg ctcttttctg ttgattggta caaaaaccga attaacggta 1980 agcaagaggt tatgattggt tattcggatt caggaaaaga tgctggacgg ttatctgctg 2040 cttggcagtt atacaaagct caagaagagc ttgtgaaggt tgctaaagag tacggtgtga 2100 agctaacaat gtttcacggt cgtggtggca cggtcggaag aggaggtgga ccaacccatc 2160 ttgctatatt gtctcagcct ccggatacta ttaacggttc cctccgtgtc acagttcaag 2220 gtgaagtcat cgagcaatcg tttggtgaag agcacttatg ctttagaaca cttcagcgtt 2280 tcacagctgc tacactcgag cacggtatgc gtcctccaat ttcgcctaaa ccagaatggc 2340 gcgctttgct ggatgaaatg gcggttgttg caaccgagga gtatcgctca gttgtgttcc 2400 aagaacctcg gtttgtcgag tacttccgcc tcgctacacc ggaactggag tatggacgta 2460 tgaatatcgg aagcagacct tcgaagcgta aaccaagcgg tggcattgaa tctctccgtg 2520 caattccatg gatcttcgct tggactcaaa caagattcca tcttcctgta tggcttggat 2580 tcggatcagc aattagacat gtgatcgaaa aagacgtcag gaacctccat atgctccaag 2640 atatgtacca acactggcct ttctttagag tcaccattga tctaatcgaa atggtgttcg 2700 ctaaaggaga tcctggtatt gctgctttgt acgataagct tcttgtttca gaggaactct 2760 ggccttttgg tgagaaactc agagctaact tcgaagaaac caagaaactc atcctccaga 2820 ccgctggaca caaagatctt cttgaaggtg atccttactt gaaacagaga ctgagacttc 2880 gtgattctta cattacaact ctcaatgtct gtcaagctta cacattgaag agaatccgtg 2940 atccgagtta ccatgtgact ctgcgaccac acatttctaa ggagatagcg gaatcgagca 3000 aaccagcaaa agaactcatc gagcttaacc cgactagcga atacgcgcca ggacttgaag 3060 atacactcat cttgacgatg aagggtattg ctgctggtct acaaaacacc ggttaagcta 3120 caaagagatg gttaaacaaa ctttgaatct ctctttctct ctcaagtctc tccttttttt 3180 aactacagat ttggaaaata aggttggatt ctggtttatt ttatgtatcc accgtcaaaa 3240 tgttgatttt cgtgtacgag tacttcgaga tcattgaaca catgctctgt ttttttctca 3300 agtttaataa aacagaacaa gagaatcttt tcttgtttat tttcttatct 3350 <210> 24 <211> 967 <212> PRT <213> Arabidopsis thaliana <400> 24 Met Ala Asn Arg Lys Leu Glu Lys Met Ala Ser Ile Asp Val His Leu 1 5 10 15 Arg Gln Leu Val Pro Gly Lys Val Ser Glu Asp Asp Lys Leu Val Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Leu Arg Glu Thr Val Gln Glu Leu Tyr Glu His Ser 50 55 60 Ala Glu Tyr Glu Gly Lys His Glu Pro Lys Lys Leu Glu Glu Leu Gly 65 70 75 80 Ser Val Leu Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Ile Ala Lys 85 90 95 Ala Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala Tyr Arg Arg Arg Ile Lys Lys Leu Lys Lys Gly Asp Phe Val 115 120 125 Asp Glu Ser Ser Ala Thr Thr Glu Ser Asp Leu Glu Glu Thr Phe Lys 130 135 140 Lys Leu Val Gly Asp Leu Asn Lys Ser Pro Glu Glu Ile Phe Asp Ala 145 150 155 160 Leu Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln 165 170 175 Ser Val Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile Arg Asp Cys 180 185 190 Leu Ala Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu 195 200 205 Leu Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp 210 215 220 Glu Ile Lys Arg Thr Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly 225 230 235 240 Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu 245 250 255 Arg Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Glu Glu Arg Val 260 265 270 Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp 275 280 285 Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys 290 295 300 Leu Leu Ala Arg Met Met Ala Ala Thr Met Tyr Phe Asn Gln Ile Glu 305 310 315 320 Asp Leu Met Phe Glu Met Ser Met Trp Arg Cys Asn Asp Glu Leu Arg 325 330 335 Ala Arg Ala Asp Glu Val His Ala Asn Ser Arg Lys Asp Ala Ala Lys 340 345 350 His Tyr Ile Glu Phe Trp Lys Ser Ile Pro Thr Thr Glu Pro Tyr Arg 355 360 365 Val Ile Leu Gly Asp Val Arg Asp Lys Leu Tyr His Thr Arg Glu Arg 370 375 380 Ala His Gln Leu Leu Ser Asn Gly His Ser Asp Val Pro Val Glu Ala 385 390 395 400 Thr Phe Ile Asn Leu Glu Gln Phe Leu Glu Pro Leu Glu Leu Cys Tyr 405 410 415 Arg Ser Leu Cys Ser Cys Gly Asp Arg Pro Ile Ala Asp Gly Ser Leu 420 425 430 Leu Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg 435 440 445 Leu Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Leu Asp Ala 450 455 460 Ile Thr Thr His Leu Asp Ile Gly Ser Tyr Arg Glu Trp Ser Glu Glu 465 470 475 480 Arg Arg Gln Glu Trp Leu Leu Ser Glu Leu Ser Gly Lys Arg Pro Leu 485 490 495 Phe Gly Ser Asp Leu Pro Lys Thr Glu Glu Ile Ala Asp Val Leu Asp 500 505 510 Thr Phe His Val Ile Ala Glu Leu Pro Ala Asp Ser Phe Gly Ala Tyr 515 520 525 Ile Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu 530 535 540 Leu Gln Arg Glu Cys Arg Val Lys Gln Pro Leu Arg Val Val Pro Leu 545 550 555 560 Phe Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro Ala Ala Val Ala Arg 565 570 575 Leu Phe Ser Val Asp Trp Tyr Lys Asn Arg Ile Asn Gly Lys Gln Glu 580 585 590 Val Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ser 595 600 605 Ala Ala Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Val Lys Val Ala 610 615 620 Lys Glu Tyr Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr 625 630 635 640 Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro 645 650 655 Pro Asp Thr Ile Asn Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val 660 665 670 Ile Glu Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln 675 680 685 Arg Phe Thr Ala Ala Thr Leu Glu His Gly Met Arg Pro Pro Ile Ser 690 695 700 Pro Lys Pro Glu Trp Arg Ala Leu Leu Asp Glu Met Ala Val Val Ala 705 710 715 720 Thr Glu Glu Tyr Arg Ser Val Val Phe Gln Glu Pro Arg Phe Val Glu 725 730 735 Tyr Phe Arg Leu Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn Ile 740 745 750 Gly Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu Ser Leu 755 760 765 Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu 770 775 780 Pro Val Trp Leu Gly Phe Gly Ser Ala Ile Arg His Val Ile Glu Lys 785 790 795 800 Asp Val Arg Asn Leu His Met Leu Gln Asp Met Tyr Gln His Trp Pro 805 810 815 Phe Phe Arg Val Thr Ile Asp Leu Ile Glu Met Val Phe Ala Lys Gly 820 825 830 Asp Pro Gly Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Glu Glu 835 840 845 Leu Trp Pro Phe Gly Glu Lys Leu Arg Ala Asn Phe Glu Glu Thr Lys 850 855 860 Lys Leu Ile Leu Gln Thr Ala Gly His Lys Asp Leu Leu Glu Gly Asp 865 870 875 880 Pro Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr Thr 885 890 895 Leu Asn Val Cys Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Ser 900 905 910 Tyr His Val Thr Leu Arg Pro His Ile Ser Lys Glu Ile Ala Glu Ser 915 920 925 Ser Lys Pro Ala Lys Glu Leu Ile Glu Leu Asn Pro Thr Ser Glu Tyr 930 935 940 Ala Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala 945 950 955 960 Ala Gly Leu Gln Asn Thr Gly 965 <210> 25 <211> 3309 <212> DNA <213> Arabidopsis thaliana <400> 25 gtctcgttta aatttttata aactccataa ttttatctta aagtgaatct tttttgtttt 60 ttttgttcca gctttatcgg atatatttcc ttgattttct ccgattgtgg tcaatctgga 120 aaattattga gaatctctcc ctcacttaac caaaagcgtt tttaatcaga tagagagaga 180 ggaaaaagca tcaaccaaac catggctgcg agaaatttgg agaagatggc ttctattgat 240 gctcagctca ggcttcttgc tcctggcaag gtttctgaag acgacaagct tatcgagtac 300 gatgctctgt tactggatcg atttctcgat attcttcagg atttgcatgg cgaggatgtc 360 agagaattcg ttcaagaatg ctacgaagtt gcagctgatt acgatggaaa ccgcaacact 420 gagaagcttg aggagcttgg aaatatgctg acgagtttgg atccagggga ttcaattgtt 480 gtcactaaat cattctccaa catgcttagc ttggctaatc tggctgagga agtccagatt 540 gcttaccggc gtaggattaa gaaactcaag aaaggtgatt tcgctgatga ggcctctgca 600 acaacggaat ctgacattga agagactctc aagaggcttt tgcagcttaa caagactcct 660 gaagaggtct ttgatgctct taagaatcag actgttgact tggttttaac tgctcatccc 720 actcaatctg ttcgtcggtc tttgctccaa aagtttggaa ggattcgtga ttgtttgacg 780 cagttatatg caaaggacat tactcctgat gacaaacaag aactcgatga agctctgcaa 840 cgagagattc aagctgcttt tcgcacagat gaaatccgaa gaactcctcc tacaccgcaa 900 gatgaaatga gagcagggat gagctacttc catgagacaa tctggaaagg agttccaaag 960 ttcttaagac gtgttgacac agctttaaag aacattggaa tcaacgagcg tgttccttac 1020 aatgcgcctc tcattcagtt ctcttcttgg atgggcggag accgtgatgg aaacccgcga 1080 gtaactcctg aagttacaag agatgtatgc ttattagcta gaatgatggc tgctaatctc 1140 tacttctccc agatagaaga tcttatgttt gagatgtcta tgtggcgttg caatgaggaa 1200 cttcgggttc gtgcagaacg tcaaagatgt gcgaagaggg atgcaaaaca ctatatagaa 1260 ttctggaaac aaatccctgc gaatgagcca taccgagcta ttcttggaga tgtgagggac 1320 aagctgtaca acacacgtga gcgtgcacgt cagttattgt caagcggagt ttcggacgtt 1380 cccgaagacg cggttttcac aagtgtggat cagtttttgg agccacttga gctttgttac 1440 aggtcgctct gtgattgcgg tgacagacct attgctgatg gaagcctgct tgatttctta 1500 cgccaagtgt caacatttgg ccttgctctt gtgaaacttg atatccgtca agaatctgaa 1560 agacactctg atgtcttgga tgccatcacg acgcacttag gtattggttc ttacaaagaa 1620 tggtcggagg ataaaagaca ggaatggctg ttatctgagc taagcgggaa acgccctctc 1680 tttggaccgg atcttcccaa aaccgaagag gttgcagatg tgttggacac tttcaaagtc 1740 atttctgagc ttccttcgga tagttttggt gcttatatta tctcaatggc cactgctcca 1800 tcagacgtgc tcgctgttga gcttttgcaa cgcgaatgcg ggatcactga tcctctgaga 1860 gttgtcccgt tgttcgagaa gctagcggat ttagaatccg cacctgctgc agttgcccgt 1920 ctcttctcca tagaatggta cagaaacagg atcaatggaa agcaagaagt catgatcggg 1980 tactctgact cgggcaaaga tgctggtcgt ttatcagcgg cttggcagtt atacaagact 2040 caagaagagc tcgtgaaggt ggcaaaagaa tacggagtca agctgacaat gttccacgga 2100 agaggtggga ccgttggacg aggaggtgga cctacccatc ttgctatttt gtctcagcct 2160 ccggatacca ttcatgggca attgagggta acggttcaag gtgaagttat tgaacagtct 2220 ttcggagaag agcacttatg ctttaggact cttcagcgtt tcacagctgc aacacttgag 2280 catggaatgc atccaccggt ttcccctaag cctgagtggc gtgtcctcat ggatgaaatg 2340 gctataattg ccactgaaga ataccgttct gttgtcttca aggagccccg ttttgttgag 2400 tacttccgtc tggcaacacc agagctcgag tatggaagga tgaacatagg aagccgacca 2460 tcaaaacgta aaccaagcgg aggaatcgag tcgctgcgtg caatcccgtg gatctttgcg 2520 tggactcaga cgaggttcac ttacccgtgt ggcttggctt tggaggagca ttcaaacgcg 2580 tgatacagaa ggacagtaag aatctcaaca tgctcaaaga gatgtacaac caatggccat 2640 tcttccgtgt cacaattgat ctagtcgaaa tggttttcgc caaaggagat cccggaattg 2700 cggctctgta tgaccgcctc ctcgtctctg aagaacttca accattcggt gaacaacttc 2760 gagttaacta ccaagagacc agacgcctcc tcctccaggt tgcaggtcac aaagacattt 2820 tagaaggtga cccttacttg aggcaaaggc tgcagcttcg tgacccatac atcacgacat 2880 tgaacgtgtg tcaagcctat acactcaagc agatccgtga cccaagcttc cacgtcaaag 2940 tccggccaca tctctctaag gactacatgg agtctagtcc agcggctgag ctcgtgaaac 3000 tgaatccaaa gagtgaatac gcaccgggac ttgaagatac ggttatcctc accatgaagg 3060 gtatcgctgc tggtatgcaa aacaccggtt aaggcagttt aaaacgttct tgtaccattc 3120 cctaaatcta cgctatgtaa tgtattatgt tctatgatgt gatgaaatct ctccaactcc 3180 tatcccgtac gctttttaat gagtatgata atttcttgtg ttattctatt gttgttatgt 3240 taccatatct aggaaatata tttctgaaag aaacaagaaa agaaatcttt cttttcgttc 3300 taagatgtt 3309 <210> 26 <211> 793 <212> PRT <213> Arabidopsis thaliana <400> 26 Met Ala Ala Arg Asn Leu Glu Lys Met Ala Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Leu Leu Ala Pro Gly Lys Val Ser Glu Asp Asp Lys Leu Ile Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Val Arg Glu Phe Val Gln Glu Cys Tyr Glu Val Ala 50 55 60 Ala Asp Tyr Asp Gly Asn Arg Asn Thr Glu Lys Leu Glu Glu Leu Gly 65 70 75 80 Asn Met Leu Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Val Thr Lys 85 90 95 Ser Phe Ser Asn Met Leu Ser Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala Tyr Arg Arg Arg Ile Lys Lys Leu Lys Lys Gly Asp Phe Ala 115 120 125 Asp Glu Ala Ser Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Leu Lys 130 135 140 Arg Leu Leu Gln Leu Asn Lys Thr Pro Glu Glu Val Phe Asp Ala Leu 145 150 155 160 Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser 165 170 175 Val Arg Arg Ser Leu Leu Gln Lys Phe Gly Arg Ile Arg Asp Cys Leu 180 185 190 Thr Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu Leu 195 200 205 Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu 210 215 220 Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met 225 230 235 240 Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg 245 250 255 Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn Glu Arg Val Pro 260 265 270 Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg 275 280 285 Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys Leu 290 295 300 Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Phe Ser Gln Ile Glu Asp 305 310 315 320 Leu Met Phe Glu Met Ser Met Trp Arg Cys Asn Glu Glu Leu Arg Val 325 330 335 Arg Ala Glu Arg Gln Arg Cys Ala Lys Arg Asp Ala Lys His Tyr Ile 340 345 350 Glu Phe Trp Lys Gln Ile Pro Ala Asn Glu Pro Tyr Arg Ala Ile Leu 355 360 365 Gly Asp Val Arg Asp Lys Leu Tyr Asn Thr Arg Glu Arg Ala Arg Gln 370 375 380 Leu Leu Ser Ser Gly Val Ser Asp Val Pro Glu Asp Ala Val Phe Thr 385 390 395 400 Ser Val Asp Gln Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg Ser Leu 405 410 415 Cys Asp Cys Gly Asp Arg Pro Ile Ala Asp Gly Ser Leu Leu Asp Phe 420 425 430 Leu Arg Gln Val Ser Thr Phe Gly Leu Ala Leu Val Lys Leu Asp Ile 435 440 445 Arg Gln Glu Ser Glu Arg His Ser Asp Val Leu Asp Ala Ile Thr Thr 450 455 460 His Leu Gly Ile Gly Ser Tyr Lys Glu Trp Ser Glu Asp Lys Arg Gln 465 470 475 480 Glu Trp Leu Leu Ser Glu Leu Ser Gly Lys Arg Pro Leu Phe Gly Pro 485 490 495 Asp Leu Pro Lys Thr Glu Glu Val Ala Asp Val Leu Asp Thr Phe Lys 500 505 510 Val Ile Ser Glu Leu Pro Ser Asp Ser Phe Gly Ala Tyr Ile Ile Ser 515 520 525 Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu Leu Gln Arg 530 535 540 Glu Cys Gly Ile Thr Asp Pro Leu Arg Val Val Pro Leu Phe Glu Lys 545 550 555 560 Leu Ala Asp Leu Glu Ser Ala Pro Ala Ala Val Ala Arg Leu Phe Ser 565 570 575 Ile Glu Trp Tyr Arg Asn Arg Ile Asn Gly Lys Gln Glu Val Met Ile 580 585 590 Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ser Ala Ala Trp 595 600 605 Gln Leu Tyr Lys Thr Gln Glu Glu Leu Val Lys Val Ala Lys Glu Tyr 610 615 620 Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr Val Gly Arg 625 630 635 640 Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro Pro Asp Thr 645 650 655 Ile His Gly Gln Leu Arg Val Thr Val Gln Gly Glu Val Ile Glu Gln 660 665 670 Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln Arg Phe Thr 675 680 685 Ala Ala Thr Leu Glu His Gly Met His Pro Pro Val Ser Pro Lys Pro 690 695 700 Glu Trp Arg Val Leu Met Asp Glu Met Ala Ile Ile Ala Thr Glu Glu 705 710 715 720 Tyr Arg Ser Val Val Phe Lys Glu Pro Arg Phe Val Glu Tyr Phe Arg 725 730 735 Leu Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn Ile Gly Ser Arg 740 745 750 Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu Ser Leu Arg Ala Ile 755 760 765 Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe Thr Tyr Pro Cys Gly 770 775 780 Leu Ala Leu Glu Glu His Ser Asn Ala 785 790 <210> 27 <211> 3231 <212> DNA <213> Arabidopsis thaliana <400> 27 ccacgcgtcc gaatccgcag agatttcttc ttttcagaag aagtaagagg gtggcgaaga 60 agatttgatt gatcggcgat aatggcgggt cggaacatag agaagatggc atctattgat 120 gctcagcttc ggcaactcgt tcctgctaaa gtcagtgaag acgataagct tgttgagtac 180 gatgctcttc tccttgatcg ctttctcgac attctccagg atttacacgg cgaggatctc 240 cgtgaaacgg ttcaagagtt atacgagctt tctgctgagt atgaagggaa gcgtgagcct 300 agcaagcttg aggagctagg gagtgtccta acgagtttgg atcctggtga ctcaattgtt 360 atctccaagg ctttctctca catgcttaac ttagccaatt tggctgagga ggtgcagatt 420 gctcaccgtc gcaggatcaa gaagctgaag aaaggtgatt tcgttgatga gagttctgca 480 actactgaat ccgatattga agagactttt aagaggctcg tttcggatct tggtaagtct 540 cctgaagaga tctttgatgc cttgaagaat cagactgtgg atctggtttt gactgctcat 600 cctactcagt ctgtgcgtag atcattgctt cagaagcatg ggaggataag ggactgtctt 660 gctcaactct atgcaaagga cattactcct gatgacaagc aggagctaga tgagtctctg 720 caaagagaga ttcaagctgc attccgaaca gatgagatta gaagaacacc tccaacccca 780 caagatgaaa tgagagctgg aatgagttat ttccacgaga caatctggaa aggtgtcccc 840 aagttcttgc gccgtgtgga cacagctctg aaaaacattg ggattgatga acgtgttcct 900 tacaatgccc cattgattca attctcttcg tggatgggcg gtgatcgtga tggtaatccg 960 agggtcacac ctgaggtcac tagagatgtg tgcttgttgg ctagaatgat ggctgccaat 1020 ctctactata accaaatcga gaatctgatg tttgagttat ctatgtggcg ttgcactgat 1080 gaattccgtg tgcgggcgga tgaactgcac aggaactcaa ggaaagatgc tgcaaaacat 1140 tacatagaat tctggaagac aattcctcca actgagccat accgtgtgat tcttggtgat 1200 gtgagggata agctgtatca cacacgtgag cgttcccgcc aattgctgag taatggaatc 1260 tcggatattc ctgaagaagc taccttcact aatgtggaac agttcttgga gcctcttgag 1320 ctctgttacc gatcactatg ttcatgtggt gacagcccga tagctgatgg aagccttctt 1380 gatttcttga ggcaagtctc tacctttgga ctctcccttg tgagacttga catcaggcaa 1440 gagtctgaac gccacacaga tgtcttggat gctatcacca agcacttgga catcggttcc 1500 tcctatagag actggtctga agaaggccga caggaatggc ttcttgctga actaagcggc 1560 aaacgtccac ttttcggacc tgatcttccc aaaaccgaag aaatttctga tgtcctggac 1620 acattcaaag tcatatctga gctgccttca gattgttttg gagcttatat tatctctatg 1680 gcaacttcac ctagtgatgt gcttgcggtt gagcttttac agcgcgaatg ccatgtgaaa 1740 aatccactta gagttgttcc actctttgag aagctagctg atcttgaagc agctcctgcc 1800 gctgttgcaa gactcttttc tatagactgg tacaaaaacc gtattaacgg taaacaagag 1860 gttatgattg gttactcaga ttcagggaaa gatgcagggc gtctctcagc tgcttgggag 1920 ctatacaaag ctcaagaaga gcttgtgaag gttgctaaga aatatggagt gaagctaact 1980 atgttccatg gccgtggtgg cacagtcgga agaggaggtg gtcctactca tcttgctata 2040 ttgtctcagc caccagatac agttaatggc tctcttcgag tcacggttca gggtgaagtc 2100 attgagcaat catttgggga ggcacactta tgctttagaa cacttcaacg tttcacagca 2160 gctactctag agcacggaat gaaccctccg atttcaccaa aacccgagtg gcgtgctttg 2220 cttgatgaaa tggcggttgt tgcaactgag gaataccgat ctgtcgtttt ccaagaacct 2280 cgattcgtcg agtatttccg cctcgctact ccggagctgg agtatggacg tatgaatatt 2340 ggaagtagac cttcaaagcg aaaaccaagc ggtgggatcg aatctctccg tgcaatccca 2400 tggatctttg cttggacgca aacaagattc catcttcctg tatggttagg tttcggagca 2460 gcatttaggt atgcgatcaa gaaggatgtg agaaaccttc acatgctgca agatatgtat 2520 aaacaatggc cctttttccg agtcaccatc gatctaattg aaatggtgtt cgccaaggga 2580 gaccccggga tcgctgcttt gtacgacaaa cttcttgtct cagaagattt atgggctttt 2640 ggagagaaac tcagagccaa ctttgatgaa accaagaacc tcgtcctcca gactgctgga 2700 cataaagacc ttcttgaagg agatccttac ttgaaacaga gactaaggct acgtgactct 2760 tacattacga ccctcaacgt ttgccaagcc tacacattga agaggatccg tgatgcaaac 2820 tacaatgtga ctctgcgacc acacatttct aaagagatca tgcaatcaag caaatcagca 2880 caagagctcg tcaagcttaa ccccacgagt gaatacgcgc ctggacttga ggacacactt 2940 atcttaacca tgaagggtat tgctgcagga ttgcaaaaca ccggttaagt gagtcagtga 3000 aagaaaacaa aacttcgaat ctctcttttt tatctaccct ttttaataat ctcttttttt 3060 ctagaatcca aaataattac ggttggatta cagtttactt tatgtatcca ccgttgaaat 3120 cttaatcttc cattgtatca aacgtcactg actctgtttc tggaagtgta aacaagaaca 3180 gagacagtga atcttaatgt tatcttcttt gtctaaaaaa aaaaaaaaaa a 3231 <210> 28 <211> 968 <212> PRT <213> Arabidopsis thaliana <400> 28 Met Ala Gly Arg Asn Ile Glu Lys Met Ala Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Gln Leu Val Pro Ala Lys Val Ser Glu Asp Asp Lys Leu Val Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Leu Arg Glu Thr Val Gln Glu Leu Tyr Glu Leu Ser 50 55 60 Ala Glu Tyr Glu Gly Lys Arg Glu Pro Ser Lys Leu Glu Glu Leu Gly 65 70 75 80 Ser Val Leu Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Ile Ser Lys 85 90 95 Ala Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala His Arg Arg Arg Ile Lys Lys Leu Lys Lys Gly Asp Phe Val 115 120 125 Asp Glu Ser Ser Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Phe Lys 130 135 140 Arg Leu Val Ser Asp Leu Gly Lys Ser Pro Glu Glu Ile Phe Asp Ala 145 150 155 160 Leu Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln 165 170 175 Ser Val Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile Arg Asp Cys 180 185 190 Leu Ala Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu 195 200 205 Leu Asp Glu Ser Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp 210 215 220 Glu Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly 225 230 235 240 Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu 245 250 255 Arg Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asp Glu Arg Val 260 265 270 Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp 275 280 285 Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys 290 295 300 Leu Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Tyr Asn Gln Ile Glu 305 310 315 320 Asn Leu Met Phe Glu Leu Ser Met Trp Arg Cys Thr Asp Glu Phe Arg 325 330 335 Val Arg Ala Asp Glu Leu His Arg Asn Ser Arg Lys Asp Ala Ala Lys 340 345 350 His Tyr Ile Glu Phe Trp Lys Thr Ile Pro Pro Thr Glu Pro Tyr Arg 355 360 365 Val Ile Leu Gly Asp Val Arg Asp Lys Leu Tyr His Thr Arg Glu Arg 370 375 380 Ser Arg Gln Leu Leu Ser Asn Gly Ile Ser Asp Ile Pro Glu Glu Ala 385 390 395 400 Thr Phe Thr Asn Val Glu Gln Phe Leu Glu Pro Leu Glu Leu Cys Tyr 405 410 415 Arg Ser Leu Cys Ser Cys Gly Asp Ser Pro Ile Ala Asp Gly Ser Leu 420 425 430 Leu Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg 435 440 445 Leu Asp Ile Arg Gln Glu Ser Glu Arg His Thr Asp Val Leu Asp Ala 450 455 460 Ile Thr Lys His Leu Asp Ile Gly Ser Ser Tyr Arg Asp Trp Ser Glu 465 470 475 480 Glu Gly Arg Gln Glu Trp Leu Leu Ala Glu Leu Ser Gly Lys Arg Pro 485 490 495 Leu Phe Gly Pro Asp Leu Pro Lys Thr Glu Glu Ile Ser Asp Val Leu 500 505 510 Asp Thr Phe Lys Val Ile Ser Glu Leu Pro Ser Asp Cys Phe Gly Ala 515 520 525 Tyr Ile Ile Ser Met Ala Thr Ser Pro Ser Asp Val Leu Ala Val Glu 530 535 540 Leu Leu Gln Arg Glu Cys His Val Lys Asn Pro Leu Arg Val Val Pro 545 550 555 560 Leu Phe Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro Ala Ala Val Ala 565 570 575 Arg Leu Phe Ser Ile Asp Trp Tyr Lys Asn Arg Ile Asn Gly Lys Gln 580 585 590 Glu Val Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu 595 600 605 Ser Ala Ala Trp Glu Leu Tyr Lys Ala Gln Glu Glu Leu Val Lys Val 610 615 620 Ala Lys Lys Tyr Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly 625 630 635 640 Thr Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln 645 650 655 Pro Pro Asp Thr Val Asn Gly Ser Leu Arg Val Thr Val Gln Gly Glu 660 665 670 Val Ile Glu Gln Ser Phe Gly Glu Ala His Leu Cys Phe Arg Thr Leu 675 680 685 Gln Arg Phe Thr Ala Ala Thr Leu Glu His Gly Met Asn Pro Pro Ile 690 695 700 Ser Pro Lys Pro Glu Trp Arg Ala Leu Leu Asp Glu Met Ala Val Val 705 710 715 720 Ala Thr Glu Glu Tyr Arg Ser Val Val Phe Gln Glu Pro Arg Phe Val 725 730 735 Glu Tyr Phe Arg Leu Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn 740 745 750 Ile Gly Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu Ser 755 760 765 Leu Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His 770 775 780 Leu Pro Val Trp Leu Gly Phe Gly Ala Ala Phe Arg Tyr Ala Ile Lys 785 790 795 800 Lys Asp Val Arg Asn Leu His Met Leu Gln Asp Met Tyr Lys Gln Trp 805 810 815 Pro Phe Phe Arg Val Thr Ile Asp Leu Ile Glu Met Val Phe Ala Lys 820 825 830 Gly Asp Pro Gly Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Glu 835 840 845 Asp Leu Trp Ala Phe Gly Glu Lys Leu Arg Ala Asn Phe Asp Glu Thr 850 855 860 Lys Asn Leu Val Leu Gln Thr Ala Gly His Lys Asp Leu Leu Glu Gly 865 870 875 880 Asp Pro Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr 885 890 895 Thr Leu Asn Val Cys Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Ala 900 905 910 Asn Tyr Asn Val Thr Leu Arg Pro His Ile Ser Lys Glu Ile Met Gln 915 920 925 Ser Ser Lys Ser Ala Gln Glu Leu Val Lys Leu Asn Pro Thr Ser Glu 930 935 940 Tyr Ala Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile 945 950 955 960 Ala Ala Gly Leu Gln Asn Thr Gly 965 <210> 29 <211> 3102 <212> DNA <213> Arabidopsis thaliana <400> 29 acaatgacgg acacaacaga cgatatcgca gaggaaatct cattccaaag cttcgaagat 60 gactgcaaat tgctcggtag tctcttccat gatgtgttac aaagggaagt tggcaaccca 120 ttcatggaaa aagtcgaacg cattcggatt cttgctcaga gtgcgttaaa tttgcgtatg 180 gctggtattg aggataccgc aaaccttttg gagaagcaat tgactagtga aatatccaaa 240 atgccactag aagaagcctt aacgttggct cgtacattca ctcattctct taacttaatg 300 ggcattgcag acactcatca cagaatgcac aaagtccata acgttacaca acttgcaaga 360 tcttgtgatg atatattcag ccagctattg caaagtggaa tctctccaga cgaactttat 420 aaaactgttt gcaaacagga ggtcgaaatt gttcttactg ctcatcctac ccaaataaat 480 cgaagaacct tgcagtacaa gcatattaga attgctcatc ttctagaata taacactaga 540 tcagatctaa gcgttgaaga tcgcgaaacg ctcattgaag atttggttag agagattact 600 tcactgtggc aaactgatga gcttagacgt cagaaaccta ctccagttga tgaagctaga 660 gctggtctaa acatagtgga gcaatccctt tggaaagcag taccacaata cctgcgtcgt 720 gtcagcaatt ccttgaagaa gtttacaggg aagccacttc cactaacatg cactcctatg 780 aaatttggtt cttggatggg aggtgataga gatggaaatc caaatgtcac ggcaaaggtc 840 acgaaagaag tatctctctt gtctagatgg atggctattg atttgtacat aagagaggtt 900 gatagcttaa gatttgaatt atctacggat cgatgcagtg ataggttttc aagattagct 960 gataaaattc ttgaaaagga ttatgataga ggaaaatcaa atttccaaaa gcaacaaagt 1020 tcatcatgct tgccaacaca acttccagct agagctcacc ttcctgcttg cattgacttt 1080 ggtgaatcac gacataccaa atttgaaatt gcgacgacag attatatgcc acccaatctc 1140 cagaagcaga atgaacaaga cttttcggaa agcgactggg agaaaattga caatggttcg 1200 cggtccggtc ttacttctcg aggttctttc tcatctactt ctcaacttct tctccagaga 1260 aaactatttg aggaatctca ggttgggaag actagtttcc aaaagctact agaaccacct 1320 ccacttaaac gagctggaag tgctccttat cgtattgttc ttggagaagt aaaagaaaag 1380 cttgtgaaga caagaagact tcttgaactt cttattgagg gtcttccttg tgagtatgac 1440 cctaaaaact cctatgaaac atcagatcag cttcttgaac cattgctcct ctgttacgaa 1500 tctctgcaat catcgggtgc tagggtacta gctgatggac gacttgctga tctgattcgt 1560 agagtttcta cctttggaat ggttttggtg aaactcgact tacgccagga agctgcaaga 1620 cattctgaag ctttggatgc aattacaaca tacttggata tgggtactta tagtgaatgg 1680 gatgaagaga agaaattaga atttttgaca agagaactaa aagggaaacg acctcttgtt 1740 cctcaatgta ttaaggttgg tcctgacgtc aaagaagtat tggacacatt ccgagtcgct 1800 gctgaacttg gaagtgaatc acttggcgct tacgttattt ctatggcttc aaatgcaagt 1860 gatgtcctcg ctgtggaact tcttcaaaaa gatgctcgac ttgctttaac tagcgaacat 1920 ggaaaaccat gtcctggtgg aacgctacga gtggtacctc tttttgaaac ggtgaatgat 1980 ttaagagccg ctggtccttc gataaggaaa ttgctctcaa tcgattggta tagggaacac 2040 atccaaaaga accacaacgg tcaccaagag gtgatggttg gatactctga ttctggaaaa 2100 gatgctggac gttttactgc agcatgggaa ctctacaaag ctcaagaaaa tgttgttgct 2160 gcttgtaatg aatttggaat caaaataaca ttatttcatg gacgaggagg aagcattggt 2220 cgtggtggtg gtccaaccta tctcgctatt cagtcccaac caccaggctc tgtaatgggc 2280 tctttgcgtt caactgagca aggtgagatg gttcaagcta agtttgggat accacaaacg 2340 gctgttaggc aactagaggt atacacaacc gcggttctac tcgctacctt aaagcctcct 2400 cagccacctc gagaggaaaa atggcgaaac ctaatggaag aaatctctgg aatcagttgc 2460 caacactata gaagcacagt gtatgaaaac ccagagtttc tatcttattt tcatgaggca 2520 acaccgcaag cagaacttgg tttcctcaat ataggaagcc gaccaacacg aagaaagagc 2580 tctagtggaa taggacatct ccgagctatc ccttgggtct ttgcttggac tcaaacaagg 2640 tttgttcttc cagcttggct tggtgtaggg gctggtttaa agggagtttc tgagaagggt 2700 catgcggatg atcttaaaga gatgtacaaa gaatggccat tttttcagtc cacccttgaa 2760 cttatagaga tggtgttagc taaagcagac attccaatga ccaaacacta cgacgaacaa 2820 cttgtgtctg agaaaagaag aggacttggc actgagctaa gaaaagaact aatgactact 2880 gagaagtacg ttcttgtgat aagtggtcac gagaaactct tgcaggacaa taagagcttg 2940 aagaaactca ttgatagtag acttccgtat ctcaacgcaa tgaacatgtt acaagttgaa 3000 attcttaaga ggctaagacg tgatgaagat aacaataagc taagagatgc tttgcttatc 3060 acaatcaatg gtattgctgc aggaatgaga aataccggtt aa 3102 <210> 30 <211> 1032 <212> PRT <213> Arabidopsis thaliana <400> 30 Met Thr Asp Thr Thr Asp Asp Ile Ala Glu Glu Ile Ser Phe Gln Ser 1 5 10 15 Phe Glu Asp Asp Cys Lys Leu Leu Gly Ser Leu Phe His Asp Val Leu 20 25 30 Gln Arg Glu Val Gly Asn Pro Phe Met Glu Lys Val Glu Arg Ile Arg 35 40 45 Ile Leu Ala Gln Ser Ala Leu Asn Leu Arg Met Ala Gly Ile Glu Asp 50 55 60 Thr Ala Asn Leu Leu Glu Lys Gln Leu Thr Ser Glu Ile Ser Lys Met 65 70 75 80 Pro Leu Glu Glu Ala Leu Thr Leu Ala Arg Thr Phe Thr His Ser Leu 85 90 95 Asn Leu Met Gly Ile Ala Asp Thr His His Arg Met His Lys Val His 100 105 110 Asn Val Thr Gln Leu Ala Arg Ser Cys Asp Asp Ile Phe Ser Gln Leu 115 120 125 Leu Gln Ser Gly Ile Ser Pro Asp Glu Leu Tyr Lys Thr Val Cys Lys 130 135 140 Gln Glu Val Glu Ile Val Leu Thr Ala His Pro Thr Gln Ile Asn Arg 145 150 155 160 Arg Thr Leu Gln Tyr Lys His Ile Arg Ile Ala His Leu Leu Glu Tyr 165 170 175 Asn Thr Arg Ser Asp Leu Ser Val Glu Asp Arg Glu Thr Leu Ile Glu 180 185 190 Asp Leu Val Arg Glu Ile Thr Ser Leu Trp Gln Thr Asp Glu Leu Arg 195 200 205 Arg Gln Lys Pro Thr Pro Val Asp Glu Ala Arg Ala Gly Leu Asn Ile 210 215 220 Val Glu Gln Ser Leu Trp Lys Ala Val Pro Gln Tyr Leu Arg Arg Val 225 230 235 240 Ser Asn Ser Leu Lys Lys Phe Thr Gly Lys Pro Leu Pro Leu Thr Cys 245 250 255 Thr Pro Met Lys Phe Gly Ser Trp Met Gly Gly Asp Arg Asp Gly Asn 260 265 270 Pro Asn Val Thr Ala Lys Val Thr Lys Glu Val Ser Leu Leu Ser Arg 275 280 285 Trp Met Ala Ile Asp Leu Tyr Ile Arg Glu Val Asp Ser Leu Arg Phe 290 295 300 Glu Leu Ser Thr Asp Arg Cys Ser Asp Arg Phe Ser Arg Leu Ala Asp 305 310 315 320 Lys Ile Leu Glu Lys Asp Tyr Asp Arg Gly Lys Ser Asn Phe Gln Lys 325 330 335 Gln Gln Ser Ser Ser Cys Leu Pro Thr Gln Leu Pro Ala Arg Ala His 340 345 350 Leu Pro Ala Cys Ile Asp Phe Gly Glu Ser Arg His Thr Lys Phe Glu 355 360 365 Ile Ala Thr Thr Asp Tyr Met Pro Pro Asn Leu Gln Lys Gln Asn Glu 370 375 380 Gln Asp Phe Ser Glu Ser Asp Trp Glu Lys Ile Asp Asn Gly Ser Arg 385 390 395 400 Ser Gly Leu Thr Ser Arg Gly Ser Phe Ser Ser Thr Ser Gln Leu Leu 405 410 415 Leu Gln Arg Lys Leu Phe Glu Glu Ser Gln Val Gly Lys Thr Ser Phe 420 425 430 Gln Lys Leu Leu Glu Pro Pro Pro Leu Lys Arg Ala Gly Ser Ala Pro 435 440 445 Tyr Arg Ile Val Leu Gly Glu Val Lys Glu Lys Leu Val Lys Thr Arg 450 455 460 Arg Leu Leu Glu Leu Leu Ile Glu Gly Leu Pro Cys Glu Tyr Asp Pro 465 470 475 480 Lys Asn Ser Tyr Glu Thr Ser Asp Gln Leu Leu Glu Pro Leu Leu Leu 485 490 495 Cys Tyr Glu Ser Leu Gln Ser Ser Gly Ala Arg Val Leu Ala Asp Gly 500 505 510 Arg Leu Ala Asp Leu Ile Arg Arg Val Ser Thr Phe Gly Met Val Leu 515 520 525 Val Lys Leu Asp Leu Arg Gln Glu Ala Ala Arg His Ser Glu Ala Leu 530 535 540 Asp Ala Ile Thr Thr Tyr Leu Asp Met Gly Thr Tyr Ser Glu Trp Asp 545 550 555 560 Glu Glu Lys Lys Leu Glu Phe Leu Thr Arg Glu Leu Lys Gly Lys Arg 565 570 575 Pro Leu Val Pro Gln Cys Ile Lys Val Gly Pro Asp Val Lys Glu Val 580 585 590 Leu Asp Thr Phe Arg Val Ala Ala Glu Leu Gly Ser Glu Ser Leu Gly 595 600 605 Ala Tyr Val Ile Ser Met Ala Ser Asn Ala Ser Asp Val Leu Ala Val 610 615 620 Glu Leu Leu Gln Lys Asp Ala Arg Leu Ala Leu Thr Ser Glu His Gly 625 630 635 640 Lys Pro Cys Pro Gly Gly Thr Leu Arg Val Val Pro Leu Phe Glu Thr 645 650 655 Val Asn Asp Leu Arg Ala Ala Gly Pro Ser Ile Arg Lys Leu Leu Ser 660 665 670 Ile Asp Trp Tyr Arg Glu His Ile Gln Lys Asn His Asn Gly His Gln 675 680 685 Glu Val Met Val Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Phe 690 695 700 Thr Ala Ala Trp Glu Leu Tyr Lys Ala Gln Glu Asn Val Val Ala Ala 705 710 715 720 Cys Asn Glu Phe Gly Ile Lys Ile Thr Leu Phe His Gly Arg Gly Gly 725 730 735 Ser Ile Gly Arg Gly Gly Gly Pro Thr Tyr Leu Ala Ile Gln Ser Gln 740 745 750 Pro Pro Gly Ser Val Met Gly Ser Leu Arg Ser Thr Glu Gln Gly Glu 755 760 765 Met Val Gln Ala Lys Phe Gly Ile Pro Gln Thr Ala Val Arg Gln Leu 770 775 780 Glu Val Tyr Thr Thr Ala Val Leu Leu Ala Thr Leu Lys Pro Pro Gln 785 790 795 800 Pro Pro Arg Glu Glu Lys Trp Arg Asn Leu Met Glu Glu Ile Ser Gly 805 810 815 Ile Ser Cys Gln His Tyr Arg Ser Thr Val Tyr Glu Asn Pro Glu Phe 820 825 830 Leu Ser Tyr Phe His Glu Ala Thr Pro Gln Ala Glu Leu Gly Phe Leu 835 840 845 Asn Ile Gly Ser Arg Pro Thr Arg Arg Lys Ser Ser Ser Gly Ile Gly 850 855 860 His Leu Arg Ala Ile Pro Trp Val Phe Ala Trp Thr Gln Thr Arg Phe 865 870 875 880 Val Leu Pro Ala Trp Leu Gly Val Gly Ala Gly Leu Lys Gly Val Ser 885 890 895 Glu Lys Gly His Ala Asp Asp Leu Lys Glu Met Tyr Lys Glu Trp Pro 900 905 910 Phe Phe Gln Ser Thr Leu Glu Leu Ile Glu Met Val Leu Ala Lys Ala 915 920 925 Asp Ile Pro Met Thr Lys His Tyr Asp Glu Gln Leu Val Ser Glu Lys 930 935 940 Arg Arg Gly Leu Gly Thr Glu Leu Arg Lys Glu Leu Met Thr Thr Glu 945 950 955 960 Lys Tyr Val Leu Val Ile Ser Gly His Glu Lys Leu Leu Gln Asp Asn 965 970 975 Lys Ser Leu Lys Lys Leu Ile Asp Ser Arg Leu Pro Tyr Leu Asn Ala 980 985 990 Met Asn Met Leu Gln Val Glu Ile Leu Lys Arg Leu Arg Arg Asp Glu 995 1000 1005 Asp Asn Asn Lys Leu Arg Asp Ala Leu Leu Ile Thr Ile Asn Gly 1010 1015 1020 Ile Ala Ala Gly Met Arg Asn Thr Gly 1025 1030 <210> 31 <211> 6018 <212> DNA <213> Sorghum bicolor <400> 31 aggcctagta ttgcttcaaa ttctgcggca attcaactca acaaatgctt atcctgagtt 60 tgtttatatg tactccatta gttttattaa agataagttc tcttgattat tctacgtaga 120 tagctttgtt gtacactcat tatattattt tatatataca taatacaaaa taatatttat 180 ctaaaaaaat cagaacaatg tgcacatact aataaattcc catttcaatg ttggaccatg 240 agcagatctg acggtacaca tgttcaagtg tctccgttct cctgtggaaa taataaatcg 300 cagccgtcca cgtgacacac aacacagatg tctctcgatc agtataggct gttcctgttc 360 ttcgctttgg taacaaatcc cctgcaaatt gatcgataat ataagaataa aataacgtgc 420 atctcgtaca ttcgcttgga cctgcctgct aaatgctaat gctaatgcta ccatcttcct 480 cctccgtcta taaagtggcc gccagaatcc gctcctccta caattgcagc agcctcctct 540 cctctcctcc ctgcctggtt cttgcttgca gttcttgaac caaatccaca ccgccggcgc 600 gcttagcatt ggggctagct agggggccga tcgatatggc ggccttaggg gcgaagatgg 660 agcggctgtc gtcgatcgac gcgcagctgc ggatgctggt gccggggaag gtctcggagg 720 acgacaagct catcgagtac gacgcgctcc tcctcgaccg cttcctcgac atcctccagg 780 acctccacgg cgacgacctc aaggagatgg taactctcct ccgactggtt cttagactct 840 tgttgttctt ttgttttact ggttcgggct tgcgatgcag ctttaatctt gggttggatc 900 caagtaatct agttcagtcc tgtggtcttt acctgttatt tttaccttta tttaatcttc 960 catgtttttt ttacttattt gtcttctttt tcctgagaaa aaagtatcaa tgtttagtaa 1020 aaaaaaaggc atgaaattat tgccttcttt gttctttgtt ttcttttcgt gcgattcctt 1080 tttagagtgc cagcttgagt agtattgaag agtgtgtggt tgacttcaga gtccactctt 1140 cagattaagt gattaacact tcaggtttaa gtgtaactac aaggtggttg atttgctgct 1200 taatttggcg ttgtcaagta tagtaattat actaaaatat aaattatagt ggatggccag 1260 gtgctggatt aacgttccta gtgttcaatt tcttcttctt cttcttcttt ttgttttgtt 1320 attgctcaaa gattggtttt tcagtggcaa agcgatcatc tcgatttttg attgattggg 1380 tcggatatgg ttcgaatttg atctcaatca ttcggtagaa cacttcctat gtggaaatcc 1440 atctgtaaca agtgtggatc ttagttgtat atatgttcct ggtccattaa ctgactttgg 1500 accgattgat tgactgaaac aacgaaacgc tgcagattcc acgtcatctt ttgagttctt 1560 gacttttcgt ttggatggca acatatagtt gacaaaacaa actttatctc cagcaacgca 1620 actttacacc tgattgcagt tcatagcacg tgaacccctg tcatctttct agcaccttcc 1680 ctgacagaac atggacaccc agaacatgtg acaactaata gacaaactat gaaaattttt 1740 ggatcaaaat aaagcccccg ttgaagtggg tatgtttgta ttgctcagaa agtgtgactt 1800 accatattaa atttatttga catggccagc tggcagcaat actacatatg taaatttatt 1860 tggaactgat atagtgatat gtggattgag tatggtagta acaaaatcca gaaaccgaca 1920 tatctttctc tctttttttt aatcatgtat ggtcattaat tgagttctct tgctgattag 1980 gttcaagaat gctatgaggt agctgctgag tatgaaacaa aacatgactt gcaaaagctt 2040 gatgaactcg ggaagatgat aacaagcttg gatcctgggg actctattgt gatcgccaag 2100 tctttctcgc acatgcttaa cttggccaac ttggctgagg aagtccagat agcatacagg 2160 aggagaatca agctcaagaa gggagacttt gctgatgaga actcggcaat cacagaatct 2220 gacattgagg aaacacttaa gaggcttgtt gttgacctga agaagtcacc tgctgaggta 2280 tttgatgccc tcaagagcca gactgttgat ctggttttga ctgcacatcc aacacagtct 2340 gtgaggaggt cactgctcca gaaacactcg aggttggttt gccaaacgtt gcattgtagt 2400 tgacatgcac aactccgttt tagcctttaa tcttgatccc aacattctta ccaggatacg 2460 aaactgtttg gttcaactct actcaaaaga tatcactcca gatgataagc aggaacttga 2520 tgaggctctg cagagagagg tatttatttc aatctaatgt ttattacctg gaattctttg 2580 aagcttgaga ccaaagatat caattcttaa ttccttacat ggactcctct ctcctttttc 2640 aagatccaag ctgcctttag aactgatgag atccgaagaa cgcagcccac tccccaagat 2700 gaaatgcgtg ctggtatgag ctacttccat gaaacaattt ggaagggtgt tccaaagttc 2760 ttgcgccgag ttgatactgc attgaagaac attgggatta acgagcgtgt tccttacaat 2820 gcacctctta ttcagttctc ttcttggatg ggaggagatc gtgatggtgc acgtgacatc 2880 tctacatatt tgtcttttct tctcatggca ttataaatat gagtatttgc agcacctgtt 2940 attatctttg ttgctagtgg ttgggaagat gactattcat tgtccatgtg tctgcagtct 3000 gcacctctgt cctttgtatt ctaaagcaat gtttctacaa atgcaggaaa tccaagagtg 3060 acaccagagg ttaccaggga tgtctgcttg cttgccagga tgatggcatc gaacttgtac 3120 tgctctcaga ttgaggatct catgtttgag gttgctatta ctttcagaat cagagtatag 3180 ttcataacat catttctatc agatgattga acttgataac ttgaaatgct tgcagttgtc 3240 tatgtggcga tgcagtgatg agctgcgcat gcgagctgat gagctgcatc gctccactaa 3300 gaaggatgcc aagcattaca taggtagtta ccagtgacat cattgggtct tcttaacaat 3360 ggcctgttgt tattaggcca tatttttggc attttaataa tttttccttc ttcatttctg 3420 ctgtagagtt ttggaagaag gttcctccaa atgagccata tcgggtgata ctgagtgatg 3480 tcagggataa actctacaac actcgtgagc ggtcacgaga gcttttatcc agtggacatt 3540 ctgatattcc tgaggaagct acattgacaa ctgttgagca ggttgagaat taatcagtaa 3600 tcttcagaaa ataatattga tttcttggtt ttccctcagt gggttctgat atgtagatgc 3660 caacttttgc agctgttgga gcccttggaa ctatgttaca gatcactctg tgcttgtggt 3720 gaccgtgtaa ttgctgatgg aagtcttctg gatttcttgc gtcaagtctc cacctttgga 3780 ctctcccttg tgaggcttga cattaggcaa gaatcagatc ggcatactga tgtccttgat 3840 gccatcacta cgtacctggg gataggatct taccgcgagt ggcctgaaga acgccgccaa 3900 gaatggctac tgtctgaact taatggcaag cgccctctgt ttggcccgga ccttcccaag 3960 actgaggaga ttgctgatgt tctagacaca ttccacgtta tcgctgagct tcctgctgac 4020 aattttggtg cttatatcat ttccatggca acagctcctt cggatgtact tgctgttgag 4080 ctcctccaac gtgagtgtca tgtaaagaca ccacttagag tagtcccact gtttgagaag 4140 ttggctgatc ttgaggctgc cccagctgca ttggccagac tgttctcaat cgattggtat 4200 agacagagga tcaatggcaa gcaggaggtc atgattgggt attcagattc aggcaaagat 4260 gcaggtcgac tctcagcagc ttggcagcta tacaaagctc aggaggagct catcaaggtt 4320 gctaaggact tcggtgtgaa gttgacgatg ttccatggac gtggtgggac tgttggaagg 4380 ggtggtggtc ccactcacct tgccatcttg tcccagccac cagacacgat ccatggatca 4440 ctccgggtca ctgttcaagg tgaagtcatt gagcagtctt ttggtgagga gcacttgtcg 4500 tttaggacac tgcaacgttt cacggctgct accctggagc atggaatgca cccaccaaat 4560 gcaccaaagc cagaatggcg aacccttctt gatgagatgg cagttgtggc aactgaggaa 4620 tatcggtcca ttgtctttca agagccacgc ttcgttgagt attttcgcct cgtgcagcat 4680 cgttgagtat ttccgcctcg tagtccttgt tgtccattgt catactacag taacataagc 4740 ctgcaaaacg taacttttga aataggtcgc ctgacttgag acttaatatg aatgtagcac 4800 aatgatttac tgcactatat ctttttgcaa acctaactaa aatggttaat gaaatatttg 4860 atttgaccct acatttagcg aatatttact ttgtgatatt tgtgttgaca ggcaacacct 4920 gaaacagagt atggtaggat gaacatagga agcaggccat ccaagagaaa gccgagcgga 4980 ggtatcgagt cactccgagc aatcccatgg atctttgctt ggacacaaac acggttccac 5040 ctcccggtat ggctaggatt tggaggcgca ttcaagcatg tcctccagaa ggacatcagg 5100 aacctccaca tgctccagga aatgtacaat gagtggccat ttttcagggt cactattgat 5160 ctggtggaga tggtgttcgc caagggtaac cctggcattg ctgcacttta tgacaaactc 5220 ctagtttcag aggaactgcg tccattgggt gagaagctga gggccaacta tgaagaaacc 5280 caaaagcttc tacttcaggt cgctgtcctg tccaaaagac acatcgatac attcttgcac 5340 tttgttgagc taccattcta gtagcgtttt atcattgaac tctgttttgg acttctatca 5400 ggttgccggg cacagggatc tcctggaagg tgacccttac ctgaagcagc ggctccgcct 5460 ccgtgacgcg tacatcacca ccctgaacgt ctgccaggcc tacaccctga agcggatccg 5520 tgacccggac taccatgtcg cgctgcgccc ccacctctcc aaggagatca tggaccccac 5580 caaggcggct tcagagctgg tgaagctgaa ccctggcagc gagtatgcac cggggctgga 5640 ggacaccctc attctgacca tgaagggcat agcagccggt ctccagaaca ccggttaaaa 5700 cacaaagagg ggatcttttt ttttaatcct gatcattgtc tctaggtcct ttgtatttac 5760 gcagatttta gctgcatctt cggccgtctc tctacaccgt gaggaaataa tgcgattttg 5820 ccaaagtggc ggtaaataaa agggagatga ggatcataca tgtttttctt attagtagac 5880 cgttgtgttg caactttact atgcgataat ggaacatgct gtagcctaat tgaagtgccg 5940 tatctcaagc atttttgcag gcaggctctg aattgttgga attgttccaa tgttcccttt 6000 gcaatctgtt gcctgcag 6018 <210> 32 <211> 960 <212> PRT <213> Sorghum bicolor <400> 32 Met Glu Arg Leu Ser Ser Ile Asp Ala Gln Leu Arg Met Leu Val Pro 1 5 10 15 Gly Lys Val Ser Glu Asp Asp Lys Leu Ile Glu Tyr Asp Ala Leu Leu 20 25 30 Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu His Gly Asp Asp Leu 35 40 45 Lys Glu Met Val Gln Glu Cys Tyr Glu Val Ala Ala Glu Tyr Glu Thr 50 55 60 Lys His Asp Leu Gln Lys Leu Asp Glu Leu Gly Lys Met Ile Thr Ser 65 70 75 80 Leu Asp Pro Gly Asp Ser Ile Val Ile Ala Lys Ser Phe Ser His Met 85 90 95 Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln Ile Ala Tyr Arg Arg 100 105 110 Arg Ile Lys Leu Lys Lys Gly Asp Phe Ala Asp Glu Asn Ser Ala Ile 115 120 125 Thr Glu Ser Asp Ile Glu Glu Thr Leu Lys Arg Leu Val Val Asp Leu 130 135 140 Lys Lys Ser Pro Ala Glu Val Phe Asp Ala Leu Lys Ser Gln Thr Val 145 150 155 160 Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser Val Arg Arg Ser Leu 165 170 175 Leu Gln Lys His Ser Arg Ile Arg Asn Cys Leu Val Gln Leu Tyr Ser 180 185 190 Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu Leu Asp Glu Ala Leu Gln 195 200 205 Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu Ile Arg Arg Thr Gln 210 215 220 Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met Ser Tyr Phe His Glu 225 230 235 240 Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg Arg Val Asp Thr Ala 245 250 255 Leu Lys Asn Ile Gly Ile Asn Glu Arg Val Pro Tyr Asn Ala Pro Leu 260 265 270 Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg Asp Gly Asn Pro Arg 275 280 285 Val Thr Pro Glu Val Thr Arg Asp Val Cys Leu Leu Ala Arg Met Met 290 295 300 Ala Ser Asn Leu Tyr Cys Ser Gln Ile Glu Asp Leu Met Phe Glu Leu 305 310 315 320 Ser Met Trp Arg Cys Ser Asp Glu Leu Arg Met Arg Ala Asp Glu Leu 325 330 335 His Arg Ser Thr Lys Lys Asp Ala Lys His Tyr Ile Glu Phe Trp Lys 340 345 350 Lys Val Pro Pro Asn Glu Pro Tyr Arg Val Ile Leu Ser Asp Val Arg 355 360 365 Asp Lys Leu Tyr Asn Thr Arg Glu Arg Ser Arg Glu Leu Leu Ser Ser 370 375 380 Gly His Ser Asp Ile Pro Glu Glu Ala Thr Leu Thr Thr Val Glu Gln 385 390 395 400 Leu Leu Glu Pro Leu Glu Leu Cys Tyr Arg Ser Leu Cys Ala Cys Gly 405 410 415 Asp Arg Val Ile Ala Asp Gly Ser Leu Leu Asp Phe Leu Arg Gln Val 420 425 430 Ser Thr Phe Gly Leu Ser Leu Val Arg Leu Asp Ile Arg Gln Glu Ser 435 440 445 Asp Arg His Thr Asp Val Leu Asp Ala Ile Thr Thr Tyr Leu Gly Ile 450 455 460 Gly Ser Tyr Arg Glu Trp Pro Glu Glu Arg Arg Gln Glu Trp Leu Leu 465 470 475 480 Ser Glu Leu Asn Gly Lys Arg Pro Leu Phe Gly Pro Asp Leu Pro Lys 485 490 495 Thr Glu Glu Ile Ala Asp Val Leu Asp Thr Phe His Val Ile Ala Glu 500 505 510 Leu Pro Ala Asp Asn Phe Gly Ala Tyr Ile Ile Ser Met Ala Thr Ala 515 520 525 Pro Ser Asp Val Leu Ala Val Glu Leu Leu Gln Arg Glu Cys His Val 530 535 540 Lys Thr Pro Leu Arg Val Val Pro Leu Phe Glu Lys Leu Ala Asp Leu 545 550 555 560 Glu Ala Ala Pro Ala Ala Leu Ala Arg Leu Phe Ser Ile Asp Trp Tyr 565 570 575 Arg Gln Arg Ile Asn Gly Lys Gln Glu Val Met Ile Gly Tyr Ser Asp 580 585 590 Ser Gly Lys Asp Ala Gly Arg Leu Ser Ala Ala Trp Gln Leu Tyr Lys 595 600 605 Ala Gln Glu Glu Leu Ile Lys Val Ala Lys Asp Phe Gly Val Lys Leu 610 615 620 Thr Met Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro 625 630 635 640 Thr His Leu Ala Ile Leu Ser Gln Pro Pro Asp Thr Ile His Gly Ser 645 650 655 Leu Arg Val Thr Val Gln Gly Glu Val Ile Glu Gln Ser Phe Gly Glu 660 665 670 Glu His Leu Ser Phe Arg Thr Leu Gln Arg Phe Thr Ala Ala Thr Leu 675 680 685 Glu His Gly Met His Pro Pro Asn Ala Pro Lys Pro Glu Trp Arg Thr 690 695 700 Leu Leu Asp Glu Met Ala Val Val Ala Thr Glu Glu Tyr Arg Ser Ile 705 710 715 720 Val Phe Gln Glu Pro Arg Phe Val Glu Tyr Phe Arg Leu Ala Thr Pro 725 730 735 Glu Thr Glu Tyr Gly Arg Met Asn Ile Gly Ser Arg Pro Ser Lys Arg 740 745 750 Lys Pro Ser Gly Gly Ile Glu Ser Leu Arg Ala Ile Pro Trp Ile Phe 755 760 765 Ala Trp Thr Gln Thr Arg Phe His Leu Pro Val Trp Leu Gly Phe Gly 770 775 780 Gly Ala Phe Lys His Val Leu Gln Lys Asp Ile Arg Asn Leu His Met 785 790 795 800 Leu Gln Glu Met Tyr Asn Glu Trp Pro Phe Phe Arg Val Thr Ile Asp 805 810 815 Leu Val Glu Met Val Phe Ala Lys Gly Asn Pro Gly Ile Ala Ala Leu 820 825 830 Tyr Asp Lys Leu Leu Val Ser Glu Glu Leu Arg Pro Leu Gly Glu Lys 835 840 845 Leu Arg Ala Asn Tyr Glu Glu Thr Gln Lys Leu Leu Leu Gln Val Ala 850 855 860 Gly His Arg Asp Leu Leu Glu Gly Asp Pro Tyr Leu Lys Gln Arg Leu 865 870 875 880 Arg Leu Arg Asp Ala Tyr Ile Thr Thr Leu Asn Val Cys Gln Ala Tyr 885 890 895 Thr Leu Lys Arg Ile Arg Asp Pro Asp Tyr His Val Ala Leu Arg Pro 900 905 910 His Leu Ser Lys Glu Ile Met Asp Pro Thr Lys Ala Ala Ser Glu Leu 915 920 925 Val Lys Leu Asn Pro Gly Ser Glu Tyr Ala Pro Gly Leu Glu Asp Thr 930 935 940 Leu Ile Leu Thr Met Lys Gly Ile Ala Ala Gly Leu Gln Asn Thr Gly 945 950 955 960 <210> 33 <211> 2901 <212> DNA <213> Glycine max <400> 33 atggctgctc ggaacatcga gaagatggcc tcaattgatg ctcaactgag gttgctggcg 60 ccacgcaagg tgtctgatga tgacaaactc gttgagtatg atgccttgtt gttggatcgt 120 ttccttgaca ttcttcagga tttgcatggt gaagatatca gacaaacggt ccaagattgt 180 tacgagctgt cagctgagta cgaaggagag cataagcctg aaaagttgga ggaacttggg 240 aatatgctga cgggtcttga tgctggggat tcaattgtta ttgccaagtc attttctcac 300 atgctcaatt tggccaactt ggcagaagaa gttcaaattg cgtatcgaag aaggatcaag 360 ttactgaaga agggtgattt tgctgatgag aactctgcca ttactgagtc agacattgaa 420 gagaccttca agaagcttgt ggctcaactg aagaagacac cccaggaaat ctttgatgct 480 ttgaagaacc aaactgtgga tttggttcta actgctcatc ctactcagtc tgttcgcaga 540 tctttgctgc aaaagcatgg aaggataagg aattgtttga cacaattata tgctaaggac 600 ataacaccag atgataagca ggaacttgat gaggctttac aaagagagat tcaagctgca 660 tttcgcacag atgaaattcg aaggactcct cctaccccac aagatgagat gagggcagga 720 atgagctact ttcatgagac aatttggaaa ggtgtaccac agtttctgcg tcgggtagat 780 acagctctga agaacattgg aattaatgaa cgtgtcccat ataatgctcc tgttattcag 840 ttctcttctt ggatgggagg agaccgtgat ggtaatccta gagtaacccc tgaagttaca 900 agggatgtgt gtttgctggc tagaatgatg gctgctaata tgtacttctc tcagatagag 960 gatctcatgt ttgagttgtc tatgtggcgt tgcactgacg agctacgtgt tcgtgctcat 1020 gaactccata ggtcctcaaa gagagatgca aaacattata ttgagttttg gaaacagatt 1080 cctccaaatg agccatatcg tgttattctt ggtgatgtca gagacaaact atataacatt 1140 cgggaacgtg ctcgccattt attagccaat gggacatctg atatccctga ggagacaacc 1200 ttcactaacg ttgagcagtt tctggagccc cttgaactat gctacaggtc actctgtgca 1260 tgtggtgaca gaccaatagc agatggaagc ctccttgatt tcctgcggca agtttccaca 1320 tttggactct cactagtgag acttgacatc cgtcaagagt cagataggca cactgatgtt 1380 atggatgcaa tcacaaaaca cttagacatt ggatcatacc gagagtggcc cgaggaaaag 1440 aggcaggagt ggctcttgtc tgaactcagt ggaaagcgcc ctctctttgg ccatgacctt 1500 cccaaaacag aagaaatcac cgatgttttg gaaacattcc gtgtcatttc agagcttccc 1560 tcagacaact tcggtgccta catcatatca atggcaacat ccccatctga tgtgcttgct 1620 gttgagcttt tacaacgtga atgccatgtg aagcagccac taagggtggt gccactgttt 1680 gaaaagcttg ctgatcttga ggccgctccg gctgcggtgg cacgtctttt ctctatagat 1740 tggtacagaa accgcattga tgggaagcaa gaagttatga tagggtactc agactcagga 1800 aaagatgcag gccgtctttc tgcggcttgg gcgctttaca aggctcaaga agaacttgtg 1860 aaggttgcta aggagtatgg tgttaaactt acaatgtttc atgggagagg agggactgtt 1920 ggaagaggag gaggtccaac tcatcttgct atattgtctc agccaccaga caccattcat 1980 ggctcacttc gggtaacggt tcagggtgaa gtcattgagc agtcttttgg agaggaacac 2040 ttgtgcttta gaacacttca gcgcttcact gcagctacac ttgagcatgg catgcatcct 2100 cctgtgtcac cgaaacccga atggcgtgcc ctcatggatg aaatggctgt cattgcaaca 2160 aaggagtatc gctctgttgt tttcaaagaa cctcgttttg ttgaatattt cagatgtgca 2220 actcctgagt tggagtatgg aagaatgaac attggcagtc gtccatcaaa gcgaaagcca 2280 agtggaggaa ttgaatcact acgtgctatt ccttggattt ttgcatggac acaaacgagg 2340 tttcatttgc cagtgtggct tggttttggg tcagcattta agcatgtagt tgagaaagat 2400 ccgaagaatc tccaaatgct tcaggacatg tacaatcaat ggcctttctt cagggtcacc 2460 ctggacttgg ttgagatggt gtttgctaag ggagacccgg ggattgcagc cctatttgac 2520 aaactcctag tatcagaaga gctgcgtcca tttggagaaa atttaagagc taaatacgaa 2580 gaaaccaaga gctttctcct ccaggttgct gggcacaagg atattcttga aggagacccc 2640 tacttgaagc aaagacttcg tcttcgtgac tcatacatca caaccctcaa tgtgttgcaa 2700 gcttacacat tgaagcgaat tcgtgatcct gactaccatg tgaagttgag gccacacttg 2760 tcaaaggact acatggaatc aagcaagcca gcagcagagc ttgttaaact taaccccaaa 2820 agcgagtatg ctcctggtct tgaggacacc cttattttga caatgaaggg tattgctgct 2880 ggaatgcaaa ataccggtta a 2901 <210> 34 <211> 966 <212> PRT <213> Glycine max <400> 34 Met Ala Ala Arg Asn Ile Glu Lys Met Ala Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Leu Leu Ala Pro Arg Lys Val Ser Asp Asp Asp Lys Leu Val Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Ile Arg Gln Thr Val Gln Asp Cys Tyr Glu Leu Ser 50 55 60 Ala Glu Tyr Glu Gly Glu His Lys Pro Glu Lys Leu Glu Glu Leu Gly 65 70 75 80 Asn Met Leu Thr Gly Leu Asp Ala Gly Asp Ser Ile Val Ile Ala Lys 85 90 95 Ser Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala Tyr Arg Arg Arg Ile Lys Leu Leu Lys Lys Gly Asp Phe Ala 115 120 125 Asp Glu Asn Ser Ala Ile Thr Glu Ser Asp Ile Glu Glu Thr Phe Lys 130 135 140 Lys Leu Val Ala Gln Leu Lys Lys Thr Pro Gln Glu Ile Phe Asp Ala 145 150 155 160 Leu Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln 165 170 175 Ser Val Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile Arg Asn Cys 180 185 190 Leu Thr Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu 195 200 205 Leu Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp 210 215 220 Glu Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly 225 230 235 240 Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Gln Phe Leu 245 250 255 Arg Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn Glu Arg Val 260 265 270 Pro Tyr Asn Ala Pro Val Ile Gln Phe Ser Ser Trp Met Gly Gly Asp 275 280 285 Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys 290 295 300 Leu Leu Ala Arg Met Met Ala Ala Asn Met Tyr Phe Ser Gln Ile Glu 305 310 315 320 Asp Leu Met Phe Glu Leu Ser Met Trp Arg Cys Thr Asp Glu Leu Arg 325 330 335 Val Arg Ala His Glu Leu His Arg Ser Ser Lys Arg Asp Ala Lys His 340 345 350 Tyr Ile Glu Phe Trp Lys Gln Ile Pro Pro Asn Glu Pro Tyr Arg Val 355 360 365 Ile Leu Gly Asp Val Arg Asp Lys Leu Tyr Asn Ile Arg Glu Arg Ala 370 375 380 Arg His Leu Leu Ala Asn Gly Thr Ser Asp Ile Pro Glu Glu Thr Thr 385 390 395 400 Phe Thr Asn Val Glu Gln Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg 405 410 415 Ser Leu Cys Ala Cys Gly Asp Arg Pro Ile Ala Asp Gly Ser Leu Leu 420 425 430 Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg Leu 435 440 445 Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Met Asp Ala Ile 450 455 460 Thr Lys His Leu Asp Ile Gly Ser Tyr Arg Glu Trp Pro Glu Glu Lys 465 470 475 480 Arg Gln Glu Trp Leu Leu Ser Glu Leu Ser Gly Lys Arg Pro Leu Phe 485 490 495 Gly His Asp Leu Pro Lys Thr Glu Glu Ile Thr Asp Val Leu Glu Thr 500 505 510 Phe Arg Val Ile Ser Glu Leu Pro Ser Asp Asn Phe Gly Ala Tyr Ile 515 520 525 Ile Ser Met Ala Thr Ser Pro Ser Asp Val Leu Ala Val Glu Leu Leu 530 535 540 Gln Arg Glu Cys His Val Lys Gln Pro Leu Arg Val Val Pro Leu Phe 545 550 555 560 Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro Ala Ala Val Ala Arg Leu 565 570 575 Phe Ser Ile Asp Trp Tyr Arg Asn Arg Ile Asp Gly Lys Gln Glu Val 580 585 590 Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ser Ala 595 600 605 Ala Trp Ala Leu Tyr Lys Ala Gln Glu Glu Leu Val Lys Val Ala Lys 610 615 620 Glu Tyr Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr Val 625 630 635 640 Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro Pro 645 650 655 Asp Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val Ile 660 665 670 Glu Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln Arg 675 680 685 Phe Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro Val Ser Pro 690 695 700 Lys Pro Glu Trp Arg Ala Leu Met Asp Glu Met Ala Val Ile Ala Thr 705 710 715 720 Lys Glu Tyr Arg Ser Val Val Phe Lys Glu Pro Arg Phe Val Glu Tyr 725 730 735 Phe Arg Cys Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn Ile Gly 740 745 750 Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu Ser Leu Arg 755 760 765 Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu Pro 770 775 780 Val Trp Leu Gly Phe Gly Ser Ala Phe Lys His Val Val Glu Lys Asp 785 790 795 800 Pro Lys Asn Leu Gln Met Leu Gln Asp Met Tyr Asn Gln Trp Pro Phe 805 810 815 Phe Arg Val Thr Leu Asp Leu Val Glu Met Val Phe Ala Lys Gly Asp 820 825 830 Pro Gly Ile Ala Ala Leu Phe Asp Lys Leu Leu Val Ser Glu Glu Leu 835 840 845 Arg Pro Phe Gly Glu Asn Leu Arg Ala Lys Tyr Glu Glu Thr Lys Ser 850 855 860 Phe Leu Leu Gln Val Ala Gly His Lys Asp Ile Leu Glu Gly Asp Pro 865 870 875 880 Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr Thr Leu 885 890 895 Asn Val Leu Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Asp Tyr 900 905 910 His Val Lys Leu Arg Pro His Leu Ser Lys Asp Tyr Met Glu Ser Ser 915 920 925 Lys Pro Ala Ala Glu Leu Val Lys Leu Asn Pro Lys Ser Glu Tyr Ala 930 935 940 Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala 945 950 955 960 Gly Met Gln Asn Thr Gly 965 <210> 35 <211> 8638 <212> DNA <213> Saccharum officinarum <220> <221> misc_feature <222> (1324)..(1324) <223> n is a, c, g, or t <400> 35 gatccgtcac tgtcctcatg taatactcac accctttgga tacaaaaata cgagcatacg 60 gctatgtttt caagagtaca acaacttctt tgccatgtct accatagctt gcccaatata 120 aaaatcgaac atatctctct agagccaacc tccttcattc attattcatg tccatggaca 180 aaccacaaaa ttcactcgat tttcactcta gatggtgtga taaatcttta tctatctatc 240 tgtctgtcta ggtagccagc tggttttttt ttatctgtct gtctatctat ctatctatta 300 ttaaagaata aaactttact tccaactcat tttgatttat tcccaaaaaa tacatgtcct 360 ttctttcgtc ccattctttt tttaaaatgt gttgaattta atgcaacata cggacacact 420 tgctgacgaa caaaattccg ataaaacaaa ggtcttgctc tcccgacgcg acgggccgcc 480 accatgaaac ctgtaggcga gagccgagag gagtaagact atccgcactc gtggtactct 540 aaattcatca tctaaaagca atatttcatt atagtcactc ctctatacca ctttctttcg 600 cactcatcca tcctctgtaa tcatcctcta taccaactac cagctgatgg ggtccacacg 660 tcatactctt attttctctc tcccttcccc tctcctccct cttctctctc ctctatcttc 720 ttttccggct gcttccggtt gggcgcagca cacgaggtgg ggccgccctg ggcacgtagc 780 ggactgctgc gacatgccag gaatggcgga cgatgagtgg gtagcggtcg gtttgcgtcc 840 ccggtgcagc cgatttgagt cgctatgtcc acgctgtccc tttagcgctc gtgtatacgt 900 cccggtgcgg acggtcttaa cgctccacta ggatgggctt tcaccactgg agatgaaaac 960 gaaacagaaa tattccgaat tgactgtttt cgttttctat attatgaacc ggttttttaa 1020 catgaaaaat tgtcagtttc aattggtttc acaatcattt tctaccattt ttttgtattc 1080 tttaattgct aaatgtagaa atattccgaa ccgaccgttt ttatttttct atactgtaag 1140 ctcgttttcg accgttttgt tcctggttca ccgccacagt ccgagttcga agggatatac 1200 gacgaatcca tccagcacaa gcgacagtcc cgtcctgtcc tataaatagc agaccacagc 1260 agagagagag agagggtgtc cctctccgct ccgtcacagg aaacccggta tagcatcaag 1320 gaangttttt ttgtcgtgtt gattgatctc cctccccttt cgcccccgtc ctgcctcctg 1380 gcctcacccc agaaaaaaaa aggtgagatg ctttcctctc ctctcccttc gatccagtag 1440 gtttgcagtc tgtttcctag atcttgttta ggcatttgtc catcttggag tggcaaagtc 1500 cctagctccc acaacggctg attgctgtag gttttgatca tacttttttt tttgcattcg 1560 agaaagcccc gtgctttgtt ggaatctgcg tgcttagggc tgggtggatc gtcttctcgc 1620 ttcaagaaca tgtcgaaatc cgtggattgg agggatttgt ggggttttct cttctctttt 1680 ggttggaatt gtgggttttg atctgtgtgg attctgttgc agggggcgag aagggaaggg 1740 gagtgcttgg gggggagaga agtagatggc gcgcaatgcg gtggacaagg cgacgtccat 1800 cgacgcgcag ctgcggctgc tggccccgca gaagctctcc gacgatgaca agcttgtcga 1860 gtacgacgcc ctgctcctcg accggttcct cgacatccta caggacctgc acggcgagga 1920 catcagggag acggtatgta aatgctccaa ttgtttcctg cccgtggtgc tatttgttcc 1980 tttcttttcg gtgctggcaa ttgatttagg tggtagatag ctcgatcatg cttgaaaatc 2040 tgtttatact gtcatgcatg catgggtcgc gatagcagga gaatcagaca cagcatctgg 2100 gccttgtccg tgggtgtttc tatatggtga tattcttctc atctgttttg gtattgcact 2160 ctggtgatgg aaactagtgc tgcatttaac aaatcatagt agcactgggg gtccacccat 2220 ttgttctaca gttgctgatc aatactgtgc tagttcccac tttgtgtttt ctagcttttg 2280 aaattggtac atcaccatga tgttcaaaac tggtggggtt atcatgatgt gtggagcact 2340 tgcactataa tcatggcctt ttgatactct cgagttatta tgccctttga actattgttg 2400 ttgctgatac gaggtagttt gcagatcaga tttattgtct tttctatgca taaatagtat 2460 gataaaatgg taaaaggcca ccttttttac aatgcataga cctatcacgc tattttacat 2520 tatcatttta ccactcaagt aagtcccatc tccttgccca ttttttttgt atatctgcaa 2580 gccaatcttt gcttgacatt ctgataggtg gcttgatttc tgtggtcatc cgttacacag 2640 caattccagt gtgttcacca actcactcta cattcgataa aatttatact tttttgcaat 2700 gccgtaaagt ttccctttct catgaatagg tgcaagaatg ctatgagtta gctgctgagt 2760 atgaaaataa gcttgacccc aaaatgctgg atgagattgg gaatgtgctg accagcttgg 2820 atcctggaga ctccattgtc ataaccaagt cattctcaca catgcttatc ctggcaaact 2880 tggctgagga ggtacaaatt gcataccgca ggagaataaa actgaagaag ggtgactttg 2940 ttgatgagaa ctcagcaaca actgaatcag acatcgagga gacattaaag aggcttatgc 3000 atcagcttaa gaagtcccct ctggaggtat ttgatgctct caagaatcaa actgttgacc 3060 tcgtcctgac tgcacatcca actcagtcag tccggagatc actgctccaa aagcatggca 3120 ggttagtctt gaagctttct gaattgttag atctcaggat gagatttact cgatggaatt 3180 gaatatttgc tatgcagaaa tgttggttct gtttgttctt tatgcacatc agagcaatgc 3240 aatttgctca cactgaattt cacatactgc tttcatagaa aacctgatgt ttttttgtcc 3300 acttttcttt tatgtgtaaa tattccttgc atggttttgc tgtagtctgc cttttaagaa 3360 acaacagcaa tagaaaaaaa taatatattt ctcgaggcat gttaaatcat acgttatatg 3420 tgccttttga tgccttagat tcctcacctt tcaatgtgca ggataagaaa ctgtttaact 3480 caactttatg caaaggacat cactccagat gagaaacagg aacttgatga agcacttcaa 3540 agagaggtaa tttgcttaga tattttggta tattagtgtt gtataatact atctgtgtag 3600 tagttaatca ggaaaacttt gtcaccttca ctaaatatat atttatatga ttctaatatc 3660 ctgttccatt tcttatctac agattcaagc tgcctttaga acagatgaaa tcaggcgggc 3720 gcctcctact ccgcaggatg aaatgcgtgc tggaatgagt tattttcatg agactatatg 3780 gaagggtgta cccaagttct tacgtagggt tgacactgct cttaagaaca ttggcataaa 3840 tgagcggttg ccatataatg cccctatcat tcagttttct tcttggatgg gtggtgatcg 3900 tgatggtgca tggcattctc tctccttttt tttggatagt atatttgatg atgtgccgaa 3960 tcatgcaact gtagttcaca agaaagaagt gcatatataa ctctaaactg atatccacaa 4020 cagggaatcc aagagtcacg ccagagatta caagggatgt atgcttgttg gctagaatga 4080 tggctgctaa tttgtataat gcccagatag aagacctaat gtttgaggta aaaataagga 4140 cacagttttt atttgatatt gtagtgatat tagtctcaca agaattcttt ttatcgcttg 4200 cagttatcta tgtggcgctg cagtgacgag ttacgtgtaa aggtcgatga gttacaccga 4260 tcctccaaga aagatacaac aaaacactat ataggtgcag attatattat gatatttttg 4320 ttaaacttat atattatatc ttcaacatcc ttgcctacca tctgctgcaa aatatttaac 4380 caaactagtc gccaatctgt tctttccaat ggatgaaata gctacacatt ttataaagta 4440 cctccatcca gaaaagagtg cagttctagt tctactctta gtcaaacaat ctaaagtttg 4500 accaagttca tagaaaagaa tatcaataat tatgacacca aataggtata ctatgaaaat 4560 atatttcatg acaaatctaa tgatacttat ttggtatcat aaatattgat atttttttgg 4620 cacaaagtta gtcaaacttg agatggtttg acttagtcat aaatatattt ggtatccaga 4680 attgcattct tttccggatg aagggagtat cttacttatg attaatatat ggatcctcat 4740 cataaccata aatgtggttc cactatgctg ctgaagatta atctgagaca tgcagatcag 4800 gattctaatc taaatggttc taacccaagt cagcaattgg ggaaaaaata ggcatggcaa 4860 atccatattc caaaagggtt ggactgtaag aatcagaaac agttaaaagg gcagacccag 4920 tgccagaggc tcccacacga gtggggtcta gggaaaggaa taaccgaagt aaagtcttac 4980 ctccgcagaa attctacaga gagaaacagt taccttgcaa aaaaaaaggc attgaaggat 5040 ttgaaacatg caataaaact aatgtattta gctgttagct taataaatat gatcatgaag 5100 tattaagaaa tagctgtcat caggactcag gagttgcatt gatatatgtg ctttcttgcc 5160 aacataggct ggmatttgaa tcatgtttcg ttctcttgat ttgtttctga gacacgtgga 5220 tgtctatttc tgtcgttgta ctattttaat attggaaaga accatgtcac tatggagtaa 5280 tttttttaaa gacaaattct tgctattttc atgcagactt tgatatttag gatgacattt 5340 ttggcagcaa cagacatgat attgatgcat gctatttttg tctattcttt tagattaatg 5400 cagccaatta gacaaaacta ggtgaagtta atacatgctg acatgctttt ccatgcagag 5460 ttctggaaac aagttccccc cagtgaacct taccgtgtga ttctgagtga tgtcagagat 5520 aaactctaca acacgcgtga acgagcacgc catttattag ctagtgggtt ttctgaaatt 5580 ccagaggaag caaccttcac cgatgttgaa caggtatgta aagtgaaaac agtagtgttc 5640 atttgatgtt cctggctagg ataaaaaatt aatctgtacc atacactttt agtcctatat 5700 taagattgga ttctttcatt ctatggtgta ctgtaaaagg ttgaaacatt cccaagataa 5760 aggatctttg tagctgtttc aggatatatt atgttttatg aattcttgtc tcgattgaat 5820 cttttttctc ttgcagttct tggagcctct tgagctctgt tacagatccc tctgtgcctg 5880 tggtgatcgc tctgttgcag atggaagcct tcttgacttc ttacggcaag tgtctacgtt 5940 tggactatcc cttgttagac ttgatatcag gcaagaatct gaccgacata ctgatgttat 6000 ggatgctata actgaatacc tcggcattgg atcataccgt aaatggacag aggagaaacg 6060 ccaagaatgg ctactctcgg aacttaatgg aaagaggccg ttatttggtc ctgaccttcc 6120 caagtcagat gagattgctg atgttctaga tactttccac gtattagctg aacttccttc 6180 agacagcttt ggtgcatatg taatatctat ggcgacagct ccctcagatg ttcttgctgt 6240 cgagctcttg cagcgtgaat gtcatgtgaa aaaaccactg agagttgtgc cattgttcga 6300 aaaactggca gatcttgagg cagcacccgc agctttagct cggctgttct ctgttgaatg 6360 gtacagaaac aggatcaatg gcaagcagga agtgatgatc gggtattcag attctggcaa 6420 ggatgctggt cgtttctctg ctgcttggca actgtacaag gctcaagagg agctaattaa 6480 tgttgctaag ctgtatgggg ttaagttaac tatgttccac ggacgaggtg ggactgtggg 6540 aagaggtggg ggccctaccc atcttgctat actgtcacaa cctcctgaaa ctattcatgg 6600 atcacttagg gtaactgttc aaggtgaagt cattgagcaa tcttttggag aggagcattt 6660 gtgctttaga accctgcaac gtttcacagc tgctactctt gaacatggta tgcatcctcc 6720 aatttcgcca aaaccggaat ggcgtgcttt aatggatgaa atggctattg ttgccacaaa 6780 ggaataccga tcaattgtat ttgaagaacc acgctttgtt gaatatttcc gccttgtaag 6840 tcttcggttt tctttgcttg tgttttcctt ttgaacacac ctttacttgt ctttatattg 6900 ttattatgca attaccacta tgagatttta attgtagctt ttatttaggc cttggtattt 6960 cactcttgtt tttgttagtt gggaattcat ctagctagtc ctgaagatta atatactgtt 7020 tcatttcgtt tgttttactg tcatgtcatt actccttgta gtaccctata aatttattat 7080 tttttggtaa tgggtccatt tttctgcata actaatcctg gcatttgtgt ctttctttca 7140 aataggcaac accagagatg gaatatggta ggatgaatat tggaagcaga ccatcgaaaa 7200 gaaagccaag tgcaggcatt gaatcactgc gtgcaatccc ttggatcttt gcttggacgc 7260 agactcggtt ccacctacca gtgtggcttg gttttggagc ggcattcaag catgtcttgg 7320 ataaggacat acggaatctt caaacccttc aagagatgta caatcagtgg ccatttttca 7380 gggttacaat agacttggtt gagatggtgt ttgccaaagg cgatcctggt atagcggctc 7440 tgtatgacaa gcttctagtt tcagaggatt tgtggtcatt cggcaagcgt cttagagcca 7500 actatgaaga aacaaagcaa cttcttctac aggtgatttg tctaagatct tcttgcattc 7560 gttatggact gctagagttg catgtagact atgtgatgcc tctaccaggc ttgaacattg 7620 gtgcgtctga atgagttgat aattaagtta atccgtaatc tatagccaca tcatgcccaa 7680 ctatttccag agaatgttta gatacaagct caaactggta gataaaccaa ggaggaaatg 7740 gttctggcaa taggatgtcc attcaccccg tcttgttctt gtctcaccca ctgcattgtg 7800 gcctgctgaa tttcaggttg ctgggcacaa agaccttctg gagggcgacc cttacctgaa 7860 gcagaggctg cgcatccgtg actcctacat cactgccctg aacgtgtgcc aagcttacat 7920 gctgaagcgc atcagggacc ctggcttcca ggtgaacccg gggcctcacc tgtcgaagga 7980 catcatggac atgggcaagc cggcctcgga gcttgtgaag ctcaacacca cgagcgagta 8040 cgccccggga ctggaggaca ccctcatcct gaccatgaag ggcatcgctg ccggaatgca 8100 gaacaccggc tgaaagaaca ggatccggag tgccttcttt attctgagct gatgtatcta 8160 tcgtagcgta ggggatcatg gcgtgaaccg gttaacaaga cgggggtgca cacctggata 8220 tgggggatta cctgttttag cagtagtagt atttactttt atgctatgct ctatcgaaac 8280 tcctatgtat gcatatccat gttgcttgag cctgcactag cttttggatc atagcttgtt 8340 aagtaatgcg cagggcatct tgttacggtg aaataactct gtgcttgtgc ttggtgctgg 8400 gctgctggca tatttgtgcc gaggagtcta ctgaattgca tggatcattg taccttttct 8460 gtcgtgcggt atcttgtcga atactactgt cctgggctaa cggacaggct gtagagacta 8520 gatgcgcacg tcgtgtatca cgcacgcaca acggccccct ggaaactgcg gaggcccgga 8580 gccctcggac gtgcacgcgc aaacaggggc tttgtcaaaa ttcaattttt cttctaat 8638 <210> 36 <211> 966 <212> PRT <213> Saccharum officinarum <400> 36 Met Ala Arg Asn Ala Val Asp Lys Ala Thr Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Leu Leu Ala Pro Gln Lys Leu Ser Asp Asp Asp Lys Leu Val Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Ile Arg Glu Thr Val Gln Glu Cys Tyr Glu Leu Ala 50 55 60 Ala Glu Tyr Glu Asn Lys Leu Asp Pro Lys Met Leu Asp Glu Ile Gly 65 70 75 80 Asn Val Leu Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Ile Thr Lys 85 90 95 Ser Phe Ser His Met Leu Ile Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala Tyr Arg Arg Arg Ile Lys Leu Lys Lys Gly Asp Phe Val Asp 115 120 125 Glu Asn Ser Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Leu Lys Arg 130 135 140 Leu Met His Gln Leu Lys Lys Ser Pro Leu Glu Val Phe Asp Ala Leu 145 150 155 160 Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser 165 170 175 Val Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile Arg Asn Cys Leu 180 185 190 Thr Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Glu Lys Gln Glu Leu 195 200 205 Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu 210 215 220 Ile Arg Arg Ala Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met 225 230 235 240 Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg 245 250 255 Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn Glu Arg Leu Pro 260 265 270 Tyr Asn Ala Pro Ile Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg 275 280 285 Asp Gly Asn Pro Arg Val Thr Pro Glu Ile Thr Arg Asp Val Cys Leu 290 295 300 Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Asn Ala Gln Ile Glu Asp 305 310 315 320 Leu Met Phe Glu Leu Ser Met Trp Arg Cys Ser Asp Glu Leu Arg Val 325 330 335 Lys Val Asp Glu Leu His Arg Ser Ser Lys Lys Asp Thr Thr Lys His 340 345 350 Tyr Ile Glu Phe Trp Lys Gln Val Pro Pro Ser Glu Pro Tyr Arg Val 355 360 365 Ile Leu Ser Asp Val Arg Asp Lys Leu Tyr Asn Thr Arg Glu Arg Ala 370 375 380 Arg His Leu Leu Ala Ser Gly Phe Ser Glu Ile Pro Glu Glu Ala Thr 385 390 395 400 Phe Thr Asp Val Glu Gln Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg 405 410 415 Ser Leu Cys Ala Cys Gly Asp Arg Ser Val Ala Asp Gly Ser Leu Leu 420 425 430 Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg Leu 435 440 445 Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Met Asp Ala Ile 450 455 460 Thr Glu Tyr Leu Gly Ile Gly Ser Tyr Arg Lys Trp Thr Glu Glu Lys 465 470 475 480 Arg Gln Glu Trp Leu Leu Ser Glu Leu Asn Gly Lys Arg Pro Leu Phe 485 490 495 Gly Pro Asp Leu Pro Lys Ser Asp Glu Ile Ala Asp Val Leu Asp Thr 500 505 510 Phe His Val Leu Ala Glu Leu Pro Ser Asp Ser Phe Gly Ala Tyr Val 515 520 525 Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu Leu 530 535 540 Gln Arg Glu Cys His Val Lys Lys Pro Leu Arg Val Val Pro Leu Phe 545 550 555 560 Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro Ala Ala Leu Ala Arg Leu 565 570 575 Phe Ser Val Glu Trp Tyr Arg Asn Arg Ile Asn Gly Lys Gln Glu Val 580 585 590 Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Phe Ser Ala 595 600 605 Ala Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Ile Asn Val Ala Lys 610 615 620 Leu Tyr Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr Val 625 630 635 640 Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro Pro 645 650 655 Glu Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val Ile 660 665 670 Glu Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln Arg 675 680 685 Phe Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro Ile Ser Pro 690 695 700 Lys Pro Glu Trp Arg Ala Leu Met Asp Glu Met Ala Ile Val Ala Thr 705 710 715 720 Lys Glu Tyr Arg Ser Ile Val Phe Glu Glu Pro Arg Phe Val Glu Tyr 725 730 735 Phe Arg Leu Ala Thr Pro Glu Met Glu Tyr Gly Arg Met Asn Ile Gly 740 745 750 Ser Arg Pro Ser Lys Arg Lys Pro Ser Ala Gly Ile Glu Ser Leu Arg 755 760 765 Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu Pro 770 775 780 Val Trp Leu Gly Phe Gly Ala Ala Phe Lys His Val Leu Asp Lys Asp 785 790 795 800 Ile Arg Asn Leu Gln Thr Leu Gln Glu Met Tyr Asn Gln Trp Pro Phe 805 810 815 Phe Arg Val Thr Ile Asp Leu Val Glu Met Val Phe Ala Lys Gly Asp 820 825 830 Pro Gly Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Glu Asp Leu 835 840 845 Trp Ser Phe Gly Lys Arg Leu Arg Ala Asn Tyr Glu Glu Thr Lys Gln 850 855 860 Leu Leu Leu Gln Val Ala Gly His Lys Asp Leu Leu Glu Gly Asp Pro 865 870 875 880 Tyr Leu Lys Gln Arg Leu Arg Ile Arg Asp Ser Tyr Ile Thr Ala Leu 885 890 895 Asn Val Cys Gln Ala Tyr Met Leu Lys Arg Ile Arg Asp Pro Gly Phe 900 905 910 Gln Val Asn Pro Gly Pro His Leu Ser Lys Asp Ile Met Asp Met Gly 915 920 925 Lys Pro Ala Ser Glu Leu Val Lys Leu Asn Thr Thr Ser Glu Tyr Ala 930 935 940 Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala 945 950 955 960 Gly Met Gln Asn Thr Gly 965 <210> 37 <211> 3522 <212> DNA <213> Pinus abies <400> 37 gcttgtccta acaatagaaa catggctttg agcatctcaa cctggatctt gaaataactt 60 ccgagcccga gatcattgaa actttgaaga aatcgtgttg ttgaattttt attgttgcag 120 aggaaagatc agaattttga gattttggcg aagcggaact tggatttagg agaaatctgt 180 tgcagagatg gcgcgcaaca acttggagaa gatggcatcc attgatgccc agatgaggct 240 cttggttcct ggaaaagttt ctgaggatga caagttgatt gagtacgatg cccttctact 300 ggatcgcttc cttgacatcc tgcaggactt acatggagaa gatatcaggg cgatggttca 360 agaatgctat gagcgttctg gtgaatatga gggaaagaat gatcctcaca agctggaaga 420 gttgggaaat gtattaacaa gtctggatcc tggggattca attgttgtgg ccagctcatt 480 ttcccacatg cttaatttag ctaatttagc tgaagaagtt cagattgctt accggcgccg 540 aaataaaata aagaggggcg gctttgcaga tgaaagcaat gcaactactg aatcagacat 600 tgaagaaact tttaaaaggc ttgtaaacca gttaggaaaa tcaccggcag aggtgtttga 660 tgctcttaag aatcagactg ttgatttggt gttgacagca catccaacac agtcagtccg 720 cagatcattg ctgcagaagc atgctaggat tcggaattgc ttgtctcagt tatatgggaa 780 agatattacc cctgatgaga agcaggagct tgatgaagct ttgctaagag agattcaagc 840 tgccttccgc acagatgaaa ttcggcgtac tcctcctact ccacaagatg agatgcgagc 900 aggaatgagc tattttcatg aaacaatttg gaagggtgtc cctaagtttt tacgccgtat 960 tgatactgcc ctgaagtcaa ttgggatcaa tgaacgagtg ccgtataatg cacctcttat 1020 acagttttct tcatggatgg gaggtgatcg agatggaaat cctagggtaa ctccagaagt 1080 aacaagagat gtatgcttac ttgcaagaat gatggcagca aatttatatt attcccagat 1140 agaggatctt atgtttgagt tgtccatgtg gcgttgtagt gatgagctga gagcacgagc 1200 cctacaactc catagtgcat caaagaaaga tgcaaagcat tacatagaat tttggaaaca 1260 gattcctcca aatgaacctt ttagggtgat attgggagat gtacgagata aattgtacaa 1320 tactcgagaa cgtactcgcc aattactttc taatggaatt tctgacatac cagaggaagt 1380 aacctttaca aatattgacg agtttttgga gccacttgaa ctttgttacc gatcactgtg 1440 ttctactggg gaccagccaa ttgcagatgg cagtcttctt gattttatgc gtcaagtttc 1500 aacatttggt ttgtcatttg ttaagctgga tattagacag gaatctgaca gacacagtga 1560 tgttgctgat gcaattacaa ggcatttagg cattggatcc tacaaagagt ggtcagagga 1620 acaacgacaa gcatggctct tgtcagaact gcaagggaaa cgtcccttgt ttgggccgga 1680 cctcccaaag acagatgagg ttcgagatgt tctagacaca tttcatgtaa tatctgagct 1740 tcctgctgac aattttggag cttatattat ttcaatggca actgcagcat cagatgtttt 1800 agtggttgag ttattacaac gggaatgcca tgtgaaaaaa ccattacgtg ttgtaccatt 1860 atttgagaag cttgcagatc tagaggctgc tcctgctgct ttggctagat tgttttcaat 1920 aaactggtac agaaacagaa ttgatggaaa gcaagaagtc atgattggtt actctgattc 1980 tggaaaggat gctggtaggt tgagtgcagg ttgggctttg tacaaagcac aggaagacct 2040 tataaaggtt gctaaagaat ttggtattaa gttgacaatg ttccatggtc gtggaggaac 2100 tgtaggcagg gggggaggcc caacccatct ggccatattg tcacaacctc cagacacaat 2160 tcatggctct tttcgggtca ctgttcaagg ggaagtcata gaacagtcat ttggtgagga 2220 acatttgtgt ttcagaactc tccaacgatt tactgctgcc actcttgagc atggaatgcg 2280 gcctccagtt gcaccaaagc ctgagtggcg tgaactgatg gatgaaatgg ctgttgttgc 2340 tacgaaggag tacaggtcaa ttgttttcca ggacccaaga ttcgttgaat atttccgttc 2400 tgcaacacca gaattggagt atggtcgaat gaacatcggg agtcgcccct caaaaaggaa 2460 gccaagtggg ggcattgagt cactccgtgc catcccatgg atatttgctt ggacacaaac 2520 tcgatttcat cttcctgttt ggcttggatt tggtgcagca ttcaagcatg ttatggagaa 2580 ggatataaga aatctccata tgctgcagca gatgtacaat gaatggccat tctttcgggt 2640 tacaattgat ctaattgaaa tggtttttgc aaaaggtgat ccagggatag ctgctttgta 2700 tgacaaacta ctggtatctg atgatttgtg ggccattggt gaaaaattga gagctaacta 2760 tggtgaaacc aaagatttgc tactgcaggt tgctggacat aaagatctac ttgaaggtga 2820 tccatacttg aaacagcgac tcagacttcg tgactcatac attacaactc tgaatgtttg 2880 tcaggcttat actttgaaaa gaattagaga ccccaactat catgttaatc ttaggcctca 2940 tttgtcgaag gaaagttcaa ccaaaccggc agctgaattg gtcaaactga atccaacgag 3000 tgagtatgca ccaggtctgg aggatacatt gattctaacc atgaagggca tagcagctgg 3060 tatgcagaac actggttaga aggattttgg aaacggatca ggcattttct catgttagga 3120 gtcaggacta taacggaagt ttcttgagac ctacttctga gggaccttct tcagattcca 3180 gtatttaagg cagcttctaa atatgtcaaa gcaccagcaa gaatgatctg ccagtgtaga 3240 tatggtcatt taataagctc gagaagagag caaatgttgg ttgtcagttg acaactttca 3300 aggattttat tataacgagt ctaggatcat atatgatctt aggatcccta atatatatga 3360 aaagccctaa aacatgtagt tttgtgaact ggacttgagg accaggactc ctttatatgc 3420 aaggcttggg aagtacaatg atttaacttg atgaatgcat taataatgat ctttagcatg 3480 ctgttgtttg tggcaaaaaa aaaaaaaaaa aaaaaaaaaa aa 3522 <210> 38 <211> 963 <212> PRT <213> Pinus abies <400> 38 Met Ala Arg Asn Asn Leu Glu Lys Met Ala Ser Ile Asp Ala Gln Met 1 5 10 15 Arg Leu Leu Val Pro Gly Lys Val Ser Glu Asp Asp Lys Leu Ile Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Ile Arg Ala Met Val Gln Glu Cys Tyr Glu Arg Ser 50 55 60 Gly Glu Tyr Glu Gly Lys Asn Asp Pro His Lys Leu Glu Glu Leu Gly 65 70 75 80 Asn Val Leu Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Val Ala Ser 85 90 95 Ser Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala Tyr Arg Arg Arg Asn Lys Ile Lys Arg Gly Gly Phe Ala Asp 115 120 125 Glu Ser Asn Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Phe Lys Arg 130 135 140 Leu Val Asn Gln Leu Gly Lys Ser Pro Ala Glu Val Phe Asp Ala Leu 145 150 155 160 Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser 165 170 175 Val Arg Arg Ser Leu Leu Gln Lys His Ala Arg Ile Arg Asn Cys Leu 180 185 190 Ser Gln Leu Tyr Gly Lys Asp Ile Thr Pro Asp Glu Lys Gln Glu Leu 195 200 205 Asp Glu Ala Leu Leu Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu 210 215 220 Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met 225 230 235 240 Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg 245 250 255 Arg Ile Asp Thr Ala Leu Lys Ser Ile Gly Ile Asn Glu Arg Val Pro 260 265 270 Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg 275 280 285 Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys Leu 290 295 300 Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Tyr Ser Gln Ile Glu Asp 305 310 315 320 Leu Met Phe Glu Leu Ser Met Trp Arg Cys Ser Asp Glu Leu Arg Ala 325 330 335 Arg Ala Leu Gln Leu His Ser Ala Ser Lys Lys Asp Ala Lys His Tyr 340 345 350 Ile Glu Phe Trp Lys Gln Ile Pro Pro Asn Glu Pro Phe Arg Val Ile 355 360 365 Leu Gly Asp Val Arg Asp Lys Leu Tyr Asn Thr Arg Glu Arg Thr Arg 370 375 380 Gln Leu Leu Ser Asn Gly Ile Ser Asp Ile Pro Glu Glu Val Thr Phe 385 390 395 400 Thr Asn Ile Asp Glu Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg Ser 405 410 415 Leu Cys Ser Thr Gly Asp Gln Pro Ile Ala Asp Gly Ser Leu Leu Asp 420 425 430 Phe Met Arg Gln Val Ser Thr Phe Gly Leu Ser Phe Val Lys Leu Asp 435 440 445 Ile Arg Gln Glu Ser Asp Arg His Ser Asp Val Ala Asp Ala Ile Thr 450 455 460 Arg His Leu Gly Ile Gly Ser Tyr Lys Glu Trp Ser Glu Glu Gln Arg 465 470 475 480 Gln Ala Trp Leu Leu Ser Glu Leu Gln Gly Lys Arg Pro Leu Phe Gly 485 490 495 Pro Asp Leu Pro Lys Thr Asp Glu Val Arg Asp Val Leu Asp Thr Phe 500 505 510 His Val Ile Ser Glu Leu Pro Ala Asp Asn Phe Gly Ala Tyr Ile Ile 515 520 525 Ser Met Ala Thr Ala Ala Ser Asp Val Leu Val Val Glu Leu Leu Gln 530 535 540 Arg Glu Cys His Val Lys Lys Pro Leu Arg Val Val Pro Leu Phe Glu 545 550 555 560 Lys Leu Ala Asp Leu Glu Ala Ala Pro Ala Ala Leu Ala Arg Leu Phe 565 570 575 Ser Ile Asn Trp Tyr Arg Asn Arg Ile Asp Gly Lys Gln Glu Val Met 580 585 590 Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ser Ala Gly 595 600 605 Trp Ala Leu Tyr Lys Ala Gln Glu Asp Leu Ile Lys Val Ala Lys Glu 610 615 620 Phe Gly Ile Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr Val Gly 625 630 635 640 Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro Pro Asp 645 650 655 Thr Ile His Gly Ser Phe Arg Val Thr Val Gln Gly Glu Val Ile Glu 660 665 670 Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln Arg Phe 675 680 685 Thr Ala Ala Thr Leu Glu His Gly Met Arg Pro Pro Val Ala Pro Lys 690 695 700 Pro Glu Trp Arg Glu Leu Met Asp Glu Met Ala Val Val Ala Thr Lys 705 710 715 720 Glu Tyr Arg Ser Ile Val Phe Gln Asp Pro Arg Phe Val Glu Tyr Phe 725 730 735 Arg Ser Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn Ile Gly Ser 740 745 750 Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu Ser Leu Arg Ala 755 760 765 Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu Pro Val 770 775 780 Trp Leu Gly Phe Gly Ala Ala Phe Lys His Val Met Glu Lys Asp Ile 785 790 795 800 Arg Asn Leu His Met Leu Gln Gln Met Tyr Asn Glu Trp Pro Phe Phe 805 810 815 Arg Val Thr Ile Asp Leu Ile Glu Met Val Phe Ala Lys Gly Asp Pro 820 825 830 Gly Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Asp Asp Leu Trp 835 840 845 Ala Ile Gly Glu Lys Leu Arg Ala Asn Tyr Gly Glu Thr Lys Asp Leu 850 855 860 Leu Leu Gln Val Ala Gly His Lys Asp Leu Leu Glu Gly Asp Pro Tyr 865 870 875 880 Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr Thr Leu Asn 885 890 895 Val Cys Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Asn Tyr His 900 905 910 Val Asn Leu Arg Pro His Leu Ser Lys Glu Ser Ser Thr Lys Pro Ala 915 920 925 Ala Glu Leu Val Lys Leu Asn Pro Thr Ser Glu Tyr Ala Pro Gly Leu 930 935 940 Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala Gly Met Gln 945 950 955 960 Asn Thr Gly <210> 39 <211> 3158 <212> DNA <213> Lotus japonicus <220> <221> misc_feature <222> (3088)..(3088) <223> n is a, c, g, or t <400> 39 gggtttgtga agttacaatg gcgaacagga acttggagaa gatggcatcc attgatgctc 60 agcttcggca attggttcct gctaaagtca gcgaggatga taagctggtt gagtatgatg 120 ctctgctact ggatcggttc cttgatattc tccaggattt acatggggag gatctgagag 180 aaactgttca agaagtatat gagctttctg ctgagtatga aagaaagcat gaacctcaga 240 gactggaagt acttggaaat ctgataacta gtttggacgc tggagattcc attgttgttg 300 ccaagtcctt tgcccacatg cttaatttgg caaacttagc tgaagaggtc cagattgctc 360 accgccgtag gatcaagttg aaaaaggggg atttcgctga tgagggcaat gcaaccactg 420 aatcagatat tgaagaaact ttcaagaaac ttgtaggtga aatgaagaag tctcctcagg 480 aagtttttga tgaactgaaa aatcagactg ttgatctggt tcttactgct catcctactc 540 aatcagttcg tagatctttg ctgcagaagc atggaaggat acgaaattgc ttaactcaat 600 tgtatgccaa agacatcact cctgatgata agcaggagct tgatgaggct ctacagagag 660 agatccaagc tgctttccgt actgatgaaa tcaggagaac cgctccaaca ccacaagatg 720 aaatgagagc agggatgagc tactttcatg aaacaatttg gaagggtgtg cccaaatttc 780 tgcgtcgtgt tgatacagct ttgaagaata tagggattaa tgagcgtgtc ccgtataatg 840 ctccacttat tcaattttct tcttggatgg gtggtgatcg tgatggcaat ccaagagtaa 900 ctcctgaagt gacaagggat gtttgcttat tggctagaat gatggctgct aatttgtatt 960 attcacagat tgaggatctt atgtttgaac tgtccatgtg gcgctgcaat gatgagctgc 1020 gtgtccgggc tgaggaactt accagttctt ccaataaaga tgcagttgca aaacactaca 1080 tagagttttg gaaaaacatt cctccaagtg aaccgtatcg tgtggtactg ggtgaagtaa 1140 ggaacagact ctaccagact cgtgagcgtt ctcgccattt gcttgctaat gagtactctg 1200 acattctaga ggaacacact ttcactaatg tggaggagtt cctggaaccc ctcgagctct 1260 gttatagatc actttgtgcc tgtggtgatc gggcaattgc tgatggaagc cttctagatt 1320 ttttgaggca agtctctact tttggactgt ccctagttag gcttgatatt aggcaagagt 1380 ccgaccgtct tactgatgtg ctggatgcca tcaccaaaca tttgggaatc ggctcctacc 1440 tggaatggtc tgaagaaaag cggcagcaat ggcttttgtc cgagttgagt ggcaaacgcc 1500 ctctctttgg acctgatctt ccccaaactg aagagatcaa agatgttctc gacacatttc 1560 atgtcatagc agaacttcca tctgataact ttggagcata tatcatatca atggcaactg 1620 caccatctga tgtgcttgca gttgaactcc tgcaacgtga atgccatgtc aagaatccgt 1680 taagagtcgt cccattgttt gagaagcttg ctgatctgga aacagctccc gctgctttgg 1740 ctcggttgtt ctccgttgag tggtaccgaa accggatcaa cgggaaacaa gaagtcatga 1800 ttggctattc tgattcaggt aaagatgctg gaaggttctc tgcagcgtgg cagctatata 1860 aggctcaaga agagcttatt aaggtagcta aggaatatgg tgttaagcta acaatgttcc 1920 atggtcgtgg agggactgtc ggcagaggag gcggtcctac tcaccttgct atcctgtctc 1980 agcctccaga cacaatccat ggatcactcc gtgttactgt ccaaggagaa gttatcgagc 2040 agtcatttgg agaggagcac ttgtgtttca gaacccttca acgttacact gcagctactc 2100 tagaacatgg aatgcatccc ccaatttccc ccaaaccaga atggcgtgct ttgatggacg 2160 agatggctgt tattgccact gaggaatacc gttctattgt attcaaagaa ccccgttttg 2220 ttgagtattt ccgcctggct acaccggagt tggagtatgg ccgaatgaat attggaagtc 2280 ggccggcaaa gagaaagcct agtggaggca ttgagacgct ccgcgctata ccttggatct 2340 ttgcctggac acagacaagg tttcaccttc cagtgtggct agggtttggg gctgcattca 2400 aacatgtgat tgcaaaggat atcagaaatc ttaacatgct gcaagagatg tacaatcaat 2460 ggcctttctt tagggtcact attgatttag tggaaatggt gttcgccaag ggagaccccg 2520 gtatagctgc tttgtatgac aggctccttg tttcagaaga tttgtggtca tttggggaac 2580 agttgaggac catgtttgaa gaaactaagc aactgctact tcaggtggct gcacacaagg 2640 atcttcttga aggtgatcct tacttgaaac aaagactccg gttgcgtgat tcttacatca 2700 ctaccctcaa tgtgtgccaa gcttacacat tgaagcgaat ccgcgatccg aactataatg 2760 tgaagctacg cccccacatc tctaaagagg ctatagacgt gagtaaacct gcggatgaac 2820 ttgttactct gaacccaaca agtgaatatg cacctggttt ggaagacacc ctcattctca 2880 ccatgaaggg tattgctgcc ggcatgcaaa acactggtta aatctgagag attctacttc 2940 tgttttctgt tctcctgttt tatcaaaata atgaatttag atacgactca cccaaagagg 3000 gtgtttgttt tccttttccc agttgaaata tcatttgata taaattatgt ttccatgctt 3060 tgctatataa agcatcgttt ggctgctntg aaacaatgat taatgccagt atgcaactga 3120 ttatgtttta actgaaaaaa aaaaaaaaaa aaaaaaaa 3158 <210> 40 <211> 967 <212> PRT <213> Lotus japonicus <400> 40 Met Ala Asn Arg Asn Leu Glu Lys Met Ala Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Gln Leu Val Pro Ala Lys Val Ser Glu Asp Asp Lys Leu Val Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Leu Arg Glu Thr Val Gln Glu Val Tyr Glu Leu Ser 50 55 60 Ala Glu Tyr Glu Arg Lys His Glu Pro Gln Arg Leu Glu Val Leu Gly 65 70 75 80 Asn Leu Ile Thr Ser Leu Asp Ala Gly Asp Ser Ile Val Val Ala Lys 85 90 95 Ser Phe Ala His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala His Arg Arg Arg Ile Lys Leu Lys Lys Gly Asp Phe Ala Asp 115 120 125 Glu Gly Asn Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Phe Lys Lys 130 135 140 Leu Val Gly Glu Met Lys Lys Ser Pro Gln Glu Val Phe Asp Glu Leu 145 150 155 160 Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser 165 170 175 Val Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile Arg Asn Cys Leu 180 185 190 Thr Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu Leu 195 200 205 Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu 210 215 220 Ile Arg Arg Thr Ala Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met 225 230 235 240 Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg 245 250 255 Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn Glu Arg Val Pro 260 265 270 Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg 275 280 285 Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys Leu 290 295 300 Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Tyr Ser Gln Ile Glu Asp 305 310 315 320 Leu Met Phe Glu Leu Ser Met Trp Arg Cys Asn Asp Glu Leu Arg Val 325 330 335 Arg Ala Glu Glu Leu Thr Ser Ser Ser Asn Lys Asp Ala Val Ala Lys 340 345 350 His Tyr Ile Glu Phe Trp Lys Asn Ile Pro Pro Ser Glu Pro Tyr Arg 355 360 365 Val Val Leu Gly Glu Val Arg Asn Arg Leu Tyr Gln Thr Arg Glu Arg 370 375 380 Ser Arg His Leu Leu Ala Asn Glu Tyr Ser Asp Ile Leu Glu Glu His 385 390 395 400 Thr Phe Thr Asn Val Glu Glu Phe Leu Glu Pro Leu Glu Leu Cys Tyr 405 410 415 Arg Ser Leu Cys Ala Cys Gly Asp Arg Ala Ile Ala Asp Gly Ser Leu 420 425 430 Leu Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg 435 440 445 Leu Asp Ile Arg Gln Glu Ser Asp Arg Leu Thr Asp Val Leu Asp Ala 450 455 460 Ile Thr Lys His Leu Gly Ile Gly Ser Tyr Leu Glu Trp Ser Glu Glu 465 470 475 480 Lys Arg Gln Gln Trp Leu Leu Ser Glu Leu Ser Gly Lys Arg Pro Leu 485 490 495 Phe Gly Pro Asp Leu Pro Gln Thr Glu Glu Ile Lys Asp Val Leu Asp 500 505 510 Thr Phe His Val Ile Ala Glu Leu Pro Ser Asp Asn Phe Gly Ala Tyr 515 520 525 Ile Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu 530 535 540 Leu Gln Arg Glu Cys His Val Lys Asn Pro Leu Arg Val Val Pro Leu 545 550 555 560 Phe Glu Lys Leu Ala Asp Leu Glu Thr Ala Pro Ala Ala Leu Ala Arg 565 570 575 Leu Phe Ser Val Glu Trp Tyr Arg Asn Arg Ile Asn Gly Lys Gln Glu 580 585 590 Val Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Phe Ser 595 600 605 Ala Ala Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Ile Lys Val Ala 610 615 620 Lys Glu Tyr Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr 625 630 635 640 Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro 645 650 655 Pro Asp Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val 660 665 670 Ile Glu Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln 675 680 685 Arg Tyr Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro Ile Ser 690 695 700 Pro Lys Pro Glu Trp Arg Ala Leu Met Asp Glu Met Ala Val Ile Ala 705 710 715 720 Thr Glu Glu Tyr Arg Ser Ile Val Phe Lys Glu Pro Arg Phe Val Glu 725 730 735 Tyr Phe Arg Leu Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn Ile 740 745 750 Gly Ser Arg Pro Ala Lys Arg Lys Pro Ser Gly Gly Ile Glu Thr Leu 755 760 765 Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu 770 775 780 Pro Val Trp Leu Gly Phe Gly Ala Ala Phe Lys His Val Ile Ala Lys 785 790 795 800 Asp Ile Arg Asn Leu Asn Met Leu Gln Glu Met Tyr Asn Gln Trp Pro 805 810 815 Phe Phe Arg Val Thr Ile Asp Leu Val Glu Met Val Phe Ala Lys Gly 820 825 830 Asp Pro Gly Ile Ala Ala Leu Tyr Asp Arg Leu Leu Val Ser Glu Asp 835 840 845 Leu Trp Ser Phe Gly Glu Gln Leu Arg Thr Met Phe Glu Glu Thr Lys 850 855 860 Gln Leu Leu Leu Gln Val Ala Ala His Lys Asp Leu Leu Glu Gly Asp 865 870 875 880 Pro Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr Thr 885 890 895 Leu Asn Val Cys Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Asn 900 905 910 Tyr Asn Val Lys Leu Arg Pro His Ile Ser Lys Glu Ala Ile Asp Val 915 920 925 Ser Lys Pro Ala Asp Glu Leu Val Thr Leu Asn Pro Thr Ser Glu Tyr 930 935 940 Ala Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala 945 950 955 960 Ala Gly Met Gln Asn Thr Gly 965 <210> 41 <211> 3189 <212> DNA <213> Nicotiana tabacum <400> 41 aaaaattgtc cacttgtagg aaaggagatt attggggttg ttgatagtgt gaaaaatggc 60 gacacggagt ttggagaaat tggcatcaat tgatgcacag ttaagggcat tggttcctgg 120 caaagtttct gaggatgata agttggttga gtatgatgct ttgcttttgg atcggtttct 180 tgatattctt caggatttac atggggaaga tcttaaggaa acggtccaag aatgttatga 240 actttctgcg gaatacgaag gcaagcacga tccaaagaag ctggaggagc ttggaaatgt 300 gttgacaagt ttggatccag gggattccat tgtcattgct aaagctttct ctcacatgct 360 taatttggcc aacttggccg aggaggtgca gatcgcctac cgtcgacgac aaaagttgaa 420 aaggggggac tttgctgatg agaacaatgc aacaactgaa tcagatattg aagaaacttt 480 caagaaactt gtaggggact tgaaaaagtc tcctcaagaa gttttcgatg ctctgaaaaa 540 tcagactgtg gatttagtct taactgctca tcctactcaa tctgtccgaa gatctttgct 600 tcaaaagcac ggaaggatcc gagattgctt ggctcagttg tatgctaaag acattacacc 660 cgatgataaa caagagctcg atgaggcttt acagagggag attcaagctg ctttccgcac 720 tgatgaaatt cggaggactg ctccaactcc acaagatgaa atgagagctg gaatgagcta 780 ctttcatgaa actatttgga agggtgttcc aaagttcctt cgtcgtgttg atacagctct 840 taaaaacata gggattaacg aacgacttcc ttacaatgct cctcttattc aattctcctc 900 ttggatgggt ggtgaccggg atggcaatcc aagagtgact cttgaggtca caagagatgt 960 ctgcttacta gcaagaatga tggcagcgaa tttgtactat tcgcaaatag aggaactcat 1020 gtttgagtta tctatgtggc gttgcaatga tgaccttcgt attcgagcag ctgaacttta 1080 caggtcctca aggagggaca ctaagcacta catagaattt tggaaaacaa ttccgccaag 1140 tgaaccatac cgtgtaattc ttggcgatgt gagagataag ctgtatcaga cacgtgagcg 1200 tactcgccaa atgttagccc atggaatctc tgatattcct gaggatgcaa cttataataa 1260 tgttgagcag ttcttggaac ctcttgaact ctgctacaga tctctttgtg aatgtggtga 1320 tcgccccatt gccgatggaa gccttctgga ttttcttaga caagtttcta cctttggact 1380 ctcatttgtt agacttgaca taagacaaga gtcagaccgc cacactgacg tccttgatgc 1440 cattacccag cacttggaaa tcggttcata tcgagagtgg tctgaagaac gtagacagga 1500 gtggcttctt tctgaactca gcggcaagag acctttattt ggacctgatc ttccaagaac 1560 cgaagaaatt gctgacgtct tggatacgct ccatgtcata gcagaacttc catctgactg 1620 cttcggggca tatatcatct caatggccac tgcaccatct gacgtgcttg cagttgagct 1680 cctacagcgt gaatgccatg tgaagcaacc tttacgagtg gttccacttt tcgaaaagtt 1740 ggatgatctg gagtctgcgt ctgcggctgt tgcacgtctc ttttcgattg agtggtacag 1800 aaaccggatt aacggtaaac aagaggtcat ggtcgggtat tcagactctg gcaaggatgc 1860 tggtcgtttc tcagcagcgt ggcagctata taaggctcaa gaggagctta taaaagttgc 1920 caaagaacat ggtgtgaagc taactatgtt ccacggtaga ggtggtacag taggaagagg 1980 aggtggcccc acccatcttg ctatattgtc tcagccacca gatacaattc agggatctct 2040 ccgtgtcaca gttcagggtg aagttatcga gcaatcgttt ggggaggaac acttgtgttt 2100 taggactctc caacgtttca ctgctgctac ccttgaacat gggatgcatc cacccgtctc 2160 tcccaaacca gaatggcgtg cacttatgga tgaaatcgcg gttattgcta cagagaagta 2220 taggtcaata gttttcaaag aacctcgatt tgttgagtat tccgccttgg ccacacctga 2280 gttagagtat ggtcgaatga acattggaag ccgtccatca aagcgtaaac ctagtggagg 2340 aatagaatca ctcagagcta ttccatggat ctttgcctgg acgcaaacta ggtttcatct 2400 ccccgtctgg cttggctttg gggcggcatt taagtatgcc attgacaagg atataaaaaa 2460 ccttcgcatg tttcacgaaa tgtacaatga atggccattc tttagagtca ctattgactt 2520 ggttgagatg gtgttcgcca agggaaaccc cggtattgca gctttgtatg acaagcttct 2580 cgtttcagaa gatttgttgc ctttcggcga gcttttgagg tccaactacg aggagacaag 2640 gagcctccta ctccagattg ctggacacaa ggatcttctg gagggagacc cctacttgaa 2700 acaacgactc aggctgcgtg attcctacat cacaacctta aacttgttgc aagcctacac 2760 tctcaagcgt atacgtgatc ctaactatca tgtcacgcta aggcctcata tttcgaagga 2820 ttacatggaa tcgaagtcag ctgctgaact tgtgcagctg aacccgacaa gtgaatatgc 2880 ccccggcttg gaggacacac tcatcttgac aatgaagggt attgctgctg gactgcagaa 2940 taccggttaa actcattctg atgttcgtgt tttttctaat tttttatata ctcgaaaagc 3000 atcattctgg tttatgagag gtagatgttt ttcatttctg ttgtgttttg tggtggtgaa 3060 agttttttat tccaccctat atatcatgtt tgataaaact aataagactc catttgagtg 3120 aggtttactt caccaaaatg aactgtaatc tcattgttgg ctcaatggaa tatcaagttt 3180 cttagatca 3189 <210> 42 <211> 964 <212> PRT <213> Nicotiana tabacum <400> 42 Met Ala Thr Arg Ser Leu Glu Lys Leu Ala Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Ala Leu Val Pro Gly Lys Val Ser Glu Asp Asp Lys Leu Val Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Leu Lys Glu Thr Val Gln Glu Cys Tyr Glu Leu Ser 50 55 60 Ala Glu Tyr Glu Gly Lys His Asp Pro Lys Lys Leu Glu Glu Leu Gly 65 70 75 80 Asn Val Leu Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Ile Ala Lys 85 90 95 Ala Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala Tyr Arg Arg Arg Gln Lys Leu Lys Arg Gly Asp Phe Ala Asp 115 120 125 Glu Asn Asn Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Phe Lys Lys 130 135 140 Leu Val Gly Asp Leu Lys Lys Ser Pro Gln Glu Val Phe Asp Ala Leu 145 150 155 160 Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser 165 170 175 Val Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile Arg Asp Cys Leu 180 185 190 Ala Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu Leu 195 200 205 Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu 210 215 220 Ile Arg Arg Thr Ala Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met 225 230 235 240 Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg 245 250 255 Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn Glu Arg Leu Pro 260 265 270 Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg 275 280 285 Asp Gly Asn Pro Arg Val Thr Leu Glu Val Thr Arg Asp Val Cys Leu 290 295 300 Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Tyr Ser Gln Ile Glu Glu 305 310 315 320 Leu Met Phe Glu Leu Ser Met Trp Arg Cys Asn Asp Asp Leu Arg Ile 325 330 335 Arg Ala Ala Glu Leu Tyr Arg Ser Ser Arg Arg Asp Thr Lys His Tyr 340 345 350 Ile Glu Phe Trp Lys Thr Ile Pro Pro Ser Glu Pro Tyr Arg Val Ile 355 360 365 Leu Gly Asp Val Arg Asp Lys Leu Tyr Gln Thr Arg Glu Arg Thr Arg 370 375 380 Gln Met Leu Ala His Gly Ile Ser Asp Ile Pro Glu Asp Ala Thr Tyr 385 390 395 400 Asn Asn Val Glu Gln Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg Ser 405 410 415 Leu Cys Glu Cys Gly Asp Arg Pro Ile Ala Asp Gly Ser Leu Leu Asp 420 425 430 Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Phe Val Arg Leu Asp 435 440 445 Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Leu Asp Ala Ile Thr 450 455 460 Gln His Leu Glu Ile Gly Ser Tyr Arg Glu Trp Ser Glu Glu Arg Arg 465 470 475 480 Gln Glu Trp Leu Leu Ser Glu Leu Ser Gly Lys Arg Pro Leu Phe Gly 485 490 495 Pro Asp Leu Pro Arg Thr Glu Glu Ile Ala Asp Val Leu Asp Thr Leu 500 505 510 His Val Ile Ala Glu Leu Pro Ser Asp Cys Phe Gly Ala Tyr Ile Ile 515 520 525 Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu Leu Gln 530 535 540 Arg Glu Cys His Val Lys Gln Pro Leu Arg Val Val Pro Leu Phe Glu 545 550 555 560 Lys Leu Asp Asp Leu Glu Ser Ala Ser Ala Ala Val Ala Arg Leu Phe 565 570 575 Ser Ile Glu Trp Tyr Arg Asn Arg Ile Asn Gly Lys Gln Glu Val Met 580 585 590 Val Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Phe Ser Ala Ala 595 600 605 Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Ile Lys Val Ala Lys Glu 610 615 620 His Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr Val Gly 625 630 635 640 Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro Pro Asp 645 650 655 Thr Ile Gln Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val Ile Glu 660 665 670 Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln Arg Phe 675 680 685 Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro Val Ser Pro Lys 690 695 700 Pro Glu Trp Arg Ala Leu Met Asp Glu Ile Ala Val Ile Ala Thr Glu 705 710 715 720 Lys Tyr Arg Ser Ile Val Phe Lys Glu Pro Arg Phe Val Glu Tyr Ser 725 730 735 Ala Leu Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn Ile Gly Ser 740 745 750 Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu Ser Leu Arg Ala 755 760 765 Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu Pro Val 770 775 780 Trp Leu Gly Phe Gly Ala Ala Phe Lys Tyr Ala Ile Asp Lys Asp Ile 785 790 795 800 Lys Asn Leu Arg Met Phe His Glu Met Tyr Asn Glu Trp Pro Phe Phe 805 810 815 Arg Val Thr Ile Asp Leu Val Glu Met Val Phe Ala Lys Gly Asn Pro 820 825 830 Gly Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Glu Asp Leu Leu 835 840 845 Pro Phe Gly Glu Leu Leu Arg Ser Asn Tyr Glu Glu Thr Arg Ser Leu 850 855 860 Leu Leu Gln Ile Ala Gly His Lys Asp Leu Leu Glu Gly Asp Pro Tyr 865 870 875 880 Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr Thr Leu Asn 885 890 895 Leu Leu Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Asn Tyr His 900 905 910 Val Thr Leu Arg Pro His Ile Ser Lys Asp Tyr Met Glu Ser Lys Ser 915 920 925 Ala Ala Glu Leu Val Gln Leu Asn Pro Thr Ser Glu Tyr Ala Pro Gly 930 935 940 Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala Gly Leu 945 950 955 960 Gln Asn Thr Gly <210> 43 <211> 3048 <212> DNA <213> Glycine max <400> 43 ttttaggtga gggactgaaa ggtagcaatg gcgaccagga acttggaaaa gatggcatcc 60 attgatgcac agcttaggca attggctcct gccaaagtga gtgaggatga caaactgatt 120 gagtatgatg ctcttctgct ggatcggttc cttgatatcc ttcaagattt acatggggag 180 gatctgaagg aaacagttca agaagtgtat gaactttcag ctgagtatga aggaaagcat 240 gaccctaaga aactggaaga acttggaaat ttgataacca gtttggatgc tggggactct 300 attcttgttg ccaagtcctt ttcccacatg cttaatttgg ccaacttggc tgaagaggtc 360 cagatttctc gccgccgaag aaacaagttg aagaaagggg attttgcaga tgagaacaat 420 gcaactacag aatcagacat tgaagaaact ctcaagaaac ttgtatttga cttgaagaag 480 tctcctcagg aagtttttga tgcactgaaa aaccagactg ttgatttggt tcttactgct 540 catcctactc aatcaattcg tagatctttg cttcaaaagc atggaaggat aaggaattgt 600 ttatctcaat tgtatgccaa agacattact cctgatgata agcaggagct tgatgaggct 660 ctacaaaggg agattcaagc tgccttccgt acagatgaaa tcaggaggac ccctccaaca 720 ccacaagatg agatgagagc agggatgagc tacttccatg aaacaatttg gaacggtgtt 780 cccagatttc tgcgccgtgt agacacagct ttgaacaata tcgggattaa agagcgtgtt 840 ccttataatg ctccccttat tcaattttct tcttggatgg ggggtgatcg cgatggtaat 900 ccaagagtaa ctcctgaagt gacaagggat gtttgcttat tggctagaat gatggctgct 960 aatttgtatt attcccagat agaagatctt atgtttgagc tctctatgtg gcgctgcaat 1020 gatgaactac gcgttcgtgc agaagaactt cacaggtctt ccaagaaaga tgaagttgca 1080 aaacactata tagaattttg gaaaaaggtt cccccaaatg aaccatatcg tgtggtactc 1140 ggtgaagtaa gggataggct ctatcagact cgtgagcgtt ctcgccattt gctttctaat 1200 gggtactctg acattccaga ggaagccact ttcaccaatg ttgaggagtt cctggaatct 1260 cttgaactat gttacagatc actatgtgct tgtggtgata gagcaattgc tgatggaagc 1320 cttcttgatt tcatgagaca agtctccact tttggactgt cactagtgag gcttgatatc 1380 aggcaagagt cagatcgtca cactgatgtg ctggatgcca ttaccaaaca cttggaaatt 1440 ggctcgtacc aggaatggtc tgaagagaaa agacaggaat ggttgttgtc tgagttaagt 1500 ggcaaaaggc ctctatttgg acctgacctt cctcaaactg aagaaattag agatgttttg 1560 gacacatttc atgtcatagc agaactacca ccagacaact ttggagccta tatcatatca 1620 atggcaactg caccatctga tgtgcttgca gttgagcttc tacaacgtga atgtcacatc 1680 aagcatccct taagagttgt gccattgttt gagaagctag ctgatctaga ggctgctcct 1740 gctgctctgg cacggttgtt ctcgatagac tggtacagaa ataggatcaa tgggaagcaa 1800 gaagtgatga ttggatactc agattcaggg aaagatgctg ggaggttctc tgcagcatgg 1860 cagctatata aggctcagga ggaacttata aatgttgcca agaaatttgg tgttaagcta 1920 accatgttcc atggtcgcgg tggaactgtt ggaagaggag gtggacctac tcatcttgct 1980 attctgtctc aacctccaga cacaatccat ggatcacttc gtgtgacagt ccaaggtgaa 2040 gtcattgagc aatcatttgg agaacaacac ttgtgcttta gaacactaca acgtttcact 2100 gccgccactc tagaacatgg catgcacccc ccaatttcgc caaaaccaga atggcgtgct 2160 ttgatggatc agatggctgt cattgctact gaggaatacc gttccattgt attcaaggaa 2220 ccacgctttg ttgagtattt ccgcctggct acaccagagt tggagtatgg aaggatgaat 2280 attggaagtc gaccagcaaa gagaagacct agtggaggca ttgaaacact gcgtgcaata 2340 ccttggattt ttgcatggac tcagacaagg tttcatcttc cagtgtggct aggctttgga 2400 gcagcattta aaaaagtcat tgaggaaaat gttaagaatc tcaatatgct gcaagagatg 2460 tacaatcaat ggcctttctt tagggtcaca cttgatttgg tggaaatggt gtttgccaaa 2520 ggagatccga aaattgccgc tctgaatgat agactccttg tttcaaagga tctgtggccg 2580 tttggggatc aattgaggaa caaatatgaa gaaactagga aactcctact tcaggtggct 2640 ggacacaagg aaattcttga aggggaccct tacttgaagc aaagactcag gcttcgtcat 2700 gctcccatta ccaccctcaa tattgtccaa gcttacacat tgaaacgtat ccgtgatcct 2760 aactacaatg tgaaggtgcg cccccgcata tcaaaggaat ctgcagaggc aagcaaatca 2820 gctgatgaac ttgtcaaatt gaacccaaca agtgaatatg cccctggttt ggaagacaca 2880 ctcattctca ctatgaaggg tattgctgct ggcatgcaga acactggtta agtttgtttg 2940 aatactgaaa gtgagtgctc tgagttttgc tcacagaata cacttttttt gttttgttat 3000 tatgttgccc cacctttctg tacaatttgg tatgctgctc tagaattc 3048 <210> 44 <211> 967 <212> PRT <213> Glycine max <400> 44 Met Ala Thr Arg Asn Leu Glu Lys Met Ala Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Gln Leu Ala Pro Ala Lys Val Ser Glu Asp Asp Lys Leu Ile Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Leu Lys Glu Thr Val Gln Glu Val Tyr Glu Leu Ser 50 55 60 Ala Glu Tyr Glu Gly Lys His Asp Pro Lys Lys Leu Glu Glu Leu Gly 65 70 75 80 Asn Leu Ile Thr Ser Leu Asp Ala Gly Asp Ser Ile Leu Val Ala Lys 85 90 95 Ser Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ser Arg Arg Arg Arg Asn Lys Leu Lys Lys Gly Asp Phe Ala Asp 115 120 125 Glu Asn Asn Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Leu Lys Lys 130 135 140 Leu Val Phe Asp Leu Lys Lys Ser Pro Gln Glu Val Phe Asp Ala Leu 145 150 155 160 Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser 165 170 175 Ile Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile Arg Asn Cys Leu 180 185 190 Ser Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu Leu 195 200 205 Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu 210 215 220 Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met 225 230 235 240 Ser Tyr Phe His Glu Thr Ile Trp Asn Gly Val Pro Arg Phe Leu Arg 245 250 255 Arg Val Asp Thr Ala Leu Asn Asn Ile Gly Ile Lys Glu Arg Val Pro 260 265 270 Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg 275 280 285 Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys Leu 290 295 300 Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Tyr Ser Gln Ile Glu Asp 305 310 315 320 Leu Met Phe Glu Leu Ser Met Trp Arg Cys Asn Asp Glu Leu Arg Val 325 330 335 Arg Ala Glu Glu Leu His Arg Ser Ser Lys Lys Asp Glu Val Ala Lys 340 345 350 His Tyr Ile Glu Phe Trp Lys Lys Val Pro Pro Asn Glu Pro Tyr Arg 355 360 365 Val Val Leu Gly Glu Val Arg Asp Arg Leu Tyr Gln Thr Arg Glu Arg 370 375 380 Ser Arg His Leu Leu Ser Asn Gly Tyr Ser Asp Ile Pro Glu Glu Ala 385 390 395 400 Thr Phe Thr Asn Val Glu Glu Phe Leu Glu Ser Leu Glu Leu Cys Tyr 405 410 415 Arg Ser Leu Cys Ala Cys Gly Asp Arg Ala Ile Ala Asp Gly Ser Leu 420 425 430 Leu Asp Phe Met Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg 435 440 445 Leu Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Leu Asp Ala 450 455 460 Ile Thr Lys His Leu Glu Ile Gly Ser Tyr Gln Glu Trp Ser Glu Glu 465 470 475 480 Lys Arg Gln Glu Trp Leu Leu Ser Glu Leu Ser Gly Lys Arg Pro Leu 485 490 495 Phe Gly Pro Asp Leu Pro Gln Thr Glu Glu Ile Arg Asp Val Leu Asp 500 505 510 Thr Phe His Val Ile Ala Glu Leu Pro Pro Asp Asn Phe Gly Ala Tyr 515 520 525 Ile Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu 530 535 540 Leu Gln Arg Glu Cys His Ile Lys His Pro Leu Arg Val Val Pro Leu 545 550 555 560 Phe Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro Ala Ala Leu Ala Arg 565 570 575 Leu Phe Ser Ile Asp Trp Tyr Arg Asn Arg Ile Asn Gly Lys Gln Glu 580 585 590 Val Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Phe Ser 595 600 605 Ala Ala Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Ile Asn Val Ala 610 615 620 Lys Lys Phe Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr 625 630 635 640 Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro 645 650 655 Pro Asp Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val 660 665 670 Ile Glu Gln Ser Phe Gly Glu Gln His Leu Cys Phe Arg Thr Leu Gln 675 680 685 Arg Phe Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro Ile Ser 690 695 700 Pro Lys Pro Glu Trp Arg Ala Leu Met Asp Gln Met Ala Val Ile Ala 705 710 715 720 Thr Glu Glu Tyr Arg Ser Ile Val Phe Lys Glu Pro Arg Phe Val Glu 725 730 735 Tyr Phe Arg Leu Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn Ile 740 745 750 Gly Ser Arg Pro Ala Lys Arg Arg Pro Ser Gly Gly Ile Glu Thr Leu 755 760 765 Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu 770 775 780 Pro Val Trp Leu Gly Phe Gly Ala Ala Phe Lys Lys Val Ile Glu Glu 785 790 795 800 Asn Val Lys Asn Leu Asn Met Leu Gln Glu Met Tyr Asn Gln Trp Pro 805 810 815 Phe Phe Arg Val Thr Leu Asp Leu Val Glu Met Val Phe Ala Lys Gly 820 825 830 Asp Pro Lys Ile Ala Ala Leu Asn Asp Arg Leu Leu Val Ser Lys Asp 835 840 845 Leu Trp Pro Phe Gly Asp Gln Leu Arg Asn Lys Tyr Glu Glu Thr Arg 850 855 860 Lys Leu Leu Leu Gln Val Ala Gly His Lys Glu Ile Leu Glu Gly Asp 865 870 875 880 Pro Tyr Leu Lys Gln Arg Leu Arg Leu Arg His Ala Pro Ile Thr Thr 885 890 895 Leu Asn Ile Val Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Asn 900 905 910 Tyr Asn Val Lys Val Arg Pro Arg Ile Ser Lys Glu Ser Ala Glu Ala 915 920 925 Ser Lys Ser Ala Asp Glu Leu Val Lys Leu Asn Pro Thr Ser Glu Tyr 930 935 940 Ala Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala 945 950 955 960 Ala Gly Met Gln Asn Thr Gly 965 <210> 45 <211> 5920 <212> DNA <213> Solanum tuberosum <400> 45 ctatacctta ttgagtgtcc aaagtaaaga cttttttttc tcatcttttg tgttctgaca 60 taccaaaatt caggtactga acattattta tgttctccaa tttgccatac tcaaaatttc 120 aatctcttgt tttttttgtt tttttttgct aacaaataaa tcaacaagaa tataaaactt 180 agtagagagt tgccaactgg ggtttttgtt tgttttgaat tgccagaaca agagaaaaaa 240 aagtggtccc ttttttgtac ttttcttggg gtcatgatca gatattgtgg tcactgtaat 300 ttgtaaaaaa aatttgatga tttttatgtt tatgtctatt gctgcagagt gttgactgtt 360 gagtgagaaa tgactacgag gaatttggag aaacttgcat cgattgatgc acagttgagg 420 caattggtgc ctgctaaagt ttctgaagat gataaacttg ttgagtatga tgctttgctt 480 ttggataggt ttcttgatat tcttcaagat ttacatgggg aggatctcaa agaaacagta 540 tgcatttttc ccaatttatg tttgctgtta atgtaaccta tgaatgattt agacaattgt 600 aaattatcta cctaagttgt agtcttttat gttgtgtacc ctttgatgaa gttctgtgat 660 ttttgtcttt tggttactaa ggggttgttg tttttgtctt ccacttttaa tatggtttat 720 ttcttgaagt taaagattgg atttttatgt cacttgtaaa aaaggggaat aaaaagattg 780 gatttttatg tctgttctga ctgagttgac ttcaaacact tgaattggtt actaaagggt 840 gttgtttttg tcttccactt ttaatctggt ctatttcttg aagtaaaaaa gattgaattt 900 ttatgtcact tacaaaaaaa ggaacaaaaa gattggattt ttatgtctgt tctgactgag 960 tgaactacaa acatttgatt ctgaggtgtg tgtaatactt agagatggta tcgatataat 1020 ggtattcata tgcttcagta tagtttgact gtgttagtgg atgaaatccc atgtgtatgt 1080 tgacttgaga tcctaaactt gtgttgacca agtagtcttg ttttttcgga atgttttgtc 1140 gtgttttctt tagtatttgc cagatttctt cacttctgtt atttcttttt cgatcttatt 1200 ttccttaagc tgagggtata tcagaaacag tctctctacc tctcaaggta ggggtaaggt 1260 cttggtacac tctaccctcc ccagacccta cttgtggaat tacactgagt atgttgttgt 1320 aattgcaaaa gactggtcaa catttaagtc tttgatattt tcaatctcac attaggtcca 1380 agagtgttat gagctttctg ccgagtatga agccaagcat gatccgaaga agctggagga 1440 acttggcaat gtgttgacaa gtttggaccc aggagattca attgtcattg ctaaagcttt 1500 ctctcacatg cttaacttgg ccaatttggc tgaggaggtt cagattgcct accgtaggcg 1560 ccaaaaattg aagaaaaagg gagattttgg ggatgagagc aatgcaacaa ctgagtcaga 1620 tattgaagaa actttcaaga aattggtggg ggacttgaag aagtcccctc aagaagtttt 1680 tgatgctatc aagaatcaga ctgtggatct ggtcctaaca gctcatccta cacaatctgt 1740 acgaagatca ttgcttcaaa agcatggaag gtttggtctt taatcaccat gtttattgtc 1800 ttcagcagtt agagttgtct ccttggcttg tcattttatg ctagtttgtg cttcgatttt 1860 tccctaataa atataattgg aaatgctctt ttcggaccaa attttcgtgc tttcgtcggt 1920 tgtttactta cttgttctaa ccaaattttc aggatccgtg actgcttggc tcagttgtat 1980 gctaaagaca ttacacccga tgataaacaa gaacttgatg aggctttaca gagggaggta 2040 actatcgacg tttagttact tgatacatgt gtttttcctt gaatgaaatt ctattattag 2100 taccttcaat tctggtgtct ttctgactct actaatggat attttggtgc ttcaatatca 2160 tatagatatg tcttgatctg tcaggcctta tattatcaat ggacttactt ttttcatccc 2220 tctcatgaag attggagaag caaaaattat ctcataagtt acccatttaa tagttgcccc 2280 ttcattcatt tgaatgattt taccctgtaa aaagtggagc tggttatatg attgctctaa 2340 aattggatat gaagcaataa tagcaatctt cgaactcaaa tatgtgtcgc attctgtgga 2400 tcatggttta ttggtatgat gcacccatta ttcttttttg acaaatatct gctacttact 2460 tcctctgtag atccaagctg cgttccgaac tgatgagatc cgaagaactc ctcctactcc 2520 acaagatgaa atgagagctg gaatgagcta tttccatgaa acaatttgga agggtgtacc 2580 aaagtttctg cgccgtgttg atacagctct taaaaacata gggattaatg aacgagttcc 2640 ttataatgct ccccttattc aattctcctc ttggatgggc ggtgatcgtg atggtatgat 2700 tcctttactg tggagaatgt ttgcagttac tttagctaaa agctgagaaa acaaaatagg 2760 aattcggatt acataatttt gaaggggtgg aggaaagcaa aatactcctt ctgcttgaac 2820 gtggattact tagttactac atgcagtaga taatccttat ttatctgtca actctctgct 2880 accaagtaca ggtaatccaa gagtgactcc tgaggtcaca agagatgttt gcttattggc 2940 cagaatgatg gcagctaact tgtactattc gcaaatagag gacctcatgt ttgaggtatc 3000 caacaattaa atgtttttga gacttttgtc ttggttcaat tagtgaaaaa atcgcactat 3060 ctacactgtg atctttttct aaattgtaca atctttcagt tatctatgtg gcgctgcaat 3120 gaagaacttc gtgtgcgagc agatgatctc caaaggtctt caaggagaga tgaaaaacac 3180 tacataggta actaattgaa tattgctatt aaggttgatc catgaaattg aatcaaagaa 3240 gagttttcta gttgcatata accttgatag gacttttaaa tgcgtgtttg aagtatgatt 3300 caaattctcc tttcaagtga gccaagggtg tctttcatca ttgccgatgg gaaaaaaaaa 3360 gggtgagcaa agggtgttat tatttatgat ttaaagattg agaaaaagag gtcattctag 3420 catctggtat gctgattaga aattgcacga gaagctctct gtattctctt ggaaagatgt 3480 tcctttcttc caaaaaaatc tttggacaga gaaatcgcat aatctgtgat ctttcaacat 3540 tttcttctca tgcagaattt tggaagcaag ttcctccaaa tgaaccctat cgtgtaattc 3600 ttggtgatgt gagagataag ttgtatcaga cacgtgagcg tgctcgccaa ctgttaggcc 3660 atggatactc tgaaattcca gaggaagcaa cttatactaa tattgagcag gttcataata 3720 ctatacttct gtcttttcct gtgactgctt tctatatgta gacccttcta aattaagcag 3780 tgaatattca cttgtactct tgaaagctta actagtttta ctaaacagct tgacatgtta 3840 ttcatcgaaa aaatgaacta gaaaaacatg aggaagtgtg tctctttctt gttgaataac 3900 agcataagca tttgcatggt tgttctacca aaccaaaaac atataaatat ctgtgttgca 3960 tgtcatataa cactaatatg gtcatcattt tatgtagttc ttggagcctc ttgagctctg 4020 ctacagatct ctttgtgctt gtggtgacct ctccatcgcg gatggtagcc ttctggattt 4080 cctgagacaa gtttctacgt ttggactttc acttgtgaga cttgacataa gacaagagtc 4140 ggaccgccat actgatgtgc ttgacgctat tacgcaacat ttggaaattg gttcatatcg 4200 agactggtct gaagaacgta gacaagagtg gcttctgtct gaactcagtg gcaagagacc 4260 tttatttgga cctgatcttc caaaaactga agaaattgct gatgttttgg atacgttcca 4320 tgtcatagcc gaactcccag cagactgctt cggggcatac atcatctcaa tggccactgc 4380 accatctgat gttcttgcag tagagcttct acagcgtgaa tgccgagtga ggcaaccttt 4440 acgagttgtt ccactttttg agaagttggc tgatctggat gctgctcctg cagccgttgc 4500 acgtcttttc tcaattgagt ggtacagaaa ccggattaat ggcaagcaag aagtgatgat 4560 tggatactcc gactctggca aggatgcagg tcggctatca gcagcctggc agttatataa 4620 ggctcaagag gagcttatac aagtcgccaa ggagttcgac gtgaagctaa ccatgttcca 4680 tggtagaggt ggtacagtgg gaagaggagg tggccccgcc catcttgcca tattgtctca 4740 accacccgaa acaattcacg gatctctccg tgttacagtt cagggtgagg ttattgagca 4800 gtcttttggg gaagaacact tgtgttttag gacactccag cgttttactg ctgctacact 4860 tgaacatggg atgcatccac cagtctctcc aaaaccagaa tggcgtgcac ttatggacga 4920 aattgcagtt gttgcaacag aaaagtatcg atcaatagtt tttaaggaac cccgatttgt 4980 cgagtatttc cgcctggtaa gtatgctagc aatgaactca gttattaatt gtagatgctg 5040 tcacaaatat tgccttgagt tgtaataagc tatttttcat tgatcatgtt tgcaggccac 5100 acccgagtta gagtatggtc gaatgaacat tggcagccgt ccatcaaagc gtaaacccag 5160 cggaggcata gaatcactta gagctattcc gtggatcttt gcttggactc aaactagatt 5220 ccatcttcca gtctggctcg gctttggagc agcatttaag tatgccattg aaaaggatat 5280 caaaaacctt cgcatgctgc aggaaatgta caatgcatgg cctttcttta gggtaactat 5340 cgatttggtt gagatggtgt tcgccaaagg agacccaggc attgctgcat tgttcgacaa 5400 gcttctggtg tccgaagatt tgtggtcttt cggtgaactt ttgaggtcaa agtatgagga 5460 gacaaagagc ctcctcctgc aggtaatgtg acatatactt ctaaaaagga tcggttgaac 5520 acttattgtg ctcgattgct tcacaaactg gttccaagtt agtacatcta aacataattt 5580 tccctttccc tttttaaaat agattgctgg acacaaggat cttctggagg gtgatccata 5640 cttaaaacaa cgactcaggt tgcgtgactc ctacatcaca acattgaatg tgtgtcaagc 5700 ctacacccta aagcgtattc gtgacccaga ctatagtgtc acaccaaggc ctcacatttc 5760 caaggaatac atggaagcaa aaccagctac agaacttgtg aacctgaacc cgactagcga 5820 atatgcacct ggcttggagg acacactcat cttaaccatg aaaggtattg ctgctggaat 5880 gcagaatact ggttagtcgt cacctggaat atggaagatg 5920 <210> 46 <211> 965 <212> PRT <213> Solanum tuberosum <400> 46 Met Thr Thr Arg Asn Leu Glu Lys Leu Ala Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Gln Leu Val Pro Ala Lys Val Ser Glu Asp Asp Lys Leu Val Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Leu Lys Glu Thr Val Gln Glu Cys Tyr Glu Leu Ser 50 55 60 Ala Glu Tyr Glu Ala Lys His Asp Pro Lys Lys Leu Glu Glu Leu Gly 65 70 75 80 Asn Val Leu Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Ile Ala Lys 85 90 95 Ala Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln 100 105 110 Ile Ala Tyr Arg Arg Arg Gln Lys Leu Lys Lys Lys Gly Asp Phe Gly 115 120 125 Asp Glu Ser Asn Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Phe Lys 130 135 140 Lys Leu Val Gly Asp Leu Lys Lys Ser Pro Gln Glu Val Phe Asp Ala 145 150 155 160 Ile Lys Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln 165 170 175 Ser Val Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile Arg Asp Cys 180 185 190 Leu Ala Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu 195 200 205 Leu Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp 210 215 220 Glu Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly 225 230 235 240 Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu 245 250 255 Arg Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn Glu Arg Val 260 265 270 Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp 275 280 285 Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys 290 295 300 Leu Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Tyr Ser Gln Ile Glu 305 310 315 320 Asp Leu Met Phe Glu Leu Ser Met Trp Arg Cys Asn Glu Glu Leu Arg 325 330 335 Val Arg Ala Asp Asp Leu Gln Arg Ser Ser Arg Arg Asp Glu Lys His 340 345 350 Tyr Ile Glu Phe Trp Lys Gln Val Pro Pro Asn Glu Pro Tyr Arg Val 355 360 365 Ile Leu Gly Asp Val Arg Asp Lys Leu Tyr Gln Thr Arg Glu Arg Ala 370 375 380 Arg Gln Leu Leu Gly His Gly Tyr Ser Glu Ile Pro Glu Glu Ala Thr 385 390 395 400 Tyr Thr Asn Ile Glu Gln Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg 405 410 415 Ser Leu Cys Ala Cys Gly Asp Leu Ser Ile Ala Asp Gly Ser Leu Leu 420 425 430 Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg Leu 435 440 445 Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Leu Asp Ala Ile 450 455 460 Thr Gln His Leu Glu Ile Gly Ser Tyr Arg Asp Trp Ser Glu Glu Arg 465 470 475 480 Arg Gln Glu Trp Leu Leu Ser Glu Leu Ser Gly Lys Arg Pro Leu Phe 485 490 495 Gly Pro Asp Leu Pro Lys Thr Glu Glu Ile Ala Asp Val Leu Asp Thr 500 505 510 Phe His Val Ile Ala Glu Leu Pro Ala Asp Cys Phe Gly Ala Tyr Ile 515 520 525 Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu Leu 530 535 540 Gln Arg Glu Cys Arg Val Arg Gln Pro Leu Arg Val Val Pro Leu Phe 545 550 555 560 Glu Lys Leu Ala Asp Leu Asp Ala Ala Pro Ala Ala Val Ala Arg Leu 565 570 575 Phe Ser Ile Glu Trp Tyr Arg Asn Arg Ile Asn Gly Lys Gln Glu Val 580 585 590 Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ser Ala 595 600 605 Ala Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Ile Gln Val Ala Lys 610 615 620 Glu Phe Asp Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr Val 625 630 635 640 Gly Arg Gly Gly Gly Pro Ala His Leu Ala Ile Leu Ser Gln Pro Pro 645 650 655 Glu Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val Ile 660 665 670 Glu Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln Arg 675 680 685 Phe Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro Val Ser Pro 690 695 700 Lys Pro Glu Trp Arg Ala Leu Met Asp Glu Ile Ala Val Val Ala Thr 705 710 715 720 Glu Lys Tyr Arg Ser Ile Val Phe Lys Glu Pro Arg Phe Val Glu Tyr 725 730 735 Phe Arg Leu Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met Asn Ile Gly 740 745 750 Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu Ser Leu Arg 755 760 765 Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu Pro 770 775 780 Val Trp Leu Gly Phe Gly Ala Ala Phe Lys Tyr Ala Ile Glu Lys Asp 785 790 795 800 Ile Lys Asn Leu Arg Met Leu Gln Glu Met Tyr Asn Ala Trp Pro Phe 805 810 815 Phe Arg Val Thr Ile Asp Leu Val Glu Met Val Phe Ala Lys Gly Asp 820 825 830 Pro Gly Ile Ala Ala Leu Phe Asp Lys Leu Leu Val Ser Glu Asp Leu 835 840 845 Trp Ser Phe Gly Glu Leu Leu Arg Ser Lys Tyr Glu Glu Thr Lys Ser 850 855 860 Leu Leu Leu Gln Ile Ala Gly His Lys Asp Leu Leu Glu Gly Asp Pro 865 870 875 880 Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr Thr Leu 885 890 895 Asn Val Cys Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Asp Tyr 900 905 910 Ser Val Thr Pro Arg Pro His Ile Ser Lys Glu Tyr Met Glu Ala Lys 915 920 925 Pro Ala Thr Glu Leu Val Asn Leu Asn Pro Thr Ser Glu Tyr Ala Pro 930 935 940 Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala Gly 945 950 955 960 Met Gln Asn Thr Gly 965 <210> 47 <211> 3317 <212> DNA <213> Medicago sativa <400> 47 aaacactgtc cttctgatcc atttttccat tccttgtcat catcttcttc ttcgtatcta 60 actaactgtc tggcacacaa cacggtgaga gagtgaattg ctacaatggc aaacaagatg 120 gaaaaaatgg catcaattga tgcacagctt agacaattgg ttcctgcaaa agtgagtgaa 180 gatgataaac ttattgagta tgatgctttg ttgttggatc ggtttcttga tattcttcaa 240 gatttacatg gagaggatct gaaggattct gttcaagaag tgtatgaact gtctgctgaa 300 tatgaaagaa agcatgatcc taagaaactt gaagagcttg gaaatttgat cacaagtttc 360 gatgcaggtg actcaattgt tgttgccaag tccttttcac acatgcttaa cttggccaac 420 ttagctgaag aggttcaaat tgcgcaccgc cgaaggaaca agttgaagaa aggtgatttt 480 agggatgaga gcaatgcaac cactgaatct gacattgagg aaactctcaa gaaacttgtg 540 tttgacatga agaaatctcc tcaagaggtt tttgatgcat tgaagaacca gactgttgat 600 cttgttctta ctgctcatcc tactcagtcg gttcgtcgat ctttgcttca aaagcacgga 660 agggtaagga actgtttatc tcaattgtat gctaaagaca tcactcctga tgataagcag 720 gagcttgatg aagctctcca gagggagatt caagctgcat tccgtactga cgaaatcaag 780 aggactccac caactcccca agatgaaatg agagctggga tgagttactt ccatgaaaca 840 atttggaagg gtgtccctaa atttcttcgc cgtgttgata cggcattgaa gaacataggg 900 attaacgaac gtgttcccta taatgctcct cttattcaat tttcttcttg gatgggtggt 960 gatcgtgacg gtaatccaag agtgactcct gaagtgacaa gggatgtttg cttactagct 1020 agaatgatgg ctgctaactt gtattattca cagatagaag atcttatgtt tgaactttct 1080 atgtggcgtt gcaatgacga gctacgtgtt cgcgcagaag aacttcacag gaattccaag 1140 aaagatgaag ttgcaaaaca ctatatagag ttttggaaaa aaattccttt gaatgaacca 1200 taccgtgttg tactcgggga ggtaagggac aagctctatc gcactcgtga gcgttctcgt 1260 tatctcctag ctcatggcta ctgtgaaatt cctgaagaag ccacattcac caatgtcgat 1320 gagtttctgg aacctcttga actctgctac agatcactct gtgcttgtgg tgatcgtgca 1380 attgctgatg gaagccttct tgatttcttg aggcaagttt ccacttttgg actgtcactt 1440 gtaaggcttg atatacggca agagtctgat cgtcacactg acgtgatgga tgccattacc 1500 aaacatttgg aaattggatc ctaccaagaa tggtctgaag aaaaaagaca ggaatggctt 1560 ttgtccgagt tgattggcaa aaggccactc tttggacctg acctacccca aaccgatgaa 1620 attagagatg ttttagacac gttccgtgtc atagcagaac ttccatctga caactttgga 1680 gcctacatca tttcgatggc aactgcaccg tctgatgtgc tggcagttga gcttcttcaa 1740 cgtgaatgca aagtcaggaa tccattaaga gtcgttccgt tgtttgaaaa gcttgatgat 1800 cttgagtctg ctcctgctgc attggctcgg ttgttctcca tagactggta cattaaccgg 1860 atcgatggga agcaagaagt tatgattgga tattctgatt caggaaaaga tgctggaagg 1920 ttttctgcag catggcagct atataaggct caggaggacc tcatcaaagt cgcacagaaa 1980 tttggtgtta agctaaccat gttccacggt cgtggtggaa ctgttggaag aggaggtgga 2040 cctacccatc ttgctatctt gtctcaacca ccagaaacaa ttcacggatc tcttcgtgtg 2100 acagttcaag gtgaagttat tgaacagtcg ttcggtgagg aacacttgtg ctttaggaca 2160 ctgcaacgtt tcactgctgc tactctagaa catggaatgc gtcccccaag ctctccaaaa 2220 ccagaatggc gcgccttgat ggatcagatg gctgtcattg caactgagga ataccgttca 2280 attgtgttca aggaaccacg ttttgttgag tatttccgtc tggctacacc agagatggag 2340 tatggtagga tgaacattgg aagtcgaccg gcaaagagaa ggcctagtgg aggcattgaa 2400 acactgcgtg cgataccatg gatctttgcc tggacacaga caaggtttca tcttccagta 2460 tggctgggct ttggagcagc atttagacaa gttgttcaga aggatgttaa gaatctccat 2520 atgctgcaag agatgtacaa tcaatggcct ttctttaggg ttacaattga tttagttgaa 2580 atggtgtttg ccaagggtga ccctggtatt gcagcactga atgataggct cctagtttca 2640 aaggatctgt ggccatttgg ggaacaattg agaagcaaat atgaagaaac taagaaactc 2700 ctacttcagg tggctgcaca caaggaagtt cttgaaggtg acccctactt gaagcaaaga 2760 ctcagactcc gtgattcgta cattacaacc cttaatgttt tccaagccta cacattgaaa 2820 cggatccgcg atccaaacta caaggtggag gtgcgccccc caatatcgaa agagtctgct 2880 gaaacaagta aaccagctga tgaacttgta acattgaatc caacaagtga atatgctcct 2940 ggtttggaag acacactcat tcttaccatg aagggtattg ctgctggcat gcagaacact 3000 ggttaaattt tggttacatt tttcacttgt atttgtttct ttatgttaag tgtgtactaa 3060 gatttcataa atactagatg aatctagttg caaacaagca cttcaagtga gtgctttttt 3120 ctttttcttt ttcttttcat aagaatttca catcaggttt tgttggtgtg cttccttact 3180 ttgctgccac acaaatgagt tatgcaattg atgttatgtt tcaaggcata aattttgttg 3240 agtgctgcta ctatacgctt tcttgttcaa tttaatatga gactgaaaaa catagaaaat 3300 aggaacaatt ataataa 3317 <210> 48 <211> 966 <212> PRT <213> Medicago sativa <400> 48 Met Ala Asn Lys Met Glu Lys Met Ala Ser Ile Asp Ala Gln Leu Arg 1 5 10 15 Gln Leu Val Pro Ala Lys Val Ser Glu Asp Asp Lys Leu Ile Glu Tyr 20 25 30 Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu His 35 40 45 Gly Glu Asp Leu Lys Asp Ser Val Gln Glu Val Tyr Glu Leu Ser Ala 50 55 60 Glu Tyr Glu Arg Lys His Asp Pro Lys Lys Leu Glu Glu Leu Gly Asn 65 70 75 80 Leu Ile Thr Ser Phe Asp Ala Gly Asp Ser Ile Val Val Ala Lys Ser 85 90 95 Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln Ile 100 105 110 Ala His Arg Arg Arg Asn Lys Leu Lys Lys Gly Asp Phe Arg Asp Glu 115 120 125 Ser Asn Ala Thr Thr Glu Ser Asp Ile Glu Glu Thr Leu Lys Lys Leu 130 135 140 Val Phe Asp Met Lys Lys Ser Pro Gln Glu Val Phe Asp Ala Leu Lys 145 150 155 160 Asn Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser Val 165 170 175 Arg Arg Ser Leu Leu Gln Lys His Gly Arg Val Arg Asn Cys Leu Ser 180 185 190 Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu Leu Asp 195 200 205 Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu Ile 210 215 220 Lys Arg Thr Pro Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met Ser 225 230 235 240 Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg Arg 245 250 255 Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn Glu Arg Val Pro Tyr 260 265 270 Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg Asp 275 280 285 Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys Leu Leu 290 295 300 Ala Arg Met Met Ala Ala Asn Leu Tyr Tyr Ser Gln Ile Glu Asp Leu 305 310 315 320 Met Phe Glu Leu Ser Met Trp Arg Cys Asn Asp Glu Leu Arg Val Arg 325 330 335 Ala Glu Glu Leu His Arg Asn Ser Lys Lys Asp Glu Val Ala Lys His 340 345 350 Tyr Ile Glu Phe Trp Lys Lys Ile Pro Leu Asn Glu Pro Tyr Arg Val 355 360 365 Val Leu Gly Glu Val Arg Asp Lys Leu Tyr Arg Thr Arg Glu Arg Ser 370 375 380 Arg Tyr Leu Leu Ala His Gly Tyr Cys Glu Ile Pro Glu Glu Ala Thr 385 390 395 400 Phe Thr Asn Val Asp Glu Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg 405 410 415 Ser Leu Cys Ala Cys Gly Asp Arg Ala Ile Ala Asp Gly Ser Leu Leu 420 425 430 Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg Leu 435 440 445 Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Met Asp Ala Ile 450 455 460 Thr Lys His Leu Glu Ile Gly Ser Tyr Gln Glu Trp Ser Glu Glu Lys 465 470 475 480 Arg Gln Glu Trp Leu Leu Ser Glu Leu Ile Gly Lys Arg Pro Leu Phe 485 490 495 Gly Pro Asp Leu Pro Gln Thr Asp Glu Ile Arg Asp Val Leu Asp Thr 500 505 510 Phe Arg Val Ile Ala Glu Leu Pro Ser Asp Asn Phe Gly Ala Tyr Ile 515 520 525 Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu Leu 530 535 540 Gln Arg Glu Cys Lys Val Arg Asn Pro Leu Arg Val Val Pro Leu Phe 545 550 555 560 Glu Lys Leu Asp Asp Leu Glu Ser Ala Pro Ala Ala Leu Ala Arg Leu 565 570 575 Phe Ser Ile Asp Trp Tyr Ile Asn Arg Ile Asp Gly Lys Gln Glu Val 580 585 590 Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Phe Ser Ala 595 600 605 Ala Trp Gln Leu Tyr Lys Ala Gln Glu Asp Leu Ile Lys Val Ala Gln 610 615 620 Lys Phe Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr Val 625 630 635 640 Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro Pro 645 650 655 Glu Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val Ile 660 665 670 Glu Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln Arg 675 680 685 Phe Thr Ala Ala Thr Leu Glu His Gly Met Arg Pro Pro Ser Ser Pro 690 695 700 Lys Pro Glu Trp Arg Ala Leu Met Asp Gln Met Ala Val Ile Ala Thr 705 710 715 720 Glu Glu Tyr Arg Ser Ile Val Phe Lys Glu Pro Arg Phe Val Glu Tyr 725 730 735 Phe Arg Leu Ala Thr Pro Glu Met Glu Tyr Gly Arg Met Asn Ile Gly 740 745 750 Ser Arg Pro Ala Lys Arg Arg Pro Ser Gly Gly Ile Glu Thr Leu Arg 755 760 765 Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu Pro 770 775 780 Val Trp Leu Gly Phe Gly Ala Ala Phe Arg Gln Val Val Gln Lys Asp 785 790 795 800 Val Lys Asn Leu His Met Leu Gln Glu Met Tyr Asn Gln Trp Pro Phe 805 810 815 Phe Arg Val Thr Ile Asp Leu Val Glu Met Val Phe Ala Lys Gly Asp 820 825 830 Pro Gly Ile Ala Ala Leu Asn Asp Arg Leu Leu Val Ser Lys Asp Leu 835 840 845 Trp Pro Phe Gly Glu Gln Leu Arg Ser Lys Tyr Glu Glu Thr Lys Lys 850 855 860 Leu Leu Leu Gln Val Ala Ala His Lys Glu Val Leu Glu Gly Asp Pro 865 870 875 880 Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr Thr Leu 885 890 895 Asn Val Phe Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Asn Tyr 900 905 910 Lys Val Glu Val Arg Pro Pro Ile Ser Lys Glu Ser Ala Glu Thr Ser 915 920 925 Lys Pro Ala Asp Glu Leu Val Thr Leu Asn Pro Thr Ser Glu Tyr Ala 930 935 940 Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala 945 950 955 960 Gly Met Gln Asn Thr Gly 965 <210> 49 <211> 3213 <212> DNA <213> Zea mays <400> 49 gccctctcct ggctcctctc cttcctgctt ggtttttgct ttcagctctt gaaccgaatc 60 cactgccgcg gcgcttagca ttggggacta gggggccgac atggctgcct tagggccgaa 120 gatggagcgt ctgtcgtcga tcgacgcgca gctgcggatg ctggtgccgg ggaaggtttc 180 ggaggacgat aagctcatcg agtacgacgc tctcctcctc gatcggttcc tcgacatcct 240 tcaggacctc catggcgacg acctcaagga aatggttcaa gaatgctatg aggtagctgc 300 tgagtatgaa acaaaacatg acttgcaaaa gcttgatgaa ctcgggaaga tgataacaag 360 cttggatcct ggggactcta tcgtgattgc taagtctctc tcgcacatgc ttaacttggc 420 caacttggct gaggaagtcc agatagccta caggaggaga atcaagctca agaagggaga 480 ctttgctgat gagaactcgg caatcacaga atctgacatt gaggaaacac ttaagaggct 540 tgttgttgac ctgaagaagt cacctgctga ggtatttgat gccctcaaga gccagactgt 600 tgatctggtt ttgactgcac atccaacaca gtctgtgagg aggtcactgc tccagaaaca 660 ctcgaggata cgcaactgtt tggttcaact ctactcaaaa gatatcactc cggatgataa 720 gcaggaactt gatgaggctc tgcaaagaga gatccaagct gcctttagaa ctgatgagat 780 ccgaagaaca cagcccactc cccaagatga aatgcgtgct ggtatgagct acttccacga 840 aacaatttgg aagggtgttc caaagttctt gcgccgggtt gatactgcat tgaagaacat 900 tgggattaac gagcgtgttc cttacaatgc acctcttatt caattctctt cttggatggg 960 gggagatcgt gatggaaatc caagagtgac accagaggtt accagggatg tctgcttgct 1020 tgccagaatg atggcatcaa acttgtactg ctctcagatt gaggatctca tgtttgagtt 1080 gtctatgtgg cgatgcagtg atgaactgcg catgcgagct gatgtgctgc atctctccac 1140 taagaaggat gccaaacatt acatagagtt ttggaagaag gttcctccaa atgagccata 1200 tcgggtgata ctgagtgatg tcagggataa actgtacaac actcgtgaac ggtcacgaga 1260 gcttttatcc agtgggcatt ctgatattcc tgaggaagct acattgacaa atgttgagca 1320 gctgttggag cccttggaac tatgttacag atcactctgt gcttgtggtg actctgtaat 1380 tgctgatgga acccttctgg atttcttgcg tcaagtgtcc acctttggac tctcccttgt 1440 gaggcttgac attaggcaag agtcagatag gcatactgat gtccttgatg ccatcactac 1500 atacctgggg ataggatctt accgtgaatg gactgaagaa cgccgccaag aatggttact 1560 gtctgaactt aatggcaagc gccctctgtt tggctcagac cttcccaaga ctgaggaaat 1620 ttctgatgtt ctagacacat tccatgttat tgctgagctt ccctctgaca attttggtgc 1680 gtatatcatt tccatggcga cagctccgtc ggacgtcctt gctgttgaac tcctccaacg 1740 tgagtgtcat gtgaaaacac cacttagagt agtcccgctg tttgagaagt tggccgatct 1800 tgaggctgcc ccggctgcat tggccagact gttctcaata gattggtaca gacagaggat 1860 caatggcaag caggaggtca tgattgggta ttcagactcg ggcaaagatg ctggtcgcct 1920 ctcagcagct tggcagctat acaaagctca ggaggagctc atcaaggttg ctaaggactt 1980 tggtgtgaag ttaacgatgt tccatggacg tggtgggact gttggaaggg gtggtggtcc 2040 cactcacctt gccatcttgt cccagccacc agacacgatc cacggatcac tcagggtcac 2100 tgtgcaaggt gaagtcattg aacagtcatt tggtgaggag cacttgtgct ttaggacact 2160 gcaacgtttc acggctgcta ccctggagca tggcatgcac ccaccaaatg caccaaagcc 2220 agaatggcga gcccttcttg atgagatggc agttgtggca actgaggaat atcggtccat 2280 tgtcttcaaa gagccacgct ttgtcgagta tttccgcctt gcaacccctg aaacagagta 2340 tggtaggatg aacataggaa gcaggccatc caagagaaag ccgagcggag gtatcgactc 2400 actccgagca atcccatgga tctttgcttg gacacaaacg cggttccacc tcccggtctg 2460 gctaggattt ggagccgcat tcaagaatgt cctccagaag gacatcagga acctccacat 2520 gctccaggaa atgtacaatg agtggccatt tttcagggtg actattgatc tggtggagat 2580 ggtgttcgcc aagggtaatc ctggcattgc cgcactgtat gacaaactcc tcgtttcaga 2640 ggaactgcat ccattgggtg agaagctgag ggccaactat gaggaaaccc agaagcttct 2700 acttcaggtt gctgggcaca gggatcttct ggaaggtgac ctctacctga agcagcggct 2760 ccgcctgcgt gatgcgtaca tcaccaccct gaacgtctgc caggcctaca ccctgaagcg 2820 gatccgtgac ccggactacc atgtcgcgct gcgcccccac ctctccaagg agatcatgga 2880 ctcgaccaag gctgcggcgg acgtggtgaa gctgaaccct ggcagcgaat acgcaccggg 2940 gctggaggac accctcatcc tgaccatgaa gggcatagca gccggcctcc agaacaccgg 3000 ttaaaccacg aagaggggat cttttttctc ctcctgatca ttggctctag gtccttcgta 3060 ttttcgcgga ttgtaacttc ggccacctct ctacaccgtg aggaaataat ggtggtttct 3120 gcaaaagtgg tggtaaataa aagggcgaca actatcttgt ttttcatagt aacttataac 3180 tttacgatgc gataatggaa catggcttgc gtt 3213 <210> 50 <211> 967 <212> PRT <213> Zea mays <400> 50 Met Ala Ala Leu Gly Pro Lys Met Glu Arg Leu Ser Ser Ile Asp Ala 1 5 10 15 Gln Leu Arg Met Leu Val Pro Gly Lys Val Ser Glu Asp Asp Lys Leu 20 25 30 Ile Glu Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln 35 40 45 Asp Leu His Gly Asp Asp Leu Lys Glu Met Val Gln Glu Cys Tyr Glu 50 55 60 Val Ala Ala Glu Tyr Glu Thr Lys His Asp Leu Gln Lys Leu Asp Glu 65 70 75 80 Leu Gly Lys Met Ile Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Ile 85 90 95 Ala Lys Ser Leu Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu 100 105 110 Val Gln Ile Ala Tyr Arg Arg Arg Ile Lys Leu Lys Lys Gly Asp Phe 115 120 125 Ala Asp Glu Asn Ser Ala Ile Thr Glu Ser Asp Ile Glu Glu Thr Leu 130 135 140 Lys Arg Leu Val Val Asp Leu Lys Lys Ser Pro Ala Glu Val Phe Asp 145 150 155 160 Ala Leu Lys Ser Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr 165 170 175 Gln Ser Val Arg Arg Ser Leu Leu Gln Lys His Ser Arg Ile Arg Asn 180 185 190 Cys Leu Val Gln Leu Tyr Ser Lys Asp Ile Thr Pro Asp Asp Lys Gln 195 200 205 Glu Leu Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr 210 215 220 Asp Glu Ile Arg Arg Thr Gln Pro Thr Pro Gln Asp Glu Met Arg Ala 225 230 235 240 Gly Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe 245 250 255 Leu Arg Arg Val Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn Glu Arg 260 265 270 Val Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly 275 280 285 Asp Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val 290 295 300 Cys Leu Leu Ala Arg Met Met Ala Ser Asn Leu Tyr Cys Ser Gln Ile 305 310 315 320 Glu Asp Leu Met Phe Glu Leu Ser Met Trp Arg Cys Ser Asp Glu Leu 325 330 335 Arg Met Arg Ala Asp Val Leu His Leu Ser Thr Lys Lys Asp Ala Lys 340 345 350 His Tyr Ile Glu Phe Trp Lys Lys Val Pro Pro Asn Glu Pro Tyr Arg 355 360 365 Val Ile Leu Ser Asp Val Arg Asp Lys Leu Tyr Asn Thr Arg Glu Arg 370 375 380 Ser Arg Glu Leu Leu Ser Ser Gly His Ser Asp Ile Pro Glu Glu Ala 385 390 395 400 Thr Leu Thr Asn Val Glu Gln Leu Leu Glu Pro Leu Glu Leu Cys Tyr 405 410 415 Arg Ser Leu Cys Ala Cys Gly Asp Ser Val Ile Ala Asp Gly Thr Leu 420 425 430 Leu Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ser Leu Val Arg 435 440 445 Leu Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Leu Asp Ala 450 455 460 Ile Thr Thr Tyr Leu Gly Ile Gly Ser Tyr Arg Glu Trp Thr Glu Glu 465 470 475 480 Arg Arg Gln Glu Trp Leu Leu Ser Glu Leu Asn Gly Lys Arg Pro Leu 485 490 495 Phe Gly Ser Asp Leu Pro Lys Thr Glu Glu Ile Ser Asp Val Leu Asp 500 505 510 Thr Phe His Val Ile Ala Glu Leu Pro Ser Asp Asn Phe Gly Ala Tyr 515 520 525 Ile Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu 530 535 540 Leu Gln Arg Glu Cys His Val Lys Thr Pro Leu Arg Val Val Pro Leu 545 550 555 560 Phe Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro Ala Ala Leu Ala Arg 565 570 575 Leu Phe Ser Ile Asp Trp Tyr Arg Gln Arg Ile Asn Gly Lys Gln Glu 580 585 590 Val Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ser 595 600 605 Ala Ala Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Ile Lys Val Ala 610 615 620 Lys Asp Phe Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr 625 630 635 640 Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro 645 650 655 Pro Asp Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val 660 665 670 Ile Glu Gln Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln 675 680 685 Arg Phe Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro Asn Ala 690 695 700 Pro Lys Pro Glu Trp Arg Ala Leu Leu Asp Glu Met Ala Val Val Ala 705 710 715 720 Thr Glu Glu Tyr Arg Ser Ile Val Phe Lys Glu Pro Arg Phe Val Glu 725 730 735 Tyr Phe Arg Leu Ala Thr Pro Glu Thr Glu Tyr Gly Arg Met Asn Ile 740 745 750 Gly Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Asp Ser Leu 755 760 765 Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu 770 775 780 Pro Val Trp Leu Gly Phe Gly Ala Ala Phe Lys Asn Val Leu Gln Lys 785 790 795 800 Asp Ile Arg Asn Leu His Met Leu Gln Glu Met Tyr Asn Glu Trp Pro 805 810 815 Phe Phe Arg Val Thr Ile Asp Leu Val Glu Met Val Phe Ala Lys Gly 820 825 830 Asn Pro Gly Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Glu Glu 835 840 845 Leu His Pro Leu Gly Glu Lys Leu Arg Ala Asn Tyr Glu Glu Thr Gln 850 855 860 Lys Leu Leu Leu Gln Val Ala Gly His Arg Asp Leu Leu Glu Gly Asp 865 870 875 880 Leu Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ala Tyr Ile Thr Thr 885 890 895 Leu Asn Val Cys Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro Asp 900 905 910 Tyr His Val Ala Leu Arg Pro His Leu Ser Lys Glu Ile Met Asp Ser 915 920 925 Thr Lys Ala Ala Ala Asp Val Val Lys Leu Asn Pro Gly Ser Glu Tyr 930 935 940 Ala Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala 945 950 955 960 Ala Gly Leu Gln Asn Thr Gly 965 <210> 51 <211> 5845 <212> DNA <213> Triticum aestivum <400> 51 gcggcgcgag cactaatcga ctcactatag ggcgtcgact cgatcttgag ggctgaggac 60 ggtggaatca ggaccgtcca cgtggacatg tggatgctcc caccataatc cgtaaactaa 120 tcccagtccc gatcgaaatc aaatcacgaa cactaccact tggacacaaa ttaatttgat 180 ttacagagat ctctcgagtc ccggtgaatc ccggcggcac tcctgccatc cgccttctat 240 aaataggcag caactggagt cacgacctcc tcagtcccgg ccccaaccac atcctccccc 300 caatctagct ccctccctcc ctaccacgct ggtccctgcg aggcggcgcg gcgagcgcga 360 gcagtcgggt cggctccggt caaagcgagc cggcgatggc gttgtcggcg ccgggcggcg 420 gcagcgggaa gatcgagcgg ctgtcgtcga tcgacgcgca gctgcggctg ctcgtccccg 480 ccaaggtgtc cgaggacgac aagctcattg agtacgacgc gctcctcctc gaccgcttcc 540 tcgacgtcct gcagggcctc cacggcgacg atctcaggga gatggtaact cttttttctt 600 cttgttttct ctctctcgca ctgttcgatc tcgcaccgga tccgagctgt cccatcaccc 660 atgtgctact gctgcgctgc tcccattgat tcctctgaac tttacatgtg gcgcttcagg 720 gttcgagtgg agttttcagc tcagtgttta cggagtgggg ttgactttgg gttaagtctc 780 gatgtcggta gatttgtgtg taatctggtg ttgttaagtg gtagtttgga cgattgccca 840 gctgctcagt ttttctgcca caaacaaatt ttttttcgca gctaatctat atcccattgt 900 ggtcttgatt ttgggagcac tgctttaatt agtcgaactg ggttactgat tgaatctcaa 960 atcgtgtcgg tcaagcatga cttcatccgt ggaatttgcc tcgctctatc attgttgtgt 1020 caactgattt tggcatataa gtgctggatc ttatgttggt catatacggg atactaaata 1080 actggcttag tagttgtgtc aactgaagta atatgttaac tgacttggat ctactgtaat 1140 tatgaaaaat agctaacagt gttcatctct tagtctacga atatactagt tgggttaaac 1200 tgtcgataca acggatagac gccttcttag gctaaccggc atggaagtgc tgataatatt 1260 tacatgtatg gaagtctcga gacattgtcc attgcttgta gaagaccgtt acatcttgtt 1320 tataccttac ctaacaaagc ctgagatatg gcgtttccag agaaccaaac taggggaaaa 1380 aaggttcttg aaatcgactt gccttgactt ttgttgactt ggtggctcac aacctgtttg 1440 gtaccttgct tgtcaattga ttaagaagac gtaggcatat aaacaatcag gttgctggtc 1500 ggcttgatta tctttttggt accttgcttg tcagttgatt aagaagacat cctatatctt 1560 atgttgattg atggacagcc ataattggat tattattttc actaaacagg ttcaagaatg 1620 ctatgaggtg gctgctgaat atgaaactaa gcatgacctg gaaaagcttg atgaactcgg 1680 agagatgata acaagcttgg atcctggtga ctctattgtg attgccaaag ctttttcaca 1740 catgcttaac ttggccaact tggctgagga agtgcagatc gcatacagga ggagagtcaa 1800 gctcaagaag ggagactttg ctgatgaaaa ttcagcaatc acagaatctg acatcgagga 1860 aactcttaag aggcttgttt ttgacatgaa gaagtcccct gctgaggttt ttgatgccct 1920 caagaatcag actgttgatc tggttttgac tgcacatcca acacaatctg taaggaggtc 1980 actgctccag aagcattcga ggttagttaa ccaaacattg tgatgatagt agtcatgata 2040 caatttctat atattaatcc tgattacaat gactttatat caggatccgg aactgtttgg 2100 ttcagttata ctcgaaggat atcactccag atgacaagca ggaacttgac gaggctctcc 2160 agagagaggt gcttactgct atccttatgt tgattttcat gctgtttcta aggcacattg 2220 ttaacatgac aatgcagtca cagtagcctt acaacatcag acagctgaga ttctttctta 2280 cacttaacct agaatcctcc tttttagatc caagctgcct ttagaactga tgagatccga 2340 agactcagcc cgactcccca agatcacatg cgtgctggta tgagcgactt tcatgagaca 2400 atatggaagg gtgttccaaa gtttttgcgc cgtgttgata cggcattgaa gaacattggg 2460 atcaatgagc gtgttcctta taatgctcct cttatccaat tctcttcttg gatgggtgga 2520 gatcgtgatg gtgagtggaa tctctgtccc tcgtgatact gtgcagcgta catctatgat 2580 gtatctacag tcactgcaag cttttattac cttggtggtg tctgttagat gctacatttt 2640 ctgtatctgg tcgtatcaag aactatggat aaagccaact gttttatgta tctaaacttc 2700 tagtaccttt acaaatacag gaaatccaag agtgacacca gaagttacaa gggacgtctg 2760 tttgcttgcc agaatgatgg cagctaattt gtattgtgca cagattgagg atctcatgtt 2820 tgaggtagaa attgattgat tacttttaac taagttcaca tatatttgat cattagaagt 2880 tggataaaac ttcaaactat ttcagttgtc tatgtggcga tgcaatgatg agctacgctc 2940 gcgagctgat gagctgcacc gctcttctaa gaaggatgct aagcattaca taggtacata 3000 acagtaacag tttttttaaa tgtaaaatag taggtcagac ccctgccaga gctttaaaaa 3060 ggcagtaaca gcttctaggc atgaaatttc acataacata tgcctttttt ttgttctact 3120 tattaatttg tgatgttcat ctccgatata tagagttctg gaagaaggtt cctccgaatg 3180 agccatatcg ggtaatactg ggtgatgtta gggataatct ttacaacacg cgtgagcgat 3240 cacgtgagtt gttatccagt ggacattccg acatacctga ggaagctact ctgacaaatc 3300 ttgagcaggt tgagtaatgt ctacgaaata taattggaac tatacatttt ttcttcaatg 3360 gtactatgtt tggtagagaa atggtcttta atatatgtcg gtcttctctt gcagctgttg 3420 gagcccttgg agctctgtta caggtcactg tgtgcttgtg gtgaccgtgt tattgctgat 3480 ggaacccttc ttgatttctt gcgccaagtc tctacctttg gactttccct cgtgaagctt 3540 gacatcaggc aagagtctga caggcacact gatgctctgg atgcaatcac ctcatacctg 3600 ggaataggat cttatcgtga gtggtctgag gaacaccgtc aagaatggct gttgtctgaa 3660 ctcaatggga agcgcccatt atttggcgca gaccttccca tgacagagga agttgctgat 3720 gttatgggcg cgttccaggt tattgctgag ctgcccggtg acaattttgg agcatatgtc 3780 atctcaatgg caacatctcc ttcagatgtt cttgctgtgg agctcctcca acgtgagtgc 3840 catatcaaga caccacttag agttgtcccc ctgtttgaga agttggccga tctcgaggct 3900 gccccagcag cactggccag actcttctca atagattggt acagagagag gatcaatggc 3960 aagcaggagg tcatgattgg gtattcagac tcaggcaagg atgcaggccg tctctcagca 4020 gcttggcaga tgtacaaggc tcaggaggac ctcgtcaagg tcgctaagca atttggagtg 4080 aaattgacga tgttccatgg acgaggtggg actgttggaa ggggtggtgg ccccactcat 4140 cttgctatct tgtctcagcc accggacacg atcaatggat cactccgggt cactgttcag 4200 ggtgaagtta tcgagcagag ctttggggaa gaacacttgt gcttcaggac gctccagcgt 4260 ttcacagctg ctactcttga gcatgggatg cgtccaccca tttcaccaaa gccagagtgg 4320 cgagctcttc tcgatgagat ggctgtggtg gcaactgaag aatatcggtc aattgtcttc 4380 caagaaccac gcttcgtcga gtatttccgc cttgtaagtc cttgctctca ttgaccatca 4440 ggctaggaaa catattaact gcttgaatag acttttcaat atgttgcaaa cctgaacctg 4500 ccagtgagat ggaattcatg caatgattta cggtggaaac ctatatcatg aaaataattt 4560 caaaaaataa tgaattgtga tagcacttag ggtaccttct tttgcaactg taatttctat 4620 gacagtacaa accctcgcca atgttatatt ggcagctcag gttattgcag taaggtttaa 4680 acaaaacaaa aacaaacctt ggtgccattc aggttgaacc ttcagtcaaa taatttcttt 4740 ctgatatttg tgtttgacag gcaacaccgg agacagagta tggcaggatg aatataggga 4800 gcaggccatc caagagaaag ccaagtggtg gcattgaatc actccgtgca atcccatgga 4860 tcttcgcatg gacgcagaca cggttccacc tcccggtctg gctgggcttt ggtggtgcct 4920 tcaagcatat cctcaagaag gacatcagga acttccacat gctccaggag atgtacaacg 4980 agtggccatt cttcagggtc accatcgatc ttgttgagat ggtgttcgcc aagggtaatc 5040 ctggcattgc tgccttgtat gacaggctcc tagtttcaga ggggctacag cccctgggtg 5100 agaagctgag ggccaactat gaggagaccc agaagctgct tcttcaggtt tttgttacta 5160 aaacgcagaa ctcctgtact tcgttcaaca acactgccag cattgatctt ctaggccagt 5220 tgttaaaata ttgacaataa aactggattt tcttgatttc aggttgctgg gcacaaggat 5280 cttcttgaag gtgatcccta cctgaagcag cggctccgcc tccgtgacgc gtacatcacc 5340 accatgaacg tctgccaggc atacacattg aagaggatcc gtgacccaga ctaccatgtt 5400 gcgctgcgcc cccatctgtc caaggaggtg atggacacga gcaagccggc tgctgagctc 5460 gtgacgctga acccggcgag tgagtacgcg ccggggctgg aggataccct catcttgacc 5520 atgaagggca ttgctgccgg tctccagaac accggttagg gcaaggggag attgccggat 5580 tatctttttt ttgtaccttg atgagatatt ttccttttat cgagtgctgt gggccttgta 5640 tctcagcgga tgttgctgca tctgccccta tatccagtga ggaataatgg catttcgcaa 5700 gtagtataat atttataaat aaaggcaaac aatgataatt tctaatctgt ttgtcagtcg 5760 tacttggaac acttaaggac atgtaccatg gtgctatctt aggagtgcca tattggataa 5820 atgatgtggt ggagaaaaga gaatt 5845 <210> 52 <211> 972 <212> PRT <213> Triticum aestivum <400> 52 Met Ala Leu Ser Ala Pro Gly Gly Gly Ser Gly Lys Ile Glu Arg Leu 1 5 10 15 Ser Ser Ile Asp Ala Gln Leu Arg Leu Leu Val Pro Ala Lys Val Ser 20 25 30 Glu Asp Asp Lys Leu Ile Glu Tyr Asp Ala Leu Leu Leu Asp Arg Phe 35 40 45 Leu Asp Val Leu Gln Gly Leu His Gly Asp Asp Leu Arg Glu Met Val 50 55 60 Gln Glu Cys Tyr Glu Val Ala Ala Glu Tyr Glu Thr Lys His Asp Leu 65 70 75 80 Glu Lys Leu Asp Glu Leu Gly Glu Met Ile Thr Ser Leu Asp Pro Gly 85 90 95 Asp Ser Ile Val Ile Ala Lys Ala Phe Ser His Met Leu Asn Leu Ala 100 105 110 Asn Leu Ala Glu Glu Val Gln Ile Ala Tyr Arg Arg Arg Val Lys Leu 115 120 125 Lys Lys Gly Asp Phe Ala Asp Glu Asn Ser Ala Ile Thr Glu Ser Asp 130 135 140 Ile Glu Glu Thr Leu Lys Arg Leu Val Phe Asp Met Lys Lys Ser Pro 145 150 155 160 Ala Glu Val Phe Asp Ala Leu Lys Asn Gln Thr Val Asp Leu Val Leu 165 170 175 Thr Ala His Pro Thr Gln Ser Val Arg Arg Ser Leu Leu Gln Lys His 180 185 190 Ser Arg Ile Arg Asn Cys Leu Val Gln Leu Tyr Ser Lys Asp Ile Thr 195 200 205 Pro Asp Asp Lys Gln Glu Leu Asp Glu Ala Leu Gln Arg Glu Ile Gln 210 215 220 Ala Ala Phe Arg Thr Asp Glu Ile Arg Arg Leu Ser Pro Thr Pro Gln 225 230 235 240 Asp His Met Arg Ala Gly Met Ser Asp Phe His Glu Thr Ile Trp Lys 245 250 255 Gly Val Pro Lys Phe Leu Arg Arg Val Asp Thr Ala Leu Lys Asn Ile 260 265 270 Gly Ile Asn Glu Arg Val Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser 275 280 285 Ser Trp Met Gly Gly Asp Arg Asp Gly Asn Pro Arg Val Thr Pro Glu 290 295 300 Val Thr Arg Asp Val Cys Leu Leu Ala Arg Met Met Ala Ala Asn Leu 305 310 315 320 Tyr Cys Ala Gln Ile Glu Asp Leu Met Phe Glu Leu Ser Met Trp Arg 325 330 335 Cys Asn Asp Glu Leu Arg Ser Arg Ala Asp Glu Leu His Arg Ser Ser 340 345 350 Lys Lys Asp Ala Lys His Tyr Ile Glu Phe Trp Lys Lys Val Pro Pro 355 360 365 Asn Glu Pro Tyr Arg Val Ile Leu Gly Asp Val Arg Asp Asn Leu Tyr 370 375 380 Asn Thr Arg Glu Arg Ser Arg Glu Leu Leu Ser Ser Gly His Ser Asp 385 390 395 400 Ile Pro Glu Glu Ala Thr Leu Thr Asn Leu Glu Gln Leu Leu Glu Pro 405 410 415 Leu Glu Leu Cys Tyr Arg Ser Leu Cys Ala Cys Gly Asp Arg Val Ile 420 425 430 Ala Asp Gly Thr Leu Leu Asp Phe Leu Arg Gln Val Ser Thr Phe Gly 435 440 445 Leu Ser Leu Val Lys Leu Asp Ile Arg Gln Glu Ser Asp Arg His Thr 450 455 460 Asp Ala Leu Asp Ala Ile Thr Ser Tyr Leu Gly Ile Gly Ser Tyr Arg 465 470 475 480 Glu Trp Ser Glu Glu His Arg Gln Glu Trp Leu Leu Ser Glu Leu Asn 485 490 495 Gly Lys Arg Pro Leu Phe Gly Ala Asp Leu Pro Met Thr Glu Glu Val 500 505 510 Ala Asp Val Met Gly Ala Phe Gln Val Ile Ala Glu Leu Pro Gly Asp 515 520 525 Asn Phe Gly Ala Tyr Val Ile Ser Met Ala Thr Ser Pro Ser Asp Val 530 535 540 Leu Ala Val Glu Leu Leu Gln Arg Glu Cys His Ile Lys Thr Pro Leu 545 550 555 560 Arg Val Val Pro Leu Phe Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro 565 570 575 Ala Ala Leu Ala Arg Leu Phe Ser Ile Asp Trp Tyr Arg Glu Arg Ile 580 585 590 Asn Gly Lys Gln Glu Val Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp 595 600 605 Ala Gly Arg Leu Ser Ala Ala Trp Gln Met Tyr Lys Ala Gln Glu Asp 610 615 620 Leu Val Lys Val Ala Lys Gln Phe Gly Val Lys Leu Thr Met Phe His 625 630 635 640 Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala 645 650 655 Ile Leu Ser Gln Pro Pro Asp Thr Ile Asn Gly Ser Leu Arg Val Thr 660 665 670 Val Gln Gly Glu Val Ile Glu Gln Ser Phe Gly Glu Glu His Leu Cys 675 680 685 Phe Arg Thr Leu Gln Arg Phe Thr Ala Ala Thr Leu Glu His Gly Met 690 695 700 Arg Pro Pro Ile Ser Pro Lys Pro Glu Trp Arg Ala Leu Leu Asp Glu 705 710 715 720 Met Ala Val Val Ala Thr Glu Glu Tyr Arg Ser Ile Val Phe Gln Glu 725 730 735 Pro Arg Phe Val Glu Tyr Phe Arg Leu Ala Thr Pro Glu Thr Glu Tyr 740 745 750 Gly Arg Met Asn Ile Gly Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly 755 760 765 Gly Ile Glu Ser Leu Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln 770 775 780 Thr Arg Phe His Leu Pro Val Trp Leu Gly Phe Gly Gly Ala Phe Lys 785 790 795 800 His Ile Leu Lys Lys Asp Ile Arg Asn Phe His Met Leu Gln Glu Met 805 810 815 Tyr Asn Glu Trp Pro Phe Phe Arg Val Thr Ile Asp Leu Val Glu Met 820 825 830 Val Phe Ala Lys Gly Asn Pro Gly Ile Ala Ala Leu Tyr Asp Arg Leu 835 840 845 Leu Val Ser Glu Gly Leu Gln Pro Leu Gly Glu Lys Leu Arg Ala Asn 850 855 860 Tyr Glu Glu Thr Gln Lys Leu Leu Leu Gln Val Ala Gly His Lys Asp 865 870 875 880 Leu Leu Glu Gly Asp Pro Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp 885 890 895 Ala Tyr Ile Thr Thr Met Asn Val Cys Gln Ala Tyr Thr Leu Lys Arg 900 905 910 Ile Arg Asp Pro Asp Tyr His Val Ala Leu Arg Pro His Leu Ser Lys 915 920 925 Glu Val Met Asp Thr Ser Lys Pro Ala Ala Glu Leu Val Thr Leu Asn 930 935 940 Pro Ala Ser Glu Tyr Ala Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr 945 950 955 960 Met Lys Gly Ile Ala Ala Gly Leu Gln Asn Thr Gly 965 970 <210> 53 <211> 3535 <212> DNA <213> Oryza sativa <400> 53 aggtggaaga gacggacaga ggccactacc cgtgcaccac gccccctctc ccacaatctc 60 gcaaaaaagt tgattttctt tttcagcttc ctcctcccct cctccgcttc tcatcaatcc 120 actagcatat cagatcagat tcctgtacac ttccctttcc tcgcatccaa tcccgactat 180 caaatcatca ccatcctttt gcaaaaccaa aaaaaaaaaa gtagataaaa gaagaaggtt 240 cttgcatcca agagaggagg acactgtccg tcgtgcagcg tttcttgctt ggttgaatcg 300 ggtggttttg ggggggatgg cggggaaggt ggagaagatg gcgtcgatcg acgcgcagct 360 gcggatgctg gcgccggcga agctgtcgga ggacgacaag ctggtggagt acgacgccct 420 cctcctcgac cgcttcctcg acatcctcca ggacctccac ggcgacgacc tccgcgagct 480 ggtccaagaa tgctatgaga tcgctgctga gtatgaaggg aagcatgact cccaaaagct 540 cgatgaactt ggcaacatgt tgacaagctt ggatcctggt gactccattg tgatggccaa 600 agctttctcc cacatgctta atttggctaa cttggccgag gaggtccaga ttgcatacag 660 gaggagaatc aagctcaaga agggtgactt tgctgatgag aactcggcac tgacagaatc 720 tgacattgaa gaaactttta agaggcttgt tgttgacctg aagaaatcac cagcagaggt 780 ctttgatgcc cttaagagtc agactgttga cctggttttg actgcacatc caacacagtc 840 agtgaggagg tcactgcttc aaaaacactc aaggataagg aattgtttgg ttcaactata 900 ctcaaaggat atcacaccag atgataaaca ggagcttgat gaggctctcc agagggagat 960 tcaagcagcc tttagaactg atgagatccg aagaacccag ccaactcctc aagatgaaat 1020 gagggctggt atgagttact ttcatgagac aatctggaaa ggtgttccga agttcttacg 1080 ccgtctggac actgccttga agaacatcgg aattgatgag cgtgttcctt ataatgcacc 1140 tctcattcag ttctcttctt ggatgggagg agaccgtgat ggaaatccaa gagtgacacc 1200 agaagtcaca agggatgtat gcttgcttgc tagaatgatg gcttcaaatt tatactgctc 1260 gcaaattgag gatctcatgt ttgagctgtc tatgtggcga tgcaatgatg agcttcgggc 1320 acgagcagat gagctgcatc tctcctcaaa gaaagatgca aagcactata tagaattctg 1380 gaagaaggtt ccgcccagtg agccataccg agttgttcta ggtgatgtga gagacaagct 1440 gtacaacaca cgtgaacgag cacgccagtt attatccagc ggatattctg acattcctga 1500 agaaaccact ctcaccagtg ttgaacagtt cttagagcct ctggagctat gttacaggtc 1560 actctgcgat tgcggtgacc gtgtaattgc tgatgggacc cttctggact tcttgcgcca 1620 ggtgtctacc tttgggctgt gccttgtgag gcttgacatt aggcaagaat ctgacaggca 1680 caccgatgtc ctcgatgcca tcaccacata cctgggaata ggatcatacc gtgagtggtc 1740 cgaggaacgc cgtcaggact ggctcttgtc tgaactcaat gggaagcgcc cattgtttgg 1800 cccagacctt cccaagaccg atgagattgc tgacgttcta gacacgttcc gcgtgatagc 1860 tgagcttccc gctgacaatt ttggggccta tatcatttcc atggcgacag ctccgtcaga 1920 cgtgcttgct gttgagctcc tccaacgtga atgccatgtg aagacaccac ttagagttgt 1980 cccactgttt gagaagttgg ctgatcttga atctgcccca gcagcagtgg ccagactgtt 2040 ctccatagat tggtacagag aaaggataaa tggcaaacag gaggtcatga ttggctattc 2100 ggactcgggt aaggacgccg gtcgtctctc ggcagcttgg cagctgtaca agtctcagga 2160 ggagctcatc aacgttgcca aggagtttgg ggtgaagttg acaatgttcc atgggcgcgg 2220 tgggactgtc ggaagaggcg gaggtcccac tcatcttgcc atcttgtctc agccaccaga 2280 cacaatccat ggatctctcc gggtcactgt ccagggtgaa gtcattgagc agtcctttgg 2340 tgaggagcac ctttgcttca ggacactgca gcgtttcacg gctgccactc tggagcatgg 2400 catgcatcca ccaattgcgc cgaaaccaga atggcgtgct ctgcttgatg agatggctgt 2460 ggtggctaca aaggaatacc ggtccatcgt cttccaggaa ccacgctttg tcgagtattt 2520 ccgccttgca acaccagaga tggagtatgg aaggatgaat ataggaagca ggccatccaa 2580 gagaaagccg agtggtggca tcgagtcact ccgtgccatc ccatggatct tcgcgtggac 2640 gcaaactcgc ttccaccttc ctgtctggct tggcttcggt tctgccttca agcacatcct 2700 ggagaaggac atcaggaacc tccacatgct ccaggagatg tacaatgagt ggccgttctt 2760 cagagtcacg atcgatctgg ttgagatggt tttcgccaag ggtgaccctg gcatcgccgc 2820 attgtacgac aagctccttg tctccgagga gctatggcct ctgggagaga aactgagggc 2880 caactgtgaa gaaaccaaac agcttctcct tcaggttgct ggacacaagg atcttctcga 2940 aggtgatctc tacctgaagc agcgccttcg cctccgcaat gcctacatca ccaccctgaa 3000 tgtctgccag gcttacacga tgaagcgaat ccgcgacccg gactaccatg tcacgctgcg 3060 cccccacatg tccaaggaga tcatggactg gtctaagccg gctgcggagc tggtgaagct 3120 gaacccgacc agtgagtatg cgccggggct ggaggacacc ctcatcctga ccatgaaggg 3180 aattgctgct ggaatgcaga acaccggcta agcgaactat caactatgaa gtgcctgaat 3240 tcacaccgtt ttatatggac tcttatcttg atttcggtca tttgctctcg gccatttaat 3300 tttgccgatg cagaggctcg tgcagtttct aatttctttc ggaagatatt ttcaataatg 3360 gagttgtaca agaacatcaa ttaatcaaaa taaagtggat attatgttca ttatcgttta 3420 gagcaacctg gtaaagccat ttttttgtgt agaccacata gtgagtgtgt tgaaattcca 3480 tttgcttaat gaaactgcca ttatctaagt aaagtcaaag ggctccttta tattg 3535 <210> 54 <211> 964 <212> PRT <213> Oryza sativa <400> 54 Met Ala Gly Lys Val Glu Lys Met Ala Ser Ile Asp Ala Gln Leu Arg 1 5 10 15 Met Leu Ala Pro Ala Lys Leu Ser Glu Asp Asp Lys Leu Val Glu Tyr 20 25 30 Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu His 35 40 45 Gly Asp Asp Leu Arg Glu Leu Val Gln Glu Cys Tyr Glu Ile Ala Ala 50 55 60 Glu Tyr Glu Gly Lys His Asp Ser Gln Lys Leu Asp Glu Leu Gly Asn 65 70 75 80 Met Leu Thr Ser Leu Asp Pro Gly Asp Ser Ile Val Met Ala Lys Ala 85 90 95 Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln Ile 100 105 110 Ala Tyr Arg Arg Arg Ile Lys Leu Lys Lys Gly Asp Phe Ala Asp Glu 115 120 125 Asn Ser Ala Leu Thr Glu Ser Asp Ile Glu Glu Thr Phe Lys Arg Leu 130 135 140 Val Val Asp Leu Lys Lys Ser Pro Ala Glu Val Phe Asp Ala Leu Lys 145 150 155 160 Ser Gln Thr Val Asp Leu Val Leu Thr Ala His Pro Thr Gln Ser Val 165 170 175 Arg Arg Ser Leu Leu Gln Lys His Ser Arg Ile Arg Asn Cys Leu Val 180 185 190 Gln Leu Tyr Ser Lys Asp Ile Thr Pro Asp Asp Lys Gln Glu Leu Asp 195 200 205 Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu Ile 210 215 220 Arg Arg Thr Gln Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met Ser 225 230 235 240 Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg Arg 245 250 255 Leu Asp Thr Ala Leu Lys Asn Ile Gly Ile Asp Glu Arg Val Pro Tyr 260 265 270 Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg Asp 275 280 285 Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg Asp Val Cys Leu Leu 290 295 300 Ala Arg Met Met Ala Ser Asn Leu Tyr Cys Ser Gln Ile Glu Asp Leu 305 310 315 320 Met Phe Glu Leu Ser Met Trp Arg Cys Asn Asp Glu Leu Arg Ala Arg 325 330 335 Ala Asp Glu Leu His Leu Ser Ser Lys Lys Asp Ala Lys His Tyr Ile 340 345 350 Glu Phe Trp Lys Lys Val Pro Pro Ser Glu Pro Tyr Arg Val Val Leu 355 360 365 Gly Asp Val Arg Asp Lys Leu Tyr Asn Thr Arg Glu Arg Ala Arg Gln 370 375 380 Leu Leu Ser Ser Gly Tyr Ser Asp Ile Pro Glu Glu Thr Thr Leu Thr 385 390 395 400 Ser Val Glu Gln Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg Ser Leu 405 410 415 Cys Asp Cys Gly Asp Arg Val Ile Ala Asp Gly Thr Leu Leu Asp Phe 420 425 430 Leu Arg Gln Val Ser Thr Phe Gly Leu Cys Leu Val Arg Leu Asp Ile 435 440 445 Arg Gln Glu Ser Asp Arg His Thr Asp Val Leu Asp Ala Ile Thr Thr 450 455 460 Tyr Leu Gly Ile Gly Ser Tyr Arg Glu Trp Ser Glu Glu Arg Arg Gln 465 470 475 480 Asp Trp Leu Leu Ser Glu Leu Asn Gly Lys Arg Pro Leu Phe Gly Pro 485 490 495 Asp Leu Pro Lys Thr Asp Glu Ile Ala Asp Val Leu Asp Thr Phe Arg 500 505 510 Val Ile Ala Glu Leu Pro Ala Asp Asn Phe Gly Ala Tyr Ile Ile Ser 515 520 525 Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val Glu Leu Leu Gln Arg 530 535 540 Glu Cys His Val Lys Thr Pro Leu Arg Val Val Pro Leu Phe Glu Lys 545 550 555 560 Leu Ala Asp Leu Glu Ser Ala Pro Ala Ala Val Ala Arg Leu Phe Ser 565 570 575 Ile Asp Trp Tyr Arg Glu Arg Ile Asn Gly Lys Gln Glu Val Met Ile 580 585 590 Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ser Ala Ala Trp 595 600 605 Gln Leu Tyr Lys Ser Gln Glu Glu Leu Ile Asn Val Ala Lys Glu Phe 610 615 620 Gly Val Lys Leu Thr Met Phe His Gly Arg Gly Gly Thr Val Gly Arg 625 630 635 640 Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser Gln Pro Pro Asp Thr 645 650 655 Ile His Gly Ser Leu Arg Val Thr Val Gln Gly Glu Val Ile Glu Gln 660 665 670 Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr Leu Gln Arg Phe Thr 675 680 685 Ala Ala Thr Leu Glu His Gly Met His Pro Pro Ile Ala Pro Lys Pro 690 695 700 Glu Trp Arg Ala Leu Leu Asp Glu Met Ala Val Val Ala Thr Lys Glu 705 710 715 720 Tyr Arg Ser Ile Val Phe Gln Glu Pro Arg Phe Val Glu Tyr Phe Arg 725 730 735 Leu Ala Thr Pro Glu Met Glu Tyr Gly Arg Met Asn Ile Gly Ser Arg 740 745 750 Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu Ser Leu Arg Ala Ile 755 760 765 Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe His Leu Pro Val Trp 770 775 780 Leu Gly Phe Gly Ser Ala Phe Lys His Ile Leu Glu Lys Asp Ile Arg 785 790 795 800 Asn Leu His Met Leu Gln Glu Met Tyr Asn Glu Trp Pro Phe Phe Arg 805 810 815 Val Thr Ile Asp Leu Val Glu Met Val Phe Ala Lys Gly Asp Pro Gly 820 825 830 Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Glu Glu Leu Trp Pro 835 840 845 Leu Gly Glu Lys Leu Arg Ala Asn Cys Glu Glu Thr Lys Gln Leu Leu 850 855 860 Leu Gln Val Ala Gly His Lys Asp Leu Leu Glu Gly Asp Leu Tyr Leu 865 870 875 880 Lys Gln Arg Leu Arg Leu Arg Asn Ala Tyr Ile Thr Thr Leu Asn Val 885 890 895 Cys Gln Ala Tyr Thr Met Lys Arg Ile Arg Asp Pro Asp Tyr His Val 900 905 910 Thr Leu Arg Pro His Met Ser Lys Glu Ile Met Asp Trp Ser Lys Pro 915 920 925 Ala Ala Glu Leu Val Lys Leu Asn Pro Thr Ser Glu Tyr Ala Pro Gly 930 935 940 Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala Gly Met 945 950 955 960 Gln Asn Thr Gly <210> 55 <211> 2928 <212> DNA <213> Oryza sativa <400> 55 atgtcggcga tgtcggcggc gggcggcggc ggcggcgtgg ggaaggtgga gcggctgtcg 60 tcgatcgacg cgcagctgcg gcagctggtg ccggcgaagc tgtcggagga cgacaagctc 120 atcgagtacg acgcgctcct cctcgaccga ttcctcgacg tcctccatgg cctccacggc 180 gacgacctca aggatctcgt tcaagaatgc tatgaggtgg ccgcggagta tgaaacaaag 240 cacgacgtgc aaaagctcga tgaactcggc aacatgataa caagcttgga tccgggcgac 300 tcgattgtta ttgcgaaagc cttttcgcac atgcttaact tggccaactt ggctgaagaa 360 gtccagatcg catacaggag gaggatcaag ctcaagaagg gtgatttcgc tgacgaaaac 420 tcggcaatga ctgaatccga cattgaggaa acactcaaga ggcttgtttt tgacctgaag 480 aaatcccctg ctgaggtctt tgatgccctc aagagtcaga ctgttgacct tgttttgact 540 gcacatccaa cacagtctgt gaggaggtca ctgctccaga aacactccag gattcggaac 600 tgtctggttc agctttattc aaaggatatc actccagatg acaagcaaga gcttgatgag 660 gctctccaga gagagatcca agctgccttt agaaccgatg agatccgaag aacacagccc 720 actccccaag atgaaatgcg tgctggcatg agctacttcc atgaaacaat atggaagggt 780 gttccaaagt tcttgcgccg tgtggatact gcattgaaga acatcggtat cgacgagcgt 840 gttccttaca atgctcctct tattcagttc tcgtcttgga tgggaggaga tcgtgatgga 900 aatccaagag tcacaccaga ggttacaagg gatgtctgct tgcttgcaag aatgatggca 960 gcaaacttgt attgctcaca aattgaggat ctcatgtttg agttatctat gtggcgatgt 1020 aacgaggagc tacgctcacg agctgatgat ctgcaccgct cttctaagaa ggacgcaaag 1080 cattacatag agttttggaa gaaggttcct ctgaatgaac cataccgggt gatactgagt 1140 gatgtgagag ataagcttta caatacacgt gaacgatcac gggagttgtt gtccagcgga 1200 tattgcgaca tccctgagga agcaactctg acaaatgttg agcagctatt ggagcccttg 1260 gagctatgct acaggtcgct gtgcgcctgt ggtgaccgtg ccatcgctga tggaagcctt 1320 cttgatttct tgcgccaagt ttccaccttt ggactctccc ttgtgaggct tgacattagg 1380 caagaatccg acagacacac cgatgtcctt gatgccatca cgacatacct gggcatagga 1440 tcttaccgtg agtggtccga ggaacgccgt caagagtggc tgttgtccga actcaacggg 1500 aagcgaccat tgtttggccc agaccttccc aggacagatg aggttgctga tgttctagac 1560 acattccatg tgattgccga gctccctgct gacagttttg gagcctatgt tatttccatg 1620 gcaacagccc cctcggatgt ccttgctgtt gagctcctcc aacgcgagtg ccatgtcaag 1680 acaccgctta gagttgtccc cctgttcgag aagttggctg atcttgagtc tgcccctgcg 1740 gcattgacca ggctcttctc aataagttgg tacaggcaga ggatcaatgg taagcaggag 1800 gtcatgattg ggtattcaga ttcaggcaag gatgctggcc gtctctcggc agcttggcag 1860 atgtacaagg ctcaggagca gctcgtcaag gtagcgaagg atttcggggt caagttgacg 1920 atgttccatg gacgaggtgg aaccgttggt aggggcggtg ggccgactca ccttgccatc 1980 ttgtctcagc ctccagacac gatcaacgga tcgctccgtg tcactgttca gggtgaagtc 2040 attgagcaga gctttggtga ggagcacttg tgtttcagga cactgcagcg tttcaccgct 2100 gctacacttg agcacggcat gcatccaccc agtgcaccga agccagaatg gcgagctctt 2160 cttgatgaga tggctgtggt ggcaaccaag gagtatcgat ccgtagtgtt ccaagagcca 2220 cgctttgtgg agtatttccg ccttgcaaca cctgagacag agtatggaag gatgaacata 2280 ggaagcaggc catccaagag gaagccgagt ggaggcattg aatcactccg tgcgatccca 2340 tggatcttcg catggacgca gacccgcttc caccttcccg tctggcttgg attcggtgct 2400 gcattcaagc acgcccttca gaaggacatc aggaatctcc acatgctcca ggagatgtac 2460 aacgagtggc cgttcttcag ggtcactctc gacctgattg agatggtttt cgccaagggt 2520 aatcctggca ttgctgccct ttacgacaaa ctcctcgttt ctgaggatct acagccactg 2580 ggtgagaagc tgagagccaa ctatgtagag acacaaaagc tgcttcttca ggttgctggc 2640 catagggatc ttcttgaagg tgacccctac ctgaagcagc ggctccgact ccgcgacgcc 2700 tacataacca ccctgaatgt ctgccaagcc tacacgctga aacggatccg cgacccggat 2760 taccacgtca cgctgcgccc tcacctgtcc aaggaggtga tggatgggag caagccggcc 2820 gcggagcttg tgaagctgaa cccgggtagc gagtacgcgc cagggctgga ggacaccctc 2880 atcctgacca tgaagggcat tgctgcaggg ttgcagaaca ctggttaa 2928 <210> 56 <211> 975 <212> PRT <213> Oryza sativa <400> 56 Met Ser Ala Met Ser Ala Ala Gly Gly Gly Gly Gly Val Gly Lys Val 1 5 10 15 Glu Arg Leu Ser Ser Ile Asp Ala Gln Leu Arg Gln Leu Val Pro Ala 20 25 30 Lys Leu Ser Glu Asp Asp Lys Leu Ile Glu Tyr Asp Ala Leu Leu Leu 35 40 45 Asp Arg Phe Leu Asp Val Leu His Gly Leu His Gly Asp Asp Leu Lys 50 55 60 Asp Leu Val Gln Glu Cys Tyr Glu Val Ala Ala Glu Tyr Glu Thr Lys 65 70 75 80 His Asp Val Gln Lys Leu Asp Glu Leu Gly Asn Met Ile Thr Ser Leu 85 90 95 Asp Pro Gly Asp Ser Ile Val Ile Ala Lys Ala Phe Ser His Met Leu 100 105 110 Asn Leu Ala Asn Leu Ala Glu Glu Val Gln Ile Ala Tyr Arg Arg Arg 115 120 125 Ile Lys Leu Lys Lys Gly Asp Phe Ala Asp Glu Asn Ser Ala Met Thr 130 135 140 Glu Ser Asp Ile Glu Glu Thr Leu Lys Arg Leu Val Phe Asp Leu Lys 145 150 155 160 Lys Ser Pro Ala Glu Val Phe Asp Ala Leu Lys Ser Gln Thr Val Asp 165 170 175 Leu Val Leu Thr Ala His Pro Thr Gln Ser Val Arg Arg Ser Leu Leu 180 185 190 Gln Lys His Ser Arg Ile Arg Asn Cys Leu Val Gln Leu Tyr Ser Lys 195 200 205 Asp Ile Thr Pro Asp Asp Lys Gln Glu Leu Asp Glu Ala Leu Gln Arg 210 215 220 Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu Ile Arg Arg Thr Gln Pro 225 230 235 240 Thr Pro Gln Asp Glu Met Arg Ala Gly Met Ser Tyr Phe His Glu Thr 245 250 255 Ile Trp Lys Gly Val Pro Lys Phe Leu Arg Arg Val Asp Thr Ala Leu 260 265 270 Lys Asn Ile Gly Ile Asp Glu Arg Val Pro Tyr Asn Ala Pro Leu Ile 275 280 285 Gln Phe Ser Ser Trp Met Gly Gly Asp Arg Asp Gly Asn Pro Arg Val 290 295 300 Thr Pro Glu Val Thr Arg Asp Val Cys Leu Leu Ala Arg Met Met Ala 305 310 315 320 Ala Asn Leu Tyr Cys Ser Gln Ile Glu Asp Leu Met Phe Glu Leu Ser 325 330 335 Met Trp Arg Cys Asn Glu Glu Leu Arg Ser Arg Ala Asp Asp Leu His 340 345 350 Arg Ser Ser Lys Lys Asp Ala Lys His Tyr Ile Glu Phe Trp Lys Lys 355 360 365 Val Pro Leu Asn Glu Pro Tyr Arg Val Ile Leu Ser Asp Val Arg Asp 370 375 380 Lys Leu Tyr Asn Thr Arg Glu Arg Ser Arg Glu Leu Leu Ser Ser Gly 385 390 395 400 Tyr Cys Asp Ile Pro Glu Glu Ala Thr Leu Thr Asn Val Glu Gln Leu 405 410 415 Leu Glu Pro Leu Glu Leu Cys Tyr Arg Ser Leu Cys Ala Cys Gly Asp 420 425 430 Arg Ala Ile Ala Asp Gly Ser Leu Leu Asp Phe Leu Arg Gln Val Ser 435 440 445 Thr Phe Gly Leu Ser Leu Val Arg Leu Asp Ile Arg Gln Glu Ser Asp 450 455 460 Arg His Thr Asp Val Leu Asp Ala Ile Thr Thr Tyr Leu Gly Ile Gly 465 470 475 480 Ser Tyr Arg Glu Trp Ser Glu Glu Arg Arg Gln Glu Trp Leu Leu Ser 485 490 495 Glu Leu Asn Gly Lys Arg Pro Leu Phe Gly Pro Asp Leu Pro Arg Thr 500 505 510 Asp Glu Val Ala Asp Val Leu Asp Thr Phe His Val Ile Ala Glu Leu 515 520 525 Pro Ala Asp Ser Phe Gly Ala Tyr Val Ile Ser Met Ala Thr Ala Pro 530 535 540 Ser Asp Val Leu Ala Val Glu Leu Leu Gln Arg Glu Cys His Val Lys 545 550 555 560 Thr Pro Leu Arg Val Val Pro Leu Phe Glu Lys Leu Ala Asp Leu Glu 565 570 575 Ser Ala Pro Ala Ala Leu Thr Arg Leu Phe Ser Ile Ser Trp Tyr Arg 580 585 590 Gln Arg Ile Asn Gly Lys Gln Glu Val Met Ile Gly Tyr Ser Asp Ser 595 600 605 Gly Lys Asp Ala Gly Arg Leu Ser Ala Ala Trp Gln Met Tyr Lys Ala 610 615 620 Gln Glu Gln Leu Val Lys Val Ala Lys Asp Phe Gly Val Lys Leu Thr 625 630 635 640 Met Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro Thr 645 650 655 His Leu Ala Ile Leu Ser Gln Pro Pro Asp Thr Ile Asn Gly Ser Leu 660 665 670 Arg Val Thr Val Gln Gly Glu Val Ile Glu Gln Ser Phe Gly Glu Glu 675 680 685 His Leu Cys Phe Arg Thr Leu Gln Arg Phe Thr Ala Ala Thr Leu Glu 690 695 700 His Gly Met His Pro Pro Ser Ala Pro Lys Pro Glu Trp Arg Ala Leu 705 710 715 720 Leu Asp Glu Met Ala Val Val Ala Thr Lys Glu Tyr Arg Ser Val Val 725 730 735 Phe Gln Glu Pro Arg Phe Val Glu Tyr Phe Arg Leu Ala Thr Pro Glu 740 745 750 Thr Glu Tyr Gly Arg Met Asn Ile Gly Ser Arg Pro Ser Lys Arg Lys 755 760 765 Pro Ser Gly Gly Ile Glu Ser Leu Arg Ala Ile Pro Trp Ile Phe Ala 770 775 780 Trp Thr Gln Thr Arg Phe His Leu Pro Val Trp Leu Gly Phe Gly Ala 785 790 795 800 Ala Phe Lys His Ala Leu Gln Lys Asp Ile Arg Asn Leu His Met Leu 805 810 815 Gln Glu Met Tyr Asn Glu Trp Pro Phe Phe Arg Val Thr Leu Asp Leu 820 825 830 Ile Glu Met Val Phe Ala Lys Gly Asn Pro Gly Ile Ala Ala Leu Tyr 835 840 845 Asp Lys Leu Leu Val Ser Glu Asp Leu Gln Pro Leu Gly Glu Lys Leu 850 855 860 Arg Ala Asn Tyr Val Glu Thr Gln Lys Leu Leu Leu Gln Val Ala Gly 865 870 875 880 His Arg Asp Leu Leu Glu Gly Asp Pro Tyr Leu Lys Gln Arg Leu Arg 885 890 895 Leu Arg Asp Ala Tyr Ile Thr Thr Leu Asn Val Cys Gln Ala Tyr Thr 900 905 910 Leu Lys Arg Ile Arg Asp Pro Asp Tyr His Val Thr Leu Arg Pro His 915 920 925 Leu Ser Lys Glu Val Met Asp Gly Ser Lys Pro Ala Ala Glu Leu Val 930 935 940 Lys Leu Asn Pro Gly Ser Glu Tyr Ala Pro Gly Leu Glu Asp Thr Leu 945 950 955 960 Ile Leu Thr Met Lys Gly Ile Ala Ala Gly Leu Gln Asn Thr Gly 965 970 975 <210> 57 <211> 3307 <212> DNA <213> Oryza sativa <400> 57 cccacactct ctacccccaa acttgccctc caatctatct ccgccgccgc cgccgcctcc 60 gccgcgagag ggcgtcgccg agctgcgcgg gaggctcgcc tcccgcagca tctggccgga 120 ttcgtcgtag tcgaggcagc tgtaagcgag agagagggag atggccgcgg ccgccgggaa 180 ggcggcgatg gagcggcacc agtcgatcga cgcgcagctg cggctgctcg cgccggggaa 240 ggtatccgag gacgacaagc tcgtcgagta cgacgccctc ctcgtcgacc gcttcctcga 300 catcctccag gacctgcacg gccctcacct ccgcgaattc gtgcaggagt gctacgagct 360 gtcggcggag tacgagaacg acagggacga ggcgcggctc gacgagctgg ggaggaagct 420 caccagcctg ccgccggggg actccatcgt cgtctccagc tccttctcgc acatgctcaa 480 cctcgccaac ctcgccgagg aggtgcagat cgcgcaccgc cgccggatca agctcaagcg 540 cggggacttc gccgacgagg cctccgcgcc caccgagtcc gacatcgagg agacgctcaa 600 gcgcctcgtc acccagctcg gcaagtcgag ggaggaggtg ttcgatgcgc tcaagaacca 660 gaccgttgac ctcgtgttca ccgcgcatcc aacgcagtcc gtcaggaggt ccctgctcca 720 gaagcacggg aggatccgga attgcctgag gcagttatat gcgaaagaca tcactgctga 780 tgacaagcag gagcttgatg aggccctgca gagggagatt caagcagctt tcagaactga 840 tgaaatccgc aggactcctc ccactcctca ggatgaaatg cgcgccggga tgagttattt 900 tcatgaaact atatggaagg gtgtaccaaa gttcttgcgc cgcattgata ctgctctgaa 960 aaatattggg attaatgagc gtcttcctta caatgctcct ctcatccagt tctcatcctg 1020 gatgggtggt gaccgtgatg gaaacccaag agttacacca gaggttacaa gagatgtatg 1080 cttgttggca agaatgatgg ctgctaacct gtacttctct cagatagaag atctgatgtt 1140 tgagctctct atgtggcgct gcagtgatga acttcgaatt cgtgcagatg atttgcattg 1200 ctcctccaga aaagctgcaa agcactatat agaattctgg aagcaaattc ctccaaatga 1260 gccttatcgt gtcatacttg gtggtgtcag ggataaattg tactatacgc gtgaacgtac 1320 tcgccatcta ttgacaactg gagtttctga aattccagag gaggcaacgt ttactaatgt 1380 tgaagagttt ctggagccgc ttgagctgtg ctacagatca ttatgtgctt gtggtgacaa 1440 acctatagct gatggaagcc ttcttgattt cttgcgtcaa gtatcaactt ttgggctggc 1500 tcttgtaaaa cttgacataa ggcaggagtc tgatcgacac actgatgtcc ttgatgccat 1560 aactacatat cttgggattg gatcttacgc tgaatggtct gaggagaaac gccaggattg 1620 gcttttgtcc gaactaaggg gcaaacgtcc tttgtttggt cctgatcttc ctcagactga 1680 agaaattgct gatgttttag gaacatttca cgtccttgct gagctcccgg cagattgttt 1740 tggtgcttac atcatctcaa tggcaactgc accatctgat gtgcttgctg tggagcttct 1800 acagcgggag tgccatataa aacagcctct gcgagttgtt cccctatttg agaaacttgc 1860 agatcttgaa gcagctccag cagcggtggc acgactattt tcaatagact ggtacatgaa 1920 taggattaat ggcaagcagg aggtcatgat tggatactca gactctggca aggatgctgg 1980 tcgtctttct gcagcatggc aaatgtacaa agcacaagag gagcttgtca aggtggcaaa 2040 gcattatggt gtaaagttga caatgttcca tggaagaggt ggaacagttg gcagaggagg 2100 tggtcccagt catcttgcca tattatctca accaccagac acgatacatg gatcacttcg 2160 tgtaacagta cagggcgagg ttattgaaca ctcgtttgga gaggaacact tgtgctttag 2220 aactctgcag cgctttactg cagctactct tgagcatgga atgcatcctc caatttcccc 2280 caaaccagaa tggcgtgctc taatggatga gatggctgtt gtggcaacaa aggaatatcg 2340 atcaatcgtc ttcaaggagc cacggtttgt tgaatacttc cgatcggcaa cacctgagac 2400 agaatatggc aggatgaaca ttggtagccg accatcaaag agaaagccta gtggtggcat 2460 tgaatcgctc cgtgcaattc cttggatttt tgcttggaca caaactaggt ttcatcttcc 2520 tgtatggctt ggatttggtg gagcgttcaa acatataatg cagaaggata tcaggaacat 2580 ccatacactg aaagaaatgt acaatgagtg gccattcttc agggtcacct tggacttgct 2640 tgagatggtt ttcgctaagg gagatccagg aattgctgct ttatatgaca aattgcttgt 2700 ggcaggtgat ctgcaatcct ttggagagca gctgagaaac aactttgaag agacaaaaca 2760 gctactcctt caggttgccg gtcacaagga tattctggaa ggggatcctt acctgaagca 2820 gcgtctgcgg ctgcgtgagt cgtacatcac taccttgaac gtttgccaag cctacaccct 2880 gaagcggata agggacccta gcttcgaggt gatgtcgcag ccggccttgt cgaaggagtt 2940 cgtcgacagc aaccagcctg ccgagctggt ccaactgaac gctgcgagcg agtacgcacc 3000 tggcctggag gacaccctca tcctgacgat gaagggcatt gctgccggca tgcagaacac 3060 aggctagatt gtccacaaga atgcttccag caggtgcaat caatcaatca tcaataactc 3120 cttccatgat gagatggtga atatgtttaa ctagtacgtt cgccgatgct agtgaattct 3180 ggagactttt ttttgctcgc acgttttctt ttggttgtgt acttgatgta aatgtcaagg 3240 ggggacttat ttggcttttg cagcccgatc caaaataaaa tatggaccaa tcattctacg 3300 aaaaaaa 3307 <210> 58 <211> 959 <212> PRT <213> Oryza sativa <400> 58 Met Glu Arg His Gln Ser Ile Asp Ala Gln Leu Arg Leu Leu Ala Pro 1 5 10 15 Gly Lys Val Ser Glu Asp Asp Lys Leu Val Glu Tyr Asp Ala Leu Leu 20 25 30 Val Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu His Gly Pro His Leu 35 40 45 Arg Glu Phe Val Gln Glu Cys Tyr Glu Leu Ser Ala Glu Tyr Glu Asn 50 55 60 Asp Arg Asp Glu Ala Arg Leu Asp Glu Leu Gly Arg Lys Leu Thr Ser 65 70 75 80 Leu Pro Pro Gly Asp Ser Ile Val Val Ser Ser Ser Phe Ser His Met 85 90 95 Leu Asn Leu Ala Asn Leu Ala Glu Glu Val Gln Ile Ala His Arg Arg 100 105 110 Arg Ile Lys Leu Lys Arg Gly Asp Phe Ala Asp Glu Ala Ser Ala Pro 115 120 125 Thr Glu Ser Asp Ile Glu Glu Thr Leu Lys Arg Leu Val Thr Gln Leu 130 135 140 Gly Lys Ser Arg Glu Glu Val Phe Asp Ala Leu Lys Asn Gln Thr Val 145 150 155 160 Asp Leu Val Phe Thr Ala His Pro Thr Gln Ser Val Arg Arg Ser Leu 165 170 175 Leu Gln Lys His Gly Arg Ile Arg Asn Cys Leu Arg Gln Leu Tyr Ala 180 185 190 Lys Asp Ile Thr Ala Asp Asp Lys Gln Glu Leu Asp Glu Ala Leu Gln 195 200 205 Arg Glu Ile Gln Ala Ala Phe Arg Thr Asp Glu Ile Arg Arg Thr Pro 210 215 220 Pro Thr Pro Gln Asp Glu Met Arg Ala Gly Met Ser Tyr Phe His Glu 225 230 235 240 Thr Ile Trp Lys Gly Val Pro Lys Phe Leu Arg Arg Ile Asp Thr Ala 245 250 255 Leu Lys Asn Ile Gly Ile Asn Glu Arg Leu Pro Tyr Asn Ala Pro Leu 260 265 270 Ile Gln Phe Ser Ser Trp Met Gly Gly Asp Arg Asp Gly Asn Pro Arg 275 280 285 Val Thr Pro Glu Val Thr Arg Asp Val Cys Leu Leu Ala Arg Met Met 290 295 300 Ala Ala Asn Leu Tyr Phe Ser Gln Ile Glu Asp Leu Met Phe Glu Leu 305 310 315 320 Ser Met Trp Arg Cys Ser Asp Glu Leu Arg Ile Arg Ala Asp Asp Leu 325 330 335 His Cys Ser Ser Arg Lys Ala Ala Lys His Tyr Ile Glu Phe Trp Lys 340 345 350 Gln Ile Pro Pro Asn Glu Pro Tyr Arg Val Ile Leu Gly Gly Val Arg 355 360 365 Asp Lys Leu Tyr Tyr Thr Arg Glu Arg Thr Arg His Leu Leu Thr Thr 370 375 380 Gly Val Ser Glu Ile Pro Glu Glu Ala Thr Phe Thr Asn Val Glu Glu 385 390 395 400 Phe Leu Glu Pro Leu Glu Leu Cys Tyr Arg Ser Leu Cys Ala Cys Gly 405 410 415 Asp Lys Pro Ile Ala Asp Gly Ser Leu Leu Asp Phe Leu Arg Gln Val 420 425 430 Ser Thr Phe Gly Leu Ala Leu Val Lys Leu Asp Ile Arg Gln Glu Ser 435 440 445 Asp Arg His Thr Asp Val Leu Asp Ala Ile Thr Thr Tyr Leu Gly Ile 450 455 460 Gly Ser Tyr Ala Glu Trp Ser Glu Glu Lys Arg Gln Asp Trp Leu Leu 465 470 475 480 Ser Glu Leu Arg Gly Lys Arg Pro Leu Phe Gly Pro Asp Leu Pro Gln 485 490 495 Thr Glu Glu Ile Ala Asp Val Leu Gly Thr Phe His Val Leu Ala Glu 500 505 510 Leu Pro Ala Asp Cys Phe Gly Ala Tyr Ile Ile Ser Met Ala Thr Ala 515 520 525 Pro Ser Asp Val Leu Ala Val Glu Leu Leu Gln Arg Glu Cys His Ile 530 535 540 Lys Gln Pro Leu Arg Val Val Pro Leu Phe Glu Lys Leu Ala Asp Leu 545 550 555 560 Glu Ala Ala Pro Ala Ala Val Ala Arg Leu Phe Ser Ile Asp Trp Tyr 565 570 575 Met Asn Arg Ile Asn Gly Lys Gln Glu Val Met Ile Gly Tyr Ser Asp 580 585 590 Ser Gly Lys Asp Ala Gly Arg Leu Ser Ala Ala Trp Gln Met Tyr Lys 595 600 605 Ala Gln Glu Glu Leu Val Lys Val Ala Lys His Tyr Gly Val Lys Leu 610 615 620 Thr Met Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro 625 630 635 640 Ser His Leu Ala Ile Leu Ser Gln Pro Pro Asp Thr Ile His Gly Ser 645 650 655 Leu Arg Val Thr Val Gln Gly Glu Val Ile Glu His Ser Phe Gly Glu 660 665 670 Glu His Leu Cys Phe Arg Thr Leu Gln Arg Phe Thr Ala Ala Thr Leu 675 680 685 Glu His Gly Met His Pro Pro Ile Ser Pro Lys Pro Glu Trp Arg Ala 690 695 700 Leu Met Asp Glu Met Ala Val Val Ala Thr Lys Glu Tyr Arg Ser Ile 705 710 715 720 Val Phe Lys Glu Pro Arg Phe Val Glu Tyr Phe Arg Ser Ala Thr Pro 725 730 735 Glu Thr Glu Tyr Gly Arg Met Asn Ile Gly Ser Arg Pro Ser Lys Arg 740 745 750 Lys Pro Ser Gly Gly Ile Glu Ser Leu Arg Ala Ile Pro Trp Ile Phe 755 760 765 Ala Trp Thr Gln Thr Arg Phe His Leu Pro Val Trp Leu Gly Phe Gly 770 775 780 Gly Ala Phe Lys His Ile Met Gln Lys Asp Ile Arg Asn Ile His Thr 785 790 795 800 Leu Lys Glu Met Tyr Asn Glu Trp Pro Phe Phe Arg Val Thr Leu Asp 805 810 815 Leu Leu Glu Met Val Phe Ala Lys Gly Asp Pro Gly Ile Ala Ala Leu 820 825 830 Tyr Asp Lys Leu Leu Val Ala Gly Asp Leu Gln Ser Phe Gly Glu Gln 835 840 845 Leu Arg Asn Asn Phe Glu Glu Thr Lys Gln Leu Leu Leu Gln Val Ala 850 855 860 Gly His Lys Asp Ile Leu Glu Gly Asp Pro Tyr Leu Lys Gln Arg Leu 865 870 875 880 Arg Leu Arg Glu Ser Tyr Ile Thr Thr Leu Asn Val Cys Gln Ala Tyr 885 890 895 Thr Leu Lys Arg Ile Arg Asp Pro Ser Phe Glu Val Met Ser Gln Pro 900 905 910 Ala Leu Ser Lys Glu Phe Val Asp Ser Asn Gln Pro Ala Glu Leu Val 915 920 925 Gln Leu Asn Ala Ala Ser Glu Tyr Ala Pro Gly Leu Glu Asp Thr Leu 930 935 940 Ile Leu Thr Met Lys Gly Ile Ala Ala Gly Met Gln Asn Thr Gly 945 950 955 <210> 59 <211> 3808 <212> DNA <213> Oryza sativa <400> 59 acccacacac ccacactctc tacccccaaa cttgccctcc aatctatctc cgccgccgcc 60 gccgcctccg ccgcgagagg gcgtcgccga gctgcgcggg aggctcgcct cccgcagcat 120 ctggccggat tcgtcgtagt cgaggcagct gtaagcgaga gagagggaga tggccgcggc 180 cgccgggaag gcggcgatgg agcggcacca gtcgatcgac gcgcagctgc ggctgctcgc 240 gccggggaag gtatccgagg acgacaagct cgtcgagtac gacgccctcc tcgtcgaccg 300 cttcctcgac atcctccagg acctgcacgg ccctcacctc cgcgaattcg tgcaggagtg 360 ctacgagctg tcggcggagt acgagaacga cagggacgag gcgcggctcg acgagctggg 420 gaggaagctc accagcctgc cgccggggga ctccatcgtc gtctccagct ccttctcgca 480 catgctcaac ctcgccaacc tcgccgagga ggtgcagatc gcgcaccgcc gccggatcaa 540 gctcaagcgc ggggacttcg ccgacgaggc ctccgcgccc accgagtccg acatcgagga 600 gacgctcaag cgcctcgtca cccagctcgg caagtcgagg gaggaggtgt tcgatgcgct 660 caagaaccag accgttgacc tcgtgttcac cgcgcatcca acgcagtccg tcaggaggtc 720 cctgctccag aagcacggga ggatccggaa ttgcctgagg cagttatatg cgaaagacat 780 cactgctgat gacaagcagg agcttgatga ggccctgcag agggagattc aagcagcttt 840 cagaactgat gaaatccgca ggactcctcc cactcctcag gatgaaatgc gcgccgggat 900 gagttatttt catgaaacta tatggaaggg tgtaccaaag ttcttgcgcc gcattgatac 960 tgctctgaaa aatattggga ttaatgagcg tcttccttac aatgctcctc tcatccagtt 1020 ctcatcctgg atgggtggtg accgtgatgg aaacccaaga gttacaccag aggttacaag 1080 agatgtatgc ttgttggcaa gaatgatggc tgctaacctg tacttctctc agatagaaga 1140 tctgatgttt gagctctcta tgtggcgctg cagtgatgaa cttcgaattc gtgcagatga 1200 tttgcattgc tcctccagaa aagctgcaaa gcactatata gaattctgga agcaaattcc 1260 tccaaatgag ccttatcgtg tcatacttgg tggtgtcagg gataaattgt actatacgcg 1320 tgaacgtact cgccatctat tgacaactgg agtttctgaa attccagagg aggcaacgtt 1380 tactaatgtt gaagagtttc tggagccgct tgagctgtgc tacagatcat tatgtgcttg 1440 tggtgacaaa cctatagctg atggaagcct tcttgatttc ttgcgtcaag tatcaacttt 1500 tgggctggct cttgtaaaac ttgacataag gcaggagtct gatcgacaca ctgatgtcct 1560 tgatgccata actacatatc ttgggattgg atcttacgct gaatggtctg aggagaaacg 1620 ccaggattgg cttttgtccg aactaagggg caaacgtcct ttgtttggtc ctgatcttcc 1680 tcagactgaa gaaattgctg atgttttagg aacatttcac gtccttgctg agctcccggc 1740 agattgtttt ggtgcttaca tcatctcaat ggcaactgca ccatctgatg tgcttgctgt 1800 ggagcttcta cagcgggagt gccatataaa acagcctctg cgagttgttc ccctatttga 1860 gaaacttgca gatcttgaag cagctccagc agcggtggca cgactatttt caatagactg 1920 gtacatgaat aggattaatg gcaagcagga ggtcatgatt ggatactcag actctggcaa 1980 ggatgctggt cgtctttctg cagcatggca aatgtacaaa gcacaagagg agcttgtcaa 2040 ggtggcaaag cattatggtg taaagttgac aatgttccat ggaagaggtg gaacagttgg 2100 cagaggaggt ggtcccagtc atcttgccat attatctcaa ccaccagaca cgatacatgg 2160 atcacttcgt gtaacagtac agggcgaggt tattgaacac tcgtttggag aggaacactt 2220 gtgctttaga actctgcagc gctttactgc agctactctt gagcatggaa tgcatcctcc 2280 aatttccccc aaaccagaat ggcgtgctct aatggatgag atggctgttg tggcaacaaa 2340 ggaatatcga tcaatcgtct tcaaggagcc acggtttgtt gaatacttcc gatcggcaac 2400 acctgagaca gaatatggca ggatgaacat tggtagccga ccatcaaaga gaaagcctag 2460 tggtggcatt gaatcgctcc gtgcaattcc ttggattttt gcttggacac aaactaggtt 2520 tcatcttcct gtatggcttg gatttggtgg agcgttcaaa catataatgc agaaggatat 2580 caggaacatc catacactga aagaaatgta caatgagtgg ccattcttca gggtcacctt 2640 ggacttgctt gagatggttt tcgccaaggg agatccagga attgctgctt tatatgacaa 2700 attgcttgtg gcaggtgatc tgcaatcctt tggagagcag ctgagaaaca actttgaaga 2760 gacaaaacag ctactccttc aggttgccgg tcacaaggat attctggaag gggatcctta 2820 cctgaagcag cgtctgcggc tgcgtgagtc gtacatcact accttgaacg tttgccaagc 2880 ctacaccctg aagcggataa gggaccctag cttcgaggtg atgtcgcagc cggccttgtc 2940 gaaggagttc gtcgacagca accagcctgc cgagctggtc caactgaacg ctgcgagcga 3000 gtacgcacct ggcctggagg acaccctcat cctgacgatg aagggcattg ctgccggcat 3060 gcagaacaca ggctagattg tccacaagaa tgcttccagc aggtgcaatc aatcaatcat 3120 caataactcc ttccatgatg agatggtgaa tatgtttaac tacccgatcc aaaataaaat 3180 atggaccaat cattctacga agcttgattc tgaacgcttc gaatttgcat cagtggtgac 3240 agcggctgtg tttgcatctt taaacgacag actaaaagca ttgtgcaccg caagatgcag 3300 acttgacatg tgcttatagc agaagtatta catggagcac atctcagggt caggtatatt 3360 gcaatctcaa aaatcaggag atacacaatc agatggatat gaaatgagaa gcaaaattgt 3420 gtctgaagaa atgagaagca agaagacagt taaagggtct gatgggttac agtctgaaaa 3480 atcaggggat atgcaatcgg agagatatga aagtgacaaa attttgtcca gagaaataag 3540 aagcaagaaa acattgaaag gtcagttatc atgctcacct agcattatgc accataaaat 3600 gatcttggca gacaatataa tctagcataa aattatatac aacaaattag agattgtagc 3660 gttgataaat tttcaaggac tatatatcta tagttagtta cagtgagaaa taacaaaagt 3720 tacatatgta actacaatac atatagactg taactgggct aaaactgcaa gcatgcttga 3780 atttcttcaa aaaataaaga atttcttc 3808 <210> 60 <211> 968 <212> PRT <213> Oryza sativa <400> 60 Met Ala Ala Ala Ala Gly Lys Ala Ala Met Glu Arg His Gln Ser Ile 1 5 10 15 Asp Ala Gln Leu Arg Leu Leu Ala Pro Gly Lys Val Ser Glu Asp Asp 20 25 30 Lys Leu Val Glu Tyr Asp Ala Leu Leu Val Asp Arg Phe Leu Asp Ile 35 40 45 Leu Gln Asp Leu His Gly Pro His Leu Arg Glu Phe Val Gln Glu Cys 50 55 60 Tyr Glu Leu Ser Ala Glu Tyr Glu Asn Asp Arg Asp Glu Ala Arg Leu 65 70 75 80 Asp Glu Leu Gly Arg Lys Leu Thr Ser Leu Pro Pro Gly Asp Ser Ile 85 90 95 Val Val Ser Ser Ser Phe Ser His Met Leu Asn Leu Ala Asn Leu Ala 100 105 110 Glu Glu Val Gln Ile Ala His Arg Arg Arg Ile Lys Leu Lys Arg Gly 115 120 125 Asp Phe Ala Asp Glu Ala Ser Ala Pro Thr Glu Ser Asp Ile Glu Glu 130 135 140 Thr Leu Lys Arg Leu Val Thr Gln Leu Gly Lys Ser Arg Glu Glu Val 145 150 155 160 Phe Asp Ala Leu Lys Asn Gln Thr Val Asp Leu Val Phe Thr Ala His 165 170 175 Pro Thr Gln Ser Val Arg Arg Ser Leu Leu Gln Lys His Gly Arg Ile 180 185 190 Arg Asn Cys Leu Arg Gln Leu Tyr Ala Lys Asp Ile Thr Ala Asp Asp 195 200 205 Lys Gln Glu Leu Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala Phe 210 215 220 Arg Thr Asp Glu Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu Met 225 230 235 240 Arg Ala Gly Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val Pro 245 250 255 Lys Phe Leu Arg Arg Ile Asp Thr Ala Leu Lys Asn Ile Gly Ile Asn 260 265 270 Glu Arg Leu Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp Met 275 280 285 Gly Gly Asp Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr Arg 290 295 300 Asp Val Cys Leu Leu Ala Arg Met Met Ala Ala Asn Leu Tyr Phe Ser 305 310 315 320 Gln Ile Glu Asp Leu Met Phe Glu Leu Ser Met Trp Arg Cys Ser Asp 325 330 335 Glu Leu Arg Ile Arg Ala Asp Asp Leu His Cys Ser Ser Arg Lys Ala 340 345 350 Ala Lys His Tyr Ile Glu Phe Trp Lys Gln Ile Pro Pro Asn Glu Pro 355 360 365 Tyr Arg Val Ile Leu Gly Gly Val Arg Asp Lys Leu Tyr Tyr Thr Arg 370 375 380 Glu Arg Thr Arg His Leu Leu Thr Thr Gly Val Ser Glu Ile Pro Glu 385 390 395 400 Glu Ala Thr Phe Thr Asn Val Glu Glu Phe Leu Glu Pro Leu Glu Leu 405 410 415 Cys Tyr Arg Ser Leu Cys Ala Cys Gly Asp Lys Pro Ile Ala Asp Gly 420 425 430 Ser Leu Leu Asp Phe Leu Arg Gln Val Ser Thr Phe Gly Leu Ala Leu 435 440 445 Val Lys Leu Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Leu 450 455 460 Asp Ala Ile Thr Thr Tyr Leu Gly Ile Gly Ser Tyr Ala Glu Trp Ser 465 470 475 480 Glu Glu Lys Arg Gln Asp Trp Leu Leu Ser Glu Leu Arg Gly Lys Arg 485 490 495 Pro Leu Phe Gly Pro Asp Leu Pro Gln Thr Glu Glu Ile Ala Asp Val 500 505 510 Leu Gly Thr Phe His Val Leu Ala Glu Leu Pro Ala Asp Cys Phe Gly 515 520 525 Ala Tyr Ile Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Ala Val 530 535 540 Glu Leu Leu Gln Arg Glu Cys His Ile Lys Gln Pro Leu Arg Val Val 545 550 555 560 Pro Leu Phe Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro Ala Ala Val 565 570 575 Ala Arg Leu Phe Ser Ile Asp Trp Tyr Met Asn Arg Ile Asn Gly Lys 580 585 590 Gln Glu Val Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg 595 600 605 Leu Ser Ala Ala Trp Gln Met Tyr Lys Ala Gln Glu Glu Leu Val Lys 610 615 620 Val Ala Lys His Tyr Gly Val Lys Leu Thr Met Phe His Gly Arg Gly 625 630 635 640 Gly Thr Val Gly Arg Gly Gly Gly Pro Ser His Leu Ala Ile Leu Ser 645 650 655 Gln Pro Pro Asp Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly 660 665 670 Glu Val Ile Glu His Ser Phe Gly Glu Glu His Leu Cys Phe Arg Thr 675 680 685 Leu Gln Arg Phe Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro 690 695 700 Ile Ser Pro Lys Pro Glu Trp Arg Ala Leu Met Asp Glu Met Ala Val 705 710 715 720 Val Ala Thr Lys Glu Tyr Arg Ser Ile Val Phe Lys Glu Pro Arg Phe 725 730 735 Val Glu Tyr Phe Arg Ser Ala Thr Pro Glu Thr Glu Tyr Gly Arg Met 740 745 750 Asn Ile Gly Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu 755 760 765 Ser Leu Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe 770 775 780 His Leu Pro Val Trp Leu Gly Phe Gly Gly Ala Phe Lys His Ile Met 785 790 795 800 Gln Lys Asp Ile Arg Asn Ile His Thr Leu Lys Glu Met Tyr Asn Glu 805 810 815 Trp Pro Phe Phe Arg Val Thr Leu Asp Leu Leu Glu Met Val Phe Ala 820 825 830 Lys Gly Asp Pro Gly Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ala 835 840 845 Gly Asp Leu Gln Ser Phe Gly Glu Gln Leu Arg Asn Asn Phe Glu Glu 850 855 860 Thr Lys Gln Leu Leu Leu Gln Val Ala Gly His Lys Asp Ile Leu Glu 865 870 875 880 Gly Asp Pro Tyr Leu Lys Gln Arg Leu Arg Leu Arg Glu Ser Tyr Ile 885 890 895 Thr Thr Leu Asn Val Cys Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp 900 905 910 Pro Ser Phe Glu Val Met Ser Gln Pro Ala Leu Ser Lys Glu Phe Val 915 920 925 Asp Ser Asn Gln Pro Ala Glu Leu Val Gln Leu Asn Ala Ala Ser Glu 930 935 940 Tyr Ala Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile 945 950 955 960 Ala Ala Gly Met Gln Asn Thr Gly 965 <210> 61 <211> 3055 <212> DNA <213> Oryza sativa <400> 61 gcattggccg ttcggatcgc ggtggcgctt cgtgaaggtg ggggagaagg gggaaaagga 60 gtcggctttc ggggagatgg cgcgcaatgc ggcggacaag gggacgtcca tcgacgcgca 120 gctgcggatc ctggcgccta agaagctctc ggaggacgac aagcttgtgg agtacgacgc 180 gctgctcctc gatcgcttcc tcgacatcct ccaggatctg catggggagg acatcaggga 240 gacggttcaa gaatgctatg aattagctgc tgagtatgaa agtaagattg cgtatcgtag 300 gaggataaaa ctgaagaagg gtgattttgc tgatgaaaac tctgctacaa ctgaatcaaa 360 ctttgaggag accctaaaaa ggcttgttgg tgagcttaag aagtcccctc atgaggtatt 420 tgatgctctc aagaatcaaa caatcgacct ggtcctgaca gcacatccaa ctcagtcagt 480 caggaggtcg ctgctacaaa agcatggcag gataagaagt tgtttaacaa aactttatgc 540 aaaagacata actccagatg agaagcagga actcgatgaa gcacttaaga gagagatcca 600 agccgccttt agaacagatg aaattcggcg agcacctcct acaccacagg atgaaatgcg 660 tgctggaatg agttattttc atgagacaat atggaagggt gtacccaagt ttttacgtag 720 ggttgatact gcccttaaga acattggcat aaacgagcga gtgccctata atgctcctct 780 tattcaattt tcttcttgga tgggtggaga ccgtgatgga aatccaagag tcacaccaga 840 ggttacaagg gacgtatgcc tgttagctag aatgatggct gctaacttat actatgcaca 900 gatagaggat ctgatgtttg agctatctat gtggcgctgt agtgatgaac tacgtgtaaa 960 agctgatcag ttacaccgtt gcgcaaagaa aaacacaaca aagcactata tagagttctg 1020 gaaacaagtt cctccgagtg aaccctatcg tgtaatactg agcaatgtca gagataagtt 1080 gtacaataca cgcgagcgag cacgccattt attagccagt ggattttctg aaattcctga 1140 cgaagcaaca ttcactgatg ttgagcagtt cttggagcct cttgagctct gttacaggtc 1200 tctctgtgcc tgtggtgata attctattgc agatggcagt cttcttgact ttctacggca 1260 agtgtccaca tttggactat cccttgttag acttgatatt aggcaagaat ctgaccgaca 1320 tactgatgtt atggatgcca taactcaata ccttggaatt ggatcctatc gtgaatggtc 1380 agaggagaaa cgccaagaat ggcttctgtc agaactcaat ggaaagaggc cattatttgg 1440 tcctgacctt ccccagacgg atgaaattgc tgatgcccta gatacttttc atgtgatagc 1500 agaactaccc tatgatagct ttggtgcata tgtaatatcc atggcaacag ctccttcaga 1560 tgttctagca gttgagcttc tgcaacgtga atgtcatgtg aagaagccac tgagagttgt 1620 gccattgttt gaaaaactag cagatctgga agcagcacca gcagctcttg cccgactttt 1680 ctctgttgac tggtacagaa ataggatcga cggaaagcag gaagtaatga ttgggtattc 1740 agattctgga aaagatgctg gccgtttctc tgcagcttgg gaactgtata aagctcaaga 1800 ggagcttatt aaagttgcta agcagtttgg ggttaagttg actatgtttc atgggcgagg 1860 tggaactgtt ggaagaggtg ggggtcctac acaccttgct atactgtcac aacctccaga 1920 taccattcat ggatcacttc gtgtgactgt tcaaggtgaa gtcattgagc aatcttttgg 1980 agaggagcat ttgtgtttta ggacacttca acgttttaca tctgctactc ttgagcatgg 2040 tatgcatcca ccaatttcac caaagccaga atggcgtgct ttgatggatg aaatggccgc 2100 tgttgctaca aaagaatacc ggtccattgt cttccaagag gcacgatttg ttgaatattt 2160 ccgccttgca acaccagagt tggaatatgg taggatgaat attggaagta ggccatcaaa 2220 acgaaagcct agtggaggca ttgaatcact tcgtgcaatt ccttggatct ttgcttggac 2280 acaaactcga ttccacctac cagtgtggct tggttttggc gcagcgttca agcatgtctt 2340 gcagaaggac atacgcaatc ttcagatcct tcaggagatg tacaacgaat ggccattttt 2400 cagggttaca atagacttgg ttgagatggt gtttgctaag ggtgatcctg gtatagcagc 2460 tctgtatgac aagttgctag tttctgagga tttgtggcca tttggtgctc gtcttagagc 2520 aaactatgaa gaaacaaagc aacttcttct acaggttgct ggacacaaag accttctgga 2580 gggagatcct tacttgaggc agagactgcg tatccgtgat tcctacatca cagcgctgaa 2640 tgtttgccaa gcttgcacgc taaagcgtat cagggaccct ggcttccatg taagcccccg 2700 agctcacctc tccaaggaca taatggactc agggaagcca gccgctgagc ttgtgaagct 2760 gaacacaaca agcgagtacg gcccaggcct cgaggacact ctcatcctga ccatgaaggg 2820 catcgctgct ggtatgcaga acactgggtg aagtagaact ggttcgttct gatggtgtgt 2880 tatggtgtca tgaattagtg tagtttgcac ctctatgcaa tcactatttg cagtttgcac 2940 ctctgaactc tatatgtaaa taaggggatg ctaagcaacg tataactaag actggttata 3000 tccatggata ttacctgttt agcatgttat atatcgaact cttatgctgt tcacc 3055 <210> 62 <211> 924 <212> PRT <213> Oryza sativa <400> 62 Met Ala Arg Asn Ala Ala Asp Lys Gly Thr Ser Ile Asp Ala Gln Leu 1 5 10 15 Arg Ile Leu Ala Pro Lys Lys Leu Ser Glu Asp Asp Lys Leu Val Glu 20 25 30 Tyr Asp Ala Leu Leu Leu Asp Arg Phe Leu Asp Ile Leu Gln Asp Leu 35 40 45 His Gly Glu Asp Ile Arg Glu Thr Val Gln Glu Cys Tyr Glu Leu Ala 50 55 60 Ala Glu Tyr Glu Ser Lys Ile Ala Tyr Arg Arg Arg Ile Lys Leu Lys 65 70 75 80 Lys Gly Asp Phe Ala Asp Glu Asn Ser Ala Thr Thr Glu Ser Asn Phe 85 90 95 Glu Glu Thr Leu Lys Arg Leu Val Gly Glu Leu Lys Lys Ser Pro His 100 105 110 Glu Val Phe Asp Ala Leu Lys Asn Gln Thr Ile Asp Leu Val Leu Thr 115 120 125 Ala His Pro Thr Gln Ser Val Arg Arg Ser Leu Leu Gln Lys His Gly 130 135 140 Arg Ile Arg Ser Cys Leu Thr Lys Leu Tyr Ala Lys Asp Ile Thr Pro 145 150 155 160 Asp Glu Lys Gln Glu Leu Asp Glu Ala Leu Lys Arg Glu Ile Gln Ala 165 170 175 Ala Phe Arg Thr Asp Glu Ile Arg Arg Ala Pro Pro Thr Pro Gln Asp 180 185 190 Glu Met Arg Ala Gly Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly 195 200 205 Val Pro Lys Phe Leu Arg Arg Val Asp Thr Ala Leu Lys Asn Ile Gly 210 215 220 Ile Asn Glu Arg Val Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser 225 230 235 240 Trp Met Gly Gly Asp Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val 245 250 255 Thr Arg Asp Val Cys Leu Leu Ala Arg Met Met Ala Ala Asn Leu Tyr 260 265 270 Tyr Ala Gln Ile Glu Asp Leu Met Phe Glu Leu Ser Met Trp Arg Cys 275 280 285 Ser Asp Glu Leu Arg Val Lys Ala Asp Gln Leu His Arg Cys Ala Lys 290 295 300 Lys Asn Thr Thr Lys His Tyr Ile Glu Phe Trp Lys Gln Val Pro Pro 305 310 315 320 Ser Glu Pro Tyr Arg Val Ile Leu Ser Asn Val Arg Asp Lys Leu Tyr 325 330 335 Asn Thr Arg Glu Arg Ala Arg His Leu Leu Ala Ser Gly Phe Ser Glu 340 345 350 Ile Pro Asp Glu Ala Thr Phe Thr Asp Val Glu Gln Phe Leu Glu Pro 355 360 365 Leu Glu Leu Cys Tyr Arg Ser Leu Cys Ala Cys Gly Asp Asn Ser Ile 370 375 380 Ala Asp Gly Ser Leu Leu Asp Phe Leu Arg Gln Val Ser Thr Phe Gly 385 390 395 400 Leu Ser Leu Val Arg Leu Asp Ile Arg Gln Glu Ser Asp Arg His Thr 405 410 415 Asp Val Met Asp Ala Ile Thr Gln Tyr Leu Gly Ile Gly Ser Tyr Arg 420 425 430 Glu Trp Ser Glu Glu Lys Arg Gln Glu Trp Leu Leu Ser Glu Leu Asn 435 440 445 Gly Lys Arg Pro Leu Phe Gly Pro Asp Leu Pro Gln Thr Asp Glu Ile 450 455 460 Ala Asp Ala Leu Asp Thr Phe His Val Ile Ala Glu Leu Pro Tyr Asp 465 470 475 480 Ser Phe Gly Ala Tyr Val Ile Ser Met Ala Thr Ala Pro Ser Asp Val 485 490 495 Leu Ala Val Glu Leu Leu Gln Arg Glu Cys His Val Lys Lys Pro Leu 500 505 510 Arg Val Val Pro Leu Phe Glu Lys Leu Ala Asp Leu Glu Ala Ala Pro 515 520 525 Ala Ala Leu Ala Arg Leu Phe Ser Val Asp Trp Tyr Arg Asn Arg Ile 530 535 540 Asp Gly Lys Gln Glu Val Met Ile Gly Tyr Ser Asp Ser Gly Lys Asp 545 550 555 560 Ala Gly Arg Phe Ser Ala Ala Trp Glu Leu Tyr Lys Ala Gln Glu Glu 565 570 575 Leu Ile Lys Val Ala Lys Gln Phe Gly Val Lys Leu Thr Met Phe His 580 585 590 Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala 595 600 605 Ile Leu Ser Gln Pro Pro Asp Thr Ile His Gly Ser Leu Arg Val Thr 610 615 620 Val Gln Gly Glu Val Ile Glu Gln Ser Phe Gly Glu Glu His Leu Cys 625 630 635 640 Phe Arg Thr Leu Gln Arg Phe Thr Ser Ala Thr Leu Glu His Gly Met 645 650 655 His Pro Pro Ile Ser Pro Lys Pro Glu Trp Arg Ala Leu Met Asp Glu 660 665 670 Met Ala Ala Val Ala Thr Lys Glu Tyr Arg Ser Ile Val Phe Gln Glu 675 680 685 Ala Arg Phe Val Glu Tyr Phe Arg Leu Ala Thr Pro Glu Leu Glu Tyr 690 695 700 Gly Arg Met Asn Ile Gly Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly 705 710 715 720 Gly Ile Glu Ser Leu Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln 725 730 735 Thr Arg Phe His Leu Pro Val Trp Leu Gly Phe Gly Ala Ala Phe Lys 740 745 750 His Val Leu Gln Lys Asp Ile Arg Asn Leu Gln Ile Leu Gln Glu Met 755 760 765 Tyr Asn Glu Trp Pro Phe Phe Arg Val Thr Ile Asp Leu Val Glu Met 770 775 780 Val Phe Ala Lys Gly Asp Pro Gly Ile Ala Ala Leu Tyr Asp Lys Leu 785 790 795 800 Leu Val Ser Glu Asp Leu Trp Pro Phe Gly Ala Arg Leu Arg Ala Asn 805 810 815 Tyr Glu Glu Thr Lys Gln Leu Leu Leu Gln Val Ala Gly His Lys Asp 820 825 830 Leu Leu Glu Gly Asp Pro Tyr Leu Arg Gln Arg Leu Arg Ile Arg Asp 835 840 845 Ser Tyr Ile Thr Ala Leu Asn Val Cys Gln Ala Cys Thr Leu Lys Arg 850 855 860 Ile Arg Asp Pro Gly Phe His Val Ser Pro Arg Ala His Leu Ser Lys 865 870 875 880 Asp Ile Met Asp Ser Gly Lys Pro Ala Ala Glu Leu Val Lys Leu Asn 885 890 895 Thr Thr Ser Glu Tyr Gly Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr 900 905 910 Met Lys Gly Ile Ala Ala Gly Met Gln Asn Thr Gly 915 920 <210> 63 <211> 2832 <212> DNA <213> Welwitschia mirabilis <220> <221> misc_feature <222> (1741)..(1743) <223> n is a, c, g, or t <400> 63 agcatcgacg cgcaactgcg gcttttggtc ccaacgaagg tttccgaaga tgataagctt 60 attgagtatg acgctcttct gatggaccgc tttctggata tcttgcaaga cctacatgga 120 gaagaaatta gagaaacggt tcaagagtgc tatgagcttt caggagaata cgaaggaaag 180 tttgacacgg caaagttgga ggagcttgga ggagtgttaa caagtctaga tgctggagac 240 tccattgttg ttgcagctct ttctcacatg cttaacctag cgaacttggc tgaggaggtt 300 cagatagcat accgaagacg aattaaacac aaaaagaaag gggatttcgc ggatgagaat 360 tccgcaacga cggaatcaga cattgaagaa acctttaaaa ggcttgtaaa tcagcttgga 420 aggtctcctc aagaagtttt tgacgctctc aaaaatcaaa caattgattt ggtcttgact 480 gcacatccaa cgcatcagtc ggtatccctg ctacaaaagc atggcaggat ccgaaactgc 540 ttgtctcagt tgtatgcgaa agacattacg cccgatgaaa aacaggagct tgatgaagct 600 ttacagaggg agattcaagc tgccttcaga actgatgaaa ttcggcgcac tcctcccacc 660 cctcaagatg agatgcgagc aggaatgagt tatttccatg aaaccatatg gaaaggtgtc 720 cctaagttct tacgtcgtgt tgacactgct ctaaagtcga ttggtataaa tgagagactt 780 ccttacaatg cccccctaat acaattctcg tcgtggatgg gcggcgaccg cgacgggaat 840 cctagagtca ctccagaagt cacgcgagac gtttgtctcc ttgcgaggat gatggctaca 900 aatttatact actctcagat agaggacctt atgtttgagt tgtcaatgtg gcgatgtagc 960 gatgagcttc ggcaacgtgc tctgcagctt cataattctg caaagagaga tgcaaaacat 1020 tacatagagt tttggaagca agtacctccc aatgagccat ttagggtaat tttgggagat 1080 gttagggaca agttatataa cactcgggaa cgcactcgcc agttgcttgc caatggtttc 1140 tcagatgtgc cagaagaagc acttacgagt gtagatcagt tgttggaacc gttagagttg 1200 tgctatcgat ctctgtgctc taccggcgat caacccattg cagatggcag tcttcttgat 1260 ttcatgcgtc aagtctcaac ctttggctta actcttgtga agttggatat tagacaagaa 1320 tcagatcgac acactgatgt tatcgacgca ataacaagac atctaggcct tgggtcctat 1380 aaagagtggc cagaagacaa acgacaggag tggctgttgg ctgaactacg tggaaaacgt 1440 ccactatttg gacccgacct tccaactaca gatgaaataa gagaagttct tgacacattc 1500 cacgtggtag ctgaacttcc tccagacaac tttggagctt acatcatatc aatggctact 1560 gctccttcag atgttttagt cgttgagtta ctgcagaggg aatgccgtgt gaaaaagcct 1620 ctgcgagttg tgcctttgtt tgagaagctt gctgatttag agaatcgtcc cgcggctttg 1680 gcaaggctgt tctcaattga ttggtataga aacagaattg atggaaagca agaagtaatg 1740 nnnggttact cagactccgg caaggatgcc ggaagactat ctgcagcatg gcaattatac 1800 aaggctcaag aggaattgat caaggttgca aaacagtttg gaattaagct gacaatgttt 1860 catggtcgtg gagggaccgt tggaagagga ggtggtccaa cccatctggc tatattatct 1920 caacctccag acacaattca cgggtcattg cgagttaccg tccaagggga ggttattgag 1980 cagtgttttg gggaggaaca tctgtgtttc cgaactcttc agcgctttac tgctgccaca 2040 ttggaacatg gaatgcatcc tccaattgca cctaagcccg aatggcgtca actgatggat 2100 gaaatggctg ttgttgctac tcaagagtat aggtcttatg ttttccacaa caagagattt 2160 gtggagtatt tccgatccgc aactcccgag ttggagtatg gacggatgaa tataggcagt 2220 cgtccatcaa aaagaaagcc cagtggaggc attgaatcac ttcgtgcaat tccatggata 2280 tttgcttgga cacagaccag attccatctt cctgtttggc ttggatttgg tgctgctttc 2340 aagagtgtta tcgagaagga cattcgaaat cttcacacgc tgcaacaaat gtataacgaa 2400 tggccatttt tccgtgtcac cattgaccta gttgaaatgg tgtttgccaa gcaccctgaa 2460 attgctgcat tatacgataa actgcttgta tcatcagtct tgtgggcttt cggggaacaa 2520 ctaagaaaaa actatgtaga gactaagacc cttctgctgc aggttgctgg acacaaagaa 2580 gtcttagaag gcgacccata tctgaaacaa cgattgagac ttcgtgactc atatatcaca 2640 accttgaatg cacttcaggc atatacttta aaacggatac gagatccaag ctaccatgtc 2700 accctcaggc ctcatttatc taaagaaagc tcaaccaagc cagcagcaga attggtaaaa 2760 ttaaacccaa ccagtgagta tgcaccggga ttagaagata cattgatctt aaccatgaag 2820 ggcattgctg cc 2832 <210> 64 <211> 944 <212> PRT <213> Welwitschia mirabilis <220> <221> UNSURE <222> (581)..(581) <223> Xaa can be any naturally occurring amino acid <400> 64 Ser Ile Asp Ala Gln Leu Arg Leu Leu Val Pro Thr Lys Val Ser Glu 1 5 10 15 Asp Asp Lys Leu Ile Glu Tyr Asp Ala Leu Leu Met Asp Arg Phe Leu 20 25 30 Asp Ile Leu Gln Asp Leu His Gly Glu Glu Ile Arg Glu Thr Val Gln 35 40 45 Glu Cys Tyr Glu Leu Ser Gly Glu Tyr Glu Gly Lys Phe Asp Thr Ala 50 55 60 Lys Leu Glu Glu Leu Gly Gly Val Leu Thr Ser Leu Asp Ala Gly Asp 65 70 75 80 Ser Ile Val Val Ala Ala Leu Ser His Met Leu Asn Leu Ala Asn Leu 85 90 95 Ala Glu Glu Val Gln Ile Ala Tyr Arg Arg Arg Ile Lys His Lys Lys 100 105 110 Lys Gly Asp Phe Ala Asp Glu Asn Ser Ala Thr Thr Glu Ser Asp Ile 115 120 125 Glu Glu Thr Phe Lys Arg Leu Val Asn Gln Leu Gly Arg Ser Pro Gln 130 135 140 Glu Val Phe Asp Ala Leu Lys Asn Gln Thr Ile Asp Leu Val Leu Thr 145 150 155 160 Ala His Pro Thr His Gln Ser Val Ser Leu Leu Gln Lys His Gly Arg 165 170 175 Ile Arg Asn Cys Leu Ser Gln Leu Tyr Ala Lys Asp Ile Thr Pro Asp 180 185 190 Glu Lys Gln Glu Leu Asp Glu Ala Leu Gln Arg Glu Ile Gln Ala Ala 195 200 205 Phe Arg Thr Asp Glu Ile Arg Arg Thr Pro Pro Thr Pro Gln Asp Glu 210 215 220 Met Arg Ala Gly Met Ser Tyr Phe His Glu Thr Ile Trp Lys Gly Val 225 230 235 240 Pro Lys Phe Leu Arg Arg Val Asp Thr Ala Leu Lys Ser Ile Gly Ile 245 250 255 Asn Glu Arg Leu Pro Tyr Asn Ala Pro Leu Ile Gln Phe Ser Ser Trp 260 265 270 Met Gly Gly Asp Arg Asp Gly Asn Pro Arg Val Thr Pro Glu Val Thr 275 280 285 Arg Asp Val Cys Leu Leu Ala Arg Met Met Ala Thr Asn Leu Tyr Tyr 290 295 300 Ser Gln Ile Glu Asp Leu Met Phe Glu Leu Ser Met Trp Arg Cys Ser 305 310 315 320 Asp Glu Leu Arg Gln Arg Ala Leu Gln Leu His Asn Ser Ala Lys Arg 325 330 335 Asp Ala Lys His Tyr Ile Glu Phe Trp Lys Gln Val Pro Pro Asn Glu 340 345 350 Pro Phe Arg Val Ile Leu Gly Asp Val Arg Asp Lys Leu Tyr Asn Thr 355 360 365 Arg Glu Arg Thr Arg Gln Leu Leu Ala Asn Gly Phe Ser Asp Val Pro 370 375 380 Glu Glu Ala Leu Thr Ser Val Asp Gln Leu Leu Glu Pro Leu Glu Leu 385 390 395 400 Cys Tyr Arg Ser Leu Cys Ser Thr Gly Asp Gln Pro Ile Ala Asp Gly 405 410 415 Ser Leu Leu Asp Phe Met Arg Gln Val Ser Thr Phe Gly Leu Thr Leu 420 425 430 Val Lys Leu Asp Ile Arg Gln Glu Ser Asp Arg His Thr Asp Val Ile 435 440 445 Asp Ala Ile Thr Arg His Leu Gly Leu Gly Ser Tyr Lys Glu Trp Pro 450 455 460 Glu Asp Lys Arg Gln Glu Trp Leu Leu Ala Glu Leu Arg Gly Lys Arg 465 470 475 480 Pro Leu Phe Gly Pro Asp Leu Pro Thr Thr Asp Glu Ile Arg Glu Val 485 490 495 Leu Asp Thr Phe His Val Val Ala Glu Leu Pro Pro Asp Asn Phe Gly 500 505 510 Ala Tyr Ile Ile Ser Met Ala Thr Ala Pro Ser Asp Val Leu Val Val 515 520 525 Glu Leu Leu Gln Arg Glu Cys Arg Val Lys Lys Pro Leu Arg Val Val 530 535 540 Pro Leu Phe Glu Lys Leu Ala Asp Leu Glu Asn Arg Pro Ala Ala Leu 545 550 555 560 Ala Arg Leu Phe Ser Ile Asp Trp Tyr Arg Asn Arg Ile Asp Gly Lys 565 570 575 Gln Glu Val Met Xaa Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg 580 585 590 Leu Ser Ala Ala Trp Gln Leu Tyr Lys Ala Gln Glu Glu Leu Ile Lys 595 600 605 Val Ala Lys Gln Phe Gly Ile Lys Leu Thr Met Phe His Gly Arg Gly 610 615 620 Gly Thr Val Gly Arg Gly Gly Gly Pro Thr His Leu Ala Ile Leu Ser 625 630 635 640 Gln Pro Pro Asp Thr Ile His Gly Ser Leu Arg Val Thr Val Gln Gly 645 650 655 Glu Val Ile Glu Gln Cys Phe Gly Glu Glu His Leu Cys Phe Arg Thr 660 665 670 Leu Gln Arg Phe Thr Ala Ala Thr Leu Glu His Gly Met His Pro Pro 675 680 685 Ile Ala Pro Lys Pro Glu Trp Arg Gln Leu Met Asp Glu Met Ala Val 690 695 700 Val Ala Thr Gln Glu Tyr Arg Ser Tyr Val Phe His Asn Lys Arg Phe 705 710 715 720 Val Glu Tyr Phe Arg Ser Ala Thr Pro Glu Leu Glu Tyr Gly Arg Met 725 730 735 Asn Ile Gly Ser Arg Pro Ser Lys Arg Lys Pro Ser Gly Gly Ile Glu 740 745 750 Ser Leu Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Thr Arg Phe 755 760 765 His Leu Pro Val Trp Leu Gly Phe Gly Ala Ala Phe Lys Ser Val Ile 770 775 780 Glu Lys Asp Ile Arg Asn Leu His Thr Leu Gln Gln Met Tyr Asn Glu 785 790 795 800 Trp Pro Phe Phe Arg Val Thr Ile Asp Leu Val Glu Met Val Phe Ala 805 810 815 Lys His Pro Glu Ile Ala Ala Leu Tyr Asp Lys Leu Leu Val Ser Ser 820 825 830 Val Leu Trp Ala Phe Gly Glu Gln Leu Arg Lys Asn Tyr Val Glu Thr 835 840 845 Lys Thr Leu Leu Leu Gln Val Ala Gly His Lys Glu Val Leu Glu Gly 850 855 860 Asp Pro Tyr Leu Lys Gln Arg Leu Arg Leu Arg Asp Ser Tyr Ile Thr 865 870 875 880 Thr Leu Asn Ala Leu Gln Ala Tyr Thr Leu Lys Arg Ile Arg Asp Pro 885 890 895 Ser Tyr His Val Thr Leu Arg Pro His Leu Ser Lys Glu Ser Ser Thr 900 905 910 Lys Pro Ala Ala Glu Leu Val Lys Leu Asn Pro Thr Ser Glu Tyr Ala 915 920 925 Pro Gly Leu Glu Asp Thr Leu Ile Leu Thr Met Lys Gly Ile Ala Ala 930 935 940 <210> 65 <211> 4776 <212> DNA <213> Chlamydomonas reinhardtii <400> 65 atgacggact ccacatatga ttttggagcc gtgagggacg atctgacgcc gcttgaggat 60 gactgcaagc ttctcggtag cctgcttgac gactgtctcc gcgtcgaaat cggcgagacc 120 atgttcaaga agattgaacg catccgagca ctggcgcaat gtgcctcaaa tctgtcgatc 180 aagggagacg cgggcgcctc cgacatgctg tcgcaccggc tggcggagga gctgatgaac 240 ctggacatgg acgaggcggt gccgctcaca cgcgcctgcg gccactacct caacctgtcc 300 ggcatcgcag agctgcacca cggagtgcgc cgcgaccgcg ccactcgcga gcccaacccc 360 aacagctgcg acgcggtgtt tgcgcggctg atcacggagg gcgtggaccc cgaggagctg 420 taccgggcgg tgtcggagca gaacgtggag gtggtgctca ccgcgcaccc cacacaggtg 480 aaccggcgca cgctgcagta caagcacact cgcattgcgg cgctgctgca gcagcacgac 540 cgctccgacc tgacggcgga ggagcggcgc aacatggtga gcgagctgca gcgggaggtg 600 gcggcgctgt ggcagacgga cgagctgagg aggcagaagc ccacgccgct ggacgaggcg 660 cgcggcggtc tgcacattgt ggagcagtcg ctgtgggccg cggtgccgca gtacatgcgc 720 cgcctcagcg ccgcgctcaa gaaacacacc gggcacgacc tgccgctgca ggccacgccc 780 ttccgcttcg gcagctggat gggcggcgac cgcgatggca accccaacgt gaccgccaag 840 gtgacggcgc acgtgacggc cctggcgcgc tggatggcgg cggatctgta cctgcgtgag 900 atcgacacgc tgaggtttga gctgtccatg aaccagtgca gtgcggcggt gtggaagatg 960 gcccgccgca tcatcgccga gggccacacc aagcgcgccg gcgtggtccg ggccaaggcc 1020 gccgccgccc tgcaccagac cgcaacagac gcagccagcc atggcggctc cgccgcctcg 1080 gcggccgccg ccgccgccgc aggcggcgac gtcgtcgctg acggcaccag cggcggcggc 1140 gctgccgccg ccgccggccc cgccgccgct gccgcggcgg acgacgcgtt caccttcagc 1200 cggttggggc ggccccggcc ggagcggccg agcacggacg tgcggagtgt gggcgtgctg 1260 gcgggcggcg agggcgcggc gttcccgggc ggcatgatcc tgggcacgca gccggtgtcg 1320 gcgcacacgg cggcggaggt gtcggtgccg cacgagctgc cgggacagga cgtggagggc 1380 ggctcggaga tggacttcaa cgagtcccgc cgcgcctcgg acgccggaga cctgggcgcc 1440 tcgcagcacc ccatgctggg cgggccctcc gccggcgcct ccgccgagcc caccgcccac 1500 ggctacacca ccaccgccac cgccgccgcc gccgccgccg acggcacgca gcccgagccc 1560 gaagtccccg gcacgcccag ctacgccgac cccggcaccc ccgaccgcct tggcgcgctg 1620 cccggcccct tcacgcccgg ccccacgccc ttccgcgagg cggccaacgc cgccatgagc 1680 accgccgcca gcggcggcgc gggcggcggc ggcggcggcg gcgcgaaccg cgcggcctcg 1740 ggcctgggcg gcgaccccac cttcacgcgt cgcagcctga tggcgcagcg gctgggaacc 1800 agctcggtgc agttcgcgcg cgcgcacgag caccccggct tccaccccta ccgcatcgtg 1860 ttgggccacg tgcgcgacag gctggcggcc acgcggcggc gcatggagga cctgctgagc 1920 ggccgcgagc cggcgggcga ggcgcacggc ggcgtggggg cgggcggcgg cggcggcggc 1980 ggcgcggcgc cgtggtatga gagcgaggac gagctggcgg agccgctgat ggcgtgctac 2040 tggtcgctgt gggagtgcgg cggcggcgtc attgcggacg ggcggctgct ggacctcatc 2100 cgccgcgtgt acaccttcgg catgtgcctc atgaagctag acctgcgcca ggagtccacc 2160 cgccacgccg aggccctgga cgccgtgacc agctacctgg gtctgggctc ctacctggag 2220 tggagcgagg accagaaaat cgagtggctc acaaaggagc tgcagggccg gcggccgctc 2280 atccccgccg acatgcccat gagcgccgag gtgcgcgagg tgctggacac cttcaaggtg 2340 gccgcccatc tgggccgtga caacctgggc gcctacgtca tctccatgac caagggcgcc 2400 tcggacgtga tggcggtgga gctgctgcag cgcgaggcgc gcatgcaggt gggcgccgag 2460 gcgggcggcc gcggcggcgg cgggcccgag gacggcggct cgctgcgcgt ggtgccgctg 2520 ttcgagacgc tggaggacct ggacgcggcg gaggacgtga tgacgcggct gctgaccaac 2580 ccctggtacc gcgagcacct gcgggcagtg cacggcgacg cgcaggaggt gatgctggga 2640 tacagcgaca gcggcaagga cgccggccgc ctggctgcca actgggcgct gtacaagtgt 2700 caggagcggc tggtggccat caccaaggcc aacaacgtca agctcacgct gttccacggc 2760 cgcggcggca ccgtgggccg cggcggcggg cccacccaca tcgccatcca gtcgcagccg 2820 cccggctctg tggaggggac cttccgcatc accgagcagg gcgagatggt ccaggccaag 2880 ttcggcatca gcggcgtggc tctgagccag ctggagacct acaccaccgc tgtgctgctg 2940 gccaccatgc gcccgcccag cccgccgcgc cgcgaggagt ggcgcgccgt gatggagatg 3000 ctcagccgcg tcagctgcga gagctaccgc aacatcgtgc accacagccc gctcttcctg 3060 cgctacttca agcacgccac gcccgaggcc gagctgggca acctctacat cggctctcgc 3120 ccggctcggc ggcgcaacaa ggacgcctcc atctccacgc tgcgcgccat cccctggatc 3180 ttcgcctgga cgcagaaccg cctcatcctg ccctcctggc tgggcattgg cgccgccctc 3240 accgcggcca tgacccaggg ccacctgccc acgctgcagg ccatgtaccg cgagtggccc 3300 ttcttcggat ccacagtgga tctgattgag atgatcctgg ccaagaccga cccgcgcatc 3360 gcggcgctgt acgaggaggt gctggtcaac gaccccgagg agaagaagct gggagccgag 3420 ctgcgcgagc ggctgcagcg ctgccagggc gccatcctca aggtgaccgg gcacgagaac 3480 ctgctgtcca acaaccccac attgagcaag ctcatctcca tgcgctcgcc cttcgtggac 3540 cccatcaaca tcctgcaggt ggaggtgctg cggcgcctgc gccaggaccc caacaacatg 3600 cgcctgcgcg acgcgctgct catctccatc aacggcatcg ccgccggcat gcgcaacacc 3660 ggctaagcag cggcggcgct gctgctggtg atggaggtgg aggtggagat ggacgtggtg 3720 cgcaccaggc acaaggcgga ggcaggtgcc agtggaggtg gggcgtcccg ggcggaggca 3780 tgagcggcgt cgacggctgg cgccgcggta tgatgtgctg cggcacgagc gacggcacgt 3840 gcggtctaaa gctgctggat gtgcttggca cggcgcgcaa gaggggtgtg ctgggggcgg 3900 aggtggtgct gaaaatgttt ggttagttgg ttggatgttt gggctagctg gtgcgctgga 3960 gcgggtaagg caagtggtgg gtggggtatg cgggtgcgct ggggtgtcca gggcggctgc 4020 gatcaatgcg ggttggtggg caaccccgtc ccggcgctga atcgctgcgt ggatctgacc 4080 tttgcggaat tcctgcctgc cttccgcgcc tggcaattta ggaactcgtt tgagcgtttg 4140 acgttgtcct agggcggcat gaccgagcat cgcgtgcatg gcagcggggc tgcgatcgcg 4200 cgtggtgagc cacagacgtt gatagtgata tttgaggcag cccagaacgc atggcggaat 4260 ggcgtggtct ttgagagctg agtgtgtcag actggcatag ggcgctgtgg ctgactaacg 4320 tcccgcacgt gtgcgactgc agaccatgtt tgcaggggca ggtactttac ttgatgtgca 4380 tggcattctc acataaagct ccgaaggatc atttgtggcg caccaaccag agacctagcc 4440 cagagcagag tgtcagcagc gatatcaaag tcattttgtg ggtggttgtc tgggtactcc 4500 gaggcgcgta cgttgagcgc gtgctcgctg cataccgcat acggaatcgg ataagtgaaa 4560 ggaggtcaca tggccagggg ctgcagatgc tggtgagggc tgcctgccta agcggcgtgt 4620 ccgggacggc agggaagcac gcatgccatt cgacgtgtgc ggtgcaaatg agaccgtgga 4680 gtcctcgggc agggcttgac agcacaagcg tggagcgcgc acacagcgca cagactatgt 4740 tttccttgtg ctctttaaca cagcgcacag aaaaaa 4776 <210> 66 <211> 1221 <212> PRT <213> Chlamydomonas reinhardtii <400> 66 Met Thr Asp Ser Thr Tyr Asp Phe Gly Ala Val Arg Asp Asp Leu Thr 1 5 10 15 Pro Leu Glu Asp Asp Cys Lys Leu Leu Gly Ser Leu Leu Asp Asp Cys 20 25 30 Leu Arg Val Glu Ile Gly Glu Thr Met Phe Lys Lys Ile Glu Arg Ile 35 40 45 Arg Ala Leu Ala Gln Cys Ala Ser Asn Leu Ser Ile Lys Gly Asp Ala 50 55 60 Gly Ala Ser Asp Met Leu Ser His Arg Leu Ala Glu Glu Leu Met Asn 65 70 75 80 Leu Asp Met Asp Glu Ala Val Pro Leu Thr Arg Ala Cys Gly His Tyr 85 90 95 Leu Asn Leu Ser Gly Ile Ala Glu Leu His His Gly Val Arg Arg Asp 100 105 110 Arg Ala Thr Arg Glu Pro Asn Pro Asn Ser Cys Asp Ala Val Phe Ala 115 120 125 Arg Leu Ile Thr Glu Gly Val Asp Pro Glu Glu Leu Tyr Arg Ala Val 130 135 140 Ser Glu Gln Asn Val Glu Val Val Leu Thr Ala His Pro Thr Gln Val 145 150 155 160 Asn Arg Arg Thr Leu Gln Tyr Lys His Thr Arg Ile Ala Ala Leu Leu 165 170 175 Gln Gln His Asp Arg Ser Asp Leu Thr Ala Glu Glu Arg Arg Asn Met 180 185 190 Val Ser Glu Leu Gln Arg Glu Val Ala Ala Leu Trp Gln Thr Asp Glu 195 200 205 Leu Arg Arg Gln Lys Pro Thr Pro Leu Asp Glu Ala Arg Gly Gly Leu 210 215 220 His Ile Val Glu Gln Ser Leu Trp Ala Ala Val Pro Gln Tyr Met Arg 225 230 235 240 Arg Leu Ser Ala Ala Leu Lys Lys His Thr Gly His Asp Leu Pro Leu 245 250 255 Gln Ala Thr Pro Phe Arg Phe Gly Ser Trp Met Gly Gly Asp Arg Asp 260 265 270 Gly Asn Pro Asn Val Thr Ala Lys Val Thr Ala His Val Thr Ala Leu 275 280 285 Ala Arg Trp Met Ala Ala Asp Leu Tyr Leu Arg Glu Ile Asp Thr Leu 290 295 300 Arg Phe Glu Leu Ser Met Asn Gln Cys Ser Ala Ala Val Trp Lys Met 305 310 315 320 Ala Arg Arg Ile Ile Ala Glu Gly His Thr Lys Arg Ala Gly Val Val 325 330 335 Arg Ala Lys Ala Ala Ala Ala Leu His Gln Thr Ala Thr Asp Ala Ala 340 345 350 Ser His Gly Gly Ser Ala Ala Ser Ala Ala Ala Ala Ala Ala Ala Gly 355 360 365 Gly Asp Val Val Ala Asp Gly Thr Ser Gly Gly Gly Ala Ala Ala Ala 370 375 380 Ala Gly Pro Ala Ala Ala Ala Ala Ala Asp Asp Ala Phe Thr Phe Ser 385 390 395 400 Arg Leu Gly Arg Pro Arg Pro Glu Arg Pro Ser Thr Asp Val Arg Ser 405 410 415 Val Gly Val Leu Ala Gly Gly Glu Gly Ala Ala Phe Pro Gly Gly Met 420 425 430 Ile Leu Gly Thr Gln Pro Val Ser Ala His Thr Ala Ala Glu Val Ser 435 440 445 Val Pro His Glu Leu Pro Gly Gln Asp Val Glu Gly Gly Ser Glu Met 450 455 460 Asp Phe Asn Glu Ser Arg Arg Ala Ser Asp Ala Gly Asp Leu Gly Ala 465 470 475 480 Ser Gln His Pro Met Leu Gly Gly Pro Ser Ala Gly Ala Ser Ala Glu 485 490 495 Pro Thr Ala His Gly Tyr Thr Thr Thr Ala Thr Ala Ala Ala Ala Ala 500 505 510 Ala Asp Gly Thr Gln Pro Glu Pro Glu Val Pro Gly Thr Pro Ser Tyr 515 520 525 Ala Asp Pro Gly Thr Pro Asp Arg Leu Gly Ala Leu Pro Gly Pro Phe 530 535 540 Thr Pro Gly Pro Thr Pro Phe Arg Glu Ala Ala Asn Ala Ala Met Ser 545 550 555 560 Thr Ala Ala Ser Gly Gly Ala Gly Gly Gly Gly Gly Gly Gly Ala Asn 565 570 575 Arg Ala Ala Ser Gly Leu Gly Gly Asp Pro Thr Phe Thr Arg Arg Ser 580 585 590 Leu Met Ala Gln Arg Leu Gly Thr Ser Ser Val Gln Phe Ala Arg Ala 595 600 605 His Glu His Pro Gly Phe His Pro Tyr Arg Ile Val Leu Gly His Val 610 615 620 Arg Asp Arg Leu Ala Ala Thr Arg Arg Arg Met Glu Asp Leu Leu Ser 625 630 635 640 Gly Arg Glu Pro Ala Gly Glu Ala His Gly Gly Val Gly Ala Gly Gly 645 650 655 Gly Gly Gly Gly Gly Ala Ala Pro Trp Tyr Glu Ser Glu Asp Glu Leu 660 665 670 Ala Glu Pro Leu Met Ala Cys Tyr Trp Ser Leu Trp Glu Cys Gly Gly 675 680 685 Gly Val Ile Ala Asp Gly Arg Leu Leu Asp Leu Ile Arg Arg Val Tyr 690 695 700 Thr Phe Gly Met Cys Leu Met Lys Leu Asp Leu Arg Gln Glu Ser Thr 705 710 715 720 Arg His Ala Glu Ala Leu Asp Ala Val Thr Ser Tyr Leu Gly Leu Gly 725 730 735 Ser Tyr Leu Glu Trp Ser Glu Asp Gln Lys Ile Glu Trp Leu Thr Lys 740 745 750 Glu Leu Gln Gly Arg Arg Pro Leu Ile Pro Ala Asp Met Pro Met Ser 755 760 765 Ala Glu Val Arg Glu Val Leu Asp Thr Phe Lys Val Ala Ala His Leu 770 775 780 Gly Arg Asp Asn Leu Gly Ala Tyr Val Ile Ser Met Thr Lys Gly Ala 785 790 795 800 Ser Asp Val Met Ala Val Glu Leu Leu Gln Arg Glu Ala Arg Met Gln 805 810 815 Val Gly Ala Glu Ala Gly Gly Arg Gly Gly Gly Gly Pro Glu Asp Gly 820 825 830 Gly Ser Leu Arg Val Val Pro Leu Phe Glu Thr Leu Glu Asp Leu Asp 835 840 845 Ala Ala Glu Asp Val Met Thr Arg Leu Leu Thr Asn Pro Trp Tyr Arg 850 855 860 Glu His Leu Arg Ala Val His Gly Asp Ala Gln Glu Val Met Leu Gly 865 870 875 880 Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Leu Ala Ala Asn Trp Ala 885 890 895 Leu Tyr Lys Cys Gln Glu Arg Leu Val Ala Ile Thr Lys Ala Asn Asn 900 905 910 Val Lys Leu Thr Leu Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly 915 920 925 Gly Gly Pro Thr His Ile Ala Ile Gln Ser Gln Pro Pro Gly Ser Val 930 935 940 Glu Gly Thr Phe Arg Ile Thr Glu Gln Gly Glu Met Val Gln Ala Lys 945 950 955 960 Phe Gly Ile Ser Gly Val Ala Leu Ser Gln Leu Glu Thr Tyr Thr Thr 965 970 975 Ala Val Leu Leu Ala Thr Met Arg Pro Pro Ser Pro Pro Arg Arg Glu 980 985 990 Glu Trp Arg Ala Val Met Glu Met Leu Ser Arg Val Ser Cys Glu Ser 995 1000 1005 Tyr Arg Asn Ile Val His His Ser Pro Leu Phe Leu Arg Tyr Phe 1010 1015 1020 Lys His Ala Thr Pro Glu Ala Glu Leu Gly Asn Leu Tyr Ile Gly 1025 1030 1035 Ser Arg Pro Ala Arg Arg Arg Asn Lys Asp Ala Ser Ile Ser Thr 1040 1045 1050 Leu Arg Ala Ile Pro Trp Ile Phe Ala Trp Thr Gln Asn Arg Leu 1055 1060 1065 Ile Leu Pro Ser Trp Leu Gly Ile Gly Ala Ala Leu Thr Ala Ala 1070 1075 1080 Met Thr Gln Gly His Leu Pro Thr Leu Gln Ala Met Tyr Arg Glu 1085 1090 1095 Trp Pro Phe Phe Gly Ser Thr Val Asp Leu Ile Glu Met Ile Leu 1100 1105 1110 Ala Lys Thr Asp Pro Arg Ile Ala Ala Leu Tyr Glu Glu Val Leu 1115 1120 1125 Val Asn Asp Pro Glu Glu Lys Lys Leu Gly Ala Glu Leu Arg Glu 1130 1135 1140 Arg Leu Gln Arg Cys Gln Gly Ala Ile Leu Lys Val Thr Gly His 1145 1150 1155 Glu Asn Leu Leu Ser Asn Asn Pro Thr Leu Ser Lys Leu Ile Ser 1160 1165 1170 Met Arg Ser Pro Phe Val Asp Pro Ile Asn Ile Leu Gln Val Glu 1175 1180 1185 Val Leu Arg Arg Leu Arg Gln Asp Pro Asn Asn Met Arg Leu Arg 1190 1195 1200 Asp Ala Leu Leu Ile Ser Ile Asn Gly Ile Ala Ala Gly Met Arg 1205 1210 1215 Asn Thr Gly 1220 <210> 67 <211> 3099 <212> DNA <213> Glycine max <400> 67 atgactgaca tcactggtga tattgctgag gaaatctcct tccagagctt cgatgatgac 60 tgcaggttgc ttggtaatct cctcaatgac attctccagc gtgaagttgg caccaacttg 120 cttgacaaga tcgaaaggac tcgagtcctt gctcagagtg gttgtaatat gaggcaggcg 180 ggtattgtaa acatggcaga gatgcttgag aagcagttgg cttcggagtt atcaaagatg 240 acactagaag aagctttcac ccttgctcgt gccttcagcc attatcttac tttgatgggt 300 atagctgaga cccaccatag ggttcgtaaa ggagggaata tggcacaaat tgcaaaatct 360 tgcgatgata tatttaacca gctggtgcag ggtggagtcc ccccagaaga actttatgac 420 acagtctgca agcgggaggt tgaaattgtt ctcactgctc atcccacaca gattaaccgt 480 cgaaccttac agtttaaaca cattagaatt gctcatcttt tggattacaa tgatcgacct 540 gatcttagca ctgaagatcg agaaatggtg attgaagatc tggtgagaga gataacttca 600 atatggcaga cagatgagct taggcgccag aaacccactc cagttgatga agctagagct 660 ggtttcaata ttgtggagca gtcactctgg aaagctgtcc ctcattattt acgtcgtgtc 720 agcaatgcat taaagaagca tacaggaaag ccacttcctt tgacttgcac tcccataaag 780 tttggatctt ggatgggagg tgatagagat ggaaacccaa atgtgacagc aaaggtcaca 840 aaagatgttt cacttctatc tagatggatg gcgattgacc tctatattcg ggaagtggat 900 agcctcagat ttgagctatc catgaaccag tgcagtgata ggttgtcaag attggcacat 960 gaaattctag aagccaagca tgagaatcgc cgtgagaatt ggaatcagtc tgcgaataga 1020 agtctcacac ttccaacaca acttccagct agagctcatt taccttctat tgctgaaaat 1080 ggtgaatctc ggcatcccag actagacatt ccagcacctg attacatgca atccaatcac 1140 aaggatggtg gggtttctgt aagttcaact acatcaaaac ttgccaatcc caatactcga 1200 ttaccaggaa caagttcagc aaattccagt gcttcttcag ctgcacttgg tcaaaagaaa 1260 ttgtatgcag aatcccagac aggaaagtcc acttttcaaa agcttttgga gccaatgctt 1320 cctcaacttc ctggaattgc tccttataga attgtcctgg ggaatgttaa ggataagctt 1380 gagaaaagtc gtagacggtt agaaattctt cttgaggatg ttgcatgtga ctatgatcct 1440 ttggattact atgaaacatc tgatcagctt ttggaacctc tgctcctctg ttatgaatct 1500 ctgcaatcgt gtggatctgg ggtgctagct gatggtcgac ttgctgatct gattcgtaga 1560 gttgctacct ttggaatggt gttaatgaag cttgacttgc gtcaggaatc tgggagacat 1620 gcagaagcac ttgatgcaat aacacagtac ttagatatgg gtacttacag tgaatgggat 1680 gaagaaaaga agttggactt cttaacaaga gaacttaaag ggaagaggcc tcttgttcct 1740 gttagtatag aggttcatcc tgatgttaaa gaagtcttgg atacattccg aattgccgct 1800 gaactgggga gtgattcact tggagcttat gtgatctcta tggcctcaaa tgcaagtgat 1860 gtccttgcag tagagctttt acagaaggat gcacggcttg ctgctattgg ggagttggga 1920 aaagcatgtc ctggtggaac gttgcgggtt gtccctctgt ttgaaactgt gaaagacctg 1980 agaggagctg gttcagttat ccggaaactt ttatcaatag actggtacca tgaacacatc 2040 gttaagaacc ataatggaca tcaagaggtt atggttggat attctgattc tggtaaagat 2100 gctggtcgct ttactgctgc ttgggaactt tacaaagctc aggaggatgt tgtagctgct 2160 tgcaatgatt atggaataaa ggttactcta ttccatggtc gtggaggcag tattggtcgt 2220 ggtggtggcc caacatatct ggctattcag tcccaacccc ctggctctgt gatgggaacg 2280 cttcggtcta ctgagcaggg agagatggta gaggctaagt ttgggttgcc acagatagct 2340 gttagacaac ttgagatata cacaacagct gtactacttg caacccttcg tccacctatc 2400 ccaccccgag aagaaaaatg gcgtaatgtc atggaagaga tctcaaacat cagttgtcag 2460 tgtgaccgca atgtagtgta tgaaaatcca gaattcctgg cctacttcca tgaagccaca 2520 ccagaggcag aacttggctt ccttaacata ggtagccgcc ctacaagaag gaagagctca 2580 gtaggaatcg gacaccttcg tgcaattccc tggttatttg catggacaca aacaagattc 2640 gttcttccag cttggcttgg agtcggagca ggtttaaaag gagcttgcga gaaaggttac 2700 accgaagagc taaaagccat gtacaaagaa tggcccttct ttcaaagtac catagatctt 2760 attgagatgg ttttggggaa agctgacatt cctatagcca agcactatga tgaagtcctt 2820 gtgacaaagg agaggcaaga gcttggccat gaactaagaa gtgagctcat gacagctgaa 2880 aagtttgtca tggttattag tgggcacgag aaacttcagc agaataatag gagcttgagg 2940 aggctaattg agaatagact tcccttcctt aatcccttga acatgttgca ggtggagata 3000 ctcaagaggt taagacgtga tgatgacaac cgtaagatca gagatgcttt gcttatcacc 3060 ataaatggga ttgctgcagg gatgaagaat acaggttga 3099 <210> 68 <211> 1032 <212> PRT <213> Glycine max <400> 68 Met Thr Asp Ile Thr Gly Asp Ile Ala Glu Glu Ile Ser Phe Gln Ser 1 5 10 15 Phe Asp Asp Asp Cys Arg Leu Leu Gly Asn Leu Leu Asn Asp Ile Leu 20 25 30 Gln Arg Glu Val Gly Thr Asn Leu Leu Asp Lys Ile Glu Arg Thr Arg 35 40 45 Val Leu Ala Gln Ser Gly Cys Asn Met Arg Gln Ala Gly Ile Val Asn 50 55 60 Met Ala Glu Met Leu Glu Lys Gln Leu Ala Ser Glu Leu Ser Lys Met 65 70 75 80 Thr Leu Glu Glu Ala Phe Thr Leu Ala Arg Ala Phe Ser His Tyr Leu 85 90 95 Thr Leu Met Gly Ile Ala Glu Thr His His Arg Val Arg Lys Gly Gly 100 105 110 Asn Met Ala Gln Ile Ala Lys Ser Cys Asp Asp Ile Phe Asn Gln Leu 115 120 125 Val Gln Gly Gly Val Pro Pro Glu Glu Leu Tyr Asp Thr Val Cys Lys 130 135 140 Arg Glu Val Glu Ile Val Leu Thr Ala His Pro Thr Gln Ile Asn Arg 145 150 155 160 Arg Thr Leu Gln Phe Lys His Ile Arg Ile Ala His Leu Leu Asp Tyr 165 170 175 Asn Asp Arg Pro Asp Leu Ser Thr Glu Asp Arg Glu Met Val Ile Glu 180 185 190 Asp Leu Val Arg Glu Ile Thr Ser Ile Trp Gln Thr Asp Glu Leu Arg 195 200 205 Arg Gln Lys Pro Thr Pro Val Asp Glu Ala Arg Ala Gly Phe Asn Ile 210 215 220 Val Glu Gln Ser Leu Trp Lys Ala Val Pro His Tyr Leu Arg Arg Val 225 230 235 240 Ser Asn Ala Leu Lys Lys His Thr Gly Lys Pro Leu Pro Leu Thr Cys 245 250 255 Thr Pro Ile Lys Phe Gly Ser Trp Met Gly Gly Asp Arg Asp Gly Asn 260 265 270 Pro Asn Val Thr Ala Lys Val Thr Lys Asp Val Ser Leu Leu Ser Arg 275 280 285 Trp Met Ala Ile Asp Leu Tyr Ile Arg Glu Val Asp Ser Leu Arg Phe 290 295 300 Glu Leu Ser Met Asn Gln Cys Ser Asp Arg Leu Ser Arg Leu Ala His 305 310 315 320 Glu Ile Leu Glu Ala Lys His Glu Asn Arg Arg Glu Asn Trp Asn Gln 325 330 335 Ser Ala Asn Arg Ser Leu Thr Leu Pro Thr Gln Leu Pro Ala Arg Ala 340 345 350 His Leu Pro Ser Ile Ala Glu Asn Gly Glu Ser Arg His Pro Arg Leu 355 360 365 Asp Ile Pro Ala Pro Asp Tyr Met Gln Ser Asn His Lys Asp Gly Gly 370 375 380 Val Ser Val Ser Ser Thr Thr Ser Lys Leu Ala Asn Pro Asn Thr Arg 385 390 395 400 Leu Pro Gly Thr Ser Ser Ala Asn Ser Ser Ala Ser Ser Ala Ala Leu 405 410 415 Gly Gln Lys Lys Leu Tyr Ala Glu Ser Gln Thr Gly Lys Ser Thr Phe 420 425 430 Gln Lys Leu Leu Glu Pro Met Leu Pro Gln Leu Pro Gly Ile Ala Pro 435 440 445 Tyr Arg Ile Val Leu Gly Asn Val Lys Asp Lys Leu Glu Lys Ser Arg 450 455 460 Arg Arg Leu Glu Ile Leu Leu Glu Asp Val Ala Cys Asp Tyr Asp Pro 465 470 475 480 Leu Asp Tyr Tyr Glu Thr Ser Asp Gln Leu Leu Glu Pro Leu Leu Leu 485 490 495 Cys Tyr Glu Ser Leu Gln Ser Cys Gly Ser Gly Val Leu Ala Asp Gly 500 505 510 Arg Leu Ala Asp Leu Ile Arg Arg Val Ala Thr Phe Gly Met Val Leu 515 520 525 Met Lys Leu Asp Leu Arg Gln Glu Ser Gly Arg His Ala Glu Ala Leu 530 535 540 Asp Ala Ile Thr Gln Tyr Leu Asp Met Gly Thr Tyr Ser Glu Trp Asp 545 550 555 560 Glu Glu Lys Lys Leu Asp Phe Leu Thr Arg Glu Leu Lys Gly Lys Arg 565 570 575 Pro Leu Val Pro Val Ser Ile Glu Val His Pro Asp Val Lys Glu Val 580 585 590 Leu Asp Thr Phe Arg Ile Ala Ala Glu Leu Gly Ser Asp Ser Leu Gly 595 600 605 Ala Tyr Val Ile Ser Met Ala Ser Asn Ala Ser Asp Val Leu Ala Val 610 615 620 Glu Leu Leu Gln Lys Asp Ala Arg Leu Ala Ala Ile Gly Glu Leu Gly 625 630 635 640 Lys Ala Cys Pro Gly Gly Thr Leu Arg Val Val Pro Leu Phe Glu Thr 645 650 655 Val Lys Asp Leu Arg Gly Ala Gly Ser Val Ile Arg Lys Leu Leu Ser 660 665 670 Ile Asp Trp Tyr His Glu His Ile Val Lys Asn His Asn Gly His Gln 675 680 685 Glu Val Met Val Gly Tyr Ser Asp Ser Gly Lys Asp Ala Gly Arg Phe 690 695 700 Thr Ala Ala Trp Glu Leu Tyr Lys Ala Gln Glu Asp Val Val Ala Ala 705 710 715 720 Cys Asn Asp Tyr Gly Ile Lys Val Thr Leu Phe His Gly Arg Gly Gly 725 730 735 Ser Ile Gly Arg Gly Gly Gly Pro Thr Tyr Leu Ala Ile Gln Ser Gln 740 745 750 Pro Pro Gly Ser Val Met Gly Thr Leu Arg Ser Thr Glu Gln Gly Glu 755 760 765 Met Val Glu Ala Lys Phe Gly Leu Pro Gln Ile Ala Val Arg Gln Leu 770 775 780 Glu Ile Tyr Thr Thr Ala Val Leu Leu Ala Thr Leu Arg Pro Pro Ile 785 790 795 800 Pro Pro Arg Glu Glu Lys Trp Arg Asn Val Met Glu Glu Ile Ser Asn 805 810 815 Ile Ser Cys Gln Cys Asp Arg Asn Val Val Tyr Glu Asn Pro Glu Phe 820 825 830 Leu Ala Tyr Phe His Glu Ala Thr Pro Glu Ala Glu Leu Gly Phe Leu 835 840 845 Asn Ile Gly Ser Arg Pro Thr Arg Arg Lys Ser Ser Val Gly Ile Gly 850 855 860 His Leu Arg Ala Ile Pro Trp Leu Phe Ala Trp Thr Gln Thr Arg Phe 865 870 875 880 Val Leu Pro Ala Trp Leu Gly Val Gly Ala Gly Leu Lys Gly Ala Cys 885 890 895 Glu Lys Gly Tyr Thr Glu Glu Leu Lys Ala Met Tyr Lys Glu Trp Pro 900 905 910 Phe Phe Gln Ser Thr Ile Asp Leu Ile Glu Met Val Leu Gly Lys Ala 915 920 925 Asp Ile Pro Ile Ala Lys His Tyr Asp Glu Val Leu Val Thr Lys Glu 930 935 940 Arg Gln Glu Leu Gly His Glu Leu Arg Ser Glu Leu Met Thr Ala Glu 945 950 955 960 Lys Phe Val Met Val Ile Ser Gly His Glu Lys Leu Gln Gln Asn Asn 965 970 975 Arg Ser Leu Arg Arg Leu Ile Glu Asn Arg Leu Pro Phe Leu Asn Pro 980 985 990 Leu Asn Met Leu Gln Val Glu Ile Leu Lys Arg Leu Arg Arg Asp Asp 995 1000 1005 Asp Asn Arg Lys Ile Arg Asp Ala Leu Leu Ile Thr Ile Asn Gly 1010 1015 1020 Ile Ala Ala Gly Met Lys Asn Thr Gly 1025 1030 <210> 69 <211> 3159 <212> DNA <213> Ricinus communis <400> 69 atgacggaca ccacagatga tattgcagag gaaatctcat ttcagagttt tgatgatgat 60 tgtaagcttc ttggcaattt gttaaacgat gttttgcaga gagaagttgg ttctaaattc 120 atggagaagc ttgaacgcaa tcgcatccta gctcagagtg cttgtaatat gagattggcg 180 gggatagaag ataccgctga attgctggag aagcagctgg cattggagat atcaaggatg 240 acattagagg aagcattgac acttgctcgt gcctttagtc attaccttaa tttgatgggc 300 attgctgaga cccatcacag ggttcgtaag gcacggagta tgacacatct atcaaaatct 360 tgtgatgaca tatttaatca gctgctgcag agtggcatat ctgcagagga gctttatgac 420 acagtttgca agcaggaggt tgaaattgtg ctcactgcac atcctactca aattaatcgt 480 cgtaccttgc aatataagca catcagaatt gctcatcttt tagattataa tgaccggcct 540 gatcttactc atgaagatcg agaaatgctg attgaagatc tggtgagaga aattacttca 600 atatggcaga cagatgagct taggcgccac aagcctacac cagtagatga agctagggct 660 ggcttgaaca ttgtggagca gtccctgtgg aaagctcttc cccattattt acgtcgtgtc 720 agtactgccc taaagaagca tacaggaaag ccacttcctt tgacttgcac gccaataagg 780 tttgggtctt ggatgggggg tgatagagat ggtaatccga atgtaacagc aaaggtcaca 840 agagatgttt ctcttttatc taggtggatg gctgttgacc tttacattcg agaagttgat 900 agcctgagat ttgaactatc catggttcaa tgcagtgata gattgttgaa agtggcaaat 960 gacattttaa tagaagaaac ttcatctgaa gatcaccatg agagttggaa tcaacctgca 1020 agcagaagtc aaacaaagtt tcctagaaaa tctcttccta cacaacttcc acctagagct 1080 gatcttcctg cttgcactga atgtaatgat ggtgaatctc agtatcccaa actagaactt 1140 ccaggaactg attacatgcc ctttaatcgc caggaagctc taggttcttc atattcagaa 1200 tcttcatccc aggatatcaa tcatggttta cctaaaacaa ctggaaatgg aagtgttgct 1260 aattctagtg gatctccgcg ggcatctttc agctctgctc aactggttgc acagaggaaa 1320 ctatttgcag aatccaagat aggaagatct agcttccaga agcttctaga accaagtctg 1380 cctcaacgtc ctggaattgc tccttataga attgttcttg gaaatgtaaa agataagctt 1440 atgaggacaa gaagacgtct ggaacttctt ctagaggatc ttccttgtga atatgatcaa 1500 tgggattact atgagacaac agatcaatta ttggatccac tgcttctgtg ctacgagtct 1560 cttcaatcat gtggagctgg ggttctagct gatggtcggc tagctgacct gataagaaga 1620 gttgctacat ttgggatggt gttaatgaag ctagacttgc gccaggaatc tggtagacat 1680 gctgatactc ttgatgcaat caccaaatat ttggaaatgg gcacgtatag tgagtgggat 1740 gaagaaaaga agctggaatt tctgacaaga gaactgaaag gaaaacggcc actggttcct 1800 cctactattg aggttgctcc tgatgttaaa gaagtcttgg atgctttccg tgttgctgct 1860 gagctgggga gtgattcact tggagcttat gtgatttcta tggcatccaa tgcaagtgat 1920 gtccttgctg tggagcttct gcagaaggat gcccggcttg ctgttagtgg ggagctagga 1980 agaccatgcc ctggtggaac gttgcgagta gttccgttgt ttgaaactgt gaaagacctg 2040 agaggtgctg gttcggtgat cagaaaactg ttatcaattg actggtatag agaacacata 2100 attaagaacc ataacgggca tcaggaggtg atggttggct attctgattc tggtaaagat 2160 gctggacgct ttactgctgc atgggaactt tacaaagccc aagaggatgt tgtggcagcc 2220 tgtaatgatt ttggtatcaa agtaacacta ttccatgggc gtggagggag tattggtcgt 2280 ggtggtggcc ccacatatct tgccattcaa tcccaaccac ctggttcagt tatgggtact 2340 cttcggtcaa ctgagcaagg agaaatggtg caggccaagt ttgggctgcc acatactgcc 2400 atcagacaac tagagatata cacaactgct gtgctgcttg caacccttcg tcctccacat 2460 ccacctcgag aagaacaatg gcgcaatgtc atggaggaga tttcaaaaat cagttgccag 2520 aattaccgga gcacagtcta tgaaaaccca gaattcctcg cctacttcca tgaggctact 2580 ccccaggctg agcttggctt tcttaacata ggaagccgcc ccacaagaag aaagagctca 2640 actggtattg gacatcttcg tgccattcca tgggtattcg catggaccca gaccagattt 2700 gttcttcctg cttggcttgg agttggagca ggtttaaagg gtgcttgtga gaagggattt 2760 actgaagact tgaaagcaat gtacaaagaa tggcctttct tccaatctac tattgatctt 2820 atagagatgg tactagggaa ggcagacatt cctatagcca agcactatga tgaagttctt 2880 gtatctgaga gcaggcgaga gcttggagct gagcttagga gtgagctctt aacaacagaa 2940 aagtatgtgt tggtggttag tgggcatgag aaactatctc agaacaaccg cagcctgcgg 3000 aggctaatag agagcaggct gccttatctc aatcctatga atatgttgca ggtggaggtt 3060 ctaaagaggt tgaggcggga cgacgacaac aataagctca gagatgccct gcttattacc 3120 ataaatggga ttgctgctgg aatgaggaac acaggctga 3159 <210> 70 <211> 1052 <212> PRT <213> Ricinus communis <400> 70 Met Thr Asp Thr Thr Asp Asp Ile Ala Glu Glu Ile Ser Phe Gln Ser 1 5 10 15 Phe Asp Asp Asp Cys Lys Leu Leu Gly Asn Leu Leu Asn Asp Val Leu 20 25 30 Gln Arg Glu Val Gly Ser Lys Phe Met Glu Lys Leu Glu Arg Asn Arg 35 40 45 Ile Leu Ala Gln Ser Ala Cys Asn Met Arg Leu Ala Gly Ile Glu Asp 50 55 60 Thr Ala Glu Leu Leu Glu Lys Gln Leu Ala Leu Glu Ile Ser Arg Met 65 70 75 80 Thr Leu Glu Glu Ala Leu Thr Leu Ala Arg Ala Phe Ser His Tyr Leu 85 90 95 Asn Leu Met Gly Ile Ala Glu Thr His His Arg Val Arg Lys Ala Arg 100 105 110 Ser Met Thr His Leu Ser Lys Ser Cys Asp Asp Ile Phe Asn Gln Leu 115 120 125 Leu Gln Ser Gly Ile Ser Ala Glu Glu Leu Tyr Asp Thr Val Cys Lys 130 135 140 Gln Glu Val Glu Ile Val Leu Thr Ala His Pro Thr Gln Ile Asn Arg 145 150 155 160 Arg Thr Leu Gln Tyr Lys His Ile Arg Ile Ala His Leu Leu Asp Tyr 165 170 175 Asn Asp Arg Pro Asp Leu Thr His Glu Asp Arg Glu Met Leu Ile Glu 180 185 190 Asp Leu Val Arg Glu Ile Thr Ser Ile Trp Gln Thr Asp Glu Leu Arg 195 200 205 Arg His Lys Pro Thr Pro Val Asp Glu Ala Arg Ala Gly Leu Asn Ile 210 215 220 Val Glu Gln Ser Leu Trp Lys Ala Leu Pro His Tyr Leu Arg Arg Val 225 230 235 240 Ser Thr Ala Leu Lys Lys His Thr Gly Lys Pro Leu Pro Leu Thr Cys 245 250 255 Thr Pro Ile Arg Phe Gly Ser Trp Met Gly Gly Asp Arg Asp Gly Asn 260 265 270 Pro Asn Val Thr Ala Lys Val Thr Arg Asp Val Ser Leu Leu Ser Arg 275 280 285 Trp Met Ala Val Asp Leu Tyr Ile Arg Glu Val Asp Ser Leu Arg Phe 290 295 300 Glu Leu Ser Met Val Gln Cys Ser Asp Arg Leu Leu Lys Val Ala Asn 305 310 315 320 Asp Ile Leu Ile Glu Glu Thr Ser Ser Glu Asp His His Glu Ser Trp 325 330 335 Asn Gln Pro Ala Ser Arg Ser Gln Thr Lys Phe Pro Arg Lys Ser Leu 340 345 350 Pro Thr Gln Leu Pro Pro Arg Ala Asp Leu Pro Ala Cys Thr Glu Cys 355 360 365 Asn Asp Gly Glu Ser Gln Tyr Pro Lys Leu Glu Leu Pro Gly Thr Asp 370 375 380 Tyr Met Pro Phe Asn Arg Gln Glu Ala Leu Gly Ser Ser Tyr Ser Glu 385 390 395 400 Ser Ser Ser Gln Asp Ile Asn His Gly Leu Pro Lys Thr Thr Gly Asn 405 410 415 Gly Ser Val Ala Asn Ser Ser Gly Ser Pro Arg Ala Ser Phe Ser Ser 420 425 430 Ala Gln Leu Val Ala Gln Arg Lys Leu Phe Ala Glu Ser Lys Ile Gly 435 440 445 Arg Ser Ser Phe Gln Lys Leu Leu Glu Pro Ser Leu Pro Gln Arg Pro 450 455 460 Gly Ile Ala Pro Tyr Arg Ile Val Leu Gly Asn Val Lys Asp Lys Leu 465 470 475 480 Met Arg Thr Arg Arg Arg Leu Glu Leu Leu Leu Glu Asp Leu Pro Cys 485 490 495 Glu Tyr Asp Gln Trp Asp Tyr Tyr Glu Thr Thr Asp Gln Leu Leu Asp 500 505 510 Pro Leu Leu Leu Cys Tyr Glu Ser Leu Gln Ser Cys Gly Ala Gly Val 515 520 525 Leu Ala Asp Gly Arg Leu Ala Asp Leu Ile Arg Arg Val Ala Thr Phe 530 535 540 Gly Met Val Leu Met Lys Leu Asp Leu Arg Gln Glu Ser Gly Arg His 545 550 555 560 Ala Asp Thr Leu Asp Ala Ile Thr Lys Tyr Leu Glu Met Gly Thr Tyr 565 570 575 Ser Glu Trp Asp Glu Glu Lys Lys Leu Glu Phe Leu Thr Arg Glu Leu 580 585 590 Lys Gly Lys Arg Pro Leu Val Pro Pro Thr Ile Glu Val Ala Pro Asp 595 600 605 Val Lys Glu Val Leu Asp Ala Phe Arg Val Ala Ala Glu Leu Gly Ser 610 615 620 Asp Ser Leu Gly Ala Tyr Val Ile Ser Met Ala Ser Asn Ala Ser Asp 625 630 635 640 Val Leu Ala Val Glu Leu Leu Gln Lys Asp Ala Arg Leu Ala Val Ser 645 650 655 Gly Glu Leu Gly Arg Pro Cys Pro Gly Gly Thr Leu Arg Val Val Pro 660 665 670 Leu Phe Glu Thr Val Lys Asp Leu Arg Gly Ala Gly Ser Val Ile Arg 675 680 685 Lys Leu Leu Ser Ile Asp Trp Tyr Arg Glu His Ile Ile Lys Asn His 690 695 700 Asn Gly His Gln Glu Val Met Val Gly Tyr Ser Asp Ser Gly Lys Asp 705 710 715 720 Ala Gly Arg Phe Thr Ala Ala Trp Glu Leu Tyr Lys Ala Gln Glu Asp 725 730 735 Val Val Ala Ala Cys Asn Asp Phe Gly Ile Lys Val Thr Leu Phe His 740 745 750 Gly Arg Gly Gly Ser Ile Gly Arg Gly Gly Gly Pro Thr Tyr Leu Ala 755 760 765 Ile Gln Ser Gln Pro Pro Gly Ser Val Met Gly Thr Leu Arg Ser Thr 770 775 780 Glu Gln Gly Glu Met Val Gln Ala Lys Phe Gly Leu Pro His Thr Ala 785 790 795 800 Ile Arg Gln Leu Glu Ile Tyr Thr Thr Ala Val Leu Leu Ala Thr Leu 805 810 815 Arg Pro Pro His Pro Pro Arg Glu Glu Gln Trp Arg Asn Val Met Glu 820 825 830 Glu Ile Ser Lys Ile Ser Cys Gln Asn Tyr Arg Ser Thr Val Tyr Glu 835 840 845 Asn Pro Glu Phe Leu Ala Tyr Phe His Glu Ala Thr Pro Gln Ala Glu 850 855 860 Leu Gly Phe Leu Asn Ile Gly Ser Arg Pro Thr Arg Arg Lys Ser Ser 865 870 875 880 Thr Gly Ile Gly His Leu Arg Ala Ile Pro Trp Val Phe Ala Trp Thr 885 890 895 Gln Thr Arg Phe Val Leu Pro Ala Trp Leu Gly Val Gly Ala Gly Leu 900 905 910 Lys Gly Ala Cys Glu Lys Gly Phe Thr Glu Asp Leu Lys Ala Met Tyr 915 920 925 Lys Glu Trp Pro Phe Phe Gln Ser Thr Ile Asp Leu Ile Glu Met Val 930 935 940 Leu Gly Lys Ala Asp Ile Pro Ile Ala Lys His Tyr Asp Glu Val Leu 945 950 955 960 Val Ser Glu Ser Arg Arg Glu Leu Gly Ala Glu Leu Arg Ser Glu Leu 965 970 975 Leu Thr Thr Glu Lys Tyr Val Leu Val Val Ser Gly His Glu Lys Leu 980 985 990 Ser Gln Asn Asn Arg Ser Leu Arg Arg Leu Ile Glu Ser Arg Leu Pro 995 1000 1005 Tyr Leu Asn Pro Met Asn Met Leu Gln Val Glu Val Leu Lys Arg 1010 1015 1020 Leu Arg Arg Asp Asp Asp Asn Asn Lys Leu Arg Asp Ala Leu Leu 1025 1030 1035 Ile Thr Ile Asn Gly Ile Ala Ala Gly Met Arg Asn Thr Gly 1040 1045 1050 <210> 71 <211> 1568 <212> DNA <213> Oryza sativa <400> 71 cccacgcgtc cgcccacgcg tccgggacac cagaaacata gtacacttga gctcactcca 60 aactcaaaca ctcacaccaa tggctctcca agttcaggcc gcactcctgc cctctgctct 120 ctctgtcccc aagaagggta acttgagcgc ggtggtgaag gagccggggt tccttagcgt 180 gagcagaagg ccaagaagcc gtcgctggtg gtgagggcgg tggcgacgcg gcgggccggt 240 ggcgagcccc ggcgcgggca cgtcgaaggc ggacgggaag aagacgctgc ggcagggggt 300 ggtggtgatc accggcgcgt cgtcggggct cgggctcgcg gcggcgaagg cgcttggcgg 360 agacggggaa gtggcacgtg gtgatggcgt tccgcgactt tcctgaaggc ggcgacggcg 420 gcgaaggcgg cggggatggc ggcggggagc tacaccgtca tgcacctgga cctcgcctcc 480 ctcgacagcg tccgccagtt cgtggacaac ttccggcgct ccggcatgcc gctcgacgcg 540 ctggtgtgca acgccgcaca tctaccggcc gacggcgcgg caaccgacgt tcaacgccga 600 cgggtacgag atgagcgtcg gggtgaacca cctgggccac ttcctcctcg cccgcctcat 660 gctcgacgac ctcaagaaat ccgactaccc gtcgcggcgg ctcatcatcc tcggctccat 720 caccggcaac accaacacct tcgccggcaa cgtccctccc aaggccgggc taggcgacct 780 ccgggggctc gccggcgggc tccgcgggca gaacgggtcg gcgatgatcg acggcgcgga 840 gagcttcgac ggcgccaagg cgtacaagga cagcaagatc tgtaacatgc tgacgatgca 900 ggagttccac cggagattcc acgaggagac cgggatcacg ttcgcgtcgc tgtacccggg 960 gtgcatcgcg acgacgggct tgttccgcga gcacatcccg ctgttccggc tgctgttccc 1020 gccgttccag cggttcgtga cgaaggggtt cgtgtcggag gcggagtccg ggaagcggct 1080 ggcgcaggtg gtgggcgacc cgagcctgac caagtccggc gtgtactgga gctggaacaa 1140 ggactcggcg tcgttcgaga accagctctc gcaggaggcc agcgacccgg agaaggccag 1200 gaagctctgg gacctcagcg agaagctcgt cggcctcgtc tgagtttatt atttacccat 1260 tcgtttcaac tgttaatttc ttcggggttt agggggtttc agctttcagt gagagaggcc 1320 tgtcaagtga tgtacaatta gtaatttttt tttacccgac aaatcatgca ataaaaccac 1380 aggcttacat tatcgatttg tccacctaaa ttaagtttca actgttaatt tcttcggggt 1440 ttagggggtt tcagctttca gtgagagagg cctgtcaagt gatgtacaat tagtaatttt 1500 tttttacccg acaaatcatg caataaaacc acaggcttac attatcgatt tgtccaccta 1560 aattaagt 1568 <210> 72 <211> 53 <212> DNA <213> Artificial sequence <220> <223> primer: prm08763 <400> 72 ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa cttggcagtt cct 53 <210> 73 <211> 48 <212> DNA <213> Artificial sequence <220> <223> primer: prm08764 <400> 73 ggggaccact ttgtacaaga aagctgggtt caaccagtat tacgcatt 48 <210> 74 <211> 1295 <212> DNA <213> Capsicum annuum <400> 74 gccaactttg tacaaaaaag cagtcttaaa caatggaaga aattcaagta ccaccttatt 60 tcctctgtcc gatttcactg gagatgatga aagatccagt cacgatctcg actggaataa 120 catacgatcg agagaacatc gagagatgga tattctcagc taagaacaat acgtgtccgg 180 ttacgaagca atcccttacg agcatagagt tgacccctaa tgtcactcta cgacgattca 240 tccaatcgtg gtgtactctc aatgcgtccc atggcatcga gaggttccct acaccgaagc 300 ctccggtcag caaagctcaa atcttaaagc tcatgaaaga agcgaaatcg cgcgaaatgc 360 aaatgaaatc actcaacaca cttagatcca tagcttctgt gaacgatgct aacaagcgtt 420 gcatggagtc tgcgggcgca gcggagttct tagcctctgt tgtgattgat tcgagtgatg 480 tgttgggtga agagggtttc atgagtacta aagatgaagc attaagcatc ctctaccaac 540 tcaagttatc agaagatgga ttgaggtcac tcatcacgag tggaaatggt gaattcatcg 600 agtcactgac acgcgtcatg cagcgtggga gctatgagtc aagggcttac gcggtgatgc 660 tgatgaaaga catgttcgaa gcatccacac taccaactct attttcgagc ttgaagaaag 720 agttcttcgc tcaagtggtt cgagtcttga gggatgagat ctctcaaaag gccaccaaag 780 cgtcattgca agtgctagcg cacgcgtgtc catttgggag gaacagagtg aaagcagctg 840 aggcaggagc cgttagggtt ttggtggacc ttctgctcga ttcatccgag aaaaggacct 900 gcgaactgat gctaatcttg ctggatcaaa tttgtcagag cgcagaaggg agagccgagc 960 tgttgaatca tccgggaggg ttagccatcg tctcgaagaa aatacttagg gtttcgaaag 1020 tagggagcga aagggcaatc aagatattgc attcgatatc aaagttttca tcaacacaaa 1080 gtgttgttca agagatgttg agtttgggtg ttgtggcaaa gctttgtttg gtacttcaag 1140 ttgattgtgg aagtaaagct aaggatagag ctagagatat tctcaaaatt catgcaaagg 1200 catggaggaa ttctccttgt atacctatga atttattatc ttcatatcca ttttaggaaa 1260 ataggaccaa aagagcaccc agctttcttg tacaa 1295 <210> 75 <211> 407 <212> PRT <213> Capsicum annuum <400> 75 Met Glu Glu Ile Gln Val Pro Pro Tyr Phe Leu Cys Pro Ile Ser Leu 1 5 10 15 Glu Met Met Lys Asp Pro Val Thr Ile Ser Thr Gly Ile Thr Tyr Asp 20 25 30 Arg Glu Asn Ile Glu Arg Trp Ile Phe Ser Ala Lys Asn Asn Thr Cys 35 40 45 Pro Val Thr Lys Gln Ser Leu Thr Ser Ile Glu Leu Thr Pro Asn Val 50 55 60 Thr Leu Arg Arg Phe Ile Gln Ser Trp Cys Thr Leu Asn Ala Ser His 65 70 75 80 Gly Ile Glu Arg Phe Pro Thr Pro Lys Pro Pro Val Ser Lys Ala Gln 85 90 95 Ile Leu Lys Leu Met Lys Glu Ala Lys Ser Arg Glu Met Gln Met Lys 100 105 110 Ser Leu Asn Thr Leu Arg Ser Ile Ala Ser Val Asn Asp Ala Asn Lys 115 120 125 Arg Cys Met Glu Ser Ala Gly Ala Ala Glu Phe Leu Ala Ser Val Val 130 135 140 Ile Asp Ser Ser Asp Val Leu Gly Glu Glu Gly Phe Met Ser Thr Lys 145 150 155 160 Asp Glu Ala Leu Ser Ile Leu Tyr Gln Leu Lys Leu Ser Glu Asp Gly 165 170 175 Leu Arg Ser Leu Ile Thr Ser Gly Asn Gly Glu Phe Ile Glu Ser Leu 180 185 190 Thr Arg Val Met Gln Arg Gly Ser Tyr Glu Ser Arg Ala Tyr Ala Val 195 200 205 Met Leu Met Lys Asp Met Phe Glu Ala Ser Thr Leu Pro Thr Leu Phe 210 215 220 Ser Ser Leu Lys Lys Glu Phe Phe Ala Gln Val Val Arg Val Leu Arg 225 230 235 240 Asp Glu Ile Ser Gln Lys Ala Thr Lys Ala Ser Leu Gln Val Leu Ala 245 250 255 His Ala Cys Pro Phe Gly Arg Asn Arg Val Lys Ala Ala Glu Ala Gly 260 265 270 Ala Val Arg Val Leu Val Asp Leu Leu Leu Asp Ser Ser Glu Lys Arg 275 280 285 Thr Cys Glu Leu Met Leu Ile Leu Leu Asp Gln Ile Cys Gln Ser Ala 290 295 300 Glu Gly Arg Ala Glu Leu Leu Asn His Pro Gly Gly Leu Ala Ile Val 305 310 315 320 Ser Lys Lys Ile Leu Arg Val Ser Lys Val Gly Ser Glu Arg Ala Ile 325 330 335 Lys Ile Leu His Ser Ile Ser Lys Phe Ser Ser Thr Gln Ser Val Val 340 345 350 Gln Glu Met Leu Ser Leu Gly Val Val Ala Lys Leu Cys Leu Val Leu 355 360 365 Gln Val Asp Cys Gly Ser Lys Ala Lys Asp Arg Ala Arg Asp Ile Leu 370 375 380 Lys Ile His Ala Lys Ala Trp Arg Asn Ser Pro Cys Ile Pro Met Asn 385 390 395 400 Leu Leu Ser Ser Tyr Pro Phe 405 <210> 76 <211> 65 <212> PRT <213> Artificial sequence <220> <223> U-box domain <400> 76 Phe Leu Cys Pro Ile Ser Leu Glu Met Met Lys Asp Pro Val Thr Ile 1 5 10 15 Ser Thr Gly Ile Thr Tyr Asp Arg Glu Asn Ile Glu Arg Trp Ile Phe 20 25 30 Ser Ala Lys Asn Asn Thr Cys Pro Val Thr Lys Gln Ser Leu Thr Ser 35 40 45 Ile Glu Leu Thr Pro Asn Val Thr Leu Arg Arg Phe Ile Gln Ser Trp 50 55 60 Cys 65 <210> 77 <211> 14 <212> PRT <213> Artificial sequence <220> <223> motif 1 <400> 77 Gly Ile Thr Tyr Asp Arg Glu Asn Ile Glu Arg Trp Ile Phe 1 5 10 <210> 78 <211> 8 <212> PRT <213> Artificial sequence <220> <223> motif 2 <400> 78 Gln Ser Trp Cys Thr Leu Asn Ala 1 5 <210> 79 <211> 8 <212> PRT <213> Artificial sequence <220> <223> motif 3 <400> 79 Gly Arg Ala Glu Leu Leu Asn His 1 5 <210> 80 <211> 13 <212> PRT <213> Artificial sequence <220> <223> motif 4 <400> 80 Gly Leu Ala Ile Val Ser Lys Lys Ile Leu Arg Val Ser 1 5 10 <210> 81 <211> 9 <212> PRT <213> Artificial sequence <220> <223> motif 5 <400> 81 Lys Leu Cys Leu Val Leu Gln Val Asp 1 5 <210> 82 <211> 3 <212> PRT <213> Artificial sequence <220> <223> motif 6 <400> 82 Ser Tyr Pro 1 <210> 83 <211> 1619 <212> DNA <213> Arabidopsis thaliana <400> 83 ctaacttatt caaaccaatt cacatcttcc caaacccaac tactacaact tgtattaaga 60 aaaagatata ttcccttagc ttctttgatc aatatattcg tcagggttct cgtcaaagtc 120 ctcagcatct tcatcatatg tccggaggaa taatggatga agagatcgag attcctccgt 180 tcttcctttg tcctatctct ttggagatca tgaaagatcc agtgatagtc tctaccggaa 240 taacctacga cagagacagc atcgagaaat ggctatttgc aggcaagaaa aactcgtgtc 300 cggtcaccaa acaagacata accgacgcgg atctcacccc gaatcacact ctacgccgtc 360 tcatccaatc ttggtgcacc ctaaacgcct cctacggcgt cgagaggatc cctaccccaa 420 gacctccgat ttgtaaatct gagatcgaaa agctcattag agattcagcc tcttcccatg 480 aaaaccaagt caagtgtctc aaacgacttc gtcagattgt gtcggagaac gcgaccaaca 540 agcggtgttt agaggcagcg ggagtaccgg agttcttggc caacatcgta agcaacgact 600 cagaaaatgg gagtttgacc gacgaagccc tcaacttact ttaccacctc gagacctcag 660 agacagtcct caagaatctt ttaaacaaca agaaagataa caatatcgta aagtcgttga 720 cgaagatcat gcagcgtggg atgtacgagt ccagagtcta tgccactttg cttctcaaga 780 acattctcga agtagcggat ccaatgcaga gtatgactct caagccagag gttttcactg 840 aggtcgtcca gatcttggac gaccggatct cgcagaaggc gaccaaagct gccatgcata 900 tattggtgaa catatgccca tggggaagga acagacacaa ggccgtggaa gctggagtaa 960 tctctgtgat catcgagctt ctcatggacg agagcttcac atcagagagg agaggtccag 1020 agatggcgat ggtggttctt gatctgttgt gtcagtgtgc ggagggacga gccgagttct 1080 tgaaccacgg agcagccata gcggtggtgt gcaagaagat acttagggtt tcacagacag 1140 caagcgatag agcggttagg gttttgttgt cggtgggaag gttctgcgca acgcctgctt 1200 tgttgcacga gatgttacag ttgggggttg tagcgaagct ttgtcttgtg cttcaagtaa 1260 gctgtggagg taagaccaaa gagaaggcaa aggagttgct taagttgcac gctagggtct 1320 ggaaggactc gccttgtctc ccaaaaaaca tgattcttgc atatccctgc tgatgaaaac 1380 gaagaaaaca atacaaacaa gtccaattct cagtgagagc aatcacatat atgagagatg 1440 ctgttgaaaa aactaaagga gtattcaatt attcatatca ttaatccaat tttccttagg 1500 tttcttattt cgtacttttg atgttctcaa tgtagataat agtggaaaat gttcatcaaa 1560 tatttttttt tatgaaaaac tgcaaagata tcatatataa aatcacaagt taccaggct 1619 <210> 84 <211> 435 <212> PRT <213> Arabidopsis thaliana <400> 84 Met Asp Gln Glu Ile Glu Ile Pro Ser Phe Phe Leu Cys Pro Ile Ser 1 5 10 15 Leu Asp Ile Met Lys Asp Pro Val Ile Val Ser Thr Gly Ile Thr Tyr 20 25 30 Asp Arg Glu Ser Ile Glu Lys Trp Leu Phe Ser Gly Lys Lys Asn Ser 35 40 45 Cys Pro Val Thr Lys Gln Val Ile Thr Glu Thr Asp Leu Thr Pro Asn 50 55 60 His Thr Leu Arg Arg Leu Ile Gln Ser Trp Cys Thr Leu Asn Ala Ser 65 70 75 80 Tyr Gly Ile Glu Arg Ile Pro Thr Pro Lys Pro Pro Ile Cys Lys Ser 85 90 95 Glu Ile Glu Lys Leu Ile Lys Glu Ser Ser Ser Ser His Leu Asn Gln 100 105 110 Val Lys Cys Leu Lys Arg Leu Arg Gln Ile Val Ser Glu Asn Thr Thr 115 120 125 Asn Lys Arg Cys Leu Glu Ala Ala Glu Val Pro Glu Phe Leu Ala Asn 130 135 140 Ile Val Ser Asn Ser Val Asp Thr Tyr Asn Ser Pro Ser Ser Ser Leu 145 150 155 160 Ser Ser Ser Asn Leu Asn Asp Met Cys Gln Ser Asn Met Leu Glu Asn 165 170 175 Arg Phe Asp Ser Ser Arg Ser Leu Met Asp Glu Ala Leu Ser Val Leu 180 185 190 Tyr His Leu Asp Thr Ser Glu Thr Ala Leu Lys Ser Leu Leu Asn Asn 195 200 205 Lys Lys Gly Thr Asn Leu Val Lys Thr Leu Thr Lys Ile Met Gln Arg 210 215 220 Gly Ile Tyr Glu Ser Arg Ala Tyr Ala Ala Leu Leu Leu Lys Lys Leu 225 230 235 240 Leu Glu Val Ala Asp Pro Met Gln Ile Ile Leu Leu Glu Arg Glu Leu 245 250 255 Phe Gly Glu Val Ile Gln Ile Leu His Asp Gln Ile Ser His Lys Ala 260 265 270 Thr Arg Ser Ala Met Gln Ile Leu Val Ile Thr Cys Pro Trp Gly Arg 275 280 285 Asn Arg His Lys Ala Val Glu Gly Gly Thr Ile Ser Met Ile Ile Glu 290 295 300 Leu Leu Met Asp Asp Thr Phe Ser Ser Glu Arg Arg Asn Ser Glu Met 305 310 315 320 Ala Met Val Val Leu Asp Met Leu Cys Gln Cys Ala Glu Gly Arg Ala 325 330 335 Glu Phe Leu Asn His Gly Ala Ala Ile Ala Val Val Ser Lys Lys Ile 340 345 350 Leu Arg Val Ser Gln Ile Thr Ser Glu Arg Ala Val Arg Val Leu Leu 355 360 365 Ser Val Gly Arg Phe Cys Ala Thr Pro Ser Leu Leu Gln Glu Met Leu 370 375 380 Gln Leu Gly Val Val Ala Lys Leu Cys Leu Val Leu Gln Val Ser Cys 385 390 395 400 Gly Asn Lys Thr Lys Glu Lys Ala Lys Glu Leu Leu Lys Leu His Ala 405 410 415 Arg Val Trp Arg Glu Ser Pro Cys Val Pro Arg Asn Leu Tyr Asp Ser 420 425 430 Tyr Pro Ala 435 <210> 85 <211> 1645 <212> DNA <213> Arabidopsis thaliana <400> 85 gctaacttat tcaaaccaat tcacatatct cctaaatctc aacgactgca ctttgaagct 60 ttttgtttag attcgttcgt cgtttccatt gattaagtct acttcttttt tttcatattt 120 tcgagcgggt caaatggatc aagagataga gattccttcc ttcttccttt gtccaatctc 180 tctagatatc atgaaagatc cggtgatagt ttccaccgga ataacctacg accgagaaag 240 catcgagaag tggctctttt ccggtaagaa aaactcatgt ccagtcacca aacaagtcat 300 aaccgaaact gatcttaccc caaaccacac tcttcgccgt ttgattcaat cttggtgtac 360 cctcaacgca tcatatggta tagagaggat cccaactcca aaacctccga tctgtaaatc 420 ggagatcgaa aagcttatca aagagtcgtc atcttcgcat ctaaaccaag tcaaatgcct 480 caaacgactt cgtcaaatag tatctgagaa tacaaccaac aaacggtgct tagaagccgc 540 agaagttccg gagtttttgg caaatatcgt aagcaactct gtagatacgt ataactctcc 600 ttcttcttca ctttcttctt cgaatctcaa cgacatgtgt cagtcaaaca tgttggagaa 660 tcgatttgat tcttcaagaa gcttgatgga cgaagcccta agcgtactct accatcttga 720 cacatcggag acagccctca agagtctttt aaacaacaag aaaggaacaa atcttgtgaa 780 aacgttgacg aagattatgc aacgtgggat ctacgagtca agagcctatg cggctttgct 840 tctcaagaag ctcctggaag ttgcggatcc aatgcagatc atattgttgg aacgagaact 900 tttcggtgag gtgattcaaa tcttgcacga ccagatctct cacaaggcga caagatcagc 960 aatgcaaatc ttggtgatca catgtccatg gggaaggaat agacacaagg cagtggaagg 1020 tggaacaatc tcgatgataa tcgagctttt aatggacgat actttctcat cagagagaag 1080 gaattcagag atggcgatgg tggttcttga tatgttatgt cagtgcgcag aaggaagagc 1140 tgagttcttg aatcacggtg ccgctattgc ggttgtgtct aagaagatat tgagggtctc 1200 acaaataact agtgaaaggg cagttagggt tttgctttcg gttgggaggt tctgcgcgac 1260 accctctttg ttgcaggaga tgttgcaatt gggagttgta gcaaagctgt gtctggtact 1320 tcaagttagc tgtggtaaca agactaaaga aaaggctaaa gaattgctta agcttcacgc 1380 tagggtttgg agggaatcac cttgtgtccc aagaaatttg tatgattcgt atcctgcttg 1440 aacaacgtac atgtttgaat aattctcatc agatacaaac aattctttga gaattattct 1500 tcgtataagt tcattttaaa acaaaaaaga gtggtttaaa ttttgctcaa actctgattt 1560 tctttcattt gtttttgttt tattatcttt caatgtttat cattatgtgt agataatagt 1620 ggacatattt tcatgaaatt atgaa 1645 <210> 86 <211> 411 <212> PRT <213> Arabidopsis thaliana <400> 86 Met Ser Gly Gly Ile Met Asp Glu Glu Ile Glu Ile Pro Pro Phe Phe 1 5 10 15 Leu Cys Pro Ile Ser Leu Glu Ile Met Lys Asp Pro Val Ile Val Ser 20 25 30 Thr Gly Ile Thr Tyr Asp Arg Asp Ser Ile Glu Lys Trp Leu Phe Ala 35 40 45 Gly Lys Lys Asn Ser Cys Pro Val Thr Lys Gln Asp Ile Thr Asp Ala 50 55 60 Asp Leu Thr Pro Asn His Thr Leu Arg Arg Leu Ile Gln Ser Trp Cys 65 70 75 80 Thr Leu Asn Ala Ser Tyr Gly Val Glu Arg Ile Pro Thr Pro Arg Pro 85 90 95 Pro Ile Cys Lys Ser Glu Ile Glu Lys Leu Ile Arg Asp Ser Ala Ser 100 105 110 Ser His Glu Asn Gln Val Lys Cys Leu Lys Arg Leu Arg Gln Ile Val 115 120 125 Ser Glu Asn Ala Thr Asn Lys Arg Cys Leu Glu Ala Ala Gly Val Pro 130 135 140 Glu Phe Leu Ala Asn Ile Val Ser Asn Asp Ser Glu Asn Gly Ser Leu 145 150 155 160 Thr Asp Glu Ala Leu Asn Leu Leu Tyr His Leu Glu Thr Ser Glu Thr 165 170 175 Val Leu Lys Asn Leu Leu Asn Asn Lys Lys Asp Asn Asn Ile Val Lys 180 185 190 Ser Leu Thr Lys Ile Met Gln Arg Gly Met Tyr Glu Ser Arg Val Tyr 195 200 205 Ala Thr Leu Leu Leu Lys Asn Ile Leu Glu Val Ala Asp Pro Met Gln 210 215 220 Ser Met Thr Leu Lys Pro Glu Val Phe Thr Glu Val Val Gln Ile Leu 225 230 235 240 Asp Asp Arg Ile Ser Gln Lys Ala Thr Lys Ala Ala Met His Ile Leu 245 250 255 Val Asn Ile Cys Pro Trp Gly Arg Asn Arg His Lys Ala Val Glu Ala 260 265 270 Gly Val Ile Ser Val Ile Ile Glu Leu Leu Met Asp Glu Ser Phe Thr 275 280 285 Ser Glu Arg Arg Gly Pro Glu Met Ala Met Val Val Leu Asp Leu Leu 290 295 300 Cys Gln Cys Ala Glu Gly Arg Ala Glu Phe Leu Asn His Gly Ala Ala 305 310 315 320 Ile Ala Val Val Cys Lys Lys Ile Leu Arg Val Ser Gln Thr Ala Ser 325 330 335 Asp Arg Ala Val Arg Val Leu Leu Ser Val Gly Arg Phe Cys Ala Thr 340 345 350 Pro Ala Leu Leu His Glu Met Leu Gln Leu Gly Val Val Ala Lys Leu 355 360 365 Cys Leu Val Leu Gln Val Ser Cys Gly Gly Lys Thr Lys Glu Lys Ala 370 375 380 Lys Glu Leu Leu Lys Leu His Ala Arg Val Trp Lys Asp Ser Pro Cys 385 390 395 400 Leu Pro Lys Asn Met Ile Leu Ala Tyr Pro Cys 405 410 <210> 87 <211> 1212 <212> DNA <213> Medicago truncatula <400> 87 atggatgaaa ttgatgttcc ttcacatttt ctttgcccaa tttccctaca acttatgaaa 60 gatcctgtca cactttccac aggaattacg tacgacagag aaaacataga aaaatggtta 120 ttttcattcc aaaacaatac ttgtcctgtt acaaaacaaa ccttattaga aaccgatctt 180 aataatctta taccaaacca tactttacgt cgtttgattc aatcttggtg tacccttaat 240 gcttcatttg gtgttgaacg tattccaaca ccaaaatcac caatagatag aacacagatt 300 cttaaactcc tcaatgaagc aaagaaattc ccagaaaaac aactcaattg tcttgtaaag 360 cttcgttcta tcgtcttcga aagcgaaagg aacaaaaaat gtttggaatc tgcaggtgca 420 atagagtttc tagctttaac catgaagaac aatttaaatt caagttctct gagtgaagca 480 gctattgaaa ttttgtttca tcttaaccct tctgaagaac atgttaagaa tctgataaac 540 aatgaaagca ttcaatttat tgagtcattg tttcatgttt tgaagcttgg aagctaccaa 600 tctagaggtt atgcaacaat gctgttgaaa tcggcgtttg aagtatccga tccgattcaa 660 ttaataagcg taaaaaaggc gatttttgaa gagataatga gagtgctagt tgataagatc 720 tcacaacaag cttcaaaagc tgcattaaaa ctacttctgg agcttttacc atggggaaga 780 aaccgaatta aagcggttga aggaggcgtg gttttagtcc taatcgaact tcttttcgat 840 gtttcggaaa gaagggtttg tgaattgatg ttaataggtt tggatcaaat ttgtggttgt 900 gcagaaggga gagcagaatt gttgaatcat ggagcaggat tggctattgt gtcaaagaaa 960 attttgaggg tttctcatgt tgcaagtgat agaggtgtta gaattatgag ttctatttgt 1020 aggtattctg caaattctag agttttacat gaaatgttgc atgttggagc agtttcaaag 1080 ttgtgtttgg tgcttcaagt tgatagtaat ttcaagacaa aagagagggc taaggagata 1140 ctcaaattgc attctactgt ttggaagaat tctacatgta ttcctgttcc attgttatct 1200 tcttatccat ga 1212 <210> 88 <211> 403 <212> PRT <213> Medicago truncatula <400> 88 Met Asp Glu Ile Asp Val Pro Ser His Phe Leu Cys Pro Ile Ser Leu 1 5 10 15 Gln Leu Met Lys Asp Pro Val Thr Leu Ser Thr Gly Ile Thr Tyr Asp 20 25 30 Arg Glu Asn Ile Glu Lys Trp Leu Phe Ser Phe Gln Asn Asn Thr Cys 35 40 45 Pro Val Thr Lys Gln Thr Leu Leu Glu Thr Asp Leu Asn Asn Leu Ile 50 55 60 Pro Asn His Thr Leu Arg Arg Leu Ile Gln Ser Trp Cys Thr Leu Asn 65 70 75 80 Ala Ser Phe Gly Val Glu Arg Ile Pro Thr Pro Lys Ser Pro Ile Asp 85 90 95 Arg Thr Gln Ile Leu Lys Leu Leu Asn Glu Ala Lys Lys Phe Pro Glu 100 105 110 Lys Gln Leu Asn Cys Leu Val Lys Leu Arg Ser Ile Val Phe Glu Ser 115 120 125 Glu Arg Asn Lys Lys Cys Leu Glu Ser Ala Gly Ala Ile Glu Phe Leu 130 135 140 Ala Leu Thr Met Lys Asn Asn Leu Asn Ser Ser Ser Leu Ser Glu Ala 145 150 155 160 Ala Ile Glu Ile Leu Phe His Leu Asn Pro Ser Glu Glu His Val Lys 165 170 175 Asn Leu Ile Asn Asn Glu Ser Ile Gln Phe Ile Glu Ser Leu Phe His 180 185 190 Val Leu Lys Leu Gly Ser Tyr Gln Ser Arg Gly Tyr Ala Thr Met Leu 195 200 205 Leu Lys Ser Ala Phe Glu Val Ser Asp Pro Ile Gln Leu Ile Ser Val 210 215 220 Lys Lys Ala Ile Phe Glu Glu Ile Met Arg Val Leu Val Asp Lys Ile 225 230 235 240 Ser Gln Gln Ala Ser Lys Ala Ala Leu Lys Leu Leu Leu Glu Leu Leu 245 250 255 Pro Trp Gly Arg Asn Arg Ile Lys Ala Val Glu Gly Gly Val Val Leu 260 265 270 Val Leu Ile Glu Leu Leu Phe Asp Val Ser Glu Arg Arg Val Cys Glu 275 280 285 Leu Met Leu Ile Gly Leu Asp Gln Ile Cys Gly Cys Ala Glu Gly Arg 290 295 300 Ala Glu Leu Leu Asn His Gly Ala Gly Leu Ala Ile Val Ser Lys Lys 305 310 315 320 Ile Leu Arg Val Ser His Val Ala Ser Asp Arg Gly Val Arg Ile Met 325 330 335 Ser Ser Ile Cys Arg Tyr Ser Ala Asn Ser Arg Val Leu His Glu Met 340 345 350 Leu His Val Gly Ala Val Ser Lys Leu Cys Leu Val Leu Gln Val Asp 355 360 365 Ser Asn Phe Lys Thr Lys Glu Arg Ala Lys Glu Ile Leu Lys Leu His 370 375 380 Ser Thr Val Trp Lys Asn Ser Thr Cys Ile Pro Val Pro Leu Leu Ser 385 390 395 400 Ser Tyr Pro <210> 89 <211> 1480 <212> DNA <213> Nicotiana benthamiana <220> <221> misc_feature <222> (661)..(661) <223> n is a, c, g, or t <220> <221> misc_feature <222> (770)..(770) <223> n is a, c, g, or t <400> 89 gaaagaacgc atctttactc ttctctctct cgttatatat aatttgagtc ttgtttttat 60 ttgtaaagaa gaaaaaaaat agatatggaa gaagtagaga tacctcaata ttttttgtgt 120 cctatatcac ttcaaataat gaaagatccg gtgacgacgg tgaccggaat aacgtacgac 180 cgggaaagca tcgagatgtg gttgttaacg gcggaggaag agacggagac ggcggcgtgt 240 ccggtaacaa agcaaccttt gccaaaagac accgagttgt tgacaccaaa tcatatgctc 300 cggcggctaa ttcaagcttg gtgcatagtc aacgcagaga aaggcgttga ccgaattcca 360 acaccaaagt atcctatgaa caaatcgaat attctccgat tacttcgaca agttaataat 420 aatgatcatc agctttgtgc tgaagctttg aggaaaatgg ctgatttggt tagtgagaat 480 gaaaagaaca ggaaatgcat ggaacaagct ggtgcaatta aggctatggt ttgtttcata 540 gtaaaaagtt tcaaatatga gaaattattt cctggtattg aagaagcttt aaggattttc 600 catttaattt ggaatccaaa atccgaaaac aagcagtatg taaaggataa ccctgattta 660 nttcaagcaa ttttatggat tttaaagagc aatttgaata ccagtcacgt cctagtcaag 720 actcatgcaa tgatggtttt gaagaacgtg acagaagttt cgagttcgan tcttttaaca 780 ggattagacc ccgagttttt ccaacaaatg gcgaatacat tgcgaaaaaa tggaaagtac 840 tacatctctc aacaagcaac aaaagcagct ttacaagtgc taatagatgc atgtctatgg 900 ggaagaaata ggctaaaaat cgtcgaatcg ggagccattt tcgagctgat tgagcttgaa 960 ttatctaacc ctgagaaaag ggttagtgaa ttagtattct gtctattggc taatctatgc 1020 gtattagctg atgggagagc agaattgttg aaacatgcag ctggaattgc agtggtcaca 1080 aaaaggacac taaggatatc ttcagctaca gatgatagtg cacttcaaat tcttggttta 1140 atttcaaagt tttctgccac aaacgaagtg ttattggaaa tgttaagggt aggaggggta 1200 tcaaaacttt gcatggcaat tcaagcagat tgtgagcctc atttgaagaa gaaagcaaga 1260 gagatattga gagcacattc tcatgtttgg agtaattctc cttgtatctc cttgtataca 1320 gtttatcttt tgacagattt cctggacaat agcaagattt gagccctata accttgaata 1380 gttttttttt tccttgtata aatacagcta gccaacatac tgcctttttt gttatactgt 1440 aaaacagcat ctaaattacc cataaaaaaa aaaaaaaaaa 1480 <210> 90 <211> 425 <212> PRT <213> Nicotiana benthamiana <220> <221> UNSURE <222> (193)..(193) <223> Xaa can be any naturally occurring amino acid <220> <221> UNSURE <222> (229)..(229) <223> Xaa can be any naturally occurring amino acid <400> 90 Met Glu Glu Val Glu Ile Pro Gln Tyr Phe Leu Cys Pro Ile Ser Leu 1 5 10 15 Gln Ile Met Lys Asp Pro Val Thr Thr Val Thr Gly Ile Thr Tyr Asp 20 25 30 Arg Glu Ser Ile Glu Met Trp Leu Leu Thr Ala Glu Glu Glu Thr Glu 35 40 45 Thr Ala Ala Cys Pro Val Thr Lys Gln Pro Leu Pro Lys Asp Thr Glu 50 55 60 Leu Leu Thr Pro Asn His Met Leu Arg Arg Leu Ile Gln Ala Trp Cys 65 70 75 80 Ile Val Asn Ala Glu Lys Gly Val Asp Arg Ile Pro Thr Pro Lys Tyr 85 90 95 Pro Met Asn Lys Ser Asn Ile Leu Arg Leu Leu Arg Gln Val Asn Asn 100 105 110 Asn Asp His Gln Leu Cys Ala Glu Ala Leu Arg Lys Met Ala Asp Leu 115 120 125 Val Ser Glu Asn Glu Lys Asn Arg Lys Cys Met Glu Gln Ala Gly Ala 130 135 140 Ile Lys Ala Met Val Cys Phe Ile Val Lys Ser Phe Lys Tyr Glu Lys 145 150 155 160 Leu Phe Pro Gly Ile Glu Glu Ala Leu Arg Ile Phe His Leu Ile Trp 165 170 175 Asn Pro Lys Ser Glu Asn Lys Gln Tyr Val Lys Asp Asn Pro Asp Leu 180 185 190 Xaa Gln Ala Ile Leu Trp Ile Leu Lys Ser Asn Leu Asn Thr Ser His 195 200 205 Val Leu Val Lys Thr His Ala Met Met Val Leu Lys Asn Val Thr Glu 210 215 220 Val Ser Ser Ser Xaa Leu Leu Thr Gly Leu Asp Pro Glu Phe Phe Gln 225 230 235 240 Gln Met Ala Asn Thr Leu Arg Lys Asn Gly Lys Tyr Tyr Ile Ser Gln 245 250 255 Gln Ala Thr Lys Ala Ala Leu Gln Val Leu Ile Asp Ala Cys Leu Trp 260 265 270 Gly Arg Asn Arg Leu Lys Ile Val Glu Ser Gly Ala Ile Phe Glu Leu 275 280 285 Ile Glu Leu Glu Leu Ser Asn Pro Glu Lys Arg Val Ser Glu Leu Val 290 295 300 Phe Cys Leu Leu Ala Asn Leu Cys Val Leu Ala Asp Gly Arg Ala Glu 305 310 315 320 Leu Leu Lys His Ala Ala Gly Ile Ala Val Val Thr Lys Arg Thr Leu 325 330 335 Arg Ile Ser Ser Ala Thr Asp Asp Ser Ala Leu Gln Ile Leu Gly Leu 340 345 350 Ile Ser Lys Phe Ser Ala Thr Asn Glu Val Leu Leu Glu Met Leu Arg 355 360 365 Val Gly Gly Val Ser Lys Leu Cys Met Ala Ile Gln Ala Asp Cys Glu 370 375 380 Pro His Leu Lys Lys Lys Ala Arg Glu Ile Leu Arg Ala His Ser His 385 390 395 400 Val Trp Ser Asn Ser Pro Cys Ile Ser Leu Tyr Thr Val Tyr Leu Leu 405 410 415 Thr Asp Phe Leu Asp Asn Ser Lys Ile 420 425 <210> 91 <211> 1643 <212> DNA <213> Oryza sativa <400> 91 cattcccttc aactcaaact cctcttcttc ttcttcctcc catcgatctc tctccttcgc 60 gatcaactcg agctcgaact cgtctcgtgg tagtagcgag catggaggag gcggcggcgg 120 aggtgccgtc ctacttcctg tgcccgatct cgctggagat catgagggac ccggtgacgc 180 tggcgacggg gatcacctac gaccggagca gcatcgagcg gtggatgttc ggcggcggcg 240 gcggcgacgg ggggaagggg acgtgcccgg tgacgcggcg gcagctggcg ccggcggagc 300 gggaggcgac gcccaaccac acgctgcggc ggctcatcca ggcgtggtgc gccgcgcacg 360 ccgtcgagag gttccccacc ccgcgcccgc ccgtcgactc ctgccgcgtc gccgcgctcg 420 tcgacgaggg gacgacgacg atgctcggcg gcggcggcag gcagcggcag ctcgccgcgc 480 tccgggagat caaggccatc gccgccgaga gcgaccgcaa caagcgctgc gtcgaggcca 540 cgcccggcgc cgtcgagttc ctcgtctccg tcgtcgtcca gagccatgcc gccgcctcca 600 cctcagccag ctcggacgac gacgacctgt tcgactcggt gatcgattcc cccatgtcga 660 cgagctcgcc ggaggaggag gccctgggcg tgctctactc cctcaagccg tccgagccca 720 ccctgcgccg cgtcctcggc aaggacaatg gcgtcggctt cctcgacacc ctcgcctccg 780 tgctccgccg cccgagctac cgttcgcgcg cgtatgccat cctcctcctg aaggcggtga 840 cgtcggcgat gccgccggag cggctgatgg cggtgagccc cgagctggtg gaggaggtgg 900 tccgggtggt gtccgacggc gtgtcgtcga aggcggtgaa ggcggcgctg cacgtgctgt 960 gccggctgtg cccgtggggg cggaaccgcg tgaaggcggt ggaggccggc gcggtggcgg 1020 cgctggtgga gctcctcctc gacgaggagg gcggcggcgg gcggcggcgc gcggcggagc 1080 tggcggtggt ggcgatcgac cacctgtgcg ggtgcgcgga ggggaggtcg gagctggtgg 1140 cgcacccggc ggggctcgcc gtggtgtcca agagggcgat gcgggtgtcg ccggcggcca 1200 ccgagagcgc cgtgcgcgcg ctccacgccg tcgcgaggaa cgcggcgacg ccggccgtgc 1260 tgcaggagat gctcgccgtc ggcgtggtgg cgaagctgct gctggtgctg caggcggacg 1320 gcggcgagcg cgccagggcg agggcgaggg agatgctcag ggcgaacgct agggtttgga 1380 aggactcgcc atgcttgcaa gctcacctta aggcttctta cccctcctga tcatttcatc 1440 accatcacat ccatccaccg atctattaat tattattaat tgctaagagg agcacatgct 1500 ttaatttgca ctcctcttag tagttaatta gattttgtga ttacttttag ttctttaatt 1560 tgtttatgat ctgaatgtac aaaatacact gtaaatcttt cattaattct gtacaaaaat 1620 acactataaa tctttcattg cct 1643 <210> 92 <211> 442 <212> PRT <213> Oryza sativa <400> 92 Met Glu Glu Ala Ala Ala Glu Val Pro Ser Tyr Phe Leu Cys Pro Ile 1 5 10 15 Ser Leu Glu Ile Met Arg Asp Pro Val Thr Leu Ala Thr Gly Ile Thr 20 25 30 Tyr Asp Arg Ser Ser Ile Glu Arg Trp Met Phe Gly Gly Gly Gly Gly 35 40 45 Asp Gly Gly Lys Gly Thr Cys Pro Val Thr Arg Arg Gln Leu Ala Pro 50 55 60 Ala Glu Arg Glu Ala Thr Pro Asn His Thr Leu Arg Arg Leu Ile Gln 65 70 75 80 Ala Trp Cys Ala Ala His Ala Val Glu Arg Phe Pro Thr Pro Arg Pro 85 90 95 Pro Val Asp Ser Cys Arg Val Ala Ala Leu Val Asp Glu Gly Thr Thr 100 105 110 Thr Met Leu Gly Gly Gly Gly Arg Gln Arg Gln Leu Ala Ala Leu Arg 115 120 125 Glu Ile Lys Ala Ile Ala Ala Glu Ser Asp Arg Asn Lys Arg Cys Val 130 135 140 Glu Ala Thr Pro Gly Ala Val Glu Phe Leu Val Ser Val Val Val Gln 145 150 155 160 Ser His Ala Ala Ala Ser Thr Ser Ala Ser Ser Asp Asp Asp Asp Leu 165 170 175 Phe Asp Ser Val Ile Asp Ser Pro Met Ser Thr Ser Ser Pro Glu Glu 180 185 190 Glu Ala Leu Gly Val Leu Tyr Ser Leu Lys Pro Ser Glu Pro Thr Leu 195 200 205 Arg Arg Val Leu Gly Lys Asp Asn Gly Val Gly Phe Leu Asp Thr Leu 210 215 220 Ala Ser Val Leu Arg Arg Pro Ser Tyr Arg Ser Arg Ala Tyr Ala Ile 225 230 235 240 Leu Leu Leu Lys Ala Val Thr Ser Ala Met Pro Pro Glu Arg Leu Met 245 250 255 Ala Val Ser Pro Glu Leu Val Glu Glu Val Val Arg Val Val Ser Asp 260 265 270 Gly Val Ser Ser Lys Ala Val Lys Ala Ala Leu His Val Leu Cys Arg 275 280 285 Leu Cys Pro Trp Gly Arg Asn Arg Val Lys Ala Val Glu Ala Gly Ala 290 295 300 Val Ala Ala Leu Val Glu Leu Leu Leu Asp Glu Glu Gly Gly Gly Gly 305 310 315 320 Arg Arg Arg Ala Ala Glu Leu Ala Val Val Ala Ile Asp His Leu Cys 325 330 335 Gly Cys Ala Glu Gly Arg Ser Glu Leu Val Ala His Pro Ala Gly Leu 340 345 350 Ala Val Val Ser Lys Arg Ala Met Arg Val Ser Pro Ala Ala Thr Glu 355 360 365 Ser Ala Val Arg Ala Leu His Ala Val Ala Arg Asn Ala Ala Thr Pro 370 375 380 Ala Val Leu Gln Glu Met Leu Ala Val Gly Val Val Ala Lys Leu Leu 385 390 395 400 Leu Val Leu Gln Ala Asp Gly Gly Glu Arg Ala Arg Ala Arg Ala Arg 405 410 415 Glu Met Leu Arg Ala Asn Ala Arg Val Trp Lys Asp Ser Pro Cys Leu 420 425 430 Gln Ala His Leu Lys Ala Ser Tyr Pro Ser 435 440 <210> 93 <211> 1591 <212> DNA <213> Oryza sativa <400> 93 agtactcccc atctcccatc caccattgct gccatctcca ccacatacaa tacaacaact 60 actactcagc tcaccatcac cggagcaaga gccaagaaga cgacgacgac gacgagctag 120 cagcagcatt gcaaccgacg gcaatggagg agcagcagca ggtggaggtg gaggtggagg 180 tgccgtccta cttcgtgtgc cccatctcgc tgcagatcat gcgcgacccg gtgacgctcc 240 ccaccggcat cacctacgac cgcgacggca tcgagcgatg gctcctcacc gccggcacct 300 gcccgctcac caagcagccc gtgccgcccg actgcgaccc cacgcccaac cacaccctgc 360 gccgcctcat ccagtcgtgg tgcgccctcc acgccgacca tggcgtcgac ctcgtcccca 420 cccccaagcc ccccgccgac cgcgcccgcg tcgccgacct cgtctcccgc ctccgcgccg 480 ccacgagctc cgctgccctc ctcgacgcgc tgcgcgagct cagggacgtt gccgccgaga 540 gcgagcgtaa caggaagctc ctcgccgccg tccccggcgc ggtggatgtt ctggccgccg 600 tcgtcgtcgc gtcgtgtcga gacgccaagg ccgcgtgcga cgaggccctc gagatcgtct 660 gctcgctgga gctctcggag cggtgcctgg cgcggctcgt cgagaggaac gaggagctcg 720 tcgacgcgct cgtcgccacg ctgcagcgga cgaacaccac gtcccgggcg cacgcggcgc 780 tgctcctgga ggccgtgacg gcggtcatgc cgtcgaacag gctggtgtcc ctcccggagg 840 aggtgttcgg tgaggcggtg cagctgctcc gcgacagggt atcgagcccg gcgacgaggg 900 cggcgctgca cgtgctggtc ggcacgacgt cgtggggccg caaccgcgtg aaggcggtgg 960 acgccggcgc ggtggcggtg ctggtcgaca tgctcctgga cgggccagtc gagcggcgcg 1020 ggtgcgagct ggccctggcg gcgctggacc ggatgtgcgg gtgcgcggag gggcgggcgg 1080 cgctggtgtc gcacggcgcg ggcgtggcgg tggtggggag gaaggtgctg agggtgtcgg 1140 aggtggcgag cgagaaggcg gtgcgggtgc tgcggtcggt ggcgaggcac gcggcgacgg 1200 cggcggtggt gcaggagatg gggcagacgg gggcggtgga gaagctgtgc gtggtggcgc 1260 agtcggagca gtgcggggag aggacgcggg agcgggcgcg ggagacgctg cggctgcacg 1320 ccagagcgtg gaggaactcg ccctgcttgc agcctcacct ccaggccctc tacccttctt 1380 gctgatcgaa ttctgattca tgatcaccgg cctcatcact agctagctac caacatacag 1440 cacagagaga attgaacact tgttcgattc ttcctttcgc tcgattaatt ttattgagtt 1500 gagatcgttc gatgtagtcc tatgaatcaa agtgtacaga tcgacgcaat agatgaacta 1560 aatcatgcgc gagctttttt tgtttgggtc t 1591 <210> 94 <211> 413 <212> PRT <213> Oryza sativa <400> 94 Met Glu Glu Gln Gln Gln Val Glu Val Glu Val Glu Val Pro Ser Tyr 1 5 10 15 Phe Val Cys Pro Ile Ser Leu Gln Ile Met Arg Asp Pro Val Thr Leu 20 25 30 Pro Thr Gly Ile Thr Tyr Asp Arg Asp Gly Ile Glu Arg Trp Leu Leu 35 40 45 Thr Ala Gly Thr Cys Pro Leu Thr Lys Gln Pro Val Pro Pro Asp Cys 50 55 60 Asp Pro Thr Pro Asn His Thr Leu Arg Arg Leu Ile Gln Ser Trp Cys 65 70 75 80 Ala Leu His Ala Asp His Gly Val Asp Leu Val Pro Thr Pro Lys Pro 85 90 95 Pro Ala Asp Arg Ala Arg Val Ala Asp Leu Val Ser Arg Leu Arg Ala 100 105 110 Ala Thr Ser Ser Ala Ala Leu Leu Asp Ala Leu Arg Glu Leu Arg Asp 115 120 125 Val Ala Ala Glu Ser Glu Arg Asn Arg Lys Leu Leu Ala Ala Val Pro 130 135 140 Gly Ala Val Asp Val Leu Ala Ala Val Val Val Ala Ser Cys Arg Asp 145 150 155 160 Ala Lys Ala Ala Cys Asp Glu Ala Leu Glu Ile Val Cys Ser Leu Glu 165 170 175 Leu Ser Glu Arg Cys Leu Ala Arg Leu Val Glu Arg Asn Glu Glu Leu 180 185 190 Val Asp Ala Leu Val Ala Thr Leu Gln Arg Thr Asn Thr Thr Ser Arg 195 200 205 Ala His Ala Ala Leu Leu Leu Glu Ala Val Thr Ala Val Met Pro Ser 210 215 220 Asn Arg Leu Val Ser Leu Pro Glu Glu Val Phe Gly Glu Ala Val Gln 225 230 235 240 Leu Leu Arg Asp Arg Val Ser Ser Pro Ala Thr Arg Ala Ala Leu His 245 250 255 Val Leu Val Gly Thr Thr Ser Trp Gly Arg Asn Arg Val Lys Ala Val 260 265 270 Asp Ala Gly Ala Val Ala Val Leu Val Asp Met Leu Leu Asp Gly Pro 275 280 285 Val Glu Arg Arg Gly Cys Glu Leu Ala Leu Ala Ala Leu Asp Arg Met 290 295 300 Cys Gly Cys Ala Glu Gly Arg Ala Ala Leu Val Ser His Gly Ala Gly 305 310 315 320 Val Ala Val Val Gly Arg Lys Val Leu Arg Val Ser Glu Val Ala Ser 325 330 335 Glu Lys Ala Val Arg Val Leu Arg Ser Val Ala Arg His Ala Ala Thr 340 345 350 Ala Ala Val Val Gln Glu Met Gly Gln Thr Gly Ala Val Glu Lys Leu 355 360 365 Cys Val Val Ala Gln Ser Glu Gln Cys Gly Glu Arg Thr Arg Glu Arg 370 375 380 Ala Arg Glu Thr Leu Arg Leu His Ala Arg Ala Trp Arg Asn Ser Pro 385 390 395 400 Cys Leu Gln Pro His Leu Gln Ala Leu Tyr Pro Ser Cys 405 410 <210> 95 <211> 1353 <212> DNA <213> Oryza sativa <400> 95 tcagcgaggg taggaagcat tcaagtgcga ggccaagcat ggcgagtccc tccacaccct 60 ggcgtgcatc ttgagcatct ccctcgccct cgccctcgtc cgctcgccgg aggcgccgac 120 ctgcaccagg aagagcagcc tcgccaccac gccgacggcc agcatctcct gcagcaccgc 180 cgacgtcgcc gagtgcctcg ccacggcgtg cagcgcgcgc acggcgctct cggcgcccgc 240 cgcggcgggc agccgcgtcg ccgcgcacgc caccgccgcg agccccgccg ggtgcgccac 300 cagcgccagg cgcccctccg cgcagccgca gatgtggtcg atcgccacgg cggcgagctc 360 gcacgcgcgc cggtcgccgc cgccgccgcc gcagccctcg tcgaggagga ggcgcacgag 420 cgccgacacg gcgccggcgt cgaccgcctt gacgcggttc cggccccacg ggcagagccg 480 gcagagcacg tggagcgcca ccttgaccgc cttcgccgac ggcctgtccg ccaccacccc 540 caccacgccg tcgaccagcg cggcgctcgc cgacgtcagc cgcgcggggg ccatcgccgg 600 gagcgccgat ttcagcaggt ggattccctg catccgcgag aggtagctcg gccgccgcag 660 cacgcacgcc atggtttcca agaaatcctc accgccgctg tcctccaaga ccctcttgaa 720 gctctcctcg gagagcttga gcgaatgcag gatgctcagg gccgcctcct ccggcgagct 780 cgccttcgcc ggatcatgca cgccgccgca cgtcgtctct tccggcttgg ccgacgtcgc 840 gtcgtccacg cccgccacgg aggtgcgctc cttgacgacg gacaggagga actccacggc 900 gccggaggcg ccctggacgc accgccggtt gcggtcgctc tcggcgacga tgtcggcgag 960 ctccctcagc gaagccatca gctcctcccg ctgacgacgc cggcgcagca gcggccgcgc 1020 ggcgtccacg atggcggcga cgcgggcggc gtcgacgggg gggcgcgggg tggggaagcg 1080 ctcgacggcg tggacggcgc accacccctg tatgaggcgg cggagcgtgt ggttgggcgt 1140 gggctcccgg tccgccggcg ccagccgctg cttggtcacc gggcactcgc cgtggccgtc 1200 ggtgaacacc caccgctcga tgctctcccg gtcgtaggtg atccccgtcg acagcgtcac 1260 cgggtcccgc atgatctcca gcgagatcgg gcacatgaag taggacggca cctccaccgc 1320 cggcgccgcc gccggcgacg actcctcacc cat 1353 <210> 96 <211> 450 <212> PRT <213> Oryza sativa <400> 96 Met Gly Glu Glu Ser Ser Pro Ala Ala Ala Pro Ala Val Glu Val Pro 1 5 10 15 Ser Tyr Phe Met Cys Pro Ile Ser Leu Glu Ile Met Arg Asp Pro Val 20 25 30 Thr Leu Ser Thr Gly Ile Thr Tyr Asp Arg Glu Ser Ile Glu Arg Trp 35 40 45 Val Phe Thr Asp Gly His Gly Glu Cys Pro Val Thr Lys Gln Arg Leu 50 55 60 Ala Pro Ala Asp Arg Glu Pro Thr Pro Asn His Thr Leu Arg Arg Leu 65 70 75 80 Ile Gln Gly Trp Cys Ala Val His Ala Val Glu Arg Phe Pro Thr Pro 85 90 95 Arg Pro Pro Val Asp Ala Ala Arg Val Ala Ala Ile Val Asp Ala Ala 100 105 110 Arg Pro Leu Leu Arg Arg Arg Arg Gln Arg Glu Glu Leu Met Ala Ser 115 120 125 Leu Arg Glu Leu Ala Asp Ile Val Ala Glu Ser Asp Arg Asn Arg Arg 130 135 140 Cys Val Gln Gly Ala Ser Gly Ala Val Glu Phe Leu Leu Ser Val Val 145 150 155 160 Lys Glu Arg Thr Ser Val Ala Gly Val Asp Asp Ala Thr Ser Ala Lys 165 170 175 Pro Glu Glu Thr Thr Cys Gly Gly Val His Asp Pro Ala Lys Ala Ser 180 185 190 Ser Pro Glu Glu Ala Ala Leu Ser Ile Leu His Ser Leu Lys Leu Ser 195 200 205 Glu Glu Ser Phe Lys Arg Val Leu Glu Asp Ser Gly Gly Glu Asp Phe 210 215 220 Leu Glu Thr Met Ala Cys Val Leu Arg Arg Pro Ser Tyr Leu Ser Arg 225 230 235 240 Met Gln Gly Ile His Leu Leu Lys Ser Ala Leu Pro Ala Met Ala Pro 245 250 255 Ala Arg Leu Thr Ser Ala Ser Ala Ala Leu Val Asp Gly Val Val Gly 260 265 270 Val Val Ala Asp Arg Pro Ser Ala Lys Ala Val Lys Val Ala Leu His 275 280 285 Val Leu Cys Arg Leu Cys Pro Trp Gly Arg Asn Arg Val Lys Ala Val 290 295 300 Asp Ala Gly Ala Val Ser Ala Leu Val Arg Leu Leu Leu Asp Glu Gly 305 310 315 320 Cys Gly Gly Gly Gly Gly Asp Arg Arg Ala Cys Glu Leu Ala Ala Val 325 330 335 Ala Ile Asp His Ile Cys Gly Cys Ala Glu Gly Arg Leu Ala Leu Val 340 345 350 Ala His Pro Ala Gly Leu Ala Ala Val Ala Cys Ala Ala Thr Arg Leu 355 360 365 Pro Ala Ala Ala Gly Ala Glu Ser Ala Val Arg Ala Leu His Ala Val 370 375 380 Ala Arg His Ser Ala Thr Ser Ala Val Leu Gln Glu Met Leu Ala Val 385 390 395 400 Gly Val Val Ala Arg Leu Leu Phe Leu Val Gln Val Gly Ala Ser Gly 405 410 415 Glu Arg Thr Arg Ala Arg Ala Arg Glu Met Leu Lys Met His Ala Arg 420 425 430 Val Trp Arg Asp Ser Pro Cys Leu Ala Ser His Leu Asn Ala Ser Tyr 435 440 445 Pro Arg 450 <210> 97 <211> 1248 <212> DNA <213> Oryza sativa <400> 97 atggaggagg cggcggcgga ggtgccgtcc tacttcctgt gcccgatctc gctggagatc 60 atgagggacc cggtgacgct ggcgacgggg atcacctacg accggagcag catcgagcgg 120 tggatgttcg gcggcggcgg cggcggcggc gggaagggga cgtgcccggt gacgcggcgg 180 cagctggcgc cggcggagcg ggaggcgacg cccaaccaca cgctgcggcg gctcatccag 240 gcgtggggac gacgacgatg ctcggcggcg gcggcaggca gcggcagctc gccgcgctcc 300 ggggagatca aggccatcgc cgccgagagc gaccgcaaca agcgctgcgt cgaggccacg 360 cccggcgccg tcgagttcct cgtctccgtc gtcgtccaga gccatgccgc cgcctccacc 420 tcagccagct cggacgacga cgacctgttc gactcggtga tcgattcccc catgtcgacg 480 agctcgccgg aggaggaggc cctgggcgtg ctctactccc tcaagccgtc cgagcccacc 540 ctgcgccgcg tcctcggcaa ggacaatggc gtcggcttcc tcgacaccct cgcctccgtg 600 ctccgccgcc cgagctaccg ttcgcgcgcg tatgccatcc tcctcctgaa ggcggtgacg 660 tcggcgatgc cgccggagcg gctgatggcg gtgagccccg agctggtgga ggaggtggtc 720 cgggtggtgt ccgacggcgt gtcgtcgaag gcggtgaagg cggcgctgca cgtgctgtgc 780 cggctgtgcc cgtgggggcg gaaccgcgtg aaggcggtgg aggccggcgc ggtggcggcg 840 ctggtggagc tcctcctcga cgaggagggc ggcggcgggc ggcggcgcgc ggcggagctg 900 gcggtggtgg cgatcgacca cctgtgcggg tgcgcggagg ggaggtcgga gctggtggcg 960 cacccggcgg ggctcgccgt ggtgtccaag agggcgatgc gggtgtcgcc ggcggccacc 1020 gagagcgccg tgcgcgcgct ccacgccgtc gcgaggaacg cggcgacgcc ggccgtgctg 1080 caggagatgc tcgccgtcgg cgtggtggcg aagctgctgc tggtgctgca ggcggacggc 1140 ggcgagcgcg ccagggcgag ggcgagggag atgctcaggg cgaacgctag ggtttggaag 1200 gactcgccat gcttgcaagc tcaccttaag gcttcttacc cctcctga 1248 <210> 98 <211> 415 <212> PRT <213> Oryza sativa <400> 98 Met Glu Glu Ala Ala Ala Glu Val Pro Ser Tyr Phe Leu Cys Pro Ile 1 5 10 15 Ser Leu Glu Ile Met Arg Asp Pro Val Thr Leu Ala Thr Gly Ile Thr 20 25 30 Tyr Asp Arg Ser Ser Ile Glu Arg Trp Met Phe Gly Gly Gly Gly Gly 35 40 45 Gly Gly Gly Lys Gly Thr Cys Pro Val Thr Arg Arg Gln Leu Ala Pro 50 55 60 Ala Glu Arg Glu Ala Thr Pro Asn His Thr Leu Arg Arg Leu Ile Gln 65 70 75 80 Ala Trp Gly Arg Arg Arg Cys Ser Ala Ala Ala Ala Gly Ser Gly Ser 85 90 95 Ser Pro Arg Ser Gly Glu Ile Lys Ala Ile Ala Ala Glu Ser Asp Arg 100 105 110 Asn Lys Arg Cys Val Glu Ala Thr Pro Gly Ala Val Glu Phe Leu Val 115 120 125 Ser Val Val Val Gln Ser His Ala Ala Ala Ser Thr Ser Ala Ser Ser 130 135 140 Asp Asp Asp Asp Leu Phe Asp Ser Val Ile Asp Ser Pro Met Ser Thr 145 150 155 160 Ser Ser Pro Glu Glu Glu Ala Leu Gly Val Leu Tyr Ser Leu Lys Pro 165 170 175 Ser Glu Pro Thr Leu Arg Arg Val Leu Gly Lys Asp Asn Gly Val Gly 180 185 190 Phe Leu Asp Thr Leu Ala Ser Val Leu Arg Arg Pro Ser Tyr Arg Ser 195 200 205 Arg Ala Tyr Ala Ile Leu Leu Leu Lys Ala Val Thr Ser Ala Met Pro 210 215 220 Pro Glu Arg Leu Met Ala Val Ser Pro Glu Leu Val Glu Glu Val Val 225 230 235 240 Arg Val Val Ser Asp Gly Val Ser Ser Lys Ala Val Lys Ala Ala Leu 245 250 255 His Val Leu Cys Arg Leu Cys Pro Trp Gly Arg Asn Arg Val Lys Ala 260 265 270 Val Glu Ala Gly Ala Val Ala Ala Leu Val Glu Leu Leu Leu Asp Glu 275 280 285 Glu Gly Gly Gly Gly Arg Arg Arg Ala Ala Glu Leu Ala Val Val Ala 290 295 300 Ile Asp His Leu Cys Gly Cys Ala Glu Gly Arg Ser Glu Leu Val Ala 305 310 315 320 His Pro Ala Gly Leu Ala Val Val Ser Lys Arg Ala Met Arg Val Ser 325 330 335 Pro Ala Ala Thr Glu Ser Ala Val Arg Ala Leu His Ala Val Ala Arg 340 345 350 Asn Ala Ala Thr Pro Ala Val Leu Gln Glu Met Leu Ala Val Gly Val 355 360 365 Val Ala Lys Leu Leu Leu Val Leu Gln Ala Asp Gly Gly Glu Arg Ala 370 375 380 Arg Ala Arg Ala Arg Glu Met Leu Arg Ala Asn Ala Arg Val Trp Lys 385 390 395 400 Asp Ser Pro Cys Leu Gln Ala His Leu Lys Ala Ser Tyr Pro Ser 405 410 415 <210> 99 <211> 1215 <212> DNA <213> Oryza sativa <400> 99 atggcgagcg cggcggccga ggtgccgtcc tacttcgtct gcccgatctc gctgcagctc 60 atgcgcgacc ccgtcacgct ccctacgggg atctcgtacg accgcgccgc gatcgcgcgg 120 tggctcgccg cgccgggggc ccgccggacg tgtcccgtca cgcggcagcc gctcgagcac 180 gggctggagc tcacgcccaa ccacaccctg cgccgcctga tccagtcgtg ggcggcctcc 240 gtctcccccg ggtcggccgt ggacgaggag gtggccgcgc tacgaccggt ttcgagcgac 300 gaggttgcgt cgctcctgtc cgacgccgcc gcggcgcagg tgggcgcgct caggaggctg 360 cgggagctgg cggcggagtg cgaggatagc agggcaatgc tggagtccca gggcggggtg 420 ttcgacgtgc tatctcgcgt cgtgaccagc ggcagcgcct gctcgacggc gcgggaggag 480 gcggttggtg tcctcgcgtc gctccggatc ccggagcagg agctgatcgg cgtctcgacc 540 aggcacggca acctggcgga gtccctcacg gccgtgctcc gctcgtcgaa tctccagtcg 600 cgggcgcacg cggtgcagct cgtgaggacg ctcgccgacg cggtggtccc ggcgtgggtg 660 atcggcctca acgcggagct cctcgccgag gtggtcggcg tggtccgcga ccgcgtctcg 720 gcgcgggcca ccaaggcgtc cctccacgcg ctcgccgcgc tctgcccgta cggccggcac 780 cgcgtgaaga tcgtgggcgc cggcgcggtg gcggcgctgg tggagctgct gctggacgag 840 cccgagcggc gcgtgtgcga gctggcgctg gccgtgctgg accggctgtg cacgtgcgcg 900 gaggggcgcg cggagctggt ggcgcacgcg gcgggcgtgg ccgtggtggg gaagaaggtg 960 ctgcgggtgt cggaggcggc gagcgagcgg gcggtgcgcg tgctgcggtc ggtggcgcgg 1020 cacgcggcga cgccggcggt gctgcaggag atggcgcagt gcggcgtggt ggggaagctg 1080 tgcctggcgc tgcggtcgga gcagtgcggg gtgaagacca aggagaaggc gcacgaggtg 1140 ctcaagctgc actccagggt ctggagggcc tcgccatgct tgtctcccag cttcttggcg 1200 ctttacccat catga 1215 <210> 100 <211> 404 <212> PRT <213> Oryza sativa <400> 100 Met Ala Ser Ala Ala Ala Glu Val Pro Ser Tyr Phe Val Cys Pro Ile 1 5 10 15 Ser Leu Gln Leu Met Arg Asp Pro Val Thr Leu Pro Thr Gly Ile Ser 20 25 30 Tyr Asp Arg Ala Ala Ile Ala Arg Trp Leu Ala Ala Pro Gly Ala Arg 35 40 45 Arg Thr Cys Pro Val Thr Arg Gln Pro Leu Glu His Gly Leu Glu Leu 50 55 60 Thr Pro Asn His Thr Leu Arg Arg Leu Ile Gln Ser Trp Ala Ala Ser 65 70 75 80 Val Ser Pro Gly Ser Ala Val Asp Glu Glu Val Ala Ala Leu Arg Pro 85 90 95 Val Ser Ser Asp Glu Val Ala Ser Leu Leu Ser Asp Ala Ala Ala Ala 100 105 110 Gln Val Gly Ala Leu Arg Arg Leu Arg Glu Leu Ala Ala Glu Cys Glu 115 120 125 Asp Ser Arg Ala Met Leu Glu Ser Gln Gly Gly Val Phe Asp Val Leu 130 135 140 Ser Arg Val Val Thr Ser Gly Ser Ala Cys Ser Thr Ala Arg Glu Glu 145 150 155 160 Ala Val Gly Val Leu Ala Ser Leu Arg Ile Pro Glu Gln Glu Leu Ile 165 170 175 Gly Val Ser Thr Arg His Gly Asn Leu Ala Glu Ser Leu Thr Ala Val 180 185 190 Leu Arg Ser Ser Asn Leu Gln Ser Arg Ala His Ala Val Gln Leu Val 195 200 205 Arg Thr Leu Ala Asp Ala Val Val Pro Ala Trp Val Ile Gly Leu Asn 210 215 220 Ala Glu Leu Leu Ala Glu Val Val Gly Val Val Arg Asp Arg Val Ser 225 230 235 240 Ala Arg Ala Thr Lys Ala Ser Leu His Ala Leu Ala Ala Leu Cys Pro 245 250 255 Tyr Gly Arg His Arg Val Lys Ile Val Gly Ala Gly Ala Val Ala Ala 260 265 270 Leu Val Glu Leu Leu Leu Asp Glu Pro Glu Arg Arg Val Cys Glu Leu 275 280 285 Ala Leu Ala Val Leu Asp Arg Leu Cys Thr Cys Ala Glu Gly Arg Ala 290 295 300 Glu Leu Val Ala His Ala Ala Gly Val Ala Val Val Gly Lys Lys Val 305 310 315 320 Leu Arg Val Ser Glu Ala Ala Ser Glu Arg Ala Val Arg Val Leu Arg 325 330 335 Ser Val Ala Arg His Ala Ala Thr Pro Ala Val Leu Gln Glu Met Ala 340 345 350 Gln Cys Gly Val Val Gly Lys Leu Cys Leu Ala Leu Arg Ser Glu Gln 355 360 365 Cys Gly Val Lys Thr Lys Glu Lys Ala His Glu Val Leu Lys Leu His 370 375 380 Ser Arg Val Trp Arg Ala Ser Pro Cys Leu Ser Pro Ser Phe Leu Ala 385 390 395 400 Leu Tyr Pro Ser <210> 101 <211> 1416 <212> DNA <213> Oryza sativa <400> 101 cccacgcgtc cgcccacgcg tccgggacac cagaaacata gtacacttga gctcactcca 60 aactcaaaca ctcacaccaa tggctctcca agttcaggcc gcactcctgc cctctgctct 120 ctctgtcccc aagaagggta acttgagcgc ggtggtgaag gagccggggt tccttagcgt 180 gagcagaagg ccaagaagcc gtcgctggtg gtgagggcgg tggcgacgcg gcgggccggt 240 ggcgagcccc ggcgcgggca cgtcgaaggc ggacgggaag aagacgctgc ggcagggggt 300 ggtggtgatc accggcgcgt cgtcggggct cgggctcgcg gcggcgaagg cgcttggcgg 360 agacggggaa gtggcacgtg gtgatggcgt tccgcgactt tcctgaaggc ggcgacggcg 420 gcgaaggcgg cggggatggc ggcggggagc tacaccgtca tgcacctgga cctcgcctcc 480 ctcgacagcg tccgccagtt cgtggacaac ttccggcgct ccggcatgcc gctcgacgcg 540 ctggtgtgca acgccgcaca tctaccggcc gacggcgcgg caaccgacgt tcaacgccga 600 cgggtacgag atgagcgtcg gggtgaacca cctgggccac ttcctcctcg cccgcctcat 660 gctcgacgac ctcaagaaat ccgactaccc gtcgcggcgg ctcatcatcc tcggctccat 720 caccggcaac accaacacct tcgccggcaa cgtccctccc aaggccgggc taggcgacct 780 ccgggggctc gccggcgggc tccgcgggca gaacgggtcg gcgatgatcg acggcgcgga 840 gagcttcgac ggcgccaagg cgtacaagga cagcaagatc tgtaacatgc tgacgatgca 900 ggagttccac cggagattcc acgaggagac cgggatcacg ttcgcgtcgc tgtacccggg 960 gtgcatcgcg acgacgggct tgttccgcga gcacatcccg ctgttccggc tgctgttccc 1020 gccgttccag cggttcgtga cgaaggggtt cgtgtcggag gcggagtccg ggaagcggct 1080 ggcgcaggtg gtgggcgacc cgagcctgac caagtccggc gtgtactgga gctggaacaa 1140 ggactcggcg tcgttcgaga accagctctc gcaggaggcc agcgacccgg agaaggccag 1200 gaagctctgg gacctcagcg agaagctcgt cggcctcgtc tgagtttatt atttacccat 1260 tcgtttcaac tgttaatttc ttcggggttt agggggtttc agctttcagt gagagaggcc 1320 tgtcaagtga tgtacaatta gtaatttttt tttacccgac aaatcatgca ataaaaccac 1380 aggcttacat tatcgatttg tccacctaaa ttaagt 1416 <210> 102 <211> 55 <212> DNA <213> Artificial sequence <220> <223> primer: prm9075 <400> 102 ggggacaagt ttgtacaaaa aagcaggctt aaacaatgga agaaattcaa gtacc 55 <210> 103 <211> 51 <212> DNA <213> Artificial sequence <220> <223> primer: prm8785 <400> 103 ggggaccact ttgtacaaga aagctgggtg ctcttttggt cctattttcc t 51 <210> 104 <211> 801 <212> DNA <213> Pseudomonas fluorescens <400> 104 tttgtacaaa aaagcaggct taaacaatga ctgacacccc aatgtccccc gccgaattcg 60 aagcggccct gcgcgccaag ggcgcctatt accacatcta tcacccgtat cacgtggcga 120 tgtatgaagg ccgggcgact cgcgagcaga tccagggctg ggtcgccaac cgcttttact 180 atcaggtgaa catcccgctc aaggacgccg cgatcctggc caactgcccg gaccgcgaaa 240 tccgtcgcga gtggattcaa cgcctgttgg accatgacgg cgcccccggt gaagacggcg 300 gtatcgaagc ctggttgcgt cttgggcaag cggtcggcct cgacccggat cagttgcgct 360 cccaggaact ggtgctgccc ggcgtgcgtt tcgccgtgga tgcctacgtc aacttcgccc 420 gccgggcccg ttggcaggaa gccgccagca gctcattgac cgagctgttt gcgccgcaga 480 tccaccaatc gcgcctcgac agttggccgc agcattaccc gtggatcgac ccggccggtt 540 acgaatattt ccgtacgcgc ctgggccagg ctcgccggga tgtggagcac ggtctggcaa 600 tcacgttgca gcactacacc acgcgggaag gccaggagcg catgctggaa attctccagt 660 tcaaactgga cattctttgg agcatgctcg acgccatgag catggcctac gaactgaacc 720 gcccgccgta ccacagcgtg accgaacagc gggtctggca taaaggaatc accttatgaa 780 cccagctttc ttgtacaaag t 801 <210> 105 <211> 250 <212> PRT <213> Pseudomonas fluorescens <400> 105 Met Thr Asp Thr Pro Met Ser Pro Ala Glu Phe Glu Ala Ala Leu Arg 1 5 10 15 Ala Lys Gly Ala Tyr Tyr His Ile Tyr His Pro Tyr His Val Ala Met 20 25 30 Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala Asn 35 40 45 Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile Leu 50 55 60 Ala Asn Cys Pro Asp Arg Glu Ile Arg Arg Glu Trp Ile Gln Arg Leu 65 70 75 80 Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg Ser 100 105 110 Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Arg Trp Gln Glu Ala Ala Ser Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser Trp 145 150 155 160 Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe Arg 165 170 175 Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala Ile 180 185 190 Thr Leu Gln His Tyr Thr Thr Arg Glu Gly Gln Glu Arg Met Leu Glu 195 200 205 Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr Glu 225 230 235 240 Gln Arg Val Trp His Lys Gly Ile Thr Leu 245 250 <210> 106 <211> 753 <212> DNA <213> Pseudomonas fluorescens <400> 106 atgaccgaca ccccgctgtc ccccgccgaa ttcgaagcgg ccctgcgcgc caagggcgcc 60 tattaccaca ttcatcaccc gtatcacgtg gcgatgtatg aaggccgggc cacccgtgag 120 cagatacagg gctgggtcgc caaccgcttc tactatcagg tgaacatccc cctgaaagac 180 gcggcgatcc tcgccaactg cccggatcgc gagatccgtc gcgagtggat tcagcgcctg 240 ctcgaccacg acggcgcgcc cggtgaagat ggcggcatcg aagcctggct gcgcctcggc 300 caggccgtcg gtctcgatcc ggatcaattg cgctcccagg aactggtgct gcccggcgtg 360 cgtttcgccg tcgacgccta cgtcaacttc gcccgccgcg ccagttggca ggaagccgcc 420 agcagctcgc tgaccgagct gttcgcgccg cagatccacc agtcgcgcct cgacagctgg 480 ccgcagcatt acccgtggat cgacccggcc ggctacgaat atttccgcac ccgtctcggc 540 caggcccggc gcgatgtcga gcatggtctg gcgatcacgc tggagcacta caagacccgc 600 gaaggccagg aacgcatgct ggaaattctc cagttcaaac tggacatcct ttggagcatg 660 ctcgatgcca tgagcatggc ctacgaactg aaccgcccgc cgtatcacag cgtcaccgat 720 caacgggtct ggcataaagg aatcgcctta tga 753 <210> 107 <211> 250 <212> PRT <213> Pseudomonas fluorescens <400> 107 Met Thr Asp Thr Pro Leu Ser Pro Ala Glu Phe Glu Ala Ala Leu Arg 1 5 10 15 Ala Lys Gly Ala Tyr Tyr His Ile His His Pro Tyr His Val Ala Met 20 25 30 Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala Asn 35 40 45 Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile Leu 50 55 60 Ala Asn Cys Pro Asp Arg Glu Ile Arg Arg Glu Trp Ile Gln Arg Leu 65 70 75 80 Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg Ser 100 105 110 Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser Trp 145 150 155 160 Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe Arg 165 170 175 Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala Ile 180 185 190 Thr Leu Glu His Tyr Lys Thr Arg Glu Gly Gln Glu Arg Met Leu Glu 195 200 205 Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr Asp 225 230 235 240 Gln Arg Val Trp His Lys Gly Ile Ala Leu 245 250 <210> 108 <211> 753 <212> DNA <213> Pseudomonas fluorescens <400> 108 atgaccgaca ccccgctgtc cgccgccgaa ttcgagcagg cactgcgcgc caaaggcgcc 60 tactaccaca tccatcaccc ttatcacgtg gcgatgtatg aaggccgggc gacccgcgag 120 cagatccagg gctgggtcgc caaccggttc tattaccagg tgaacatccc catgaaggac 180 gcggcgatcc tcgccaactg tccggaccgg gagattcgcc gcgaatggat ccagcgcctg 240 ctggaccatg acggcgcccc gggcgaggac ggcggcatcg aggcctggct gcgcctgggc 300 caggccgtgg gcctggaccc ggaccagttg cgctcccagg aactggtgct gcccggtgtg 360 cgctttgccg tggacgccta tgtcaatttt gctcgccggg ccagttggca ggaggcggcc 420 agcagctcgc tgaccgaact gttcgcgccg caaatccacc agtcgcgcct ggacagctgg 480 ccccagcatt acccatggat cgaccccact ggctacgagt acttccgcac ccgcctgggc 540 caggcccgcc gtgatgtcga gcacggcctg gcgatcaccc tgcagcacta caccacccgt 600 gccggccagg aacgcatgct ggaaattctc cagttcaaac tggacatcct ttggagcatg 660 ctcgacgcca tgagcatggc ctatgaactg aaccgcccgc cctatcacag cgtcaccgat 720 cagcgggtct ggcataaggg gatcacccta tga 753 <210> 109 <211> 250 <212> PRT <213> Pseudomonas fluorescens <400> 109 Met Thr Asp Thr Pro Leu Ser Ala Ala Glu Phe Glu Gln Ala Leu Arg 1 5 10 15 Ala Lys Gly Ala Tyr Tyr His Ile His His Pro Tyr His Val Ala Met 20 25 30 Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala Asn 35 40 45 Arg Phe Tyr Tyr Gln Val Asn Ile Pro Met Lys Asp Ala Ala Ile Leu 50 55 60 Ala Asn Cys Pro Asp Arg Glu Ile Arg Arg Glu Trp Ile Gln Arg Leu 65 70 75 80 Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg Ser 100 105 110 Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser Trp 145 150 155 160 Pro Gln His Tyr Pro Trp Ile Asp Pro Thr Gly Tyr Glu Tyr Phe Arg 165 170 175 Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala Ile 180 185 190 Thr Leu Gln His Tyr Thr Thr Arg Ala Gly Gln Glu Arg Met Leu Glu 195 200 205 Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr Asp 225 230 235 240 Gln Arg Val Trp His Lys Gly Ile Thr Leu 245 250 <210> 110 <211> 756 <212> DNA <213> Pseudomonas syringae <400> 110 atgagcgaag cgactgcgct gtcccccgcc gaattcgaac aggccttgcg cgccaagggt 60 gcctattacc acatctatca cccgttccat gtggcgatgt acgagggccg agcgacccgc 120 gagcagattc agggctgggt cgccaaccgt ttctactatc aggtgaacat tccgctcaag 180 gacgcggcga ttctggccaa ctgcccggat cgcgagatcc gtcgcgagtg gattcagcgc 240 ctgctcgatc atgacggtgc gcccggcgaa gacggcggca tcgaagcctg gctgcgcctc 300 ggccaggccg tgggactgga cccggaccag ctgcgctcgc aggaactggt gctgccaggc 360 gtgcgctttg ccgtcgacgc ctacgtgaac ttcgcccgcc gcgccaactg gcaggaagca 420 gccagcagct cgctgaccga actgttcgcc ccgcagatcc accagtcgcg tctggacagc 480 tggccgcagc actacccatg gatcgacccg gcaggctatg agtatttccg cactcgcctg 540 ggtcaggccc gacgcgatgt agagcacggc ctcgccatca cgttacagca ctacactacg 600 tacgaaggtc agcagcgtat gctggaaatc ctgcagttca aactcgatat cctgtggagc 660 atgctcgatg cgatgtccat ggcctacgag ctgaaccgcc cgccgtatca cagcgtcaca 720 gaccaaaggg tctggcataa ggggattacc ctatga 756 <210> 111 <211> 251 <212> PRT <213> Pseudomonas syringae <400> 111 Met Ser Glu Ala Thr Ala Leu Ser Pro Ala Glu Phe Glu Gln Ala Leu 1 5 10 15 Arg Ala Lys Gly Ala Tyr Tyr His Ile Tyr His Pro Phe His Val Ala 20 25 30 Met Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Asp Arg Glu Ile Arg Arg Glu Trp Ile Gln Arg 65 70 75 80 Leu Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg 100 105 110 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Asn Trp Gln Glu Ala Ala Ser Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe 165 170 175 Arg Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala 180 185 190 Ile Thr Leu Gln His Tyr Thr Thr Tyr Glu Gly Gln Gln Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr 225 230 235 240 Asp Gln Arg Val Trp His Lys Gly Ile Thr Leu 245 250 <210> 112 <211> 756 <212> DNA <213> Pseudomonas syringae <400> 112 atgagcgaag cgactgcgct gtcccccgcc gaattcgaac aggccttgcg cgccaagggt 60 gcctattacc acatctatca cccgtaccat gtggcgatgt acgagggtcg tgcaacccgc 120 gagcagattc agggctgggt cgccaaccgt ttctactatc aggtgaacat tccgctcaag 180 gacgcggcga ttctggccaa ctgcccggat cgcgagatcc gtcgcgagtg gattcagcgc 240 ctgctcgatc atgacggtgc gcccggcgaa gacggcggca ttgaagcctg gctgcgcctc 300 ggccaggccg tggggctcga cccggaccaa ctgcgctctc aggaactggt gctgccaggc 360 gtgcgttttg ccgtcgacgc ctacgtgaac ttcgcccgcc gcgccaactg gcaggaagcg 420 gccagcagct cgctgaccga actgttcgcg ccgcagatcc accaatcgcg cctggacagc 480 tggccgcagc attacccgtg gatcgacccg gcaggctacg agtatttccg cactcgcctg 540 ggccaggccc gacgcgacgt ggaacacggc ctcgccatca cgttacagca ctacactaca 600 tatgaaggcc agcagcgcat gctggaaatc ctgcagttca agctcgatat cctgtggagc 660 atgctcgatg cgatgtccat ggcctacgag ctgaaccgcc cgccgtatca cagcgttaca 720 gaccaaaagg tctggcataa ggggattacg ctatga 756 <210> 113 <211> 251 <212> PRT <213> Pseudomonas syringae <400> 113 Met Ser Glu Ala Thr Ala Leu Ser Pro Ala Glu Phe Glu Gln Ala Leu 1 5 10 15 Arg Ala Lys Gly Ala Tyr Tyr His Ile Tyr His Pro Tyr His Val Ala 20 25 30 Met Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Asp Arg Glu Ile Arg Arg Glu Trp Ile Gln Arg 65 70 75 80 Leu Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg 100 105 110 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Asn Trp Gln Glu Ala Ala Ser Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe 165 170 175 Arg Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala 180 185 190 Ile Thr Leu Gln His Tyr Thr Thr Tyr Glu Gly Gln Gln Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr 225 230 235 240 Asp Gln Lys Val Trp His Lys Gly Ile Thr Leu 245 250 <210> 114 <211> 756 <212> DNA <213> Pseudomonas putida <400> 114 tcatagggtg attcccttgt gccacacccg ttcctgggtg acggagtgat agggcgggcg 60 gttcagttcg taggccatgc tcatggcatc gagcatactc cagaggatat ccagcttgaa 120 ctgcagtatc tccagcatac gctcctggcc cgcacgggtg gtgtagtgct gcagggtaat 180 cgccaggccg tgttccacat cgcgtcgcgc ctggcccagg cgggtacgga aatactcata 240 gccggcgggg tcgatccacg ggtagtgctg cggccagctg tccaggcgtg actggtggat 300 ttgcggggcg aacagctcgg tcagcgaact gctggcggct tcctgccagc tggcgcggcg 360 ggcaaagttg acgtaggcgt ccacggcaaa gcgcacgcca ggcaatacca gttcttgcga 420 gcgcaattgg tccgggtcca gcccgacagc ctggcccagg cgcagccagg cttcgatgcc 480 gccatcctcg ccgggcgcac cgtcgtggtc gagcaggcgc tggatccact cgcggcgcac 540 ttcgcggtcc gggcagttgg ccaggatcgc ggcatccttc atcgggatgt tgacctggta 600 gtagaagcgg ttggccaccc agccctggat ctgctcgcgg gtggcgcgcc cctggtacat 660 cgccacgtgg tacgggtgat ggatgtggta ataggcgccc ttggcgcgca gggcctgctc 720 gaactcggca ggggacattg gcagtgcgtc gctcat 756 <210> 115 <211> 251 <212> PRT <213> Pseudomonas putida <400> 115 Met Ser Asp Ala Leu Pro Met Ser Pro Ala Glu Phe Glu Gln Ala Leu 1 5 10 15 Arg Ala Lys Gly Ala Tyr Tyr His Ile His His Pro Tyr His Val Ala 20 25 30 Met Tyr Gln Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Met Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp Ile Gln Arg 65 70 75 80 Leu Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg 100 105 110 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe 165 170 175 Arg Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala 180 185 190 Ile Thr Leu Gln His Tyr Thr Thr Arg Ala Gly Gln Glu Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr 225 230 235 240 Gln Glu Arg Val Trp His Lys Gly Ile Thr Leu 245 250 <210> 116 <211> 756 <212> DNA <213> Pseudomonas putida <400> 116 atgagcgacg cactgcccat gtcccctgcc gaattcgagc aggctctgcg cgccaaaggc 60 gcctattacc acatccatca cccgtaccat gtggcgatgt accaaggccg cgccacccgc 120 gagcagatcc agggctgggt ggccaaccgt ttctactacc aggtcaacat cccgatgaag 180 gatgccgcga tcctggccaa ctgcccggac cgcgaagtgc gccgagagtg gatccagcgc 240 ctgctcgacc acgacggcgc acccggcgag gacggtggca tcgaagcctg gctgcgcctg 300 ggccaggccg tcggcctcga ccccgaccag ctgcgctccc aggagctggt actgcccggc 360 gtacgctttg ccgtggacgc ctacgtcaac ttcgcccgcc gcgccagctg gcaggaagcc 420 gccagcagct cgctgaccga actgtttgcc ccacaaatcc accagtcgcg gctggacagt 480 tggccacagc actacccgtg gatcgacccg gccggctacg agtacttccg cacccgcctt 540 ggccaggccc ggcgcgacgt ggagcacggc ctggcgatta ccctgcagca ctacaccacc 600 cgcgcgggcc aggagcgtat gctggagatc ctgcagttca agctggatat cctctggagc 660 atgctcgacg ccatgagcat ggcctacgag ctgaaccgcc cgccttatca ctccgtcacc 720 caggaccggg tgtggcacaa ggggatcacc ctatga 756 <210> 117 <211> 251 <212> PRT <213> Pseudomonas putida <400> 117 Met Ser Asp Ala Leu Pro Met Ser Pro Ala Glu Phe Glu Gln Ala Leu 1 5 10 15 Arg Ala Lys Gly Ala Tyr Tyr His Ile His His Pro Tyr His Val Ala 20 25 30 Met Tyr Gln Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Met Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp Ile Gln Arg 65 70 75 80 Leu Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg 100 105 110 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe 165 170 175 Arg Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala 180 185 190 Ile Thr Leu Gln His Tyr Thr Thr Arg Ala Gly Gln Glu Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr 225 230 235 240 Gln Asp Arg Val Trp His Lys Gly Ile Thr Leu 245 250 <210> 118 <211> 756 <212> DNA <213> Pseudomonas putida <400> 118 atgagcgacg cactgcccat gtcccctgcc gaattcgagc aggctctgcg cgccaaaggc 60 gcctattacc acatccatca cccgtaccat gtggcgatgt accaaggccg cgccacccgc 120 gagcagatcc agggctgggt ggccaaccgt ttctactacc aggtcaacat cccgatgaag 180 gatgccgcga tcctggccaa ctgcccggac cgcgaagtgc gccgagagtg gatccagcgc 240 ctgctcgacc acgacggcgc acccggcgag gacggtggca tcgaagcctg gctgcgcctg 300 ggccaggccg tcggcctcga ccccgaccag ctgcgctccc aggagctggt actgcccggc 360 gtacgctttg ccgtggacgc ctacgtcaac ttcgcccgcc gcgccagctg gcaggaagcc 420 gccagcagct cgctgaccga actgtttgcc ccacaaatcc accagtcgcg gctggacagt 480 tggccacagc actacccgtg gatcgacccg gccggctacg agtacttccg cacccgcctt 540 ggccaggccc ggcgcgacgt ggagcacggc ctggcgatta ccctgcagca ctacaccacc 600 cgcgcgggcc aggagcgtat gctggagatc ctgcagttca agctggatat cctctggagc 660 atgctcgacg ccatgagcat ggcctacgag ctgaaccgcc cgccttatca ctccgtcacc 720 caggaccggg tgtggcacaa ggggatcacc ctatga 756 <210> 119 <211> 251 <212> PRT <213> Pseudomonas putida <400> 119 Met Ser Asp Ala Leu Pro Met Ser Pro Ala Glu Phe Glu Gln Ala Leu 1 5 10 15 Arg Ala Lys Gly Ala Tyr Tyr His Ile His His Pro Tyr His Val Ala 20 25 30 Met Tyr Gln Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Met Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp Ile Gln Arg 65 70 75 80 Leu Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg 100 105 110 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe 165 170 175 Arg Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala 180 185 190 Ile Thr Leu Gln His Tyr Thr Thr Arg Ala Gly Gln Glu Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr 225 230 235 240 Gln Glu Arg Met Trp His Lys Gly Ile Thr Leu 245 250 <210> 120 <211> 756 <212> DNA <213> Pseudomonas syringae <400> 120 tcatggcgta atccccttat gccagacctt ctggtctgtg acgctgtggt acggggggcg 60 gttcaattca tacgccatgg acatggcatc gagcatgctc cacagaatgt cgagtttgaa 120 ctgcaggatt tccagcatgc gctgctggcc ttcatacgta gtgtagtgct gtaacgtgat 180 tgcgaggccg tgttccacat cgcgacgtgc ctgacccagg cgagtacgga aatactcgta 240 acctgtgggg tcaatccacg ggtaatgctg tggccagctg tccaggcgcg attgatgaat 300 ctgcggtgcg aacaactcgg tcagcgagct gctggcggcc tcttgccagt tggcgcggcg 360 ggcgaagttc acgtaggcat cgaccgcaaa gcgcacaccg ggcagtacca gttcctgcga 420 gcgcaactga tccgggtcca gccccacggc ctcgccgagg cgcagccagg cttcgatgcc 480 gccgtcttca ccgggcgcgc cgtcgtggtc cagcaggcgc tgaatccact cgcgacgaat 540 ctcgcgatcc gggcaattgg ccagaatggc ggcgtccttg agcgggatgt tcacctgata 600 gtaaaagcgg ttggcgaccc agccctgaat ctgctcgcgg gtcgcgcggc cttcatacat 660 cgccacatga aacggatgat agatgtggta ataggcgccc ttggcacgta aggcctgctc 720 gaattcagcc ggggacagcg cagtcgcttc actcat 756 <210> 121 <211> 251 <212> PRT <213> Pseudomonas syringae <400> 121 Met Ser Glu Ala Thr Ala Leu Ser Pro Ala Glu Phe Glu Gln Ala Leu 1 5 10 15 Arg Ala Lys Gly Ala Tyr Tyr His Ile Tyr His Pro Phe His Val Ala 20 25 30 Met Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Asp Arg Glu Ile Arg Arg Glu Trp Ile Gln Arg 65 70 75 80 Leu Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Glu Ala Val Gly Leu Asp Pro Asp Gln Leu Arg 100 105 110 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Asn Trp Gln Glu Ala Ala Ser Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Asp Pro Thr Gly Tyr Glu Tyr Phe 165 170 175 Arg Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala 180 185 190 Ile Thr Leu Gln His Tyr Thr Thr Tyr Glu Gly Gln Gln Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr 225 230 235 240 Asp Gln Lys Val Trp His Lys Gly Ile Thr Pro 245 250 <210> 122 <211> 756 <212> DNA <213> Pseudomonas entomophila <400> 122 tcataaggcg attcccttgt gccagacccg ctcgcttgtg acgctgtgat agggcgggcg 60 gttcaattcg taggccatgc tcatggcatc gagcatgctc cagaggatat ccagcttgaa 120 ctgcaggatc tccagcatgc gcgcctggcc ctcgcgggtg gtgtagtgcg ccagggtgat 180 cgccaggcca tgctcgacat cacggcgggc ctggcccagg cgggtgcgga agtattcgta 240 gccggccggg tcgatccacg ggtagtgctg cggccagctg tccaggcgcg actggtggat 300 ctgcggggcg aacagctcgg tcagcgagct gctggcggcc tcctgccagc tggcgcggcg 360 ggcgaagttg acgtaggcgt cgacggcgaa gcgcacgccg ggcagcacca gctcctggct 420 gcgcagttgg tccgggtcca ggcccacggc ctggccgaga cgcagccagg cttcgatgcc 480 gccgtcctcg cccggcgcgc cgtcatggtc gagcaggcgc tggacccact cgcggcgcac 540 ctcgcggtcc gggcagttgg ccaggatcgc ggcatccttc atggggatgt tcacctggta 600 gtagaagcgg ttggccaccc agccctggat ctgctcgcgg gtggcgcggc cttcatacat 660 cgccacgtgg taggggtggt ggatgtggta gaaggcgccc ttggcgcgca gggcctgctc 720 gaactcggca ggtgacatcg gtgcggcgtc attcat 756 <210> 123 <211> 251 <212> PRT <213> Pseudomonas entomophila <400> 123 Met Asn Asp Ala Ala Pro Met Ser Pro Ala Glu Phe Glu Gln Ala Leu 1 5 10 15 Arg Ala Lys Gly Ala Phe Tyr His Ile His His Pro Tyr His Val Ala 20 25 30 Met Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Met Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp Val Gln Arg 65 70 75 80 Leu Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg 100 105 110 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe 165 170 175 Arg Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Ala 180 185 190 Ile Thr Leu Ala His Tyr Thr Thr Arg Glu Gly Gln Ala Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Ser Met Ala Tyr Glu Leu Asn Arg Pro Pro Tyr His Ser Val Thr 225 230 235 240 Ser Glu Arg Val Trp His Lys Gly Ile Ala Leu 245 250 <210> 124 <211> 756 <212> DNA <213> Pseudomonas putida <400> 124 atgagcgagg cactgccact gtcgcctgcc gaattcgagc aggccctgcg cgccaagggc 60 gcctactacc acattcatca cccctaccac gtggcgatgt acgaagggcg cgccacccgc 120 gaacagattc agggctgggt ggccaaccgc ttctattacc aggtgaacat cccgatgaag 180 gatgccgcga tcctggccaa ctgcccggac cgcgaagtgc gccgtgagtg gatccagcgc 240 ctgctcgacc acgacggagc cccgggcgaa gacggtggta tcgaagcctg gctgcgcctg 300 ggccaggccg tggggctcga cccggaccag ctgcgttccc aggagctggt gctgccaggt 360 gtacgcttcg ccgtcgatgc ctacgtgaac ttcgcccgcc gtgccagctg gcaggaagcg 420 gccagcagct cgctgaccga actgttcgcc ccgcagatcc accagtcgcg cctggacagc 480 tggccgcaac actatccgtg gatcgatcct gccggctacg agtacttccg cacccgcctg 540 ggccaggccc ggcgcgatgt cgaacacggt ctgacgatca cattgcagca ctacaccacc 600 cgggcggccc aggagcgtat gctggaaatc ctgcagttca agctggatat cctctggagc 660 atgctcgatg ccatgagcat ggcctacgag ctgcaccgcc cgccgtatca caccgtcacc 720 cagcaacggg tatggcacaa ggggattgcc ctatga 756 <210> 125 <211> 251 <212> PRT <213> Pseudomonas putida <400> 125 Met Ser Glu Ala Leu Pro Leu Ser Pro Ala Glu Phe Glu Gln Ala Leu 1 5 10 15 Arg Ala Lys Gly Ala Tyr Tyr His Ile His His Pro Tyr His Val Ala 20 25 30 Met Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Met Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp Ile Gln Arg 65 70 75 80 Leu Leu Asp His Asp Gly Ala Pro Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Gln Ala Val Gly Leu Asp Pro Asp Gln Leu Arg 100 105 110 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Asp Pro Ala Gly Tyr Glu Tyr Phe 165 170 175 Arg Thr Arg Leu Gly Gln Ala Arg Arg Asp Val Glu His Gly Leu Thr 180 185 190 Ile Thr Leu Gln His Tyr Thr Thr Arg Ala Ala Gln Glu Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Ser Met Ala Tyr Glu Leu His Arg Pro Pro Tyr His Thr Val Thr 225 230 235 240 Gln Gln Arg Val Trp His Lys Gly Ile Ala Leu 245 250 <210> 126 <211> 753 <212> DNA <213> Pseudomonas mendocina <400> 126 atgagccaag ctgccatgac acctgccgag ttcgagcagg cgctgcgcgc caagggcgcg 60 ctgtaccaca tccatcatcc gtttcatcgc gccatgtacg aagggcgcgc cacccgcgag 120 cagattcagg gctgggtggc caaccgcttc tactatcagg tcaatattcc gctcaaggat 180 gcggcgatcc tcgccaactg tccggatcgc gaaactcggc gcgagtggat tcagcgcatc 240 ctcgaccatg acggtgcacc gggtgaggag ggcggtatcg aagcctggct gcgcctggcc 300 gagtcggtcg gcctcgaccg cgagcaggtg ctgtcgcagg agctggtgct gcccggcgtg 360 cgcttcgccg tcgacgccta cgtcaacttc gcccgccgcg ccagctggca ggaagcggcc 420 agcagctcgc tgaccgagct gttcgcgccg accatccacc agtcgcgcct ggacgcctgg 480 ccgcagcact acccgtggat cgatgcggcc ggttacgact acttccgcaa tcgtctgagc 540 caggcgcggc gcgacgtcga gcatggcctg cgcatcaccc tggagcacta ccgcacccgt 600 gatgcgcagg agcacatgct gaacatcctg cagttcaagc tggacgtgct gtggagcatg 660 ctcgacgcca tgagcatggc ctacgagctg gagcgcccgc cgtatcacac ggtgacggcc 720 gagcgtgtct ggcataaggg aatcgacctg tga 753 <210> 127 <211> 250 <212> PRT <213> Pseudomonas mendocina <400> 127 Met Ser Gln Ala Ala Met Thr Pro Ala Glu Phe Glu Gln Ala Leu Arg 1 5 10 15 Ala Lys Gly Ala Leu Tyr His Ile His His Pro Phe His Arg Ala Met 20 25 30 Tyr Glu Gly Arg Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala Asn 35 40 45 Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile Leu 50 55 60 Ala Asn Cys Pro Asp Arg Glu Thr Arg Arg Glu Trp Ile Gln Arg Ile 65 70 75 80 Leu Asp His Asp Gly Ala Pro Gly Glu Glu Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Ala Glu Ser Val Gly Leu Asp Arg Glu Gln Val Leu Ser 100 105 110 Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Thr Ile His Gln Ser Arg Leu Asp Ala Trp 145 150 155 160 Pro Gln His Tyr Pro Trp Ile Asp Ala Ala Gly Tyr Asp Tyr Phe Arg 165 170 175 Asn Arg Leu Ser Gln Ala Arg Arg Asp Val Glu His Gly Leu Arg Ile 180 185 190 Thr Leu Glu His Tyr Arg Thr Arg Asp Ala Gln Glu His Met Leu Asn 195 200 205 Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Ser Met Ala Tyr Glu Leu Glu Arg Pro Pro Tyr His Thr Val Thr Ala 225 230 235 240 Glu Arg Val Trp His Lys Gly Ile Asp Leu 245 250 <210> 128 <211> 813 <212> DNA <213> Pseudomonas aeruginosa <400> 128 tcatggcgcc agcccccggt gccagacccg ctcacgggtc accgtatggt acggcggacg 60 ttccagctcg taggccatgc tcatcgcgtc gagcatgctc cacagcacgt ccagcttgaa 120 ttgcaggatc tccagcatgc gttcctgtgc ctcgcgggtc cgatagtgct ccagggtgat 180 ccgcaggccg tgctcgacgt cacgccgggc ctgggccagg cggctgcgga aatactcgta 240 gccggccgcc tcgatccacg gatagtggcg cggccagctg tccagccgcg actggtggat 300 ctgcggggcg aagagttcgg tcagcgaact gctcgccgcc tcctgccagc tggcgcgacg 360 ggcgaagttg acataggcgt cgacggcgaa gcgcacgccg ggcagcaccc gttcttcgga 420 cagcacctgc tcgcgctcca ggcccaccgc ctccgccagg cgcagccagg cctcgatgcc 480 tcccgcctcg ccgggggcgc cgtcgtggtc gaggatgcgc tggacccact cgcggcggac 540 ctcgcggtcg ggacagttgg ccaggatcgc cgcgtccttc agcgggatgt tgagctggta 600 gtagaagcgg ttcgccaccc agccctggat ctgttcgcga ctggcacggc cctcgtacat 660 cgcgacatgg aacggatggt ggatatggta gtagcgcccc ttgtcgcgca gcgcccgttc 720 gaactcggcg cggtccatgg cggcacggct catgtcggtc cccctacagc tggatgtgca 780 tgccatccca ggccacttcg atgccactgg cat 813 <210> 129 <211> 270 <212> PRT <213> Pseudomonas aeruginosa <400> 129 Met Pro Val Ala Ser Lys Trp Pro Gly Met Ala Cys Thr Ser Ser Cys 1 5 10 15 Arg Gly Thr Asp Met Ser Arg Ala Ala Met Asp Arg Ala Glu Phe Glu 20 25 30 Arg Ala Leu Arg Asp Lys Gly Arg Tyr Tyr His Ile His His Pro Phe 35 40 45 His Val Ala Met Tyr Glu Gly Arg Ala Ser Arg Glu Gln Ile Gln Gly 50 55 60 Trp Val Ala Asn Arg Phe Tyr Tyr Gln Leu Asn Ile Pro Leu Lys Asp 65 70 75 80 Ala Ala Ile Leu Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp 85 90 95 Val Gln Arg Ile Leu Asp His Asp Gly Ala Pro Gly Glu Ala Gly Gly 100 105 110 Ile Glu Ala Trp Leu Arg Leu Ala Glu Ala Val Gly Leu Glu Arg Glu 115 120 125 Gln Val Leu Ser Glu Glu Arg Val Leu Pro Gly Val Arg Phe Ala Val 130 135 140 Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala 145 150 155 160 Ser Ser Ser Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg 165 170 175 Leu Asp Ser Trp Pro Arg His Tyr Pro Trp Ile Glu Ala Ala Gly Tyr 180 185 190 Glu Tyr Phe Arg Ser Arg Leu Ala Gln Ala Arg Arg Asp Val Glu His 195 200 205 Gly Leu Arg Ile Thr Leu Glu His Tyr Arg Thr Arg Glu Ala Gln Glu 210 215 220 Arg Met Leu Glu Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser Met 225 230 235 240 Leu Asp Ala Met Ser Met Ala Tyr Glu Leu Glu Arg Pro Pro Tyr His 245 250 255 Thr Val Thr Arg Glu Arg Val Trp His Arg Gly Leu Ala Pro 260 265 270 <210> 130 <211> 753 <212> DNA <213> Pseudomonas aeruginosa <400> 130 atgagccgtg ccgccatgga tcgcgccgaa ttcgaacggg cgctgcgcga caagggacgc 60 tactaccata tccaccatcc gttccatgtc gcgatgtacg agggccgtgc cagtcgcgaa 120 cagatccagg gctgggtggc gaaccgtttc tactaccagg tcaacatccc gctgaaggac 180 gcggcgatcc tggccaactg tcccgaccgc gaggtccgcc gcgagtggat ccagcgtatc 240 ctcgaccacg acggcgcccc cggcgaggcg ggcggcatcg aggcctggct gcgtctggcg 300 gaagcggtgg gcctggagcg cgagcaggtg ctgtccgagg agcgggtgct gcccggcgtg 360 cgcttcgccg tcgacgccta cgtcaacttc gcccgtcgcg ccagttggca ggaggcggcg 420 agcagttcgc tgaccgaact cttcgccccg cagatccacc agtcgcggct ggacagctgg 480 ccgcgccact atccgtggat cgaggcggcc ggctacgagt atttccgcag tcgcctggcc 540 caggcccggc gcgacgtcga gcacggcctg cggatcaccc tggagcacta tcggacccgc 600 gaggcacagg aacgcatgct ggatatcctg caattcaagc tggacgtgtt gtggagcatg 660 ctcgacgcga tgagcatggc ctacgaactc gaacgcccgc cgtaccacac ggtgacccgc 720 gagcgggtct ggcatcgggg gctggcatca tga 753 <210> 131 <211> 250 <212> PRT <213> Pseudomonas aeruginosa <400> 131 Met Ser Arg Ala Ala Met Asp Arg Ala Glu Phe Glu Arg Ala Leu Arg 1 5 10 15 Asp Lys Gly Arg Tyr Tyr His Ile His His Pro Phe His Val Ala Met 20 25 30 Tyr Glu Gly Arg Ala Ser Arg Glu Gln Ile Gln Gly Trp Val Ala Asn 35 40 45 Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile Leu 50 55 60 Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp Ile Gln Arg Ile 65 70 75 80 Leu Asp His Asp Gly Ala Pro Gly Glu Ala Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Ala Glu Ala Val Gly Leu Glu Arg Glu Gln Val Leu Ser 100 105 110 Glu Glu Arg Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser Trp 145 150 155 160 Pro Arg His Tyr Pro Trp Ile Glu Ala Ala Gly Tyr Glu Tyr Phe Arg 165 170 175 Ser Arg Leu Ala Gln Ala Arg Arg Asp Val Glu His Gly Leu Arg Ile 180 185 190 Thr Leu Glu His Tyr Arg Thr Arg Glu Ala Gln Glu Arg Met Leu Asp 195 200 205 Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Ser Met Ala Tyr Glu Leu Glu Arg Pro Pro Tyr His Thr Val Thr Arg 225 230 235 240 Glu Arg Val Trp His Arg Gly Leu Ala Ser 245 250 <210> 132 <211> 753 <212> DNA <213> Pseudomonas aeruginosa <400> 132 tcatggcgcc agcccccggt gccagacccg ctcacgggtc accgtatggt acggcggacg 60 ttccagctcg taggccatgc tcatcgcgtc gagcatgctc cacagcacgt ccagcttgaa 120 ttgcaggatc tccagcatgc gttcctgtgc ctcgcgggtc cgatagtgct ccagggtgat 180 ccgcaggccg tgctcgacgt cacgccgggc ctgggccagg cggctgcgga aatactcgta 240 gccggccgcc tcgatccacg gatagtggcg cggccagctg tccagccgcg actggtggat 300 ctgcggggcg aagagttcgg tcagcgaact gctcgccgcc tcctgccagc tggcgcgacg 360 ggcgaagttg acataggcgt cgacggcgaa gcgcacgccg ggcagcaccc gttcttcgga 420 cagcacctgc tcgcgctcca ggcccaccgc ctccgccagg cgcagccagg cctcgatgcc 480 tcccgcctcg ccgggggcgc cgtcgtggtc gaggatgcgc tggacccact cgcggcggac 540 ctcgcggtcg ggacagttgg ccaggatcgc cgcgtccttc agcgggatgt tgagctggta 600 gtagaagcgg ttcgccaccc agccctggat ctgttcgcga ctggcacggc cctcgtacat 660 cgcgacatgg aacggatggt ggatatggta gtagcgcccc ttgtcgcgca gcgcccgttc 720 gaactcggcg cggtccatgg cggcacggct cat 753 <210> 133 <211> 250 <212> PRT <213> Pseudomonas aeruginosa <400> 133 Met Ser Arg Ala Ala Met Asp Arg Ala Glu Phe Glu Arg Ala Leu Arg 1 5 10 15 Asp Lys Gly Arg Tyr Tyr His Ile His His Pro Phe His Val Ala Met 20 25 30 Tyr Glu Gly Arg Ala Ser Arg Glu Gln Ile Gln Gly Trp Val Ala Asn 35 40 45 Arg Phe Tyr Tyr Gln Leu Asn Ile Pro Leu Lys Asp Ala Ala Ile Leu 50 55 60 Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp Val Gln Arg Ile 65 70 75 80 Leu Asp His Asp Gly Ala Pro Gly Glu Ala Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Ala Glu Ala Val Gly Leu Glu Arg Glu Gln Val Leu Ser 100 105 110 Glu Glu Arg Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Ser Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser Trp 145 150 155 160 Pro Arg His Tyr Pro Trp Ile Glu Ala Ala Gly Tyr Glu Tyr Phe Arg 165 170 175 Ser Arg Leu Ala Gln Ala Arg Arg Asp Val Glu His Gly Leu Arg Ile 180 185 190 Thr Leu Glu His Tyr Arg Thr Arg Glu Ala Gln Glu Arg Met Leu Glu 195 200 205 Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Ser Met Ala Tyr Glu Leu Glu Arg Pro Pro Tyr His Thr Val Thr Arg 225 230 235 240 Glu Arg Val Trp His Arg Gly Leu Ala Pro 245 250 <210> 134 <211> 753 <212> DNA <213> Azotobacter vinelandii <400> 134 tcacagtatc gttccccggt gccagacccg ctcatgggtc accgtgtgat acggcggacg 60 gtccagttcg taggccatgc tcatggcgtc gagcatgctc cagaggatgt ccagcttgaa 120 ctgcaggatc tccagcatgc gggcctgggc ctcgcgggtg gcgaagtgcg cgagggtgat 180 gcgcaggccg tgctcgacgt cgcggcgcgc ttccttcagg cgcctgcgga agtagtcgta 240 gccgccggcc tcgatccagg ggtagtgccg cggccaggtg tccaggcgcg actggtggat 300 ggtcggggcg aacagttcgg tcagcgagct gccggccgcc tcctgccaac tggcgcggcg 360 ggcgaagttg acgtaggcgt ccaccgcgaa acgcaccccc ggcagcacca gttcctggga 420 cagcaattgc tcgcgatcga ggccgaccgc ctcgccgagg cgcagccagg cctcgatgcc 480 gccctcctcg ccggggccgc catcgtggtc gaggatgcgc tggacccact cgcggcggac 540 ttcgcggtcc gggcagttgg cgaggatcgc cgcgtccttc aggggaatgt tcacctggta 600 gtagaagcga ttggccaccc agccccggat ctgctcgcgg gtcgagcgac cctcgtacat 660 ggcgacctgg aatggatggt ggatgtggta gtaggcgccc ttggcgcgca acgcccgctc 720 gaattcggcg ggactcatgg ctgtctgggt cat 753 <210> 135 <211> 250 <212> PRT <213> Azotobacter vinelandii <400> 135 Met Thr Gln Thr Ala Met Ser Pro Ala Glu Phe Glu Arg Ala Leu Arg 1 5 10 15 Ala Lys Gly Ala Tyr Tyr His Ile His His Pro Phe Gln Val Ala Met 20 25 30 Tyr Glu Gly Arg Ser Thr Arg Glu Gln Ile Arg Gly Trp Val Ala Asn 35 40 45 Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile Leu 50 55 60 Ala Asn Cys Pro Asp Arg Glu Val Arg Arg Glu Trp Val Gln Arg Ile 65 70 75 80 Leu Asp His Asp Gly Gly Pro Gly Glu Glu Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Gly Glu Ala Val Gly Leu Asp Arg Glu Gln Leu Leu Ser 100 105 110 Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Gly Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Thr Ile His Gln Ser Arg Leu Asp Thr Trp 145 150 155 160 Pro Arg His Tyr Pro Trp Ile Glu Ala Gly Gly Tyr Asp Tyr Phe Arg 165 170 175 Arg Arg Leu Lys Glu Ala Arg Arg Asp Val Glu His Gly Leu Arg Ile 180 185 190 Thr Leu Ala His Phe Ala Thr Arg Glu Ala Gln Ala Arg Met Leu Glu 195 200 205 Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Ser Met Ala Tyr Glu Leu Asp Arg Pro Pro Tyr His Thr Val Thr His 225 230 235 240 Glu Arg Val Trp His Arg Gly Thr Ile Leu 245 250 <210> 136 <211> 756 <212> DNA <213> Kluyvera intermedia <400> 136 atgatcatca ctgaagcatt atcgcccgcc gcgtttgagc aggcgctgcg cgataaaggc 60 gcgttctacc acatacatca cccgtatcac attgccatgc acaatggcga ggcgacgcgc 120 gagcagattc agggctgggt ggcgaaccgc ttctattatc agaccaacat tccgctgaaa 180 gatgcggcga tcatggcgaa ttgcccggat gcggcgacgc ggcgtaaatg ggtgcagcgc 240 atcctcgatc acgacggcag caacggtcac gaaggcggga ttgaagcctg gctgcagttg 300 ggtgaggcgg tggggctgga acgtgacgtg ttgctgtcag agaagctggt gctgccgggc 360 gtgcgttttg cggtggacgc ctacgtgaac ttcgcgcgcc gtgctaactg gcaggaagcg 420 gcctgtagct cgctcaccga gctgtttgcg ccgcagattc atcagtcgcg tctcgacagc 480 tggccgcagc actatccgtg gatcaaagag gaaggctatt tctacttccg cagccgtttg 540 agccaggcga accgcgatgt ggagcatggg ctggcgctgg cgcttgaggt gtttacccgc 600 gccgaacagc agaaccgcat gctggagatc ctgcagttta aactcgatat tctctggacc 660 atgctcgatg ccatgaccat ggcgtatgcg ctgcaacgtc cgccttatca tacggtcacc 720 gatcaggtgt cctggcacag cacaagactg gtataa 756 <210> 137 <211> 251 <212> PRT <213> Kluyvera intermedia <400> 137 Met Ile Ile Thr Glu Ala Leu Ser Pro Ala Ala Phe Glu Gln Ala Leu 1 5 10 15 Arg Asp Lys Gly Ala Phe Tyr His Ile His His Pro Tyr His Ile Ala 20 25 30 Met His Asn Gly Glu Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Thr Asn Ile Pro Leu Lys Asp Ala Ala Ile 50 55 60 Met Ala Asn Cys Pro Asp Ala Ala Thr Arg Arg Lys Trp Val Gln Arg 65 70 75 80 Ile Leu Asp His Asp Gly Ser Asn Gly His Glu Gly Gly Ile Glu Ala 85 90 95 Trp Leu Gln Leu Gly Glu Ala Val Gly Leu Glu Arg Asp Val Leu Leu 100 105 110 Ser Glu Lys Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Asn Trp Gln Glu Ala Ala Cys Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Lys Glu Glu Gly Tyr Phe Tyr Phe 165 170 175 Arg Ser Arg Leu Ser Gln Ala Asn Arg Asp Val Glu His Gly Leu Ala 180 185 190 Leu Ala Leu Glu Val Phe Thr Arg Ala Glu Gln Gln Asn Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Thr Met Leu Asp Ala 210 215 220 Met Thr Met Ala Tyr Ala Leu Gln Arg Pro Pro Tyr His Thr Val Thr 225 230 235 240 Asp Gln Val Ser Trp His Ser Thr Arg Leu Val 245 250 <210> 138 <211> 771 <212> DNA <213> Oceanospirillum sp. <400> 138 tcactcatta aacagcccct tgtgaaatac cttttcaccc gtcactgtat ggtatggtgg 60 gcgctccagt tcataggcca ttgtcattgc atcaagcatg gtccaaagca catccaactt 120 aaactgaagt atttccagca ttctgtcttg ctgttcccgg gtagtgtaat gatccagcgt 180 aatttcaaga ccatgaacca catcacgacg cgcttcggta agccggttgc ggaagtactg 240 ataaccctct tctttgatcc atgggtaatg ctgaggccat gtatcaaggc gattctgatg 300 aatggttggc gcaaacagct cagtcaatga agagctggca gcttcttgcc aggtcgctct 360 gcgcgcaaaa ttgatataag catctacagc gaagcgaaca ccaggaagaa catgctcacc 420 tgataggatc tcttcgcggg ttagaccgac agcctcacca agacgaagcc atgcttcaat 480 accgccctcg gcaccatcat aaccatcatg atctaataca cgctgcaccc aatgacgacg 540 tacatcccgg tcagggcaat ttgccataat tgcagcatct ttcacgggga tgcttatctg 600 ataatagaaa cggtttgcga cccagcctcg aatctgttca ggagtagact ggccgttgta 660 cattgcaata tggtaagggt gttgagtgtg ataaagatcg cctttcgctc taagcgcttt 720 ttcaaacgct tcacgactca tgggtaattt atcgttggcc tgtgtattca t 771 <210> 139 <211> 256 <212> PRT <213> Oceanospirillum sp. <400> 139 Met Asn Thr Gln Ala Asn Asp Lys Leu Pro Met Ser Arg Glu Ala Phe 1 5 10 15 Glu Lys Ala Leu Arg Ala Lys Gly Asp Leu Tyr His Thr Gln His Pro 20 25 30 Tyr His Ile Ala Met Tyr Asn Gly Gln Ser Thr Pro Glu Gln Ile Arg 35 40 45 Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Ser Ile Pro Val Lys 50 55 60 Asp Ala Ala Ile Met Ala Asn Cys Pro Asp Arg Asp Val Arg Arg His 65 70 75 80 Trp Val Gln Arg Val Leu Asp His Asp Gly Tyr Asp Gly Ala Glu Gly 85 90 95 Gly Ile Glu Ala Trp Leu Arg Leu Gly Glu Ala Val Gly Leu Thr Arg 100 105 110 Glu Glu Ile Leu Ser Gly Glu His Val Leu Pro Gly Val Arg Phe Ala 115 120 125 Val Asp Ala Tyr Ile Asn Phe Ala Arg Arg Ala Thr Trp Gln Glu Ala 130 135 140 Ala Ser Ser Ser Leu Thr Glu Leu Phe Ala Pro Thr Ile His Gln Asn 145 150 155 160 Arg Leu Asp Thr Trp Pro Gln His Tyr Pro Trp Ile Lys Glu Glu Gly 165 170 175 Tyr Gln Tyr Phe Arg Asn Arg Leu Thr Glu Ala Arg Arg Asp Val Val 180 185 190 His Gly Leu Glu Ile Thr Leu Asp His Tyr Thr Thr Arg Glu Gln Gln 195 200 205 Asp Arg Met Leu Glu Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Thr 210 215 220 Met Leu Asp Ala Met Thr Met Ala Tyr Glu Leu Glu Arg Pro Pro Tyr 225 230 235 240 His Thr Val Thr Gly Glu Lys Val Phe His Lys Gly Leu Phe Asn Glu 245 250 255 <210> 140 <211> 756 <212> DNA <213> Klebsiella pneumoniae <400> 140 atgctgatca ctgacacgct gtcgccgcag gcctttgaag aggctctgcg ggctaaaggc 60 gacttctacc atattcacca cccttaccac atcgccatgc ataacggcaa cgcgacccgc 120 gagcaaattc agggttgggt ggcgaaccgg ttttattacc agaccactat tccgctgaaa 180 gacgcggcga ttatggccaa ctgcccggat gcgcagaccc ggcgcaaatg ggtgcagcgg 240 atcctcgacc acgacggcag ccacggcgag gacggcggga ttgaagcctg gctgcggctg 300 ggggaagcgg tcggtttgag ccgcgacgat ctgctcagcg agcgtcacgt gctgcccggt 360 gtgcgcttcg cggtggatgc ctatcttaat ttcgcccgtc gcgcctgctg gcaggaggcg 420 gcctgcagct ccctgaccga gctgttcgcc ccgcagatcc atcagtcgcg cctcgacagc 480 tggccgcagc actatccatg gatcaaagag gaaggctatt tttacttccg cagtcgtctg 540 agccaggcta accgcgacgt tgagcatggc ctggcgctgg cgaaggccta ctgcgacagc 600 gctgaaaaac agaaccggat gctggagatc ctgcagttta agctcgacat tctgtggtcg 660 atgctcgatg ccatgaccat ggcctatgcc ctgcagcgcc cgccctatca cacggtcacc 720 gacaaggcgg cctggcacac gacccgactg gtgtaa 756 <210> 141 <211> 251 <212> PRT <213> Klebsiella pneumoniae <400> 141 Met Leu Ile Thr Asp Thr Leu Ser Pro Gln Ala Phe Glu Glu Ala Leu 1 5 10 15 Arg Ala Lys Gly Asp Phe Tyr His Ile His His Pro Tyr His Ile Ala 20 25 30 Met His Asn Gly Asn Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Thr Thr Ile Pro Leu Lys Asp Ala Ala Ile 50 55 60 Met Ala Asn Cys Pro Asp Ala Gln Thr Arg Arg Lys Trp Val Gln Arg 65 70 75 80 Ile Leu Asp His Asp Gly Ser His Gly Glu Asp Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Glu Ala Val Gly Leu Ser Arg Asp Asp Leu Leu 100 105 110 Ser Glu Arg His Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Leu Asn Phe Ala Arg Arg Ala Cys Trp Gln Glu Ala Ala Cys Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Gln His Tyr Pro Trp Ile Lys Glu Glu Gly Tyr Phe Tyr Phe 165 170 175 Arg Ser Arg Leu Ser Gln Ala Asn Arg Asp Val Glu His Gly Leu Ala 180 185 190 Leu Ala Lys Ala Tyr Cys Asp Ser Ala Glu Lys Gln Asn Arg Met Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Thr Met Ala Tyr Ala Leu Gln Arg Pro Pro Tyr His Thr Val Thr 225 230 235 240 Asp Lys Ala Ala Trp His Thr Thr Arg Leu Val 245 250 <210> 142 <211> 660 <212> DNA <213> Pseudomonas stutzeri <400> 142 atgtatgccg ggcaggcgac gcgcgagcag attcagggtt gggttgccaa ccgcttctac 60 tatcaggtct gcatcccggt gaaggatgca gcgatcatgg ccaactgtcc ggaccgcgac 120 acccgccgcg agtggattca gcgcatcatc gaccacgatg gcgcgccggg tgaggagggt 180 ggcatcgaag cctggctgcg actggccgag gccgtgggtc tggaccgcga gcaggtgctg 240 tcgcaggagc tggtgcttcc gggcgtgcgc ttcgcagtgg atgcctacgt gaactttgcc 300 cgtcgggcct gctggcagga agcagccagc agctcgctga ccgaactgtt cgcaccgacc 360 atccaccagt cgcggctgga tagctggccg cagcactatc cctggatcga cgcgtcgggc 420 tatgactact tccgcaagcg cctgaaggaa gcccgccgcg atgtcgagca cggcctgcgc 480 atcaccctgg accactatcg cacccgcgag gcgcaggagc gcatgctgga gatccttcag 540 ttcaagctcg acgtgttgtg gagcatgctg gacgccatga gcatggccta tgagctggac 600 cgaccgccgt accataccgt cacccgcgac cgggtctggc acaagggcat cagcttctga 660 <210> 143 <211> 219 <212> PRT <213> Pseudomonas stutzeri <400> 143 Met Tyr Ala Gly Gln Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala 1 5 10 15 Asn Arg Phe Tyr Tyr Gln Val Cys Ile Pro Val Lys Asp Ala Ala Ile 20 25 30 Met Ala Asn Cys Pro Asp Arg Asp Thr Arg Arg Glu Trp Ile Gln Arg 35 40 45 Ile Ile Asp His Asp Gly Ala Pro Gly Glu Glu Gly Gly Ile Glu Ala 50 55 60 Trp Leu Arg Leu Ala Glu Ala Val Gly Leu Asp Arg Glu Gln Val Leu 65 70 75 80 Ser Gln Glu Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 85 90 95 Val Asn Phe Ala Arg Arg Ala Cys Trp Gln Glu Ala Ala Ser Ser Ser 100 105 110 Leu Thr Glu Leu Phe Ala Pro Thr Ile His Gln Ser Arg Leu Asp Ser 115 120 125 Trp Pro Gln His Tyr Pro Trp Ile Asp Ala Ser Gly Tyr Asp Tyr Phe 130 135 140 Arg Lys Arg Leu Lys Glu Ala Arg Arg Asp Val Glu His Gly Leu Arg 145 150 155 160 Ile Thr Leu Asp His Tyr Arg Thr Arg Glu Ala Gln Glu Arg Met Leu 165 170 175 Glu Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser Met Leu Asp Ala 180 185 190 Met Ser Met Ala Tyr Glu Leu Asp Arg Pro Pro Tyr His Thr Val Thr 195 200 205 Arg Asp Arg Val Trp His Lys Gly Ile Ser Phe 210 215 <210> 144 <211> 768 <212> DNA <213> Acinetobacter sp. <400> 144 ttgaggttta atatgaccac aacattattt tctcctgcgg aatttgaaca agccctgcgt 60 gacaaaggtc gctactatca tattcatcat ccctatcaca tcatgatgaa tgatgggcat 120 gccactaagc aacaaattca gggctgggtc gccaaccgtt tttattatca ggtcaatatc 180 cctttaaaag atgcggccat catggccaat tgcccagatc ctgcgacacg ccgtaaatgg 240 gtgcaacgta ttttggatca cgatggtcaa catgacgacc atggcggaat tgaagcatgg 300 ttgcgtctgg gtgaagccgt tggcctagac cgtgagacta ttttgtcaca aaagatggtt 360 ttgcccagtg tacgttttgc ggtagatgcc tatgtcaatt ttgcccgtcg tgcctgctgg 420 caagaagctg catgtagttc gcttaccgaa ctttttgcac ctgccatcca tcaatcacgt 480 ctggatactt ggcctacaca ttacccatgg attgatgcag aaggttacgc ctattttaga 540 ggacgcttga gtcaggccaa tcgtgacgtt gagcatggtt tggaactggc acttgagtac 600 tgcaataccg tagatcgcca gcagcgtatg ttgaatattt tacagttcaa actggatatt 660 ttgtggacga tccttgatgg tatgagcatg gcctatgtgc ttgagcgtgc accatatcac 720 acggttactc aagaagcggt ttggcatcaa aaaggattat taggatga 768 <210> 145 <211> 255 <212> PRT <213> Acinetobacter sp. <400> 145 Met Arg Phe Asn Met Thr Thr Thr Leu Phe Ser Pro Ala Glu Phe Glu 1 5 10 15 Gln Ala Leu Arg Asp Lys Gly Arg Tyr Tyr His Ile His His Pro Tyr 20 25 30 His Ile Met Met Asn Asp Gly His Ala Thr Lys Gln Gln Ile Gln Gly 35 40 45 Trp Val Ala Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp 50 55 60 Ala Ala Ile Met Ala Asn Cys Pro Asp Pro Ala Thr Arg Arg Lys Trp 65 70 75 80 Val Gln Arg Ile Leu Asp His Asp Gly Gln His Asp Asp His Gly Gly 85 90 95 Ile Glu Ala Trp Leu Arg Leu Gly Glu Ala Val Gly Leu Asp Arg Glu 100 105 110 Thr Ile Leu Ser Gln Lys Met Val Leu Pro Ser Val Arg Phe Ala Val 115 120 125 Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Cys Trp Gln Glu Ala Ala 130 135 140 Cys Ser Ser Leu Thr Glu Leu Phe Ala Pro Ala Ile His Gln Ser Arg 145 150 155 160 Leu Asp Thr Trp Pro Thr His Tyr Pro Trp Ile Asp Ala Glu Gly Tyr 165 170 175 Ala Tyr Phe Arg Gly Arg Leu Ser Gln Ala Asn Arg Asp Val Glu His 180 185 190 Gly Leu Glu Leu Ala Leu Glu Tyr Cys Asn Thr Val Asp Arg Gln Gln 195 200 205 Arg Met Leu Asn Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Thr Ile 210 215 220 Leu Asp Gly Met Ser Met Ala Tyr Val Leu Glu Arg Ala Pro Tyr His 225 230 235 240 Thr Val Thr Gln Glu Ala Val Trp His Gln Lys Gly Leu Leu Gly 245 250 255 <210> 146 <211> 750 <212> PRT <213> Serratia marcescens <400> 146 Ala Thr Gly Ala Cys Gly Cys Ala Ala Cys Cys Ala Cys Thr Cys Cys 1 5 10 15 Cys Cys Cys Thr Thr Gly Ala Cys Cys Cys Ala Cys Ala Gly Gly Cys 20 25 30 Gly Thr Thr Thr Gly Ala Ala Gly Cys Gly Cys Gly Cys Cys Gly Thr 35 40 45 Cys Cys Ala Cys Ala Ala Gly Gly Cys Gly Cys Thr Thr Ala Thr Thr 50 55 60 Ala Cys Cys Ala Thr Ala Thr Cys Cys Ala Cys Cys Ala Cys Cys Cys 65 70 75 80 Gly Thr Ala Cys Cys Ala Cys Ala Thr Cys Gly Cys Gly Ala Thr Gly 85 90 95 Cys Ala Cys Ala Ala Cys Gly Gly Cys Gly Ala Ala Gly Cys Gly Ala 100 105 110 Cys Cys Cys Gly Cys Gly Ala Gly Cys Ala Gly Ala Thr Cys Cys Ala 115 120 125 Gly Gly Gly Cys Thr Gly Gly Gly Thr Gly Gly Cys Cys Ala Ala Cys 130 135 140 Cys Gly Gly Thr Thr Cys Thr Ala Cys Thr Ala Cys Cys Ala Gly Ala 145 150 155 160 Cys Cys Ala Gly Cys Ala Thr Thr Cys Cys Gly Ala Thr Thr Ala Ala 165 170 175 Gly Gly Ala Thr Gly Cys Ala Gly Cys Gly Ala Thr Cys Ala Thr Gly 180 185 190 Gly Cys Cys Ala Ala Cys Thr Gly Cys Cys Cys Ala Cys Ala Gly Cys 195 200 205 Cys Gly Gly Ala Ala Ala Cys Ala Cys Gly Cys Cys Gly Cys Ala Ala 210 215 220 Ala Thr Gly Gly Gly Thr Ala Cys Ala Gly Cys Gly Cys Ala Thr Cys 225 230 235 240 Cys Thr Gly Gly Ala Thr Cys Ala Cys Cys Ala Cys Gly Gly Cys Ala 245 250 255 Cys Gly Gly Ala Cys Gly Gly Cys Ala Gly Cys Gly Ala Ala Gly Gly 260 265 270 Cys Gly Gly Cys Ala Thr Cys Gly Ala Gly Gly Cys Cys Thr Cys Thr 275 280 285 Gly Ala Cys Cys Thr Gly Gly Gly Cys Gly Ala Ala Gly Cys Cys Gly 290 295 300 Thr Thr Gly Gly Gly Cys Thr Gly Cys Ala Gly Cys Gly Cys Gly Ala 305 310 315 320 Cys Ala Cys Thr Thr Thr Gly Cys Thr Cys Thr Cys Thr Gly Ala Ala 325 330 335 Gly Ala Gly Cys Gly Gly Gly Thr Ala Cys Thr Gly Cys Cys Gly Gly 340 345 350 Gly Cys Gly Thr Gly Cys Gly Cys Thr Thr Cys Gly Cys Gly Gly Thr 355 360 365 Gly Gly Ala Cys Gly Cys Cys Thr Ala Cys Gly Thr Cys Ala Ala Cys 370 375 380 Thr Thr Cys Gly Cys Gly Cys Gly Cys Cys Gly Cys Gly Cys Cys Thr 385 390 395 400 Gly Cys Thr Gly Gly Cys Ala Gly Gly Ala Ala Gly Cys Gly Gly Cys 405 410 415 Cys Thr Gly Cys Ala Gly Cys Thr Cys Ala Cys Thr Gly Ala Cys Cys 420 425 430 Gly Ala Ala Cys Thr Gly Thr Thr Cys Gly Cys Gly Cys Cys Gly Cys 435 440 445 Ala Ala Ala Thr Thr Cys Ala Cys Cys Ala Ala Thr Cys Gly Cys Gly 450 455 460 Cys Cys Thr Cys Gly Ala Cys Ala Gly Cys Thr Gly Gly Cys Cys Gly 465 470 475 480 Cys Ala Gly Cys Ala Cys Thr Ala Cys Cys Cys Gly Thr Gly Gly Ala 485 490 495 Thr Cys Gly Cys Ala Gly Cys Cys Gly Thr Cys Gly Gly Cys Thr Ala 500 505 510 Cys Gly Ala Cys Thr Ala Thr Thr Thr Cys Cys Gly Cys Ala Gly Cys 515 520 525 Cys Gly Cys Cys Thr Cys Cys Gly Cys Cys Ala Gly Gly Cys Cys Ala 530 535 540 Ala Cys Cys Gly Cys Gly Ala Thr Gly Thr Gly Gly Ala Ala Cys Ala 545 550 555 560 Cys Gly Gly Cys Cys Thr Gly Gly Cys Gly Cys Thr Gly Gly Cys Gly 565 570 575 Cys Thr Gly Gly Ala Cys Thr Ala Thr Thr Gly Cys Gly Ala Cys Ala 580 585 590 Cys Cys Gly Thr Thr Gly Ala Ala Ala Ala Gly Cys Ala Gly Cys Ala 595 600 605 Gly Cys Gly Cys Ala Thr Gly Cys Thr Gly Gly Ala Gly Ala Thr Cys 610 615 620 Cys Thr Gly Cys Ala Gly Thr Thr Cys Ala Ala Gly Cys Thr Gly Gly 625 630 635 640 Ala Cys Ala Thr Thr Cys Thr Gly Thr Gly Gly Ala Gly Cys Ala Thr 645 650 655 Gly Cys Thr Gly Gly Ala Cys Gly Cys Cys Ala Thr Gly Ala Gly Cys 660 665 670 Ala Thr Gly Gly Cys Cys Thr Ala Cys Ala Cys Cys Cys Thr Gly Ala 675 680 685 Ala Cys Cys Gly Cys Cys Cys Ala Cys Cys Thr Thr Ala Cys Cys Ala 690 695 700 Cys Ala Gly Cys Gly Thr Gly Ala Cys Cys Gly Cys Cys Gly Cys Gly 705 710 715 720 Cys Gly Gly Gly Thr Ala Thr Gly Gly Cys Ala Cys Ala Ala Cys Cys 725 730 735 Ala Gly Ala Gly Gly Cys Thr Gly Gly Thr Gly Thr Ala Ala 740 745 750 <210> 147 <211> 249 <212> PRT <213> Serratia marcescens <400> 147 Met Thr Gln Pro Leu Pro Leu Asp Pro Gln Ala Phe Glu Ala Arg Arg 1 5 10 15 Pro Gln Gly Ala Tyr Tyr His Ile His His Pro Tyr His Ile Ala Met 20 25 30 His Asn Gly Glu Ala Thr Arg Glu Gln Ile Gln Gly Trp Val Ala Asn 35 40 45 Arg Phe Tyr Tyr Gln Thr Ser Ile Pro Ile Lys Asp Ala Ala Ile Met 50 55 60 Ala Asn Cys Pro Gln Pro Glu Thr Arg Arg Lys Trp Val Gln Arg Ile 65 70 75 80 Leu Asp His His Gly Thr Asp Gly Ser Glu Gly Gly Ile Glu Ala Ser 85 90 95 Asp Leu Gly Glu Ala Val Gly Leu Gln Arg Asp Thr Leu Leu Ser Glu 100 105 110 Glu Arg Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val Asn 115 120 125 Phe Ala Arg Arg Ala Cys Trp Gln Glu Ala Ala Cys Ser Ser Leu Thr 130 135 140 Glu Leu Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser Trp Pro 145 150 155 160 Gln His Tyr Pro Trp Ile Ala Ala Val Gly Tyr Asp Tyr Phe Arg Ser 165 170 175 Arg Leu Arg Gln Ala Asn Arg Asp Val Glu His Gly Leu Ala Leu Ala 180 185 190 Leu Asp Tyr Cys Asp Thr Val Glu Lys Gln Gln Arg Met Leu Glu Ile 195 200 205 Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Met Ser 210 215 220 Met Ala Tyr Thr Leu Asn Arg Pro Pro Tyr His Ser Val Thr Ala Ala 225 230 235 240 Arg Val Trp His Asn Gln Arg Leu Val 245 <210> 148 <211> 732 <212> PRT <213> Marinobacter algicola <400> 148 Cys Thr Ala Cys Ala Gly Cys Cys Cys Cys Cys Gly Gly Thr Gly Cys 1 5 10 15 Cys Ala Gly Ala Cys Cys Gly Gly Cys Thr Gly Ala Cys Cys Gly Gly 20 25 30 Thr Thr Ala Cys Gly Gly Thr Gly Thr Gly Gly Thr Ala Cys Gly Gly 35 40 45 Cys Gly Gly Cys Gly Thr Gly Cys Gly Gly Thr Gly Cys Thr Gly Ala 50 55 60 Thr Ala Ala Gly Cys Cys Ala Thr Ala Gly Thr Cys Ala Gly Gly Gly 65 70 75 80 Cys Ala Thr Cys Cys Ala Ala Cys Ala Thr Ala Gly Ala Cys Cys Ala 85 90 95 Thr Ala Ala Gly Ala Thr Ala Thr Cys Cys Ala Gly Thr Thr Thr Gly 100 105 110 Ala Ala Thr Thr Gly Ala Ala Gly Gly Ala Thr Thr Thr Cys Cys Ala 115 120 125 Gly Gly Gly Cys Ala Cys Gly Gly Gly Cys Cys Thr Gly Cys Thr Gly 130 135 140 Thr Gly Cys Cys Gly Cys Gly Gly Thr Gly Gly Thr Ala Ala Ala Gly 145 150 155 160 Thr Gly Ala Thr Cys Cys Ala Gly Gly Gly Thr Ala Ala Thr Gly Gly 165 170 175 Thr Cys Ala Gly Gly Cys Cys Ala Thr Gly Thr Thr Cys Cys Ala Cys 180 185 190 Ala Thr Cys Gly Cys Gly Gly Cys Gly Cys Gly Cys Thr Thr Cys Cys 195 200 205 Gly Ala Cys Ala Ala Cys Cys Gly Cys Thr Thr Gly Cys Gly Gly Ala 210 215 220 Ala Ala Thr Ala Gly Gly Cys Gly Thr Ala Thr Cys Cys Ala Thr Cys 225 230 235 240 Gly Gly Thr Cys Thr Gly Gly Ala Thr Cys Cys Ala Gly Gly Gly Ala 245 250 255 Thr Ala Ala Thr Gly Cys Thr Gly Gly Gly Gly Cys Cys Ala Gly Cys 260 265 270 Thr Ala Thr Cys Gly Ala Gly Cys Cys Gly Gly Gly Ala Cys Thr Gly 275 280 285 Gly Thr Gly Ala Ala Thr Thr Thr Cys Cys Gly Gly Cys Gly Cys Ala 290 295 300 Ala Ala Cys Ala Gly Thr Thr Cys Thr Gly Thr Cys Ala Gly Gly Gly 305 310 315 320 Ala Gly Gly Ala Ala Cys Ala Gly Gly Cys Cys Gly Cys Thr Thr Cys 325 330 335 Cys Thr Gly Cys Cys Ala Ala Gly Thr Cys Gly Cys Cys Cys Gly Gly 340 345 350 Cys Gly Gly Gly Cys Ala Ala Ala Gly Thr Thr Cys Ala Gly Gly Thr 355 360 365 Ala Gly Gly Cys Gly Thr Cys Thr Ala Cys Gly Gly Cys Ala Ala Ala 370 375 380 Cys Cys Gly Thr Ala Cys Ala Cys Cys Cys Gly Gly Cys Ala Gly Cys 385 390 395 400 Ala Cys Ala Thr Gly Gly Cys Gly Cys Thr Gly Gly Thr Cys Gly Gly 405 410 415 Thr Gly Ala Cys Cys Thr Cys Gly Thr Cys Cys Cys Gly Gly Gly Thr 420 425 430 Thr Ala Gly Cys Cys Cys Gly Ala Cys Cys Gly Cys Thr Thr Cys Cys 435 440 445 Gly Cys Cys Ala Ala Gly Cys Thr Cys Ala Ala Cys Cys Ala Gly Gly 450 455 460 Cys Cys Thr Cys Gly Ala Thr Ala Cys Cys Gly Cys Cys Thr Thr Cys 465 470 475 480 Gly Thr Cys Gly Thr Cys Ala Ala Thr Gly Thr Gly Gly Cys Cys Ala 485 490 495 Thr Cys Gly Thr Gly Ala Thr Cys Cys Ala Ala Cys Ala Cys Thr Cys 500 505 510 Gly Thr Thr Gly Gly Ala Gly Cys Cys Ala Cys Ala Ala Cys Cys Gly 515 520 525 Gly Cys Gly Gly Ala Cys Cys Gly Ala Gly Gly Cys Ala Thr Cys Cys 530 535 540 Gly Gly Gly Cys Ala Gly Thr Thr Ala Gly Cys Cys Ala Thr Gly Ala 545 550 555 560 Thr Cys Gly Cys Cys Gly Cys Ala Thr Cys Cys Thr Thr Gly Cys Gly 565 570 575 Gly Gly Gly Thr Ala Thr Gly Thr Thr Gly Ala Thr Cys Thr Gly Gly 580 585 590 Thr Ala Gly Thr Ala Gly Thr Ala Cys Cys Gly Gly Thr Thr Ala Gly 595 600 605 Cys Gly Ala Cys Cys Cys Ala Gly Cys Cys Ala Cys Gly Ala Ala Thr 610 615 620 Cys Thr Gly Cys Thr Cys Ala Gly Gly Ala Gly Thr Gly Cys Ala Gly 625 630 635 640 Thr Cys Ala Cys Cys Gly Cys Cys Ala Thr Ala Cys Ala Thr Gly Gly 645 650 655 Cys Thr Thr Thr Ala Thr Gly Gly Thr Ala Gly Gly Gly Ala Thr Gly 660 665 670 Gly Thr Gly Ala Ala Thr Gly Thr Gly Gly Thr Ala Gly Thr Ala Cys 675 680 685 Thr Gly Gly Cys Cys Thr Thr Thr Thr Gly Cys Ala Cys Gly Cys Ala 690 695 700 Gly Gly Gly Cys Cys Thr Gly Cys Thr Cys Gly Ala Ala Ala Thr Cys 705 710 715 720 Cys Cys Cys Ala Cys Gly Ala Thr Thr Cys Ala Thr 725 730 <210> 149 <211> 243 <212> PRT <213> Marinobacter algicola <400> 149 Met Asn Arg Gly Asp Phe Glu Gln Ala Leu Arg Ala Lys Gly Gln Tyr 1 5 10 15 Tyr His Ile His His Pro Tyr His Lys Ala Met Tyr Gly Gly Asp Cys 20 25 30 Thr Pro Glu Gln Ile Arg Gly Trp Val Ala Asn Arg Tyr Tyr Tyr Gln 35 40 45 Ile Asn Ile Pro Arg Lys Asp Ala Ala Ile Met Ala Asn Cys Pro Asp 50 55 60 Ala Ser Val Arg Arg Leu Trp Leu Gln Arg Val Leu Asp His Asp Gly 65 70 75 80 His Ile Asp Asp Glu Gly Gly Ile Glu Ala Trp Leu Ser Leu Ala Glu 85 90 95 Ala Val Gly Leu Thr Arg Asp Glu Val Thr Asp Gln Arg His Val Leu 100 105 110 Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Leu Asn Phe Ala Arg Arg 115 120 125 Ala Thr Trp Gln Glu Ala Ala Cys Ser Ser Leu Thr Glu Leu Phe Ala 130 135 140 Pro Glu Ile His Gln Ser Arg Leu Asp Ser Trp Pro Gln His Tyr Pro 145 150 155 160 Trp Ile Gln Thr Asp Gly Tyr Ala Tyr Phe Arg Lys Arg Leu Ser Glu 165 170 175 Ala Arg Arg Asp Val Glu His Gly Leu Thr Ile Thr Leu Asp His Phe 180 185 190 Thr Thr Ala Ala Gln Gln Ala Arg Ala Leu Glu Ile Leu Gln Phe Lys 195 200 205 Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Leu Thr Met Ala Tyr Gln 210 215 220 His Arg Thr Pro Pro Tyr His Thr Val Thr Gly Gln Pro Val Trp His 225 230 235 240 Arg Gly Leu <210> 150 <211> 756 <212> DNA <213> Marinobacter sp. <400> 150 tcatagcccc ctgtgccaga cttgctgatc ggtaaccgta tggaacggcg gcgttttgtg 60 gctgtaggcc atggtcaggg cgtccagcag gctccacaga atatccagtt tgaactgtaa 120 aatttcgagg gcgcgggcct gctcggtagc tctggtgaaa tactccagcg taatcgccag 180 gccatgttcc acatcgcggc gggcttctga taggcgctta cggaagtagc tatagccggc 240 ctcgtcaatc cacggataat gttctggcca gctgtccaga cgagactggt ggatttctgg 300 cgcaaacagc tcggtcagcg aggaacaagc cgcttcttgc caagtcgcgc ggcgcgcaaa 360 gttcaagtag gcgtccaccg caaaacgcac gccgggcagc acgtggcgct ggtcgatcac 420 ctcttcccga gtcagcccca cggcttccgc caggcacaac caggcttcaa tgccgcccgc 480 atcaccgtcg tgaccatcgt ggtcaagaat gcgctgcaac cattgcttgc gcacgctggc 540 gtcggggcaa ttggccataa tggccgcatc tttacgcggg atcattacct gataataata 600 gcggttggcc acccagcccc ggatttgctc agggctgcac tggccaccat acatggcctg 660 atgatacggg tgatgaatat gatagagccg gcccttattg cgtaacgcct gttcaaaatc 720 cgcgcgattc agggtggtgt tcacaatggc gttcat 756 <210> 151 <211> 251 <212> PRT <213> Marinobacter sp. <400> 151 Met Asn Ala Ile Val Asn Thr Thr Leu Asn Arg Ala Asp Phe Glu Gln 1 5 10 15 Ala Leu Arg Asn Lys Gly Arg Leu Tyr His Ile His His Pro Tyr His 20 25 30 Gln Ala Met Tyr Gly Gly Gln Cys Ser Pro Glu Gln Ile Arg Gly Trp 35 40 45 Val Ala Asn Arg Tyr Tyr Tyr Gln Val Met Ile Pro Arg Lys Asp Ala 50 55 60 Ala Ile Met Ala Asn Cys Pro Asp Ala Ser Val Arg Lys Gln Trp Leu 65 70 75 80 Gln Arg Ile Leu Asp His Asp Gly His Asp Gly Asp Ala Gly Gly Ile 85 90 95 Glu Ala Trp Leu Cys Leu Ala Glu Ala Val Gly Leu Thr Arg Glu Glu 100 105 110 Val Ile Asp Gln Arg His Val Leu Pro Gly Val Arg Phe Ala Val Asp 115 120 125 Ala Tyr Leu Asn Phe Ala Arg Arg Ala Thr Trp Gln Glu Ala Ala Cys 130 135 140 Ser Ser Leu Thr Glu Leu Phe Ala Pro Glu Ile His Gln Ser Arg Leu 145 150 155 160 Asp Ser Trp Pro Glu His Tyr Pro Trp Ile Asp Glu Ala Gly Tyr Ser 165 170 175 Tyr Phe Arg Lys Arg Leu Ser Glu Ala Arg Arg Asp Val Glu His Gly 180 185 190 Leu Ala Ile Thr Leu Glu Tyr Phe Thr Arg Ala Thr Glu Gln Ala Arg 195 200 205 Ala Leu Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Leu Leu 210 215 220 Asp Ala Leu Thr Met Ala Tyr Ser His Lys Thr Pro Pro Phe His Thr 225 230 235 240 Val Thr Asp Gln Gln Val Trp His Arg Gly Leu 245 250 <210> 152 <211> 759 <212> DNA <213> Alpha proteobacterium <400> 152 atgacaaagc aagcaccttg gtctcgcgat gaatttgaag caaagctccg tgctaaaggc 60 gagtactacc acatctatca tccgtttcat gtagcgatga ataaaggtga atgtagccaa 120 gaacaaattc aaggatgggt cgccaatcgc ttattttatc agttagcgat cccagtaaaa 180 gatgcaggga tcatggcaaa ttgctgggat ctgcaaaccc gtcgcaaatg gatccagcgt 240 atattggatc atgatggaga ccctgaagat actactctag gcggtattga agcttggtta 300 cgtctaggtg aagcggtggg tttacatcgt gaagatatgc tcaatgaacg ctttttatta 360 cctggtgtga agtttgccgt cggggcatat attaacttta cgcgtaaagc tagctgggaa 420 gaagcagcct gttcgtcact cactgagatg ttcgcacctg aaatccatca aagtcgcctc 480 gatacttggc caacccatta taaatggatt gatccagaag gattttccta ttttcaaatg 540 cgtttaaatc aggcacgtcg tgatgtacag cacggtttag agatcacttt agatcatttt 600 gaaacgcgta aacaacaaga gcgtgcattg aatattctgc aattcaaact tgatgtctta 660 tggagtatgg ctgatagtat cagcttagca tatgagttta accgcaagcc ttttggtgcg 720 gtaactgacg aaaatatttc tcacaaaggc ttcatgtaa 759 <210> 153 <211> 252 <212> PRT <213> Alpha proteobacterium <400> 153 Met Thr Lys Gln Ala Pro Trp Ser Arg Asp Glu Phe Glu Ala Lys Leu 1 5 10 15 Arg Ala Lys Gly Glu Tyr Tyr His Ile Tyr His Pro Phe His Val Ala 20 25 30 Met Asn Lys Gly Glu Cys Ser Gln Glu Gln Ile Gln Gly Trp Val Ala 35 40 45 Asn Arg Leu Phe Tyr Gln Leu Ala Ile Pro Val Lys Asp Ala Gly Ile 50 55 60 Met Ala Asn Cys Trp Asp Leu Gln Thr Arg Arg Lys Trp Ile Gln Arg 65 70 75 80 Ile Leu Asp His Asp Gly Asp Pro Glu Asp Thr Thr Leu Gly Gly Ile 85 90 95 Glu Ala Trp Leu Arg Leu Gly Glu Ala Val Gly Leu His Arg Glu Asp 100 105 110 Met Leu Asn Glu Arg Phe Leu Leu Pro Gly Val Lys Phe Ala Val Gly 115 120 125 Ala Tyr Ile Asn Phe Thr Arg Lys Ala Ser Trp Glu Glu Ala Ala Cys 130 135 140 Ser Ser Leu Thr Glu Met Phe Ala Pro Glu Ile His Gln Ser Arg Leu 145 150 155 160 Asp Thr Trp Pro Thr His Tyr Lys Trp Ile Asp Pro Glu Gly Phe Ser 165 170 175 Tyr Phe Gln Met Arg Leu Asn Gln Ala Arg Arg Asp Val Gln His Gly 180 185 190 Leu Glu Ile Thr Leu Asp His Phe Glu Thr Arg Lys Gln Gln Glu Arg 195 200 205 Ala Leu Asn Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser Met Ala 210 215 220 Asp Ser Ile Ser Leu Ala Tyr Glu Phe Asn Arg Lys Pro Phe Gly Ala 225 230 235 240 Val Thr Asp Glu Asn Ile Ser His Lys Gly Phe Met 245 250 <210> 154 <211> 756 <212> DNA <213> Colwellia psychrerythraea <400> 154 tcatttaaaa attctcttat ggtaatttgg ctcagctatt aaaccttggt aaggcgctcg 60 gtcctgttga tatgctaagg tcatagcatc aagcatactc cacaaaatat ctaatttaaa 120 ttggagaata tttaatgcct cgtcttgtgc ttgacgagta gtaaagtgat ctaaggtgat 180 ttgtaggcca tgattaacat cgcgtcttgc ttgagataag cgcatttgaa aatactgtaa 240 gccttgtgtt tcaatccaag gataatttat aggccaactg tctagcctgc tttgatgtat 300 ttgaggggca aacatttccg tcagtgacga acatgcagct tgctgccagt tagcacggcg 360 agcaaagttt acataggcat ctacggcgaa tcgcacccca ggtaaaacaa atttctcatc 420 cagtaagtct tgtctatcta atcctaccgc ttggcccaat tgtaaccagg cttcaatacc 480 acctaaggtt ttgtcttcta cactgccatc gtgatctaat atgcgttgga tccatagacg 540 acgagtttcc atatcatgac aattagctaa tatggcggca tctttaatag gaatatttac 600 ttggtaataa aaacggtttg ccacccaacc ctgaatttgc tcaacactac attcaccttg 660 gtgcatggca atatgaaatg ggtgatgaat atggtaaagc tgccctttag cgcggagcat 720 ttcttcaaac tgctctcttg tccatggttg ttgcat 756 <210> 155 <211> 251 <212> PRT <213> Colwellia psychrerythraea <400> 155 Met Gln Gln Pro Trp Thr Arg Glu Gln Phe Glu Glu Met Leu Arg Ala 1 5 10 15 Lys Gly Gln Leu Tyr His Ile His His Pro Phe His Ile Ala Met His 20 25 30 Gln Gly Glu Cys Ser Val Glu Gln Ile Gln Gly Trp Val Ala Asn Arg 35 40 45 Phe Tyr Tyr Gln Val Asn Ile Pro Ile Lys Asp Ala Ala Ile Leu Ala 50 55 60 Asn Cys His Asp Met Glu Thr Arg Arg Leu Trp Ile Gln Arg Ile Leu 65 70 75 80 Asp His Asp Gly Ser Val Glu Asp Lys Thr Leu Gly Gly Ile Glu Ala 85 90 95 Trp Leu Gln Leu Gly Gln Ala Val Gly Leu Asp Arg Gln Asp Leu Leu 100 105 110 Asp Glu Lys Phe Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Asn Trp Gln Gln Ala Ala Cys Ser Ser 130 135 140 Leu Thr Glu Met Phe Ala Pro Gln Ile His Gln Ser Arg Leu Asp Ser 145 150 155 160 Trp Pro Ile Asn Tyr Pro Trp Ile Glu Thr Gln Gly Leu Gln Tyr Phe 165 170 175 Gln Met Arg Leu Ser Gln Ala Arg Arg Asp Val Asn His Gly Leu Gln 180 185 190 Ile Thr Leu Asp His Phe Thr Thr Arg Gln Ala Gln Asp Glu Ala Leu 195 200 205 Asn Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Met Thr Leu Ala Tyr Gln Gln Asp Arg Ala Pro Tyr Gln Gly Leu Ile 225 230 235 240 Ala Glu Pro Asn Tyr His Lys Arg Ile Phe Lys 245 250 <210> 156 <211> 723 <212> DNA <213> Gamma proteobacterium <400> 156 ttaccggcta cagctatgaa atggcggctc ttcatagaca taagccaact gcattgcatc 60 cagcatactc cataaaatat ccagctttaa ctgcagtata cccatggcct gctgctgctg 120 ttcgaaggtt ttaaagtagt ccagagtaat cgccaaacca tgctctacat ctcttcgggc 180 ttcgctaagt cgcgtgcgga aatattgata gccgttggga tcgatccagg gatagtgttc 240 cggccaggtc gctaagcgtt tttgatgaat ggtcggggca aagagttcgg tgagtgatga 300 gcaggccgct tcctgccagt tagcgcggcg ggcaaagtta acgtaggcgt ctactgcaaa 360 gcgcacgccg ggtaatatat gttgctgact tataatttcg tctcgggtta aacccacagc 420 ctctcccaag cggagccagg cctcaatacc accactatcc tcatcgctgg tgccatcgtg 480 atcaagaata cgctgcaccc ataaacgacg aacagaggcg tcgtcacagt tggccataat 540 ggcggcgtct ttgatcggta tactgatttg ataataatag cggttagcca cccagccctg 600 tatctgcttt tgagtacagt tgccggtatt catcgcaata tggaaggggt gatgaatatg 660 gtagagcgcg cccttgtctc gtagctgctg ctcaaattct tctgcagtcc aggctttagt 720 cat 723 <210> 157 <211> 240 <212> PRT <213> Gamma proteobacterium <400> 157 Met Thr Lys Ala Trp Thr Ala Glu Glu Phe Glu Gln Gln Leu Arg Asp 1 5 10 15 Lys Gly Ala Leu Tyr His Ile His His Pro Phe His Ile Ala Met Asn 20 25 30 Thr Gly Asn Cys Thr Gln Lys Gln Ile Gln Gly Trp Val Ala Asn Arg 35 40 45 Tyr Tyr Tyr Gln Ile Ser Ile Pro Ile Lys Asp Ala Ala Ile Met Ala 50 55 60 Asn Cys Asp Asp Ala Ser Val Arg Arg Leu Trp Val Gln Arg Ile Leu 65 70 75 80 Asp His Asp Gly Thr Ser Asp Glu Asp Ser Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Gly Glu Ala Val Gly Leu Thr Arg Asp Glu Ile Ile Ser 100 105 110 Gln Gln His Ile Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Asn Trp Gln Glu Ala Ala Cys Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Thr Ile His Gln Lys Arg Leu Ala Thr Trp 145 150 155 160 Pro Glu His Tyr Pro Trp Ile Asp Pro Asn Gly Tyr Gln Tyr Phe Arg 165 170 175 Thr Arg Leu Ser Glu Ala Arg Arg Asp Val Glu His Gly Leu Ala Ile 180 185 190 Thr Leu Asp Tyr Phe Lys Thr Phe Glu Gln Gln Gln Gln Ala Met Gly 195 200 205 Ile Leu Gln Leu Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Gln Leu Ala Tyr Val Tyr Glu Glu Pro Pro Phe His Ser Cys Ser Arg 225 230 235 240 <210> 158 <211> 780 <212> DNA <213> Gamma proteobacterium <400> 158 atgtcgctcc ttgataccgc ttcatcgcga gacgcatcta atcaggcccc tctgacccga 60 gcagattttg aggcgcgtct gcgcgccaag ggctcgcgct atcacatcca ccatcctttt 120 catcaagcga tgtacgcggg tgagctaacg cctcgacaaa ttcggggctg ggtagccaac 180 aggtattact accaaataat gattcctcaa aaggatgcag cgattctggc caattgctct 240 gaccgggaaa tccgcgtgaa atggatccag cgtatccttg atcatgatgg tgccgacggt 300 gatgaaggcg gtattgaagc ctggttggaa ttggctgaag cggtgggact taagcgtgat 360 gaagtgaccg atcttcgcta cgtgctaccc ggtgtgcgct ttgcggtcga tgcttatgtc 420 aacttcgcac gtaacgccac ttggcaggaa gccgcttgct catcgctaac agagatgttc 480 gcgcctgaaa ttcatcggtc ccggctcaat acttggccgc aacattacag ctggattgac 540 caaagcggat tgaagtactt tcaaaagcgt ctaggagagg cccggcgtga tgttgagcat 600 ggcctggacg taactctcga ttatttcaaa tatcgcgaac agcaggaaaa ggcgctgggt 660 attttacagt ttaaactcga tattctgtgg acaatgctgg acgcaatgac catggcctac 720 gtgcacacca cgcccccata tcacagctgt gatgacggta ttcattcggt acctgggtaa 780 <210> 159 <211> 259 <212> PRT <213> Gamma proteobacterium <400> 159 Met Ser Leu Leu Asp Thr Ala Ser Ser Arg Asp Ala Ser Asn Gln Ala 1 5 10 15 Pro Leu Thr Arg Ala Asp Phe Glu Ala Arg Leu Arg Ala Lys Gly Ser 20 25 30 Arg Tyr His Ile His His Pro Phe His Gln Ala Met Tyr Ala Gly Glu 35 40 45 Leu Thr Pro Arg Gln Ile Arg Gly Trp Val Ala Asn Arg Tyr Tyr Tyr 50 55 60 Gln Ile Met Ile Pro Gln Lys Asp Ala Ala Ile Leu Ala Asn Cys Ser 65 70 75 80 Asp Arg Glu Ile Arg Val Lys Trp Ile Gln Arg Ile Leu Asp His Asp 85 90 95 Gly Ala Asp Gly Asp Glu Gly Gly Ile Glu Ala Trp Leu Glu Leu Ala 100 105 110 Glu Ala Val Gly Leu Lys Arg Asp Glu Val Thr Asp Leu Arg Tyr Val 115 120 125 Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg 130 135 140 Asn Ala Thr Trp Gln Glu Ala Ala Cys Ser Ser Leu Thr Glu Met Phe 145 150 155 160 Ala Pro Glu Ile His Arg Ser Arg Leu Asn Thr Trp Pro Gln His Tyr 165 170 175 Ser Trp Ile Asp Gln Ser Gly Leu Lys Tyr Phe Gln Lys Arg Leu Gly 180 185 190 Glu Ala Arg Arg Asp Val Glu His Gly Leu Asp Val Thr Leu Asp Tyr 195 200 205 Phe Lys Tyr Arg Glu Gln Gln Glu Lys Ala Leu Gly Ile Leu Gln Phe 210 215 220 Lys Leu Asp Ile Leu Trp Thr Met Leu Asp Ala Met Thr Met Ala Tyr 225 230 235 240 Val His Thr Thr Pro Pro Tyr His Ser Cys Asp Asp Gly Ile His Ser 245 250 255 Val Pro Gly <210> 160 <211> 750 <212> DNA <213> Shewanella woodyi <400> 160 atgcaagcct ggactaaaga agaattcgaa caaaaactca aagataaagg gtcgctttac 60 catatacacc atccctacca taagatgatg cataaaggtg agtgcagcgt tgaacagatc 120 agaggttggg ttgccaaccg cttctattat cagatcaata ttcccgttaa agatgcagcc 180 atactggcaa actgtcgcga tgtaaaaact cgccgcatgt ggatccaacg tatagtggat 240 catgatggtt caattgaaga taacacctta ggtggtatcg aggcttggct aaaactcggt 300 gaagcggtgg gactgaatag acaagatatg ctagatgaaa agtatatcct gccaggggtt 360 cggttcgcgg tcgatgccta tgtgaatttt gccagacgag cctcatggca agaggcggcc 420 tgctcatcac ttaccgagat gtttgcgcca gagatacacc aaagtcgcct taatacctgg 480 ccagaaaact acccttggat aaaatccgaa ggattaagct actttcagat gcgactctct 540 caagcaaggc gagatgttaa tcatggctta gcgatcactt tggcacattt tacgacccga 600 gagcagcagg agcatgcact gaatattttg cagtttaaac tcgatattct ttggtccatg 660 ttagatgcaa tgacattagc ttatcagtat gagcgtgcgc cctattcaca gcttattgat 720 gcgcctgtct atcataaagg gatcttctga 750 <210> 161 <211> 249 <212> PRT <213> Shewanella woodyi <400> 161 Met Gln Ala Trp Thr Lys Glu Glu Phe Glu Gln Lys Leu Lys Asp Lys 1 5 10 15 Gly Ser Leu Tyr His Ile His His Pro Tyr His Lys Met Met His Lys 20 25 30 Gly Glu Cys Ser Val Glu Gln Ile Arg Gly Trp Val Ala Asn Arg Phe 35 40 45 Tyr Tyr Gln Ile Asn Ile Pro Val Lys Asp Ala Ala Ile Leu Ala Asn 50 55 60 Cys Arg Asp Val Lys Thr Arg Arg Met Trp Ile Gln Arg Ile Val Asp 65 70 75 80 His Asp Gly Ser Ile Glu Asp Asn Thr Leu Gly Gly Ile Glu Ala Trp 85 90 95 Leu Lys Leu Gly Glu Ala Val Gly Leu Asn Arg Gln Asp Met Leu Asp 100 105 110 Glu Lys Tyr Ile Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Arg Ala Ser Trp Gln Glu Ala Ala Cys Ser Ser Leu 130 135 140 Thr Glu Met Phe Ala Pro Glu Ile His Gln Ser Arg Leu Asn Thr Trp 145 150 155 160 Pro Glu Asn Tyr Pro Trp Ile Lys Ser Glu Gly Leu Ser Tyr Phe Gln 165 170 175 Met Arg Leu Ser Gln Ala Arg Arg Asp Val Asn His Gly Leu Ala Ile 180 185 190 Thr Leu Ala His Phe Thr Thr Arg Glu Gln Gln Glu His Ala Leu Asn 195 200 205 Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Thr Leu Ala Tyr Gln Tyr Glu Arg Ala Pro Tyr Ser Gln Leu Ile Asp 225 230 235 240 Ala Pro Val Tyr His Lys Gly Ile Phe 245 <210> 162 <211> 726 <212> DNA <213> Gamma proteobacterium <400> 162 ctagtcgata ttgcagctat ggaacggcgc ctcattgtag acgtatgcca gttgcatagc 60 atccagcatg ctccacaata tatcgagctt catttgcaga atacccaatg catgctcttg 120 tgcttcgcgg gtttggaagt gatccagcgt gatttgcaat ccgtgctcaa catcacggcg 180 cgcttcactg aggcgagtac gaaaataacg gtagccctca gcttcaatcc aggggtaatg 240 ctcaggccag ctgtcgagtc ttttttgatg aataattggt gcaaataatt cggtcaaaga 300 cgaacaggcg gcttcctgcc agctcgcttt gcgggcaaag ttaacataag catctaccgc 360 gaaacggacg ccgggtaata cgtgttgaaa actagtgatc tcactgcgct gcagcccaac 420 ggcttcgccg aggcgcagcc aggcctcaat cccgccactg tcttgctcgc tagtgccgtc 480 gtggtccaat atacgctgta cccatagcct gcgcacggta ggctcggtac agttcgcaag 540 gatgttagcg tccttgatcg ggatattaac ctggtagtag taccgattgg cgacccagcc 600 ttgtatttgc tgctggttac attggccgct gttcattgct acatgcagag gatgatgaat 660 atgatacaag gcttctttgg cccgcaagcc tcgttcgaat tcttctcttg accatggttt 720 tgacat 726 <210> 163 <211> 241 <212> PRT <213> Gamma proteobacterium <400> 163 Met Ser Lys Pro Trp Ser Arg Glu Glu Phe Glu Arg Gly Leu Arg Ala 1 5 10 15 Lys Glu Ala Leu Tyr His Ile His His Pro Leu His Val Ala Met Asn 20 25 30 Ser Gly Gln Cys Asn Gln Gln Gln Ile Gln Gly Trp Val Ala Asn Arg 35 40 45 Tyr Tyr Tyr Gln Val Asn Ile Pro Ile Lys Asp Ala Asn Ile Leu Ala 50 55 60 Asn Cys Thr Glu Pro Thr Val Arg Arg Leu Trp Val Gln Arg Ile Leu 65 70 75 80 Asp His Asp Gly Thr Ser Glu Gln Asp Ser Gly Gly Ile Glu Ala Trp 85 90 95 Leu Arg Leu Gly Glu Ala Val Gly Leu Gln Arg Ser Glu Ile Thr Ser 100 105 110 Phe Gln His Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Asn Phe Ala Arg Lys Ala Ser Trp Gln Glu Ala Ala Cys Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Ile Ile His Gln Lys Arg Leu Asp Ser Trp 145 150 155 160 Pro Glu His Tyr Pro Trp Ile Glu Ala Glu Gly Tyr Arg Tyr Phe Arg 165 170 175 Thr Arg Leu Ser Glu Ala Arg Arg Asp Val Glu His Gly Leu Gln Ile 180 185 190 Thr Leu Asp His Phe Gln Thr Arg Glu Ala Gln Glu His Ala Leu Gly 195 200 205 Ile Leu Gln Met Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Met 210 215 220 Gln Leu Ala Tyr Val Tyr Asn Glu Ala Pro Phe His Ser Cys Asn Ile 225 230 235 240 Asp <210> 164 <211> 753 <212> DNA <213> Burkholderia xenovorans <400> 164 tcattgcggg aaggcctttt cgatcgaatc cagcatggtc cacagaatgt cgagcttgaa 60 ttgcaggatc tcgagcgcgc gttcctgctg ttcgcgccgc gtgaaatgat cgagcgtgac 120 ggcgagcccg tgctccacgt cgcgttgtgc aagcgaaatg cgcgagcgga aatacgcgag 180 acccgaagac tcgatccacg gataatgttc cggccagctc gcgagccggt cgcgatgaac 240 ctgcggcgcg aacatttccg tgagcgacga gcagaccgat tcctgccacg gcgcgcggcg 300 cgcaaaattc acataggcgt cgacggcgaa gcgcacgccg ggcgccacct gtttcagcga 360 ccacagatcg tcacgcgaca gcccgaccgc gtcgcccagc cgcgcccatg tttcgatgcc 420 gccttcctcg tcgccgcaac cgtcgtggtc gagaatgcgc agcacccagc ggcggcgtgt 480 ttcgcgatcc gggcaattcg acagcacggc cgcatccttc agcggaatat tgatctgata 540 atagaagcga ttggcgaccc agccgcgaat ctgttcgcgg gagcaaccgc cgctattcat 600 cttcacattg aacggatgat gaatgtgata cgcggcgcct ttcgcgcgca actgtgcttc 660 gaattcttca cgggtccagg ccgggcgctc gtcgcctccg ttcgtttgcg cgttctggcg 720 cggcgccgtg cccaaggtat ctttcgcgtt cat 753 <210> 165 <211> 250 <212> PRT <213> Burkholderia xenovorans <400> 165 Met Asn Ala Lys Asp Thr Leu Gly Thr Ala Pro Arg Gln Asn Ala Gln 1 5 10 15 Thr Asn Gly Gly Asp Glu Arg Pro Ala Trp Thr Arg Glu Glu Phe Glu 20 25 30 Ala Gln Leu Arg Ala Lys Gly Ala Ala Tyr His Ile His His Pro Phe 35 40 45 Asn Val Lys Met Asn Ser Gly Gly Cys Ser Arg Glu Gln Ile Arg Gly 50 55 60 Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Asn Ile Pro Leu Lys Asp 65 70 75 80 Ala Ala Val Leu Ser Asn Cys Pro Asp Arg Glu Thr Arg Arg Arg Trp 85 90 95 Val Leu Arg Ile Leu Asp His Asp Gly Cys Gly Asp Glu Glu Gly Gly 100 105 110 Ile Glu Thr Trp Ala Arg Leu Gly Asp Ala Val Gly Leu Ser Arg Asp 115 120 125 Asp Leu Trp Ser Leu Lys Gln Val Ala Pro Gly Val Arg Phe Ala Val 130 135 140 Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro Trp Gln Glu Ser Val 145 150 155 160 Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Gln Val His Arg Asp Arg 165 170 175 Leu Ala Ser Trp Pro Glu His Tyr Pro Trp Ile Glu Ser Ser Gly Leu 180 185 190 Ala Tyr Phe Arg Ser Arg Ile Ser Leu Ala Gln Arg Asp Val Glu His 195 200 205 Gly Leu Ala Val Thr Leu Asp His Phe Thr Arg Arg Glu Gln Gln Glu 210 215 220 Arg Ala Leu Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Thr Met 225 230 235 240 Leu Asp Ser Ile Glu Lys Ala Phe Pro Gln 245 250 <210> 166 <211> 726 <212> DNA <213> Methylococcus capsulatus <400> 166 atgagccaag acacgatccc ctggagccgc gaagaattcg aggctcggct gcgtgccaag 60 gaaaagtact accacatcca tcacccttac cacgtgttga tggcgagcgg tgagctgaac 120 cgcgagcaga tccagggctg ggtggcgaac cgcttctatt atcagatcac cattccgcgc 180 aaggattcgg ccatcatggc caactgcccg gaccgcgaaa cccgccgcaa atggatgcag 240 cgggtgatgg atcacgacgg ttacggcgat gatcccggcg ggatcgaggc atggatccag 300 ctaggcatcg cctgtggcct gagtcgcgag gacatcacct cgctcaggca tgtactgccc 360 ggcgtgcgtt tcgccgtcga cgcctacctc aacttcgctc gtaccgcgac ctggcaggaa 420 gccgcctgct cttcgctcac cgagctgttt gcgccgacca tccacaaaca acgcctggct 480 ggctggccgg atctgtatcc gtggatcgca gccgacggct tggcctattt ccgcaagcgg 540 gtgactcagg ccagccgcga tgtcgagcac ggcatcgaaa tcacgctgga tcatttcaag 600 acccgcgaac aacaggaacg ggccctggaa atcctccaat tcaagctcga catcctgtgg 660 tcgatgttgg acgccatgta cctcgcctat gtcgacaaaa aaccgcccta tttcaacatc 720 gcctga 726 <210> 167 <211> 241 <212> PRT <213> Methylococcus capsulatus <400> 167 Met Ser Gln Asp Thr Ile Pro Trp Ser Arg Glu Glu Phe Glu Ala Arg 1 5 10 15 Leu Arg Ala Lys Glu Lys Tyr Tyr His Ile His His Pro Tyr His Val 20 25 30 Leu Met Ala Ser Gly Glu Leu Asn Arg Glu Gln Ile Gln Gly Trp Val 35 40 45 Ala Asn Arg Phe Tyr Tyr Gln Ile Thr Ile Pro Arg Lys Asp Ser Ala 50 55 60 Ile Met Ala Asn Cys Pro Asp Arg Glu Thr Arg Arg Lys Trp Met Gln 65 70 75 80 Arg Val Met Asp His Asp Gly Tyr Gly Asp Asp Pro Gly Gly Ile Glu 85 90 95 Ala Trp Ile Gln Leu Gly Ile Ala Cys Gly Leu Ser Arg Glu Asp Ile 100 105 110 Thr Ser Leu Arg His Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala 115 120 125 Tyr Leu Asn Phe Ala Arg Thr Ala Thr Trp Gln Glu Ala Ala Cys Ser 130 135 140 Ser Leu Thr Glu Leu Phe Ala Pro Thr Ile His Lys Gln Arg Leu Ala 145 150 155 160 Gly Trp Pro Asp Leu Tyr Pro Trp Ile Ala Ala Asp Gly Leu Ala Tyr 165 170 175 Phe Arg Lys Arg Val Thr Gln Ala Ser Arg Asp Val Glu His Gly Ile 180 185 190 Glu Ile Thr Leu Asp His Phe Lys Thr Arg Glu Gln Gln Glu Arg Ala 195 200 205 Leu Glu Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp 210 215 220 Ala Met Tyr Leu Ala Tyr Val Asp Lys Lys Pro Pro Tyr Phe Asn Ile 225 230 235 240 Ala <210> 168 <211> 708 <212> DNA <213> Limnobacter sp. <400> 168 tcattttttt ctcttgtcgg gatacgccag tgcaatcgca tcggacatac tccaaagcac 60 gtccagtttg aattgcagaa tttcaagtgc acgttcctgt tgggcacggg ttttgaaata 120 attcaaggtc acttccaggc catgttcaac gtcgcgttgc gccaggctga ttctggagcg 180 aaaataattc aaaccttcag gtgcaaccca tttgtagtct ttgggccagt tgctcaggcg 240 ttgcttgtga atttctggtg caaacatttc agtcaacgat gagcacaccg cttcttgcca 300 gggcgcgcgg cgggcaaaat tcacgtaggc gtccactgca aaacgcacgc ctggaagcac 360 cagttgctgg ctccacagca cgtctttgtc aatgcctact gcttcaccca ggcgactcca 420 ggcttcaatg ccgccagcat tgccttccca gccatcgtga tccagaatgc gctgcaccca 480 acggcgacgg gtttcgcgat cgtcacaatt ggccatcacc gcagcgtctt tttgcggaat 540 gcacacttga taataaaagc ggtttgccac ccagccgcgc agttgttccc ggctcagttt 600 gccctcacgc atggccacgt tgaatgggtg gtgaatgtga tagcggtcgc cctttgcgcg 660 caagcgttct tcgaactcct ttttgctcca ggctttgtta ctgctcat 708 <210> 169 <211> 235 <212> PRT <213> Limnobacter sp. <400> 169 Met Ser Ser Asn Lys Ala Trp Ser Lys Lys Glu Phe Glu Glu Arg Leu 1 5 10 15 Arg Ala Lys Gly Asp Arg Tyr His Ile His His Pro Phe Asn Val Ala 20 25 30 Met Arg Glu Gly Lys Leu Ser Arg Glu Gln Leu Arg Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Cys Ile Pro Gln Lys Asp Ala Ala Val 50 55 60 Met Ala Asn Cys Asp Asp Arg Glu Thr Arg Arg Arg Trp Val Gln Arg 65 70 75 80 Ile Leu Asp His Asp Gly Trp Glu Gly Asn Ala Gly Gly Ile Glu Ala 85 90 95 Trp Ser Arg Leu Gly Glu Ala Val Gly Ile Asp Lys Asp Val Leu Trp 100 105 110 Ser Gln Gln Leu Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Pro Trp Gln Glu Ala Val Cys Ser Ser 130 135 140 Leu Thr Glu Met Phe Ala Pro Glu Ile His Lys Gln Arg Leu Ser Asn 145 150 155 160 Trp Pro Lys Asp Tyr Lys Trp Val Ala Pro Glu Gly Leu Asn Tyr Phe 165 170 175 Arg Ser Arg Ile Ser Leu Ala Gln Arg Asp Val Glu His Gly Leu Glu 180 185 190 Val Thr Leu Asn Tyr Phe Lys Thr Arg Ala Gln Gln Glu Arg Ala Leu 195 200 205 Glu Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser Met Ser Asp Ala 210 215 220 Ile Ala Leu Ala Tyr Pro Asp Lys Arg Lys Lys 225 230 235 <210> 170 <211> 708 <212> DNA <213> Burkholderia phymatum <400> 170 atgagtgtca aaggcagcag cggaccggca tggagccgcg atgaattcga agcgcaattg 60 cgtgcgaagg gacaggcgta tcacatccat catccgttca acgtgaaaat gaacagcggc 120 ggatgttcgc acgagcagat tcgcggctgg gtcgcgaacc gcttctacta tcagatcaac 180 attccgctga aggatgccgc ggtgctgtcg aactgtcccg accgcgacac gcgccgccgc 240 tgggtgctgc gcatactcga tcacgacggt tacggcgaag acgaaggcgg catcgaaaca 300 tgggcgcggc tcggcgatgc ggtcggcctg tcgcgcgatg aactgtggtc gctcgaacac 360 gtggtgccgg gcgtgcgctt cgcggtcgac gcatacgtga actttgcgcg gcgcgcgccg 420 tggcaggaag ccgtctgctc gtcgctcacc gaaatcttcg cgccgcagat ccacaaagac 480 cggctcgcca catggcccga acactacccg tggatcaagc ccgaagggct cgcatatttc 540 cgttcgcgca tttcgcttgc acaacgcgac gtcgaacacg ggctgtccgt cacgctcgat 600 catttccgca cgcgcgacca gcaacagcgc gcgctcgaca ttctgcaatt caagctcgac 660 attctgtgga cgatgctcga cgccatcgag aaggccttcc cagcatga 708 <210> 171 <211> 235 <212> PRT <213> Burkholderia phymatum <400> 171 Met Ser Val Lys Gly Ser Ser Gly Pro Ala Trp Ser Arg Asp Glu Phe 1 5 10 15 Glu Ala Gln Leu Arg Ala Lys Gly Gln Ala Tyr His Ile His His Pro 20 25 30 Phe Asn Val Lys Met Asn Ser Gly Gly Cys Ser His Glu Gln Ile Arg 35 40 45 Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Asn Ile Pro Leu Lys 50 55 60 Asp Ala Ala Val Leu Ser Asn Cys Pro Asp Arg Asp Thr Arg Arg Arg 65 70 75 80 Trp Val Leu Arg Ile Leu Asp His Asp Gly Tyr Gly Glu Asp Glu Gly 85 90 95 Gly Ile Glu Thr Trp Ala Arg Leu Gly Asp Ala Val Gly Leu Ser Arg 100 105 110 Asp Glu Leu Trp Ser Leu Glu His Val Val Pro Gly Val Arg Phe Ala 115 120 125 Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro Trp Gln Glu Ala 130 135 140 Val Cys Ser Ser Leu Thr Glu Ile Phe Ala Pro Gln Ile His Lys Asp 145 150 155 160 Arg Leu Ala Thr Trp Pro Glu His Tyr Pro Trp Ile Lys Pro Glu Gly 165 170 175 Leu Ala Tyr Phe Arg Ser Arg Ile Ser Leu Ala Gln Arg Asp Val Glu 180 185 190 His Gly Leu Ser Val Thr Leu Asp His Phe Arg Thr Arg Asp Gln Gln 195 200 205 Gln Arg Ala Leu Asp Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Thr 210 215 220 Met Leu Asp Ala Ile Glu Lys Ala Phe Pro Ala 225 230 235 <210> 172 <211> 720 <212> DNA <213> Burkholderia cenocepacia <400> 172 atgaacgcac cgatccccgc tacggcgttg cacgcgacgc cctggaccgc gaccgaattc 60 gaggcgcgcc tgcgtgcgct cgaatcgcgc tatcacattc atcatccgtt caaccggcgg 120 ctcaacagcg gcgcctgttc gcccacgcag atccgcggct gggtcgcgaa ccgcttctac 180 taccagatct gcatcccgct caaggatgcg gcgatcctgt cgaactgccc cgaccgcgag 240 acgcgacgcc gctggattca gcggctgatc gaccacgacg ggcagggcga caacgcaggc 300 ggcatcgagg cgtgggtgcg gctcggcgaa gcgtgcggcc tcacgcgcga cgagctgtgg 360 tcgctcgaac acgtgctgcc cggcgtgcgt ttcgcggtgg atgcgtacgt gaacttcgcg 420 cggcgcgcgc cgtggcagga agccgtgtgc tcgtcgctga ccgagatgtt cgcgccgcag 480 atccatctcg accggctcgc gggctggccg tcgcattacc cgtggatcga accggccggg 540 ctgcattact tccgcagccg cgtgccgctc gcgcagcgcg acgtcgagca cgggctcgcg 600 gtgacgctcg cgcatttcac gacaccggag gcgcagcagc gcgcgctcgg cattctgcaa 660 ttcaagctcg acatcctgtg gtcgatgctc gacgccgtcg aaaaggccta cccgttatga 720 <210> 173 <211> 239 <212> PRT <213> Burkholderia cenocepacia <400> 173 Met Asn Ala Pro Ile Pro Ala Thr Ala Leu His Ala Thr Pro Trp Thr 1 5 10 15 Ala Thr Glu Phe Glu Ala Arg Leu Arg Ala Leu Glu Ser Arg Tyr His 20 25 30 Ile His His Pro Phe Asn Arg Arg Leu Asn Ser Gly Ala Cys Ser Pro 35 40 45 Thr Gln Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Cys 50 55 60 Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro Asp Arg Glu 65 70 75 80 Thr Arg Arg Arg Trp Ile Gln Arg Leu Ile Asp His Asp Gly Gln Gly 85 90 95 Asp Asn Ala Gly Gly Ile Glu Ala Trp Val Arg Leu Gly Glu Ala Cys 100 105 110 Gly Leu Thr Arg Asp Glu Leu Trp Ser Leu Glu His Val Leu Pro Gly 115 120 125 Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro 130 135 140 Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Gln 145 150 155 160 Ile His Leu Asp Arg Leu Ala Gly Trp Pro Ser His Tyr Pro Trp Ile 165 170 175 Glu Pro Ala Gly Leu His Tyr Phe Arg Ser Arg Val Pro Leu Ala Gln 180 185 190 Arg Asp Val Glu His Gly Leu Ala Val Thr Leu Ala His Phe Thr Thr 195 200 205 Pro Glu Ala Gln Gln Arg Ala Leu Gly Ile Leu Gln Phe Lys Leu Asp 210 215 220 Ile Leu Trp Ser Met Leu Asp Ala Val Glu Lys Ala Tyr Pro Leu 225 230 235 <210> 174 <211> 720 <212> DNA <213> Burkholderia cenocepacia <400> 174 atgaacgcac cgatccccgc tacggcgttg cacgcgacgc cctggaccgc gaccgaattc 60 gaggcgcgcc tgcgtgcgct cgaatcgcgc tatcacattc atcatccgtt caaccggcgg 120 ctcaacagcg gcgcctgttc gcccacgcag atccgcggct gggtcgcgaa ccgcttctac 180 taccagatct gcatcccgct caaggatgcg gcgatcctgt cgaactgccc cgaccgcgag 240 acgcggcgcc gctggattca gcggctgatc gaccacgacg ggcagggcga caacgcaggc 300 ggcatcgagg cgtgggtgcg gctcggcgaa gcgtgcggcc tgacgcgcga cgagctgtgg 360 tcgctcgaac acgtgctgcc gggcgtgcgt ttcgcggtgg atgcgtatgt gaacttcgcg 420 cggcgcgcgc cctggcagga agccgtgtgc tcgtcgctga ccgagatgtt cgcgccgcag 480 atccatctcg accggctcgc gggctggccg tcgcattacc cgtggatcga accggccggg 540 ctgcattact tccgcagccg cgtgccgctc gcgcagcgcg acgtcgagca tgggctcgcg 600 gtgacgctcg cgcatttcac gacaccggac gcgcagcagc gcgcgctcgg cattctgcaa 660 ttcaagctcg acatcctgtg gtcgatgctc gacgccgtcg aaaaggccta cccgttatga 720 <210> 175 <211> 239 <212> PRT <213> Burkholderia cenocepacia <400> 175 Met Asn Ala Pro Ile Pro Ala Thr Ala Leu His Ala Thr Pro Trp Thr 1 5 10 15 Ala Thr Glu Phe Glu Ala Arg Leu Arg Ala Leu Glu Ser Arg Tyr His 20 25 30 Ile His His Pro Phe Asn Arg Arg Leu Asn Ser Gly Ala Cys Ser Pro 35 40 45 Thr Gln Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Cys 50 55 60 Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro Asp Arg Glu 65 70 75 80 Thr Arg Arg Arg Trp Ile Gln Arg Leu Ile Asp His Asp Gly Gln Gly 85 90 95 Asp Asn Ala Gly Gly Ile Glu Ala Trp Val Arg Leu Gly Glu Ala Cys 100 105 110 Gly Leu Thr Arg Asp Glu Leu Trp Ser Leu Glu His Val Leu Pro Gly 115 120 125 Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro 130 135 140 Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Gln 145 150 155 160 Ile His Leu Asp Arg Leu Ala Gly Trp Pro Ser His Tyr Pro Trp Ile 165 170 175 Glu Pro Ala Gly Leu His Tyr Phe Arg Ser Arg Val Pro Leu Ala Gln 180 185 190 Arg Asp Val Glu His Gly Leu Ala Val Thr Leu Ala His Phe Thr Thr 195 200 205 Pro Asp Ala Gln Gln Arg Ala Leu Gly Ile Leu Gln Phe Lys Leu Asp 210 215 220 Ile Leu Trp Ser Met Leu Asp Ala Val Glu Lys Ala Tyr Pro Leu 225 230 235 <210> 176 <211> 720 <212> DNA <213> Burkholderia cenocepacia <400> 176 atgaacgcac cgatccccgc tacggcgttg cacgcgacgc cctggaccgc gaccgaattc 60 gaggcgcgcc tgcgtgcgct cgaatcgcgc tatcacatcc accatccgtt caaccggcgg 120 ctcaacagcg gcgcttgttc gcccacgcag attcgcggct gggtcgcgaa ccgtttctat 180 taccagatct gcatcccgct caaggatgcg gcgatcctgt cgaactgccc cgaccgcgac 240 acgcggcgcc gctggatcca gcggctgatc gaccacgacg ggcagggcga caacgccggc 300 ggcatcgagg cgtgggtgcg gctcggcgaa gcgtgcggcc tggcgcgcga cgagctgtgg 360 tcgctcgaac acgtgctgcc cggcgtgcgt ttcgcggtgg atgcgtatgt gaacttcgcg 420 cggcgcgcgc cctggcagga agccgtgtgc tcgtcgctga ccgagatgtt cgcgccgcag 480 atccatctcg accggctcgc gggctggccg tcgcattacc cgtggatcga gccggccggg 540 ctgcattact tccgcagccg cgtgccgctc gcgcagcgcg acgtcgagca tgggctcgcg 600 gtgacgctcg cgcatttcac gacaccggac gcgcagcagc gcgcgctcgg cattctgcaa 660 ttcaagctcg acatcctgtg gtcgatgctc gacgccgtcg aaaaggccta cccgttatga 720 <210> 177 <211> 239 <212> PRT <213> Burkholderia cenocepacia <400> 177 Met Asn Ala Pro Ile Pro Ala Thr Ala Leu His Ala Thr Pro Trp Thr 1 5 10 15 Ala Thr Glu Phe Glu Ala Arg Leu Arg Ala Leu Glu Ser Arg Tyr His 20 25 30 Ile His His Pro Phe Asn Arg Arg Leu Asn Ser Gly Ala Cys Ser Pro 35 40 45 Thr Gln Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Cys 50 55 60 Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro Asp Arg Asp 65 70 75 80 Thr Arg Arg Arg Trp Ile Gln Arg Leu Ile Asp His Asp Gly Gln Gly 85 90 95 Asp Asn Ala Gly Gly Ile Glu Ala Trp Val Arg Leu Gly Glu Ala Cys 100 105 110 Gly Leu Ala Arg Asp Glu Leu Trp Ser Leu Glu His Val Leu Pro Gly 115 120 125 Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro 130 135 140 Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Gln 145 150 155 160 Ile His Leu Asp Arg Leu Ala Gly Trp Pro Ser His Tyr Pro Trp Ile 165 170 175 Glu Pro Ala Gly Leu His Tyr Phe Arg Ser Arg Val Pro Leu Ala Gln 180 185 190 Arg Asp Val Glu His Gly Leu Ala Val Thr Leu Ala His Phe Thr Thr 195 200 205 Pro Asp Ala Gln Gln Arg Ala Leu Gly Ile Leu Gln Phe Lys Leu Asp 210 215 220 Ile Leu Trp Ser Met Leu Asp Ala Val Glu Lys Ala Tyr Pro Leu 225 230 235 <210> 178 <211> 696 <212> DNA <213> Dechloromonas aromatica <400> 178 atgatgaccc cgtggaatca cgccgaattc gaggcgaaac tgcgcgacaa gggggccgct 60 taccacatct accatccgtt caacgtcttg ctgaacaccg ggcaggcgaa gcgcgaacag 120 atccagggct gggtggccaa ccgctactat taccagatca tcatcccggt caaggatgcg 180 gcgatcatgt ccaactgccc tgatcgcgaa atacggcgcg actggattca gcgcatcatc 240 gaccacgatg gccgtggcga cgacgccggt ggtatcgaag cgtggattcg cctaggtgaa 300 gcggtcgggc tggcgcgaga agaaatcacc gatctgcgcc acgttattcc agccgtgcgc 360 tttgcctgtg atgcctatct caacttctgt cgccggcagc cgtggcagga agcggtgtgt 420 tcgtcgctga ccgagttgtt cgcgccgaag attcacaagg agcgcctggc caactggccc 480 gagttctacc catggatcga atcgaccggc ctgcagtatt ttcgtaaccg ggttacccag 540 gccaggcgcg acgtcgagca ggggctggcg gttaccctag actacttcga taccccggcc 600 ctgcaggctc gtgcgctgga catcctgcag ttcaagctcg acatcctgtg gtcaatgaac 660 gatgccatgg cgctgcgcta tggcgtcaac aaatga 696 <210> 179 <211> 231 <212> PRT <213> Dechloromonas aromatica <400> 179 Met Met Thr Pro Trp Asn His Ala Glu Phe Glu Ala Lys Leu Arg Asp 1 5 10 15 Lys Gly Ala Ala Tyr His Ile Tyr His Pro Phe Asn Val Leu Leu Asn 20 25 30 Thr Gly Gln Ala Lys Arg Glu Gln Ile Gln Gly Trp Val Ala Asn Arg 35 40 45 Tyr Tyr Tyr Gln Ile Ile Ile Pro Val Lys Asp Ala Ala Ile Met Ser 50 55 60 Asn Cys Pro Asp Arg Glu Ile Arg Arg Asp Trp Ile Gln Arg Ile Ile 65 70 75 80 Asp His Asp Gly Arg Gly Asp Asp Ala Gly Gly Ile Glu Ala Trp Ile 85 90 95 Arg Leu Gly Glu Ala Val Gly Leu Ala Arg Glu Glu Ile Thr Asp Leu 100 105 110 Arg His Val Ile Pro Ala Val Arg Phe Ala Cys Asp Ala Tyr Leu Asn 115 120 125 Phe Cys Arg Arg Gln Pro Trp Gln Glu Ala Val Cys Ser Ser Leu Thr 130 135 140 Glu Leu Phe Ala Pro Lys Ile His Lys Glu Arg Leu Ala Asn Trp Pro 145 150 155 160 Glu Phe Tyr Pro Trp Ile Glu Ser Thr Gly Leu Gln Tyr Phe Arg Asn 165 170 175 Arg Val Thr Gln Ala Arg Arg Asp Val Glu Gln Gly Leu Ala Val Thr 180 185 190 Leu Asp Tyr Phe Asp Thr Pro Ala Leu Gln Ala Arg Ala Leu Asp Ile 195 200 205 Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Asn Asp Ala Met Ala 210 215 220 Leu Arg Tyr Gly Val Asn Lys 225 230 <210> 180 <211> 723 <212> DNA <213> Nitrosococcus oceani <400> 180 gtggcgggaa aaaaaccctg gagccgtgaa gaattcgagc agaagctgca ggaaaaagaa 60 tgcttctacc acattcacca ccccttccag gtattaatga acaacggcaa gctgaaccag 120 taccaggtcc aaggatgggt agccaaccgc ttttattacc atacctgtat ccctctcaag 180 gatgccgcta tcctagccaa ctgctcccag cgatcagtgc ggcgccaatg ggtacagcga 240 atcctggatc atgacggtta cggcgaagac gtaggtggca tcgaagcctg gcttcagcta 300 ggcgaagccg tgggcttaag ccgggaaacg ctggaatccc agcaacaggt tctgcccgga 360 gtacgctttg ccgttgacgc ttatgtcaac tttgcccgcc atgctacctg gcaggaagct 420 gtctgctctt ctcttacgga gctctttgcc ccttcgctcc atcaacaacg attagacaac 480 tggcctcgct attacccttg gattaaagcg gaaggctacc attattttcg caagcgcctc 540 aacgaagccc gacgggatgt tcgacacggc ctagaagcga ccctggatta ctttcaaagc 600 cgcacccagc aggagcaggc gctagctatc ttacagttta aactggatgt actatggacc 660 ctactggatg ccctctggat ggcgtacatt gaaaatcgtc ccccctatca cacagagctt 720 taa 723 <210> 181 <211> 240 <212> PRT <213> Nitrosococcus oceani <400> 181 Met Ala Gly Lys Lys Pro Trp Ser Arg Glu Glu Phe Glu Gln Lys Leu 1 5 10 15 Gln Glu Lys Glu Cys Phe Tyr His Ile His His Pro Phe Gln Val Leu 20 25 30 Met Asn Asn Gly Lys Leu Asn Gln Tyr Gln Val Gln Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr His Thr Cys Ile Pro Leu Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Ser Gln Arg Ser Val Arg Arg Gln Trp Val Gln Arg 65 70 75 80 Ile Leu Asp His Asp Gly Tyr Gly Glu Asp Val Gly Gly Ile Glu Ala 85 90 95 Trp Leu Gln Leu Gly Glu Ala Val Gly Leu Ser Arg Glu Thr Leu Glu 100 105 110 Ser Gln Gln Gln Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg His Ala Thr Trp Gln Glu Ala Val Cys Ser Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Ser Leu His Gln Gln Arg Leu Asp Asn 145 150 155 160 Trp Pro Arg Tyr Tyr Pro Trp Ile Lys Ala Glu Gly Tyr His Tyr Phe 165 170 175 Arg Lys Arg Leu Asn Glu Ala Arg Arg Asp Val Arg His Gly Leu Glu 180 185 190 Ala Thr Leu Asp Tyr Phe Gln Ser Arg Thr Gln Gln Glu Gln Ala Leu 195 200 205 Ala Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Thr Leu Leu Asp Ala 210 215 220 Leu Trp Met Ala Tyr Ile Glu Asn Arg Pro Pro Tyr His Thr Glu Leu 225 230 235 240 <210> 182 <211> 714 <212> DNA <213> Ralstonia pickettii <400> 182 tcagcgagtg ggatacgcgc gctcaatcgc gtcaagcatc gaccagagga catcaagttt 60 gaattgcagg atgtcgaggg cgcgctcttg ctgcgcacgt gtcgtgaagt gtgccagtgt 120 caccttcagg ccatgttcga catcgcgctg tgcgagcgtg atccggctgc ggaagtagtg 180 cagaccaccg gcttcgatcc acggataatg ttgcggccag ttggctagcc ggtcgcggtg 240 aatctttggc gcaaacattt cggtcagcga tgagcacacc gcctcttgcc acggcacgct 300 ccgtgcaaaa ttcacgtaag cgtcgacggc aaagcgtaca cccggcacta catgcttgag 360 cgaccagagg tcttgctcag gtatgcctgc agcctcaccc agccgcaccc aggcctcgat 420 accgccaggg ctatcagcat tcccatcatg atcgagaatt ctctgcaccc aaagccggcg 480 ggtttcgcga tccgggcaat tggcgatgat ggcgccatcc ttgcgaggga tgttgacctg 540 gtaataaaaa cggttggcga tccagccccg aacctggtcg ggcgtcagtt caccattgtt 600 catgcgcacg ttgaacggat gatggatgtg gtagccagcg ccctttgcgc gcaactgcac 660 ctcgaactcc tcaggcggcc atgcagcgtc ggggcttgcg ttggttcggc tcaa 714 <210> 183 <211> 237 <212> PRT <213> Ralstonia pickettii <400> 183 Met Ser Arg Thr Asn Ala Ser Pro Asp Ala Ala Trp Pro Pro Glu Glu 1 5 10 15 Phe Glu Val Gln Leu Arg Ala Lys Gly Ala Gly Tyr His Ile His His 20 25 30 Pro Phe Asn Val Arg Met Asn Asn Gly Glu Leu Thr Pro Asp Gln Val 35 40 45 Arg Gly Trp Ile Ala Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Arg 50 55 60 Lys Asp Gly Ala Ile Ile Ala Asn Cys Pro Asp Arg Glu Thr Arg Arg 65 70 75 80 Leu Trp Val Gln Arg Ile Leu Asp His Asp Gly Asn Ala Asp Ser Pro 85 90 95 Gly Gly Ile Glu Ala Trp Val Arg Leu Gly Glu Ala Ala Gly Ile Pro 100 105 110 Glu Gln Asp Leu Trp Ser Leu Lys His Val Val Pro Gly Val Arg Phe 115 120 125 Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Ser Val Pro Trp Gln Glu 130 135 140 Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Lys Ile His Arg 145 150 155 160 Asp Arg Leu Ala Asn Trp Pro Gln His Tyr Pro Trp Ile Glu Ala Gly 165 170 175 Gly Leu His Tyr Phe Arg Ser Arg Ile Thr Leu Ala Gln Arg Asp Val 180 185 190 Glu His Gly Leu Lys Val Thr Leu Ala His Phe Thr Thr Arg Ala Gln 195 200 205 Gln Glu Arg Ala Leu Asp Ile Leu Gln Phe Lys Leu Asp Val Leu Trp 210 215 220 Ser Met Leu Asp Ala Ile Glu Arg Ala Tyr Pro Thr Arg 225 230 235 <210> 184 <211> 792 <212> DNA <213> Azoarcus sp. <400> 184 atggaagccg aactgctcgc cgcgcctgct gcacgtacgc ttgcccccaa cgccggcacc 60 cacgaccgcc cgccgatgtc gcgcgaggaa ttcgaagcgc agctgcgcgc caagggcacc 120 agctaccaca tctaccaccc cttccacgtg atgatggccg aagggcgcct gacgccggcc 180 cagctgcgcg gctgggtggc gaaccgcttc tactaccaga tcgcgatccc ggtgaaggac 240 gcggccatca tgtccaactg cccggaccgc gagatccgcc gcgagtggat acagcgcatc 300 ctcgaccacg acggctacga gatcggcggt gtgtccgacc ccggcggcat cgaggcctgg 360 atacggctgg gcgaggcggt ggggctgagc cgcgacgatg tcacctcgct gcgcttcgtc 420 gcgccggcgg cgcgctttgc ggtggatgcc tacatcaatt tcgcccgcca gcggccgtgg 480 gaagaggcgg tggcttccag ccttaccgag ttgttcgcac cccacatcca ccagcagcgc 540 atcgacacct ggccgcaggt ctatccctgg gtgaagaccg agggtttgca gtatttccgc 600 aaccgcctga cccaggcgcg ccgcgacgtc gcccacggcc tgcgcttcac gctggagcac 660 ttcagccaga cgcgcgcgct gcaggaacgc gcgctggaga tcctgcagtt caagctcgac 720 gtgctgtggg cgctggccga cgcgatcatg ctcagccagt gcgaaatcga gatcaagggg 780 ccgaaggcat ga 792 <210> 185 <211> 263 <212> PRT <213> Azoarcus sp. <400> 185 Met Glu Ala Glu Leu Leu Ala Ala Pro Ala Ala Arg Thr Leu Ala Pro 1 5 10 15 Asn Ala Gly Thr His Asp Arg Pro Pro Met Ser Arg Glu Glu Phe Glu 20 25 30 Ala Gln Leu Arg Ala Lys Gly Thr Ser Tyr His Ile Tyr His Pro Phe 35 40 45 His Val Met Met Ala Glu Gly Arg Leu Thr Pro Ala Gln Leu Arg Gly 50 55 60 Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Ala Ile Pro Val Lys Asp 65 70 75 80 Ala Ala Ile Met Ser Asn Cys Pro Asp Arg Glu Ile Arg Arg Glu Trp 85 90 95 Ile Gln Arg Ile Leu Asp His Asp Gly Tyr Glu Ile Gly Gly Val Ser 100 105 110 Asp Pro Gly Gly Ile Glu Ala Trp Ile Arg Leu Gly Glu Ala Val Gly 115 120 125 Leu Ser Arg Asp Asp Val Thr Ser Leu Arg Phe Val Ala Pro Ala Ala 130 135 140 Arg Phe Ala Val Asp Ala Tyr Ile Asn Phe Ala Arg Gln Arg Pro Trp 145 150 155 160 Glu Glu Ala Val Ala Ser Ser Leu Thr Glu Leu Phe Ala Pro His Ile 165 170 175 His Gln Gln Arg Ile Asp Thr Trp Pro Gln Val Tyr Pro Trp Val Lys 180 185 190 Thr Glu Gly Leu Gln Tyr Phe Arg Asn Arg Leu Thr Gln Ala Arg Arg 195 200 205 Asp Val Ala His Gly Leu Arg Phe Thr Leu Glu His Phe Ser Gln Thr 210 215 220 Arg Ala Leu Gln Glu Arg Ala Leu Glu Ile Leu Gln Phe Lys Leu Asp 225 230 235 240 Val Leu Trp Ala Leu Ala Asp Ala Ile Met Leu Ser Gln Cys Glu Ile 245 250 255 Glu Ile Lys Gly Pro Lys Ala 260 <210> 186 <211> 720 <212> DNA <213> Burkholderia multivorans <400> 186 tcatgcgcaa tacgcctttt caatggcatc gaggatcgac cacagcacgt cgagcttgaa 60 cgtcagaatc tcgagcgcgc gccgttgcgc gtccgcggtc gtgaaatgcg cgagcgtgac 120 cgcgaggccg tgttcgacgt cgcgctgcgc gagcggcagg cggctgcgga aatactgcag 180 cccgtccgcg tcgatccacg aatagtgcga cggccagccg gcgagacggt cgaggtggat 240 ctgcggcgcg aacatctcgg tcagcgacga gcagaccgct tcctgccacg tcgcgcgccg 300 cgcgaagttc acgtacgcgt cgacggcaaa gcgcacgccc ggcagcacgt gctcgagcga 360 ccacagcgcc gcgcgatcga gaccgaccgc ctcgccgagc cgcacccacg cttcgatgcc 420 gccggcatcg tcgccgtgcc cgtcgtgatc gaggatgcgc tgcacccaca gccggcgcgt 480 gtcgcggtcc ggacagttcg agaggatcgc cgcgtccttc agcgggatgc tgatctgata 540 gtagaagcgg ttcgcgaccc agccgcgaat ctgcgcgggc gtgcacgcgc ccgcattgag 600 ccgccggttg aacggatggt gaatgtgata gcgcgattcg agcgcgcgca gacgcgcctc 660 gaattcgtcg gcgctccacg ggctcgcgtg cagcgccgcc gcggaaatcg gtgcgttcat 720 <210> 187 <211> 239 <212> PRT <213> Burkholderia multivorans <400> 187 Met Asn Ala Pro Ile Ser Ala Ala Ala Leu His Ala Ser Pro Trp Ser 1 5 10 15 Ala Asp Glu Phe Glu Ala Arg Leu Arg Ala Leu Glu Ser Arg Tyr His 20 25 30 Ile His His Pro Phe Asn Arg Arg Leu Asn Ala Gly Ala Cys Thr Pro 35 40 45 Ala Gln Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Ser 50 55 60 Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro Asp Arg Asp 65 70 75 80 Thr Arg Arg Leu Trp Val Gln Arg Ile Leu Asp His Asp Gly His Gly 85 90 95 Asp Asp Ala Gly Gly Ile Glu Ala Trp Val Arg Leu Gly Glu Ala Val 100 105 110 Gly Leu Asp Arg Ala Ala Leu Trp Ser Leu Glu His Val Leu Pro Gly 115 120 125 Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Thr 130 135 140 Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Gln 145 150 155 160 Ile His Leu Asp Arg Leu Ala Gly Trp Pro Ser His Tyr Ser Trp Ile 165 170 175 Asp Ala Asp Gly Leu Gln Tyr Phe Arg Ser Arg Leu Pro Leu Ala Gln 180 185 190 Arg Asp Val Glu His Gly Leu Ala Val Thr Leu Ala His Phe Thr Thr 195 200 205 Ala Asp Ala Gln Arg Arg Ala Leu Glu Ile Leu Thr Phe Lys Leu Asp 210 215 220 Val Leu Trp Ser Ile Leu Asp Ala Ile Glu Lys Ala Tyr Cys Ala 225 230 235 <210> 188 <211> 735 <212> DNA <213> Verminephrobacter eiseniae <400> 188 atgcccgccc ccgttgcccc agccattgcg cccaccgtcc cgccagccat ccccgacgcc 60 gagcgcgccg ccttcgaggc ccggctgcgc gcactgcaag cgcgctacca catccaccac 120 ccgttcaacc aacgcatggc cagcgggcaa tgctcacgcg cccagataca gggctgggtg 180 gcgaaccgct tttactacca ggtcaacatt ccgctcaagg atgcggccat cctgtcgaac 240 tgccccgacc gcgcaacgcg gcgcgaatgg gtggtgcgca ttctcgacca cgatggcagc 300 gccgccgagc ccggcggcat cgaagcctgg agccggctcg gcgaggccgt ggggctgacg 360 cgcgcggccc tgtggtcaca gcagatggtg ctgcccgggg tgcgctttgc ggtcgatgcc 420 tacgtcaact ttgcgcggcg cgcaccttgg caggaagccg tgtgctcgtc gctgaccgag 480 atgttcgcgc ccgccatcca ccaggaacgg ctggccggct ggccgcagca ctacccctgg 540 atcgaagccg aaggtctggc ctatttccgt tcacgcatcc cgctggcgca gcgcgatgtc 600 gagcatggcc tgcgcgtcac gctcgagcac tttcgcacgc cggccgagca gcagcgcgcc 660 acgcaaatcc tgcagttcaa gctcgacatc ctgtggtcga tgctcgacgc gatcgaaaag 720 gcgtaccccg aatga 735 <210> 189 <211> 244 <212> PRT <213> Verminephrobacter eiseniae <400> 189 Met Pro Ala Pro Val Ala Pro Ala Ile Ala Pro Thr Val Pro Pro Ala 1 5 10 15 Ile Pro Asp Ala Glu Arg Ala Ala Phe Glu Ala Arg Leu Arg Ala Leu 20 25 30 Gln Ala Arg Tyr His Ile His His Pro Phe Asn Gln Arg Met Ala Ser 35 40 45 Gly Gln Cys Ser Arg Ala Gln Ile Gln Gly Trp Val Ala Asn Arg Phe 50 55 60 Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn 65 70 75 80 Cys Pro Asp Arg Ala Thr Arg Arg Glu Trp Val Val Arg Ile Leu Asp 85 90 95 His Asp Gly Ser Ala Ala Glu Pro Gly Gly Ile Glu Ala Trp Ser Arg 100 105 110 Leu Gly Glu Ala Val Gly Leu Thr Arg Ala Ala Leu Trp Ser Gln Gln 115 120 125 Met Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe 130 135 140 Ala Arg Arg Ala Pro Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu 145 150 155 160 Met Phe Ala Pro Ala Ile His Gln Glu Arg Leu Ala Gly Trp Pro Gln 165 170 175 His Tyr Pro Trp Ile Glu Ala Glu Gly Leu Ala Tyr Phe Arg Ser Arg 180 185 190 Ile Pro Leu Ala Gln Arg Asp Val Glu His Gly Leu Arg Val Thr Leu 195 200 205 Glu His Phe Arg Thr Pro Ala Glu Gln Gln Arg Ala Thr Gln Ile Leu 210 215 220 Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala Ile Glu Lys 225 230 235 240 Ala Tyr Pro Glu <210> 190 <211> 720 <212> DNA <213> Burkholderia vietnamiensis <400> 190 tcatgcggga tatgcctttt cgatcgcatc gagaatctgc cacaggacat ccagcttgaa 60 cgacaggatg tcgagcgcgc gccgttgcgc gtcaggtgtc gtgaaatgac tcagcgtcac 120 cgcgagcccg tgctcgacgt cgcgctgcgc gagcggcacg cggctgcgga aatactgcag 180 gccgtcggcc tcgatccacg ggtagtgcga cggccagccg gccagccggt cgaggtggat 240 ctgcggcgcg aacatctcgg tcagcgacga gcacacggct tcctgccacg gcgcgcgacg 300 cgcgaagttg acgtacgcat cgaccgcgaa gcgcacgccc ggcagcacgt gctcgagcga 360 ccacagctgc gcgcgctcga tgccgaccgc ctcgccgagc cgcgcccacg cctcgatgcc 420 gccttcgctc tcgccgtgcc cgtcgtggtc gagaatccgc tcgacccaca ggcggcgcgt 480 ctcgcggtcg gggcagttcg acaggatcgc cgcgtccttc agcggaatgc tgatctgata 540 gtagaagcgg ttcgcgaccc agccgcgaat ctgctcgcgc gagcattcgc cggcattcat 600 ccgccggttg aacggatgat gaatgtgata gcgcgattcg agcgcgcgca ggcgcgcctc 660 gaactcctgc gcgctccagg gcgtcgcgtg cagcgccgcg gcgggaatcg gtgcgttcat 720 <210> 191 <211> 239 <212> PRT <213> Burkholderia vietnamiensis <400> 191 Met Asn Ala Pro Ile Pro Ala Ala Ala Leu His Ala Thr Pro Trp Ser 1 5 10 15 Ala Gln Glu Phe Glu Ala Arg Leu Arg Ala Leu Glu Ser Arg Tyr His 20 25 30 Ile His His Pro Phe Asn Arg Arg Met Asn Ala Gly Glu Cys Ser Arg 35 40 45 Glu Gln Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Ser 50 55 60 Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro Asp Arg Glu 65 70 75 80 Thr Arg Arg Leu Trp Val Glu Arg Ile Leu Asp His Asp Gly His Gly 85 90 95 Glu Ser Glu Gly Gly Ile Glu Ala Trp Ala Arg Leu Gly Glu Ala Val 100 105 110 Gly Ile Glu Arg Ala Gln Leu Trp Ser Leu Glu His Val Leu Pro Gly 115 120 125 Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro 130 135 140 Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Gln 145 150 155 160 Ile His Leu Asp Arg Leu Ala Gly Trp Pro Ser His Tyr Pro Trp Ile 165 170 175 Glu Ala Asp Gly Leu Gln Tyr Phe Arg Ser Arg Val Pro Leu Ala Gln 180 185 190 Arg Asp Val Glu His Gly Leu Ala Val Thr Leu Ser His Phe Thr Thr 195 200 205 Pro Asp Ala Gln Arg Arg Ala Leu Asp Ile Leu Ser Phe Lys Leu Asp 210 215 220 Val Leu Trp Gln Ile Leu Asp Ala Ile Glu Lys Ala Tyr Pro Ala 225 230 235 <210> 192 <211> 735 <212> DNA <213> Methylophilales bacterium <400> 192 atgacaaaac cttggacaag agacgagttt gaagatcgac taagaaagaa gggtaagggg 60 tatcatatat accatccttt tcacgtaatg atgtacgaag gaaaacttag caaagaacaa 120 ctacaaagct gggttttaaa ccgtttttac tatcagataa gcatcccatt aaaagatgcg 180 gcaatcttat caaattgccc cgtgaaagaa atcagaaaag aatggatagt aagaatatta 240 gaccatgatg gagagggaga tgctgacggt gggattgagg catggattaa tttaggtaga 300 gcagtcggac taacacgaga ggatgttact tctttaaagc atgtaagtcc tggagttaaa 360 tttgccgtag atgcctatat aaatttcgca aaacaaaaat cgtggcaaga gtctgtttgc 420 tcctcattaa ctgaattatt tgcaccacac attcatcaac aaagaattag ctcatggccg 480 tctatgtacc catggatcga tgaatctggc ctcacatact ttaaaaagcg acttacggaa 540 gcgagacggg atgtggagca tggtttaggt gtaacccttg attattttag taaaacacgt 600 gaaacacaag agcaagcttt agaaatactt caatttaaac ttaatgtttt atgggttatt 660 gcagattcaa tcatgctagc atcatctaat attaaggtag aagatcgaga ctacttaagg 720 caaccaataa actaa 735 <210> 193 <211> 244 <212> PRT <213> Methylophilales bacterium <400> 193 Met Thr Lys Pro Trp Thr Arg Asp Glu Phe Glu Asp Arg Leu Arg Lys 1 5 10 15 Lys Gly Lys Gly Tyr His Ile Tyr His Pro Phe His Val Met Met Tyr 20 25 30 Glu Gly Lys Leu Ser Lys Glu Gln Leu Gln Ser Trp Val Leu Asn Arg 35 40 45 Phe Tyr Tyr Gln Ile Ser Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser 50 55 60 Asn Cys Pro Val Lys Glu Ile Arg Lys Glu Trp Ile Val Arg Ile Leu 65 70 75 80 Asp His Asp Gly Glu Gly Asp Ala Asp Gly Gly Ile Glu Ala Trp Ile 85 90 95 Asn Leu Gly Arg Ala Val Gly Leu Thr Arg Glu Asp Val Thr Ser Leu 100 105 110 Lys His Val Ser Pro Gly Val Lys Phe Ala Val Asp Ala Tyr Ile Asn 115 120 125 Phe Ala Lys Gln Lys Ser Trp Gln Glu Ser Val Cys Ser Ser Leu Thr 130 135 140 Glu Leu Phe Ala Pro His Ile His Gln Gln Arg Ile Ser Ser Trp Pro 145 150 155 160 Ser Met Tyr Pro Trp Ile Asp Glu Ser Gly Leu Thr Tyr Phe Lys Lys 165 170 175 Arg Leu Thr Glu Ala Arg Arg Asp Val Glu His Gly Leu Gly Val Thr 180 185 190 Leu Asp Tyr Phe Ser Lys Thr Arg Glu Thr Gln Glu Gln Ala Leu Glu 195 200 205 Ile Leu Gln Phe Lys Leu Asn Val Leu Trp Val Ile Ala Asp Ser Ile 210 215 220 Met Leu Ala Ser Ser Asn Ile Lys Val Glu Asp Arg Asp Tyr Leu Arg 225 230 235 240 Gln Pro Ile Asn <210> 194 <211> 753 <212> DNA <213> Methylobacillus flagellatus <400> 194 ttatcgtggc tgtctgagat agtcgacatg ttgttctacc ttgatgttgg ttgaggcaag 60 cataatggca tcggcaatga cccacagcac atccagcttg aattgcagaa tatccagtgc 120 cttttcttgc aattcacggc tctggctgaa gtaatccagg gtcacggcga gcccttgctc 180 gacatcgcgc ctggcttcgg tcaggcgctt cttgaaatag gtcaggccct cttccttaac 240 ccagggatac atgctgggcc aggagctgat gcgctgttga tggatgtgcg gcgcaaacag 300 ttcggtcaga gaggaacaga cggcctcctg ccaagggcgc tgcttggcga aattgacata 360 ggcatccact gcgaacctga caccgggcgc gacaaacttg agggacgtca cgtcctcgcg 420 actcaggccg actgcctggc cgagctgtat ccacgcctcg atgccaccga cgttatttgc 480 atccccgtca tggtcaatga tgcgttggat ccatccctta cggatttcct tgtccgggca 540 gttggacaga atggccgcat ccttttgcgg gatgctgatc tggtaataaa agcggttggc 600 gacccagcac tgcaattgct cgcgggtgag cttgccttca tacatcatca cgtggaacgg 660 gtggtagata tggtatcccc tacccttgtc gcgcagcttc tgctcgaact cttcgcgtgt 720 ccagggaata ttatctgtca gtggtgcatt cat 753 <210> 195 <211> 250 <212> PRT <213> Methylobacillus flagellatus <400> 195 Met Asn Ala Pro Leu Thr Asp Asn Ile Pro Trp Thr Arg Glu Glu Phe 1 5 10 15 Glu Gln Lys Leu Arg Asp Lys Gly Arg Gly Tyr His Ile Tyr His Pro 20 25 30 Phe His Val Met Met Tyr Glu Gly Lys Leu Thr Arg Glu Gln Leu Gln 35 40 45 Cys Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Ser Ile Pro Gln Lys 50 55 60 Asp Ala Ala Ile Leu Ser Asn Cys Pro Asp Lys Glu Ile Arg Lys Gly 65 70 75 80 Trp Ile Gln Arg Ile Ile Asp His Asp Gly Asp Ala Asn Asn Val Gly 85 90 95 Gly Ile Glu Ala Trp Ile Gln Leu Gly Gln Ala Val Gly Leu Ser Arg 100 105 110 Glu Asp Val Thr Ser Leu Lys Phe Val Ala Pro Gly Val Arg Phe Ala 115 120 125 Val Asp Ala Tyr Val Asn Phe Ala Lys Gln Arg Pro Trp Gln Glu Ala 130 135 140 Val Cys Ser Ser Leu Thr Glu Leu Phe Ala Pro His Ile His Gln Gln 145 150 155 160 Arg Ile Ser Ser Trp Pro Ser Met Tyr Pro Trp Val Lys Glu Glu Gly 165 170 175 Leu Thr Tyr Phe Lys Lys Arg Leu Thr Glu Ala Arg Arg Asp Val Glu 180 185 190 Gln Gly Leu Ala Val Thr Leu Asp Tyr Phe Ser Gln Ser Arg Glu Leu 195 200 205 Gln Glu Lys Ala Leu Asp Ile Leu Gln Phe Lys Leu Asp Val Leu Trp 210 215 220 Val Ile Ala Asp Ala Ile Met Leu Ala Ser Thr Asn Ile Lys Val Glu 225 230 235 240 Gln His Val Asp Tyr Leu Arg Gln Pro Arg 245 250 <210> 196 <211> 693 <212> DNA <213> Ralstonia eutropha <400> 196 atgacatatt ccaccgcatc gggtcccgcg gagttcgaag cgcggctgcg cgccaaagaa 60 accggctacc acattcatca cccgttcaac cagcgcatgg cggccggatt gtgttcgccg 120 ggacagatcc gcgcctgggt cgccaaccgc ttctactacc aggccaatat cccgctgaag 180 gacgccgcca tccttgccaa ctgccccgag cgcgacacgc gccgcgagtg ggtggtacgc 240 atcctggacc acgacgggac tgacacccag cccggtggca ttgaagcctg gctgcggctg 300 ggccaagcca tagggctcga gcgcgcggca ttgcttgacc atcggcacgt gctcccaggg 360 gtgcgctttg ccgtcgacgc ctatgtcaac tttgcgcggc gagcgccgtg gcaggaagcc 420 gtgtgctcct cgctcaccga gatgtttgcc ccggagatcc acaaggagcg gctcgcgggc 480 tggcccacgc attacccttg gatcgaggcc gccgggctcg attactttcg ctcgcgcatc 540 ccgctcgcgc agcgcgacgt cgagcacggc ctgcgcgtga cgctgggcta cttccgtaca 600 ccggagcaac agcaacgcgc gctcgatatc ctgcaattca agctcgacgt gctgtggtcg 660 atgctcgatg ccatccagct agccaaccca tga 693 <210> 197 <211> 230 <212> PRT <213> Ralstonia eutropha <400> 197 Met Thr Tyr Ser Thr Ala Ser Gly Pro Ala Glu Phe Glu Ala Arg Leu 1 5 10 15 Arg Ala Lys Glu Thr Gly Tyr His Ile His His Pro Phe Asn Gln Arg 20 25 30 Met Ala Ala Gly Leu Cys Ser Pro Gly Gln Ile Arg Ala Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Ala Asn Ile Pro Leu Lys Asp Ala Ala Ile 50 55 60 Leu Ala Asn Cys Pro Glu Arg Asp Thr Arg Arg Glu Trp Val Val Arg 65 70 75 80 Ile Leu Asp His Asp Gly Thr Asp Thr Gln Pro Gly Gly Ile Glu Ala 85 90 95 Trp Leu Arg Leu Gly Gln Ala Ile Gly Leu Glu Arg Ala Ala Leu Leu 100 105 110 Asp His Arg His Val Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Pro Trp Gln Glu Ala Val Cys Ser Ser 130 135 140 Leu Thr Glu Met Phe Ala Pro Glu Ile His Lys Glu Arg Leu Ala Gly 145 150 155 160 Trp Pro Thr His Tyr Pro Trp Ile Glu Ala Ala Gly Leu Asp Tyr Phe 165 170 175 Arg Ser Arg Ile Pro Leu Ala Gln Arg Asp Val Glu His Gly Leu Arg 180 185 190 Val Thr Leu Gly Tyr Phe Arg Thr Pro Glu Gln Gln Gln Arg Ala Leu 195 200 205 Asp Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser Met Leu Asp Ala 210 215 220 Ile Gln Leu Ala Asn Pro 225 230 <210> 198 <211> 720 <212> DNA <213> Burkholderia ambifaria <400> 198 atgaacgcac cgattcccgc cgcggcgctg cacgcgacgc cctggagtgc gcaggagttc 60 gaggcgcgtc tgcgcgcgct cgaatcgcgc taccacatcc atcacccgtt caaccggcgc 120 ctgaataccg gcgcgtgctc gcccgagcag atccgcggct gggtcgcgaa ccgcttctac 180 taccagatca gcattccgct gaaggacgcg gcgatcctgt ccaattgccc ggaccgcgat 240 acgcgccgac tgtgggtcga gcggatcctc gatcacgatg gtcacggcgg gcaggaaggc 300 gggatcgagg catgggcgcg cctcggcgaa gcggtcggca tcgagcgcgc ggaattgtgg 360 tcgctcgtgc acgtgctgcc cggcgtgcgg ttcgcggtcg acgcgtacgt gaatttcgcg 420 cggcatgcgc catggcagga agccgtgtgc tcgtcgctga ccgagatgtt cgcgccacag 480 atccatctcg atcggctcgc ggggtggccg tcccactatc cgtggatcga ggcggacggg 540 ctgcagtatt tccgcagccg cgtgccgctc gcgcagcgcg acgtcgagca cgggctcgcg 600 gtcacgctga accatttcac gacaccggac gcgcaacggc gcgcgctcga catcctgtcg 660 ttcaagctgg atgtgctgtg gtcgattctc gacgcgattg aaaaggccta ccccgcatga 720 <210> 199 <211> 239 <212> PRT <213> Burkholderia ambifaria <400> 199 Met Asn Ala Pro Ile Pro Ala Ala Ala Leu His Ala Thr Pro Trp Ser 1 5 10 15 Ala Gln Glu Phe Glu Ala Arg Leu Arg Ala Leu Glu Ser Arg Tyr His 20 25 30 Ile His His Pro Phe Asn Arg Arg Leu Asn Thr Gly Ala Cys Ser Pro 35 40 45 Glu Gln Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Ser 50 55 60 Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro Asp Arg Asp 65 70 75 80 Thr Arg Arg Leu Trp Val Glu Arg Ile Leu Asp His Asp Gly His Gly 85 90 95 Gly Gln Glu Gly Gly Ile Glu Ala Trp Ala Arg Leu Gly Glu Ala Val 100 105 110 Gly Ile Glu Arg Ala Glu Leu Trp Ser Leu Val His Val Leu Pro Gly 115 120 125 Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg His Ala Pro 130 135 140 Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Gln 145 150 155 160 Ile His Leu Asp Arg Leu Ala Gly Trp Pro Ser His Tyr Pro Trp Ile 165 170 175 Glu Ala Asp Gly Leu Gln Tyr Phe Arg Ser Arg Val Pro Leu Ala Gln 180 185 190 Arg Asp Val Glu His Gly Leu Ala Val Thr Leu Asn His Phe Thr Thr 195 200 205 Pro Asp Ala Gln Arg Arg Ala Leu Asp Ile Leu Ser Phe Lys Leu Asp 210 215 220 Val Leu Trp Ser Ile Leu Asp Ala Ile Glu Lys Ala Tyr Pro Ala 225 230 235 <210> 200 <211> 711 <212> DNA <213> Ralstonia eutropha <400> 200 tcatgggttg gcttgctgga tggcgtcgag catcgaccag agcacgtcga gcttgaactg 60 caggatgtcg agggcgcgct gctgttgcgc cgcgctgcgg aaatggccca gcgtcacgcg 120 caggccatgg tccacgtcgc gctgcgcgag cggaatgcga gagcggaagt agtccagccc 180 ggcggcctcg atccacgggt aatgcgtggg ccagccggcc aggcgttcct tgtggattgc 240 gggcgcgaac atctccgtca gcgacgagca cacggcttcc tgccacggtg cgcggcgcgc 300 aaagttgacg taggcatcga cggcaaagcg caccccgggc agcacgtgcc ggtggctcag 360 cagtgcttcg cgctccaggc ccaccgcctg gcccaggcgc agccaggcct cgatgccgcc 420 gggctgggtg tcggtgccgt cgtggtcaag gatgcgcacc acccactcgc ggcgggtgtc 480 gcgctcgggg caattggaca ggatggcggc gtccttcagc gggatgttgt cctgatagta 540 gaagcggttg gccacccatg cgcggatctg cgcgggcgaa cactggcctg ccgccatgcg 600 ctggttgaag ggatggtgga tgtggtagcc gctttccatg gcgcgcaggc gggcctcgaa 660 ctcggcctcg gtccaggcga tgggggggat ggggaggatg gcagttgtca t 711 <210> 201 <211> 236 <212> PRT <213> Ralstonia eutropha <400> 201 Met Thr Thr Ala Ile Leu Pro Ile Pro Pro Ile Ala Trp Thr Glu Ala 1 5 10 15 Glu Phe Glu Ala Arg Leu Arg Ala Met Glu Ser Gly Tyr His Ile His 20 25 30 His Pro Phe Asn Gln Arg Met Ala Ala Gly Gln Cys Ser Pro Ala Gln 35 40 45 Ile Arg Ala Trp Val Ala Asn Arg Phe Tyr Tyr Gln Asp Asn Ile Pro 50 55 60 Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro Glu Arg Asp Thr Arg 65 70 75 80 Arg Glu Trp Val Val Arg Ile Leu Asp His Asp Gly Thr Asp Thr Gln 85 90 95 Pro Gly Gly Ile Glu Ala Trp Leu Arg Leu Gly Gln Ala Val Gly Leu 100 105 110 Glu Arg Glu Ala Leu Leu Ser His Arg His Val Leu Pro Gly Val Arg 115 120 125 Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro Trp Gln 130 135 140 Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Ala Ile His 145 150 155 160 Lys Glu Arg Leu Ala Gly Trp Pro Thr His Tyr Pro Trp Ile Glu Ala 165 170 175 Ala Gly Leu Asp Tyr Phe Arg Ser Arg Ile Pro Leu Ala Gln Arg Asp 180 185 190 Val Asp His Gly Leu Arg Val Thr Leu Gly His Phe Arg Ser Ala Ala 195 200 205 Gln Gln Gln Arg Ala Leu Asp Ile Leu Gln Phe Lys Leu Asp Val Leu 210 215 220 Trp Ser Met Leu Asp Ala Ile Gln Gln Ala Asn Pro 225 230 235 <210> 202 <211> 711 <212> DNA <213> Ralstonia pickettii <400> 202 atgacacatc ctgttgcctg gacggccgaa gagttcgaag cacggctgcg cgcgaagcag 60 gcgggctatc acattcatca tccgttcaac ctgcgcatgc gcgctggcga atgcacgccg 120 gaggaaatcc gcacgtgggt tgcgaaccgt ttctactacc aggtcaacat cccgctcaag 180 gatgcggcca tcctgtccaa ctgccccgac cgggcaacgc gccgcgagtg gatcgtccgc 240 atccacgacc acgacggcga cgatgcgcag ccgggcggca tcgagagctg ggtgcgctta 300 ggcgttgccg tgggcctgac gcgcgacgcg ctgtggtctc accggcatct gctgccgggc 360 gtgcgctttg cggtggatgc gtatgtgaac tttgcgcgcc gcgcgccgtg gcaggaagca 420 gtgtgctcct cgctcacgga gatgttcgcg ccggacattc acaaggaacg actggccggc 480 tggcccgagc actatccgtg ggtgcagccg gaggggctgg cgtacttccg ctcgcgcatt 540 ccgctggcct cgcgcgacgt cgagcacggc ctgcgcgtga cactcgacta cttccgcacg 600 ccggagcagc aactgcgtgc gctggacatc ctgcagttca agctcgacat cctctggtcg 660 atgctcgatg ccatccaaca ggcccacgca catgagccct cccttgtctg a 711 <210> 203 <211> 236 <212> PRT <213> Ralstonia pickettii <400> 203 Met Thr His Pro Val Ala Trp Thr Ala Glu Glu Phe Glu Ala Arg Leu 1 5 10 15 Arg Ala Lys Gln Ala Gly Tyr His Ile His His Pro Phe Asn Leu Arg 20 25 30 Met Arg Ala Gly Glu Cys Thr Pro Glu Glu Ile Arg Thr Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Leu Lys Asp Ala Ala Ile 50 55 60 Leu Ser Asn Cys Pro Asp Arg Ala Thr Arg Arg Glu Trp Ile Val Arg 65 70 75 80 Ile His Asp His Asp Gly Asp Asp Ala Gln Pro Gly Gly Ile Glu Ser 85 90 95 Trp Val Arg Leu Gly Val Ala Val Gly Leu Thr Arg Asp Ala Leu Trp 100 105 110 Ser His Arg His Leu Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr 115 120 125 Val Asn Phe Ala Arg Arg Ala Pro Trp Gln Glu Ala Val Cys Ser Ser 130 135 140 Leu Thr Glu Met Phe Ala Pro Asp Ile His Lys Glu Arg Leu Ala Gly 145 150 155 160 Trp Pro Glu His Tyr Pro Trp Val Gln Pro Glu Gly Leu Ala Tyr Phe 165 170 175 Arg Ser Arg Ile Pro Leu Ala Ser Arg Asp Val Glu His Gly Leu Arg 180 185 190 Val Thr Leu Asp Tyr Phe Arg Thr Pro Glu Gln Gln Leu Arg Ala Leu 195 200 205 Asp Ile Leu Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Ala 210 215 220 Ile Gln Gln Ala His Ala His Glu Pro Ser Leu Val 225 230 235 <210> 204 <211> 768 <212> DNA <213> Acidiphilium cryptum <400> 204 atgatgagag ccgatctcct ggccgaggcg ccaccagccg atgatggccg cgcgccctgg 60 tctcacgccg aattcgaggc gaagctgcgc gaggccggca gcgcctacca catccaccat 120 ccgttcaacg tgatgctcaa caccggcaag gcgacgccgg agcagatccg catgtgggtc 180 gccaaccgct tctattacca gatcgcgatc ccggtgaagg acgcggcgat cctctccaac 240 tgccccgacc gcgagatccg ccgcggctgg atccgccgcc tcctcgacca tgacgggttc 300 gactacgaac tgcccgacgg ctcgcgcctg cgcgacgagg gcggcatcga ggcctggctc 360 cgcctcggca tcgccaccgg cctcgcgcgc gaggagatgc tcgacctgcg ccacctcttg 420 cccggcgtgc gcttcgcggt cgacgcctat gtcaatttcg cccgccgcgc gccctggcag 480 gaggccgtct gctcctcgct gaccgagctt ttcgcccccg acatccaccg ccagcgcctc 540 gccacctggc ccggccacta tccctggatc gagagcgagg ggctcgacta cttccgcaac 600 cgcaccagcc aggccccgcg cgacgtcgtc cacggcctgc ggatcacgct cgcccatttc 660 gcgacccggc cgatgcagga gcgcgccctg cagatcctca agttcaagct ggacattctg 720 tggacgatga acgacgagat gggacgacat tacggcgtcg ccgcctga 768 <210> 205 <211> 255 <212> PRT <213> Acidiphilium cryptum <400> 205 Met Met Arg Ala Asp Leu Leu Ala Glu Ala Pro Pro Ala Asp Asp Gly 1 5 10 15 Arg Ala Pro Trp Ser His Ala Glu Phe Glu Ala Lys Leu Arg Glu Ala 20 25 30 Gly Ser Ala Tyr His Ile His His Pro Phe Asn Val Met Leu Asn Thr 35 40 45 Gly Lys Ala Thr Pro Glu Gln Ile Arg Met Trp Val Ala Asn Arg Phe 50 55 60 Tyr Tyr Gln Ile Ala Ile Pro Val Lys Asp Ala Ala Ile Leu Ser Asn 65 70 75 80 Cys Pro Asp Arg Glu Ile Arg Arg Gly Trp Ile Arg Arg Leu Leu Asp 85 90 95 His Asp Gly Phe Asp Tyr Glu Leu Pro Asp Gly Ser Arg Leu Arg Asp 100 105 110 Glu Gly Gly Ile Glu Ala Trp Leu Arg Leu Gly Ile Ala Thr Gly Leu 115 120 125 Ala Arg Glu Glu Met Leu Asp Leu Arg His Leu Leu Pro Gly Val Arg 130 135 140 Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro Trp Gln 145 150 155 160 Glu Ala Val Cys Ser Ser Leu Thr Glu Leu Phe Ala Pro Asp Ile His 165 170 175 Arg Gln Arg Leu Ala Thr Trp Pro Gly His Tyr Pro Trp Ile Glu Ser 180 185 190 Glu Gly Leu Asp Tyr Phe Arg Asn Arg Thr Ser Gln Ala Pro Arg Asp 195 200 205 Val Val His Gly Leu Arg Ile Thr Leu Ala His Phe Ala Thr Arg Pro 210 215 220 Met Gln Glu Arg Ala Leu Gln Ile Leu Lys Phe Lys Leu Asp Ile Leu 225 230 235 240 Trp Thr Met Asn Asp Glu Met Gly Arg His Tyr Gly Val Ala Ala 245 250 255 <210> 206 <211> 729 <212> DNA <213> Burkholderia dolosa <400> 206 atgaccacga tgaacgcacc gcttcccgct accgcgctgc acgcgacgcc ctggagcgcg 60 caggagttcg aggcgcacct gcgcgcgctc gaatcgcgct atcacattca tcatccgttc 120 aaccggcggc tgaactcggg cgcgtgctcg cccgagcaga tccgcggctg ggtcgcgaac 180 cgcttctact accagatcag cattccgctg aaggacgcgg cgatcctgtc gaattgtccg 240 gaccgcgaca cgcgccgact gtgggtgcag cggattctcg atcacgacgg acacggcggc 300 gacgcaggcg gaatcgaagc gtgggcgcgg ctcggcgaag cggtcggcat cccgcgctcg 360 caactgtggt cgctcgaacg cgtgctgccc ggcgtgcgct tcgcggtcga tgcgtatgtg 420 aacttcgcgc gccgcgcgcc gtggcaggaa gccgtgtgct cgtcgctgac ggagatgttc 480 gcgccgcaga tccacctcga ccggctcgcg ggctggccgt cgcactaccc gtggatcgac 540 gcggacgggc tgcagtattt ccgcagccgc gtgccgctcg cgcagcgcga cgtcgagcac 600 gggctcgcgg tgacgctgcg ccatttcacg acaccggaag cgcaacgacg agcgctcgac 660 atcctgtcgt tcaagctgga tgtcctgtgg tcgatcctcg atgcaatcga aaaggcgtat 720 cccgcatga 729 <210> 207 <211> 242 <212> PRT <213> Burkholderia dolosa <400> 207 Met Thr Thr Met Asn Ala Pro Leu Pro Ala Thr Ala Leu His Ala Thr 1 5 10 15 Pro Trp Ser Ala Gln Glu Phe Glu Ala His Leu Arg Ala Leu Glu Ser 20 25 30 Arg Tyr His Ile His His Pro Phe Asn Arg Arg Leu Asn Ser Gly Ala 35 40 45 Cys Ser Pro Glu Gln Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr 50 55 60 Gln Ile Ser Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro 65 70 75 80 Asp Arg Asp Thr Arg Arg Leu Trp Val Gln Arg Ile Leu Asp His Asp 85 90 95 Gly His Gly Gly Asp Ala Gly Gly Ile Glu Ala Trp Ala Arg Leu Gly 100 105 110 Glu Ala Val Gly Ile Pro Arg Ser Gln Leu Trp Ser Leu Glu Arg Val 115 120 125 Leu Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg 130 135 140 Arg Ala Pro Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe 145 150 155 160 Ala Pro Gln Ile His Leu Asp Arg Leu Ala Gly Trp Pro Ser His Tyr 165 170 175 Pro Trp Ile Asp Ala Asp Gly Leu Gln Tyr Phe Arg Ser Arg Val Pro 180 185 190 Leu Ala Gln Arg Asp Val Glu His Gly Leu Ala Val Thr Leu Arg His 195 200 205 Phe Thr Thr Pro Glu Ala Gln Arg Arg Ala Leu Asp Ile Leu Ser Phe 210 215 220 Lys Leu Asp Val Leu Trp Ser Ile Leu Asp Ala Ile Glu Lys Ala Tyr 225 230 235 240 Pro Ala <210> 208 <211> 720 <212> DNA <213> Burkholderia dolosa <400> 208 atgaacgcac cgcttcccgc taccgcgctg cacgcgacgc cctggagcgc gcaggagttc 60 gaggcgcacc tgcgcgcgct cgaatcgcgc tatcacattc atcatccgtt caaccggcgg 120 ctgaactcgg gcgcgtgctc gcccgagcag atccgcggct gggtcgcgaa ccgcttctac 180 taccagatca gcattccgct gaaggacgcg gcgatcctgt cgaattgtcc ggaccgcgac 240 acgcgccgac tgtgggtgca gcggattctc gatcacgacg gacacggcgg cgacgcaggc 300 ggaatcgaag cgtgggcgcg gctcggcgaa gcggtcggca tcccgcgctc gcaactgtgg 360 tcgctcgaac gcgtgctgcc cggcgtgcgc ttcgcggtcg atgcgtatgt gaacttcgcg 420 cgccgcgcgc cgtggcagga agccgtgtgc tcgtcgctga cggagatgtt cgcgccgcag 480 atccacctcg accggctcgc gggctggccg tcgcactacc cgtggatcga cgcggacggg 540 ctgcagtatt tccgcagccg cgtgccgctc gcgcagcgcg acgtcgagca cgggctcgcg 600 gtgacgctgc gccatttcac gacaccggaa gcgcaacgac gagcgctcga catcctgtcg 660 ttcaagctgg atgtcctgtg gtcgatcctc gatgcaatcg aaaaggcgta tcccgcatga 720 <210> 209 <211> 239 <212> PRT <213> Burkholderia dolosa <400> 209 Met Asn Ala Pro Leu Pro Ala Thr Ala Leu His Ala Thr Pro Trp Ser 1 5 10 15 Ala Gln Glu Phe Glu Ala His Leu Arg Ala Leu Glu Ser Arg Tyr His 20 25 30 Ile His His Pro Phe Asn Arg Arg Leu Asn Ser Gly Ala Cys Ser Pro 35 40 45 Glu Gln Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Ile Ser 50 55 60 Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser Asn Cys Pro Asp Arg Asp 65 70 75 80 Thr Arg Arg Leu Trp Val Gln Arg Ile Leu Asp His Asp Gly His Gly 85 90 95 Gly Asp Ala Gly Gly Ile Glu Ala Trp Ala Arg Leu Gly Glu Ala Val 100 105 110 Gly Ile Pro Arg Ser Gln Leu Trp Ser Leu Glu Arg Val Leu Pro Gly 115 120 125 Val Arg Phe Ala Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro 130 135 140 Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu Met Phe Ala Pro Gln 145 150 155 160 Ile His Leu Asp Arg Leu Ala Gly Trp Pro Ser His Tyr Pro Trp Ile 165 170 175 Asp Ala Asp Gly Leu Gln Tyr Phe Arg Ser Arg Val Pro Leu Ala Gln 180 185 190 Arg Asp Val Glu His Gly Leu Ala Val Thr Leu Arg His Phe Thr Thr 195 200 205 Pro Glu Ala Gln Arg Arg Ala Leu Asp Ile Leu Ser Phe Lys Leu Asp 210 215 220 Val Leu Trp Ser Ile Leu Asp Ala Ile Glu Lys Ala Tyr Pro Ala 225 230 235 <210> 210 <211> 732 <212> DNA <213> Polaromonas naphthalenivorans <400> 210 tcatacgcag gctttctcga tgccgtcgag catgctccac aggatgtcga gcttgaactg 60 caggatgtcc agcgccctgt gctgcgcctg gcgggtggtg aaatgggtga tggtgaccgc 120 cagcccgtgt tccacatcgc ggcttgccag cggaatacgg ctgcggaaat aagtcaggcc 180 ttcgggctcg atccaggcgt aatgcaaagg ccagctggca agccggtcct tgtggatctg 240 gggtgcgaac atttcggtca gcgatgagca cacggcttcc tgccacggtg ctttcgcggc 300 gaaattcacg taggcatcgc aggcgaaccg caccgccggc gccacgccct gcaacgacca 360 caattcctca cgcgacaggc cgaccgccag gcccaactgg gtccaggctt ccatgccgcc 420 agcggcgcag ccctggtagt cgccgtagcc gtcatggtcc agaatgcgtt ccacccacag 480 tcggcggtgc gcccggtcag gcatgttggc caaaatcgcc gcgtccttgc gcggaatgca 540 caactggtaa taaaaacggt tggccaccca gcaacggatt tcgtctgcgg tgcagccgcc 600 ctggttcatc cgtacattga agggatggtg aatgtgatag gccgtgcctt tggcgcgcag 660 ctgcctttca aactcggcag ggctccaggc tgatctgctg gcgtcaaagc agggtgattg 720 ggctatttcc at 732 <210> 211 <211> 243 <212> PRT <213> Polaromonas naphthalenivorans <400> 211 Met Glu Ile Ala Gln Ser Pro Cys Phe Asp Ala Ser Arg Ser Ala Trp 1 5 10 15 Ser Pro Ala Glu Phe Glu Arg Gln Leu Arg Ala Lys Gly Thr Ala Tyr 20 25 30 His Ile His His Pro Phe Asn Val Arg Met Asn Gln Gly Gly Cys Thr 35 40 45 Ala Asp Glu Ile Arg Cys Trp Val Ala Asn Arg Phe Tyr Tyr Gln Leu 50 55 60 Cys Ile Pro Arg Lys Asp Ala Ala Ile Leu Ala Asn Met Pro Asp Arg 65 70 75 80 Ala His Arg Arg Leu Trp Val Glu Arg Ile Leu Asp His Asp Gly Tyr 85 90 95 Gly Asp Tyr Gln Gly Cys Ala Ala Gly Gly Met Glu Ala Trp Thr Gln 100 105 110 Leu Gly Leu Ala Val Gly Leu Ser Arg Glu Glu Leu Trp Ser Leu Gln 115 120 125 Gly Val Ala Pro Ala Val Arg Phe Ala Cys Asp Ala Tyr Val Asn Phe 130 135 140 Ala Ala Lys Ala Pro Trp Gln Glu Ala Val Cys Ser Ser Leu Thr Glu 145 150 155 160 Met Phe Ala Pro Gln Ile His Lys Asp Arg Leu Ala Ser Trp Pro Leu 165 170 175 His Tyr Ala Trp Ile Glu Pro Glu Gly Leu Thr Tyr Phe Arg Ser Arg 180 185 190 Ile Pro Leu Ala Ser Arg Asp Val Glu His Gly Leu Ala Val Thr Ile 195 200 205 Thr His Phe Thr Thr Arg Gln Ala Gln His Arg Ala Leu Asp Ile Leu 210 215 220 Gln Phe Lys Leu Asp Ile Leu Trp Ser Met Leu Asp Gly Ile Glu Lys 225 230 235 240 Ala Cys Val <210> 212 <211> 741 <212> DNA <213> Rickettsiella grylli <400> 212 atgccgacta aacgctgcga agtatcattg tctcagagtg tatttgaaaa aaaaatttta 60 aaccttgaaa aatattatca tatccatcat cctttcaatc aattaatgaa cgatggccaa 120 ttgactcggc aacaaattca acagtgggtg attaatcgct tctattatca agtcaatatc 180 cctgtaaaag atgctgctat tttatccaat tgtcctctac gggagatacg aagagaatgg 240 gtgaaacgga tcattgaaca cgatggcgat gtcattaatc ccggtggaat tgaagcctgg 300 ctgacattgg gagaagcgtg cggactgacg cgtaacttat tgtggtctat gaaatatgtc 360 ctgccgggcg tgcgctttgc agtagacgct tacattcagt ttacacgaac gcatccatgg 420 caagctgcgg tttgttcatc gttaacggag ctttttgcac ccgaaatcca tcgccaacgt 480 ttaacgaatt ggcccatcca ttatccatgg atggatttaa acgcattagc ttattttcgt 540 tgtcgattaa atcaaatcaa tcatcatgtc aaaaaaggct tacaatggac actcgaaaat 600 tttcaaacac acgaacagca aacacaagca ttggctattt taaaatttaa attagaaatt 660 ctttggtcaa tttcagacag cctttactta gcctatgtat taggtcaccc tcccatcaca 720 ttttcaaagg atgatacatg a 741 <210> 213 <211> 246 <212> PRT <213> Rickettsiella grylli <400> 213 Met Pro Thr Lys Arg Cys Glu Val Ser Leu Ser Gln Ser Val Phe Glu 1 5 10 15 Lys Lys Ile Leu Asn Leu Glu Lys Tyr Tyr His Ile His His Pro Phe 20 25 30 Asn Gln Leu Met Asn Asp Gly Gln Leu Thr Arg Gln Gln Ile Gln Gln 35 40 45 Trp Val Ile Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro Val Lys Asp 50 55 60 Ala Ala Ile Leu Ser Asn Cys Pro Leu Arg Glu Ile Arg Arg Glu Trp 65 70 75 80 Val Lys Arg Ile Ile Glu His Asp Gly Asp Val Ile Asn Pro Gly Gly 85 90 95 Ile Glu Ala Trp Leu Thr Leu Gly Glu Ala Cys Gly Leu Thr Arg Asn 100 105 110 Leu Leu Trp Ser Met Lys Tyr Val Leu Pro Gly Val Arg Phe Ala Val 115 120 125 Asp Ala Tyr Ile Gln Phe Thr Arg Thr His Pro Trp Gln Ala Ala Val 130 135 140 Cys Ser Ser Leu Thr Glu Leu Phe Ala Pro Glu Ile His Arg Gln Arg 145 150 155 160 Leu Thr Asn Trp Pro Ile His Tyr Pro Trp Met Asp Leu Asn Ala Leu 165 170 175 Ala Tyr Phe Arg Cys Arg Leu Asn Gln Ile Asn His His Val Lys Lys 180 185 190 Gly Leu Gln Trp Thr Leu Glu Asn Phe Gln Thr His Glu Gln Gln Thr 195 200 205 Gln Ala Leu Ala Ile Leu Lys Phe Lys Leu Glu Ile Leu Trp Ser Ile 210 215 220 Ser Asp Ser Leu Tyr Leu Ala Tyr Val Leu Gly His Pro Pro Ile Thr 225 230 235 240 Phe Ser Lys Asp Asp Thr 245 <210> 214 <211> 732 <212> DNA <213> Methylibium petroleiphilum <400> 214 ttgagcgccg acctgccctg gtctcccgca gaattcgagg cacgcctgcg cgccaaggag 60 tccgggtacc acatccacca ccccttcaac aagcggctca acagcggcgc gctgcagccc 120 ttccaggtgc gcggctgggt ggccaaccgc ttctactacc agcaggcgat cccgatgaag 180 gacgccgcgg tcatggccaa ctgcgaggac cgcgccacgc ggcgccgctg gatcgagcgc 240 atgctcgacc acgacggcca tggcgatcac gaggggcaga acgccggcgg tatcgagacc 300 tggacgcgcc tgggcatggc cgtgggcctg agccgcgagg acctctggtc gcaccgccac 360 gttcagccgg gcgtgcgctt cgcggtcgat gcctacgtga acttcgcgcg ccgcgcgccc 420 tggcgcgagg gcgtgatctc ctcgctgacc gagatgttcg cgcccaagat ccacgccgac 480 cggctggccg gctggcccag catgtacccg tggatcgccg ccgagggcct ggcctatttc 540 cgcagccgca tcccgctggc gcagcgcgac gtggagcacg gcctggaggt cgccatcgcg 600 ttcggcgaca cccgcgcgaa gcaggagcgc gcgatcgaga tcctgcagtt caagctcgac 660 gtgctgtggt cgctgctcga cgccgtggag cgcgcctacc ccgacgacct gcccgaggag 720 cgccgaccgt ga 732 <210> 215 <211> 243 <212> PRT <213> Methylibium petroleiphilum <400> 215 Met Ser Ala Asp Leu Pro Trp Ser Pro Ala Glu Phe Glu Ala Arg Leu 1 5 10 15 Arg Ala Lys Glu Ser Gly Tyr His Ile His His Pro Phe Asn Lys Arg 20 25 30 Leu Asn Ser Gly Ala Leu Gln Pro Phe Gln Val Arg Gly Trp Val Ala 35 40 45 Asn Arg Phe Tyr Tyr Gln Gln Ala Ile Pro Met Lys Asp Ala Ala Val 50 55 60 Met Ala Asn Cys Glu Asp Arg Ala Thr Arg Arg Arg Trp Ile Glu Arg 65 70 75 80 Met Leu Asp His Asp Gly His Gly Asp His Glu Gly Gln Asn Ala Gly 85 90 95 Gly Ile Glu Thr Trp Thr Arg Leu Gly Met Ala Val Gly Leu Ser Arg 100 105 110 Glu Asp Leu Trp Ser His Arg His Val Gln Pro Gly Val Arg Phe Ala 115 120 125 Val Asp Ala Tyr Val Asn Phe Ala Arg Arg Ala Pro Trp Arg Glu Gly 130 135 140 Val Ile Ser Ser Leu Thr Glu Met Phe Ala Pro Lys Ile His Ala Asp 145 150 155 160 Arg Leu Ala Gly Trp Pro Ser Met Tyr Pro Trp Ile Ala Ala Glu Gly 165 170 175 Leu Ala Tyr Phe Arg Ser Arg Ile Pro Leu Ala Gln Arg Asp Val Glu 180 185 190 His Gly Leu Glu Val Ala Ile Ala Phe Gly Asp Thr Arg Ala Lys Gln 195 200 205 Glu Arg Ala Ile Glu Ile Leu Gln Phe Lys Leu Asp Val Leu Trp Ser 210 215 220 Leu Leu Asp Ala Val Glu Arg Ala Tyr Pro Asp Asp Leu Pro Glu Glu 225 230 235 240 Arg Arg Pro <210> 216 <211> 639 <212> DNA <213> Nitrococcus mobilis <400> 216 atgatgatga atcgcggcga actctcgcga caccaactcc agggttgggt tgccaaccgc 60 tattattacc aaatcagcat cccactgaaa gacgcggcac tgatctccca atgtccggat 120 cgggccgtgc ggcggcactg gctgcacagg ctcctcgatc aggacggccg cacgggcagc 180 gaagggggga tcgaagcatg gatcaacctc ggcgaggccg tcggcctgag ccggacagag 240 ctgatctccg agcgtcaggt tttgcctggt gttcgattcg cggtggacgc ctatgtaaat 300 ttggtgcgct gggggtcttg gcaggacggg gtgtgcgcct cgctcaccga gctgttcgcg 360 ccgggcatcc atcgcgaacg tctgaacagc tggccgactc actatccctg ggtcgatccc 420 gccggcttag cctattttcg cagccgcctc gaagtagccc ggcaagacgg gcggcacgga 480 ctcgctttgg tactcgatca ttgcgacacc ccggcaagcc aggatcgcgc ggtgcgcatc 540 gtcaagttca aactcgaagt tctctgggcc atgctcgatg cgatgtacct ggcctatgtg 600 gtaggcatgc cgccgttttt taacgtcgcg ggcgactga 639 <210> 217 <211> 212 <212> PRT <213> Nitrococcus mobilis <400> 217 Met Met Met Asn Arg Gly Glu Leu Ser Arg His Gln Leu Gln Gly Trp 1 5 10 15 Val Ala Asn Arg Tyr Tyr Tyr Gln Ile Ser Ile Pro Leu Lys Asp Ala 20 25 30 Ala Leu Ile Ser Gln Cys Pro Asp Arg Ala Val Arg Arg His Trp Leu 35 40 45 His Arg Leu Leu Asp Gln Asp Gly Arg Thr Gly Ser Glu Gly Gly Ile 50 55 60 Glu Ala Trp Ile Asn Leu Gly Glu Ala Val Gly Leu Ser Arg Thr Glu 65 70 75 80 Leu Ile Ser Glu Arg Gln Val Leu Pro Gly Val Arg Phe Ala Val Asp 85 90 95 Ala Tyr Val Asn Leu Val Arg Trp Gly Ser Trp Gln Asp Gly Val Cys 100 105 110 Ala Ser Leu Thr Glu Leu Phe Ala Pro Gly Ile His Arg Glu Arg Leu 115 120 125 Asn Ser Trp Pro Thr His Tyr Pro Trp Val Asp Pro Ala Gly Leu Ala 130 135 140 Tyr Phe Arg Ser Arg Leu Glu Val Ala Arg Gln Asp Gly Arg His Gly 145 150 155 160 Leu Ala Leu Val Leu Asp His Cys Asp Thr Pro Ala Ser Gln Asp Arg 165 170 175 Ala Val Arg Ile Val Lys Phe Lys Leu Glu Val Leu Trp Ala Met Leu 180 185 190 Asp Ala Met Tyr Leu Ala Tyr Val Val Gly Met Pro Pro Phe Phe Asn 195 200 205 Val Ala Gly Asp 210 <210> 218 <211> 717 <212> DNA <213> Mycobacterium smegmatis <400> 218 tcagcgattt ccataagcct ggtcgatcgc atcgagcatg ctccacagca cgtcgcactt 60 gaaggacaag gccgacagcg cggccgtctg ggtttcctgc gtgacgcaat gccgtcgcac 120 cacctcaaga ccgtgttcgg agtcgcgggg cgcctgggtg atgcgagatc tgaagtaaga 180 gagttctttc gggtcgatcc aggtgtagtg acgttcgaac gccgcgagcc gctcggccat 240 caggtcgggt gcgaacagct cggtcagcga cgaggccacc gcctccagcc atggccgggt 300 gcgggtgaag ttcacgtagg cgtcgacggc gaagcgcacg cccggcagca ggtgtcgtgc 360 gtcttcgacc tccgccctgg tcaaaccgac cgcttcggcc agtcgcagcc acgcctcgat 420 tcccccggtt ccttcggtcg tgccgtcgtg gtcgatgatt cgctggaccc aacggcgccg 480 tatctcacgg tccgggcagg tgctgaggat cgctgcgtct ttccggggga tgttcacctg 540 gtagtagaag cggttggcca cccacccgcg gatctcctcg gggctgcact gcccggtgtt 600 catccgacgg tggaagggat gcaggtggtg gtaatccttg acgtgctcgc gaagcgcttc 660 ctcgaactcg tcgggcgtca gtgcctgggt tactgctcct cgcgccagcg gtgccat 717 <210> 219 <211> 238 <212> PRT <213> Mycobacterium smegmatis <400> 219 Met Ala Pro Leu Ala Arg Gly Ala Val Thr Gln Ala Leu Thr Pro Asp 1 5 10 15 Glu Phe Glu Glu Ala Leu Arg Glu His Val Lys Asp Tyr His His Leu 20 25 30 His Pro Phe His Arg Arg Met Asn Thr Gly Gln Cys Ser Pro Glu Glu 35 40 45 Ile Arg Gly Trp Val Ala Asn Arg Phe Tyr Tyr Gln Val Asn Ile Pro 50 55 60 Arg Lys Asp Ala Ala Ile Leu Ser Thr Cys Pro Asp Arg Glu Ile Arg 65 70 75 80 Arg Arg Trp Val Gln Arg Ile Ile Asp His Asp Gly Thr Thr Glu Gly 85 90 95 Thr Gly Gly Ile Glu Ala Trp Leu Arg Leu Ala Glu Ala Val Gly Leu 100 105 110 Thr Arg Ala Glu Val Glu Asp Ala Arg His Leu Leu Pro Gly Val Arg 115 120 125 Phe Ala Val Asp Ala Tyr Val Asn Phe Thr Arg Thr Arg Pro Trp Leu 130 135 140 Glu Ala Val Ala Ser Ser Leu Thr Glu Leu Phe Ala Pro Asp Leu Met 145 150 155 160 Ala Glu Arg Leu Ala Ala Phe Glu Arg His Tyr Thr Trp Ile Asp Pro 165 170 175 Lys Glu Leu Ser Tyr Phe Arg Ser Arg Ile Thr Gln Ala Pro Arg Asp 180 185 190 Ser Glu His Gly Leu Glu Val Val Arg Arg His Cys Val Thr Gln Glu 195 200 205 Thr Gln Thr Ala Ala Leu Ser Ala Leu Ser Phe Lys Cys Asp Val Leu 210 215 220 Trp Ser Met Leu Asp Ala Ile Asp Gln Ala Tyr Gly Asn Arg 225 230 235 <210> 220 <211> 690 <212> DNA <213> Saccharopolyspora erythraea <400> 220 tcagtcggcg tacgcgtggt cgatggcatc gagaatgctc cacaggacat cgcatttgaa 60 cgacagggcc gccacggctc gtgcctgctc gtcggccgac cggcagtgtt cggtcaccac 120 ctgcagggcg tgttcggagt cgcggggagc ctgctccagg cgggcccgga agtaaccgag 180 accgccgggg tcgatccacg gatagcagcg ctcgaacgcg gcgaggcgct gcgccatcag 240 gtccggtgcg aacagctcgg tcaacgacga cgccaccgcc tcggtccacg gccgggtgcg 300 ggcgaaggtg acgtaggcgt cgacggcgaa ccgcacgccg gggacgacat gccgttcgtc 360 gagcacttcc tcgcgggtca ggccgaccgc ctcggccagg tgcaaccagg cgtcgatacc 420 gcctcgcccg cccggcgcgc cgtcgtggtc gaggatccgc cgcacccagc gcctgcgcac 480 ctcgcggtcg gggcagttgg acaggatcgc ggcgtccttg agcgggatgc tctcctggta 540 gtagaagcgg ttggccaccc acccctggat ctggcggcgg ctcagccgtc ccccgttcat 600 cctgacgtgg aacgggtgct ggtcgtggta gcgccgcgac tgcgcgcgca acgccgcgac 660 gaagccgtcg gtgccggtga gcgccgccat 690 <210> 221 <211> 229 <212> PRT <213> Saccharopolyspora erythraea <400> 221 Met Ala Ala Leu Thr Gly Thr Asp Gly Phe Val Ala Ala Leu Arg Ala 1 5 10 15 Gln Ser Arg Arg Tyr His Asp Gln His Pro Phe His Val Arg Met Asn 20 25 30 Gly Gly Arg Leu Ser Arg Arg Gln Ile Gln Gly Trp Val Ala Asn Arg 35 40 45 Phe Tyr Tyr Gln Glu Ser Ile Pro Leu Lys Asp Ala Ala Ile Leu Ser 50 55 60 Asn Cys Pro Asp Arg Glu Val Arg Arg Arg Trp Val Arg Arg Ile Leu 65 70 75 80 Asp His Asp Gly Ala Pro Gly Gly Arg Gly Gly Ile Asp Ala Trp Leu 85 90 95 His Leu Ala Glu Ala Val Gly Leu Thr Arg Glu Glu Val Leu Asp Glu 100 105 110 Arg His Val Val Pro Gly Val Arg Phe Ala Val Asp Ala Tyr Val Thr 115 120 125 Phe Ala Arg Thr Arg Pro Trp Thr Glu Ala Val Ala Ser Ser Leu Thr 130 135 140 Glu Leu Phe Ala Pro Asp Leu Met Ala Gln Arg Leu Ala Ala Phe Glu 145 150 155 160 Arg Cys Tyr Pro Trp Ile Asp Pro Gly Gly Leu Gly Tyr Phe Arg Ala 165 170 175 Arg Leu Glu Gln Ala Pro Arg Asp Ser Glu His Ala Leu Gln Val Val 180 185 190 Thr Glu His Cys Arg Ser Ala Asp Glu Gln Ala Arg Ala Val Ala Ala 195 200 205 Leu Ser Phe Lys Cys Asp Val Leu Trp Ser Ile Leu Asp Ala Ile Asp 210 215 220 His Ala Tyr Ala Asp 225 <210> 222 <211> 759 <212> DNA <213> Sagittula stellata <400> 222 atgaccaagg caccgcaatc gcgcgacgcg ttcgaagccc ggctgcgcca gatcggagcg 60 gagcgatatc acgacctgca tccgttccac gaccgtctgc acggtgggca gtgtaccatg 120 gaggaggtgc aggcctgggt catcaaccgc tactactacc agcactcgat cccgatgaag 180 gacgcggcct tcatgtcccg ggtggaggac cctgatttgc gccgcgcgtg gaggtcgcgg 240 atggaggatc acgacggaac cgccgacaac gaaggcggca taaggcgctg gctgcggctg 300 gcggaggcgg tgggtctgga tcccgactac gtctcgacga cagagggcgt cctgcccgca 360 acgaagttcg cggtggacgc ctacgtccgt ttcgtccgcg aaaagaccct gctcgaagcg 420 gtggcggcat cactcacgga actcttcgca ccgaagatcc acgccaaccg catcgaggga 480 ctgctgaaga attacgcctt cgccgacgac tcctcgctgt cgtatttccg caaccggttg 540 aaagaagcgc cgaaggatgt ggcctttggg ctggcctggg tgctggacca tgccgacacc 600 gccgagaagc aggacgtggc ggccagggcg ctgatcttca agacggatgt tctgtggtcc 660 caactcgacg cgctgtgggg cgcctacgtc gagccgcggc gcattccgcc cggcgcgtgg 720 cagcccggaa cggggcagct cttgcggcag gcgtcatga 759 <210> 223 <211> 252 <212> PRT <213> Sagittula stellata <400> 223 Met Thr Lys Ala Pro Gln Ser Arg Asp Ala Phe Glu Ala Arg Leu Arg 1 5 10 15 Gln Ile Gly Ala Glu Arg Tyr His Asp Leu His Pro Phe His Asp Arg 20 25 30 Leu His Gly Gly Gln Cys Thr Met Glu Glu Val Gln Ala Trp Val Ile 35 40 45 Asn Arg Tyr Tyr Tyr Gln His Ser Ile Pro Met Lys Asp Ala Ala Phe 50 55 60 Met Ser Arg Val Glu Asp Pro Asp Leu Arg Arg Ala Trp Arg Ser Arg 65 70 75 80 Met Glu Asp His Asp Gly Thr Ala Asp Asn Glu Gly Gly Ile Arg Arg 85 90 95 Trp Leu Arg Leu Ala Glu Ala Val Gly Leu Asp Pro Asp Tyr Val Ser 100 105 110 Thr Thr Glu Gly Val Leu Pro Ala Thr Lys Phe Ala Val Asp Ala Tyr 115 120 125 Val Arg Phe Val Arg Glu Lys Thr Leu Leu Glu Ala Val Ala Ala Ser 130 135 140 Leu Thr Glu Leu Phe Ala Pro Lys Ile His Ala Asn Arg Ile Glu Gly 145 150 155 160 Leu Leu Lys Asn Tyr Ala Phe Ala Asp Asp Ser Ser Leu Ser Tyr Phe 165 170 175 Arg Asn Arg Leu Lys Glu Ala Pro Lys Asp Val Ala Phe Gly Leu Ala 180 185 190 Trp Val Leu Asp His Ala Asp Thr Ala Glu Lys Gln Asp Val Ala Ala 195 200 205 Arg Ala Leu Ile Phe Lys Thr Asp Val Leu Trp Ser Gln Leu Asp Ala 210 215 220 Leu Trp Gly Ala Tyr Val Glu Pro Arg Arg Ile Pro Pro Gly Ala Trp 225 230 235 240 Gln Pro Gly Thr Gly Gln Leu Leu Arg Gln Ala Ser 245 250 <210> 224 <211> 771 <212> DNA <213> Sinorhizobium meliloti <400> 224 gtgacgacgg caactgacag acaagctttc catgcccgcc tgctggagat cggcaaggag 60 cgctaccatg acaagcatcc gtttcatgcg atgctccatg gcggcggttg cacgacgacg 120 caagtccgcg cctgggtgat caaccgctat tattaccaga gccgcatccc catgaaggat 180 gcggcctttc tgtcgcgttg cgacgacccg gatatgcgcc gggcctggcg ctcccgcatc 240 gaagatcacg acggcggcgt cgaggagggc ggcggcatcc ggcgctggct gcgtctcgcc 300 gaggccgtgg gactcgatcc agcctatgtc ggctccgcaa ggggcgtact gccgtcgacc 360 cggtttgccg tggacgccta tgtttccttt gtgcgtgaga agccgctgct cgaggcggtg 420 gcctcctcgc tgacggagct ttttgcgccg aagatccact cggagcgcat tgccgggctg 480 ctggagcact acgccttcgc cgatgacgcg gcgctcgcct acttccgcca gaggctggcg 540 gaggtgcccc gggatgtcga gttcggcctc gcctatgtcc ttgaccatgc cgacacgcgg 600 gaaaagcagg acgcggccgc tcaggcactc accttcaaga cggatgttct ctgggcccag 660 ctcgatgcac tttattcggc ctatgtcacg ccggggcgca ttccgccggg ggcctgggac 720 ggccgggagg gggtgatccg cgagccgaga gcgcgggagg ccgcggaatg a 771 <210> 225 <211> 256 <212> PRT <213> Sinorhizobium meliloti <400> 225 Met Thr Thr Ala Thr Asp Arg Gln Ala Phe His Ala Arg Leu Leu Glu 1 5 10 15 Ile Gly Lys Glu Arg Tyr His Asp Lys His Pro Phe His Ala Met Leu 20 25 30 His Gly Gly Gly Cys Thr Thr Thr Gln Val Arg Ala Trp Val Ile Asn 35 40 45 Arg Tyr Tyr Tyr Gln Ser Arg Ile Pro Met Lys Asp Ala Ala Phe Leu 50 55 60 Ser Arg Cys Asp Asp Pro Asp Met Arg Arg Ala Trp Arg Ser Arg Ile 65 70 75 80 Glu Asp His Asp Gly Gly Val Glu Glu Gly Gly Gly Ile Arg Arg Trp 85 90 95 Leu Arg Leu Ala Glu Ala Val Gly Leu Asp Pro Ala Tyr Val Gly Ser 100 105 110 Ala Arg Gly Val Leu Pro Ser Thr Arg Phe Ala Val Asp Ala Tyr Val 115 120 125 Ser Phe Val Arg Glu Lys Pro Leu Leu Glu Ala Val Ala Ser Ser Leu 130 135 140 Thr Glu Leu Phe Ala Pro Lys Ile His Ser Glu Arg Ile Ala Gly Leu 145 150 155 160 Leu Glu His Tyr Ala Phe Ala Asp Asp Ala Ala Leu Ala Tyr Phe Arg 165 170 175 Gln Arg Leu Ala Glu Val Pro Arg Asp Val Glu Phe Gly Leu Ala Tyr 180 185 190 Val Leu Asp His Ala Asp Thr Arg Glu Lys Gln Asp Ala Ala Ala Gln 195 200 205 Ala Leu Thr Phe Lys Thr Asp Val Leu Trp Ala Gln Leu Asp Ala Leu 210 215 220 Tyr Ser Ala Tyr Val Thr Pro Gly Arg Ile Pro Pro Gly Ala Trp Asp 225 230 235 240 Gly Arg Glu Gly Val Ile Arg Glu Pro Arg Ala Arg Glu Ala Ala Glu 245 250 255 <210> 226 <211> 1416 <212> DNA <213> Oryza sativa <400> 226 cccacgcgtc cgcccacgcg tccgggacac cagaaacata gtacacttga gctcactcca 60 aactcaaaca ctcacaccaa tggctctcca agttcaggcc gcactcctgc cctctgctct 120 ctctgtcccc aagaagggta acttgagcgc ggtggtgaag gagccggggt tccttagcgt 180 gagcagaagg ccaagaagcc gtcgctggtg gtgagggcgg tggcgacgcg gcgggccggt 240 ggcgagcccc ggcgcgggca cgtcgaaggc ggacgggaag aagacgctgc ggcagggggt 300 ggtggtgatc accggcgcgt cgtcggggct cgggctcgcg gcggcgaagg cgcttggcgg 360 agacggggaa gtggcacgtg gtgatggcgt tccgcgactt tcctgaaggc ggcgacggcg 420 gcgaaggcgg cggggatggc ggcggggagc tacaccgtca tgcacctgga cctcgcctcc 480 ctcgacagcg tccgccagtt cgtggacaac ttccggcgct ccggcatgcc gctcgacgcg 540 ctggtgtgca acgccgcaca tctaccggcc gacggcgcgg caaccgacgt tcaacgccga 600 cgggtacgag atgagcgtcg gggtgaacca cctgggccac ttcctcctcg cccgcctcat 660 gctcgacgac ctcaagaaat ccgactaccc gtcgcggcgg ctcatcatcc tcggctccat 720 caccggcaac accaacacct tcgccggcaa cgtccctccc aaggccgggc taggcgacct 780 ccgggggctc gccggcgggc tccgcgggca gaacgggtcg gcgatgatcg acggcgcgga 840 gagcttcgac ggcgccaagg cgtacaagga cagcaagatc tgtaacatgc tgacgatgca 900 ggagttccac cggagattcc acgaggagac cgggatcacg ttcgcgtcgc tgtacccggg 960 gtgcatcgcg acgacgggct tgttccgcga gcacatcccg ctgttccggc tgctgttccc 1020 gccgttccag cggttcgtga cgaaggggtt cgtgtcggag gcggagtccg ggaagcggct 1080 ggcgcaggtg gtgggcgacc cgagcctgac caagtccggc gtgtactgga gctggaacaa 1140 ggactcggcg tcgttcgaga accagctctc gcaggaggcc agcgacccgg agaaggccag 1200 gaagctctgg gacctcagcg agaagctcgt cggcctcgtc tgagtttatt atttacccat 1260 tcgtttcaac tgttaatttc ttcggggttt agggggtttc agctttcagt gagagaggcc 1320 tgtcaagtga tgtacaatta gtaatttttt tttacccgac aaatcatgca ataaaaccac 1380 aggcttacat tatcgatttg tccacctaaa ttaagt 1416 <210> 227 <211> 2194 <212> DNA <213> Oryza sativa <400> 227 aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60 aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140 acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200 tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260 tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320 atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380 gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440 gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500 gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560 gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620 tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680 ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740 actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800 agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860 atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920 gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980 ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040 acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100 aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160 ttggtgtagc ttgccacttt caccagcaaa gttc 2194 <210> 228 <211> 55 <212> DNA <213> Artificial sequence <220> <223> primer: prm08777 <400> 228 ggggacaagt ttgtacaaaa aagcaggctt aaacaatgac tgacacccca atgtc 55 <210> 229 <211> 51 <212> DNA <213> Artificial sequence <220> <223> primer: prm08782 <400> 229 ggggaccact ttgtacaaga aagctgggtt cataaggtga ttcctttatg c 51

Claims

PEPC (phosphoenolpyruvate carboxylase),
Class III U-Box 단백질 및
PQQC 단백질
로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절을 포함하는, 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.
제1항에 있어서, 상기 수확량을 증가시키는 폴리펩티드는 서열번호 2, 서열번호 75, 서열번호 105 및 상기 서열의 오쏘로그(orthologue) 및 패럴로그(paralogue)로 이루어진 그룹에서 선택된 것을 특징으로 하는 방법.
제1항 또는 제2항에 있어서, 상기 수확량을 증가시키는 단백질은 서열번호 2, 서열번호 75 및 서열번호 105로 이루어진 그룹에서 선택된 폴리펩티드의 C-말단 영역에 증가하는 순으로 선호되는, 적어도 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 가지는 C-말단 영역을 가지는 것을 특징으로 하는 방법.
제1항 내지 제3항 중 어느 한 항에 있어서, 상기 PEPC 단백질은 하기 모티프 중 임의의 하나 이상을 포함하는 것을 특징으로 하는 방법:
모티프 I: QEIMVGYSDSNKD, 또는 모티프 I에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 가지는 모티프;
모티프 II: FHGRGGSVGRGGGPAYKAIL, 또는 모티프 II에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 가지는 모티프;
모티프 III: LRAIPWVF, 또는 모티프 III에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 가지는 모티프;
모티프 IV: GIAAGMRNTG, 또는 모티프 IV에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 가지는 모티프;
모티프 V: SGFLSSNWE, 또는 모티프 V에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 가지는 모티프;
모티프 VI: SYKEWPEDKR, 또는 모티프 VI에 증가하는 순으로 선호되는, 적어도 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 가지는 모티프.
제4항에 있어서, 상기
모티프 I은 바람직하게는 QE V/I M I/L/V GYSDS G/N/S K D/F 이고;
모티프 II는 바람직하게는 FHGRGG T/S V/I GRGGGP T/S/A H/Y L/I/E/D/K AI L/Q/V 이고;
모티프 III은 바람직하게는 LRAIPW I/L/V F 이고;
모티프 IV는 바람직하게는 G I/V A/S AG L/M Q/R/K N T/S G 이고;
모티프 V는 바람직하게는 S/G G F/I L/T/V S/T S N/Q/G WE 이고;
모티프 VI은 바람직하게는 S/T Y S/L/K/A/R/Q E/K/D W S/P/T/D E E/D R/G/K/Q R/K인 것을 특징으로 하는 방법.
제1항 내지 제5항 중 어느 한 항에 있어서, 상기 조절된 발현은 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
제1항 내지 제6항 중 어느 한 항에 있어서, 상기 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산은 표 9 내지 표 11에 열거된 단백질 중 임의의 하나를 암호화하거나, 또는 상기 핵산의 부분, 또는 상기 핵산과 혼성화할 수 있는 핵산인 것을 특징으로 하는 방법.
제1항 내지 제7항 중 어느 한 항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비해 각각 증가된 지상부 면적, 증가된 출현(emergence) 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률(fill rate), 원추화서(panicle)당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이(height) 및 뿌리 굵기의 증가 중 하나 이상을 포함하는 것을 특징으로 하는 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 또는 순한 가뭄 조건 하에서 얻어진 것을 특징으로 하는 방법.
제1항 내지 제8항 중 어느 한 항에 있어서, 상기 향상된 수확량 관련 형질은 질소 결핍 조건 하에서 얻어진 것을 특징으로 하는 방법.
제1항 내지 제10항 중 어느 한 항에 있어서, 상기 핵산은 어린 녹색 조직 특이적 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 PEPC 폴리펩티드를 암호화하는 핵산은 세균 또는 식물 유래인 것을 특징으로 하는 방법.
PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 재조합 핵산을 포함하는 것을 특징으로 하는, 제1항 내지 제12항 중 어느 한 항에 따른 방법에 의해 수득 가능한, 종자를 포함하는 식물 또는 식물의 일부.
하기를 포함하는 구축물:
(i) 제1항 내지 제5항 중 어느 한 항에 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산;
(ii) (i)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
제14항에 있어서, 상기 조절 서열은 어린 녹색 조직 특이적 프로모터인 것을 특징으로 하는 구축물.
대조구 식물에 비해 각각 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가 중 하나 이상을 가진 식물을 생산하기 위한 방법에 있어, 제14항 또는 제15항에 따른 구축물의 용도.
제14항 또는 제15항에 따른 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
하기 단계를 포함하는 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 제1항 내지 제5항 중 어느 한 항에 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
제1항 내지 제5항 중 어느 한 항에 정의된 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 증가된 발현으로 인해, 대조구 식물에 비하여 각각 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가 중 하나 이상을 가진 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포.
제13항, 제17항, 또는 제19항 중 어느 한 항에 있어서, 상기 식물은 작물 식물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호밀, 라이밀, 수수 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포.
수확 가능한 부분이 바람직하게는 신초(shoot) 생물량 및/또는 종자인 것을 특징으로 하는, 제20항에 따른 식물의 수확 가능한 부분.
제20항에 따른 식물 및/또는 제21항에 따른 식물의 수확 가능한 부분 유래의 산물.
대조구 식물에 비해 각각 수확량을 증가시키는, 특히 증가된 지상부 면적, 증가된 출현 활력, 증가된 총 종자 수, 증가된 종자 중량, 증가된 충만률, 원추화서당 증가된 꽃의 수, 증가된 종자 수, 증가된 수확 지수, 증가된 높이 및 뿌리 굵기의 증가 중 하나 이상을 증가시키는 PEPC, Class III U-Box 및 PQQC 폴리펩티드로 이루어진 그룹에서 선택된 수확량을 증가시키는 폴리펩티드를 암호화하는 핵산의 용도.