KR101255413B1 - 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 - Google Patents
향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 Download PDFInfo
- Publication number
- KR101255413B1 KR101255413B1 KR1020097026438A KR20097026438A KR101255413B1 KR 101255413 B1 KR101255413 B1 KR 101255413B1 KR 1020097026438 A KR1020097026438 A KR 1020097026438A KR 20097026438 A KR20097026438 A KR 20097026438A KR 101255413 B1 KR101255413 B1 KR 101255413B1
- Authority
- KR
- South Korea
- Prior art keywords
- plant
- nucleic acid
- plants
- delete delete
- increased
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8222—Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
- C12N15/8223—Vegetative tissue-specific promoters
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8222—Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
- C12N15/8223—Vegetative tissue-specific promoters
- C12N15/8227—Root-specific
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8273—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Cell Biology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 일반적으로 분자생물학 분야에 관한 것이며, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 더욱 상세하게는, 본 발명은 2-Cys PRX (2-cysteine peroxiredoxin)를 암호화하는 핵산 서열의 식물 뿌리에서의 발현을 조절함으로써, 바람직하게는 증가시킴으로써, 또는 ANN 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절함으로써 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 2-Cys PRX를 암호화하는 핵산 서열의 뿌리에서의 발현이 조절된, 바람직하게는 증가된, 또는 ANN 폴리펩티드를 암호화하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 수확량 관련 형질이 향상된 것이다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.
2-Cys PRX, ANN 폴리펩티드, 수확량, 발현 조절
Description
본 발명은 일반적으로 분자생물학 분야에 관한 것이며, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 더욱 상세하게는, 본 발명은 2-Cys PRX (2- cysteine peroxiredoxin)를 암호화하는 핵산 서열의 식물 뿌리에서의 발현을 조절함으로써, 바람직하게는 증가시킴으로써, 또는 ANN 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절함으로써 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 2-Cys PRX를 암호화하는 핵산 서열의 뿌리에서의 발현이 조절된, 바람직하게는 증가된, 또는 ANN 폴리펩티드를 암호화하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 대조구 식물에 비하여 수확량 관련 형질이 향상된 것이다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.
세계 인구의 증가와 농업에 유용한 경작지의 감소는 농업의 효율성을 증가시키는 연구에 박차를 가하게 만들었다. 작물 및 원예농업 향상을 위한 전통적인 방식은 바람직한 특성을 갖는 식물체를 동정하기 위하여 선택적 육종기법을 이용한다. 그러나, 상기 선택적 육종기법에는 몇 가지 약점이 있는데, 즉 노동집약적이며 양친으로부터 원하는 형질이 항상 전해지는 것이 아닌 이종의 유전적 요소를 갖는 식물로 귀착된다는 것이다. 분자생물학의 진보는 인간이 동물 및 식물의 유전자원 (germplasm)을 변형하게 허용했다. 식물유전공학은 유전물질 (전형적으로 DNA 또는 RNA 형태)의 분리와 조작 및 이 유전물질을 식물체 내로 도입하게 했다. 상기 기술은 다양한 향상된 경제적, 농업적, 원예적 형질을 갖는 작물 또는 식물을 제공하는 능력이 있다.
특히 경제적으로 중요한 형질은 증가된 수확량이다. 수확량은 보통 작물로부터 경제적 가치의 측정할 수 있는 산물로 정의된다. 이는 양 및/또는 질의 면에서 정의될 수 있다. 수확량은 몇 가지 요인에 직접적으로 의존되는데, 예를 들면 기관의 수와 크기, 식물체 형상 (예를 들면, 가지의 수), 종자 생산, 잎의 노화 등이다. 뿌리 발달, 양분 흡수, 스트레스 내성, 및 초기 활력 또한 수확량 결정에 중요한 요인일 수 있다. 상기 요인들을 최적화하는 것이 작물 수확량 향상에 기여할 수 있다.
많은 식물의 종자는 인간과 동물의 영양에 중요하므로 종자 수확량이 특히 중요한 형질이다. 옥수수, 벼, 밀, 캐놀라 및 대두와 같은 작물이 종자 자체의 직접적인 소비 또는 가공종자로 육성된 육류 소비를 통해서 전체 인간 칼로리 흡수량의 절반 이상을 차지한다. 상기 작물들은 설탕, 기름 및 산업적 가공공정에 사용되는 많은 종류의 대사물의 재료이기도 하다. 종자는 배 (어린 줄기와 뿌리의 근원) 및 배유 (발아 동안 및 실생의 초기 생장 동안 배의 양분의 공급원)를 포함한다. 종자 발달에는 많은 유전자가 관여되며, 뿌리, 잎 및 줄기로부터 생장하는 종자로 대사물의 이동이 필요하다. 특히 배유는 탄수화물, 오일 및 단백질의 대사 전구체를 동화하여, 이들을 알곡을 채우기 위한 저장성 고분자로 합성한다.
많은 작물에 있어 추가로 경제적으로 중요한 형질은 초기 활력 (early vigour)이다. 초기 활력을 향상시키는 것은 온대 및 열대 벼 품종에 있어 현대 벼 육종 프로그램의 중요한 목표이다. 긴 뿌리는 물에 파종하는 벼에서는 적절하게 토양에 박히기 위하여 중요하다. 벼를 직접 논에 파종한 곳에서와 식물이 물 밖으로 급속히 나와야 하는 곳에서는 긴 어린 줄기가 강도와 연관되어 있다. 조파지에서는 긴 중배축과 자엽초가 실생이 나오기에 좋다. 식물체가 초기활력을 갖게 하는 기술은 농업에서 매우 중요하다. 예를 들면, 빈약한 초기 활력은 유럽 연안국의 콘벨트(Corn Belt) 유전자원에 기반한 옥수수 (Zea mays L.) 잡종의 도입에 제한이 되었다.
식물 생물량(biomass)은 알팔파, 청예옥수수 및 건초와 같은 사료작물에 대한 수확량이다. 수확량에 대한 많은 대체물이 곡류 작물에서 사용되어 왔다. 그 중 주요한 것으로는 식물체 크기를 평가하는 것이다. 식물체 크기는 생물종 및 발달 단계에 따라 많은 방식으로 측정될 수 있으나, 총 식물 건량, 지상부 건량, 지상부 생체량, 엽면적, 수간재적(stem volume), 초장, 로제트 직경, 엽장, 근장, 근질량, 분얼수 및 엽수를 포함한다. 많은 생물종은 특정 발달 단계에서 식물체의 각 부분 간의 크기에 일정한 비율을 유지한다. 상기의 상대적인 관계가 한 기관의 측정 크기로 다른 기관의 크기를 추정하는 데 사용된다 (예를 들면, Tittonell et al 2005 Agric Ecosys & Environ 105: 213). 초기 발달 단계에서 식물체의 크기는 전형적으 로 발달 후기의 식물체의 크기와 연관되어 있다. 보다 큰 엽면적을 갖는 보다 큰 식물체가 보다 작은 식물체에 비해 전형적으로 보다 많은 광 및 이산화탄소를 흡수하므로, 동일 기간 내에 보다 큰 중량을 얻을 것이다 (Fasoula & Tollenaar 2005 Maydica 50:39). 미소환경적 또는 유전적 이점의 잠재적 지속성에 부가하여, 이는 식물체가 초기에 보다 큰 크기를 가져야 하는 이유이다. 식물체의 크기 및 생장 속도에 대한 강력한 유전적 인자가 있으며 (예를 들면, ter Steege et al 2005 Plant Physiology 139:1078), 넓은 범위의 유전인자형에 대해 한 가지 환경조건 하에서의 식물체의 크기는 다른 조건 하에서의 크기와 연관되어 있을 것이다 (Hittalmani et al 2003 Theoretical Applied Genetics 107:679). 이와 같은 방식으로 표준환경이 다양한 시간 및 위치에서 밭작물이 접하는 다양하며 동적인 환경에 대한 대체물로서 사용 가능하다.
지상부 건조 중량에 대한 종자 수확량의 비율인 수확지수는 많은 환경 조건하에서 비교적 안정되어 있어, 식물 크기 및 곡물 수확량 간에 강한 상관관계가 얻어질 수 있다 (예를 들면, Rebetzke 등 (2002) Crop Science 42:739). 곡물 생물량의 대부분은 식물체의 잎 및 줄기에 의한 현재의 또는 저장된 광합성 생산성에 의존하므로 상기 과정들은 본질적으로 연결되어 있다 (Gardener 등 (1985) Physiology of Crops. Iowa State University Press, pp 68-73). 따라서, 발달 초기 단계에 식물체의 크기에 대한 선발은 미래의 잠재적인 수확량에 대한 지표로 사용되어 왔다 (예를 들면, Tittonell 등 (2005) Agric Ecosys & Environ 105: 213). 유전적 차이가 스트레스 내성에 미치는 영향을 점검 시, 토양 특성, 온도, 수분 및 양분 이용성 및 광 강도를 표준화하는 능력이 필드와 비교하여 온실 또는 식물 생장상(growth chamber) 환경의 본질적인 이점이다. 그러나, 바람 또는 곤충의 부재로 인한 빈약한 수분(pollination), 또는 뿌리 생장 또는 수관(canopy) 생장을 위한 불충분한 공간으로 인한 수확량의 인위적인 제한은 수확량 차이의 점검을 위한 상기 통제된 환경의 사용을 제한할 수 있다. 따라서, 생장상 또는 온실의 표준화된 조건하에서 발달 초기에 식물체의 크기를 측정하는 것이 잠재적인 유전적 수확량 이점을 표시하는 표준 방식이다.
중요한 또 다른 형질은 향상된 비생물적 스트레스 내성 형질이다. 비생물적 스트레스가 전세계적으로 작물 손실의 일차적인 원인이며, 대부분의 주요 작물에 대해 평균 수확량을 50% 이상 감소시켰다 (Wang 등, Planta (2003) 218: 1-14). 비생물적 스트레스는 가뭄, 염분, 극단적인 온도, 화학적 독성, 양분의 과다 또는 부족 (대량원소 및/또는 미량원소), 방사 및 산화적 스트레스에 의해 야기될 수 있다. 비생물적 스트레스에 대한 식물체의 내성을 증가시키는 것은 전세계적으로 농부에게 매우 큰 경제적 이점이 있으며, 불리한 조건에서 및 작물 재배가 불가능한 지역에서 작물 재배를 가능하게 한다.
작물 수확량은 따라서 상기 요인들 중 어느 하나를 최적화함으로써 증가시킬 수 있다.
최종 목적에 따라, 임의의 수확량 형질의 변형이 다른 것에 비해 월등히 유리할 수 있다. 사료 또는 목재 생산, 또는 바이오연료 자원과 같은 경우에 적용에 대해 예를 들면, 식물체의 영양기관 부분의 증가가 바람직하며, 곡분, 전분 또는 유지 생산과 같은 경우에는 종자에 관련된 매개변수의 증가가 특히 바람직하다. 종자 매개변수 중에서도 용도에 따라 특정한 일부의 것이 다른 것에 비해 훨씬 중요하다. 종자 크기의 증가 또는 종자 수의 증가의 형태로 다양한 기작이 종자 수확량 증가에 영향을 미칠 수 있다.
식물의 수확량 관련 형질 (예를 들면 수확량 증가, 특히 종자 수확량 및/또는 생물량(biomass))의 향상은 세포 주기 또는 식물 생장 또는 방어 기작에 관련된 다양한 신호전달 경로와 같은 식물의 내재적 생장 기작의 변형을 통해서 가능하다.
놀랍게도, 지금 2-Cys PRX(2- cysteine peroxiredoxin)를 암호화하는 핵산 서열을 식물체의 뿌리에서 발현을 조절, 바람직하게는 증가시키거나, 또는 ANN 폴리펩티드를 암호화하는 핵산의 발현을 식물체에서 조절함으로써, 다양한 식물 수확량 관련 형질이 대조구 식물에 비해 향상될 수 있다는 것이 밝혀졌다,
일 구현예에 따라, 2-Cys PRX(2- cysteine peroxiredoxin)를 암호화하는 핵산 서열을 식물체의 뿌리에서 발현을 조절, 바람직하게는 증가시키거나, 또는 ANN 폴리펩티드를 암호화하는 핵산의 발현을 식물체에서 조절함으로써, 대조구 식물에 비해 다양한 식물 수확량 관련 형질을 향상시키는 방법이 제공된다.
I. 2-
Cys
PRX
(2-
cysteine
peroxiredoxin
)
티올 PRX (peroxidases)는 환원제로서 촉매성 시스테인 잔기 및 티올 함유 단백질에 의한 페록시아질산염(peroxynitrites) 및 다양한 과산화물의 환원을 촉매하는 편재하는 헴 부재 페록시다아제(heme-free peroxidases)이다. 식물에서는, 보 존된 촉매성 시스테인의 수 및 위치에 따라 5 종류로 구분될 수 있다. 페록시레독신(peroxiredoxins)으로 정의된 4 종류는 이미 계통유전학적 서열 분석에 의해 동정된 바 있는 1-Cys, 2-Cys, type II, 및 type Q 페록시레독신이고, 5 번째는 최근에 식물에서 티오레독신(thioredoxin) 의존성 활성을 갖는 것으로 알려진 글루타치온 페록시다아제(glutathione peroxidases)이다 (Rouhier & Jacquot (2005) Free Radic Biol Med 38(11): 1413-21). 아라비돕시스 탈리아나(Arabidopsis thaliana)의 게놈 분석은 적어도 티오레독신 의존성 페록시다아제의 17 가지의 이성질형(isoform)이 식물체의 다양한 부위에서 발현된다는 것을 나타낸다.
2-Cys PRX는 세포 증식, 분화, 아포토시스(apoptosis), 및 광합성에 관여하는 단백질 그룹이다. 상기 효소는 H2O2, 페록시아질산염 및 알킬 하이드로퍼록사이드를 전자 공여자로서 티오레독신(Trx)을 이용하여 물 또는 알코올로 각각 환원한다 (Netto 등, (1996) J Biol Chem 271 (26): 15315-15321). 상기 과정을 통해 2-Cys PRXs는 신호전달 경로를 조절하거나 산화적 손상에 대해 고분자를 보호한다. 상기 단백질은 동종이량체이며, 각 서브유닛은 2 개의 보존된 시스테인을 갖는다 (Choi 등, (1998) Nature Struct Biol 5:400-406). 과산화물은 한 서브유닛의 N-말단 시스테인을 설펜산(sulphenic acid)으로 산화하며, 상기 설펜산은 다른 서브유닛의 C-말단 시스테인과 반응하여 분자 내 이황화물을 형성한다. 촉매순환과정을 완성하기 위해 상기 효소는 티올/이황화물 산화환원 반응 교대(redox interchange)를 통해 환원된다 (Chae 등, (1994) Proc Natl Acad Sci USA 91: 7017-7021).
2-Cys PRX의 수준이 감소된 형질전환 아라비돕시스 탈리아나(Arabidopsis thaliana) 식물 (Baier 등 (2000) Plant Physiol 124(2): 823-32)이 안티센스 억제에 의해 생성되었다. 2-Cys PRX 발현의 억제가 다른 항산화 유전자의 발현을 증가시켰는데, 이는 상기 효소가 엽록체의 항산화 네트워크의 구성 요소를 이루며, 다른 방어계와 기능적으로 상호 연관되어 있다는 증거이다.
국제특허출원 WO05/116082는 구성적 콜리플라워 모자익 바이러스 35S 프로모터를 사용하여 아라비돕시스 2-Cys PRX (BAS1로 명명)를 과발현하는 형질전환 아라비돕시스 식물의 수득을 기재하고 있다. 상기 형질전환 식물은 야생형 식물에 비해 열 충격(heat shock) 및 병원균에 대해 잠재적인 저항성이 보다 높다고 기재하고 있다.
놀랍게도, 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물체 뿌리에서의 발현의 조절, 바람직하게는 증가로, 대조구 식물에 비해 수확량 관련 형질이 향상된 식물체로 된다는 것이 발견되었다.
일 구현예에 따라, 2-Cys PRX를 암호화하는 핵산 서열의 식물체 뿌리에서의 발현을 조절, 바람직하게는 증가시키는 단계를 포함하는 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법이 제공된다. 상기 향상된 수확량 관련 형질은 하기 중 하나 이상을 포함한다: (i) 향상된 초기 활력; (ii) 증가된 지상부 생물량(biomass); (iii) 증가된 뿌리 (두꺼운 및 가는) 생물량(biomass); (iv) 원추화서당 증가된 꽃의 수; (v) 증가된 종자 충만율(fill rate); (vi) 식물체당 증가된 총 종자 수확량; (vii) 증가된 (충만된) 종자 수; (viii) 증가된 수확 지수; 또는 (ix) 증가된 천립당 중량 (TKW).
II
.
애넥신
유사(
ANN
:
Annexin
-
like
)
애넥신은 칼슘 의존성 인지질 결합 단백질의 패밀리를 이루며, 식물 및 동물에서 발견된다. 조사된 모든 식물 종에서 적어도 2 개의 다른 애넥신이 존재함이 밝혀졌다. 구조적으로, 식물 애넥신이 동물 애넥신에 비해 덜 분지되어(divergent) 있다.
비교 연구에서는 식물 애넥신이 적어도 하나의, 보통 4 개 또는 그 이상의, 약 70 개의 아미노산으로 구성된, 보존된 반복서열을 포함하는 핵심 도메인에 있어서는 상당한 상동성을 공유하는 것으로 나타났다. 칼슘-결합 단백질로서, 애넥신은 칼슘 신호전달 경로에 역할을 하는 것으로 추정된다. 비록 애넥신의 구조는 오늘날 잘 알려져 있으나, 기능적으로 잘 밝혀져 있지 않다. 식물에서는, 애넥신이 골지체 매개된 분비, 세포 팽창, 액포 발생, 엽록체막 결합, 세포 주기, 근류착생 신호전달, 스트레스 신호전달에 관련된 것으로 보고된 바 있다.
US20050089872에는 아라비돕시스 탈리아나의 애넥신 1 및 애넥신 4 암호화 유전자 각각에 대한 T-DNA 삽입 돌연변이체 (anx1 및 anx4-1)가 기재되어 있다. 돌연변이체는 염 스트레스 및 삼투 스트레스에 민감하였다. 또한 앱시스산(abscisic acid)은 anx1 및 anx4-1 돌연변이체의 발아 및 생장에 음적인(negative) 효과를 갖는다. 발현 분석에서는 ANX1 단백질이 꽃, 줄기 또는 잎 조직에서는 아니나, 뿌리에서 우세하게 발현되는 것으로 나타났다. ANX1 및 ANX4 단백질이 삼투 스트레스 및 ABA 신호의 변환에 역할을 하는 것으로 추정된다.
놀랍게도, 이제 ANN 폴리펩티드를 암호화하는 핵산의 발현 조절로 대조구 식물에 비해 수확량 관련 형질이 향상된, 특히 수확량이 증가된 식물이 된다는 것이 발견되었다.
일 구현예에 따라, 식물에서 ANN 폴리펩티드를 암호화하는 핵산의 발현 조절을 포함하는, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법이 제공된다. 상기 향상된 수확량 관련 형질은 증가된 종자 수확량을 포함한다.
폴리펩티드(들)/단백질(들)
용어 "폴리펩티드" 및 "단백질"은 본 발명에서 상호 교체 사용되며, 펩티드 결합으로 연결된 임의의 길이의 아미노산의 중합형을 말한다.
폴리뉴클레오티드(들)/핵산(들)/
핵산서열
(들)/뉴클레오티드 서열(들)
용어 "폴리뉴클레오티드(들)", "핵산서열(들)", "뉴클레오티드 서열(들)", "핵산(들)", "핵산분자(들)"은 본 발명에서 상호 교체 사용되며, 임의의 길이의 미분지된 중합형인, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 양자의 조합인 뉴클레오티드를 말한다.
대조구
식물(들)
적절한 대조구 식물의 선택은 실험 셋업에서는 통상적인 부분이며, 해당 식물의 야생형 또는 목적 유전자가 없는 해당 식물을 포함할 수 있다. 대조구 식물은 전형적으로 평가되는 식물과 동일한 식물 종 또는 동일한 변종이다. 대조구 식물은 또한 평가되는 식물의 공접합자(nullizygote)일 수 있다. 본 발명에 사용된 "대조구 식물"은 전체 식물체뿐 아니라, 종자 및 종자의 일부분을 포함하여 식물체의 일부분도 의미하는 것으로 사용된다,
상동체
(들)
단백질의 "상동체"는 문제의 변형되지 않은 단백질에 대해 아미노산 치환, 결실 및/또는 삽입을 가지며, 이들이 유래되는 변형되지 않은 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다.
결실은 단백질로부터 하나 이상의 아미노산의 제거를 말한다.
삽입은 단백질 내의 예정된 위치에 하나 이상의 아미노산 잔기가 도입되는 것을 말한다. 삽입은 하나 또는 다수 아미노산의 서열 내 삽입뿐 아니라 N-말단 및/또는 C-말단 융합을 포함할 수 있다. 일반적으로 아미노산 서열 내 삽입은 N- 또는 C-말단 융합보다 작을 것이며, 약 1 내지 10 개 정도의 잔기이다. N- 또는 C-말단 융합 단백질 또는 펩티드의 예는 효모 two-hybrid 시스템에 사용된 전사 활성제의 결합 도메인 또는 활성화 도메인, 파아지 외피 단백질, (히스티딘)-6-태그, 글루타치온 S-전달효소-태그, 단백질 A, 말토스-결합 단백질, 디히드로폴레이트 환원효소, Tag·100 에피토프, c-myc 에피토프, FLAG-에피토프, lacZ, CMP (칼모둘린-결합 펩티드), HA 에피토프, 단백질 C 에피토프 및 VSV 에피토프를 포함한다.
치환은 유사한 성질 (유사한 소수성, 친수성, 항원성, 알파 나선 또는 베타 병풍 구조를 형성하거나 파괴하는 경향 같은)을 갖는 다른 아미노산으로 단백질의 아미노산의 치환을 말한다. 아미노산 치환은 전형적으로 한 잔기의 치환이나, 폴리펩티드에 부여된 기능적 제약에 따라 클러스터될 수도 있으며 삽입은 보통 약 1 내지 10 개 정도의 아미노산 잔기가 삽입된다. 아미노산 치환은 바람직하게는 보존적 아미노산 치환이다. 보존적 치환 표는 당업계에 주지되어 있다 (예를 들면, Creighton (1984) Proteins, W.H. Freeman and Company (Eds) 및 하기 표 1 참고).
표 1: 보존된 아미노산 치환의 예
잔기 | 보존적 치환 | 잔기 | 보존적 치환 |
Ala | Ser | Leu | Ile; Val |
Arg | Lys | Lys | Arg; Gln |
Asn | Gln; His | Met | Leu; Ile |
Asp | Glu | Phe | Met; Leu; Tyr |
Gln | Asn | Ser | Thr; Gly |
Cys | Ser | Thr | Ser; Val |
Glu | Asp | Trp | Tyr |
Gly | Pro | Tyr | Trp; Phe |
His | Asn; Gln | Val | Ile; Leu |
Ile | Leu, Val |
아미노산 치환, 결실 및/또는 삽입은 고체상 펩티드 합성 등과 같은 당업계에 주지된 펩티드 합성 기술을 이용하거나 또는 재조합 DNA 조작에 의해 용이하게 수행될 수 있다. 단백질의 치환, 삽입 또는 결실 변이체를 제조하기 위한 DNA 서열 조작 방법은 당업계에 주지되어 있다. 예를 들면, DNA 상의 예정된 위치에 치환 돌연변이를 제조하기 위한 기술은 당업자에게 주지되어 있으며, M13 돌연변이유발, T7-Gen 시험관 내 돌연변이유발 (USB, Cleveland, OH), QuickChange 자리지정 돌연변이유발 (Stratagene, San Diego, CA), PCR-매개된 자리지정 돌연변이유발 또는 다른 자리지정 돌연변이유발 프로토콜을 포함한다.
유도체
"유도체"는 목적 단백질과 같이 자연발생 형태의 단백질의 아미노산 서열에 비교하여, 자연적으로 발생하지 않는 아미노산 잔기로 아미노산의 치환 또는 자연적으로 발생하지 않는 아미노산 잔기의 첨가를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 단백질의 "유도체"는 또한 자연발생 형인 폴리펩티드의 아미노산 서열에 비교하여 자연적으로 발생하는 변형된 (글리코실화, 아실화, 프레닐화, 인산화, 미리스토일화, 황화 등) 또는 자연적으로 발생하지 않는 변형된 아미노산 잔기를 포함하는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 유도체는 또한 원래의 아미노산 서열에 비교하여 하나 이상의 비아미노산의 치환 또는 첨가를 포함할 수 있는데, 예를 들면, 이의 검출을 용이하게 하기 위해 결합되는 리포터 분자와 같은 아미노산 서열에 공유적으로 또는 비공유적으로 결합한 리포터 분자나 다른 리간드, 및 자연적으로 발생하는 단백질의 아미노산 서열에 대해 비자연적으로 발생하는 아미노산 잔기이다.
오쏘로그
(들)/
패럴로그
(들)
오쏘로그 및 패럴로그는 유전자의 조상관계를 기재하는데 사용되는 진화적 개념을 포함한다. 패럴로그는 조상 유전자의 복제로 생긴 동일한 종 내의 유전자이고 오쏘로그는 종분화로 인하여 공통 조상 유전자로부터 유래한 다른 생물체의 유전자이다.
도메인
용어 "도메인"은 진화적으로 연관된 단백질의 서열 정렬 시 특정 위치에서 보존된 아미노산의 세트이다. 다른 위치의 아미노산은 상동체들 간에 다양할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 기능에 필수적일 것인 아미노산을 나타낸다. 단백질 상동체 패밀리의 정렬된 서열상에서 고도로 보존된 부분은 임의의 문제되는 폴리펩티드가 이전에 동정된 폴리펩티드 패밀리에 속하는지를 결정하는 동정부위로 사용될 수 있다.
모티프/일치 서열/시그너처(
signature
)
용어 "모티프", "일치 서열" 또는 "시그너처"는 진화적으로 연관된 단백질의 서열에 있어 짧은 보존된 영역을 말한다. 모티프는 흔히 도메인의 고도로 보존된 부분뿐만 아니라, 도메인의 일부만을 포함할 수도 있거나 또는 보존된 도메인 외부에 있을 수도 있다 (만일 모티프의 아미노산 모두가 지정된 도메인 외부에 있으면).
혼성화
본 발명에 정의된 용어 "혼성화"는 사실상 상동인 상보적인 뉴클레오티드 서열이 서로 어닐링하는 과정이다. 혼성화 과정은 전적으로 용액 내에서, 즉 상보적인 두 가지 핵산 분자가 용액 내에 있을 때 일어날 수 있다. 혼성화 과정은 또한 상보적인 핵산 분자의 하나가 자성 비드, Sepharose 비드 또는 어떤 다른 수지(resin) 같은 기질에 고정되었을 때도 일어날 수 있다. 혼성화 과정은 더욱이 상보적인 핵산 분자 중의 하나가 니트로셀룰로스 또는 나일론 막 같은 고체 지지체에 고정되었거나 또는 사진석판술에 의하여 규산질의 유리 지지체 (핵산 어레이, 마이크로어레이 또는 핵산 칩이라 알려짐)에 고정되었을 때에도 일어날 수 있다. 혼성화가 일어나게 하기 위하여, 핵산분자는 일반적으로 열적으로 또는 화학적으로 변성되어 이중 가닥을 2개의 단일 가닥으로 녹이고/녹이거나 단일가닥 핵산 분자로부터 헤어핀 또는 기타 이차 구조를 제거한다.
용어 "스트린전시"는 혼성화가 일어나는 조건을 말한다. 혼성화의 스트린전시는 온도, 염 농도, 이온 강도 및 혼성화 완충액 조성 같은 조건의 영향을 받는다. 일반적으로 낮은 스트린전시 조건은 정해진 이온강도 및 pH에서 특정 서열에 대한 용해점 2-Cys PRXnt (Tm) 보다 약 30℃ 낮은 온도가 선택된다. 중간 스트린전시 조건은 Tm 보다 20℃ 낮은 온도일 때, 높은 스트린전시 조건은 Tm 보다 10℃ 낮은 온도이다. 높은 스트린전시 혼성화 조건은 전형적으로 표적 핵산 서열에 높은 서열 유사성을 갖는 혼성화 서열을 분리하기 위해 사용된다. 그러나, 핵산은 서열 상의 차이가 있더라도 유전암호의 축퇴로 인하여 실제로는 동일한 폴리펩티드를 암호화할 수 있다. 그러므로, 중간 스트린전시 혼성화 조건은 종종 상기 핵산분자를 동정하는데 필요할 수 있다.
Tm은 정해진 이온 강도 및 pH 하에서 표적 서열의 50%가 완벽하게 매치된 탐침에 혼성화하는 온도이다. Tm은 용액 조건, 염기 조성 및 탐침의 길이에 의존적이다. 예를 들면, 보다 긴 서열일수록 보다 높은 온도에서 특이적으로 혼성화한다. 최대 혼성화율은 Tm보다 약 16℃에서 32℃까지 낮을 때 얻어진다. 1가 양이온이 혼성액에 있으면 두 핵산 가닥 간에 정전기적 반발이 감소하여 혼성화가 촉진되고 이 효과는 0.4M (보다 높은 농도에서는 이 효과가 무시될 수 있다)까지의 나트륨 농도에서 보여진다. 포름아미드는 DNA-DNA 및 DNA-RNA 이중가닥의 용해 온도를 포름아미드 퍼센트 당 0.6 내지 0.7℃ 내리며, 50% 포름아미드의 첨가는 혼성화율은 낮아지더라도 혼성화가 30 내지 45℃에서 일어나게 한다. 염기쌍 미스매치는 혼성화율 및 이중가닥의 온도 안정성을 감소시킨다. 평균적으로 그리고 큰 탐침에 대하여, Tm은 염기 미스매치 % 당 약 1℃ 감소한다. Tm은 혼성체의 유형에 따라 하기의 식으로 계산할 수 있다:
1) DNA-DNA 혼성체 (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1 -0.61x%포름아미드
2) DNA-RNA 또는 RNA-RNA 혼성체:
Tm= 79.8 + 18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3) 올리고-DNA 또는 올리고-RNAd 혼성체:
20개 뉴클레오티드 미만에 대해: Tm=2(In)
20-35개 뉴클레오티드에 대해: Tm=22+1.46(In)
a 또는 다른 1가 양이온에 대하여, 0.01-0.4 M 범위 내에서만 정확.
b 30% 내지 75% 범위 내에서 %GC에 대하여만 정확.
c L = bp으로 표시된 이중가닥의 길이.
d 올리고, 올리고뉴클레오티드; In,= 효과적인 프라이머 길이 = 2x(G/C의 수)+(A/T의 수).
비특이적 결합은 예를 들면, 단백질 함유 용액으로 막을 차단하고, 혼성화 완충액에 이종의 RNA, DNA, 및 SDS를 첨가하고, RNAse 처리하는 것과 같은 많은 알려진 기술 중 임의의 하나를 사용하여 조절할 수 있다. 비상동 탐침에 대하여, 일련의 혼성화 과정은 (i) 점차적으로 어닐링 온도를 낮추거나 (예를 들면 68℃에서 42℃까지) (ii) 점차적으로 포름아미드 농도를 낮추거나 (예를 들면 50%에서 0%까지) 중 하나를 변화시킴으로써 수행될 수 있다. 당업자는 혼성화 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
혼성화 조건 외에, 혼성화의 특이성은 또한 전형적으로 혼성화 후 세척 기능에 의존한다. 비 특이적 혼성화로 생기는 백그라운드를 제거하기 위하여, 시료를 묽은 염 용액으로 세척한다. 이런 세척의 결정적인 요인은 최종 세척액의 이온 강도 및 온도를 포함한다: 염 농도가 낮고 세척 온도가 높을수록 세척의 스트린전시는 높아진다. 세척 조건은 전형적으로 혼성화 스트린전시에서 또는 보다 낮게 수행된다. 양성 혼성화는 적어도 백그라운드의 2 배의 신호로 나타난다. 일반적으로 핵산 혼성화 분석이나 유전자 증폭 검출 과정에 적절한 스트린전트 조건은 상기와 같다. 다소 스트린전트한 조건 또한 선택될 수 있다. 당업자는 세척 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
예를 들면, 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 전형적인 높은 스트린전시 혼성화 조건은 65℃, 1x SSC에서 또는 42℃, 1x SSC 및 50% 포름아미드에서 혼성화 후 65℃, 0.3x SSC에서 세척하는 것이다. 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 중간 스트린전시 혼성화 조건은 50℃, 4x SSC 또는 40℃, 6x SSC 및 50% 포름아미드에서 혼성화 후, 50℃, 2x SSC에서 세척하는 것이다. 혼성체의 길이는 혼성화하는 핵산 분자에 대해 예측된 길이이다. 알려진 서열의 핵산 분자가 혼성화 될 때 혼성체의 길이는 서열을 정렬하고 본 발명에서 기재된 보존된 영역을 동정하면 결정될 수 있다. 1X SSC는 0.15M NaCl 및 15mM 소듐 시트레이트이며 혼성액 및 세척액에는 부가적으로 5x Denhardt's reagent, 0.5-1.0% SDS, 100 ㎍/ml 변성된, 단편화된 연어 정자 DNA, 0.5% 소듐 피로포스페이트가 포함된다.
스트린전시 수준을 결정하기 위해서는 [SambrOoka 등 (2001) Molecular Cloning: laboratory manual, 3rdEdition, Cold Spring Harbor Laboratory Press, CSH, New York or to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989, 매년 개정됨)]을 참조하면 된다.
스플라이스
변이체
본 발명에서 사용된 용어 "스플라이스 변이체"는 선정된 인트론 및/또는 엑손이 절단되거나, 치환되거나, 대체되거나, 부가된, 또는 인트론이 짧아지거나 길어진 핵산 서열의 변이체를 포함한다. 상기 변이체는 단백질의 생물학적 활성이 사실상 보유되며 이는 단백질의 기능적 단편을 선택적으로 보유함으로써 달성될 수 있다. 상기 스플라이스 변이체는 자연계에서 발견되거나 인공적으로 만들 수도 있다. 상기 스플라이스 변이체를 예측하고 분리하는 방법은 당업계에 주지되어 있다 (예를 들면 Foissac and Schiex (2005) BMC Bioinformatics 6: 25 참고).
대립인자
변이체
대립인자 또는 대립인자 변이체는 동일한 염색체 상에 위치한 해당 유전자의 또 다른 형태이다. 대립인자 변이체는 작은 삽입/결실다형성 (Insertion/Deletion Polymorphisms, INDELs)뿐 아니라 단일염기다형성 (SNPs)을 포함한다. INDELs의 크기는 보통 100 bp 미만이다. SNPs 및 INDELs이 대부분의 생물체의 자연적으로 발생하는 다형 균주에 있어 가장 큰 서열 변이체를 형성한다.
유전자
셔플링
(
shuffling
)/방향진화(
directed
evolution
)
유전자 셔플링 또는 방향진화는 DNA 셔플링의 반복에 이은 변형된 생물학적 활성을 갖는 단백질을 암호화하는 핵산 서열이나 이의 부분의 변이체 생성을 위해 적절한 탐색 및/또는 선발로 구성된다 (Castle 등, (2004) Science 304(5674): 1151-4; 미국 특허 제5,811,238호 및 제6,395,547호).
조절 인자/조절 서열/프로모터
용어 "조절 인자", "조절 서열" 및 "프로모터"는 본 발명에서 상호 호환적으로 사용되며, 결합되는 서열의 발현에 영향을 미칠 수 있는 조절 핵산 서열을 말하는 것으로 사용된다. 용어 "프로모터"는 전형적으로 유전자의 전사개시점의 업스트림에 있으며, RNA 중합효소 및 다른 단백질의 인지 및 결합에 관여하여 작동가능하게 연결된 핵산 서열의 전사를 지시하는 핵산 조절 서열을 말한다. 상기 언급한 용어에는 전형적인 진핵세포 게놈 유전자 (CCAAT 박스 서열이 있거나 없이 정확한 전사 개시에 필요한 TATA 박스를 포함) 및 발달 및/또는 외부 자극에 반응하여 또는 조직 특이적 방식으로 유전자 발현을 변경하는 부가적인 조절 인자 (즉, 업스트림 활성화 서열, 인핸서 및 사일런서)로부터 유래한 전사 조절 서열이 포함된다. 또한 상기 용어에는 -35 박스 서열 및/또는 -10 박스 전사 조절 서열을 포함하는 전형적인 원핵생물 유전자의 전사 조절 서열이 포함된다. 용어 "조절인자"는 또한 세포, 조직 또는 기관에 핵산분자의 발현을 하게 하거나 활성화 또는 증가시키는 합성 융합 분자 또는 유도체를 포함한다.
"식물 프로모터"는 식물 세포에 암호화 서열 단편의 발현을 중재하는 조절 인자를 포함한다. 따라서, 식물 프로모터는 식물에서 유래해야 하는 것은 아니며, 예를 들면 식물 세포에 침범하는 바이러스 또는 미생물 기원일 수도 있다. "식물 프로모터"는 식물 세포, 예를 들면, 본 발명의 방법에서 발현되며, 본 발명에 기재된 핵산 서열로 형질전환된 식물 기원일 수 있다. 이는 또한 "식물" 종결신호 같은 "식물" 조절 신호에도 해당된다. 본 발명의 방법에 유용한 뉴클레오티드 서열의 프로모터 업스트림은 프로모터, 개방형해독틀 (ORF) 또는 종결신호 또는 ORF로부터 떨어져 있는 다른 3' 조절 영역 같은 3'-조절 영역의 기능성 또는 활성을 방해하지 않고 하나 이상의 뉴클레오티드 치환(들), 삽입(들) 및/또는 결실(들)에 의하여 변형될 수 있다. 더욱이 서열의 변형에 의하여 프로모터 활성은 증가될 수 있거나, 또는 보다 활성이 큰 프로모터, 심지어 이종 생물체의 프로모터로 완전히 대체되는 것도 가능하다. 식물체에서의 발현을 위해서는 상기 언급된 것처럼 핵산 서열은 올바른 순간에 요구되는 공간적 발현 양상으로 유전자를 발현하는 적절한 프로모터에 작동가능하게 연결되거나 프로모터를 포함해야 한다.
기능적으로 동등한 프로모터 동정을 위해, 후보 프로모터의 프로모터 강도 및/또는 발현 양상은 예를 들면, 리포터 유전자에 프로모터를 작동하게 연결하여 다양한 식물 조직에서 리포터 유전자의 발현 수준 및 양상을 검정함으로써 분석할 수 있다. 적절한 주지된 리포터 유전자는 예를 들면 베타-글루쿠로니다제 또는 베타-갈락토시다제를 포함한다. 프로모터 활성은 베타-글루쿠로니다제 또는 베타-갈락토시다제의 효소 활성을 측정함으로써 검정된다. 프로모터 강도 및/또는 발현 양상은 기준 프로모터의 것에 비교된다 (본 발명의 방법에 사용된 것과 같은 것). 다르게는, 프로모터 강도는 방사선 사진의 농도계 분석을 이용한 노던 블럿, 정량적 실시간 PCR 또는 RT-PCR 같은 당업계에 공지된 방법을 사용하여, mRNA 수준을 정량화하거나 본 발명의 방법에 사용된 핵산 서열의 mRNA 수준과 18S rRNA 같은 housekeeping 유전자의 mRNA 수준을 비교함으로써 분석될 수 있다 (Heid 등, 1996 Genome Methods 6: 986-994). 일반적으로 "약한 프로모터"는 암호화 서열의 발현을 낮은 수준으로 이끄는 것이다. "낮은 수준"은 세포당 약 1/10,000 전사체 내지 약 1/100,000 전사체, 약 1/500,0000 전사체까지의 수준을 말한다. 역으로, "강력한 프로모터" 는 암호화 서열의 발현을 높은 수준으로 또는 세포당 약 1/10 전사체 내지 약 1/100 전사체 내지 약 1/1000 전사체로 이끄는 것이다.
작동가능하게 연결된
본 발명에서 사용된 용어 "작동가능하게 연결된"은 프로모터 서열과 해당 유전자 간의 기능적 연관을 말하는 것으로, 그럼으로써 프로모터 서열이 해당 유전자의 전사를 개시할 수 있다.
구성적 프로모터
"구성적 프로모터"는 반드시 항상은 아니더라도 생장 및 발달의 대부분 기간 중에 그리고 대부분의 환경적 조건 하에서 적어도 하나의 세포, 조직 또는 기관에서 전사적으로 활성인 프로모터를 말한다. 하기 표 2a가 구성적 프로모터의 예이다.
표 2a: 구성적 프로모터의 예
유전자 출처 | 참고문헌 |
액틴 | McElroy 등, Plant Cell, 2: 163-171, 1990 |
HMGP | WO 2004/070039 |
CAMV 35S | Odell 등, Nature, 313: 810-812, 1985 |
CaMV 19S | Nilsson 등, Physiol. Plant. 100:456-462, 1997 |
GOS2 | de Pater 등, Plant J Nov;2(6):837-44, 1992, WO 2004/065596 |
유비퀴틴 | Christensen 등, Plant Mol. Biol. 18: 675-689, 1992 |
벼 사이클로필린 | Buchholz 등, Plant Mol Biol. 25(5): 837-43, 1994 |
옥수수 H3 히스톤 | Lepetit 등, Mol. Gen. Genet. 231:276-285, 1992 |
알팔파 H3 히스톤 | Wu 등 Plant Mol. Biol. 11:641-649, 1988 |
액틴 2 | An 등, Plant J. 10(1); 107-121, 1996 |
34S FMV | Sanger 등, Plant. Mol. Biol., 14, 1990: 433-443 |
Rubisco small subunit | US 4,962,028 |
OCS | Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553 |
SAD1 | Jain 등, Crop Science, 39 (6), 1999: 1696 |
SAD2 | Jain 등, Crop Science, 39 (6), 1999: 1696 |
nos | Shaw 등 (1984) Nucleic Acids Res. 12(20):7831-7846 |
V-ATPase | WO 01/14572 |
Super 프로모터 | WO 95/14098 |
G-box 단백질 | WO 94/12015 |
편재하는 프로모터
편재하는 프로모터는 생물체의 사실상 모든 조직이나 세포에서 활성을 갖는 것이다.
발달적으로
조절된 프로모터
발달적으로 조절된 프로모터는 특정 발달 단계 중에 또는 발달적 변화가 일어나는 식물체의 부위에서 활성을 갖는 것이다.
유도성 프로모터
유도성 프로모터는 화학적 (Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), 환경적 또는 물리적 자극에 반응하여 전사 개시가 유도되거나 증가되거나 또는 식물이 다양한 스트레스 환경에 노출될 때 "스트레스 유도성", 즉 활성화될 수 있거나 또는, 식물이 다양한 병원균에 노출될 때 "병원균 유도성", 즉 활성화될 수 있다.
기관 특이적/조직 특이적 프로모터
기관 특이적 또는 조직 특이적 프로모터는 잎, 뿌리, 종자조직 등과 같이 특정 기관 또는 조직에서 우선적으로 발현 개시가 가능한 것이다. 예를 들면, "뿌리 특이적 프로모터"는 식물의 다른 부위에 약간 누설된(leaky) 발현을 허용하지만, 사실상 식물의 다른 부위를 제외하고 식물 뿌리에서 우세하게 전사적으로 활성이 있는 프로모터이다. 특정 세포에서만 전사를 개시할 수 있는 프로모터는 본 발명에서 "세포 특이적"이라 한다.
뿌리 특이적 프로모터의 예는 하기 표 2b에 열거된다:
표 2b: 뿌리 특이적 프로모터의 예
유전자 출처 | 참고문헌 |
Rice RCc3 | Xu et al (1995) Plant Mol Biol 27(2): 237-48 |
Arabidopsis phosphate transporter PHT1 | Kovama et al ., 2005 |
Medicago phosphate transporter | Xiao et al ., 2006 |
Arabidopsis Pyk10 | Nitz et al . (2001) Plant Sci 161(2): 337-346 |
Tobacco root-specific genes RB7, RD2, RD5, RH12 | Conkling et al . (1990) Plant Phys 93(3): 1203-1211 |
Barley root-specific lectin | Lerner & Raikhel (1989) Plant Phys 91: 124-129 |
Root-specific hydroxy-proline rich protein | Keller & Lamb (1989) Genes & Dev 3:1639-1646 |
Arabidopsis CDC27B/hobbit | Blilou et al. (2002) Genes & Dev 16:2566-2575 |
종자 특이적 프로모터는 종자 조직에서만 반드시 배타적으로는 아니지만 (누설 발현의 경우) 종자조직에서 우세하게 전사적으로 활성인 것이다. 종자 특이적 프로모터는 종자발달 및/또는 발아 중에 활성일 것이다. 종자 특이적 프로모터는 배유, 호분층, 또는 배 중 하나 이상에 특이적일 수 있다. 종자 특이적 프로모터의 예는 하기 표 2c, 2d, 2e, 2f에 제시된다. 종자 특이적 프로모터의 추가적인 예는 Qing Qu 및 Takaiwa (Plant Biotechnol. J. 2, 1 13-125, 2004)에 제시되며, 이의 개시는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다.
표 2c: 종자 특이적 프로모터의 예
유전자 출처 | 참고문헌 |
seed-specific genes | Simon et al., Plant Mol. Biol. 5: 191, 1985; |
Scofield et al., J. Biol. Chem. 262: 12202, 1987.; | |
Baszczynski et al., Plant Mol. Biol. 14: 633, 1990. | |
Brazil Nut albumin | Pearson et al., Plant Mol. Biol. 18: 235-245, 1992. |
Legumin | Ellis et al., Plant Mol. Biol. 10: 203-214, 1988. |
glutelin (rice) | Takaiwa et al., Mol. Gen. Genet. 208: 15-22, 1986; |
Takaiwa et al., FEBS Letts. 221: 43-47, 1987. | |
Zein | Matzke et al Plant Mol Biol, 14(3):323-32 1990 |
NapA | Stalberg et al, Planta 199: 515-519, 1996. |
wheat LMW and HMW glutenin-1 | Mol Gen Genet 216:81-90, 1989; NAR 17:461-2, 1989 |
wheat SPA | Albani et al, Plant Cell, 9: 171-184, 1997 |
wheat α,β,γ-gliadins | EMBO J. 3:1409-15, 1984 |
barley Itr1 promoter | Diaz et al. (1995) Mol Gen Genet 248(5):592-8 |
barley B1, C, D, hordein | Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-60, 1996 |
barley DOF | Mena et al, The Plant Journal, 116(1): 53-62, 1998 |
blz2 | EP99106056.7 |
Synthetic promoter | Vicente-Carbajosa et al., Plant J. 13: 629-640, 1998. |
rice prolamin NRP33 | Wu et al, Plant Cell Physiology 39(8) 885-889, 1998 |
rice a-globulin Glb-1 | Wu et al, Plant Cell Physiology 39(8) 885-889, 1998 |
rice OSH1 | Sato et al, Proc. Natl. Acad. Sci. USA, 93: 8117-8122, 1996 |
rice a-globulin REB/OHP-1 | Nakase et al. Plant Mol. Biol. 33: 513-522, 1997 |
rice ADP-glucose pyrophos-phorylase | Trans Res 6:157-68, 1997 |
maize ESR gene family | Plant J 12:235-46, 1997 |
Sorghum α-kafirin | DeRose et al., Plant Mol. Biol 32:1029-35, 1996 |
KNOX | Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 |
rice oleosin | Wu et al, J. Biochem. 123:386, 1998 |
sunflower oleosin | Cummins et al., Plant Mol. Biol. 19: 873-876, 1992 |
PRO0117, putative rice 40S ribosomal protein | WO 2004/070039 |
PRO0136, rice alanine aminotransferase | 미공개 |
PRO0147, trypsin inhibitor ITR1 (barley) | 미공개 |
PRO0151, rice WSI18 | WO 2004/070039 |
PRO0175, rice RAB21 | WO 2004/070039 |
PRO005 | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
α-amylase (Amy32b) | Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991 |
cathepsin β-like gene | Cejudo et al, Plant Mol Biol 20:849-856, 1992 |
Barley Ltp2 | Kalla et al., Plant J. 6:849-60, 1994 |
Chi26 | Leah et al., Plant J. 4:579-89, 1994 |
Maize B-Peru | Selinger et al., Genetics 149;1125-38,1998 |
표 2d: 배유 특이적 프로모터의 예
유전자 출처 | 참고문헌 |
glutelin (rice) | Takaiwa et al. (1986) Mol Gen Genet 208:15-22; Takaiwa et al. (1987) FEBS Letts. 221:43-47 |
Zein | Matzke et al., (1990) Plant Mol Biol 14(3): 323-32 |
wheat LMW and HMW glutenin-1 | Colot et al. (1989) Mol Gen Genet 216:81-90; Anderson et al. (1989) NAR 17:461-2 |
wheat SPA | Albani et al. (1997) Plant Cell 9:171-184 |
wheat gliadins | Rafalski et al. (1984) EMBO 3:1409-15 |
barley Itr1 promoter | Diaz et al. (1995) Mol Gen Genet 248(5):592-8 |
barley B1, C, D, hordein | Cho et al. (1999) Theor Appl Genet 98:1253-62; Muller et al. (1993) Plant J 4:343-55; Sorenson et al. (1996) Mol Gen Genet 250:750-60 |
barley DOF | Mena et al, (1998) Plant J 116(1): 53-62 |
blz2 | Onate et al. (1999) J Biol Chem 274(14):9175-82 |
synthetic promoter | Vicente-Carbajosa et al. (1998) Plant J 13:629-640 |
rice prolamin NRP33 | Wu et al, (1998) Plant Cell Physiol 39(8) 885-889 |
rice globulin Glb-1 | Wu et al. (1998) Plant Cell Physiol 39(8) 885-889 |
rice globulin REB/OHP-1 | Nakase et al. (1997) Plant Molec Biol 33: 513-522 |
rice ADP-glucose pyrophosphorylase | Russell et al. (1997) Trans Res 6:157-68 |
maize ESR gene family | Opsahl-Ferstad et al. (1997) Plant J 12:235-46 |
Sorghum kafirin | DeRose et al. (1996) Plant Mol Biol 32:1029-35 |
표 2e: 배(embryo) 특이적 프로모터의 예
유전자 출처 | 참고문헌 |
KNOX | Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 |
PRO0151 | WO 2004/070039 |
PRO0175 | WO 2004/070039 |
PRO005 | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
표 2f: 호분층 특이적 프로모터의 예
유전자 출처 | 참고문헌 |
α-amylase (Amy32b) | Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991 |
cathepsin β-like gene | Cejudo et al, Plant Mol Biol 20:849-856, 1992 |
Barley Ltp2 | Kalla et al., Plant J. 6:849-60, 1994 |
Chi26 | Leah et al., Plant J. 4:579-89, 1994 |
Maize B-Peru | Selinger et al., Genetics 149;1125-38,1998 |
본 발명에서 정의된 녹색 조직 특이적 프로모터는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 식물의 다른 부위를 제외하고 실질적으로 녹색 조직에서 우세하게 전사적으로 활성이 있는 프로모터이다.
본 발명의 방법을 수행하는데 사용될 수 있는 녹색 조직 특이적 프로모터의 예는 하기의 표 2g에 있다.
표 2g: 녹색 조직 특이적 프로모터의 예
유전자 출처 | 발현 | 참고문헌 |
Maize Orthophosphate dikinase | 잎 특이적 | Fukavama et al., 2001 |
Maize Phosphoenolpyruvate carboxylase | 잎 특이적 | Kausch et al., 2001 |
Rice Phosphoenolpyruvate carboxylase | 잎 특이적 | Liu et al., 2003 |
Rice small subunit Rubisco | 잎 특이적 | Nomura et al., 2000 |
rice beta expansin EXBP9 | 어린줄기 특이적 | WO 2004/070039 |
Pigeonpea small subunit Rubisco | 잎 특이적 | Panguluri et al., 2005 |
Pea RBCS3A | 잎 특이적 |
조직 특이적 프로모터의 다른 예는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 식물의 다른 부위를 제외하고 실질적으로 분열조직에서 우세하게 전사적으로 활성이 있는 분열조직 특이적 프로모터이다. 본 발명의 방법을 수행하는데 사용될 수 있는 녹색 분열조직 특이적 프로모터의 예는 하기의 표 2h에 있다.
표 2h: 분열조직 특이적 프로모터의 예
유전자 출처 | 발현 양상 | 참고문헌 |
rice OSH1 | 어린줄기 정단분열조직, 배의 구형 단계(embryo globular stage)에서 실생단계(seedling stage)까지 | Sato et al . (1996) Proc. Natl. Acad. Sci. USA, 93: 8117-8122 |
Rice metallothionein | 분열조직 특이적 | BAD87835.1 |
WAK1 & WAK 2 | 어린줄기 및 뿌리 정단분열조직, 및 팽창하는 잎 및 악편에서 | Wagner & Kohorn (2001) Plant Cell 13(2): 303-318 |
종결신호(terminator)
용어 "종결신호"는 일차 전사체의 3' 프로세싱 및 폴리아데닐화와 전사 종결의 신호가 되는 전사 단위의 말단에 있는 DNA 서열인 조절 서열이다. 종결신호는 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 첨가된 종결신호는 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
조절(
modulation
)
용어 "조절"은 발현 또는 유전자 발현에 관한 것으로, 대조구 식물에 비하여 발현 수준이 상기 유전자 발현에 의하여 변화되는, 바람직하게는 발현 수준이 증가되는 과정이다. 원래의 조절되지 않은 발현은 구조 RNA (rRNA, tRNA) 또는 연이어 해독되는 mRNA 같이 임의의 종류의 발현일 수 있다. 용어 "활성 조절"은 식물의 증가된 수확량 관련 형질(예를 들면, 증가된 수확량 및/또는 증가된 생장)로 이끄는, 본 발명의 핵산 서열 또는 암호화된 단백질의 발현의 임의의 변화를 의미한다.
증가된
발현/과발현
본 발명에 사용된 용어 "증가된 발현" 또는 "과발현"은 원래의 야생형 발현 수준에 부가적인 임의의 형태의 발현을 의미한다.
유전자 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화 되어 있으며, 예를 들면, 적절한 프로모터에 의한 과발현, 전사 인핸서 또는 해독 인핸서의 사용을 포함한다. 프로모터 또는 인핸서 인자로 작용하는 분리된 핵산 서열은 비이질성 형태의 폴리뉴클레오티드의 적절한 위치 (전형적으로 업스트림)에 도입되어 해당 폴리펩티드를 암호화하는 핵산 서열의 발현을 상향 조절한다. 예를 들면, 내재적 프로모터는 돌연변이, 결실, 및/또는 치환에 의해 생체 내에서 변할 수 있거나 (Kmiec, US 5,565,350; Zarling 등, WO9322443), 또는 분리된 프로모터는 본 발명의 유전자로부터 적절한 거리와 방향으로 식물 세포 내에 도입될 수 있어 해당 유전자의 발현을 조절한다.
폴리펩티드 발현을 원한다면, 일반적으로 폴리뉴클레오티드 암호화 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 폴리아데닐화 영역은 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래할 수 있다. 부가된 3' 말단 서열은 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
세포질 내에 축적되는 성숙된 메세지 양의 증가를 위하여 인트론 서열이 또한 부분적인 암호화 서열의 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 식물 및 동물 발현 구축물에 있어 전사 단위 내에 스플라이스 가능한 인트론이 포함되면 mRNA 및 단백질 수준에서 유전자 발현이 1000 배까지 증가함이 보였다 (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis 등 (1987) Genes Dev 1:1183-1200). 인트론에 의한 유전자 발현의 상승효과는 전형적으로 전사 단위의 5' 말단 가까이에 위치하였을 때 가장 컸다. 옥수수 인트론 Adh1-S 인트론 1, 2, 및 6, Bronze-1 인트론의 사용은 당업계에 주지되어 있다. 전반적인 정보는 하기를 참고한다: Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
내재적 유전자
본 발명에서 "내재적" 유전자는 자연적 형태 (즉, 임의의 인간의 개입이 없는)로 식물에서 발견되는 것으로서 문제의 유전자뿐 아니라, 분리된 형태로 연이어 식물체에 (재)도입된 (트랜스진) 동일한 유전자 (사실상 상동인 핵산/유전자)를 말한다. 예를 들면, 상기 트랜스진을 갖는 형질전환 식물체에서는 트랜스진 발현의 실질적인 감소 및/또는 내재적 유전자 발현의 실질적인 감소가 있을 수 있다. 분리된 유전자는 생물체로부터 분리되거나, 또는 예를 들면 화학적 합성에 의하여 인위적으로 만들 수도 있다.
감소된
발현
본 발명에서 "감소된 발현" 또는 발현의 "감소 또는 실질적인 제거"는 대조구에 비하여 내재적 유전자 발현 및/또는 폴리펩티드 수준 및/또는 폴리펩티드 활성의 감소를 의미한다. 감소 또는 실질적인 제거는 대조구 식물에 비하여 증가하는 순으로 선호되는 적어도 10%, 20%, 30%, 40% 또는 50%, 60%, 70%, 80%, 85%, 90%, 또는 95%, 96%, 97%, 98%, 99% 이상 감소된 것이다.
식물체에 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위해서는 충분한 길이의 핵산 서열의 상당히 연속적인 뉴클레오티드가 필요하다. 유전자 침묵을 수행하기 위한 뉴클레오티드는 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 개 또는 더 소수의 뉴클레오티드만큼 적을 수도 있고, 전체 유전자 (5' 및/또는 3' UTR을 포함하여, 일부분 또는 전체)만큼 많을 수도 있다. 상당한 길이의 연속적인 뉴클레오티드는 관심 있는 단백질을 암호화하는 핵산 서열 (표적 유전자)로부터, 또는 관심 있는 단백질의 오쏘로그(orthologue), 패럴로그(paralogue) 또는 상동체(homologue)를 암호화하는 것이 가능한 임의의 핵산 서열로부터 유래할 수 있다. 바람직하게는, 상당한 길이의 연속적인 뉴클레오티드는 표적 유전자 (센스 또는 안티센스 가닥)와 수소결합을 형성할 수 있으며, 더욱 바람직하게는, 상당한 길이의 연속적인 뉴클레오티드는 표적 유전자 (센스 또는 안티센스 가닥)에 증가하는 순으로 선호되는, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% 동일한 서열을 갖는다. (기능성) 폴리펩티드를 암호화하는 핵산 서열은 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위해 본 발명에서 논의된 다양한 방법에 대한 필요조건은 아니다.
상기 발현의 감소 또는 실질적인 제거는 일상적인 수단 및 기술을 사용하여 이룰 수 있다. 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위한 방법은 핵산 서열 또는 그 일부를 (이 경우, 관심 있는 유전자 유래의, 또는 관심 있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 것이 가능한 임의의 핵산 서열 유래의 상당한 길이의 연속적인 뉴클레오티드), 바람직하게는 헤어핀 구조를 형성하는 것이 가능한 역반복(inverted repeat) 서열을 사용한 RNA 매개된 침묵에 의한다. RNA 침묵 방법의 또 다른 예는 핵산 서열 또는 그 일부 (이 경우, 관심 있는 유전자 유래의, 또는 관심 있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 것이 가능한 임의의 핵산 서열 유래의 상당한 길이의 연속적인 뉴클레오티드)를 센스 방향으로 식물체로의 도입을 포함한다.
RNA 침묵 방법의 또 다른 예는 안티센스 핵산 서열의 사용을 포함한다. 유전자 침묵은 또한 삽입 돌연변이유발 (예를 들면, T-DNA 삽입 또는 트랜스포손 삽입)에 의해, 또는 Angell 및 Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS WO 98/36083), 또는 Baulcombe (WO 99/15682)에 이의해 기재된 것과 같은 전략에 의해서도 수행 가능하다. 식물체에서 그 기능을 저해하기 위한 내재적 폴리펩티드에 대한 항체 사용, 또는 해당 폴리펩티드가 관련된 신호전달 경로의 방해와 같은 다른 방법도 당업자에게는 잘 알려져 있다. 인위적인 및/또는 자연적인 microRNAs (miRNAs)가 유전자 발현 및/또는 mRNA 해독의 녹아웃(knock out)에 사용될 수 있다. 내재적 miRNAs는 전형적으로 19-24 뉴클레오티드 길이의 단일가닥의 작은 RNAs이다. 전형적으로 21 뉴클레오티드 길이인 인위적인 microRNAs (amiRNAs)는, 특히 관심 있는 하나 또는 다수 유전자의 유전자 발현을 음성적으로 조절하기 위해 유전적으로 변형될 수 있다. 식물 microRNA의 표적을 선발하는 결정요소는 당업계에 잘 알려져 있다. 표적을 인지하기 위한 경험적 매개변수는 정의되어 있으며, 특정 amiRNAs을 디자인하는데 도움이 되게 사용될 수 있다 (Schwab 등, (2005) Dev Cell 8(4):517-27). amiRNAs 및 이의 전구체의 디자인 및 생성을 위한 편리한 수단 또한 공지되어 있다 (Schwab 등, (2006) Plant Cell 18(5):1 121-33).
최적의 수행을 위해, 내재적 유전자의 식물에서의 발현을 감소시키는 유전자 침묵 기술에서 단자엽 식물의 형질전환을 위해서는 단자엽 식물의 핵산 서열을, 쌍자엽 식물의 형질전환을 위해서는 쌍자엽 식물의 핵산 서열을 사용할 것이 요구된다. 바람직하게는, 임의의 해당 식물 종의 핵산 서열이 동일 생물종에 도입된다. 예를 들면, 벼 유래의 핵산 서열은 벼 식물로 형질전환된다. 그러나, 도입될 핵산 서열이 동일 식물 종으로부터 유래해야 한다는 것은 절대적인 필요조건은 아니다. 내재적 표적 유전자 및 도입될 핵산 서열 간에 실질적인 상동성이 있으면 충분하다.
상기 기재된 것은 내재적 유전자의 식물에서의 발현의 감소 또는 실질적인 제거를 위한 다양한 방법의 예이다. 당업자는 전체 식물 또는 그 일부에서 내재적 유전자의 발현을 감소시키기 위한 침묵을 위해, 예를 들면, 적절한 프로모터를 사용하여 상기 언급된 방법을 용이하게 변형할 수 있다.
선발
마커
(유전자)/리포터 유전자
"선발 마커", "선발 마커 유전자" 또는 "리포터 유전자"는 본 발명의 핵산 구축물로 감염되거나 형질전환된 세포의 동정 및/또는 선발을 촉진하기 위하여 발현된 세포에 표현형을 부여하는 임의의 유전자를 포함한다. 이들 마커 유전자는 일련의 상이한 원리를 통해 핵산분자의 성공적인 전달을확인 가능하게 한다. 적절한 마커는 항생제나 제초제 저항성을 주거나 새로운 대사 형질을 도입하거나 또는 시각적인 선발을 가능하게 하는 마커로부터 선택된다. 선발 마커 유전자의 예는 항생제 (네오마이신 및 카나마이신을 인산화하는 nptII, hpt, 인산화 하이그로마이신, 또는 예를 들면, 블레오마이신, 스트렙토마이신, 테트라사이클린, 클로람페니콜, 앰피실린, 겐타마이신, 제네티신 (G418), 스펙티노마이신, 블라스티시딘에 저항성을 주는 유전자), 제초제 (예를 들면, 바스타 (Basta)에 저항성을 제공하는 bar; 글리포제이트에 대한 저항성을 제공하는 aroA 또는 gox, 또는 예를 들면, 이미다졸리논, 포스피노트리신, 설포닐우레아에 저항성을 주는 유전자)에 저항성을 주는 유전자 또는 대사적 형질을 제공하는 유전자 (식물이 유일한 탄소원으로 만노즈를 이용하게 하는 manA 또는 자일로스 이용을 위한 자일로스 이성화효소, 또는 2-데옥시글루코스에 대한 저항성 같은 반영양적 마커)를 포함한다. 가시적 마커 유전자의 발현으로 발색 (예를 들면 베타-글루쿠로니다제, GUS, 또는 발색된 기질, 예를 들면 X-Gal을 갖는 베타-갈락토시다제), 발광 (루시페린/루시파라제 시스템 같은) 또는 형광 (녹색 형광 단백질, GFP, 및 이의 유도체)이 형성된다. 이 목록은 소수의 가능한 마커만을 나타낸다. 당업자는 상기 마커에 친숙하다. 생물체 및 선발 방법에 따라 다른 마커가 선호된다.
식물 세포로 핵산의 안정적인 또는 일시적인 통합에 따라 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 암호화하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 암호화하는 핵산분자는 본 발명의 또는 본 발명의 방법에 유용한 사용된 폴리펩티드를 암호화하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산으로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다).
마커 유전자, 특히 항생제 및 제초제에 저항성이 있는 유전자는 일단 핵산이 성공적으로 도입되면 형질전환 숙주 세포에서 더 이상 필요하지 않거나, 바람직하지 않으므로, 핵산 도입을 위한 본 발명의 방법에 유용한서는 이들 마커 유전자가 제거 또는 절단되게 하는 기술을 사용한다. 하나의 상기 방법이 동시형질전환 (co-transformation)으로 알려진 것이다. 동시형질전환 방법은 형질전환을 위해 두 벡터를 동시에 사용하여, 하나의 벡터에는 본 발명에 따른 핵산이 있고, 둘째 벡터에는 마커 유전자(들)이 있다. 대부분의 형질전환체는 양 벡터를 받거나, 식물의 경우 (형질전환체의 40% 이상까지) 포함한다. 아그로박테리아로 형질전환한 경우, 형질전환체는 보통 벡터의 일부, 즉 보통 발현 카세트인 T-DNA에 의해 플랭킹된 서열만을 받는다. 마커 유전자는 연이어 교배를 하여 형질전환 식물체로부터 제거된다. 다른 방법에서는, 마커 유전자가 트랜스포손에 통합되어 원하는 핵산과 함께 형질전환에 사용된다 (Ac/Ds 기술로 알려짐). 형질전환체는 트랜스포자제(transposase) 공급원과 교배될 수 있거나 또는 트랜스포자제가 발현되게 하는 핵산 구축물로 일시적으로 또는 안정적으로 형질전환된다. 어떤 경우에 (약 10%), 일단 형질전환이 성공적으로 되면 트랜스포존은 숙주 세포의 게놈 밖으로 튀어나가 소실된다. 더 많은 경우에, 트랜스포존은 다른 구역으로 튄다. 이들 경우에 마커 유전자는 교배에 의하여 제거되어야 한다. 미생물학에서 상기 일이 있어났는지 검출을 가능하게 하거나 용이하게 하는 기술이 개발되었다. 더욱 편리한 방법은 재조합 시스템이라 알려진 것에 의존하는 것으로 이점은 교배에 의한 제거가 면제될 수 있다는 것이다. 이 유형의 가장 잘 알려진 시스템은 Cre/lox 시스템이다. Cre1은 loxP 서열 사이에 위치한 서열을 제거하는 리콤비나아제이다. 만일 마커 유전자가 loxP 서열 사이에 통합되면 리콤비나아제의 발현에 의해서 마커 유전자는 제거된다. 다른 재조합 시스템은 HIN/HIX, FLP/FRT 및 REP/STB 시스템 (Tribble 등, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan 등, J. Cell Biol., 149, 2000: 553-566)이다. 본 발명에 따른 핵산 서열의 식물 게놈 내로 위치 특이적 통합이 가능하다. 자연적으로, 이들 방법은 또한 효모, 균류 또는 세균 같은 미생물에 응용될 수 있다.
트랜스제닉
/트랜스진/재조합
본 발명에서 "트랜스제닉", "트랜스진" 또는 "재조합"은 예를 들면, 핵산 서열, 발현카세트, 핵산 서열을 포함하는 유전자 구축물 또는 벡터, 또는 본 발명에 따른 핵산 서열, 발현 카세트나 벡터로 형질전환된 생물체, 하기에 기재된 재조합 방법에 의해 생성된 모든 구조물에 관한 의미이다:
(a) 본 발명의 방법에 유용한 단백질을 암호화하는 핵산서열, 또는
(b) 본 발명에 따른 핵산 서열에 작동가능하게 연결된 유전자 조절 서열(들), 예를 들면 프로모터, 또는
(c) a) 및 b)
가 자연적인 유전적 환경에 있지 않거나, 재조합 방법으로 변형되어 왔으므로 예를 들면, 하나 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역위 또는 삽입의 유형의 변형이 가능하다. 자연적인 유전적 환경은 원래의 식물에서 자연적인 게놈 또는 염색체 상의 위치나 게놈 라이브러리에서의 존재를의미하는 것으로 이해된다. 게놈 라이브러리의 경우, 핵산 서열의 자연적인 유전적 환경은 바람직하게는 적어도 부분적으로는 보유된다. 환경은 적어도 한 쪽의 핵산서열을 플랭킹하며 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1000 bp, 가장 바람직하게는 적어도 5000 bp 길이의 서열을 갖는다. 자연적으로 발생하는 발현 카세트, 예를 들면 본 발명의 방법에 유용한 폴리펩티드를 암호화하는 해당 핵산 서열과 핵산 서열의 자연적 프로모터의 자연적으로 생긴 조합은 이 발현 카세트가 예를 들면 돌연변이 처리 같은 비자연적인 합성 ("인위적") 방법으로 변형될 때 형질 전환 발현카세트가 된다. 적절한 방법이 예를 들면 US 5,565,350 또는 WO 00/15815에 기재되어 있다.
본 발명의 목적상, 트랜스제닉 식물은 상기처럼 본 발명의 방법에 유용한서 사용된 핵산은 상기 식물의 게놈상의 자연적 위치에 있지 않아 핵산이 동종에서 또는 이종에서 발현될 수 있다는 의미로 이해된다. 그러나, 언급된 바와 같이, 트랜스제닉은 또한 본 발명에 있어 또는 본 발명 방법에 사용된 핵산은 식물 게놈 내의 자연적 위치에 있는 반면, 그 서열이 자연적 서열에 대하여 변형되었고 및/또는 자연적 서열의 조절 서열이 변형되었음을 의미한다. 트랜스제닉은 핵산의 동종 또는 바람직하게는 이종 발현이 일어나는 게놈 내의 비자연적 위치에서 본 발명에 따른 핵산의 발현을 의미하는 것으로 바람직하게는 이해된다. 바람직한 트랜스제닉 식물이 본 발명에서 언급된다.
형질전환
본 발명에 언급된 용어 "도입" 또는 "형질전환"은 전달에 사용된 방법에 관계 없이 외래 폴리뉴클레오티드의 숙주 세포로의 전달을 포함한다. 기관 발생이나 배발생에 의하여 연이은 클론 번식이 가능한 식물 조직은 본 발명의 유전자 구축물로 형질전환될 수 있으며, 전체 식물체가 이로부터 재생된다. 선택된 특정 조직은 형질전환될 특정 종에 이용 가능하며 가장 잘 맞는 클론 번식 시스템에 따라 다양할 것이다. 전형적인 조직 표적은 잎 디스크, 화분, 배, 자엽, 하배축, 대배우체, 캘러스 조직, 분열조직 (예를 들면, 정단 분열조직, 액아, 및 뿌리 분열조직), 및 유도된 분열조직 (예를 들면, 자엽 분열조직 및 하배축 분열조직)을 포함한다. 폴리뉴클레오티드는 일시적으로 또는 안정적으로 숙주 세포에 도입되며 예를 들면, 플라스미드처럼 비통합적으로 유지된다. 다르게는, 숙주 게놈으로 통합된다. 결과적인 형질전환 식물 세포는 당업자에게 주지된 방식으로 형질전환 식물을 재생하는데 사용된다.
외래 유전자의 식물 게놈으로 전달을 형질전환이라 부른다. 식물 종의 형질전환은 일상적인 기술이다. 유리하게도, 임의의 몇가지 형질전환 방법이 목적 유전자를 적절한 조상 세포로의 도입에 사용될 수 있다. 식물 조직 또는 식물 세포로부터 식물의 형질전환 및 재생에 관하여 기재된 방법은 일시적인 또는 안정한 형질전환에 이용될 수 있다. 형질전환 방법은 리포좀, 전기천공법, 유리 DNA 흡수를 증가시키는 화학물질, 식물체 내로 DNA의 직접적인 주입, 입자총 충격법, 바이러스 또는 화분을 이용한 형질전환 및 미세주입(microprojection)을 포함한다. 방법은 원형질에 대한 칼슘/폴리에틸렌 글리콜법 (Krens, F.A. 등, (1982) Nature 296, 72-74; Negrutiu I 등 (1987) Plant Mol Biol 8: 363-373); 원형질의 전기천공법 (Shillito R.D. 등 (1985) Bio/Technol 3, 1099-1102); 식물로 미세주사(microinjection) (Crossway 등, (1986) Mol. Gen Genet 202: 179-185); DNA 또는 RNA 코팅된 입자 충격법 (Klein TM 등, (1987) Nature 327: 70) (비통합적) 바이러스로 감염 등으로부터 선택할 수도 있다. 형질전환 작물을 포함한 형질전환 식물은 바람직하게는 아그로박테리움-매개된형질전환을 통해 제조된다. 편리한 형질전환방법은 식물체에서의 형질전환이다. 이를 위해, 예를 들면, 아그로박테리아를 식물 종자 상에 작용하게 하거나 식물 분열조직을 아그로박테리아로 접종하는 것이 가능하다. 형질전환된 아그로박테리아의 현탁액을 손상되지 않은 식물이나 적어도 꽃 원기에 작용하게 하는 것이 본 발명에 따라 특히 편리하다는 것이 입증되었다. 처리된 식물의 종자를 얻을 때까지 식물체를 키운다 (Clough and Bent, Plant J. (1998) 16, 735-743). 벼의 아그로박테리움 매개된형질전환 방법은 하기 임의의 것에 기재된 것처럼 벼 형질전환에 관한 잘 알려진 방법들을 포함한다: 유럽특허출원 EP 1198985 A1, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan 등 (Plant Mol Biol 22 (3): 491-506, 1993), Hiei 등 (Plant J 6 (2): 271-282, 1994), 상기 명세서는 충분히 설명한 것처럼 본 발명에 참조문헌으로 통합된다. 옥수수 형질전환의 경우에, 바람직한 방법은 Ishida 등 (Nat. Biotechnol 14(6): 745-50, 1996) 또는 Frame 등 (Plant Physiol 129(1): 13-22, 2002)에 기재된 것이며, 상기 명세서는 충분히 설명한 것처럼 본 발명에 참조문헌으로 통합된다. 상기 방법들은 [B. Jenes 등, Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143] 및 [Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225]에 예로서 기재되어 있다. 핵산 또는 발현될 구축물은 바람직하게는 아그로박테리움 투머파시엔스 형질전환에 적절한 벡터, 예를 들면 pBin19 내로 클론된다 (Bevan 등, Nucl. Acids Res. 12 (1984) 8711). 상기 벡터로 형질전환된 아그로박테리아가 아라비돕시스처럼 모델로 사용된 식물 (본 발명의 범위 내의 아라비돕시스 탈리아나는 작물로 고려되지 않는다)이나 예로서 담배 같은 작물의 예를 들면, 상처 내거나 잘게 썬 잎을 아그로박테리아 용액에 적신 후 적절한 배지에 배양하는 것과 같은 식물 형질전환을 위해 알려진 방식으로 사용될 수 있다. 아그로박테리움 투머파시엔스에 의한 식물의 형질전환은 예를 들면, [Hofgen and Willmitzer in Nucl. Acid Res. (1988) 16, 9877]에 의하여 기재되었거나, 특히 [F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38]에 알려져 있다.
온전한 식물로 재생되는 체세포의 형질전환외에, 식물의 분열조직 특히 배우자로 발달하는 세포의 형질전환이 가능하다. 이 경우에, 형질전환된 배우자는 자연적인 식물 발달 과정을 거쳐 형질전환 식물이 된다. 따라서 예를 들면, 아라비돕시스의 종자가 아그로박테리아로 처리되고, 발달하는 식물체로부터 취한 종자 중의 일부분이 형질전환되어 형질전환 식물체로 된다 [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. 또 다른 방법은 화서의 반복적인 제거에 근거하며 근생엽 중앙의 절단 부위를 형질전환된 아그로박테리아와 함께 배양하면 형질전환된 종자를 이후에 얻을 수 있다 (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). 그러나, 특히 효과적인 방법은 화서 담그기 ("floral dip") 방법의 변형인 진공 침윤 (vacuum infiltration)이다. 아라비돕시스의 진공 침윤의 경우, 감압 하에 온전한 식물체를 아그로박테리아 현탁액으로 처리하는 것이고 [Bechthold, N (1993). C R Acad Sci Paris Life Sci, 316: 1194-1199], "화서 담그기법"에서는 발달 중인 화서 조직을 계면활성제가 처리된 아그로박테리아 현탁액과 잠깐 배양하는 것이다 [Clough, SJ and Bent AF (1998) Plant J. 16, 735-743]. 양 경우에 특정 비율의 형질전환 종자가 수확되며, 이들 종자는 상기 기재된 선발 조건 하에서 재배함으로써 형질전환되지 않은 종자와 구분된다. 색소체는 모계로 유전되기 때문에 색소체의 안정적인 형질전환의 잇점은 대부분의 작물에서 화분을 통한 트랜스진의 유전이 감소되거나 제거된다는 점이다. 엽록체 게놈의 형질전환은 일반적으로 Klaus 등, 2004 [Nature Biotechnology 22 (2), 225-229]에 체계적으로 표시된 과정에 의하여 수행된다. 간단히, 형질전환될 서열을 선발 마커 유전자와 함께 엽록체 게놈에 상동인 플랭킹 서열 사이에 클론한다. 이들 상동 플랭킹 서열이 플라스톰(plastome) 내로 특이적으로 통합된다. 색소체 형질전환은 많은 다른 식물 종에 대해 기술되어 왔으며, 개관은 [Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 or Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28]에 있다. 추가의 생물공학적 진보는 마커 없는 색소체 형질전환체의 형태로 최근 보고되었으며, 이는 일시적인 동시통합된(co-integrated) 마커 유전자에 의해 생성될 수 있다 (Klaus 등, 2004, Nature Biotechnology 22(2), 225-229).
T-
DNA
활성화 태깅
T-DNA 활성화 태깅 (Hayashi 등 Science (1992) 1350-1353)은 보통 프로모터 (또한 해독 인핸서 또는 인트론)를 함유하는 T-DNA를 프로모터가 표적 유전자의 발현을 지시하게 배치되어 관심 유전자의 게놈 영역 내로 또는 유전자 암호화 영역의 10 kb 업스트림 또는 다운스트림으로 삽입하는 것을 포함한다. 전형적으로, 자체의 자연 프로모터에 의한 표적 유전자 발현의 조절은 붕괴되고 유전자는 새로 도입된 프로모터의 조절하에 있게 된다. 프로모터는 전형적으로 T-DNA 내에 끼워져 있다. 이 T-DNA는 식물 게놈 내에 예를 들면, 아그로박테리움 감염을 통하여 무작위로 삽입되며 삽입된 T-DNA 인근의 유전자의 발현이 변형되게 된다. 결과적인 형질전환 식물은 도입된 프로모터에 가까운 유전자의 변형된 발현으로 인하여 우성 표현형을 보인다.
틸링(
TILLING
)
용어 "틸링(TILLING)"은 "Targeted Induced Local Lesions In Genomes"의 약어이며 변형된 발현 및/또는 활성을 갖는 단백질을 암호화하는 핵산 서열을 생성 및/또는 동정하는데 유용한 돌연변이 기술을 말한다. 틸링(TILLING)은 또한 상기 돌연변이체를 갖는 식물의 선발을 가능하게 한다. 이들 돌연변이체는 강도나 위치 또는 시기상의 변형된 발현을 보인다 (만일 돌연변이가 프로모터에 영향을 준다면). 이들 돌연변이체는 자체의 자연적 형태의 유전자에 비하여 훨씬 높은 활성을 나타낸다. 틸링(TILLING)은 고밀도 돌연변이 유발과 고속처리 탐색 방법을 조합한 것이다. 틸링(TILLING)의 전형적인 단계는 하기와 같다: (a) EMS 돌연변이유발 (Redei GP 및 Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chu NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 1682; Feldmann 등, (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) DNA 준비 및 개체의 풀링(pooling); (c) 관심 영역의 PCR 증폭 (d) 이형 이중가닥 (heteroduplexes)이 되게 변성 및 어닐링 (e) DHPLC로 이형 이중가닥이 있는지를 크로마토그램 상의 여분의 정점으로 검출 (f) 돌연변이체 개체의 동정 (g) 돌연변이 PCR 산물의 염기서열결정. 틸링(TILLING)의 방법은 당업계에 주지되어 있다 (McCallum 등, (2000) Nat Biotechnol 18: 455-457; Stemple (2004) Nat Rev Genet 5(2): 145-50).
상동 재조합
상동 재조합은 정해진 위치에 선택된 핵산 서열이 게놈 내로 도입되게 한다. 상동 재조합은 생물학에서 효모 또는 선류 (Physcomitrella) 같은 하등생물에 대해 일상적으로 사용되는 표준기술이다. 식물에 있어 상동 재조합을 수행하는 방법은 모델 식물 (Offringa 등 (1990) EMBO J 9(10): 3077-84)에 대해서 뿐 아니라 작물 예를 들면, 벼 (Terad 등 (2002) Nat Biotech 20(10): 1030-4; Iid and Terad (2004) Curr Opin Biotech 15(2): 132-8; Terada 등 (2007) Plant Physiol)에 대해서도 기재된 바 있다.
수확량
일반적인 의미에서의 용어 "수확량"은 경제적 가치 있는 측정 가능한 생산량을 말하며, 전형적으로 특정 작물, 면적, 및 기간에 관련이 있다. 개개 식물체 부분이 직접적으로 수, 크기 및/또는 중량에 근거한 수확량에 기여하거나, 또는 실제 수확량은 작물 에이커 및 년 당 수확량이고, 이는 총생산량 (수확된 및 평가된 생산량을 포함)을 재배된 에이커로 나눔으로써 결정된다. 식물의 "수확량"은 식물체의 영양조직 생물량 (뿌리 및/또는 어린 줄기 생물량), 생식 기관, 및/또는 번식체 (예를 들면, 종자)에 관련될 수 있다.
초기 활력
"초기 활력" 특히 식물 생장의 초기 단계 중에 활기차고 건강하게 잘 균형을 이룬 생장을 말하며, 예를 들면, 식물이 환경에 보다 잘 적응함으로 인한 (즉, 에너지 자원 사용이 최적화되고 어린 줄기와 뿌리 간에 분배됨) 식물체의 적응성 증가의 결과일 것이다. 초기 활력을 갖는 식물은 또한 증가된 실생 생존 및 보다 나은 작물 생성을 보여주며, 이는 흔히 고도로 균일한 밭 (균일한 양상으로 자라는 작물, 즉 대다수의 식물이 사실상 거의 동시에 다양한 발달단계에 이르는)과 흔히 보다 낫고 보다 높은 수확량이 된다. 따라서, 초기 활력은 천 개 낱알의 중량, 발아율, 출현율, 실생 생장, 실생 높이, 뿌리 길이, 뿌리 및 어린 줄기 생물량 등과 같은 다양한 요인들을 측정함으로써 결정될 수 있다.
증가/향상/강화
용어 "증가", "향상", 또는 "강화"는 서로 호환성 있게 사용할 수 있으며, 본 발명에서 정의된 대조구 식물과 비교하여 적어도 3%, 4%, 5%, 6%, 7%, 8%, 9% 또는 10%, 바람직하게는 적어도 15% 또는 20%, 더욱 바람직하게는 25%, 30%, 35% 또는 40% 이상의 수확량 및/또는 생장을 의미한다.
종자 수확량
증가된 종자 수확량은 다음 중 하나 이상으로 나타난다: a) 개별 종자 당 및/또는 식물체 당 및/또는 헥타르 또는 에이커 당의 종자 생물량 (총 종자 중량)의 증가 b) 식물체 당 꽃 수의 증가 c) 증가된 수의 (충전된) 종자 d) 증가된 종자 충전율 (충전된 종자 수를 총 종자 수로 나눈 비로 나타냄); e) 증가된 수확 지수 (종자 같은 수확할 수 있는 부분의 수확량을 총 생물량으로 나눈 비율); 및 f) 증가된 천 개 낱알 중량 (TKW) (카운트한 충전된 종자 및 이의 총 중량으로부터 외삽됨). 증가된 TKW는 증가된 종자 크기 및/또는 종자 중량, 및 배 및/또는 배유 크기의 증가로 인한다.
증가된 종자 수확량은 또한 종자 크기 및/또는 종자 부피의 증가로 나타낼 수 있다. 더욱이, 종자 수확량의 증가는 또한 종자 면적 및/또는 종자 길이 및/또는 종자 폭 및/또는 종자 주계의 증가로 나타난다. 증가된 수확량으로 외형이 변형되거나, 또는 변형된 외형으로 인해 수확량이 증가할 수도 있다.
녹색 지수
본 발명에 사용된 "녹색 지수(greenness index)"는 식물의 디지탈 화상으로부터 계산된다. 화상 상에 식물 대상에 속하는 각 화소에 대하여, 녹색 값 대 적색 값의 비율 (암호화 색상에 대하여 RGB 모델에서)이 계산된다. 녹색 지수는 녹색 대 적색의 비율이 주어진 역치를 능가하는 화소의 백분율로 표시된다. 정상적인 생장 조건 하에서, 염분 스트레스가 있는 생장 조건 하에서, 양분 이용도가 감소된 생장 조건 하에서 식물의 녹색 지수는 개화 전 마지막 화상에서 측정된다. 대조적으로, 가뭄 스트레스 생장 조건 하에서 식물의 녹색 지수는 가뭄 후의 첫 번째 화상에서 측정된다.
식물
본 발명에서 사용된 용어 "식물"은 전체식물, 식물 및 종자, 어린 줄기, 줄기, 잎, 뿌리 (괴경 포함), 꽃, 및 조직과 기관을 포함하는 식물 부분의 조상 및 자손을 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다. 용어 "식물"은 또한 식물 세포, 현탁 배양액, 캘러스 조직, 배, 분열조직, 배우체, 포자체, 화분 및 소포자를 포함하며, 이들 각각은 목적 유전자/핵산 서열을 포함한다.
본 발명의 방법에 유용한 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 하기를 포함하는 목록에서 선택된 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다: 에이서 (Acer spp.), 악티니디아 (Actinidia spp.), 아벨모스쿠스 (Abelmoschus spp.), 아가베 시살라나 (Agave sisalana), 아그로피론 (Agropyron spp.), 아그로스티스 스톨로니페라 ( Agrostis stolonifera ), 알리움 (Allium spp.), 아마란투스 (Amaranthus spp.), 암모필라 아레나리아 (Ammophila arenaria), 아나나스 코모수스 ( Ananas comosus ), 안노나 (Annona spp.), 아피움 그라베오렌스 (Apium graveolens), 아라키스 ( Arachis spp.), 알토칼푸스 ( Artocarpus spp.), 아스파라거스 오피시날리스 ( Asparagus officinalis ), 아베나 ( Avena spp.) (예를 들면, 아베나 사티바 ( Avena sativa ), 아베나 파투아 ( Avena fatua), 아베나 비잔티나 (Avena byzantina), 아베나 파투아 var . 사티바 (Avena fatua var . sativa), 아베나 하이브리다 (Avena hybrida)), 아베로아 카람볼라 (Averrhoa carambola), 뱀부사 (Bambusa sp.), 베닌카사 히스피다 (Benincasa hispida ), 벨톨레티아 엑셀세아 (Bertholletia excelsea), 베타 불가리스 (Beta vulgaris ), 브라시카 (Brassica spp.) (예를 들면, 브라시카 나푸스 ( Brassica napus ), 브라시카 라파 (Brassica rapa ssp.) [캐놀라, 유채, 순무]), 카다바 파리노사 (Cadaba farinosa), 카멜리아 시넨시스 (Camellia sinensis), 칸나 인디카 (Canna indica), 칸나비스 사티바 (Cannabis sativa), 캡시쿰 ( Capsicum spp.), 카렉스 엘라타 (Carex elata), 카리카 파파야 (Carica papaya), 카리사 마크로칼파 (Carissa macrocarpa), 카리야 (Carya spp .), 카르타무스 팅크토리우스 (Carthamus tinctorius), 카스타네아 (Castanea spp.), 케이바 펜탄드라 (Ceiba pentandra), 키코리움 엔디비아 (Cichorium endivia ), 신나모뭄 (Cinnamomum spp.), 시트룰루스 라나투스 (Citrullus lanatus), 시트루스 (Citrus spp.), 코코스 (Cocos spp .), 코페아 ( Coffea spp.), 콜로카시아 에스쿨렌타 (Colocasia esculenta), 콜라 (Cola spp.), 콜코루스 (Corchorus sp.), 코리안드룸 사티붐 (Coriandrum sativum), 코리루스 (Corylus spp.), 크라태구스 (Crataegus spp.), 크로쿠스 사티부스 (Crocus sativus), 쿠쿨비타 (Cucurbita spp .), 쿠쿠미스 ( Cucumis spp.), 키나라 ( Cynara spp.), 다우쿠스 카로타 (Daucus carota), 데스모디움 (Desmodium spp.), 디모칼푸스 론간 (Dimocarpus longan), 디오스코레아 (Dioscorea spp.), 디오스피로스 (Diospyros spp.), 에키노크로아 (Echinochloa spp .), 엘래이스 ((Elaeis (예를 들면, 엘래이스 귀넨시스 (Elaeis guineensis), 엘레이스 올레이페라 (Elaeis oleifera)), 엘레우신 코라카나 (Eleusine coracana), 에리안투스 (Erianthus sp .), 에리오보트리아 야포니카 (Eriobotrya japonica), 유카립투스 (Eucalyptus spp.), 유게니아 유니플로라 ( Eugenia uniflora), 파고피룸 ( Fagopyrum spp.), 파구스 (Fagus spp.), 페스투카 아룬디나케아 (Festuca arundinacea), 피쿠스 카리카 (Ficus carica), 폴투넬라 (Fortunella spp.), 프라가리아 (Fragaria spp.), 깅코 빌로바 (Ginkgo biloba), 글라이신 (Glycine spp.) (예를 들면, 글라이신 맥스 (Glycine max), 소야 히스피다 (Soja hispida) 또는 소야 맥스 ( Soja max )), 고시피움 힐수툼 ( Gossypium hirsutum ), 헬리안투스 (Helianthus spp.) (예를 들면, 헤리안투스 안누스 ( Helianthus annuus)), 헤메로칼리스 풀바 ( Hemerocallis fulva ), 히비스쿠스 ( Hibiscus spp.) 홀데움 ( Hordeum spp.) (예를 들면, 홀데움 불가레 (Hordeum vulgare)), 이포모에아 바타타스 (Ipomoea batatas ), 주글란스 (Juglans spp.), 락투카 사티바 (Lactuca sativa), 라티루스 (Lathyrus spp.), 렌스 쿨리나리스 (Lens culinaris), 리눔 우시타티시뭄 (Linum usitatissimum), 리치 키넨시스 (Litchi chinensis), 로투스 ( Lotus spp.), 루파 아쿠탄굴라 ( Luffa acutangula ), 루피누스 (Lupinus spp.), 루줄라 실바티카 (Luzula sylvatica), 라이코펠시콘 (Lycopersicon spp.) (예를 들면, 라이코펠시콘 에스쿨렌툼 (Lycopersicon esculentum ), 라이코펠시콘 라이코펠시쿰 (Lycopersicon lycopersicum), 라이코펠시콘 피리폴메 (Lycopersicon pyriforme)), 마크로틸로마 (Macrotyloma spp.), 말루스 (Malus spp.), 말피기아 에말기나타 (Malpighia emarginata), 맘메아 아메리카나 (Mammea americana), 망기페라 인디카 (Mangifera indica), 마니호트 ( Manihot spp.), 마닐카라 자포타 (Manilkara zapota), 메디카고 사티바 (Medicago sativa), 메릴로투스 (Melilotus spp.), 멘타 ( Mentha spp.), 미스칸투스 시넨시스 ( Miscanthus sinensis), 모몰디카 (Momordica spp.), 모루스 니그라 (Morus nigra), 무사 (Musa spp.), 니코티아나 ( Nicotiana spp.), 올레아 ( Olea spp.), 오푼티아 (Opuntia spp.), 오르니토푸스 (Ornithopus spp.), 오리자 (Oryza spp.) (예를 들면, 오리자 사티바 (Oryza sativa ), 오리자 라티포리아 ( Oryza latifolia)), 패니쿰 미리아케움 (Panicum miliaceum), 패니쿰 벌가툼 ( Panicum virgatum), 파시플로라 에둘리스 (Passiflora edulis), 파스티나카 사티바 (Pastinaca sativa), 페니세툼 (Pennisetum sp.), 펠세아 (Persea spp.), 페트로셀리눔 크리스품 (Petroselinum crispum), 파라리스 아룬디나케아 (Phalaris arundinacea), 파세올루스 (Phaseolus spp.), 플레움 프라텐세 (Phleum pratense), 피닉스 (Phoenix spp .), 프라그미테스 오스트라리스 (Phragmites australis), 피사리스 (Physalis spp.), 피누스 ( Pinus spp.,) 피스타키아 베라 (Pistacia vera ), 피숨 (Pisum spp.), 포아 (Poa spp.), 포푸러스 ( Populus spp.), 프로소피스 ( Prosopis spp.), 프루누스 (Prunus spp.), 프시디움 ( Psidium spp.), 푸니카 그라나툼 (Punica granatum), 피루스 코무니스 (Pyrus communis), 켈쿠스 (Quercus spp.), 라파누스 사티부스 (Raphanus sativus), 레움 라발바룸 (Rheum rhabarbarum), 리베스 (Ribes spp.), 리키누스 콤무니스 ( Ricinus communis ), 루부스 (Rubus spp.), 사카룸 (Saccharum spp.), 살릭스 ( Salix spp.), 삼부쿠스 ( Sambucus spp.), 세카레 세레알레 ( Secale cereale ), 세사뭄 ( Sesamum spp.), 시나피스 (Sinapis sp .), 솔라눔 ( Solanum spp.) (예를 들면, 솔라눔 투베로숨 ( Solanum tuberosum ), 솔라눔 인테그리폴리움 (Solanum integrifolium) 또는 솔라눔 라이코펠시쿰 (Solanum lycopersicum)), 솔굼 바이칼라 ( Sorghum bicolor ), 스피나시아 (Spinacia spp.), 시지기움 (Syzygium spp.), 타게테스 ( Tagetes spp.), 타마린두스 인디카 (Tamarindus indica ), 테오브로마 카카오 (Theobroma cacao ), 트리폴리움 (Trifolium spp.), 트리티코세칼레 림파우이 ( Triticosecale rimpaui ), 트리티칼레 (Triticale)(트리티쿰 세칼레(Triticum secale), 트리티쿰 (Triticum spp. (예를 들면, 트리티쿰 아에스티붐 (Triticum aestivum), 트리티쿰 두룸 (Triticum durum ), 트리티쿰 툴기둠 (Triticum turgidum ), 트리티쿰 하이베르눔 (Triticum hybernum), 트리티쿰 마차 (Triticum macha ), 트리티쿰 사티붐 (Triticum sativum ) 또는 트리티쿰 불가레 (Triticum vulgare)), 트로패오룸 미누스 (Tropaeolum minus), 트로패오룸 마주스 (Tropaeolum majus), 박시니움 (Vaccinium spp.), 비시아 (Vicia spp.), 비그나 (Vigna spp.), 비올라 오도라타 (Viola odorata), 비티스 ( Vitis spp.), 제아 메이즈 (Zea mays), 지자니아 팔루스트리스 (Zizania palustris), 지지푸스 (Ziziphus spp.).
발명의 상세한 설명
I. 2-
Cys
PRX
(2-
cysteine
peroxiredoxin
)
놀랍게도, 이제 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에서의 발현의 조절, 바람직하게는 증가로 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물이 된다는 것이 발견되었다. 첫 번째 일 구현예에 따라, 본 발명은 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에서의 발현의 조절, 바람직하게는 증가시키는 것을 포함하는, 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다.
2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 발현을 조절하는, 바람직하게는, 증가하는 바람직한 방법은 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에의 도입 및 발현이다.
이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 2-Cys PRX 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산 서열"은 상기 2-Cys PRX 폴리펩티드를 암호화하는 것이 가능한 핵산 서열을 의미한다. 식물에 도입되는 핵산 서열은 (따라서 본 발명의 방법 수행에 유용한) 하기에 기술될 유형의 단백질을 암호화하는 임의의 핵산 서열이며, 이후 또한 "2-Cys PRX 핵산 서열" 또는 "2-Cys PRX 유전자"라 칭한다.
본 발명에서 정의된 "2-Cys PRX 폴리펩티드"는 N-말단으로부터 C-말단으로 하기를 포함하는 임의의 폴리펩티드를 의미한다: (1) 색소체 운반 펩티드; 및 (2) 2-Cys PRX 보존된 도메인.
부가적으로, "2-Cys PRX 폴리펩티드"는 하기 중 하나 또는 양자를 포함한다: (i) 서열번호 77로 표시된 모티프1, 또는 서열번호 77에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 아미노산 서열 동일성을 갖는 모티프; 또는 (ii) 서열번호 78로 표시된 모티프2, 또는 서열번호 78에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 아미노산 서열 동일성을 갖는 모티프.
또 다르게는 또는 부가적으로, 본 발명에서 정의된 "2-Cys PRX 폴리펩티드"는 도 3에 도시된 것과 같은 계통수 제작에 사용 시, 임의의 다른 PRX 클레이드(clade)라기 보다는, 서열번호 2로 표시된 폴리펩티드 서열을 포함하는 2-Cys PRX 폴리펩티드 클레이드와 클러스터되는 경향이 있는 임의의 폴리펩티드 서열을 말한다.
또 다르게는 또는 부가적으로, 본 발명에서 정의된 "2-Cys PRX 폴리펩티드"는 서열번호 2로 표시된 2-Cys PRX 폴리펩티드에 증가하는 순으로 선호되는 적어도 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 임의의 폴리펩티드, 또는 본 발명의 표 A1에 제시된 임의의 폴리펩티드 서열을 말한다.
용어 "도메인" 및 "모티프"는 본 발명의 "정의" 섹션에 정의된 바 있다. 도메인 동정을 위한 전문가 데이터베이스, 예를 들면 SMART (Schultz 등 (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic 등 (2002) Nucleic Acids Res 30, 242- 244), InterPro (Mulder 등, (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo 등, Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman 등, Nucleic Acids Research 30(1): 276-280 (2002))이 존재한다. 단백질 서열의 인 실리코 분석용 도구 세트가 ExPASY 프로테오믹스 서버에서 유용하다 (Swiss Institute of Bioinformatics (Gasteiger 등, ExPASy: proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31: 3784-3788 (2003)). 도메인은 또한 서열 정렬과 같은 통상적인 기술을 사용하여서도 동정될 수 있다. 서열번호 2의 폴리펩티드 서열의 분석은 하기 실시예 2 및 4에 제시되어 있다.
비교를 위한 서열 정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는 수는 최대로, 공백(gaps)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘을 사용한다. BLAST 알고리즘 (Altschul 등 (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 복수 서열 정렬 알고리즘 (version 1.83)을 사용하여, 디폴트 페어와이즈 정렬 변수(default pairwise alignment parameters) 및 백분율로 스코링(scoring)하는 방법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell 등, BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 하기 실시예 3에 백분율로서 나타낸 서열 동일성 값은 핵산 서열 또는 폴리펩티드 전체 서열에 걸쳐(본 발명의 표 A2), 또는 선정된 도메인 또는 보존된 모티프(들)(서열번호 77로 표시된 모티프1, 및 서열번호 78로 표시된 모티프2, 서열번호 2에 포함된 모티프1 및 모티프2)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default parameters)를 사용하여 결정되었다.
단백질의 세포 내 위치를 추정하는 일은 중요하며 잘 연구되어 있다. 단백질의 위치를 아는 것은 그 기능을 밝히는 데 도움이 된다. 단백질의 위치를 밝히는 실험적인 방법은 immunolocalization으로부터 녹색형광단백질 (GFP)을 사용한 단백질의 태깅(tagging)까지 있다. 상기 방법은 비록 계산에 의한 방법에 비해 노동 집약적이기는 하나 정확하다. 최근에 서열 데이터로부터 단백질 위치의 계산에 의한 예측에 많은 진전이 있었다. 당업자에게 잘 알려진 알고리즘 중에 Swiss Institute for Bioinformatics에 의해 호스팅된 ExPASy Proteomics tools이 유용하며, 예를 들면, PSort, TargetP, ChloroP, Predotar, LipoP, MITOPROT, PATS, PTS1, SignalP 등이 있다. 본 발명의 폴리펩티드의 세포 내 위치의 동정은 실시예 5에 제시되어 있다. 특히 본 발명의 서열번호 2는 광합성 (자가영양) 세포의 색소체 (엽록체) 부위에 지정된다.
색소체에 단백질을 표적화하는 방법은 당업계에 주지되어 있으며, 운반 펩티드의 사용을 포함한다. 하기 표 3은 임의의 2-Cys PRX 폴리펩티드를 색소체에 표적화하는 데 사용될 수 있는 운반 펩티드의 예를 보여주며, 상기 2-Cys PRX 폴리펩티드는, 자연형으로는, 정상적으로 색소체에 표적화되지 않거나, 또는 상기 2-Cys PRX 폴리펩티드는 그 자연형으로는 다른 운반 펩티드 (예를 들면, 그의 자연적인 운반 펩티드)의 힘으로 색소체에 표적화된다. 예를 들면, 남세균 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열은, 2-Cys PRX 폴리펩티드가 색소체에, 바람직하게는 엽록체에 표적화되는 한, 또한 본 발명의 방법에 사용하기에 적절할 수 있다.
표 3: 색소체에 폴리펩티드의 표적화에 유용한 운반 펩티드 서열의 예
NCBI 등록번호 | 출처 생물체 | 단백질 기능 | 운반 펩티드 서열 |
P07839 | Chlamydomonas | Ferredoxin | MAMAMRSTFAARVGAKPAVRGARPASRMSCMA |
AAR23425 | Chlamydomonas | Rubisco activase | MQVTMKSSAVSGQRVGGARVATRSVRRAQLQV |
CAA56932 | Arabidopsis thaliana | Aspartate amino transferase | MASLMLSLGSTSLLPREINKDKLKLGTSASNPFLKAKSFSRVTMTVAVKPSR |
CAA31991 | Arabidopsis thaliana | Acyl carrier protein1 | MATQFSASVSLQTSCLATTRISFQKPALISNHGKTNLSFNLRRSIPSRRLSVSC |
CAB63798 | Arabidopsis thaliana | Acyl carrier protein2 | MASIAASASISLQARPRQLAIAASQVKSFSNGRRSSLSFNLRQLPTRLTVSCAAKPETVDKVCAVVRKQL |
CAB63799 | Arabidopsis thaliana | Acyl carrier protein3 | MASIATSASTSLQARPRQLVIGAKQVKSFSYGSRSNLSFNLRQLPTRLTVYCAAKPETVDKVCAVVRKQLSLKE |
2-Cys PRX 폴리펩티드는 색소체에 표적화 되어 활성화된다. 즉, 2-Cys PRX 폴리펩티드 (적어도 자연형)는 엽록체에서 H2O2의 제거를 촉매할 수 있다. 상기 활성을 점검하기 분석은 당업계에 주지되어 있다. 세부적인 내용은 실시예 6에 제시되어 있다.
본 발명은 서열번호 2의 폴리펩티드 서열을 암호화하는 서열번호 1로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며 본 발명의 방법은 유리하게는 본 발명에서 정의된 임의의 2-Cys PRX 암호화 핵산 서열 또는 2-Cys PRX 폴리펩티드 서열을 사용하여 수행될 수 있다.
2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 예는 본 발명의 실시예 1의 표 A1에 제시되어 있다. 제시된 핵산 서열이 본 발명의 방법의 수행에 유용하다. 실시예 1의 표 A1에 제시된 폴리펩티드 서열은 서열번호 2로 표시된 2-Cys PRX 폴리펩티드의 오쏘로그(orthologue) 및 패럴로그(paralogue)의 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에서 정의된 바 있다. 오쏘로그 및 패럴로그는 소위 상호간 블라스트(Reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있다. 전형적으로 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 1의 표 A1에 열거된 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열 (조회 서열은 서열번호 1 또는 서열번호 2, 두 번째 BLAST는 따라서 브라시카(Brassica) 서열과 대조하는 것이다)이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.
높은 ranking hits은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 의미있다 (또는 다른 말로, 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에다가, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 다음에 neighbour joining tree가 사용된다 (도 3 참고).
핵산 변이체도 본 발명의 방법 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 1의 표 A1에 제시된 폴리펩티드 서열 중 임의의 하나의 상동체 및 유도체를 암호화하는 핵산 서열을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 실시예 1의 표 A1에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 암호화하는 핵산 서열도 본 발명의 방법에 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 상당한 동일한 생물학적 및 기능적 활성을 가진다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 일부, 2-Cys PRX 폴리펩티드를 암호화하는 핵산에 혼성화되는 핵산 서열, 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 스플라이스 변이체, 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 대립인자 변이체, 및 유전자 셔플링에 의해 얻은 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 변이체를 포함한다. 용어 혼성화되는 서열, 스플라이스 변이체, 대립인자 변이체 및 유전자 셔플링은 본 발명에 기재된 바 있다.
본 발명의 방법의 수행은 전장 핵산 서열의 사용에 의존하지 않으므로, 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열은 전장 핵산 서열일 필요는 없다. 본 발명에서는, 실시예 1의 표 A1에 제시된 핵산 서열 중 임의의 하나의 일부, 또는 실시예 1의 표 A1에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 일부를 식물 뿌리에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산 서열의 일부분은 예를 들면, 핵산 서열에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 암호화 (또는 비암호화) 서열에 융합될 수도 있다. 다른 암호화 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.
본 발명의 방법에 유용한 일부분은 본 발명에 정의된 2-Cys PRX 폴리펩티드를 암호화하며, 실시예 1의 표 A1에 제시된 폴리펩티드 서열과 상당한 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 1의 표 A1에 제시된 핵산 서열 중의 임의의 하나의 일부분, 또는 실시예 1의 표 A1에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그(orthologue) 또는 패럴로그(paralogue)를 암호화하는 핵산 서열의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 500, 550, 600, 650, 700, 750, 800 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 1의 표 A1에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 1의 표 A1에 제시된 폴리펩티드 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 1의 핵산 서열의 일부분이다. 바람직하게는, 상기 일부분은 도 3에 도시된 바와 같은 계통수 구축에 사용 시, 임의의 다른 그룹보다는 서열번호 2로 표시된 폴리펩티드 서열을 포함하는 2-Cys PRX 폴리펩티드 그룹과 클러스터되는 경향이 있는 폴리펩티드 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건하에서, 바람직하게는 스트린전트 조건하에서, 본 발명에서 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산 서열이다.
본 발명에 따라, 실시예 1의 표 A1에 제시된 핵산 서열 중 임의의 하나와 혼성화가 가능한 핵산 서열, 또는 실시예 1의 표 A1에 제시된 임의의 핵산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열과 혼성화가 가능한 핵산의 식물 뿌리에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 2-Cys PRX 폴리펩티드를 암호화하며, 실시예 1의 표 A1에 제시된 폴리펩티드 서열과 상당한 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 1의 표 A1에 제시된 핵산 서열 중의 임의의 하나에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 1의 표 A1에 제시된 임의의 폴리펩티드 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열과 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 1로 표시된 핵산 서열에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 도 3에 도시된 것과 같은 계통수 구축에 사용 시 임의의 다른 그룹보다 서열번호 2로 표시된 폴리펩티드 서열을 포함하는 2-Cys PRX 폴리펩티드의 그룹과 클러스터되는 경향이 있는 폴리펩티드 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 상기 정의된 2-Cys PRX 폴리펩티드를 암호화하는 스플라이스 변이체이다.
본 발명에 따라, 실시예 1의 표 A1에 제시된 핵산 서열 중의 임의의 하나의 스플라이스 변이체, 또는 실시예 1의 표 A1에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 스플라이스 변이체의 식물 뿌리에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.
바람직한 스플라이스 변이체는 서열번호 1에 제시된 핵산 서열의 스플라이스 변이체, 또는 서열번호 2의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열의 스플라이스 변이체이다. 바람직하게는, 스플라이스 변이체에 의해 암호화된 폴리펩티드 서열은 도 3에 제시된 것과 같은 계통수 제작 시 임의의 다른 그룹보다는 서열번호 2로 표시된 폴리펩티드 서열을 포함하는 2-Cys PRX 폴리펩티드 그룹과 클러스터하는 경향이 있다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 상기 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 대립인자 변이체이며, 대립인자 변이체는 본 발명에서 정의된 바 있다.
본 발명에 따라, 실시예 1의 표 A1에 제시된 임의의 핵산 서열의 대립인자 변이체의 식물 뿌리에의 도입 및 발현, 또는 실시예 1의 표 A1에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 대립인자 변이체의 식물 뿌리에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 대립인자 변이체는 서열번호 2의 2-Cys PRX 폴리펩티드 및 실시예 1의 표 A1에 제시된 임의의 폴리펩티드 서열과 상당한 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 1의 대립인자 변이체 또는 서열번호 2의 오쏘로그 또는 패럴로그를 암호화하는 핵산 서열의 대립인자 변이체이다. 바람직하게는, 대립인자 변이체에 의해 암호화되는 폴리펩티드 서열은 도 3에 도시된 것과 같은 계통수 구축에 사용 시 임의의 다른 그룹과 보다는 서열번호 2로 나타낸 폴리펩티드 서열을 포함하는 2-Cys PRX 폴리펩티드와 클러스터하는 경향이 있다.
유전자 셔플링 또는 방향진화는 또한 상기 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에서 정의된 바 있다.
본 발명에 따라, 실시예 1의 표 A1에 제시된 핵산 서열 중의 임의의 하나의 변이체의 식물 뿌리에의 도입 및 발현을 포함하는, 또는 실시예 1의 표 A1에 제시된 임의의 폴리펩티드 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열의 변이체의 식물 뿌리에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이 핵산 서열은 유전자 셔플링에 의해 얻어진다.
바람직하게는 유전자 셔플링에 의해 얻어진 변이체 핵산 서열에 의해 암호화되는 폴리펩티드 서열은 도 3에 제시된 것과 같은 계통수 구축에 사용 시 임의의 다른 그룹보다 서열번호 2로 표시된 폴리펩티드 서열을 포함하는 2-Cys PRX 폴리펩티드의 그룹과 클러스터되는 경향이 있다.
더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇가지 방법이 자리지정 돌연변이유발를 달성하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (current protocols in molecular biology. Wiley Eds).
2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열은 진정세균 및 진핵생물 (진균, 식물, 또는 동물) 같은 자연적 출처로부터 유래될 수 있다. 핵산 서열은 임의의 인공적인 출처로부터 유래되거나, 또는 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 2-Cys PRX 폴리펩티드 암호화 핵산 서열은 식물로부터, 더 바람직하게는 쌍자엽 식물로부터, 더욱 바람직하게는 십자화과로부터, 가장 바람직하게는 브라시카 라파 (Brassica rapa) 유래이다.
본 발명의 방법의 수행은 향상된 수확량 관련 형질을 갖는 식물을 제공한다. 특히 본 발명의 방법의 수행은 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 상세하세 기재되어 있다.
본 발명에서 향상된 수확량 관련 형질에 대한 기준은 (수확 가능한) 지상부 및/또는 (수확 가능한) 지하부를 포함하여 하나 이상의 식물체의 일부분의 생물량 (biomass: 중량)의 증가를 의미한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 갖는 식물이 된다.
옥수수를 예로 들면, 수확량 증가는 다음 중의 하나 이상으로 표시된다: 헥타르 또는 에이커당 식물체의 수 증가, 식물체당 이삭 (열매) 수의 증가, 낱알 줄의 수, 줄당 낱알의 수, 낱알 중량, 천립중량, 열매 길이/직경의 증가, 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가. 벼를 예로 들면, 수확량 증가는 다음 중의 하나 이상의 증가로 표시된다: 헥타르 또는 에이커당 식물체의 수, 식물체당 원추화서의 수, 원추화서당 작은 이삭의 수, 원추화서당 소화의 수 (일차 원추화서에 대한 충만된 종자의 수의 비율로 표시된다), 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가, 천립중량의 증가.
본 발명은 대조구 식물에 비하여 수확량 관련 형질을, 특히 식물의 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에서의 발현을 조절, 바람직하게는 발현을 증가시키는 것을 포함한다.
본 발명에 따른 형질전환 식물은 향상된 수확량 관련 형질을 가지므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 증가된 생장 속도를 나타낼 것 같다 (생활사 중 적어도 일부에서).
증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 실질적으로 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 건조된 성숙된 종자로부터 식물체가 출발 물질과 유사한 건조된 성숙한 종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 증가된 생장 속도는 식물의 생활사 중의 하나 이상의 단계에서 또는 실질적으로 전체 식물 생활사 중에 나타날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가하면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가하면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 에이커당 년간 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 임의의 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에 (초기 시기) 또는 수확기에 (후기 시기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키는 방법을 제공하며, 상기 방법은 본 발명에 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다.
식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 스트레스에 노출되든지 간에 수확량 및/또는 생장 속도의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건하의 대조구 식물에 비하여 40%, 35% 또는 30% 미만, 바람직하게는 25%, 20% 또는 15% 미만, 더욱 바람직하게는 14%, 13%, 12%, 11% 또는 10% 미만이다. 실제로는 농업상의 진척 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 순한 스트레스는 식물이 노출되는 매일의 생물적 및/또는 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 결빙 온도에 의한 것이다. 비생물적 스트레스는 수분 스트레스 (특히 가뭄으로 인한)로 인한 삼투 스트레스, 염 스트레스, 산화적 스트레스 또는 이온 스트레스이다. 생물적 스트레스는 전형적으로 세균, 바이러스, 진균 및 곤충과 같은 병원균에 의해 야기된 스트레스이다.
특히, 본 발명의 방법은 필적하는 조건하에 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는 식물을 제공하기 위하여, 스트레스가 없는 조건하에서 또는 순한 가뭄 조건하에서 수행될 수 있다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. Rabbani 등 (Plant Physiol (2003) 133: 1755-1767)은 특히 가뭄 스트레스와 고염도 스트레스 간에 고도의 "혼선"을 기재하고 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 이들 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다. 본 발명에서 사용된 용어 "스트레스가 없는" 조건은 식물의 최적 생장을 허용하는 환경 조건이다. 당업자는 주어진 위치에서 정상적인 토양 조건 및 기후 조건을 인식하고 있다.
본 발명의 방법의 수행으로 스트레스가 없는 조건하에서 또는 순한 가뭄 스트레스 조건하에서 자란 식물이 비교되는 조건하에서 자란 대조구 식물에 비해 수확량 관련 형질이 향상된 식물로 된다. 따라서, 본 발명에 따라 스트레스가 없는 조건하에서 또는 순한 가뭄 조건하에서 키운 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 방법은 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에서의 발현의 조절, 바람직하게는 증가를 포함한다.
본 발명의 방법의 수행으로 필적하는 스트레스 조건 하에서 키운 대조구 식물에 비해 비생물적 스트레스 조건 하에서 키운 식물의 수확량 관련 형질이 향상된다. Wang 등 (Planta (2003) 218: 1-14)의 보고에 따르면, 비생물적 스트레스는 식물 생장 및 생산성에 불리한 영향을 미치는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 야기한다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관되어 있어 비슷한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 고온 또는 저온, 염분 또는 가뭄 스트레스를 흔히 동반하는 산화적 스트레스는 기능 및 구조 단백질의 변성을 야기한다. 결국 이들 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다. 다양한 환경 스트레스가 비슷한 경로를 활성화하므로, 가뭄 스트레스로 수행한 본 발명의 실시예는 가뭄 스트레스에 대한 제한으로서 보여지는 것이 아니라, 필적하는 스트레스 조건하에서, 일반적으로 비생물적 스트레스하에서 자란 대조구 식물에 비해 수확량 관련 형질을 향상시킴에 있어 상기 정의된 2-Cys PRX 폴리펩티드의 관여를 나타내기 위한 차폐물로서 보여진다.
특히 가뭄 스트레스와 고염도 스트레스 간에 고도의 "혼선"이 보고되었다 (Rabbani et al. (2003) Plant Physiol 133: 1755-1767). 따라서, 식물에서 수확량 관련 형질의 향상에 유용함에 더하여, 2-Cys PRX 폴리펩티드가 가뭄 스트레스 조건하에서 자란 대조구 식물에 비해, 또한 다양한 다른 비생물적 스트레스 조건하에서 자란 대조구 식물에 비해 식물에서 수확량 관련 형질의 향상에 용도가 있음이 발견된 것이 분명하다.
본 발명에서 정의된 용어 "비생물적 스트레스"는 하기 중 임의의 하나 이상을 의미하는 것이다: 수분 스트레스 (가뭄 또는 과도한 수분으로 인한), 혐기적 스트레스, 염분 스트레스, 온도 스트레스 (더운, 추운 또는 결빙 온도에 의한), 화학적 독성 스트레스 및 산화적 스트레스. 본 발명의 한 양상에 있어서, 비생물적 스트레스는 수분 스트레스, 염분 스트레스, 산화적 스트레스 및 이온 스트레스로부터 선택된 삼투 스트레스이다. 바람직하게는, 상기 수분 스트레스는 가뭄 스트레스이다. 용어 염분 스트레스는 통상적인 소금 (NaCl)에 제한되는 것이 아니라, 무엇보다도 NaCl, KCl, LiCl, MgCl2, CaCl2 중 임의의 하나 이상에 의해 야기된 임의의 스트레스일 수 있다.
특히, 필적할만한 스트레스 조건하에서 자란 대조구 식물에 비해 비생물적 스트레스 조건 (바람직하게는 가뭄 스트레스 조건)하에서 자란 식물에서 향상된 수확량 관련 형질은 하기 중 하나 이상을 포함한다: (i) 향상된 초기 활력; (ii) 증가된 지상부 생물량(biomass); (iii) 증가된 뿌리 (굵은 및 가는) 생물량(biomass); (iv) 원추화서당 증가된 꽃의 수; (v) 증가된 종자 충만율; (vi) 식물체당 증가된 총 종자 수확량; (vii) 증가된 (충만된) 종자 수; (viii) 증가된 수확 지수; 또는 (ix) 증가된 천립당 중량 (TKW).
본 발명의 방법의 수행은 필적할만한 스트레스 조건하에서 자란 대조구 식물에 비해 비생물적 스트레스 조건하에서 향상된 수확량 관련 형질을 가진 식물을 생산한다. 따라서, 본 발명에서는 비생물적 스트레스 조건하에서 자란 식물에 있어 수확량 관련 형질을 향상시키는 방법이 제공되며, 상기 방법은 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에서의 발현의 조절, 바람직하게는 증가를 포함한다. 본 발명의 한 가지 양상에 따라, 비생물적 스트레스는 하기 중 하나 이상으로부터 선택된 삼투 스트레스이다: 수분 스트레스, 염 스트레스, 산화적 스트레스 및 이온 스트레스. 바람직하게는, 상기 수분 스트레스는 가뭄 스트레스이다.
비생물적 환경 스트레스의 또 다른 예는 생장 및 발달을 위해 식물에 의해 동화되는 하나 이상의 양분의 감소된 이용능력이다. 식물의 수확량 및 생산품의 품질에 미치는 양분 이용 효율의 강력한 영향으로 인해, 식물 생장 및 품질을 최적화하기 위해 다량의 비료가 필드에 뿌려진다. 식물의 생산성은 보통 3 가지 주요 양분인 인, 칼륨 및 질소에 인해 제한되며, 질소가 상기 3 가지 중 식물 생장에 있어 속도 제한 요소이다. 따라서 식물 생장에 필요한 주요 양분 요소는 질소 (N) 이다. 질소는 살아있는 세포에서 발견되는 아미노산, 단백질 (효소), 핵산, 및 엽록소를 포함한 수많은 중요한 화합물의 구성성분이다. 식물 건량의 1.5% 내지 2%가 질소이며, 총 식물 단백질의 약 16%이다. 따라서, 질소 이용능력이 작물 생장 및 생산에 있어 주요 제한 요인이며 (Frink 등 (1999) Proc Natl Acad Sci USA 96(4): 1175-1180), 단백질 축적 및 아미노산 조성에 주요한 영향을 미친다. 따라서, 질소 제한 조건하에서 자랄 때 수확량이 증가된 작물은 관심의 대상이 된다.
본 발명의 방법의 수행은 필적할만한 조건하에서 자란 대조구 식물에 비해 양분결핍 조건하에서, 특히 질소결핍 조건하에서 자란 식물에게 향상된 수확량 관련 형질을 제공한다. 따라서, 본 발명에서는 양분결핍 조건하에서 자란 식물에 수확량 관련 형질을 향상시키는 방법이 제공되며, 상기 방법은 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에서의 발현의 조절, 바람직하게는 증가를 포함한다. 양분결핍은 무엇보다도 질소, 인산염 및 다른 인-함유 화합물, 칼륨, 칼슘, 카드뮴, 마그네슘, 망간, 철 및 붕소 같은 양분의 부족 또는 과다의 결과이다.
본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 이의 부분 (종자 포함)을 포함한다. 상기 식물 또는 이의 부분은 뿌리-특이적 프로모터에 작동가능하게 연결된, 상기 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 외래도입유전자(transgene)를 포함한다.
본 발명은 또한 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물에의 도입 및/또는 발현을 용이하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물에의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 유용한 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(a) 상기 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열;
(b) (a)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열 및 선택적으로
(c) 전사 종결 서열.
바람직하게는, 상기 2-Cys PRX를 암호화하는 핵산 서열은 상기 정의된 바와 같다. 용어 "조절 서열" 및 "전사 종결 서열"은 본 발명에서 정의된 바와 같다.
일 구현예에서, 구축물의 조절 서열 중 하나는 기관 특이적 프로모터, 바람직하게는 식물 뿌리에서의 발현을 위한 프로모터이다. 뿌리 특이적 프로모터의 예는 Rcc3 프로모터, 예를 들면 서열번호 80로 표시되는 벼 Rcc3 프로모터이다.
식물은 상기 기재된 임의의 핵산 서열을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 잘 알고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다.
유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있다. 본 발명의 바람직한 특징에 따르면, 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열은 뿌리 특이적 프로모터에 작동가능하게 연결된다. 상기 뿌리 특이적 프로모터는 바람직하게는 RCc3 프로모터이며 (Plant Mol Biol. 1995 Jan; 27(2): 237-48), 더욱 바람직하게는 상기 RCc3 프로모터는 벼 유래이며, 더 더욱 바람직하게는 RCc3 프로모터는 서열번호 80과 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 상기 프로모터는 서열번호 80으로 표시된다. 본 발명의 방법을 수행하기 위해 이용될 수 있는 기타 뿌리 특이적 프로모터의 예는 상기 "정의" 섹션의 표 2b에 제시되어 있다.
본 발명의 적용은 서열번호 1로 나타낸 2-Cys PRX 폴리펩티드-암호화 핵산 서열에 제한되지 않으며, 본 발명의 적용은 뿌리 특이적 프로모터에 의해 추진 시 2-Cys PRX 폴리펩티드-암호화 핵산 서열의 발현에 제한되지 않는다.
예를 들면, 잎, 줄기, 괴경, 분열조직, 종자 (배 및/또는 배유)에서의 발현에 바람직한 다른 기관 특이적 프로모터가 본 발명의 방법의 수행에 유용하다. 본 발명의 "정의" 섹션에 다양한 프로모터 형에 대해 정의되어 있다.
선택적으로, 하나 이상의 종결신호 서열이 식물에 도입된 구축물에 사용될 수 있다. 부가적인 조절 인자는 해독뿐 아니라 전사 인핸서를 포함한다. 본 발명을 수행함에 있어 사용하기에 적절한 종결신호 및 인핸서 서열이 당업자에게 공지되어 있다. 세포질 내에 축적되는 성숙한 메시지의 양 증가를 위하여 "정의" 섹션에 기재된 바와 같이 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.
본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제 서열의 원점을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.
본 발명의 방법에 유용한 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산 서열을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다.
식물 세포로 핵산 서열의 안정적인 또는 일시적인 통합시, 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 암호화하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 암호화하는 핵산분자는 본 발명의 또는 본 발명의 방법에 사용된 폴리펩티드를 암호화하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산 서열로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다). 마커 유전자는 형질전환 세포에서 더 이상 필요하지 않으면 절단되거나 제거될 수 있다. 마커 유전자 제거 기술은 당업계에 공지되어 있으며, 상기 정의 섹션에 기재되어 있다.
본 발명은 상기에서 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에서의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 제조하는 방법을 제공한다.
더욱 상세하게, 본 발명은 향상된 수확량 관련 형질을 가진 형질전환 식물을 제조하는 방법을 제공하며, 상기 방법은 하기를 포함한다:
(i) 뿌리 특이적 프로모터의 조절 하에 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열을 식물, 식물체 일부 또는 식물 세포에의 도입 및 발현 및
(ii) 식물의 생장 및 발달을 촉진하는 조건하에서 식물 세포를 배양.
상기 (i)의 핵산 서열은 본 발명에서 정의된 2-Cys PRX 폴리펩티드를 암호화할 수 있는 임의의 핵산 서열일 수 있다.
상기 핵산 서열은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 핵산 서열은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다.
일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 암호화되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.
DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 두 기술은 당업자에게 주지되어 있다.
생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다. 생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현 카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 2-Cys PRX 폴리펩티드를 암호화하는 분리된 핵산 서열을 포함하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 본 발명의 방법에 사용된 핵산 서열 또는 벡터, 발현 카세트 또는 구축물 또는 벡터에 대한 숙주 식물은 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한, 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에 적용될 수 있다. 본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다. 본 발명의 바람직일 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 대두, 해바라기, 캐놀라, 알팔파, 유채, 목화, 토마토, 감자 및 담배를 포함한다. 더욱 바람직하게는, 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다. 더욱 바람직하게는 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 라이밀, 호밀, 수수 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 지하경, 괴경 및 인경 같은 식물의 수확 가능한 부분에까지 확장되나, 이 부분에 제한되지는 않는다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 식물의 수확 가능한 부분으로부터 바람직하게는 직접적으로 유래된 생산물에 관련된다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 서열 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화되어 있으며, 정의 섹션에 예가 제시되어 있다.
상기 언급된 바와 같이, 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 발현을 조절하는, 바람직하게는 증가시키는 바람직한 방법은 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리로의 도입 및 발현이다; 그러나 상기 방법의 효과는 즉, 수확량 관련 형질을 향상시키는 방법은 T-DNA 활성화 태깅, 틸링(TILLING), 상동 재조합을 포함하여 다른 잘 알려진 기술을 사용하여 행할 수도 있으며, 이에 제한되지 않는다. 상기 기술은 정의 섹션에 기재되어 있다.
본 발명은 또한 본 발명에 기재된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 용도, 및 식물의 임의의 전술한 수확량 관련 형질을 향상시키는 상기 2-Cys PRX 폴리펩티드의 용도를 포함한다.
본 발명에서 기재된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열, 또는 2-Cys PRX 폴리펩티드 그 자체는 2-Cys PRX 폴리펩티드 암호화 유전자에 유전적으로 연결된 DNA 마커가 동정된 육종 프로그램에 용도가 있다. 유전자/핵산 서열, 또는 2-Cys PRX 폴리펩티드 그 자체는 분자 마커를 정의하는데 사용될 수 있다. 이 DNA 또는 단백질 마커는 상기 본 발명의 방법에 정의된 향상된 수확량 관련 형질을 갖는 식물을 선발하는 육종 프로그램에 사용된다.
2-Cys PRX 폴리펩티드 암호화 유전자/핵산 서열의 대립인자 변이체는 또한 마커 보조 육종 프로그램에 사용된다. 상기 육종 프로그램은 때때로 예를 들면, EMS 돌연변이 유발을 사용하여 식물에 돌연변이 유발 처리로 대립인자 변이의 도입을 필요로 하며 다르게는, 그 프로그램은 자연발생적으로 생성된 "자연적인" 대립인자 변이체의 수집물로부터 시작될 수도 있다. 그러면 대립인자 변이체의 동정은 예를 들면, PCR로 한다. 문제되는 서열의 수확량 관련 형질을 향상시키는 우수한 대립인자 변이체의 선발 단계가 잇따른다. 선발은 전형적으로 문제되는 서열의 다른 대립인자 변이체를 함유하는 식물의 생장 능력을 관찰함으로써 이루어진다. 생장 능력은 온실 또는 야외에서 관찰할 수 있다. 추가적으로 선택 가능한 단계는 우수한 대립인자 변이체가 동정된 식물과 또 다른 식물의 교배를 포함한다. 이는 예를 들면, 관심을 유발하는 표현형적 특징의 조합을 만드는데 사용될 수 있다.
2-Cys PRX 폴리펩티드 암호화 핵산 서열은 또한 이 유전자에 대한 유전자 및 물리지도 제작용 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다. 상기 2-Cys PRX 폴리펩티드 암호화 핵산 서열 사용에는 적어도 길이 15 뉴클레오티드의 핵산 서열만이 필요하다. 2-Cys PRX 폴리펩티드 암호화 핵산 서열은 RFLP (restriction fragment length polymorphism) 마커로 사용될 수 있다. 제한효소 절단된 식물 게놈 DNA의 서던 블럿 (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, Laboratory Manual)에 2-Cys PRX 폴리펩티드 암호화 핵산 서열이 프로브로 사용된다. 결과로 나온 밴드 분포 양상으로 유전자지도 제작을 위하여 MapMaker (Lander et al. (1987) Genomics 1: 174-181) 같은 컴퓨터 프로그램을 사용하여 유전적 분석을 하게 된다. 또한, 핵산 서열은 지정된 유전적 교배의 양친 및 자손을 나타내는 개체들의 제한 효소 처리된 게놈 DNAs의 서던 블럿에 탐침으로 사용될 수 있다. DNA 다형성의 분리를 기록하여, 이 집단을 이용하여 이전에 얻었던 유전자 지도상에 2-Cys PRX 폴리펩티드 암호화 핵산 서열의 위치 계산에 사용한다 (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
유전자 지도 제작에 사용하기 위한 식물 유전자 유래 탐침의 생산 및 사용은 [Bematzky and Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41]에 기재되어 있다. 수많은 공개문헌이 상기 개설된 방법론 또는 이의 변형을 사용하여 특정 cDNA 클론의 유전자 지도 제작을 기술한다. 예를 들면, F2 이종교배 개체군, 역교배 개체군, 무작위 교배 개체군, 근동질유전자계통, 및 다른 세트의 개체가 유전자 지도 제작에 사용될 수 있다. 상기 방법론은 당업자에게 주지되어 있다.
핵산 탐침은 또한 물리 지도에 제작 사용될 수 있다 (즉, 물리 지도상에 서열의 위치 Hoheisel et al. In: Non-mammalian Genomic Analysis: Practical Guide, Academic press 1996, pp. 319-346, 인용된 문헌 참조).
또 다른 구현예에 있어서, 핵산 탐침은 직접적인 형광 인 시투 혼성화 (fluorescence in situ hybridisation, FISH) 지도 제작에 사용될 수 있다 (Trask (1991) Trends Genet. 7:149-154). 비록 현 FISH 지도 제작 방법이 큰 클론에 유리하지만 (수 kb 내지 몇 백 kb; Laan et al. (1995)Genome Res. 5:13-20), 감도가 향상되면 더욱 짧은 탐침으로 FISH 지도 제작이 가능해진다.
유전자지도 및 물리지도 작성을 위한 핵산증폭에 근거한 다양한 방법이 핵산 서열을 사용하여 수행될 수 있다. 예는 대립인자 특이적 증폭 (allele-specific amplification, Kazazian (1989) J. Lab. Clin. Med 11:95-96), CAPS (polymorphism of PCR-amplified fragments; Sheffield 등 (1993) Genomics 16:325-332), 대립인자 특이적 라이게이션 (allele-specific ligation, Landegren 등 (1988) Science 241:1077-1080), 뉴클레오티드 신장 반응 (nucleotide extension reactions, Sokolov (1990) Nucleic Acid Res. 18:3671), Radiation Hybrid Mapping (Walter et al . (1997) Nat. Genet. 7:22-28) 및 Happy Mapping (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807)을 포함한다. 이들 방법을 위해서 증폭 반응 또는 프라이머 연장 반응에 사용하기 위한 프라이머 쌍을 고안하고 제작하기 위해 핵산 서열이 사용된다. 상기 프라이머의 고안은 당업자에게는 주지되어 있다. PCR에 근거한 유전자 지도 제작에 사용하는 방법에서는 핵산 서열에 해당하는 영역에서 교배 양친 간의 DNA 서열 차이를 알 필요가 있다. 그러나 이는 일반적으로 지도제작 방법에는 필요하지 않다.
본 발명의 방법에 따른 방법은 상기에서 기재된 수확량 관련 형질이 향상된 식물을 초래한다. 상기 형질은 또한 추가적인 수확량 향상 형질, 다른 비생물적 및 생물적 스트레스에 대한 내성, 다양한 외형적 특질 및/또는 생화학적 및/또는 생리적 특질을 변형시키는 형질과 같은 다른 경제적으로 유용한 형질과 조합될 수도 있다.
II
.
애넥신
유사(
ANN
:
Annexin
-
like
)
놀랍게도, 애넥신 유사(ANN: Annexin-like) (이후 ANN이라 명명함) 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절이 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 식물을 생산한다는 것이 밝혀졌다. 첫 번째 구현예에 따라, 본 발명은 ANN 폴리펩티드를 암호화하는 핵산의 식물에서 발현의 조절을 포함하는, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
ANN 폴리펩티드를 암호화하는 핵산의 발현을 조절 (바람직하게는, 증가)하는 바람직한 방법은 ANN 폴리펩티드를 암호화하는 핵산의 식물에의 도입 및 발현이다.
이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 ANN 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 ANN 폴리펩티드를 암호화하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산은 (따라서 본 발명의 방법 수행에 유용한) 하기에 기술될 유형의 단백질을 암호화하는 임의의 핵산이며, 이후 또한 "ANN 핵산" 또는 "ANN 유전자"라 칭한다.
본 발명에서 정의된 "ANN 폴리펩티드"는 자연형 (즉, 게놈 내에 암호화된 단백질) 내에 적어도 하나, 바람직하게는 2 개의 또는 그 이상의 하기 보존된 시그너처(signature) 서열을 포함하는 임의의 폴리펩티드를 말한다:
시그너처 서열 1 (서열번호 87):
(A/L/V) (M/V/L/I) (L/V/M/I/C)X(W/F) (I/V/M/T/A) (L/P/Y/M/F) (D/E/S/H) (P/A)X(G/S/E/A)RDA
상기에서 위치 4의 X는 임의의 아미노산일 수 있으며, 바람직하게는 L, S, I, V, Q, 또는 M 중의 하나일 수 있으며; 위치 10의 X는 임의의 아미노산일 수 있으며, 바람직하게는 A, V, P, G, S, T 또는 W 중의 하나일 수 있다.
바람직하게는, 시그너처 서열 1은
(A/L/V) (V/L/I) (L/V/M/I)X(W/F) (V/T/A) (L/Y/M/F) (D/E/S/H) PX (E/A) RDA이다.
시그너처 서열 2 (서열번호 88):
A(F/I/V/C/G)XG(F/R/W/M)G(C/T/V) (D/N) (S/A/T/E)X(T/A/V/L/M) (V/I/L) (I/T)X(I/V/T)L(T/A/G) (H/Q/K) (R/S)
상기에서 위치 3의 X는 임의의 아미노산일 수 있으며, 바람직하게는 K, R, Q, S, E, A 또는 M 중의 하나일 수 있으며; 위치 10의 X는 임의의 아미노산일 수 있으며, 바람직하게는 T, S, K, N, G, D, A, E, Q, 또는 R 중의 하나일 수 있으며; 위치 14의 X는 임의의 아미노산일 수 있으며, 바람직하게는 N, A, R, E, D, S, Q, 중의 하나일 수 있으며,
바람직하게는, 시그너처 서열 2는
A(F/I/V/C/G)XG(W/M)G(T/V) (D/N)EX(A/L/M) (I/L) (I/T)X(I/V/T)L(A/G) (H/Q/K) (R/S)이다.
시그너처 서열 3 (서열번호 89):
(T/S) (D/N/E/T) (D/E/K)XXL(I/T/S/N)R(V/I/A/G) (V/I/F) (V/T/C/S/A) (T/S)R(T/A) (E/D) (I/V/F/L/K/H) (D/S)
상기에서 위치 4의 X는 임의의 아미노산일 수 있으며, 바람직하게는 S, T, D, E, G, W, N, K 중의 하나일 수 있으며; 위치 5의 X는 임의의 아미노산일 수 있으며, 바람직하게는 T, A, S, M, H, D, G, W 중의 하나일 수 있다.
바람직하게는, 시그너처 서열 3은
(T/S) (D/E/T) (D/E/K) XXL (T/S/N)R(V/I/A/G) (V/I/F) (V/T/C/S/A) (T/S)R(T/A) (E/D) (I/V/F/L/K/H) (D/S)이다.
시그너처 서열 4 (서열번호 90):
(Y/H) (F/Y) (A/E/V/S) (K/E/D) (V/A/L/I) (L/V/I) (R/H/D) X (S/A) (M/I/L)
상기에서 위치 8의 X는 임의의 아미노산일 수 있으며, 바람직하게는 K, E, D, T, L, S, Q, R, N, 또는 A 중의 하나일 수 있다.
바람직하게는, 시그너처 서열 4는
(Y/H) (F/Y) (A/E/V/S) (K/E/D) (V/L/I) (L/V/I) (R/D)X(S/A) (I/L)이다.
시그너처 서열 5 (서열번호 91):
(Y/G/K/S) (L/I/M)E(H/E) (D/H) (I/V/L) (G/A/E)
바람직하게는, 시그너처 서열 5는
S(L/I/M)EE(D/H) (I/V/L)A이다.
시그너처 서열 6 (서열번호 92):
(F/L/V/I/T) (I/L/V) (R/Q/Y) (I/V) (F/L/V/I) (T/S/G/A) (E/D/T)RS
바람직하게는, 시그너처 서열 6은
(F/L/V/I/T) (I/L/V) (R/Y) (I/V) (L/V/I) (T/S/G/A) TRS이다.
시그너처 서열 7 (서열번호 93):
Y(R/K/M/E/Q)X(F/T/L/M/I) (L/I) (L/I/V) (S/T/V/A)L(V/I/L/A/M) (G/S)
상기에서 위치 3의 X는 임의의 아미노산일 수 있으며, 바람직하게는 T, D, N, K, S, R, A 중의 하나일 수 있다.
ANN 폴리펩티드는 애넥신에 연관되므로, 본 발명의 방법에 유용한 ANN 폴리펩티드는 바람직하게는 또한, 하나 이상의 애넥신 도메인을 갖는다 (Pfam entry PF00191, SMART entry SM00335, InterPro IPR001464, 도 7 및 7 B).
바람직하게는, 상기 폴리펩티드 서열이 도 8에 도시된 것과 같은 계통수 구축에 사용 시 (Cantero 등, Plant Physiol. Biochem. 44,13-24, 2006), 임의의 다른 그룹보다는 서열번호 84 및 서열번호 135로 나타낸 아미노산 서열을 포함하는 ANN 폴리펩티드의 그룹과 클러스터되는 경향이 있다.
용어 "도메인", "모티프" 및 "시그너처 "는 본 발명의 "정의" 섹션에 정의된 바 있다. 도메인 동정을 위한 전문가 데이터베이스, 예를 들면 SMART (Schultz 등 (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic 등 (2002) Nucleic Acids Res 30, 242- 244), InterPro (Mulder 등, (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo 등, Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman 등, Nucleic Acids Research 30(1): 276-280 (2002))이 존재한다. 단백질 서열의 인 실리코 분석용 도구 세트가 ExPASY 프로테오믹스 서버에서 유용하다 (Swiss Institute of Bioinformatics (Gasteiger 등, ExPASy: proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31: 3784-3788 (2003)). 도메인은 또한 서열 정렬과 같은 통상적인 기술을 사용하여서도 동정될 수 있다.
비교를 위한 서열 정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는 수는 최대로, 공백(gaps)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘을 사용한다. BLAST 알고리즘 (Altschul 등 (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 복수 서열 정렬 알고리즘 (version 1.83)을 사용하여, 디폴트 페어와이즈 정렬 변수(default pairwise alignment parameters) 및 백분율로 스코링(scoring)하는 방법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell 등, BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인이 또한 사용될 수 있다. 서열 동일성 값은 핵산 또는 아미노산 전체 서열에 걸쳐, 또는 선정된 도메인 또는 보존된 모티프(들)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default parameters)를 사용하여 결정될 수 있다.
더욱이, ANN 폴리펩티드 (적어도 자연형)는 전형적으로 칼슘 결합 활성 및 막 결합능을 갖는다. 막 결합 활성을 측정하는 수단 및 기술은 당업계에 주지되어 있으며, 수단 및 기술에는 막 표면 소수성, 소포 누출 또는 소포 유집에 미치는 영향의 측정이 포함된다. 부가하여, ANN 폴리펩티드는 효소 활성을 나타낸다; 예를 들면, 아라비돕시스 탈리아나의 애넥신 1은 페록시다아제 활성을 나타내는 것으로 보고되었다 (Gorecka 등, Biochem. Biophys. Res. Comm. 336, 868-875, 2005). 상세한 내용은 실시예 19에 제시되어 있다.
본 발명은 서열번호 84의 폴리펩티드 서열을 암호화하는, 서열번호 83으로 나타낸 핵산 서열로 식물을 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 ANN-암호화 핵산 또는 ANN 폴리펩티드를 사용하여 유리하게 수행될 수 있다
ANN 폴리펩티드를 암호화하는 핵산의 예는 본 발명의 실시예 14의 표 B1에 제시되어 있다. 제시된 핵산이 본 발명의 방법의 수행에 유용하다. 실시예 14의 표 B1에 제시된 아미노산 서열은 서열번호 84로 표시된 ANN 폴리펩티드의 오쏘로그(orthologue) 및 패럴로그(paralogue)의 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에서 정의된 바 있다. 추가의 오쏘로그 및 패럴로그는 소위 상호간 블라스트(Reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있다. 전형적으로 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 14의 표 B1에 열거된 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열 (조회 서열은 서열번호 83 또는 서열번호 84, 두 번째 BLAST는 따라서 아라비돕시스 탈리아나 서열과 대조하는 것이다)이 유래한 생물체의 서열과 대조하여 BLAST한다 (두 번째 BLAST). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 BLAST back을 하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며 첫 번째 블라스트로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 BLAST back을 하면 가장 높은 hits 중에 조회 서열이 있다.
높은 ranking hits은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 의미있다 (또는 다른 말로, 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에다가, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 다음에 neighbour joining tree가 사용된다.
핵산 변이체도 본 발명의 방법 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 14의 표 B1에 제시된 아미노산 서열 중 임의의 하나의 상동체 및 유도체를 암호화하는 핵산을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 실시예 14의 표 B1에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 암호화하는 핵산도 본 발명의 방법에 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 상당한 동일한 생물학적 및 기능적 활성을 가진다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 ANN 폴리펩티드를 암호화하는 핵산 서열의 일부, ANN 폴리펩티드를 암호화하는 핵산에 혼성화되는 핵산, ANN 폴리펩티드를 암호화하는 핵산 서열의 스플라이스 변이체, ANN 폴리펩티드를 암호화하는 핵산의 대립인자 변이체, 및 유전자 셔플링에 의해 얻은 ANN 폴리펩티드를 암호화하는 핵산의 변이체를 포함한다. 용어 혼성화되는 서열, 스플라이스 변이체, 대립인자 변이체 및 유전자 셔플링은 본 발명에 기재된 바 있다.
본 발명의 방법의 수행은 전장 핵산 서열의 사용에 의존하지 않으므로, ANN 폴리펩티드를 암호화하는 핵산은 전장 핵산일 필요는 없다. 본 발명에서는, 실시예 14의 표 B1에 제시된 핵산 서열 중 임의의 하나의 일부, 또는 실시예 14의 표 B1에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 일부를 식물에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산의 일부분은 예를 들면, 핵산에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 암호화 (또는 비암호화) 서열에 융합될 수도 있다. 다른 암호화 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.
본 발명의 방법에 유용한 일부분은 본 발명에 정의된 ANN 폴리펩티드를 암호화하며, 실시예 14의 표 B1에 제시된 아미노산 서열과 상당한 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 14의 표 B1에 제시된 핵산 중의 임의의 하나의 일부분, 또는 실시예 14의 표 B1에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 400, 450, 500, 550, 600, 650, 700 개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 14의 표 B1에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 14의 표 B1에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 83의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 도 8에 도시된 바와 같은 계통수 구축에 사용 시, 임의의 다른 그룹보다는 서열번호 84 및 서열번호 135로 표시된 아미노산 서열을 포함하는 ANN 그룹과 클러스터되는 경향이 있는 아미노산 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건하에서, 바람직하게는 스트린전트 조건하에서, 본 발명에서 정의된 ANN 폴리펩티드를 암호화하는 핵산, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산이다.
본 발명에 따라, 실시예 14의 표 B1에 제시된 핵산 중 임의의 하나와 혼성화가 가능한 핵산, 또는 실시예 14의 표 B1에 제시된 임의의 핵산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산 서열과 혼성화가 가능한 핵산의 식물에의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 ANN 폴리펩티드를 암호화하며, 실시예 14의 표 B1에 제시된 아미노산 서열과 상당한 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 14의 표 B1에 제시된 핵산 중의 임의의 하나에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 14의 표 B1에 제시된 임의의 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 암호화하는 핵산과 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 83으로 표시된 핵산에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 도 8에 도시된 것과 같은 계통수 구축에 사용 시 임의의 다른 그룹보다 서열번호 84 및 서열번호 135로 표시된 아미노산 서열을 포함하는 ANN 폴리펩티드의 그룹과 클러스터되는 경향이 있는 아미노산 서열을 암호화한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 상기 정의된 ANN 폴리펩티드를 암호화하는 스플라이스 변이체이다.
본 발명에 따라, 실시예 14의 표 B1에 제시된 임의의 핵산의 스플라이스 변이체 또는 실시예 14의 표 B1에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 스플라이스 변이체의 식물에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.
바람직한 스플라이스 변이체는 서열번호 83에 제시된 핵산의 스플라이스 변이체, 또는 서열번호 84의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 스플라이스 변이체이다. 바람직하게는, 스플라이스 변이체에 의해 암호화된 아미노산 서열은 도 8에 제시된 것과 같은 계통수 제작 시 임의의 다른 그룹보다는 서열번호 84 및 서열번호 135로 표시된 아미노산 서열을 포함하는 ANN 폴리펩티드 그룹과 클러스터하는 경향이 있다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 상기 정의된 ANN 폴리펩티드를 암호화하는 핵산의 대립인자 변이체이며, 대립인자 변이체는 본 발명에서 정의된 바 있다.
본 발명에 따라, 실시예 14의 표 B1에 제시된 임의의 핵산의 대립인자 변이체의 식물에의 도입 및 발현, 또는 실시예 4의 표 B1에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 대립인자 변이체의 식물에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 대립인자 변이체는 서열번호 84의 ANN 폴리펩티드 및 실시예 14의 표 B1에 제시된 임의의 아미노산 서열과 상당한 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 83의 대립인자 변이체 또는 서열번호 84의 오쏘로그 또는 패럴로그를 암호화하는 핵산의 대립인자 변이체이다. 바람직하게는, 대립인자 변이체에 의해 암호화되는 아미노산 서열은 도 8과 같은 계통수 구축에 사용 시 임의의 다른 그룹과 보다는 서열번호 84 및 서열번호 135으로 나타낸 아미노산 서열을 포함하는 ANN 폴리펩티드와 클러스터하는 경향이 있다.
유전자 셔플링 또는 방향진화는 또한 상기 정의된 ANN 폴리펩티드를 암호화하는 핵산의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에서 정의된 바 있다.
본 발명에 따라, 실시예 14의 표 B1에 제시된 핵산 서열 중의 임의의 하나의 변이체의 식물에의 도입 및 발현을 포함하는, 또는 실시예 14의 표 B1에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 암호화하는 핵산의 변이체의 식물에의 도입 및 발현을 포함하는 식물에서의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체 핵산은 유전자 셔플링에 의해 얻어진다.
바람직하게는 유전자 셔플링에 의해 얻어진 변이체 핵산에 의해 암호화되는 아미노산 서열은 도 8에 제시된 것과 같은 계통수 구축에 사용 시 임의의 다른 그룹보다 서열번호 84 및 서열번호 135로 표시된 아미노산 서열을 포함하는 ANN 폴리펩티드의 그룹과 클러스터되는 경향이 있다.
더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇가지 방법이 자리지정 돌연변이유발를 달성하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biology. Wiley Eds).
ANN 폴리펩티드를 암호화하는 핵산은 임의의 자연적 또는 인위적인 출처로부터 유래될 수 있다. 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 ANN 폴리펩티드 암호화 핵산은 식물로부터, 더욱 바람직하게는 쌍자엽 식물로부터, 더욱 바람직하게는 십자화과(Brassicaceae)로부터, 가장 바람직하게는 아라비돕시스 탈리아나 유래이다.
본 발명의 방법의 수행은 향상된 수확량 관련 형질을 갖는 식물을 제공한다. 특히 본 발명의 방법의 수행은 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 상세하세 기재되어 있다.
본 발명에서 향상된 수확량 관련 형질에 대한 기준은 (수확 가능한) 지상부 및/또는 (수확 가능한) 지하부를 포함하여 하나 이상의 식물체의 일부분의 생물량(biomass) (중량)의 증가를 의미한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 갖는 식물이 된다.
옥수수를 예로 들면, 수확량 증가는 다음 중의 하나 이상으로 표시된다: 헥타르 또는 에이커당 식물체의 수 증가, 식물체당 이삭 (열매) 수의 증가, 낱알 줄의 수, 줄당 낱알의 수, 낱알 중량, 천립중량, 열매 길이/직경의 증가, 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가. 벼를 예로 들면, 수확량 증가는 다음 중의 하나 이상의 증가로 표시된다: 헥타르 또는 에이커당 식물체의 수, 식물체당 원추화서의 수, 원추화서당 작은 이삭의 수, 원추화서당 소화의 수 (일차 원추화서에 대한 충만된 종자의 수의 비율로 표시된다), 종자 충만도 (충만된 종자 수/전체 종자 수 x 100)의 증가, 천립중량의 증가.
본 발명은 대조구 식물에 비하여 수확량을, 특히 식물의 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 ANN 폴리펩티드를 암호화하는 핵산의 식물에서의 발현을 조절하여, 바람직하게는 발현을 증가시키는 것을 포함한다.
본 발명에 따른 형질전환 식물은 수확량이 증가하므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 증가된 생장 속도를 나타낼 것 같다 (생활사 중 적어도 일부에서).
증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 상당한 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 건조된 성숙된 종자로부터 식물체가 출발 물질과 유사한 건조된 성숙한 종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 증가된 생장 속도는 식물의 생활사 중의 하나 이상의 단계에서 또는 상당한 전체 식물 생활사 중에 나타날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가하면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가하면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 에이커당 년간 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 임의의 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에(초기 시기) 또는 수확기에(후기 시기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키는 방법을 제공하며, 상기 방법은 본 발명에 정의된 ANN 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 조절, 바람직하게는 발현의 증가를 포함한다.
식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 스트레스에 노출되든지 간에 수확량 및/또는 생장 속도의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건하의 대조구 식물에 비하여 40%, 35% 또는 30% 미만, 바람직하게는 25%, 20% 또는 15% 미만, 더욱 바람직하게는 14%, 13%, 12%, 11% 또는 10% 미만이다. 실제로는 농업상의 진척 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 순한 스트레스는 식물이 노출되는 매일의 생물적 및/또는 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 결빙 온도에 의한 것이다. 비생물적 스트레스는 수분 스트레스 (특히 가뭄으로 인한)로 인한 삼투 스트레스, 염분 스트레스, 산화적 스트레스 또는 이온 스트레스이다. 생물적 스트레스는 전형적으로 세균, 바이러스, 진균 및 곤충과 같은 병원균에 의해 야기된 스트레스이다.
특히, 본 발명의 방법은 대조구 식물에 비하여 증가된 수확량을 갖는 식물을 제공하기 위하여, 스트레스가 없는 조건하에서 또는 순한 가뭄 조건하에서 수행될 수 있다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. Rabbani 등 (Plant Physiol (2003) 133: 1755-1767)은 특히 가뭄 스트레스와 고염도 스트레스 간에 고도의 "혼선"을 기재하고 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 이들 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다. 본 발명에서 사용된 용어 "스트레스가 없는" 조건은 식물의 최적 생장을 허용하는 환경 조건이다. 당업자는 주어진 위치에서 정상적인 토양 조건 및 기후 조건을 인식하고 있다.
본 발명의 방법의 수행으로 스트레스가 없는 조건하에서 또는 순한 가뭄 스트레스 조건하에서 자란 식물이 비교되는 조건하에서 자란 적절한 대조구 식물에 비해 수확량이 증가된다. 따라서, 본 발명에 따라 스트레스가 없는 조건하에서 또는 순한 가뭄 스트레스 조건하에서 키운 식물의 수확량을 증가시키는 방법을 제공하며, 상기 방법은 ANN 폴리펩티드를 암호화하는 핵산의 식물에서의 발현의 증가를 포함한다.
본 발명의 방법 수행은 양분결핍 조건 하에서, 특히 질소 결핍 조건 하에서 키운 식물이 동등한 조건 하에서 키운 대조구 식물에 비하여 증가된 수확량을 갖게 한다. 따라서, 본 발명에 있어서 양분결핍 조건 하에서 키운 식물의 수확량을 증가시키는 방법을 제공하며, 그 방법은 ANN 폴리펩티드 암호화 핵산의 식물에서의 발현을 증가시키는 것을 포함한다. 양분결핍은 무엇보다도 질소, 인산염 및 다른 인-함유 화합물, 칼륨, 칼슘, 카드뮴, 마그네슘, 망간, 철 및 붕소 같은 양분의 부족의 결과이다.
본 발명은 또한 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그의 일부분 (종자 포함)을 포함한다. 식물 또는 그의 일부분은 상기 정의된 ANN 폴리펩티드를 암호화하는 핵산 트랜스진을 포함한다.
본 발명은 또한 ANN 폴리펩티드를 암호화하는 핵산의 식물로의 도입 및/또는 발현을 하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물로의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 유용한 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
보다 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(a) 상기 정의된 ANN 폴리펩티드를 암호화하는 핵산;
(b) (a)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로
(c) 전사 종결 서열.
바람직하게는, ANN 폴리펩티드를 암호화하는 핵산은 상기 정의된 바와 같다. 용어 "조절 서열" 및 "전사 종결 서열"은 본 발명에서 정의된 바와 같다.
식물은 상기 기재된 임의의 핵산을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 잘 알고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동가능하게 연결된다.
유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 추진하기 위하여 사용될 수 있다. 구성적 프로모터가 본 발명의 방법에 유용한 특히 유용하다. 다양한 유형의 프로모터에 관해 "정의"에 정의되어 있다. 또한 본 발명의 방법에 유용한 것은 녹색 조직 특이적 프로모터이다.
본 발명의 적용범위가 서열번호 83으로 표시된 ANN 폴리펩티드 암호화 핵산에만 제한된 것이 아니며, 본 발명의 적용범위가 구성적 프로모터에 의한 구동 시, 또는 녹색 조직 특이적 프로모터에 의한 구동 시 ANN 폴리펩티드 암호화 핵산의 발현에 제한된 것이 아님은 분명하다.
구성적 프로모터는 바람직하게는 GOS2 프로모터, 더욱 바람직하게는 벼 GOS2 프로모터이다. 더 바람직하게는 구성적 프로모터는 사실상 서열번호 94에 유사한 핵산서열로 표시된 것이고, 가장 바람직하게는 구성적 프로모터는 서열번호 94로 표시된 것이다. 구성적 프로모터의 추가의 예는 본 발명의 "정의" 섹션의 표 2a에 있다.
본 발명의 또 다른 바람직한 특징에 있어서, ANN 폴리펩티드를 암호화하는 핵산은 녹색 조직 특이적 프로모터에 작동가능하게 연결된다. 녹색 조직 특이적 프로모터는 바람직하게는 익스팬신(expansin) 프로모터, 더욱 바람직하게는 벼 유래 익스팬신(expansin) 프로모터, 더욱 바람직하게는 서열번호 95에 사실상 유사한 핵산서열로 표시된 녹색 조직 특이적 프로모터, 가장 바람직하게는 서열번호 95로 표시된 녹색 조직 특이적 프로모터이다. 녹색 조직 특이적 프로모터의 추가적인 예는 본 발명 "정의" 섹션의 표 2g에 있다.
선택적으로, 하나 이상의 종결신호 서열이 식물에 도입된 구축물에 사용될 수 있다. 부가적인 조절 인자는 해독뿐 아니라 전사 인핸서를 포함한다. 본 발명을 수행함에 있어 사용하기에 적절한 종결신호 및 인핸서 서열이 당업자에게 공지되어 있다. 세포질 내에 축적되는 성숙한 메시지의 양 증가를 위하여 "정의" 섹션에 기재된 바와 같이 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 암호화 서열에 첨가될 수 있다. 다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.
본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제 서열의 원점을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.
본 발명의 방법에 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다.
식물 세포로 핵산의 안정적인 또는 일시적인 통합 시, 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 암호화하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 암호화하는 핵산분자는 본 발명의 또는 본 발명의 방법에 사용된 폴리펩티드를 암호화하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산으로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다). 마커 유전자는 형질전환 세포에서 더 이상 필요하지 않으면 절단되거나 제거될 수 있다. 마커 유전자 제거 기술은 당업계에 공지되어 있으며, 상기 정의 섹션에 기재되어 있다.
본 발명은 상기에서 정의된 ANN 폴리펩티드를 암호화하는 핵산의 식물에서의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 형질전환 식물을 제조하는 방법을 제공한다.
더욱 상세하게, 본 발명은 증가된 향상된 수확량 관련 형질, 특히 증가된 종자 수확량을 가진 형질전환 식물을 제조하는 방법을 제공하며, 상기 방법은 하기를 포함한다:
(i) ANN 폴리펩티드를 암호화하는 핵산을 식물 또는 식물 세포에의 도입 및 발현 및
(ii) 식물의 생장 및 발달을 촉진하는 조건하에서 식물 세포를 배양.
상기 (i)의 핵산은 본 발명에서 정의된 ANN 폴리펩티드를 암호화할 수 있는 임의의 핵산일 수 있다.
상기 핵산은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 핵산은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다.
일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 암호화되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.
DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 두 기술은 당업자에게 주지되어 있다.
생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다. 생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현 카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 ANN 폴리펩티드를 암호화하는 분리된 핵산을 포함하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 식물 세포이다. 본 발명의 방법에 사용된 핵산 또는 벡터, 발현 카세트 또는 구축물 또는 벡터에 대한 숙주 식물은 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한, 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에 적용될 수 있다. 본 발명의 방법에 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다. 본 발명의 바람직일 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 대두, 해바라기, 캐놀라, 알팔파, 유채, 목화, 토마토, 감자 및 담배를 포함한다. 더욱 바람직하게는, 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다. 더욱 바람직하게는 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 라이밀, 호밀, 수수 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 지하경, 괴경 및 인경 같은 식물의 수확 가능한 부분에까지 확장되나, 이 부분에 제한되지는 않는다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 식물의 수확 가능한 부분으로부터 바람직하게는 직접적으로 유래된 생산물에 관련된다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문헌화되어 있으며, 정의 섹션에 예가 제시되어 있다.
상기 언급된 바와 같이, ANN 폴리펩티드를 암호화하는 핵산의 발현을 조절하는, 바람직하게는 증가시키는 바람직한 방법은 ANN 폴리펩티드를 암호화하는 핵산의 식물로의 도입 및 발현이나 상기 방법의 효과는 즉, 수확량 관련 형질을 향상시키는 방법은 T-DNA 활성화 태깅, 틸링(TILLING), 상동 재조합을 포함하여 다른 잘 알려진 기술을 사용하여 행할 수도 있으며, 이에 제한되지 않는다. 상기 기술은 정의 섹션에 기재되어 있다.
본 발명은 또한 본 발명에 기재된 ANN 폴리펩티드를 암호화하는 핵산의 용도, 및 식물의 임의의 전술한 수확량 관련 형질을 향상시키는 상기 ANN 폴리펩티드의 용도를 포함한다.
본 발명에서 기재된 ANN 폴리펩티드를 암호화하는 핵산, 또는 ANN 폴리펩티드 그 자체는 ANN 폴리펩티드 암호화 유전자에 유전적으로 연결된 DNA 마커가 동정된 육종 프로그램에 용도가 있다. 핵산/유전자, 또는 ANN 폴리펩티드 그 자체는 분자 마커를 정의하는데 사용될 수 있다. 이 DNA 또는 단백질 마커는 상기 본 발명의 방법에 정의된 향상된 수확량 관련 형질을 갖는 식물을 선발하는 육종 프로그램에 사용된다.
ANN 폴리펩티드 암호화 핵산/유전자의 대립인자 변이체는 또한 마커 보조 육종 프로그램에 사용된다. 상기 육종 프로그램은 때때로 예를 들면, EMS 돌연변이 유발을 사용하여 식물에 돌연변이 유발 처리로 대립인자 변이의 도입을 필요로 하며 다르게는, 그 프로그램은 자연발생적으로 생성된 "자연적인" 대립인자 변이체의 수집물로부터 시작될 수도 있다. 그러면 대립인자 변이체의 동정은 예를 들면, PCR로 한다. 문제되는 서열의 증가된 수확량을 제공하는 우수한 대립인자 변이체의 선발 단계가 잇따른다. 선발은 전형적으로 문제되는 서열의 다른 대립인자 변이체를 함유하는 식물의 생장 능력을 관찰함으로써 이루어진다. 생장 능력은 온실 또는 야외에서 관찰할 수 있다. 추가적으로 선택 가능한 단계는 우수한 대립인자 변이체가 동정된 식물과 또 다른 식물의 교배를 포함한다. 이는 예를 들면, 관심을 유발하는 표현형적 특징의 조합을 만드는데 사용될 수 있다.
ANN 폴리펩티드 암호화 핵산은 또한 이 유전자에 대한 유전자 및 물리지도 제작용 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다. 상기 ANN 폴리펩티드 암호화 핵산 사용에는 적어도 길이 15 뉴클레오티드의 핵산 서열만이 필요하다. ANN 폴리펩티드 암호화 핵산은 RFLP (restriction fragment length polymorphism) 마커로 사용될 수 있다. 제한효소 절단된 식물 게놈 DNA의 서던 블럿 (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, Laboratory Manual)에 ANN 폴리펩티드 암호화 핵산이 프로브로 사용된다. 결과로 나온 밴드 분포 양상으로 유전자지도 제작을 위하여 MapMaker (Lander et al. (1987) Genomics 1: 174-181) 같은 컴퓨터 프로그램을 사용하여 유전적 분석을 하게 된다. 또한, 핵산 서열은 제한된 유전적 교배의 양친 및 자손을 포함하는 개체들의 제한 효소 처리된 게놈 DNAs의 서던 블럿에 탐침으로 사용될 수 있다. DNA 다형의 분리를 기록하여, 이 집단을 이용하여 이전에 얻었던 유전자 지도상에 ANN 폴리펩티드 암호화 핵산의 위치 계산에 사용한다 (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
유전자 지도 제작에 사용하기 위한 식물 유전자 유래 탐침의 생산 및 사용은 [Bematzky and Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41]에 기재되어 있다. 수많은 공개문헌이 상기 개설된 방법론 또는 이의 변형을 사용하여 특정 cDNA 클론의 유전자 지도 제작을 기술한다. 예를 들면, F2 이종교배 개체군, 역교배 개체군, 무작위 교배 개체군, 근동질유전자계통, 및 다른 세트의 개체가 유전자 지도 제작에 사용될 수 있다. 상기 방법론은 당업자에게 주지되어 있다.
핵산 탐침은 또한 물리 지도에 제작 사용될 수 있다 (즉, 물리 지도상에 서열의 위치; Hoheisel et al. In: Non-mammalian Genomic Analysis: Practical Guide, Academic press 1996, pp. 319-346, 인용된 문헌 참조).
또 다른 구현예에 있어서, 핵산 탐침은 직접적인 형광 인 시투 혼성화 (fluorescence in situ hybridisation, FISH) 지도 제작에 사용될 수 있다 (Trask (1991) Trends Genet. 7:149-154). 비록 현 FISH 지도 제작 방법이 큰 클론에 유리하지만 (수 kb 내지 몇 백 kb; Laan et al. (1995) Genome Res. 5: 13-20), 감도가 향상되면 더욱 짧은 탐침으로 FISH 지도 제작이 가능해진다.
유전자지도 및 물리지도 작성을 위한 핵산증폭에 근거한 다양한 방법이 핵산 서열을 사용하여 수행될 수 있다. 예는 대립인자 특이적 증폭 (allele-specific amplification, Kazazian (1989) J. Lab. Clin. Med 11:95-96), CAPS (polymorphism of PCR-amplified fragments; Sheffield 등 (1993) Genomics 16:325-332), 대립인자 특이적 라이게이션 (allele-specific ligation, Landegren 등 (1988) Science 241:1077-1080), 뉴클레오티드 신장 반응 (nucleotide extension reactions, Sokolov (1990) Nucleic Acid Res. 18:3671), Radiation Hybrid Mapping (Walter et al . (1997) Nat. Genet. 7:22-28) 및 Happy Mapping (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807)을 포함한다. 이들 방법을 위해서 증폭 반응 또는 프라이머 연장 반응에 사용하기 위한 프라이머 쌍을 고안하고 제작하기 위해 핵산 서열이 사용된다. 상기 프라이머의 고안은 당업자에게는 주지되어 있다. PCR에 근거한 유전자 지도 제작에 사용하는 방법에서는 핵산 서열에 해당하는 영역에서 교배 양친 간의 DNA 서열 차이를 알 필요가 있다. 그러나 이는 일반적으로 지도제작 방법에는 필요하지 않다.
본 발명의 방법에 유용한 따라, 대조구 식물에 비해 상기에서 기재된 수확량 관련 형질이 향상된 식물이 초래된다. 상기 형질은 또한 추가적인 수확량 향상 형질, 다른 비생물적 및 생물적 스트레스에 대한 내성, 다양한 외형적 특질 및/또는 생화학적 및/또는 생리적 특질을 변형시키는 형질과 같은 다른 경제적으로 유용한 형질과 조합될 수도 있다.
조항
1. 2-Cys PRX(2- Cysteine peroxiredoxin)를 암호화하는 핵산 서열의 식물 뿌리에서의 발현을 조절하는, 바람직하게는 증가시키는 단계 및 선택적으로 증가된 수확량을 갖는 식물을 선발하는 단계를 포함하는 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법으로서, 상기 2-Cys PRX 폴리펩티드는 N-말단으로부터 C-말단으로: (1) 색소체 운반 펩티드(transit peptide); 및 (2) 2-Cys PRX 도메인을 포함하는 것을 특징으로 하는 방법.
2. 조항1에 있어서, 상기 2-Cys PRX 폴리펩티드는 부가적으로 하기 중 하나 또는 양자를 포함하는 것을 특징으로 하는 방법:
(i) 서열번호 77로 표시된 모티프 1, 또는 서열번호 77에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 아미노산 서열 동일성을 갖는 모티프; 또는
(ii) 서열번호 78로 표시된 모티프 2, 또는 서열번호 78에 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 아미노산 서열 동일성을 갖는 모티프.
3. 조항1 또는 조항2에 있어서, 상기 2-Cys PRX 폴리펩티드는, 도 3에 도시된 것과 같은 계통수 구축에 이용 시, 임의의 다른 PRX 클레이드(clade)보다는 서열번호 2로 표시된 폴리펩티드 서열을 포함하는 2-Cys PRX 폴리펩티드 클레이드와 클러스터되는 경향이 있는 것을 특징으로 하는 방법.
4. 조항1 내지 조항3 중 어느 한 조항에 있어서, 상기 2-Cys PRX 폴리펩티드는 서열번호 2로 표시된 2-Cys PRX 폴리펩티드 또는 본 발명의 표 A1에 제시된 임의의 폴리펩티드 서열에 증가하는 순으로 선호되는 적어도 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 폴리펩티드인 것을 특징으로 하는 방법.
5. 조항1 내지 조항4 중 어느 한 조항에 있어서, 상기 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열은 표 A1에 제시된 핵산 서열 중 임의의 하나로 표시되거나, 또는 이의 부분, 또는 표 A1에 제시된 핵산 서열 중 임의의 하나와 혼성화할 수 있는 서열인 것을 특징으로 하는 방법.
6. 조항1 내지 조항5 중 어느 한 조항에 있어서, 상기 핵산 서열은 표 A1에 제시된 임의의 폴리펩티드의 오쏘로그(orthologue) 또는 패럴로그(paralogue)를 암호화하는 것을 특징으로 하는 방법.
7. 조항1 내지 조항6 중 어느 한 조항에 있어서, 상기 조절된 바람직하게는 증가된 발현은 T-DNA 활성화 태킹, TILLING, 또는 상동 재조합의 임의의 하나 이상에 의해 수행되는(effected) 것을 특징으로 하는 방법.
8. 조항1 내지 조항7 중 어느 한 조항에 있어서, 상기 조절된 바람직하게는 증가된 발현은 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 식물 뿌리에 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
9. 조항1 내지 조항8 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 하기 중 하나 이상인 것을 특징으로 하는 방법:
(i) 향상된 초기 활력; (ii) 증가된 지상부 생물량(biomass); (iii) 증가된 뿌리 생물량(biomass); (iv) 원추화서당 증가된 꽃의 수; (v) 증가된 종자 충만율(fill rate); (vi) 식물체당 증가된 총 종자 수확량; (vii) 증가된 (충만된) 종자 수; (viii) 증가된 수확 지수; 또는 (ix) 증가된 천립당 중량 (TKW).
10. 조항1 내지 조항9 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 비생물적 스트레스 조건하에서 얻어진 것을 특징으로 하는 방법.
11. 조항10에 있어서, 상기 비생물적 스트레스는 하나 이상의 수분 스트레스, 염 스트레스, 산화적 스트레스 및 이온 스트레스로부터 선택된 삼투 스트레스로서, 바람직하게는 상기 수분 스트레스는 가뭄 스트레스 및/또는 감소된 양분 이용성(availability)이며, 바람직하게는 감소된 질소 이용성인 것을 특징으로 하는 방법.
12. 조항10 또는 조항11에 있어서, 상기 비생물적 스트레스 내성은 하기 중 하나 이상으로부터 선택된 향상된 수확량 관련 형질로서 나타나는 것을 특징으로 하는 방법: 대조구 식물에 비해 각각 (i) 향상된 초기 활력; (ii) 증가된 지상부 생물량(biomass); (iii) 증가된 뿌리 (굵은 및 가는) 생물량(biomass); (iv) 원추화서당 증가된 꽃의 수; (v) 증가된 종자 충만율; (vi) 식물체당 증가된 총 종자 수확량; (vii) 증가된 (충만된) 종자 수; (viii) 증가된 수확 지수; 또는 (ix) 증가된 천립당 중량 (TKW).
13. 조항8 내지 조항12 중 어느 한 조항에 있어서, 상기 핵산 서열은 뿌리 특이적 프로모터에, 바람직하게는 RCc3 프로모터에, 더욱 바람직하게는 서열번호 80에 실질적으로 유사한 RCc3 프로모터에, 가장 바람직하게는 서열번호 80으로 표시된 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
14. 조항1 내지 조항13 중 어느 한 조항에 있어서, 상기 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열은 식물 유래이며, 바람직하게는 쌍자엽 식물 유래이며, 더욱 바람직하게는 십자화과(Brassicaceae) 유래이며, 가장 바람직하게는 브라시카 라파(Brassica rapa) 유래인 것을 특징으로 하는 방법.
15. 뿌리 특이적 프로모터에 작동가능하게 연결된, 2-Cys PRX 폴리펩티드를 암호화하는 핵산 외래도입유전자(transgene)를 포함하는 것을 특징으로 하는, 조항1 내지 조항14 중 어느 한 조항에 따른 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.
16. 하기를 포함하는 구축물로서:
(a) 조항1 내지 조항6 중 어느 한 조항에 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산;
(b) (a)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로
(c) 전사 종결 서열;
상기 조절 서열 중 적어도 하나는 뿌리 특이적 프로모터, 바람직하게는 Rcc3 프로모터인 것을 특징으로 하는 구축물.
17. 대조구 식물에 비해 향상된 수확량 관련 형질을 가진 식물을 생산하기 위한 방법에 있어, 조항16에 따른 구축물의 용도로서, 상기 향상된 수확량 관련 형질은 바람직하게는 하기 중 하나 이상인 것을 특징으로 하는 용도:
(i) 향상된 초기 활력; (ii) 증가된 지상부 생물량(biomass); (iii) 증가된 뿌리 (굵은 및 가는) 생물량(biomass); (iv) 원추화서당 증가된 꽃의 수; (v) 증가된 종자 충만율; (vi) 식물체당 증가된 총 종자 수확량; (vii) 증가된 (충만된) 종자 수; (viii) 증가된 수확 지수; 또는 (ix) 증가된 천립당 중량 (TKW).
18. 조항16에 따른 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
19. 하기 단계를 포함하는 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는 형질전환 식물의 제조 방법:
(i) 뿌리 특이적 프로모터의 조절하에서 조항1 내지 조항5 중 어느 조항에 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열을 식물, 식물의 일부 또는 식물 세포에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
20. 조항19에 있어서, 상기 향상된 수확량 관련 형질이 증가된 비생물적 스트레스 조건하에서 발생하는 것을 특징으로 하는 방법.
21. 조항1 내지 조항6 중 어느 조항에 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 조절된, 바람직하게는 증가된 발현으로 인해, 대조구 식물에 비하여 향상된 수확량 관련 형질을 가진 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포 또는 식물의 일부.
22. 조항15, 조항18, 또는 조항21에 있어서, 상기 식물이 작물 식물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호밀, 라이밀, 수수 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포 또는 식물의 일부.
23. 수확 가능한 부분이 바람직하게는 종자인 것을 특징으로 하는, 조항22에 따른 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열을 포함하는 식물의 수확 가능한 부분.
24. 조항22에 따른 식물 및/또는 조항23에 따른 식물의 수확 가능한 부분 유래의 산물.
25. 대조구 식물에 비해 식물에서 수확량 관련 형질의 향상을 위한, 바람직하게는 하기 중 하나 이상의 증가를 위한 조항1 내지 조항6 중 어느 조항에 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 용도:
(i) 증가된 종자 충만율; (ii) 식물체당 증가된 총 종자 수확량; (iii) 충만된 종자의 증가된 수; (iv) 증가된 총 종자 수; (v) 증가된 천립당 중량 (TKW) 또는 (vi) 증가된 수확 지수.
26. 조항25에 있어서, 상기 향상된 수확량 관련 형질이 비생물적 스트레스 조건 하에서 발생하는 것을 특징으로 하는 용도.
27. ANN 폴리펩티드를 암호화하는 핵산의 식물에서의 발현 조절을 포함하는, 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법으로서, 상기 ANN 폴리펩티드는 하기 모티프 중 하나 이상을 포함하는 것을 특징으로 하는 방법:
(i) 시그너처 서열 1 (서열번호 87),
(ii) 시그너처 서열 2 (서열번호 88),
(iii) 시그너처 서열 3 (서열번호 89),
(iv) 시그너처 서열 4 (서열번호 90),
(v) 시그너처 서열 5 (서열번호 91),
(vi) 시그너처 서열 6 (서열번호 92),
(vii) 시그너처 서열 7 (서열번호 93).
28. 조항27에 있어서, 상기 ANN 폴리펩티드는 적어도 애넥신(annexin) 도메인을 포함하는 것을 특징으로 하는 방법.
29. 조항27 또는 조항28에 있어서, 상기 조절된 발현은 ANN 폴리펩티드를 암호화하는 핵산의 식물에서의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
30. 조항27 내지 조항29 중 어느 한 조항에 있어서, 상기 ANN 폴리펩티드를 암호화하는 핵산은 표 B1에 제시된 단백질 중 임의의 하나를 암호화하거나, 또는 상기 핵산의 일부분, 또는 상기 핵산과 혼성화할 수 있는 핵산인 것을 특징으로 하는 방법.
31. 조항27 내지 조항30 중 어느 한 조항에 있어서, 상기 핵산 서열은 표 B1에 제시된 임의의 단백질의 오쏘로그(orthologue) 또는 패럴로그(paralogue)를 암호화하는 것을 특징으로 하는 방법.
32. 조항27 내지 조항31 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비해 증가된 수확량, 바람직하게는 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
33. 조항27 내지 조항32 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건하에서 얻어지는 것을 특징으로 하는 방법.
34. 조항27 내지 조항33 중 어느 한 조항에 있어서, 상기 향상된 수확량 관련 형질은 가뭄 조건하에서 얻어지는 것을 특징으로 하는 방법.
35. 조항29 내지 조항34 중 어느 한 조항에 있어서, 상기 핵산은 구성적(constitutive) 프로모터에, 바람직하게는 GOS2 프로모터에, 가장 바람직하게는 벼의 GOS2 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
36. 조항29 내지 조항34 중 어느 한 조항에 있어서, 상기 핵산은 녹색 조직 특이적 프로모터에, 바람직하게는 익스팬신(expansin) 프로모터에, 가장 바람직하게는 벼의 익스팬신 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
37. 조항27 내지 조항36 중 어느 한 조항에 있어서, 상기 ANN 폴리펩티드를 암호화하는 핵산은 식물 유래이며, 바람직하게는 쌍자엽 식물 유래이며, 더욱 바람직하게는 십자화과(Brassicaceae) 유래이며, 더 더욱 바람직하게는 아라비돕시스(Arabidopsis) 속 유래이며, 가장 바람직하게는 아라비돕시스 탈리아나(Arabidopsis thaliana ) 유래인 것을 특징으로 하는 방법.
38. ANN 폴리펩티드를 암호화하는 재조합 핵산을 포함하는 것을 특징으로 하는, 조항27 내지 조항37 중 어느 한 조항의 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.
39. 하기를 포함하는 구축물:
(i) 조항27 또는 조항28에 정의된 ANN 폴리펩티드를 암호화하는 핵산;
(ii) (i)의 핵산 서열의 발현을 이끌 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
40. 조항39에 있어서, 상기 조절 서열은 구성적 프로모터, 바람직하게는 GOS2 프로모터, 가장 바람직하게는 벼의 GOS2 프로모터인 것을 특징으로 하는 구축물.
41. 조항39에 있어서, 상기 조절 서열은 녹색 조직 특이적 프로모터, 바람직하게는 익스팬신(expansin) 프로모터, 가장 바람직하게는 벼의 익스팬신(expansin) 프로모터인 것을 특징으로 하는 구축물.
42. 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량(biomass) 및/또는 증가된 종자 수확량을 갖는 식물을 생산하는 방법에 대한 조항39 내지 조항41 중 어느 한 조항에 따른 구축물의 용도.
43. 조항39 내지 조항41 중 어느 한 조항에 따른 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
44. 하기 단계를 포함하는, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 조항27 또는 조항28에서 정의된 ANN 폴리펩티드를 암호화하는 핵산을 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
45. 조항27 또는 조항28에서 정의된 ANN 폴리펩티드를 암호화하는 핵산의 증가된 발현으로 인하여 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래한 형질전환 식물 세포.
46. 조항38, 조항43 또는 조항45에 있어서, 상기 식물은 작물 식물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호밀, 라이밀, 수수 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래한 형질전환 식물 세포.
47. 수확 가능한 부분이 바람직하게는 종자인 것을 특징으로 하는, 조항46에 따른 식물의 수확 가능한 부분.
48. 조항46에 따른 식물 및/또는 조항47에 따른 식물의 수확 가능한 부분 유래의 산물.
49. 대조구 식물에 비하여 식물에서 수확량을 증가, 특히 종자 수확량을 증가시키기 위한 ANN 폴리펩티드를 암호화하는 핵산의 용도.
도 1은 Rhee 등 (2005, Free radical Biology and Medicine 38: 1543-1552)에 따른 2-Cys Prx 효소의 촉매 및 불활성화/재활성화 사이클을 나타낸다.
도 2는 서열번호 2로 나타낸 2-Cys PRX로 NCBI에서의 보존된 도메인 데이터베이스 (CDD: Conserved Domains Database) 탐색 (default 값 사용) 결과를 나타낸다. 최고 hit entry는 CD3015, PRX_Typ2cys이다.
도 3은 진정세균, 식물 조류, 동물의 2-Cys PRX, 및 식물의 1-Cys PRX의 ClustalW (1.83) 복수 서열 정렬 후 neighbour joining 클러스터링 방법을 사용하여 수립된 계통수를 보여준다. 2-Cys PRX 클래스는 괄호로 묶어 표시하였다. 서열번호 2로 나타낸 2-Cys PRX는 박스로 표시하였다.
도 4는 진정세균, 식물 조류, 동물의 2-Cys PRX, 및 식물의 1-Cys PRX의 ClustalW (1.83) 복수 서열 정렬을 보여준다. 서열번호 77로 나타낸 모티프 1 및 서열번호 78로 나타낸 모티프 2는 박스로 표시하였다.
도 5는 벼 GOS2 프로모터 (pGOS2; 서열번호 79) 또는 벼 Rcc3 프로모터 (pRcc3; 서열번호 80)의 조절 하에서 2-Cys PRX 암호화 핵산 서열의 벼(Oryza sativa)에서의 증가된 발현을 위한 바이너리 벡터를 보여준다.
도 6은 본 발명에 따른 방법의 수행에 유용한 서열의 상세한 예이다.
도 7 A는 SMART에 의해 예측된 애넥신 도메인이 밑줄친 볼드체로 표시되어 있는 서열번호 84를 나타내며; 도 7 B는 아라비돕시스 탈리아나 애넥신 4 (서열번호 135)의 애넥신 도메인 (SMART에 의해 예측)을 보여준다.
도 8은 본 발명의 방법에 유용한 식물 애넥신 단백질의 계통수 (Cantero 등, Plant Physiol. Biochem. 44, 13-24, 2006)를 보여준다. 화살표는 아라비돕시스 탈리아나 유래의 애넥신 1 (서열번호 84) 및 애넥신 4 (서열번호 135)를 나타낸다.
도 9는 다양한 식물 애넥신 단백질의 복수 정렬을 나타낸다. 식별자는 데이터베이스 accessions을 의미한다; NP_174810는 서열번호 84에 해당한다. 보존된 잔기는 콜론 또는 점으로 표시되었다.
도 10은 벼 GOS2 프로모터 (pGOS2)의 조절 하에서 ANN 암호화 핵산의 벼(Oryza sativa)에서의 증가된 발현을 위한 바이너리 벡터를 보여준다.
도 11은 본 발명에 따른 방법의 수행에 유용한 서열의 상세한 예이다.
본 발명은 단지 예시인 하기 실시예를 참고하여 기재될 것이다. 하기 실시예는 본 발명의 범위를 완전히 한정하거나 제한할 의도는 아니다.
DNA 조작: 달리 언급되지 않는 한, 재조합 DNA 기술은 Sambrook (2001, Molecular Cloning: laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) 또는 Ausubel 등 (1994, Current Protocols in Molecular Biology, Current Protocols의 Volumes 1 및 2)에 기재된 표준 프로토콜에 따라 수행되었다. 식물 분자작업에 대한 표준 재료 및 방법은 Plant Molecular Biology Labfax (1993, by R.D.D. Croy, published by BIOS Scientific Publications Ltd (UK) 및 Blackwell Scientific Publications (UK))에 기재되어 있다.
실시예 1: 본 발명의 방법에 사용된 핵산 서열에 연관된 서열의 동정
본 발명의 방법에 사용된 핵산 서열에 연관된 서열 (전장 cDNA, ESTs 또는 게놈)이 Basic Local Alignment Tool (BLAST) 같은 데이터베이스 서열 탐색 도구를 사용하여 National Center for Biotechnology Information (NCBI)의 Entrez 뉴클레오티드 데이터베이스 (Altschul et al. (1990) J. Mol. Biol. 215:403-410; 및 Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동 정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터 베이스에 비교하거나 필적하는 것의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 본 발명에서 사용된 핵산 서열에 의해 암호화된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수 도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 A1는 본 발명의 방법에 사용된 핵산 서열에 연관된 핵산 서열의 목록이다.
표 A1 : 2-Cys PRX 핵산 및 폴리펩티드 서열의 예:
종 | 핵산 서열 NCBI 등록번호 | 서열번호 | 폴리펩티드 서열 NCBI 등록번호 | 서열번호 |
Brassica sp . | 서열번호 1 | 1 | 서열번호 2 | 2 |
Brassica rapa | AF052202.1 | 3 | AAF00001.1 | 4 |
Arabidopsis thaliana | AY086974.1 | 5 | AAM64537.1 | 6 |
Brassica napus | AF311863.1 | 7 | AAG30570.1 | 8 |
Arabidopsis thaliana | NM_120712.2 | 9 | AAM62760.1 | 10 |
Spinacia oleracea | X94219.1 | 11 | O24364 | 12 |
Nicotiana tabacum | AJ309009.2 | 13 | CAC84143.2 | 14 |
Phaseolus vulgaris | AJ288895.1 | 15 | CAC17803.1 | 16 |
Pisum sativum | AJ315851.1| | 17 | CAC48323.1 | 18 |
Oryza sativa | NM_001053585.1 | 19 | NP_001047050.1 Os02g0537700 | 20 |
Secale cereale | AF076920.1 | 21 | AAC78473.1 | 22 |
Riccia fluitans | AJ005006.1 | 23 | CAB82860.1 | 24 |
Chlamydomonas incerta | DQ122920.1 | 25 | ABA01151.1 | 26 |
Nostoc | gi|17227497:5544705-5545316 | 27 | NP_488681.1 | 28 |
Synechococcus sp | gi|86607503:2357237-2357845 | 29 | YP_478458.1 | 30 |
Nodularia spumigena | gi|119509627:35267-35878 | 31 | ZP_01628800.1 | 32 |
Thermosynechococcus elongatus | gi|22297544:1516844-1517437 | 33 | NP_682244.1 | 34 |
Ostreococcus tauri | gi|118721427:14610-14671, 14874-14913, 15068-15658 | 35 | CAL55168.1 | 36 |
Synechococcus | gi|86604733:552727-553335 | 37 | YP_474017.1 | 38 |
Synechococcus | gi|33864539:1204065-1204667 | 39 | NP_897306.1 | 40 |
Synechococcus elongatus | gi|81298811:2377107-2377703 | 41 | YP_401326.1 | 42 |
Prochlorococcus marinus | gi|84517401:555567-556163 | 43 | ZP_01005378.1 | 44 |
Porphyra purpurea | gi|11465652:76976-77575 | 45 | NP_053882.1 | 46 |
Gracilaria tenuistipitata | gi|51209843:100291-100971 | 47 | YP_063623.1 | 48 |
Mus musculus | X82067.1 | 49 | Q61171 | 50 |
Rattus norvegicus | NM_017169.1 | 51 | NP_058865.1 | 52 |
어떤 경우에는, TIGR (The Institute for Genomic Research)과 같은 연구 기관에 의해 연관 서열이 시험적으로 조립되어(assembled), 공개된다. EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다.
실시예
2: 2-
Cys
PRX
폴리펩티드 서열의 정렬(
Alignment
)
진정세균, 식물 조류, 동물의 2-Cys PRX 폴리펩티드 서열, 및 식물의 1- Cys PRX 폴리펩티드 서열 (outliers로서)의 정렬은 default 값을 사용하여 progressive 정렬의 Clustal 알고리즘 (1.83)으로 수행되었다 (Thompson 등 (1997) Nucleic Acids Res 25:4876-4882; Chenna 등 (2003) Nucleic Acids Res 31 :3497-3500). 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. 2-Cys PRX 폴리펩티드는 도 4에 정렬되어 있다. 서열번호 77로 나타낸 모티프 1 및 서열번호 78로 나타낸 모티프 2는 박스로 표시하였다.
진정세균, 식물 조류, 동물의 2-Cys PRX 폴리펩티드 서열, 및 식물의 1- Cys PRX 폴리펩티드 서열 (outliers 로서)의 계통수는 당업계에 주지된 neighbour-joining 클러스터링 알고리즘을 사용하여 구축되었다 (도 3). 2-Cys PRX는 연결괄호(accolade)로 표시하였다. 서열번호 2로 나타낸 2-Cys PRX는 박스로 표시하였다.
실시예
3: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열 간에 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (Campanella 등, BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences; Ledion Bitincka에 의해 호스팅된 소프트웨어)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타의 사전 정렬의 필요 없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다. 서열 유사성은 구분선 아래 반쪽에 보여지며, 서열 동일성은 대각선 구분선 위 반쪽에 보여진다.
비교에 사용된 매개변수는:
Scoring matrix: Blosum62
첫째 갭: 12
연장 갭: 2
소프트웨어 분석의 결과는 전장 폴리펩티드 서열에 걸쳐 전체적인 유사성 및 동일성에 대하여 표 A2에 보여진다. 동일성 백분율은 대각선 상부에 볼드체로, 유사성 백분율은 대각선 하부에 있다 (보통체).
본 발명의 방법을 수행하는데 유용한 2-Cys PRX 폴리펩티드 서열 간의 동일성 백분율은 서열번호 2에 비교 시 35% 아미노산 동일성만큼 낮을 수도 있다.
표 A2: 전장 폴리펩티드 서열에 걸친 전체적인 유사성 및 동일성에 대한 MatGAT 결과
실시예
4: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정
CD-Search (Conserved Domain Search service)는 NCBI에 호스팅된 단백질 서열 내에 구조적 및 기능적 도메인을 검출하는 웹-기반 수단이다. CD-Search는 도메인 모델의 광범위한 수집물을 검색하기 위해 BLAST(R)을 사용한다. 검색 결과는 조회 및 도메인-모델 일치 서열 간에 도메인 architecture cartoons 및 pairwise 정렬로 표시된다 (Marchler-Bauer A, Bryant SH (2004), "CD-Search: protein domain annotations on the fly", Nucleic Acids Res.32 (W)327-331). 서열번호 2로 나타낸 2-Cys PRX를 사용하여 수행된 검색 (default 값 사용)은 top hit로서 entry CD3015, PRX_Typ2cys (도 2, 표 A3)를 보인다.
표 A3: 서열번호 2로 표시된 폴리펩티드 서열의 CDD
데이터베이스 | 등록번호 | 등록명 | 기재 |
CDD | CD3015 | PRX_Typ2cys | Peroxiredoxin (PRX) 패밀리, 전형적인 2-CysPRX 서브패밀리; PRXs는 과산화수소, 퍼옥시니트라이트(peroxynitrite), 및 유기 히드로퍼옥사이드(organic hydroperoxides)를 환원시킴으로써 페록시다아제 활성을 통해 세포에서 보호 역할을 부여하는 TSA(thiol-specific antioxidant) 단백질 |
실시예
5: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열의 세포 내 위치 예측
TargetP 1.1은 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 할당은 임의의 N-말단 사전-서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비성 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거한 점수는 실제로 확률이 아니며, 반드시 부가적이지도 않다. 그러나, 가장 높은 점수를 가진 위치가 TargetP에 따라 가장 가능성이 높으며, 점수 (신뢰도 등급)간의 관계가 예측의 확실성의 표시일 것이다. 신뢰도 등급 (RC)은 1에서 5까지이며, 상기 1은 가장 강한 예측을 나타낸다. TargetP는 Technical University of Denmark의 서버에 유지된다.
N-말단 사전-서열을 포함하는 것으로 예측된 서열에 대해서 잠재적인 절단 부위 또한 예측될 수 있다.
생물체 그룹 (식물이 아닌 것 또는 식물), 컷오프 세트(cutoff sets) (없음, 사전 지정된 컷오프 세트, 또는 사용자 명시 컷오프 세트), 및 절단 부위의 예측 계산 (yes 또는 no)과 같은 많은 매개변수가 선택되었다.
서열번호 2로 표시된 폴리펩티드 서열의 TargetP 1.1 분석 결과는 표 A4에 제시된다. "식물" 그룹이 선택되었고, 컷오프는 정의되지 않았으며, 운반 펩티드의 예측된 길이가 요청되었다. 서열번호 2로 표시된 폴리펩티드 서열의 예측된 세포 내 위치는 색소체이다.
표 A4: 서열번호 2로 표시된 폴리펩티드 서열의 TargetP 1.1 분석
길이 (AA) | 268 |
엽록체 운반 펩티드 | 0.987 |
미토콘드리아 운반 펩티드 | 0.014 |
분비 경로 신호 펩티드 | 0.023 |
세포 내 다른 표적 | 0.018 |
예측된 위치 | 엽록체 |
신뢰 등급 | 1 |
예측된 운반 펩티드 깅이 | 58 |
TargetP1.1에 따라 예측된 길이는 58 개 아미노산 (N-말단으로부터 시작)이 나, 이는 성숙한 단백질의 서열분석으로 실험적으로만 확인될 수 있다. Cheong 등 (1999)은 서열번호 2로 표시된 폴리펩티드에 대해 65 개 아미노산의 운반 펩티드를 예측한다 (Plant Molec Biol 40: 825-834).
하기를 포함한 많은 다른 알고리즘이 상기 분석의 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버 상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버 상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버 상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버 상에 호스팅된 TMHMM
실시예
6: 2-
Cys
PRX
폴리펩티드에 대한 기능적 분석
2-Cys PRX 폴리펩티드는 예를 들면, 과산화수소에 페록시다아제(peroxidase) 활성을 나타낸다. 2-Cys PRX 단백질에 대한 효소 분석은 문헌에 광범위하게 기재되어 있으며, 당업자에게 주지되어 있다. Huang 등 (2007; Appl Microbiol Biotechnol 74(1):84-92), Bernier-Villamor 등 (2004; J Exp Bot 55(406):2191-9) 및 Caporaletti 등 (2007; Biochem Biophys Res Commun 355(3):722-7)이 2-Cys PRX 단백질의 효소 분석을 기재한 최근 문헌이다.
실시예
7: 본 발명의 방법에 사용된 핵산 서열의
클로닝
본 발명의 방법에 사용된 핵산 서열은 브라시카 라파 (Brassica rapa) 2-Cys PRX 클론을 주형으로 Cheong 등의 기재 (1999; Plant Molec Biol)에 따라 PCR로 증폭되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 prmO8756 (서열번호 81; 정방향, 개시 코돈 볼드체): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgtctgttgcttctt-3' 및 prmO8757 (서열번호 82; 역방향, 상보적): 5'-gg ggaccactttgtacaagaaagctgggttcgagctaaatagctgagaagag-3', 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이 때 PCR 단편이 Gateway 용어에 따르면 "entry 클론"인 p2-Cys PRX를 생성하기 위해 pDONR201 플라스미드와 인 비보(in vivo) 재조합된다. Gateway 기술의 일부분으로서, 플라스미드 pDONR201은 Invitrogen으로부터 구입하였다.
서열번호 1을 포함하는 entry 클론이 오리자 사티바(Oryza sativa) 형질전환에 사용된 2개의 destination 벡터와 LR 반응에 사용되었다. 상기 벡터는 T-DNA 경계부 내에 기능적 인자로서 하기를 포함한다: 식물 선발 마커; 스크리닝 가능한 마커 발현 카세트; 및 entry 클론에 이미 클로닝된 목적 핵산 서열과 LR 인 비보(in vivo) 재조합에 예정된 Gateway 카세트. 첫 번째 destination 벡터는 상기 Gateway 카세트의 상부에 강력한 구성적 발현을 위한 벼 GOS2 프로모터 (서열번호 79)를 포 함하며, 두 번째 destination 벡터는 뿌리 특이적 발현을 위한 벼 Rcc3 프로모터 (서열번호 80)를 포함한다.
LR 재조합 단계 후, 생성된 발현 벡터 pGOS2::2-Cys PRX 및 pRcc3::2-Cys PRX (도 5)는 당업계에 주지된 방법에 따라 아그로박테리움 (Agrobacterium) 균주 LBA4044에 개별적으로 형질전환되었다.
실시예
8: 식물 형질전환
벼 형질전환
실시예 7에 기재된 발현 벡터 중 하나를 각각 함유하는 2 개의 아그로박테리움 균주가 오리자 사티바 식물의 형질전환에 사용되었다. 벼 야포니카 재배 품종 니폰바레의 성숙한 건조 종자의 껍질을 벗겼다. 70% 에탄올에 1 분, 0.2% HgCl2에 30 분, 멸균된 증류수로 6 회, 15분 세척하여 멸균하였다. 멸균된 종자를 2,4-D 함유 배지 (캘러스 유도배지)에서 발아시켰다. 암소에서 4주간 배양 후, 배, 배반-유래 캘러스를 절단하여 동일한 배지에서 번식시켰다. 2주 후, 캘러스는 계대배양에 의해 동일한 배지 상에서 또 다른 2주간 증식되거나 번식되었다. 배 캘러스 단편은 (세포 분열 활성을 증대시키기 위하여) 공동배양 3일 전에 신선한 배지 상에서 계대배양 되었다.
발현 벡터 함유 아그로박테리움 균주 LBA4404가 공동배양에 사용되었다. 아그로박테리움은 적절한 항생제가 포함된 AB 배지에 접종되어, 28℃에서 3일간 배양 되었다. 세균을 수집하여 밀도 (OD600) 약 1이 되게 액체 공동배양 배지에 현탁액을 만들었다. 이 현탁액을 페트리디쉬에 옮겨 캘러스를 현탁액에 15 분간 침지하였다. 캘러스 조직을 필터 페이퍼 상에 옮겨 건조시킨 후, 굳힌 공동배양 배지에 옮겨 25℃, 암소에서 3일간 배양하였다. 공동배양된 캘러스를 선발제의 존재 하에 2,4-D-함유 배지에서 28℃, 암소에서 4주간 키웠다. 이 기간 중에, 급속히 자라는 저항성 캘러스 섬이 발달되었다. 이를 재분화 배지에 옮겨 명소에서 배양 후, 배가 방출되었으며 다음 4 내지 5주 후에 어린 줄기가 발달되었다. 어린 줄기를 캘러스에서 절단하여 옥신 함유 배지에서 2 내지 3주간 배양하여 토양으로 이식하였다. 강해진 어린 줄기를 온실 내 고습도 및 단일에서 키웠다.
약 35 개의 독립적인 T0 벼 형질전환체가 한 구축물당 생성되었다. 일차 형질전환체를 조직 배양실에서 온실로 옮겼다. T-DNA 삽입물의 카피 수를 확인하기 위한 정량적 PCR 분석 후, 선발제에 내성을 보이는 한 카피 형질전환 식물을 T1 종자 수확을 위하여 유지하였다. 이식 3 내지 5 개월 후 종자를 수확하였다. 본 방법으로 한 좌위 형질전환체가 50% 넘는 비율로 생산되었다 (Aldemita and Hodges 1996, Chan 등 1993, Hiei 등 1994).
실시예
9: 표현형 평가 절차
9.1 평가
셋업
약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조 직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손 중 6 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자(이형- 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다.
4 개의 T1 events는 T2 세대에서 T1 세대에 대해서와 동일한 평가 절차이나 event당 더 많은 개체로 한층 더 평가되었다. 파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
가뭄 스크린
4 events로부터 T2 종자로부터의 식물체를 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 모니터하기 위해 무작위로 선택한 화분에 습도 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동적으로 식물에 재급수하였다. 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.
9.2 통계적 분석:F-검정
식물의 표현형적 특징의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 건의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 건에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
중복적인 events의 2 회 실험이 수행되었으므로, 조합된 분석이 수행되었다. 이는 두 실험에 걸친 효과의 일관성을 확인하기에 유용하며, 그렇다면 결론에 대한 신뢰도를 증가시키기 위해 양 실험으로부터의 증거를 축적하는 것이 유용하다. 사용된 방법은 자료의 다층구조(즉, experiment-event-segregants)를 고려하는 혼합모델 접근(mixed-model approach)이다. P 값은 우도비 검정 (likelihood ratio test)을 카이 제곱 분포에 비교함으로써 구했다.
9.3 측정된 매개변수
생물량
관련 매개변수 측정
파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통 과시켰다. 매번 2-Cys PRXnt 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
초기 활력은 발아 후 3주된 식물 (seedling) 지상부 면적이다. 초기 활력은 백그라운드로부터 구분되는 지상부 식물체로부터 총 픽셀의 수를 세어 결정되었다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 하기 기재된 결과는 발아 후 3 주된 식물체에 대한 것이다
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다.
뿌리-관련 매개변수를 측정하기 위해, 뿌리를 보이게 하기위해 바닥이 투명하게 특별히 고안된 화분에 식물체를 키웠다. 식물체의 생장 중에 화분 바닥을 통해 디지털 카메라로 이미지를 기록하였다. 총 투영면적(projected area) (총 뿌리 체적에 관련될 수 있는), 임의의 두께 역치 상부 뿌리의 평균 직경 및 길이 (두꺼운 뿌리의 길이, 또는 두꺼운 뿌리 길이)와 같은 뿌리 특징을 적절한 소프트웨어를 사용하여 그림으로부터 추론하였다. 뿌리 생물량(biomass)의 증가는 총 뿌리 생물량(biomass) (식물의 수명 중에 관찰된 뿌리의 최대 생물량(biomass)으로 측정됨) 의 증가로; 또는 뿌리/신초 지수 (뿌리 및 신초의 활성 성장 기간에 근질량 및 신초 질량(shoot mass)간의 비율로 측정됨)의 증가로 표현된다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충만된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충만된 깍지는 분석 저울로 무게를 재었다. 충만된 종자의 수는 분리 단계 후 남은 충만된 깍지의 수를 세어 결정하였다. 총 종자 수확량은 식물체로부터 수확된 모든 충만된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립중량 (TKW)은 숫자를 센 충만된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확지수 (HI)는 총 종자 수확량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수 간의 비율이다. 본 발명에서 정의된 종자 충만도(fill rate)는 총 종자 (또는 소화) 수에 대한 충만된 종자 수의 비율 (%)로 표시된다.
실시예
10: 정상적인 생장 조건하에서 자란 형질전환 식물의 표현형 평가 결과
뿌리 특이적 프로모터의 조절하에서, 및 정상적인 생장 조건하에서 자란 2- Cys PRX 폴리펩티드를 암호화하는 핵산 서열을 발현하는 형질전환 벼 식물의 평가 결과가 하기에 제시되어 있다. 증가된 종자 충만율, 식물체당 증가된 총 종자 수확량, 충만된 종자의 증가된 수, 증가된 수확 지수, 및 증가된 천립당 중량뿐 아니라 향상된 초기 활력이 관찰되었다.
표 A5: 뿌리 특이적 프로모터의 조절하에서, 및 정상적인 생장 조건하에서 자란 본 발명의 방법 수행에 유용한 핵산 서열을 발현하는 형질전환 벼 식물의 평가 결과
형질 | T1 세대에서 3 회 최고 events에 대한 증가 % | T2 세대에서 3 회 최고 events에 대한 증가 % |
초기 활력 (실생) | 7% | 5% |
종자 충만율 | 1% | 10% |
식물체당 총 종자 수확량 | 8% | 10% |
충만된 종자의 총 수 | 6% | 8% |
수확 지수 | 7% | 9% |
천립중량 | 3% | 3% |
구성적 프로모터 (벼 GOS2 프로모터)의 조절하에서, 및 정상적인 생장 조건하에서 자란 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열을 발현하는 형질전환 벼 식물은 필적할만한 정상적인 생장 조건 하에서 자란 대조구 식물에 비교 시, 임의의 표현형적 형질 차이를 보이지 않았다 (데이터 미제시).
실시예
11: 스트레스 생장 조건하에서 자란 형질전환된 식물의 표현형 평가 결과
뿌리 특이적 프로모터의 조절하에서, 및 가뭄-스트레스 생장 조건하에서 자란 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열을 발현하는 형질전환 벼 식물의 평가 결과가 하기에 제시되어 있다. 증가된 지상부 생물량(biomass), 증가된 뿌리 생물량(biomass), 원추화서당 증가된 꽃의 수, 증가된 종자 충만율, 식물체당 증가 된 총 종자 수확량, 증가된 종자 수, 증가된 충만된 종자 수, 및 증가된 수확 지수뿐 아니라 향상된 초기 활력이 관찰되었다.
표 A6: 뿌리 특이적 프로모터의 조절하에서, 및 가뭄-스트레스 생장 조건하에서 자란 본 발명의 방법 수행에 유용한 핵산 서열을 발현하는 형질전환 벼 식물의 평가 결과
형질 | T2 세대에서 증가 % (모든 events) |
초기 활력 (실생) | 31% |
지상부 생물량 | 11% |
뿌리 생물량 | 6% |
원추화서당 꽃 | 8% |
종자 충만율 | 8% |
식물체당 총 종자 수확량 | 18% |
총 종자 수 | 10% |
충만된 종자의 총 수 | 17% |
수확 지수 | 8% |
실시예
12: 다른 작물의 형질전환의 예
옥수수
형질전환
옥수수 (Zea mays) 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법을 변형하여 수행하였다. 옥수수에 있어 형질전환은 유전형에 의존하며, 특정 유전형만이 형질전환 및 재분화에 순응한다. 근교계통 A188 (University of Minnesota) 또는 양친으로서 A188과의 교배는 형질전환을 위한 공여자의 좋은 원천이나 다른 유전형도 성공적으로 사용될 수 있다. 옥수수 알을 미성숙된 배의 길이가 약 1 내지 1.2mm일 때인 수분 후 약 11일된 옥수수 식물체로부터 수확한다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 절단된 배를 캘러 스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 옥수수 재분화 배지에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 옥수수 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 한 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
밀 형질전환
밀의 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법으로 수행하였다. 재배품종 봅화이트 (Bobwhite; CIMMYT, Mexico로부터 입수 가능)가 형질전환에 흔히 사용된다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 아그로박테리움과의 공배양 후 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 재분화 배지에서 시험관 내에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 한 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
대두 형질전환
대두는 Texas A&M 특허 US 5,164,310에 기재된 방법을 변형하여 형질전환되 었다. 몇 가지 상업적 대두 변종은 이 방법에 의한 형질전환에 순응한다. 재배품종 잭 (Jack; Illinois Seed foundation으로부터 입수 가능)이 흔히 형질전환에 사용된다. 대두 종자는 시험관 내 파종을 위해 멸균된다. 하배축, 유근 및 자엽 하나를 7일 된 어린 실생으로부터 잘라낸다. 상배축 및 나머지 자엽을 엽액 마디가 발달할 때까지 키운다. 이 엽액 마디를 잘라내어 발현벡터를 함유하는 아그로박테리움 투머파시엔스와 배양한다. 공배양 후 잘라낸 식물체 조각을 수세하여 선발 배지로 옮긴다. 재분화된 어린 줄기를 잘라내어 어린 줄기 신장 배지에 둔다. 1 cm가 되지 않는 어린 줄기를 뿌리가 발달하기까지 발근 배지에 둔다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 한 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
유채/
캐놀라
형질전환
5 내지 6일된 어린 실생의 자엽 엽병 및 하배축이 조직 배양을 위한 식물절편으로 사용되었으며 Babic 등 (1998, Plant Cell Rep 17: 183-188)에 따라 형질전환되었다. 상업적 재배종 웨스타 (Westar; Agriculture Canada)가 형질전환을 위한 표준 변종으로 사용되나, 다른 변종도 사용될 수 있다. 캐놀라 종자는 시험관 내 파종을 위해 표면 멸균된다. 자엽이 붙어 있는 자엽 엽병 식물절편을 시험관 내 실생으로부터 절단하여, 엽병 절편의 잘린 끝 부분을 세균 현탁액에 담구어 아그로박테리움 (발현 벡터 포함)을 접종하였다. 식물절편을 3 mg/l BAP, 3 % 수크로스, 0.7 % Phytagar를 함유하는 MSBAP-3 배지에서 23℃에서, 16 시간의 빛 하에서 2일간 배양하였다. 아그로박테리움과의 공배양 2일 후, 엽병 식물 절편을 3mg/l BAP, 세포탁심, 카베니실린, 또는 티멘틴 (300mg/l)을 함유하는 MSBAP-3 배지에 옮겨 7일간 둔 후, 어린 줄기가 재분화될 때까지 세포탁심, 카베니실린, 또는 티멘틴 및 선발제가 포함된 MSBAP-3 배지에 배양하였다. 어린 줄기의 길이가 5 내지 10 mm일 때 잘라 어린 줄기 신장 배지 (0.5 mg/l BAP 함유 MSBAP-0.5)로 옮긴다. 길이 약 2 cm인 어린 줄기를 뿌리 유도를 위하여 발근 배지(MS0)로 옮긴다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 한 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
알팔파
형질전환
알팔파 (Medicago sativa)의 재생 클론이 (McKersie 등, 1999 Plant Physiol 119: 839-847)의 방법으로 형질전환된다. 알팔파의 재분화 및 형질전환은 유전형 의존적이므로 재분화 식물이 요구된다. 재분화 식물을 얻는 방법이 기재된다. 예를 들면, 이들은 재배품종 랭그랜더 (Rangelander; Agriculture Canada) 또는 Brown DCW 및 Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112)에 의해 기재된 임의의 다른 상업적 알팔파 변종으로부터 선택할 수 있다. 다르게는, RA3 변종 (University of Wisconsin)이 조직배양에 사용하기 위해 선택되었다 (Walker 등, 1978 Am J Bot 65:654-659). 엽병 식물절편은 발현 벡터를 가진 아그로박테리움 투머파시엔스 C58C1 pMP90 (McKersie 등, 1999 Plant Physiol 119: 839-847) 또는 LBA4404와 밤새 공배양된다. 식물절편은 288 mg/L Pro, 53 mg/L 티오프롤린, 4.35 g/L K2SO4, 및 100μM 아세토시링원을 함유하는 SH 유도배지 상에서 암소에서 3일간 공배양된다. 식물절편을 절반 강도의 Murashige-Skoog 배지 (Murashige and Skoog, 1962)로 세척하여 아세토시링원은 없으나 적절한 선발제 및 아그로박테리움 생장을 저해하는 적절한 항생제를 포함하는 동일한 SH 유도배지 상에 플레이팅한다. 몇 주 후, 체세포 배를 생장조절제 및 항생제는 없고, 50g/L 수크로스가 함유된 BOi2Y 발생 배지로 옮긴다. 체세포 배는 연이어 절반 강도의 Murashige-Skoog 배지 상에서 발아된다. 발근된 실생을 온실의 토양으로 이식하여 키운다. T1 종자는 선발제에 내성을 보이며 한 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
목화 형질전환
목화 (Gossypium hirsutum L.) 형질전환은 아그로박테리움 투머파시엔스(Agrobacterium tumefaciens)를 사용하여, 자엽하축(hypocotyls) 외식편에 수행하였다. Coker 130 또는 Coker 312 (SeedCo, Lubbock, TX)와 같은 상업적 재배품종이 형질전환에 사용된 표준 변종이었으나, 다른 변종도 사용될 수 있다. 종자를 표면 살균하였으며, 암소에서 발아시켰다. 자엽하축 외식편은 약 1 -1.5 cm의 길이로 발아된 실생으로부터 절단하였다. 자엽하축 외식편을 발현 벡터를 포함하는 아그로박테리움 투머파시엔스 접종물에 5분간 침지하고, 24℃, 암소에서 MS +1.8 mg/l KNO3 + 2% 포도당 상에 약 48시간 공배양하였다. 적절한 세균 및 식물 선발 마커를 포함하는 동일 배지에 외식편을 옮겨, 배 캘러스(embryogenic calli)가 보일 때까지 수 회 새배지로의 교환을 반복하였다. 캘러스를 분리하여 체세포 배 (somatic embryos)가 나올 때까지 계대 배양하였다. 체세포 배 유래의 소식물체를 뿌리가 나올 때까지 발근배지에서 키웠다. 발근된 신초(shoots)를 화분으로 이식하여 온실에서 키웠다. 선발제에 내성을 보이며 한 카피의 T-DNA 삽입물(insert)을 포함하는 식물체로부터 T1 종자를 수확하였다.
실시예
13: 다른 스트레스 스크린의 예
염 스트레스 스크린
식물체를 코코넛 섬유(coco fibers) 및 아르젝스(argex) (3:1 비율)로 만들어진 기질에서 키웠다. 정상적인 양분액을 온실에 식물체를 이식 후 처음 2주간 사용하였다. 처음 2주 후, 식물을 수확할 때까지 25 mM 염 (NaCl)를 양분액에 첨가하였다.
감소된
양분 (질소) 이용 효율 스크린
T2 종자로부터의 벼 식물체를 양분액을 제외하고는 정상적인 조건하에서 화분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배 (식물 성숙, 종자 수확)의 나머지 부분은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서 만큼 상세하게 기록하였다.
실시예
14: 본 발명의 방법에 사용된 핵산 서열에 연관된 서열의 동정
본 발명의 방법에 사용된 핵산 서열에 연관된 서열 (전장 cDNA, ESTs 또는 게놈)은 BLAST (Basic Local Alignment Tool) 같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레 오티드 데이터베이스 (Altschul et al . (1990) J. Mol. Biol. 215:403-410; 및 Altschul et al . (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터 베이스에 비교하고 필적하는 것의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는데 사용된다. 예를 들면, 본 발명에 사용된 핵산에 의해 암호화되는 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, 덜 엄격한 일치부위를 보이기 위해 E-값을 증가할 수 있으며, 이와 같은 방식으로, 거의 정확하게 일치되는 짧은 부위가 동정된다.
표 B1은 본 발명의 방법에 유용한 핵산 서열에 연관된 핵산 서열의 목록이다.
표 B1: ANN 폴리펩티드의 예:
식물 소스 | 핵산 서열번호: |
단벡질 서열번호: |
Arabidopsis thaliana ANNAT1 | 83 | 84 |
Gossypium hirsutum fiber annexin | 96 | 97 |
Lavatera thuringiaca annexin | 98 | 99 |
Brassica rapa subsp. Pekinensis 80C09_22 | 100 | 101 |
Gossypium hirsutum annexin | 102 | 103 |
Capsicum annuum Annexin 24 | 104 | 105 |
Nicotiana tabacum VCaB42 | 106 | 107 |
Gossypium hirsutum Anx1 | 108 | 109 |
Nicotiana tabacum annexin | 110 | 111 |
Solanum tuberosum annexin p34 | 112 | 113 |
Lycopersicon esculentum annexin p34 | 114 | 115 |
Lycopersicon esculentum annexin p35 | 116 | 117 |
Arabidopsis thaliana ANNAT2 | 118 | 119 |
Nicotiana tabacum annexin | 120 | 121 |
Solanum tuberosum annexin p34-like | 122 | 123 |
Arabidopsis thaliana ANN7 | 124 | 125 |
Medicago sativa annexin | 126 | 127 |
Brassica rapa subsp. pekinensis 80A08_20 | 128 | 129 |
Arabidopsis thaliana ANNAT3 | 130 | 131 |
Arabidopsis thaliana annexin 5 | 132 | 133 |
Arabidopsis thaliana ANNAT4 | 134 | 135 |
Arabidopsis thaliana ANN6 | 136 | 137 |
Arabidopsis thaliana ANN8 At5g12380 | 138 | 139 |
Oryza sativa (japonica cultivar-group) Os09g0394900 | 140 | 141 |
Oryza sativa (japonica cultivar-group) Os02g0753800 | 142 | 143 |
Oryza sativa (japonica cultivar-group) Os08g0425700 | 144 | 145 |
Oryza sativa (japonica cultivar-group) Os06g0221200 | 146 | 147 |
Oryza sativa (japonica cultivar-group) Os09g0453300 | 148 | 149 |
Oryza sativa (japonica cultivar-group) Os05g0382900 | 150 | 151 |
Oryza sativa (japonica cultivar-group) Os08g0372900 | 152 | 153 |
Oryza sativa (japonica cultivar-group) Os03g0819300 | 154 | 155 |
어떤 경우에는, TIGR (The Institute for Genomic Research)과 같은 연구 기관에 의해 연관 서열이 시험적으로 조립되어(assembled), 공개된다. EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다.
실시예
15:
ANN
폴리펩티드 서열의 정렬
폴리펩티드 서열의 정렬은 점진적 정렬의 대중적인 Clustal 알고리즘에 근거 한 벡터 NTI (Invitrogen)의 AlignX 프로그램을 사용하여 수행되었다 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al . (2003). Nucleic Acids Res 31:3497-3500). Gap open penalty에 대한 디폴트 값은 10, gap extension penalty에 대한 디폴트 값은 0.1이고, 선택된 가중치 행렬은 Blosum 62 (만일 폴리펩티드가 정렬되면)이다. 정렬(alignment)을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. ANN 폴리펩티드간에 전체 서열에 걸쳐 서열의 보존성이 있었다. ANN 폴리펩티드는 도 9에 정렬되어 있다.
ANN 폴리펩티드 (도 8 중의 하나와 같은)의 계통수는 벡터 NTI (Invitrogen)의 AlignX 프로그램에 제공된 neighbour-joining 클러스터링 알고리즘을 사용하여 제작되었다.
실시예
16: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열 간에 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전장 폴리펩티드 서열 간에 동일성 및 유사성의 전체적인 백분율은 당업계에 유용한 방법 중의 하나인 MatGAT (Matrix Global Alignment Tool) 소프트웨어 (Campanella 등, BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences; Ledion Bitincka에 의해 호스팅된 소프트웨어)를 사용하여 결정되었다. MatGAT 소프트웨어는 데이타의 사전 정렬의 필요 없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (gap opening penalty 12, 및 gap extension penalty 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다. 서열 유사성은 구분선 아래 반쪽에 보여지며, 서열 동일성은 대각선 구분선 위 반쪽에 보여진다.
비교에 사용된 매개변수는:
Scoring matrix: Blosum62
첫째 갭: 12
연장 갭: 2
소프트웨어 분석의 결과는 전장 폴리펩티드 서열에 걸쳐 전체적인 유사성 및 동일성에 대하여 표 B2에 보여진다. 동일성 백분율은 대각선 상부에 볼드체로, 유사성 백분율은 대각선 하부에 있다(보통체).
본 발명의 방법을 수행하는데 유용한 ANN 폴리펩티드 서열 간의 동일성 백분율은 서열번호 84 (NP_174810)에 비교 시 30% 아미노산 동일성만큼 낮을 수도 있다.
표 B2: 전장 폴리펩티드 서열에 걸친 전체적인 유사성 및 동일성에 대한 MatGAT 결과
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | |
1. NP_174810 | 72.6 | 71.0 | 29.9 | 68.6 | 65.2 | 67.5 | 67.8 | 65.6 | 66.2 | 65.9 | |
2. AAC33305 | 84.5 | 89.9 | 32.1 | 71.6 | 71.6 | 68.0 | 72.8 | 72.8 | 72.8 | 73.4 | |
3. AAB71830 | 84.5 | 94.3 | 30.6 | 68.8 | 67.0 | 64.2 | 68.7 | 69.0 | 68.7 | 69.0 | |
4. AAZ41833 | 36.4 | 37.4 | 36.8 | 32.6 | 29.4 | 33.4 | 33.9 | 29.6 | 30.0 | 30.2 | |
5. AAB67994 | 82.3 | 84.5 | 83.2 | 38.7 | 63.1 | 72.2 | 85.5 | 63.4 | 63.1 | 63.1 | |
6. 1DK5 | 83.9 | 83.9 | 81.7 | 37.7 | 79.2 | 63.6 | 64.5 | 91.0 | 91.9 | 91.6 | |
7. AAD24540 | 81.1 | 82.6 | 81.0 | 38.7 | 83.9 | 77.6 | 74.4 | 63.9 | 64.2 | 64.9 | |
8. AAR13288 | 81.7 | 84.5 | 82.6 | 39.3 | 92.7 | 78.6 | 84.8 | 65.2 | 65.2 | 66.5 | |
9. CAA75213 | 84.2 | 85.1 | 83.2 | 37.4 | 81.0 | 95.7 | 79.1 | 80.4 | 92.4 | 92.7 | |
10. CAB92956 | 83.9 | 85.4 | 83.5 | 37.6 | 80.6 | 95.3 | 79.1 | 80.4 | 97.8 | 98.4 | |
11. AAC97494 | 83.9 | 85.4 | 83.5 | 37.6 | 80.6 | 95.3 | 79.1 | 80.4 | 97.8 | 100.0 | |
12. AAC97493 | 80.8 | 80.4 | 79.4 | 37.8 | 82.9 | 77.6 | 92.1 | 85.8 | 79.4 | 79.4 | 79.4 |
13. NP_201307 | 79.8 | 81.4 | 80.1 | 44.5 | 85.5 | 79.2 | 83.9 | 84.5 | 80.1 | 80.4 | 80.4 |
14. CAA75214 | 83.6 | 84.2 | 82.3 | 37.1 | 80.0 | 94.7 | 78.2 | 79.7 | 98.4 | 97.5 | 97.5 |
15. ABB55363 | 83.3 | 84.8 | 82.9 | 37.3 | 79.7 | 94.7 | 78.5 | 79.7 | 96.5 | 98.7 | 98.7 |
16. NP_196585 | 80.4 | 80.4 | 79.1 | 41.2 | 84.2 | 78.9 | 82.0 | 82.6 | 80.4 | 81.0 | 81.0 |
17. CAA52903 | 80.8 | 82.0 | 81.6 | 38.6 | 83.8 | 79.2 | 82.3 | 83.2 | 81.5 | 81.5 | 81.5 |
18. AAZ67605 | 79.2 | 79.1 | 79.1 | 41.1 | 82.6 | 78.0 | 81.6 | 82.0 | 79.4 | 79.7 | 79.7 |
19. NP_181410 | 59.2 | 58.6 | 58.6 | 27.8 | 61.4 | 58.4 | 61.7 | 63.2 | 58.6 | 58.9 | 58.9 |
20. ABE65753 | 58.4 | 56.3 | 54.7 | 27.0 | 58.5 | 54.0 | 56.6 | 59.5 | 54.7 | 55.1 | 55.1 |
21. NP_181409 | 56.4 | 55.2 | 53.6 | 25.3 | 53.9 | 54.7 | 54.5 | 54.2 | 55.8 | 55.8 | 55.8 |
22. NP_196584 | 77.4 | 78.9 | 78.6 | 41.2 | 81.8 | 78.0 | 81.1 | 81.8 | 78.3 | 79.2 | 78.9 |
23. NP_568271 | 69.4 | 67.1 | 67.7 | 30.9 | 68.4 | 66.5 | 66.8 | 69.0 | 66.8 | 68.0 | 67.7 |
24. NP_001063096 | 55.8 | 55.7 | 53.8 | 27.4 | 59.0 | 54.7 | 57.0 | 58.5 | 54.9 | 54.6 | 54.6 |
25. NP_001048149 | 76.0 | 78.5 | 77.5 | 35.2 | 79.4 | 74.5 | 75.3 | 79.1 | 77.1 | 77.1 | 77.1 |
26. NP_001061839 | 55.1 | 54.5 | 52.6 | 27.1 | 57.6 | 53.7 | 57.0 | 56.1 | 55.1 | 53.9 | 53.9 |
27. NP_001057176 | 78.2 | 79.8 | 80.1 | 35.2 | 79.5 | 75.8 | 77.0 | 79.5 | 76.7 | 77.0 | 77.0 |
28. NP_001063343 | 53.0 | 53.6 | 52.4 | 26.1 | 53.6 | 50.3 | 52.0 | 52.0 | 50.8 | 51.1 | 51.1 |
29. NP_001055408 | 54.3 | 52.7 | 53.0 | 30.2 | 53.8 | 55.1 | 53.8 | 54.3 | 53.0 | 53.2 | 53.2 |
30. NP_001061661 | 27.8 | 27.6 | 27.3 | 24.9 | 26.8 | 24.2 | 28.4 | 26.8 | 28.1 | 27.3 | 27.3 |
31. NP_001051711 | 17.7 | 16.8 | 17.1 | 10.2 | 16.5 | 17.4 | 14.2 | 16.8 | 17.2 | 17.5 | 17.8 |
12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | |
1. NP_174810 | 65.9 | 64.0 | 65.6 | 64.9 | 63.1 | 65.0 | 62.8 | 38.5 | 34.3 | 32.3 | 60.8 |
2. AAC33305 | 65.5 | 67.5 | 71.8 | 71.4 | 66.5 | 69.3 | 64.9 | 41.0 | 35.6 | 34.2 | 63.8 |
3. AAB71830 | 63.3 | 64.4 | 68.0 | 67.3 | 63.3 | 68.4 | 62.3 | 39.8 | 34.1 | 33.0 | 61.3 |
4. AAZ41833 | 32.4 | 41.8 | 29.3 | 29.5 | 35.9 | 33.1 | 35.3 | 19.9 | 17.5 | 16.8 | 34.8 |
5. AAB67994 | 70.3 | 70.1 | 63.1 | 62.1 | 68.1 | 70.5 | 67.5 | 39.6 | 34.9 | 35.1 | 64.9 |
6. 1DK5 | 62.0 | 61.8 | 90.7 | 90.4 | 62.0 | 63.6 | 61.1 | 40.0 | 33.5 | 34.2 | 59.8 |
7. AAD24540 | 87.0 | 70.3 | 63.6 | 62.9 | 69.3 | 69.6 | 69.3 | 42.5 | 36.9 | 33.7 | 67.6 |
8. AAR13288 | 73.7 | 71.0 | 65.2 | 63.8 | 70.3 | 69.3 | 68.7 | 43.5 | 36.6 | 35.3 | 67.3 |
9. CAA75213 | 62.0 | 64.4 | 97.1 | 90.8 | 64.6 | 64.2 | 62.7 | 41.9 | 35.6 | 35.0 | 61.9 |
10. CAB92956 | 63.6 | 64.4 | 92.4 | 98.4 | 63.9 | 65.2 | 62.7 | 41.3 | 35.3 | 34.1 | 61.6 |
11. AAC97494 | 64.2 | 64.4 | 92.7 | 96.8 | 64.9 | 65.8 | 63.6 | 42.2 | 35.0 | 34.7 | 62.3 |
12. AAC97493 | 68.1 | 62.7 | 62.3 | 68.0 | 66.5 | 67.4 | 40.4 | 36.0 | 33.4 | 65.4 | |
13. NP_201307 | 81.4 | 63.1 | 63.0 | 79.2 | 69.7 | 78.9 | 42.2 | 37.4 | 34.9 | 74.9 | |
14. CAA75214 | 79.0 | 79.5 | 90.8 | 63.9 | 63.0 | 62.3 | 41.0 | 35.0 | 34.7 | 61.6 | |
15. ABB55363 | 78.8 | 79.8 | 96.2 | 62.6 | 63.8 | 61.3 | 40.4 | 34.5 | 34.1 | 60.3 | |
16. NP_196585 | 80.7 | 89.9 | 79.7 | 80.4 | 69.0 | 89.9 | 41.9 | 38.2 | 34.7 | 82.4 | |
17. CAA52903 | 80.3 | 83.3 | 80.9 | 80.4 | 81.0 | 68.4 | 40.8 | 35.1 | 33.8 | 67.0 | |
18. AAZ67605 | 80.1 | 89.9 | 78.8 | 79.1 | 95.6 | 81.3 | 40.4 | 36.0 | 33.8 | 82.4 | |
19. NP_181410 | 60.1 | 57.6 | 58.3 | 58.9 | 59.5 | 58.3 | 58.3 | 31.9 | 33.6 | 41.4 | |
20. ABE65753 | 55.4 | 58.0 | 55.7 | 55.1 | 58.9 | 54.7 | 58.5 | 51.7 | 27.4 | 36.1 | |
21. NP_181409 | 54.9 | 53.9 | 55.8 | 55.8 | 53.0 | 51.4 | 52.0 | 54.2 | 47.6 | 32.6 | |
22. NP_196584 | 80.2 | 88.4 | 77.4 | 78.6 | 91.2 | 80.8 | 91.5 | 58.6 | 58.5 | 51.7 | |
23. NP_568271 | 66.5 | 66.9 | 66.8 | 68.0 | 67.7 | 68.0 | 68.4 | 63.2 | 56.6 | 55.8 | 66.0 |
24. NP_001063096 | 57.5 | 59.0 | 55.2 | 54.4 | 59.2 | 57.1 | 58.9 | 55.1 | 72.2 | 46.1 | 59.1 |
25. NP_001048149 | 74.9 | 76.0 | 76.1 | 75.9 | 76.6 | 77.1 | 75.9 | 60.1 | 57.9 | 51.1 | 74.2 |
26. NP_001061839 | 56.1 | 58.3 | 54.8 | 53.6 | 57.9 | 55.5 | 57.0 | 54.5 | 69.2 | 46.4 | 58.6 |
27. NP_001057176 | 74.8 | 76.3 | 75.7 | 76.7 | 74.8 | 76.3 | 74.4 | 60.4 | 56.8 | 48.6 | 74.2 |
28. NP_001063343 | 51.4 | 52.4 | 50.8 | 50.8 | 53.0 | 48.3 | 52.0 | 48.6 | 48.9 | 50.2 | 52.4 |
29. NP_001055408 | 53.5 | 53.8 | 53.2 | 53.2 | 53.8 | 52.4 | 53.5 | 60.2 | 44.9 | 47.3 | 53.0 |
30. NP_001061661 | 29.1 | 29.4 | 28.1 | 29.4 | 28.1 | 25.8 | 27.3 | 26.3 | 26.0 | 28.9 | 27.3 |
31. NP_001051711 | 16.8 | 16.4 | 16.2 | 17.1 | 15.2 | 19.2 | 16.8 | 16.8 | 17.1 | 17.2 | 16.7 |
23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | |
1. NP_174810 | 49.4 | 35.5 | 59.6 | 36.8 | 60.2 | 28.4 | 37.2 | 12.4 | 11.3 |
2. AAC33305 | 51.1 | 37.4 | 63.3 | 38.8 | 64.5 | 30.2 | 38.9 | 14.1 | 10.1 |
3. AAB71830 | 49.2 | 35.3 | 59.8 | 36.0 | 61.9 | 29.1 | 37.8 | 15.1 | 9.2 |
4. AAZ41833 | 22.7 | 19.2 | 29.0 | 19.0 | 28.9 | 14.6 | 21.5 | 14.4 | 8.0 |
5. AAB67994 | 51.3 | 36.8 | 63.1 | 39.0 | 61.8 | 30.6 | 39.0 | 12.5 | 10.1 |
6. 1DK5 | 48.6 | 35.2 | 60.8 | 33.9 | 59.5 | 29.0 | 41.3 | 12.2 | 10.5 |
7. AAD24540 | 51.4 | 37.2 | 61.1 | 40.7 | 62.6 | 28.3 | 39.4 | 14.9 | 9.5 |
8. AAR13288 | 51.7 | 37.5 | 63.6 | 38.8 | 63.5 | 30.2 | 40.8 | 14.3 | 7.9 |
9. CAA75213 | 48.6 | 36.5 | 62.0 | 35.6 | 60.7 | 30.5 | 39.1 | 13.0 | 10.5 |
10. CAB92956 | 49.2 | 35.5 | 62.0 | 34.8 | 61.0 | 29.5 | 39.1 | 12.5 | 9.9 |
11. AAC97494 | 49.5 | 35.5 | 63.0 | 34.8 | 61.9 | 29.5 | 39.7 | 12.5 | 8.6 |
12. AAC97493 | 49.8 | 36.9 | 59.5 | 39.8 | 59.4 | 28.0 | 38.3 | 13.7 | 11.6 |
13. NP_201307 | 48.1 | 40.4 | 59.6 | 39.6 | 60.8 | 27.9 | 40.1 | 12.9 | 10.7 |
14. CAA75214 | 48.9 | 35.3 | 60.8 | 35.3 | 59.4 | 29.8 | 38.9 | 13.0 | 9.9 |
15. ABB55363 | 48.3 | 35.3 | 61.0 | 34.0 | 60.6 | 29.2 | 38.4 | 13.2 | 10.2 |
16. NP_196585 | 50.5 | 38.7 | 61.4 | 38.8 | 58.2 | 28.3 | 39.4 | 12.9 | 11.4 |
17. CAA52903 | 49.1 | 36.3 | 60.3 | 36.0 | 59.6 | 27.5 | 37.6 | 13.0 | 9.4 |
18. AAZ67605 | 50.2 | 37.5 | 60.1 | 37.9 | 56.6 | 28.3 | 37.5 | 12.8 | 11.1 |
19. NP_181410 | 45.5 | 33.4 | 41.1 | 30.3 | 42.4 | 25.5 | 41.4 | 15.0 | 11.1 |
20. ABE65753 | 34.3 | 53.2 | 37.0 | 50.2 | 35.5 | 27.0 | 28.8 | 14.7 | 12.3 |
21. NP_181409 | 34.7 | 30.1 | 33.0 | 28.2 | 31.0 | 25.4 | 30.2 | 14.1 | 10.3 |
22. NP_196584 | 49.5 | 37.9 | 59.1 | 37.5 | 58.1 | 29.0 | 37.6 | 12.8 | 11.3 |
23. NP_568271 | 36.5 | 51.1 | 35.9 | 52.4 | 29.2 | 38.5 | 13.3 | 12.3 | |
24. NP_001063096 | 58.9 | 37.8 | 68.5 | 38.6 | 30.4 | 29.3 | 14.0 | 12.1 | |
25. NP_001048149 | 67.1 | 59.7 | 37.7 | 83.9 | 29.8 | 37.4 | 14.6 | 10.8 | |
26. NP_001061839 | 57.3 | 84.4 | 57.3 | 38.4 | 31.8 | 30.9 | 16.8 | 15.5 | |
27. NP_001057176 | 69.1 | 57.4 | 90.2 | 58.3 | 28.1 | 39.8 | 15.4 | 11.4 | |
28. NP_001063343 | 50.2 | 50.2 | 49.8 | 49.2 | 49.2 | 19.8 | 14.6 | 10.9 | |
29. NP_001055408 | 55.6 | 46.5 | 51.6 | 46.5 | 54.8 | 38.4 | 15.5 | 12.1 | |
30. NP_001061661 | 27.6 | 26.5 | 29.4 | 27.6 | 27.3 | 28.6 | 29.1 | 13.4 | |
31. NP_001051711 | 19.0 | 19.0 | 17.8 | 20.6 | 17.7 | 19.4 | 16.4 | 19.6 |
실시예
17: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 문자 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협 력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 많은 일반적인 단백질 도메인 및 패밀리를 포함하는 복수 서열 정렬 및 hidden Markov 모델의 큰 집합체이다. Pfam는 영국의 Sanger Institute server에서 호스팅된다. Interpro는 영국의 European Bioinformatics Institute에서 호스팅된다.
서열번호 84로 표시된 폴리펩티드 서열의 InterPro 스캔의 결과는 표 B3에 제시되어 있다.
표 B3: 서열번호 84로 표시된 폴리펩티드 서열의 InterPro 스캔 결과 (주요 등록번호)
데이터베이스 | 등록번호 | 등록명 | 서열번호 84에 근접하는 아미노산 |
PRODOM | PD000143 | Annexin | [16-78]T - [88-153]T - [172-239]T - [246-313]T |
PRINTS | PR00196 | ANNEXIN | [25-47]T - [65-81]T - [92-113]T - [255-275]T - [299-312]T |
GENE3D | G3DSA:1.10.220.10 | Annexin | [13-82]T - [83-161]T - [166-238]T - [243-317]T |
PANTHER | PTHR10502 | Annexin | [9-312]T |
PFAM | PF00191 | Annexin | [15-80]T - [87-152]T - [170-236]T - [246-311]T |
SMART | SM00335 | ANX | [28-80]T - [100-152]T - [183-232]T - [259-311]T |
PROFILE | PS00223 | ANNEXIN | [259-311]T |
SUPERFAMILY | SSF47874 | Annexin | [1-316]T |
PRINTS | PR01814 | ANNEXINPLANT | [119-133]T - [161-181]T - [227-245]T |
PANTHER | PTHR10502:SF10 | Annexin_like | [9-312]T |
실시예
18: 본 발명의 방법의 수행에 유용한 폴리펩티드 서열의
Topology
예측
TargetP 1.1는 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임 의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.
N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.
생물체 그룹 (비식물 또는 식물), 컷오프 세트 (없거나, 사전 지정된 컷오프 세트, 또는 사용자 정의된 컷오프 세트), 절단 부위 (유 또는 무) 예측의 계산 같은 많은 매개변수가 선택된다.
서열번호 84로 표시된 폴리펩티드 서열의 TargetP 1.1 분석 결과는 표 B4에 있다. "식물" 그룹이 선택되고, 컷오프는 지정되지 않고, 운반 펩티드의 예상 길이가 요청되었다. 서열번호 84로 표시된 폴리펩티드 서열의 세포 내 위치는 세포질 또는 핵일 수 있으며, 운반 펩티드가 없는 것으로 예측된다. 상기 예측은 애넥신 단백질이 원형질막, 액포 및 핵 외연과 관련되어 있다는 이전 보고 (Clark & Roux, Plant Physiol. 109, 1 133-1 139, 1995)와 일치한다.
표 B4: 서열번호 84로 표시된 폴리펩티드 서열의 TargetP 1.1 분석
길이 (AA) | 317 |
엽록체 운반 펩티드 | 0.102 |
미토콘드리아 운반 펩티드 | 0.126 |
분비 경로 신호 펩티드 | 0.045 |
세포 내 다른 표적 | 0.905 |
예측된 위치 | / |
신뢰 등급 | 2 |
예측된 운반 펩티드 길이 | / |
하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버 상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버 상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버 상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버 상에 호스팅된 TMHMM
실시예
19:
ANN
폴리펩티드에 대한 기능적 분석
애넥신-막 상호작용에 대한 분석 (Dabitz 등 Biochemistry 44, 16292-16300, 2005):
막 결합 분석 (
Copelletinq
분석)
인지질 소포를 Reeves 및 Dowben (J. Cell. Physiol. 73, 49-60, 1969)의 프로토콜에 따라 제조하였다. 식물 애넥신-막 결합 양상을 평가하기 위해 copelleting 분석을 수행하였다 (Hofmann 및 Huber, Methods Enzymol. 372, 186-216, 2003). 리포좀 버퍼에 0.5 nmol의 단백질 및 다양한 양의 칼슘을 포함하는 각 개별 시료(500 ㎕)에 대해 총 0.2 μmol의 인지질이 사용되었다. 이 단계에서, 10% SDS 100 ㎕에 단백질 0.1 nmol의 시료가 대조구로 준비되었다. 모든 시료를 원심분리하여 (4℃, 23,000 rpm으로 45분간), 펠렛(pellet)을 10% SDS 50 ㎕에 재현탁하여 SDS-PAGE에 사용하였다. 겔을 쿠마씨로 염색하여, ImageJ (Rasband, W. ImageJ,version 1.30, National Institutes of Health, Bethesda, MD, 2005)을 사용하여 광학농도 분석을 하였다. 각 칼슘 농도는 3 회 독립적으로 평가하였다. 표준결합방정식(standard binding equation)을 사용하여 SigmaPlot으로 Curve fitting을 수행하였다.
인지질 소포 제조
막 표면 소수성 및 리포좀 누설 평가를 위한 실험을 위해 하기 프로토콜을 사용하였다. 뇌 PS (phosphatidylserine), 난 PC (egg phosphatidylcholine), 난 PE (phosphatidylethanolamine), NBD-PE (nitrobenzoxadiazole phosphatidylethanolamine), 및 Rh-PE (lissamine rhodamine B sulfonyl phosphatidylethanolamine)를 구입하였다. MLVs (Multilamellar phospholipid vesicles)를 Bangham 등 (Preparation and use of liposomes as models of biological membranes, in Methods in Membrane Biology (Korn, E. D., Ed.) pp 1-68, Plenum Press, New York, 1974)의 방법으로 제조하였다. 5 회의 동결-해동 과정 및 연이어 압출기(extruder) (Lipex Biomembranes, Vancouver, BC)를 사용하여 30℃에서 0.1 μm Nucleopore 여과막을 통과하는 압출성형(extrusion, 5 회)으로 MLVs를 LUVs (large unilamellar vesicles)로 변환하였다. 인산염 측정은 Chen 등 (Anal. Chem. 28, 1756- 1758, 1956)의 방법에 따라 수행하였다.
막 표면 소수성
응집 (aggregation) 중에 발생하는, 2 개의 소포간에 수분이 없는 계면의 생성 또는 막 표면에 단백질의 결합에 의해 인지질 헤드그룹(headgroup)의 탈수로 인하여 막 표면 소수성이 증가한다. 막 표면 소수성의 변화는 소포를 방출 파장이 프로브 환경의 유전상수(dielectric constant)에 비례하는 dansyl-PE (N-[5-(dimethylamino)-naphthalene-2-sulfonyl)-1,2-dioleoylyl-sn-glycero-3-PE)로 표지하여 관찰 가능하다. 상기 환경에서, 순수한 PS, PS/PE (3:1), 및 1 mol % dansyl-PE를 포함하는 PS/PC (1:1) LUVs를 제조하여 900 ㎕ 버퍼용액에 첨가하였다 (최종 인지질 농도 45 μM). 상기 소포에 미치는 애넥신의 효과는 칼슘이 없는 시료에 200nM (0.18 nmol) 단백질을 주입하여 다른 pH 값에서 관찰하였다. 시료는 340 nm에서 여기되어, 400에서부터 600 nm에서 (23) 형광 방출이 기록되었다. 표면 소수성의 칼슘-의존성 양상은 단백질만의 효과 모니터링 이후에 관찰되었다.
리포좀
누출 분석
애넥신-인지질 상호작용은 인지질 소포를 불안정하게 만들 수 있어, 결국 소포 내부의 누출이 일어나게 된다. 소포 누출은 DPX (p-xylen-bis-pyridiniumbromid)의 존재하에서 ANTS (8-aminonaphthalene-1,3,6-trisulfonic acid)의 형광 소멸에 의해 탐지된다. 수용성 플루오로포어 (fluorophore) ANTS 및 그의 소멸제 DPX가 소포가 제조되는 동안에 버퍼액에 첨가된다. 과다한 ANTS/DPX 버퍼액은 Sephadex G-50 컬럼을 사용하여 겔 여과로 제거한다. 교란되지 않은 소포에 있어서는, 플루오로포어(fluorophore) 및 소멸제가 공간적으로 근접하여 DPX가 ANTS의 형광을 끈다. 소포 누출의 정도가 증가함으로써, ANTS 및 DPX가 외부 버퍼액으로 희석되어, ANTS의 형광이 증가하게 된다 (Ellens 등, Biochemistry 24, 3099-3106, 1985).
애넥신
1의
페록시다아제
(
Peroxidase
) 활성 분석 (
Gorecka
등 2005)
진핵세포 또는 원핵세포 시스템에서 발현되는 재조합 애넥신1 단백질의 페록시다아제(Peroxidase) 활성은 2 가지 방법으로 조사할 수 있다. 첫 번째 방법은 산화된 루미날(luminal)의 화학발광(chemiluminescence)에 기반한 것이다. 비변성 전기영동(non-denaturating electrophoresis)으로 분리된, 분석될 단백질을 포함하는 시료를 니트로셀룰로스(nitrocellulose) 막으로 옮겨, 루미놀(luminol)을 포함하는 현상액 (ECL kit, Amersham)으로 덮어, 제조자의 프로토콜에 따라 1시간 동안 X-ray 의학 필름에 노출시킨다. 또 다르게는, 재조합 애넥신1 단백질의 페록시다아제 활성은 여기 및 방출 양자에 대해 1-nm 슬릿으로 Fluorolog 3 분광형광계 (spectrofluorimeter: Jobin Yvon Spex, Edison, NJ)상에 Amplex Red reagent (Molecular Probes)로 형광강도측정법(fluorometric method)을 사용하여 결정된다. 분석 배지 (총 부피 100 ㎕)는 50 mM 인산칼륨 버퍼, pH 7.4, 2 mM H2O2, 최종 농도 100 μM의 Amplex Red reagent를 포함한다. 측정은 광로 길이(optical path length) 10 mm의 석영 큐벳(0.1 ml 부피)으로 하였다. Amplex Red reagent 산화의 산물인 resorufin의 형광방출은 λem 590 nm (λexc 560 nm)에서 기록하였다. 페록시다아제 활성에 미치는 단백질 인산화의 효과의 측정을 위해, AnnAt1은 측정에 앞서 알칼리성 인산분해효소(alkaline phosphatase: Sigma, 15 U/ml)와 36℃에서 10분간, pH 7.4 인산칼륨 버퍼 내에서 인큐베이션하였다. AnnAt1이 없는 시료가 대조구로 사용되었다.
실시예
20: 본 발명의 방법에 사용된 핵산 서열의
클로닝
본 발명의 방법에 사용된 핵산 서열은 주문제작한 아라비돕시스 탈리아나 실생 cDNA 라이브러리 (in pCMV Sport 6.0; Invitrogen, Paisley, UK)를 주형으로 사용하여 PCR로 증폭되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 prmO8727 (서열번호 85; 정방향, 개시 코돈은 볼드체): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggcgactcttaaggtttct-3' 및 prm09025 (서열번호 86; 역방향, 상보적): 5'-ggggaccactttgtacaagaaagctgggtttaagcatcatcttcaccgag-3', 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이 때 PCR 단편이 Gateway 용어에 따르면 "entry 클론" pANN을 생성하기 위해 pDONR201 플라 스미드와 인 비보(in vivo)로 재조합된다. 플라스미드 pDONR201은 Gateway 기술의 일부분으로서, Invitrogen으로부터 구입하였다.
서열번호 83을 포함하는 entry 클론이 오리자 사티바(Oryza sativa) 형질전환에 사용된 destination 벡터와 LR 반응에 사용되었다. 상기 벡터는 T-DNA 경계부 내에 기능적 인자로서 하기를 포함한다: 식물 선발 마커; 스크리닝 가능한 마커 발현 카세트; 및 entry 클론에 이미 클로닝된 목적 핵산 서열과 LR 인 비보(in vivo) 재조합 예정된 Gateway 카세트. 녹색 조직 특이적 발현을 위한 벼 익스팬신(expansin) 프로모터 (서열번호 95)는 상기 Gateway 카세트의 상부에 위치한다.
또 다른 일구현에서, GOS2 프로모터 (서열번호 94)를 포함하는 destination 벡터가 발현 벡터 pGOS2::ANN 생성에 사용되었다.
LR 재조합 단계 후, 생성된 발현 벡터 pEXP::ANN (도 10) 또는 pGOS2::ANN는 당업계에 주지된 방법에 따라 아그로박테리움(Agrobacterium) 균주 LBA4044로 형질전환되었다.
실시예
21: 식물 형질전환
벼 식물의 형질전환은 본 발명의 실시예 8에 기술된 과정에 따라 수행되었다.
실시예
22: 표현형 평가 절차
22.1 평가
셋업
약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 트랜스진의 유/무에 대하여 3:1로 분리되는 T1 자손 중 6 events를 보유하였다. 이들 events의 각각에 대해, 트랜스진을 갖는 (이형- 및 동형접합자) 약 10 개의 T1 실생 및 트랜스진이 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다.
4개의 T1 events는 T2 세대에서 T1 세대에 대해서와 동일한 평가 절차이나 event 당 보다 많은 개체로 한층 더 평가되었다. 파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 16 백만 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
가뭄 스크린
T2 종자로부터의 식물체를 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 모니터하기 위해 무작위로 선택한 화분에 습도 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동적으로 식물에 재급수하였다. 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서만큼 상세하게 기록하였다.
질소 이용 효율 스크린
T2 종자로부터의 벼 식물체를 양분액을 제외하고는 정상적인 조건하에서 화분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배 (식물 성숙, 종자 수확)의 나머지 부분은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건하의 생장에 대해서만큼 상세하게 기록하였다.
22.2 통계적 분석: F-검정
식물의 표현형적 특징의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 건의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 건에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
중복적인 events의 2 회 실험이 수행되었으므로, 조합된 분석이 수행되었다. 이는 두 실험에 걸친 효과의 일관성을 확인하기에 유용하며, 그렇다면 결론에 대한 신뢰도를 증가시키기 위해 양 실험으로부터의 증거를 축적하는 것이 유용하다. 사용된 방법은 자료의 다층구조를 고려하는 혼합모델 접근(mixed-model approach)이 다. P 값은 우도비 검정 (likelihood ratio test)을 카이 제곱 분포에 비교함으로써 구했다.
22.3 측정된 매개변수
생물량
관련 매개변수 측정
파종 단계에서부터 성숙 단계까지 식물에 디지털 이미지 캐비닛을 몇 회 통과시켰다. 매번 각 식물의 디지털 이미지 (2048x1536 픽셀, 1,600만 가지 색)를 적어도 6 가지 다른 각도에서 촬영하였다.
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충만된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충만된 깍지는 분석 저울로 무게를 재었다. 충만된 종자의 수는 분리 단계 후 남은 충만된 깍지의 수를 세어 결정하였다. 총 종자 수확량은 식물체로부터 수확된 모든 충만된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립중량 (TKW)은 숫자를 센 충만된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확지수 (HI)는 총 종자 수확량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수간의 비율이다. 본 발명에서 정의된 종자 충만도(fill rate)는 총 종자 (또는 소화) 수에 대한 충만된 종자 수의 비율 (%)로 표시된다.
실시예
23: 형질전환 식물의 표현형 평가 결과
구성적 프로모터에 작동가능하게 연결된 ANN 핵산을 발현하는 형질전환 벼 식물은 스트레스가 없는 조건하에서, 5% 이상의 증가를 보인 것은 총 종자 수확량, 충만된 종자의 수, 충만도, 및 수확 지수이었으며, TKW에 대해서는 3% 이상의 증가를 보였다. 가뭄 스트레스 조건하에서는 총 종자 수확량, 충만된 종자의 수, 및 충만도의 증가가 관찰되었다.
녹색 조직 특이적 프로모터에 작동가능하게 연결된 ANN 핵산을 발현하는 식물 또한 증가된 수확량, 특히 증가된 TKW를 나타내었다.
실시예
24: 다른 작물의 형질전환의 예
다른 작물의 형질전환은 본 발명의 상기 실시예 12에 기재되어 있다.
<110> Cropdesign N.V.
Crop Functional Genomics Center
<120> Plants having enhanced yield-related traits and a method for
making the same
<130> PF59233
<150> EP 07108768.8
<151> 2007-05-23
<150> US 60/932,226
<151> 2007-05-29
<150> EP 07110086.1
<151> 2007-06-12
<150> US 60/937,994
<151> 2007-06-29
<160> 155
<170> PatentIn version 3.3
<210> 1
<211> 848
<212> DNA
<213> Brassica rapa
<400> 1
ttgtacaaaa aagcaggctt aaacaatggc gtctgttgct tcttcaacca ctctcatctc 60
ctcctccgct agtgttctcc cagccaccaa gtcttcgctt cttccatctc cctccctctc 120
tttccttcca accctctcct ctccttcccc atccgcttct ctccggctcc ctcgtccctc 180
tcccctcacc tcaatccgct cctcttctcg ccggagcttc gctgtcaagg cccaaaccga 240
tgatcttcca ttggttggaa acaaggcgcc tgattttgag gcagaggctg tgttcgatca 300
ggagttcatc aaggtcaagc tctctgagta cattgggaag aagtatgtga ttctcttttt 360
ctaccccttg gacttcactt tcgtctgccc aacagagatt actgccttca gtgaccgata 420
tgcagaattt gagaagctga acacagaagt gttaggtgtc tctgttgata gtgtgttctc 480
ccaccttgct tgggttcaaa ccgacagaaa atctggagga cttggtgatc tcaactatcc 540
acttatatca gatgtcacta aatctatctc aaaatctttt ggagtgctca tccatgatca 600
gggaatagcg ttgagagggc ttttcataat agacaaggaa ggagtgatcc aacattcaac 660
catcaacaat cttggtattg gccgaagtgt tgatgagaca atgagaaccc ttcaggcatt 720
acagtacatc caggagaacc ctgatgaagt ctgccctgca ggatggaaac caggggagaa 780
gtcaatgaaa cctgacccca agctcagcaa agagtacttc tcagctattt agctcgaacc 840
cagctttc 848
<210> 2
<211> 268
<212> PRT
<213> Brassica rapa
<400> 2
Met Ala Ser Val Ala Ser Ser Thr Thr Leu Ile Ser Ser Ser Ala Ser
1 5 10 15
Val Leu Pro Ala Thr Lys Ser Ser Leu Leu Pro Ser Pro Ser Leu Ser
20 25 30
Phe Leu Pro Thr Leu Ser Ser Pro Ser Pro Ser Ala Ser Leu Arg Leu
35 40 45
Pro Arg Pro Ser Pro Leu Thr Ser Ile Arg Ser Ser Ser Arg Arg Ser
50 55 60
Phe Ala Val Lys Ala Gln Thr Asp Asp Leu Pro Leu Val Gly Asn Lys
65 70 75 80
Ala Pro Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu Phe Ile Lys
85 90 95
Val Lys Leu Ser Glu Tyr Ile Gly Lys Lys Tyr Val Ile Leu Phe Phe
100 105 110
Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe
115 120 125
Ser Asp Arg Tyr Ala Glu Phe Glu Lys Leu Asn Thr Glu Val Leu Gly
130 135 140
Val Ser Val Asp Ser Val Phe Ser His Leu Ala Trp Val Gln Thr Asp
145 150 155 160
Arg Lys Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Ile Ser Asp
165 170 175
Val Thr Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile His Asp Gln
180 185 190
Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile
195 200 205
Gln His Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser Val Asp Glu
210 215 220
Thr Met Arg Thr Leu Gln Ala Leu Gln Tyr Ile Gln Glu Asn Pro Asp
225 230 235 240
Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro
245 250 255
Asp Pro Lys Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265
<210> 3
<211> 841
<212> DNA
<213> Brassica rapa
<220>
<221> misc_feature
<222> (662)..(662)
<223> n is a, c, g, or t
<400> 3
gccatatggc gtctgttgct tcttcaacca ctctcatctc ctcctccgct agtgttctcc 60
cagccaccaa gtcttcgctt cttccatctc cctccctctc tttccttcca accctctcct 120
ctccttcccc atccgcttct ctccggtccc tcgtccctct cccctcacct caatccgctt 180
cctcttctcg ccggagcttc gctgtcaagg gccaaaccga tgatcttcca ttggttggaa 240
acaaggcgcc tgattttgag gcagagggtg tgttcgatca ggagttcatc aagttcatca 300
aggtcaagct ctctgattac attgggaaaa agtatgtgat tctctttttt ctaccccttg 360
acttcacttt cgtctgccca acagaaatta ctgccttcag tgaccgatat gcagaatttg 420
agaagctgaa tacagaagtg ttaggtgttt ctgttgatag tgtgagtgtg ttctcccacc 480
ttgctggggt tcaaaccgac agaaaatttg gaggacttgg tgatctcaac tatccactta 540
tatcagatgt cactaaatct atctcaaaat cttttggagt gctcatccat gatcagggaa 600
tagcgttgag agggcttttc ataatagaca aggaaggagt gatccaacat tcaaccatca 660
anaatcttgg tattggccga agtgttgatg agacaatgag aacccttcag gcattacagt 720
acatccagga aggccctggt gaagtctgcc ctgcaggatg gaaaccaggg gagaagtcaa 780
tgaaacctga ccccaagctc agcaaagagc tcttctcagc tatttagctc gaggctaagc 840
c 841
<210> 4
<211> 273
<212> PRT
<213> Brassica rapa
<220>
<221> UNSURE
<222> (219)..(219)
<223> Xaa can be any naturally occurring amino acid
<400> 4
Met Ala Ser Val Ala Ser Ser Thr Thr Leu Ile Ser Ser Ser Ala Ser
1 5 10 15
Val Leu Pro Ala Thr Lys Ser Ser Leu Leu Pro Ser Pro Ser Leu Ser
20 25 30
Phe Leu Pro Thr Leu Ser Ser Pro Ser Pro Ser Ala Ser Leu Arg Ser
35 40 45
Leu Val Pro Leu Pro Ser Pro Gln Ser Ala Ser Ser Ser Arg Arg Ser
50 55 60
Phe Ala Val Lys Gly Gln Thr Asp Asp Leu Pro Leu Val Gly Asn Lys
65 70 75 80
Ala Pro Asp Phe Glu Ala Glu Gly Val Phe Asp Gln Glu Phe Ile Lys
85 90 95
Phe Ile Lys Val Lys Leu Ser Asp Tyr Ile Gly Lys Lys Tyr Val Ile
100 105 110
Leu Phe Phe Leu Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile
115 120 125
Thr Ala Phe Ser Asp Arg Tyr Ala Glu Phe Glu Lys Leu Asn Thr Glu
130 135 140
Val Leu Gly Val Ser Val Asp Ser Val Ser Val Phe Ser His Leu Ala
145 150 155 160
Gly Val Gln Thr Asp Arg Lys Phe Gly Gly Leu Gly Asp Leu Asn Tyr
165 170 175
Pro Leu Ile Ser Asp Val Thr Lys Ser Ile Ser Lys Ser Phe Gly Val
180 185 190
Leu Ile His Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp
195 200 205
Lys Glu Gly Val Ile Gln His Ser Thr Ile Xaa Asn Leu Gly Ile Gly
210 215 220
Arg Ser Val Asp Glu Thr Met Arg Thr Leu Gln Ala Leu Gln Tyr Ile
225 230 235 240
Gln Glu Gly Pro Gly Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu
245 250 255
Lys Ser Met Lys Pro Asp Pro Lys Leu Ser Lys Glu Leu Phe Ser Ala
260 265 270
Ile
<210> 5
<211> 1002
<212> DNA
<213> Arabidopsis thaliana
<400> 5
gtgattgaca gatagataag agtgtttggt agctcagact cagagagtca caaagtgtgt 60
gtagcagcaa tggcgtctgt tgcttcttca actactctca tctcttctcc ctcttctagg 120
gtttttccag caaagtcttc actttcctct ccatctgttt ctttccttcg aaccctttct 180
tctccttccg catctgcttc tctccgctcc ggatttgctc gacgctcttc cctcagctcc 240
acttctcgtc ggagctttgc tgtcaaagcc caggccgatg atcttccact ggttggaaac 300
aaggcgcctg attttgaggc agaggctgtg tttgatcaag agttcatcaa ggttaagctc 360
tctgattaca ttggaaagaa gtatgtgatt ctctttttct acccattgga ctttactttc 420
gtctgcccaa cagagattac tgccttcagt gaccggcatt cagaatttga gaagttgaac 480
accgaagtat taggtgtttc tgtcgatagt gtgttctctc accttgcatg ggtccaaaca 540
gacaggaaat ctggagggct tggtgatctg aactatcccc ttatttcata tttcactaaa 600
tcaatctcaa agtcgttcgg agtgctcatc catgatcagg gaatagcact gagaggactt 660
ttcataatcg acaaggaagg agtgatccaa cattccacca tcaacaatct tggtattggc 720
caaagcgttg atgagacaat gagaaccctc caggcattac agtacatcca ggaaaacccg 780
gatgaagtct gcccagcagg atggaagccg ggtgagaagt caatgaaacc cgacccaaaa 840
ctcagcaaag agtacttctc agctatttag aaactctact atgatagcaa aaaggtacaa 900
tctttgttat atgtgagcag agtttttttt cttgtacgct aaaacaatcc tttgtttgat 960
tctcactttg tccccaaaat tataataaaa aactttttcc gc 1002
<210> 6
<211> 266
<212> PRT
<213> Arabidopsis thaliana
<400> 6
Met Ala Ser Val Ala Ser Ser Thr Thr Leu Ile Ser Ser Pro Ser Ser
1 5 10 15
Arg Val Phe Pro Ala Lys Ser Ser Leu Ser Ser Pro Ser Val Ser Phe
20 25 30
Leu Arg Thr Leu Ser Ser Pro Ser Ala Ser Ala Ser Leu Arg Ser Gly
35 40 45
Phe Ala Arg Arg Ser Ser Leu Ser Ser Thr Ser Arg Arg Ser Phe Ala
50 55 60
Val Lys Ala Gln Ala Asp Asp Leu Pro Leu Val Gly Asn Lys Ala Pro
65 70 75 80
Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu Phe Ile Lys Val Lys
85 90 95
Leu Ser Asp Tyr Ile Gly Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro
100 105 110
Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp
115 120 125
Arg His Ser Glu Phe Glu Lys Leu Asn Thr Glu Val Leu Gly Val Ser
130 135 140
Val Asp Ser Val Phe Ser His Leu Ala Trp Val Gln Thr Asp Arg Lys
145 150 155 160
Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Ile Ser Tyr Phe Thr
165 170 175
Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile His Asp Gln Gly Ile
180 185 190
Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His
195 200 205
Ser Thr Ile Asn Asn Leu Gly Ile Gly Gln Ser Val Asp Glu Thr Met
210 215 220
Arg Thr Leu Gln Ala Leu Gln Tyr Ile Gln Glu Asn Pro Asp Glu Val
225 230 235 240
Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro Asp Pro
245 250 255
Lys Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265
<210> 7
<211> 988
<212> DNA
<213> Brassica napus
<400> 7
gtcgaccacg cgtccggaga gaaagagaga gagagcagag ttcttcagtc catggcttcc 60
ttagcttcaa ccaccacact tatctcttca tctagcgttc ttcttccctc aaagccttct 120
cctttttctc ccgccgcctc cttcctccga actcttcctt ctacctccgt atctacctcc 180
tcttctctcc gctcctgttt ctccagcatc agtcccctca cctgcatccg ctcttcctct 240
cgccctagct tcgccgtcaa ggcccaggct gatgatttgc cactggttgg taacaaggcg 300
cctgattttg aggcagaggc tgtttttgac caagagttca tcaaggtgaa gctctcagag 360
tacattggta aaaagtatgt gattctgttt ctctaccctt tggacttcac ttttgtctgc 420
cctacggaga ttactgcctt cagtgaccgt tatgaagaat ttgagaagct aaacacggaa 480
gtgttaggtg tctcagtcga cagtgtgttc tcgcatcttg cgtgggtcca aacagagaga 540
aagtcaggag ggctgggtga cctgaactac ccacttgtct ctgatatcac taaatccatt 600
tcaaaatctt ttggagtgct catccctgat cagggcattg cactgagagg gcttttcatc 660
atcgacaaaa aaggagtcat acagcattcc acaatcaaca acctcggtat tggccgaagc 720
gttgatgaga caatgagaac cctccaggca ttgcagtatg ttcaagaaaa ccctgatgag 780
gtttgccccg cgggatggaa gcctggggag aaatcgatga agcctgaccc caagctgagc 840
aaagagtatt tttcagctat ttaaaggctt tttaaacaaa tgattggtga aaagcagagg 900
catgttttgt cttcattgct tatgtttctg ctatgtgtgt tttcctcaaa attgaataaa 960
aataatggaa tttaaaaaaa aaaaaaaa 988
<210> 8
<211> 270
<212> PRT
<213> Brassica napus
<400> 8
Met Ala Ser Leu Ala Ser Thr Thr Thr Leu Ile Ser Ser Ser Ser Val
1 5 10 15
Leu Leu Pro Ser Lys Pro Ser Pro Phe Ser Pro Ala Ala Ser Phe Leu
20 25 30
Arg Thr Leu Pro Ser Thr Ser Val Ser Thr Ser Ser Ser Leu Arg Ser
35 40 45
Cys Phe Ser Ser Ile Ser Pro Leu Thr Cys Ile Arg Ser Ser Ser Arg
50 55 60
Pro Ser Phe Ala Val Lys Ala Gln Ala Asp Asp Leu Pro Leu Val Gly
65 70 75 80
Asn Lys Ala Pro Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu Phe
85 90 95
Ile Lys Val Lys Leu Ser Glu Tyr Ile Gly Lys Lys Tyr Val Ile Leu
100 105 110
Phe Leu Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr
115 120 125
Ala Phe Ser Asp Arg Tyr Glu Glu Phe Glu Lys Leu Asn Thr Glu Val
130 135 140
Leu Gly Val Ser Val Asp Ser Val Phe Ser His Leu Ala Trp Val Gln
145 150 155 160
Thr Glu Arg Lys Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Val
165 170 175
Ser Asp Ile Thr Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile Pro
180 185 190
Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Lys Gly
195 200 205
Val Ile Gln His Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser Val
210 215 220
Asp Glu Thr Met Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Glu Asn
225 230 235 240
Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met
245 250 255
Lys Pro Asp Pro Lys Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265 270
<210> 9
<211> 1146
<212> DNA
<213> Arabidopsis thaliana
<400> 9
agctatttgg tttctctatc cgattcgtct ctctcacgcc ctcacgttta tccacctcat 60
cctcaaacca aaccacaaga cctctttttt aagtaaccaa tcacagagag atagagagag 120
agaacagagt caatgtcaat ggcgtctata gcttcttctt cttccaccac cctactctct 180
tcctctaggg ttcttcttcc ctccaagtct tctcttttat ctcctaccgt ctctttcccc 240
agaatcatac cctcttcctc ggcatcatcc tcttctctct gttccgggtt ctccagtctc 300
ggttccctca ccaccaaccg ctccgcctca cgccggaact tcgccgtcaa ggctcaggct 360
gatgatttac cactggtcgg taataaggcg cctgattttg aagctgaggc agtttttgat 420
caagagttca taaaggtgaa gctctctgag tacattggca aaaagtatgt tattctattc 480
ttctaccctt tggacttcac ttttgtctgc cccactgaga ttactgcctt cagtgaccgt 540
tatgaagaat ttgagaagct aaacaccgaa gtattagggg tctctgtcga cagtgtgttc 600
tcgcatcttg cgtgggtcca aacagacaga aagtcgggag ggctcggtga tctgaattat 660
cctcttgttt cggatatcac taaatccatt tcaaaatcgt ttggagtgct catccctgat 720
cagggcattg cactgagagg gcttttcatc atagacaagg aaggagtcat tcagcattcc 780
accatcaaca acctcggtat tggccgaagt gttgatgaga caatgagaac cctccaggca 840
ttacagtatg ttcaagaaaa cccggatgaa gtgtgccctg cgggatggaa gccaggggag 900
aaatcaatga aacctgaccc caagctcagc aaagaatact tttcagctat ctagaggcta 960
agattgaaca catgtttggt gaaaattagc aatcagagtt gttttattcg tcttttcaaa 1020
gttggagcag agttgttatt tttagccaaa gaacctttgt atctatctca tctttctcct 1080
gtttctgcta tgtgattctc cttaaattga atcaaaaata aagaaatcct tcttttcttt 1140
tgccaa 1146
<210> 10
<211> 271
<212> PRT
<213> Arabidopsis thaliana
<400> 10
Met Ala Ser Ile Ala Ser Ser Ser Ser Thr Thr Leu Leu Ser Ser Ser
1 5 10 15
Arg Val Leu Leu Pro Ser Lys Ser Ser Leu Leu Ser Pro Thr Val Ser
20 25 30
Val Pro Arg Thr Leu His Ser Ser Ser Ala Ser Ser Ser Ser Leu Cys
35 40 45
Ser Gly Phe Ser Ser Leu Gly Ser Leu Thr Thr Ser Arg Ser Ala Ser
50 55 60
Arg Arg Asn Phe Ala Val Lys Ala Gln Ala Asp Asp Leu Pro Leu Val
65 70 75 80
Gly Asn Lys Ala Pro Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu
85 90 95
Phe Ile Lys Val Lys Leu Ser Glu Tyr Ile Gly Lys Lys Tyr Val Ile
100 105 110
Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile
115 120 125
Thr Ala Phe Ser Asp Arg Tyr Glu Glu Phe Glu Lys Leu Asn Thr Glu
130 135 140
Val Leu Gly Val Ser Val Asp Ser Val Phe Ser His Leu Ala Trp Val
145 150 155 160
Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu
165 170 175
Val Ser Asp Ile Thr Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile
180 185 190
Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu
195 200 205
Gly Val Ile Gln His Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser
210 215 220
Val Asp Glu Thr Met Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Glu
225 230 235 240
Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser
245 250 255
Met Lys Pro Asp Pro Lys Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265 270
<210> 11
<211> 867
<212> DNA
<213> Spinacia oleracea
<400> 11
gtgtgtagca gcaatggcgt gtgttgcttc ttcaactact ctcatctctt ctccctcttc 60
tagggttttt ccagcaaagt cttcactttc ctctccatct gtttctttcc ttcgaaccct 120
ttcttctcct tccgcatctg cttctctccg ctccggattt gctcgacgct cttccctcag 180
ctccacttct cgtcggagct ttgctgtcaa agcccaggcc gatgatcttc cactggttgg 240
aaacaaggcg cctgattttg aggcagaggc tgtgtttgat caagagttca tcaaggttaa 300
gctctctgat tacattggaa agaagtatgt gattctgttt ttctacccat tggactttac 360
tttcgtctgc ccaacagaga ttactgcctt cagtgaccgg cattcagaat ttgagaagtt 420
gaacaccgaa gtattaggtg tttctgtcga tagtgtgttc tctcaccttg catgggtcca 480
aacagacagg aaatctggag ggcttggtga tctgaactat ccccttattt cagatgtcac 540
taaatcaatc tcaaagtcgt tcggagtgct catccatgat cagggaatag cactgagagg 600
acttttcata atcgacaagg aaggagtgat ccaacattcc accatcaaca atcttggtat 660
tggccgaagc gttgatgaga caatgagaac cctccaggca ttacagtaca caggaaaccc 720
ggatgaagtc tgcccagcag gatggaagcc gggtgagaag tcaatgaaac ccgacccaaa 780
actcagcaag gagtacttct cagctattta gaactctact atgatagcaa aggtacatct 840
ttgttatatg tgagcagagt ttttctg 867
<210> 12
<211> 265
<212> PRT
<213> Spinacia oleracea
<400> 12
Met Ala Cys Val Ala Ser Ser Thr Thr Leu Ile Ser Ser Pro Ser Ser
1 5 10 15
Arg Val Phe Pro Ala Lys Ser Ser Leu Ser Ser Pro Ser Val Ser Phe
20 25 30
Leu Arg Thr Leu Ser Ser Pro Ser Ala Ser Ala Ser Leu Arg Ser Gly
35 40 45
Phe Ala Arg Arg Ser Ser Leu Ser Ser Thr Ser Arg Arg Ser Phe Ala
50 55 60
Val Lys Ala Gln Ala Asp Asp Leu Pro Leu Val Gly Asn Lys Ala Pro
65 70 75 80
Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu Phe Ile Lys Val Lys
85 90 95
Leu Ser Asp Tyr Ile Gly Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro
100 105 110
Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp
115 120 125
Arg His Ser Glu Phe Glu Lys Leu Asn Thr Glu Val Leu Gly Val Ser
130 135 140
Val Asp Ser Val Phe Ser His Leu Ala Trp Val Gln Thr Asp Arg Lys
145 150 155 160
Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Ile Ser Asp Val Thr
165 170 175
Lys Ser Ile Ser Lys Ser Phe Gly Val Leu Ile His Asp Gln Gly Ile
180 185 190
Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His
195 200 205
Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser Val Asp Glu Thr Met
210 215 220
Arg Thr Leu Gln Ala Leu Gln Tyr Thr Gly Asn Pro Asp Glu Val Cys
225 230 235 240
Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro Asp Pro Lys
245 250 255
Leu Ser Lys Glu Tyr Phe Ser Ala Ile
260 265
<210> 13
<211> 990
<212> DNA
<213> Nicotiana tabacum
<400> 13
ggcacgagct cctatccaat ggcttgctct gcttcttcta cagcacttct ttcttccaac 60
ccaaaagcag cttccatttc ccccaaatcc tcctttcaag ctcccatttc tcaatgttta 120
tctgtacctt cctctttcaa tgggctccgt aattgcaagc cttttgtttc tcgtgtagcc 180
cgttccctct ctactcgcgt tgctcaatcc caacgccgtc gtttcgttgt tcgtgcctct 240
agtgaacttc cacttgttgg aaatcaagcg ccagactttg aggctgaagc tgtttttgat 300
caagaattca tcaaggttaa actatctgag tacattggga agaagtatgt cattctcttt 360
ttctacccac tagactttac atttgtttgc ccaacagaga tcactgcttt cagtgaccgt 420
tatggagaat ttgaaaagtt gaacacagaa atattgggtg tttccgtaga cagtgtgttc 480
tcccaccttg cctgggttca aactgataga aagtctggtg gcctaggtga tctgaactat 540
ccattaattt ccgacgtgac caagtcaatt tcaaaatcat acaatgttct gatccccgat 600
cagggaattg cattgagagg acttttcatc attgacaagg aaggagttat tcagcattca 660
accattaaca atcttggaat tggtcgtagt gttgatgaaa cattgagaac tcttcaggca 720
ttgcaatacg ttcaggataa cccggatgaa gtgtgcccag ctggatggaa gcctggggag 780
aaatccatga agcctgaccc caagggtagc aaagaatact ttgcatccat atgaggtgat 840
gactgcaatt gctttatcta atttgttgtt taggaaggct ggagacccta cttttctgtt 900
acatttttct aatgtaccgg ctgagtttgg tcatttttga gaatatatac acttgtacac 960
ttttaaaaaa aaaaaaaaaa aaaaaaaaaa 990
<210> 14
<211> 271
<212> PRT
<213> Nicotiana tabacum
<400> 14
Met Ala Cys Ser Ala Ser Ser Thr Ala Leu Leu Ser Ser Asn Pro Lys
1 5 10 15
Ala Ala Ser Ile Ser Pro Lys Ser Ser Phe Gln Ala Pro Ile Ser Gln
20 25 30
Cys Leu Ser Val Pro Ser Ser Phe Asn Gly Leu Arg Asn Cys Lys Pro
35 40 45
Phe Val Ser Arg Val Ala Arg Ser Leu Ser Thr Arg Val Ala Gln Ser
50 55 60
Gln Arg Arg Arg Phe Val Val Arg Ala Ser Ser Glu Leu Pro Leu Val
65 70 75 80
Gly Asn Gln Ala Pro Asp Phe Glu Ala Glu Ala Val Phe Asp Gln Glu
85 90 95
Phe Ile Lys Val Lys Leu Ser Glu Tyr Ile Gly Lys Lys Tyr Val Ile
100 105 110
Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile
115 120 125
Thr Ala Phe Ser Asp Arg Tyr Gly Glu Phe Glu Lys Leu Asn Thr Glu
130 135 140
Ile Leu Gly Val Ser Val Asp Ser Val Phe Ser His Leu Ala Trp Val
145 150 155 160
Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu
165 170 175
Ile Ser Asp Val Thr Lys Ser Ile Ser Lys Ser Tyr Asn Val Leu Ile
180 185 190
Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu
195 200 205
Gly Val Ile Gln His Ser Thr Ile Asn Asn Leu Gly Ile Gly Arg Ser
210 215 220
Val Asp Glu Thr Leu Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Asp
225 230 235 240
Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser
245 250 255
Met Lys Pro Asp Pro Lys Gly Ser Lys Glu Tyr Phe Ala Ser Ile
260 265 270
<210> 15
<211> 944
<212> DNA
<213> Phaseolus vulgaris
<400> 15
tctattctat ctacactcac tctctcactc tcccactctc ccatggcttc ctcagctccc 60
tgtgcttctc tcatatcctc aaaccctaac attctcttct ctcccaaatt cccttcttct 120
tccttttctt ccctctcctt ccccaattcc cccaactctc ttttcaaacc tttacgcact 180
tctctcaatc cttcatctcc ccctctcaga accttcgttg ccagggcttc gagtgaactt 240
ccattagttg ggaacacagc accggatttt gaagcagagg ccgtttttga tcaggagttc 300
atcaaggtca aactatctga ttatattggg aaaaaatatg ttatcctctt tttctatcca 360
ctggacttca cattcgtttg tccgacagaa atcactgcct tcagtgaccg gtatgcagag 420
tttgaggcac taaatacaga aattttgggt gtttcagttg acagtgtttt ttcacacctt 480
gcatgggttc aaactgatag aaagtcgggt ggtcttggcg acttgaatta tccattgatt 540
tctgatgtca ccaaatccat ctcaaaatct tatgatgttc tcattcccga tcaggggatt 600
gcattgagag gattgttcat tattgacaag gaaggggtta ttcagcattc taccattaac 660
aacctggcca ttggtagaag tgttgatgag acaaagagaa cgctccaggc cttgcagtat 720
gtgcaggaga acccagatga agtttgccca gctgggtgga agcctggtga gaagtccatg 780
aaaccagacc ctaaacttag caaagagtac ttctctgcta tttagggagg ataatggttg 840
aagagtagca attgctcata tgtatcaatc aatgataatt tgtataatgc aacgcaagtt 900
tataaagttt tgattgagag ggtctcatga ttatacaaaa aaaa 944
<210> 16
<211> 260
<212> PRT
<213> Phaseolus vulgaris
<400> 16
Met Ala Ser Ser Ala Pro Cys Ala Ser Leu Ile Ser Ser Asn Pro Asn
1 5 10 15
Ile Leu Phe Ser Pro Lys Phe Pro Ser Ser Ser Phe Ser Ser Leu Ser
20 25 30
Phe Pro Asn Ser Pro Asn Ser Leu Phe Lys Pro Leu Arg Thr Ser Leu
35 40 45
Asn Pro Ser Ser Pro Pro Leu Arg Thr Phe Val Ala Arg Ala Ser Ser
50 55 60
Glu Leu Pro Leu Val Gly Asn Thr Ala Pro Asp Phe Glu Ala Glu Ala
65 70 75 80
Val Phe Asp Gln Glu Phe Ile Lys Val Lys Leu Ser Asp Tyr Ile Gly
85 90 95
Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val
100 105 110
Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Ala Glu Phe Glu
115 120 125
Ala Leu Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser Val Phe Ser
130 135 140
His Leu Ala Trp Val Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly Asp
145 150 155 160
Leu Asn Tyr Pro Leu Ile Ser Asp Val Thr Lys Ser Ile Ser Lys Ser
165 170 175
Tyr Asp Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe
180 185 190
Ile Ile Asp Lys Glu Gly Val Ile Gln His Ser Thr Ile Asn Asn Leu
195 200 205
Ala Ile Gly Arg Ser Val Asp Glu Thr Lys Arg Thr Leu Gln Ala Leu
210 215 220
Gln Tyr Val Gln Glu Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys
225 230 235 240
Pro Gly Glu Lys Ser Met Lys Pro Asp Pro Lys Leu Ser Lys Glu Tyr
245 250 255
Phe Ser Ala Ile
260
<210> 17
<211> 1044
<212> DNA
<213> Pisum sativum
<220>
<221> misc_feature
<222> (968)..(968)
<223> n is a, c, g, or t
<400> 17
atggcttgct cagctccatt tgcttctctc ctatattcaa accctaacac actcttctct 60
cccaaattct cttctccgcg cctctcttct ctctcaatcc ccaatgcacc caattctctc 120
cccaaactac gcacttccct ccctctttcc ctcaaccgct cctcttcctc tcgccgcact 180
ttcgtcgtta gggcttctgg tgaattacca ttagttggga actcagcgcc ggattttgaa 240
gctgaagctg ttttcgatca ggagtttatc aaggtcaaac tatctgaata tattgggaag 300
aaatatgtta tcctcttttt ctacccattg gacttcacgt tcgtttgccc aacagaaatc 360
actgctttca gtgaccggca tgcagagttt gatgcaataa atactgagat tttgggtgtt 420
tcagttgaca gtgtgttctc gcaccttgca tgggttcaat cagatagaaa gtcaggtggc 480
cttggtgact tgaaatatcc tctggtttct gatgtcacca aatccatatc ggaatcttac 540
ggtgttctca ttcccgatca gggaattgca ttgagaggat tgttcattat cgataaggaa 600
ggggtgatcc aacattccac catcaacaac ctcggaattg gtagaagtgt tgacgagaca 660
aagagaacac tccaggcttt gcagtatgtg caggagaacc cagatgaagt ttgccctgct 720
gggtggaagc ctggtgagaa gtccatgaaa ccagacccca aaggtagcaa agagtacttt 780
gctgctgtgt agaatggcta atagtaaatt gctatgagta ttaactactc atctgtatca 840
tttgggatgt aaaaggattt tgttttatgt aattctatcc attttgaatt atgaggccta 900
tgggcttagc cataaaaata aaaagtatga ggtccaaaag tgtgtggtta cagaagcatg 960
cttgtgtncc ttgattttgg agtgaattat gaattgatgt attatctgta aaaaaaaaaa 1020
aaaaaaaaaa aaaaaaaaaa aaaa 1044
<210> 18
<211> 263
<212> PRT
<213> Pisum sativum
<400> 18
Met Ala Cys Ser Ala Pro Phe Ala Ser Leu Leu Tyr Ser Asn Pro Asn
1 5 10 15
Thr Leu Phe Ser Pro Lys Phe Ser Ser Pro Arg Leu Ser Ser Leu Ser
20 25 30
Ile Pro Asn Ala Pro Asn Ser Leu Pro Lys Leu Arg Thr Ser Leu Pro
35 40 45
Leu Ser Leu Asn Arg Ser Ser Ser Ser Arg Arg Thr Phe Val Val Arg
50 55 60
Ala Ser Gly Glu Leu Pro Leu Val Gly Asn Ser Ala Pro Asp Phe Glu
65 70 75 80
Ala Glu Ala Val Phe Asp Gln Glu Phe Ile Lys Val Lys Leu Ser Glu
85 90 95
Tyr Ile Gly Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp Phe
100 105 110
Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg His Ala
115 120 125
Glu Phe Asp Ala Ile Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser
130 135 140
Val Phe Ser His Leu Ala Trp Val Gln Ser Asp Arg Lys Ser Gly Gly
145 150 155 160
Leu Gly Asp Leu Lys Tyr Pro Leu Val Ser Asp Val Thr Lys Ser Ile
165 170 175
Ser Glu Ser Tyr Gly Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg
180 185 190
Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His Ser Thr Ile
195 200 205
Asn Asn Leu Gly Ile Gly Arg Ser Val Asp Glu Thr Lys Arg Thr Leu
210 215 220
Gln Ala Leu Gln Tyr Val Gln Glu Asn Pro Asp Glu Val Cys Pro Ala
225 230 235 240
Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro Asp Pro Lys Gly Ser
245 250 255
Lys Glu Tyr Phe Ala Ala Val
260
<210> 19
<211> 1078
<212> DNA
<213> Oryza sativa
<400> 19
acccaagctc ccaaacccct ctcgcaccca atccaaccca atcccctcct catccactcc 60
gctctgcggc catggccgcc tgctgctcct ccctcgccac cgccgtctcc tcctcctccg 120
ccaagcccct cgccggcatc ccccccgccg cgccgcactc cctctccctc ccccgcgctc 180
ccgccgccag gcccctccgc ctctccgcct cctcatccag atccgcccgg gccagcagct 240
tcgtcgcccg cgccggcggt gtggacgatg cgccgctggt cgggaacaag gcgcccgact 300
tcgatgcgga ggcagtcttc gaccaggagt tcatcaacgt gaagctgtcc gactacatcg 360
ggaagaagta cgtcattctc ttcttctacc cgttggactt caccttcgtc tgcccgaccg 420
agattaccgc tttcagtgac agatacgatg agttcgagaa gttgaacact gagatcctcg 480
gtgtttcaat tgacagtgtg ttctcccatc ttgcatgggt gcagacagac aggaaatctg 540
gtgggcttgg tgatctgaaa tacccattga tttcagatgt tactaaatca atttcgaagt 600
cctttggtgt cttgatccct gaccagggaa ttgctctgag aggacttttc atcattgaca 660
aggagggagt gattcagcac tctaccatta acaaccttgc cattggacgc agtgtagatg 720
agaccatgag gacccttcag gcgttgcagt acgtccagga caacccggac gaggtgtgcc 780
cggccggatg gaagcccggt gacaagtcga tgaagcctga ccccaaggga agcaaggagt 840
acttcgcggc catctaagca cacatatgca tatgcctggt gatggatgta gggagttttt 900
ttgctttcgc gagagccatt gcgtttcgtc tccaaagtgt agtaccgtgt gctcgtctga 960
tcggattttg ttacttgttc gccaccagct gttactttgt tccctaacaa ataaggcttt 1020
gttttggtcg tgttatacat gtatacatgt tagtgcgttt caagatcgct tctgtttt 1078
<210> 20
<211> 261
<212> PRT
<213> Oryza sativa
<400> 20
Met Ala Ala Cys Cys Ser Ser Leu Ala Thr Ala Val Ser Ser Ser Ser
1 5 10 15
Ala Lys Pro Leu Ala Gly Ile Pro Pro Ala Ala Pro His Ser Leu Ser
20 25 30
Leu Pro Arg Ala Pro Ala Ala Arg Pro Leu Arg Leu Ser Ala Ser Ser
35 40 45
Ser Arg Ser Ala Arg Ala Ser Ser Phe Val Ala Arg Ala Gly Gly Val
50 55 60
Asp Asp Ala Pro Leu Val Gly Asn Lys Ala Pro Asp Phe Asp Ala Glu
65 70 75 80
Ala Val Phe Asp Gln Glu Phe Ile Asn Val Lys Leu Ser Asp Tyr Ile
85 90 95
Gly Lys Lys Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe
100 105 110
Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Asp Glu Phe
115 120 125
Glu Lys Leu Asn Thr Glu Ile Leu Gly Val Ser Ile Asp Ser Val Phe
130 135 140
Ser His Leu Ala Trp Val Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly
145 150 155 160
Asp Leu Lys Tyr Pro Leu Ile Ser Asp Val Thr Lys Ser Ile Ser Lys
165 170 175
Ser Phe Gly Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu
180 185 190
Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His Ser Thr Ile Asn Asn
195 200 205
Leu Ala Ile Gly Arg Ser Val Asp Glu Thr Met Arg Thr Leu Gln Ala
210 215 220
Leu Gln Tyr Val Gln Asp Asn Pro Asp Glu Val Cys Pro Ala Gly Trp
225 230 235 240
Lys Pro Gly Asp Lys Ser Met Lys Pro Asp Pro Lys Gly Ser Lys Glu
245 250 255
Tyr Phe Ala Ala Ile
260
<210> 21
<211> 1067
<212> DNA
<213> Secale cereale
<400> 21
tcttcatatt cgggaaccct atctatctgg aggctaccgc ggccgccccc gggcactccc 60
cgcctgacaa ccacggccat ggcgtgcgcc ttctccgcct ccaccgtgtc cacggcggcc 120
gcgctcgtcg cgtccccgaa gccagccggg gcgccgagtg cctgtcgttt ccccgcgctt 180
cgcaggggcc gcgcaggcct ccgctgcgcg cggctcgagg acgccagggc ccgcagcttc 240
gtcgcccgcg ccgcagccga gtacgacctg ccactggtgg ggaacaaagc accggacttc 300
gctgcggagg ccgtgttcga ccaggagttc atcaacgtca agctatctga ttacattggg 360
aagaagtatg tgattctttt cttctaccct ctggacttca ccttcgtctg cccaactgag 420
attacggctt tcagcgacag acatgaggag ttcgagaaga taaacactga aattcttggt 480
gtttcagttg atagtgtgtt ttcccatctt gcatgggtgc agacagagag gaaatctggt 540
ggacttggtg atcttaagta tcctctggtt tctgatgtca ccaaatcaat ctcaaagtct 600
tttggtgtat tgatccctga tcagggaatt gctctgagag gattattcat gattgacaag 660
gagggtgtga ttcagcattc cactattaac aaccttggta ttggccgcag tgtggatgag 720
accttgagaa cccttcaggc tctgcaatac gtccaagaaa acccagacga ggtctgcccg 780
gcaggatgga aacccgggga aaagtcgatg aagcctgacc ctaagggcag caaggagtac 840
ttcgctgcca tctagatgcg acctttgcgc tcacagtctg agttttgtca tggccatttc 900
tggttacttg tgttcttgtg acccgagttg tagttatcac gcgtccaatt gcctctgtaa 960
ttcctccaat aagggtttgt ctgtgtgttg attttccctc ctccaatttg gaaagcccaa 1020
tccaagattg gaaataaaac cttctgccac ccaaaaaaaa aaaaaaa 1067
<210> 22
<211> 258
<212> PRT
<213> Secale cereale
<400> 22
Met Ala Cys Ala Phe Ser Ala Ser Thr Val Ser Thr Ala Ala Ala Leu
1 5 10 15
Val Ala Ser Pro Lys Pro Ala Gly Ala Pro Ser Ala Cys Arg Phe Pro
20 25 30
Ala Leu Arg Arg Gly Arg Ala Gly Leu Arg Cys Ala Arg Leu Glu Asp
35 40 45
Ala Arg Ala Arg Ser Phe Val Ala Arg Ala Ala Ala Glu Tyr Asp Leu
50 55 60
Pro Leu Val Gly Asn Lys Ala Pro Asp Phe Ala Ala Glu Ala Val Phe
65 70 75 80
Asp Gln Glu Phe Ile Asn Val Lys Leu Ser Asp Tyr Ile Gly Lys Lys
85 90 95
Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro
100 105 110
Thr Glu Ile Thr Ala Phe Ser Asp Arg His Glu Glu Phe Glu Lys Ile
115 120 125
Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser Val Phe Ser His Leu
130 135 140
Ala Trp Val Gln Thr Glu Arg Lys Ser Gly Gly Leu Gly Asp Leu Lys
145 150 155 160
Tyr Pro Leu Val Ser Asp Val Thr Lys Ser Ile Ser Lys Ser Phe Gly
165 170 175
Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Met Ile
180 185 190
Asp Lys Glu Gly Val Ile Gln His Ser Thr Ile Asn Asn Leu Gly Ile
195 200 205
Gly Arg Ser Val Asp Glu Thr Leu Arg Thr Leu Gln Ala Leu Gln Tyr
210 215 220
Val Gln Glu Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro Gly
225 230 235 240
Glu Lys Ser Met Lys Pro Asp Pro Lys Gly Ser Lys Glu Tyr Phe Ala
245 250 255
Ala Ile
<210> 23
<211> 876
<212> DNA
<213> Riccia fluitans
<400> 23
gttgggaaag gcagcaaata tggcaaccgc ctgtgctgca gtgtctgcag tggctgttcc 60
tgtggcctct gtagctaacc acattgcgtc ttcatcatct gggaccccat cccttgccat 120
tcccaggtct tatgagggtt taaacaaatc cttcggcgct agaattgcac cccgatcaac 180
ctccgctttt cgcaagcccg tcactggtgt ctccctcaag cagttctcga agggaaaagt 240
cgcttctgcg agatgtgcgt cacctcttgt tggaaatgtc gccccggact tcgaggcgga 300
ggccgttttt gaccaagagt tcgtgaagat caagctctcg gagtacattg ggaagagata 360
cgttgttctt ttcttctacc ctcttgactt caccttcgtt tgcccaacag aaattaccgc 420
atttagcgac aaacacgaag agtttgagaa gttgaacacc gaagttattg gggtttctac 480
tgacagtgtg ttttcccatc ttgcctggat tcaaactgac agaaaatctg gaggacttgg 540
tgacttgaag tacccacttg tgtccgactt gaccaagaag atcgctgaag attttggagt 600
attgatcccc gatcagggca ttgcattgcg aggattgttc atcatcgaca aggagggcgt 660
cattcagcac gcaaccatta acaatttggc catcggcaga agtgtggagg agacgcttcg 720
aactctgcag gctgtacaat atgtgcagga gaacccagac gaggtctgcc ccgctggctg 780
gaagccgggt gaaaagacca tgaagcctga cacaaagctc agcaaggagt acttcgcaca 840
agtataggcc gaaaatagct tcgtttggaa tacata 876
<210> 24
<211> 275
<212> PRT
<213> Riccia fluitans
<400> 24
Met Ala Thr Ala Cys Ala Ala Val Ser Ala Val Ala Val Pro Val Ala
1 5 10 15
Ser Val Ala Asn His Ile Ala Ser Ser Ser Ser Gly Thr Pro Ser Leu
20 25 30
Ala Ile Pro Arg Ser Tyr Glu Gly Leu Asn Lys Ser Phe Gly Ala Arg
35 40 45
Ile Ala Pro Arg Ser Thr Ser Ala Phe Arg Lys Pro Val Thr Gly Val
50 55 60
Ser Leu Lys Gln Phe Ser Lys Gly Lys Val Ala Ser Ala Arg Cys Ala
65 70 75 80
Ser Pro Leu Val Gly Asn Val Ala Pro Asp Phe Glu Ala Glu Ala Val
85 90 95
Phe Asp Gln Glu Phe Val Lys Ile Lys Leu Ser Glu Tyr Ile Gly Lys
100 105 110
Arg Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys
115 120 125
Pro Thr Glu Ile Thr Ala Phe Ser Asp Lys His Glu Glu Phe Glu Lys
130 135 140
Leu Asn Thr Glu Val Ile Gly Val Ser Thr Asp Ser Val Phe Ser His
145 150 155 160
Leu Ala Trp Ile Gln Thr Asp Arg Lys Ser Gly Gly Leu Gly Asp Leu
165 170 175
Lys Tyr Pro Leu Val Ser Asp Leu Thr Lys Lys Ile Ala Glu Asp Phe
180 185 190
Gly Val Leu Ile Pro Asp Gln Gly Ile Ala Leu Arg Gly Leu Phe Ile
195 200 205
Ile Asp Lys Glu Gly Val Ile Gln His Ala Thr Ile Asn Asn Leu Ala
210 215 220
Ile Gly Arg Ser Val Glu Glu Thr Leu Arg Thr Leu Gln Ala Val Gln
225 230 235 240
Tyr Val Gln Glu Asn Pro Asp Glu Val Cys Pro Ala Gly Trp Lys Pro
245 250 255
Gly Glu Lys Thr Met Lys Pro Asp Thr Lys Leu Ser Lys Glu Tyr Phe
260 265 270
Ala Gln Val
275
<210> 25
<211> 1255
<212> DNA
<213> Chlamydomonas incerta
<400> 25
atggccgctc tgcagtccgc ttcccgctcc tcggcggtgg ccttctcgcg ccaggcgcgc 60
gtggccccgc gcgttgcctc cagcgttgct cgccgcaacc tggtcgtgcg cgcttcccac 120
gctgagaagc ctctggtcgg ctccgtcgcc cctgacttca aggcccaggc cgtgttcgac 180
caggagttcc aggagattac cctgagcaag taccgcggca agtacgtggt gctgttcttc 240
taccccctgg acttcacctt cgtgtgcccc accgagatca ccgccttctc ggaccgctac 300
aaggagttca aggacatcaa caccgaggtc ctgggcgtgt ccgtggacag ccagttcacc 360
cacctggcct ggattcagac cgaccgcaag gagggtggcc tgggcgacct gaactacccc 420
ctggtggctg acctgaagaa ggagatctcc aaggcctacg gcgtcctgac cgaggacggc 480
atctccctgc gcggcctgtt catcatcgac aaggagggcg ttgtgcagca cgccaccatc 540
aacaacctgg ctttcggccg ctcggtcgac gagaccaagc gtgtgctgca ggccatccag 600
tacgtgcagt ccaaccccga tgaggtctgc cccgccggct ggaagcccgg tgacaagacc 660
atgaagcccg accccaaggg ctccaaggag tacttcgccg ccgtgtaaat tgacccttga 720
ttgagagtca atgacacgcg agggcgtcat cgcagtactc gggggcatgc tgcagatcag 780
caggcatgcg gacgagacca gtgcattggc aggctaggcg cacacgggag gcagagccag 840
tgcggcggca gcggcgagcg gcggctgtgg aagcaggcgc tagcagcagc ggcggccgcg 900
gcggcgctgc tctccatggg tgcgcctgca agcagcatgt gcatgtggac tcggtgcttc 960
tcgttgatgg gtcagggcgg cgttgccggt ggtgcggacc gggcggtaat cgcacgtagc 1020
tcaattgttg cgtgcgggcg ctgtgcgggc tggcgtgacg gcacgcaacc tgtgtggggc 1080
ctgttggtac gctcgcgata atgcagtgcg cggtccgagc ggagggacgc ggcggtgaat 1140
agctgctgta gtttcaggca gggatttacc aggtgacggg tggttgcgcc cacacccgaa 1200
cggctgtgat cccaattttc catgagaggg cttgcagatg gacggcgtgt gatcg 1255
<210> 26
<211> 235
<212> PRT
<213> Chlamydomonas incerta
<400> 26
Met Ala Ala Leu Gln Ser Ala Ser Arg Ser Ser Ala Val Ala Phe Ser
1 5 10 15
Arg Gln Ala Arg Val Ala Pro Arg Val Ala Ser Ser Val Ala Arg Arg
20 25 30
Asn Leu Val Val Arg Ala Ser His Ala Glu Lys Pro Leu Val Gly Ser
35 40 45
Val Ala Pro Asp Phe Lys Ala Gln Ala Val Phe Asp Gln Glu Phe Gln
50 55 60
Glu Ile Thr Leu Ser Lys Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe
65 70 75 80
Tyr Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe
85 90 95
Ser Asp Arg Tyr Lys Glu Phe Lys Asp Ile Asn Thr Glu Val Leu Gly
100 105 110
Val Ser Val Asp Ser Gln Phe Thr His Leu Ala Trp Ile Gln Thr Asp
115 120 125
Arg Lys Glu Gly Gly Leu Gly Asp Leu Asn Tyr Pro Leu Val Ala Asp
130 135 140
Leu Lys Lys Glu Ile Ser Lys Ala Tyr Gly Val Leu Thr Glu Asp Gly
145 150 155 160
Ile Ser Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Val Gln
165 170 175
His Ala Thr Ile Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr
180 185 190
Lys Arg Val Leu Gln Ala Ile Gln Tyr Val Gln Ser Asn Pro Asp Glu
195 200 205
Val Cys Pro Ala Gly Trp Lys Pro Gly Asp Lys Thr Met Lys Pro Asp
210 215 220
Pro Lys Gly Ser Lys Glu Tyr Phe Ala Ala Val
225 230 235
<210> 27
<211> 612
<212> DNA
<213> Nostoc sp.
<400> 27
atgtccatca cctacggaac acaagaaagc ctccgcgttg gtcaacaggc tcccgacttt 60
acagcaacag ctgtagttga tcaggaattc aagacaatta agctttccga ctatcgtggt 120
aagtacgttg tcttgttctt ctatccccta gactttacct ttgtttgccc cacggagatc 180
acagcattta gcgatcgcta cgaagaattc aagaaactta acaccgaaat tctcggtgtg 240
tccgttgata gcgagttctc ccacctagct tggattcaaa ctgatcgtaa gtctggtggt 300
gttggcgacc taaattatcc cttagtttcc gatattaaga aagaggttag cgacgcttac 360
aacgtactag acccagcagc aggtatcgct ttacgtggtc tgttcatcat cgataaagat 420
ggtatcattc agcacgctac cattaacaac ctagcttttg gtcgtagcgt tgatgaaacc 480
ctacggacat tgcaagcaat ccagtatgtc cagtctcacc cagatgaagt ttgccctgct 540
ggttggcaac ctggggaaaa gaccatgact cccgaccctg tgaagtccaa agtttacttc 600
gctgctgtgt aa 612
<210> 28
<211> 203
<212> PRT
<213> Nostoc sp.
<400> 28
Met Ser Ile Thr Tyr Gly Thr Gln Glu Ser Leu Arg Val Gly Gln Gln
1 5 10 15
Ala Pro Asp Phe Thr Ala Thr Ala Val Val Asp Gln Glu Phe Lys Thr
20 25 30
Ile Lys Leu Ser Asp Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr
35 40 45
Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser
50 55 60
Asp Arg Tyr Glu Glu Phe Lys Lys Leu Asn Thr Glu Ile Leu Gly Val
65 70 75 80
Ser Val Asp Ser Glu Phe Ser His Leu Ala Trp Ile Gln Thr Asp Arg
85 90 95
Lys Ser Gly Gly Val Gly Asp Leu Asn Tyr Pro Leu Val Ser Asp Ile
100 105 110
Lys Lys Glu Val Ser Asp Ala Tyr Asn Val Leu Asp Pro Ala Ala Gly
115 120 125
Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Asp Gly Ile Ile Gln
130 135 140
His Ala Thr Ile Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr
145 150 155 160
Leu Arg Thr Leu Gln Ala Ile Gln Tyr Val Gln Ser His Pro Asp Glu
165 170 175
Val Cys Pro Ala Gly Trp Gln Pro Gly Glu Lys Thr Met Thr Pro Asp
180 185 190
Pro Val Lys Ser Lys Val Tyr Phe Ala Ala Val
195 200
<210> 29
<211> 609
<212> DNA
<213> Synechococcus sp.
<400> 29
ctacttggca atcgccgcga agaactcctt ggatttcact gggtcggggt gcatggtttt 60
ctggccgggc tgccagttgg ccgggcaaac ttcatcgggg tgagattgca cgtattggat 120
agcttgcagg gtgcgcaagg tttcatccac actgcggcca aaggccaggt tgttaatggt 180
ggcgtgctgg atgatccctt ctttgtcgat gatgaacagg ccgcgcagcg ccacaccggc 240
ctccggatcc agaacattgt aggcagcgct gatctccttt ttcaggtcag agaccagagg 300
ataccttagc tcgcccaccc ctccggcttt gcggtcggtc tggatccagg ccaagtgaga 360
gtattcgctg tccaccgaga cgcccaggat ctcggtatcc agcttggcaa agtcgtcata 420
gcggtcgcta aaggccgtga tctccgttgg gcagacaaag gtgaagtcca aggggtagaa 480
gaacagcacc acatacttct taccccggta gtcggagagc ttcaccgtct tgaattccat 540
gtcatagacg gcggtggccg aaaaatcggg agcgggctgc cccactcgca ggcatccttc 600
ctgagacat 609
<210> 30
<211> 202
<212> PRT
<213> Synechococcus sp.
<400> 30
Met Ser Gln Glu Gly Cys Leu Arg Val Gly Gln Pro Ala Pro Asp Phe
1 5 10 15
Ser Ala Thr Ala Val Tyr Asp Met Glu Phe Lys Thr Val Lys Leu Ser
20 25 30
Asp Tyr Arg Gly Lys Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp
35 40 45
Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr
50 55 60
Asp Asp Phe Ala Lys Leu Asp Thr Glu Ile Leu Gly Val Ser Val Asp
65 70 75 80
Ser Glu Tyr Ser His Leu Ala Trp Ile Gln Thr Asp Arg Lys Ala Gly
85 90 95
Gly Val Gly Glu Leu Arg Tyr Pro Leu Val Ser Asp Leu Lys Lys Glu
100 105 110
Ile Ser Ala Ala Tyr Asn Val Leu Asp Pro Glu Ala Gly Val Ala Leu
115 120 125
Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Ile Ile Gln His Ala Thr
130 135 140
Ile Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr Leu Arg Thr
145 150 155 160
Leu Gln Ala Ile Gln Tyr Val Gln Ser His Pro Asp Glu Val Cys Pro
165 170 175
Ala Asn Trp Gln Pro Gly Gln Lys Thr Met His Pro Asp Pro Val Lys
180 185 190
Ser Lys Glu Phe Phe Ala Ala Ile Ala Lys
195 200
<210> 31
<211> 612
<212> DNA
<213> Nodularia spumigena
<400> 31
atgtccctca cttacgcaac agaaggatgc ctccgcgttg gtcaacaggc tcctgaattt 60
acagccacag ctgtggtaga tcaagaattt aagaccatta aactttccga ctatcgcggt 120
aagtatgtgg ttctgttttt ctacccctta gactttacct ttgtttgccc cactgagatc 180
acagcattta gcgatcgcta cgaagaattt aagaaagtta acacagaagt tctcggtgtt 240
tccgttgata gcgaattctc tcacctagcc tggattcaaa ctgaacgcaa gtctggtggt 300
gtcggcgacc tcaattatcc cttagtttcg gacatcaaaa aagagattag cgccacctac 360
aatgtccttg acccagccgc aggtattgct ttacgcggtt tgttcattat tgataaagat 420
ggtatcatcc agcattctac agtgaataac ctcgcctttg gtcgcagcgt tgatgaaacc 480
ctgcggacat tgcaagccct tcagtatgtt cagtctcacc ccgatgaagt ttgcccagcc 540
ggttggcaac ctggtgatca aacaatggtt cctgaccctg tgaagtcgaa agtctacttc 600
tcggctgtct ag 612
<210> 32
<211> 203
<212> PRT
<213> Nodularia spumigena
<400> 32
Met Ser Leu Thr Tyr Ala Thr Glu Gly Cys Leu Arg Val Gly Gln Gln
1 5 10 15
Ala Pro Glu Phe Thr Ala Thr Ala Val Val Asp Gln Glu Phe Lys Thr
20 25 30
Ile Lys Leu Ser Asp Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr
35 40 45
Pro Leu Asp Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser
50 55 60
Asp Arg Tyr Glu Glu Phe Lys Lys Val Asn Thr Glu Val Leu Gly Val
65 70 75 80
Ser Val Asp Ser Glu Phe Ser His Leu Ala Trp Ile Gln Thr Glu Arg
85 90 95
Lys Ser Gly Gly Val Gly Asp Leu Asn Tyr Pro Leu Val Ser Asp Ile
100 105 110
Lys Lys Glu Ile Ser Ala Thr Tyr Asn Val Leu Asp Pro Ala Ala Gly
115 120 125
Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Asp Gly Ile Ile Gln
130 135 140
His Ser Thr Val Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr
145 150 155 160
Leu Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Ser His Pro Asp Glu
165 170 175
Val Cys Pro Ala Gly Trp Gln Pro Gly Asp Gln Thr Met Val Pro Asp
180 185 190
Pro Val Lys Ser Lys Val Tyr Phe Ser Ala Val
195 200
<210> 33
<211> 594
<212> DNA
<213> Thermosynechococcus elongatus
<400> 33
ttagcccacg gcttcaaaat agactttgga tttgacaggg tcagggttca tcgtcttgtc 60
accggggtgc cagcccgcgg ggcagacttc atcggggtga gtttgaacgt attgaatcgc 120
ttggagtacc cgcagggtct catcaacact gcggccaaag gccaagttat tgattgttgc 180
gtgttggata atcccttctt tatcaatgat gaacagaccc cgcagggcca cgccttcttc 240
ggtcaggaca ttgtaggcag tgctgatgtc ttttttcagg tcagacacca agggatattt 300
aagatcgccg acaccaccag ctttgcgatc agtttgtgtc caagccaagt gggagaactg 360
gctatccaca gacacgccca ggatttcggt gttcaatttg gcaaattcat cgtagcgatc 420
gctaaaggca acaatttccg tggggcagac aaaggtaaag tccaagggat agaaaaagag 480
aacaacgtac ttaccgcgat agtccgagag cttgatggtt ttgaactctt ggtcataaac 540
agcaaccgct tcaaaatcgg gggcgggttg accgacgcgc agacactcag acat 594
<210> 34
<211> 197
<212> PRT
<213> Thermosynechococcus elongatus
<400> 34
Met Ser Glu Cys Leu Arg Val Gly Gln Pro Ala Pro Asp Phe Glu Ala
1 5 10 15
Val Ala Val Tyr Asp Gln Glu Phe Lys Thr Ile Lys Leu Ser Asp Tyr
20 25 30
Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr Phe
35 40 45
Val Cys Pro Thr Glu Ile Val Ala Phe Ser Asp Arg Tyr Asp Glu Phe
50 55 60
Ala Lys Leu Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser Gln Phe
65 70 75 80
Ser His Leu Ala Trp Thr Gln Thr Asp Arg Lys Ala Gly Gly Val Gly
85 90 95
Asp Leu Lys Tyr Pro Leu Val Ser Asp Leu Lys Lys Asp Ile Ser Thr
100 105 110
Ala Tyr Asn Val Leu Thr Glu Glu Gly Val Ala Leu Arg Gly Leu Phe
115 120 125
Ile Ile Asp Lys Glu Gly Ile Ile Gln His Ala Thr Ile Asn Asn Leu
130 135 140
Ala Phe Gly Arg Ser Val Asp Glu Thr Leu Arg Val Leu Gln Ala Ile
145 150 155 160
Gln Tyr Val Gln Thr His Pro Asp Glu Val Cys Pro Ala Gly Trp His
165 170 175
Pro Gly Asp Lys Thr Met Asn Pro Asp Pro Val Lys Ser Lys Val Tyr
180 185 190
Phe Glu Ala Val Gly
195
<210> 35
<211> 693
<212> DNA
<213> Ostreococcus tauri
<400> 35
atgttgtccg cgagtttgtc caagagcgcg ttcacgccca gggcgtcggc gctccagaag 60
agcgttaagg ggaagaactt ctcccgatcc gccgtccgcg tggaagcgcg caagccgctc 120
gtgggctacc cggcgccgga gtttagcgcc gaggcggtgt tcgatcaaga gttccaagac 180
atcaagctct cggattaccg cggcaagtac gtcgtgctct tcttctaccc gctcgatttt 240
acctttgtgt gcccgacgga aatcaccgcc ttctccgatc gctacgaaga gttcgcgaag 300
ctcaacaccg aagtcctcgg cgtgagcgtt gactccaagt tctctcactt ggcgtggttg 360
caaaccgacc gcaacgacgg cggcctcggc gacttggcct acccgctcgt cagtgacctc 420
aagcgcgaaa tctgcgaatc gtacgatgtg ttgtacgaag acggcaccgc gctccgtggg 480
ttgtacatca tcgatcgtga gggcgtcatc cagcactaca catgcaacaa cgctccgttc 540
ggccgcaacg tcgacgagtg cctgcgcgtg cttcaagcga tccaatacgt tcaaaacaac 600
ccagacgagg tgtgcccggc gggctggacc ccgggtgcgg cgacgatgaa gccggatccg 660
aagggctcga aggaatactt caaggcgatc taa 693
<210> 36
<211> 230
<212> PRT
<213> Ostreococcus tauri
<400> 36
Met Leu Ser Ala Ser Leu Ser Lys Ser Ala Phe Thr Pro Arg Ala Ser
1 5 10 15
Ala Leu Gln Lys Ser Val Lys Gly Lys Asn Phe Ser Arg Ser Ala Val
20 25 30
Arg Val Glu Ala Arg Lys Pro Leu Val Gly Tyr Pro Ala Pro Glu Phe
35 40 45
Ser Ala Glu Ala Val Phe Asp Gln Glu Phe Gln Asp Ile Lys Leu Ser
50 55 60
Asp Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe
65 70 75 80
Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Glu
85 90 95
Glu Phe Ala Lys Leu Asn Thr Glu Val Leu Gly Val Ser Val Asp Ser
100 105 110
Lys Phe Ser His Leu Ala Trp Leu Gln Thr Asp Arg Asn Asp Gly Gly
115 120 125
Leu Gly Asp Leu Ala Tyr Pro Leu Val Ser Asp Leu Lys Arg Glu Ile
130 135 140
Cys Glu Ser Tyr Asp Val Leu Tyr Glu Asp Gly Thr Ala Leu Arg Gly
145 150 155 160
Leu Tyr Ile Ile Asp Arg Glu Gly Val Ile Gln His Tyr Thr Cys Asn
165 170 175
Asn Ala Pro Phe Gly Arg Asn Val Asp Glu Cys Leu Arg Val Leu Gln
180 185 190
Ala Ile Gln Tyr Val Gln Asn Asn Pro Asp Glu Val Cys Pro Ala Gly
195 200 205
Trp Thr Pro Gly Ala Ala Thr Met Lys Pro Asp Pro Lys Gly Ser Lys
210 215 220
Glu Tyr Phe Lys Ala Ile
225 230
<210> 37
<211> 609
<212> DNA
<213> Synechococcus sp.
<400> 37
ctacttggca accgccgcga agaactcctt ggatttcacc gggtcggggt tcagggttct 60
ctggccgggc tgccagttgg ccgggcaaac ttcatcgggg tgagcttgca cgtactggat 120
ggcctgcagg gtgcgcaggg tttcatccac gctgcggcca aaggccaggt tgttgatggt 180
ggcgtgctgg atgatccctt ccttgtcgat gatgaacagg ccgcgcaaag ccacccctgc 240
cgccggatcc aggacattgt aggcggcgct gatctccttt ttcaggtcgg agaccagcgg 300
atacctcagc tcgcccaccc ctccggcttt gcggtcggtc tgaatccagg ccaggtgaga 360
gtactcgcta tccaccgaga cgccgaggat ctccgtgtcc agcttggcaa actcgtcgta 420
gcgatcgctg aaagccgtga tctccgtcgg gcagacgaag gtgaagtcca aggggtagaa 480
gaacagcacc acgtacttct tgccccggta gtcggagagc ctcaccgtct taaattccat 540
gtcgtaaacg gcagtggccg aaaaatcggg agcgggctgc cccacccgca gacatccttc 600
ctgagacat 609
<210> 38
<211> 202
<212> PRT
<213> Synechococcus sp.
<400> 38
Met Ser Gln Glu Gly Cys Leu Arg Val Gly Gln Pro Ala Pro Asp Phe
1 5 10 15
Ser Ala Thr Ala Val Tyr Asp Met Glu Phe Lys Thr Val Arg Leu Ser
20 25 30
Asp Tyr Arg Gly Lys Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp
35 40 45
Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr
50 55 60
Asp Glu Phe Ala Lys Leu Asp Thr Glu Ile Leu Gly Val Ser Val Asp
65 70 75 80
Ser Glu Tyr Ser His Leu Ala Trp Ile Gln Thr Asp Arg Lys Ala Gly
85 90 95
Gly Val Gly Glu Leu Arg Tyr Pro Leu Val Ser Asp Leu Lys Lys Glu
100 105 110
Ile Ser Ala Ala Tyr Asn Val Leu Asp Pro Ala Ala Gly Val Ala Leu
115 120 125
Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Ile Ile Gln His Ala Thr
130 135 140
Ile Asn Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr Leu Arg Thr
145 150 155 160
Leu Gln Ala Ile Gln Tyr Val Gln Ala His Pro Asp Glu Val Cys Pro
165 170 175
Ala Asn Trp Gln Pro Gly Gln Arg Thr Leu Asn Pro Asp Pro Val Lys
180 185 190
Ser Lys Glu Phe Phe Ala Ala Val Ala Lys
195 200
<210> 39
<211> 603
<212> DNA
<213> Synechococcus sp.
<400> 39
tcaaccgatg gcggagaaat actccttgga acctttcgga tcgggcttca tggtcttttc 60
gccgggcgtc cagttggcgg ggcagacttc atcggggttg gactgcacgt actggaaggc 120
ctgaagcaca cgcagggttt cgtccacatt ccggccaaca ggcaggttgt tgatcgtgga 180
gtgcatgatc acgccatcgg gatcgatgat gaacagtcca cgcaaagcaa cgccttcggc 240
gtcgtccagc acgttgtatg cggtggcgat ttccttcttg aggtcagcga ccaggggata 300
gttgatgtcg cccagaccgc cctgattgcg gggagtctga atccaggcca gatggctgaa 360
ctggctgtca acggaaacgc cgaggacttc ggtgttcttg ctggagaaat cggcgtagcg 420
gtcgctgaag gccgtgattt ctgtggggca gacgaaggtg aaatccaggg gatagaagaa 480
gagcaccacg tacttgccgc ggtactggga cagggagatt tccttgaatt cctggtccac 540
cactgcagtg gcagtgaaat cgggggcctg ctggcccaca cgaaggcaac cggtctcggt 600
cat 603
<210> 40
<211> 200
<212> PRT
<213> Synechococcus sp.
<400> 40
Met Thr Glu Thr Gly Cys Leu Arg Val Gly Gln Gln Ala Pro Asp Phe
1 5 10 15
Thr Ala Thr Ala Val Val Asp Gln Glu Phe Lys Glu Ile Ser Leu Ser
20 25 30
Gln Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe
35 40 45
Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Ala
50 55 60
Asp Phe Ser Ser Lys Asn Thr Glu Val Leu Gly Val Ser Val Asp Ser
65 70 75 80
Gln Phe Ser His Leu Ala Trp Ile Gln Thr Pro Arg Asn Gln Gly Gly
85 90 95
Leu Gly Asp Ile Asn Tyr Pro Leu Val Ala Asp Leu Lys Lys Glu Ile
100 105 110
Ala Thr Ala Tyr Asn Val Leu Asp Asp Ala Glu Gly Val Ala Leu Arg
115 120 125
Gly Leu Phe Ile Ile Asp Pro Asp Gly Val Ile Met His Ser Thr Ile
130 135 140
Asn Asn Leu Pro Val Gly Arg Asn Val Asp Glu Thr Leu Arg Val Leu
145 150 155 160
Gln Ala Phe Gln Tyr Val Gln Ser Asn Pro Asp Glu Val Cys Pro Ala
165 170 175
Asn Trp Thr Pro Gly Glu Lys Thr Met Lys Pro Asp Pro Lys Gly Ser
180 185 190
Lys Glu Tyr Phe Ser Ala Ile Gly
195 200
<210> 41
<211> 597
<212> DNA
<213> Synechococcus elongatus
<400> 41
ctagactgca gcgaagaact ctttcgactt aacagggtcg gggttcatcg tcgctgcacc 60
cggttgccaa ttggcggggc aaacttcatc ggggtgactt tggacgtact gaatggcttg 120
cagcacccgc agggtttcat caacgctgcg gccaaacgcc aggttgttga tggtggcgtg 180
ctggatcaca ccttctttgt cgatgatgaa cagaccgcgc agggcaatgc cttcagccgg 240
atcaagcacg ttgtaggcag tgctgatttc tttcttgagg tcagcaacca gcgggtaagc 300
caagtcaccc aaaccacctt ctttacggct ggtttgaatc caagccaagt ggctgaattg 360
gctatcgacc gagacaccca agatttcggt gttcagggct gaaaagtctg catagcgatc 420
gctaaaagca gtaatttcgg tcgggcaaac aaaggtgaag tcgaggggat agaagaacag 480
aacgacgtat ttgccccggt aattggatag cttgatcgtc tggaattcct gatcaacgac 540
tgcagtcgct tcaaaatcgg gggccaattg gccgacgcgc agggctcctt cggtcat 597
<210> 42
<211> 198
<212> PRT
<213> Synechococcus elongatus
<400> 42
Met Thr Glu Gly Ala Leu Arg Val Gly Gln Leu Ala Pro Asp Phe Glu
1 5 10 15
Ala Thr Ala Val Val Asp Gln Glu Phe Gln Thr Ile Lys Leu Ser Asn
20 25 30
Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr
35 40 45
Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Ala Asp
50 55 60
Phe Ser Ala Leu Asn Thr Glu Ile Leu Gly Val Ser Val Asp Ser Gln
65 70 75 80
Phe Ser His Leu Ala Trp Ile Gln Thr Ser Arg Lys Glu Gly Gly Leu
85 90 95
Gly Asp Leu Ala Tyr Pro Leu Val Ala Asp Leu Lys Lys Glu Ile Ser
100 105 110
Thr Ala Tyr Asn Val Leu Asp Pro Ala Glu Gly Ile Ala Leu Arg Gly
115 120 125
Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln His Ala Thr Ile Asn
130 135 140
Asn Leu Ala Phe Gly Arg Ser Val Asp Glu Thr Leu Arg Val Leu Gln
145 150 155 160
Ala Ile Gln Tyr Val Gln Ser His Pro Asp Glu Val Cys Pro Ala Asn
165 170 175
Trp Gln Pro Gly Ala Ala Thr Met Asn Pro Asp Pro Val Lys Ser Lys
180 185 190
Glu Phe Phe Ala Ala Val
195
<210> 43
<211> 597
<212> DNA
<213> Prochlorococcus marinus
<400> 43
ttatagactt gagaaatact ccttgctccc ttctggatct ggcttcattg tcttttcccc 60
tggagtccaa ttggcaggac atacctcgtc tgggttggct tgaacatatt gaaatgcttg 120
aagaactctc aaggtctcat caacatttct tcctacaggt aggttgttaa tagtagcgtg 180
catgatcaca ccatctggat cgatgatata aagacctctt aaagcaacac cctctgcatc 240
gtcgagaacg ttataagcca atgaaatctc tttctttaaa tcggcaacca agggataatt 300
gatatcgcca atgcctccat catttctttg agtttgaatc caggcaaggt ggctaaattg 360
actgtctaca gataccccta agacctcagt gttcttactt gaaaattcgg agtatctatc 420
gctaaaagcg gtaatttcag ttggacatac aaaagtaaaa tctagagggt aaaagaaaag 480
cacaacatat ttacctctgt aatttgaaag tgatatttcc ttgaattcct ggtctatcac 540
tgcagtagca gtaaaatcag gagctttctg gccaacacgg atacattcgt tcgtcat 597
<210> 44
<211> 198
<212> PRT
<213> Prochlorococcus marinus
<400> 44
Met Thr Asn Glu Cys Ile Arg Val Gly Gln Lys Ala Pro Asp Phe Thr
1 5 10 15
Ala Thr Ala Val Ile Asp Gln Glu Phe Lys Glu Ile Ser Leu Ser Asn
20 25 30
Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr
35 40 45
Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Arg Tyr Ser Glu
50 55 60
Phe Ser Ser Lys Asn Thr Glu Val Leu Gly Val Ser Val Asp Ser Gln
65 70 75 80
Phe Ser His Leu Ala Trp Ile Gln Thr Gln Arg Asn Asp Gly Gly Ile
85 90 95
Gly Asp Ile Asn Tyr Pro Leu Val Ala Asp Leu Lys Lys Glu Ile Ser
100 105 110
Leu Ala Tyr Asn Val Leu Asp Asp Ala Glu Gly Val Ala Leu Arg Gly
115 120 125
Leu Tyr Ile Ile Asp Pro Asp Gly Val Ile Met His Ala Thr Ile Asn
130 135 140
Asn Leu Pro Val Gly Arg Asn Val Asp Glu Thr Leu Arg Val Leu Gln
145 150 155 160
Ala Phe Gln Tyr Val Gln Ala Asn Pro Asp Glu Val Cys Pro Ala Asn
165 170 175
Trp Thr Pro Gly Glu Lys Thr Met Lys Pro Asp Pro Glu Gly Ser Lys
180 185 190
Glu Tyr Phe Ser Ser Leu
195
<210> 45
<211> 600
<212> DNA
<213> Porphyra purpurea
<400> 45
ttatgcagcc gcaaaataat ttttagattt tataggatcc ggattcattg ttctatcacc 60
aggtttccaa tttgctggac atacttcatc tggatgggct tgaacatatt gaattgcttg 120
cagaactctt aaagtttctt caacgcttct tccaaactcc agattgttaa cggtagaata 180
ttgaattata cctttaggat ctataataaa taatcccctt agggctacac ccccactatt 240
taatacatta taggcaatgc taatttcttt ttttagatct gatactaaag gatactcaag 300
atctcctaat ccaccagatt ctcgatctgt ttgcaaccaa gctaagtgag aatattcgct 360
atccacagaa acgcctaaga tttctgtgtt aagttcagaa aaatcagaat acttatcact 420
gaacgcggtt atttctgtag ggcaaacaaa agtaaaatct aaagggtaaa aaaataagat 480
gacatactta tttttaaagt cagataattt tattgtttta aattcttggt cataaacagc 540
tgtagctgaa aagtcaggcg cgatctggcc tacttgaaga caattgtgtc ctgaaatcat 600
<210> 46
<211> 199
<212> PRT
<213> Porphyra purpurea
<400> 46
Met Ile Ser Gly His Asn Cys Leu Gln Val Gly Gln Ile Ala Pro Asp
1 5 10 15
Phe Ser Ala Thr Ala Val Tyr Asp Gln Glu Phe Lys Thr Ile Lys Leu
20 25 30
Ser Asp Phe Lys Asn Lys Tyr Val Ile Leu Phe Phe Tyr Pro Leu Asp
35 40 45
Phe Thr Phe Val Cys Pro Thr Glu Ile Thr Ala Phe Ser Asp Lys Tyr
50 55 60
Ser Asp Phe Ser Glu Leu Asn Thr Glu Ile Leu Gly Val Ser Val Asp
65 70 75 80
Ser Glu Tyr Ser His Leu Ala Trp Leu Gln Thr Asp Arg Glu Ser Gly
85 90 95
Gly Leu Gly Asp Leu Glu Tyr Pro Leu Val Ser Asp Leu Lys Lys Glu
100 105 110
Ile Ser Ile Ala Tyr Asn Val Leu Asn Ser Gly Gly Val Ala Leu Arg
115 120 125
Gly Leu Phe Ile Ile Asp Pro Lys Gly Ile Ile Gln Tyr Ser Thr Val
130 135 140
Asn Asn Leu Glu Phe Gly Arg Ser Val Glu Glu Thr Leu Arg Val Leu
145 150 155 160
Gln Ala Ile Gln Tyr Val Gln Ala His Pro Asp Glu Val Cys Pro Ala
165 170 175
Asn Trp Lys Pro Gly Asp Arg Thr Met Asn Pro Asp Pro Ile Lys Ser
180 185 190
Lys Asn Tyr Phe Ala Ala Ala
195
<210> 47
<211> 681
<212> DNA
<213> Gracilaria tenuistipitata
<400> 47
atgttattat gttgttttat tactgttatt ttatataata tagacaatac taaattttat 60
aacaggaagt gtagtattaa aatgataaca aataataata ttttgagagt tggtcaacaa 120
gcccccaatt tttctgctat tgctgtatat gatcaagagt ttaagaaaat aacactgtct 180
gattacttgg gtaagtatgt aatattactg ttttatcctt tagatttcac atttgtttgt 240
ccaactgaga tcactgcttt cagtgattca tataaagaga ttcaaagtct gaatacagaa 300
gttttgggta tatctgttga cagtgaatat tcacatttag catggttgca aatggaaaga 360
gatattggag gcttaggaga tcttaattac ccgttagttt ctgatttaac aaaacagatt 420
agtgcttcat ataatgttct aacagaagaa ggtaaagcat taagaggttt atttattgtt 480
gatcagcaag gaattataca atattcttta gttaataatt tagactttgg ccgtagtatt 540
agtgaaacta taagaacact taaagctatc caatatgtac aatctcaccc agatgaagtt 600
tgtccagcaa attggcagcc aggaaaagct actataatta atagtcctca aaaatcgaaa 660
aattattttc aatctatata g 681
<210> 48
<211> 226
<212> PRT
<213> Gracilaria tenuistipitata
<400> 48
Met Leu Leu Cys Cys Phe Ile Thr Val Ile Leu Tyr Asn Ile Asp Asn
1 5 10 15
Thr Lys Phe Tyr Asn Arg Lys Cys Ser Ile Lys Met Ile Thr Asn Asn
20 25 30
Asn Ile Leu Arg Val Gly Gln Gln Ala Pro Asn Phe Ser Ala Ile Ala
35 40 45
Val Tyr Asp Gln Glu Phe Lys Lys Ile Thr Leu Ser Asp Tyr Leu Gly
50 55 60
Lys Tyr Val Ile Leu Leu Phe Tyr Pro Leu Asp Phe Thr Phe Val Cys
65 70 75 80
Pro Thr Glu Ile Thr Ala Phe Ser Asp Ser Tyr Lys Glu Ile Gln Ser
85 90 95
Leu Asn Thr Glu Val Leu Gly Ile Ser Val Asp Ser Glu Tyr Ser His
100 105 110
Leu Ala Trp Leu Gln Met Glu Arg Asp Ile Gly Gly Leu Gly Asp Leu
115 120 125
Asn Tyr Pro Leu Val Ser Asp Leu Thr Lys Gln Ile Ser Ala Ser Tyr
130 135 140
Asn Val Leu Thr Glu Glu Gly Lys Ala Leu Arg Gly Leu Phe Ile Val
145 150 155 160
Asp Gln Gln Gly Ile Ile Gln Tyr Ser Leu Val Asn Asn Leu Asp Phe
165 170 175
Gly Arg Ser Ile Ser Glu Thr Ile Arg Thr Leu Lys Ala Ile Gln Tyr
180 185 190
Val Gln Ser His Pro Asp Glu Val Cys Pro Ala Asn Trp Gln Pro Gly
195 200 205
Lys Ala Thr Ile Ile Asn Ser Pro Gln Lys Ser Lys Asn Tyr Phe Gln
210 215 220
Ser Ile
225
<210> 49
<211> 924
<212> DNA
<213> Mus musculus
<400> 49
gcctagggct ctctcggttt cgagatctct ttcctgtctc taaccgtgtc tggaagtcca 60
tgtgtccggc tcttgttcac gcagtaatgg cctccggcaa cgcgcaaatc ggaaagtcgg 120
ctcctgactt cacggccaca gcggtggtgg atggtgcctt caaggaaatc aagctttcgg 180
actacagagg gaagtacgtg gtcctctttt tctacccact ggacttcact tttgtttgcc 240
ccacggagat catcgctttt agcgaccatg ctgaggactt ccgaaagcta ggctgcgagg 300
tgctgggagt gtctgtggac tctcagttca cccacctggc gtggatcaat accccacgga 360
aagagggagg cttgggcccc ctgaatatcc ctctgcttgc tgacgtgact aaaagcttgt 420
cccagaatta cggcgtgttg aaaaatgatg agggcattgc ttacaggggt ctctttatca 480
tcgatgccaa gggtgtcctt cgccagatca cagtcaatga cctacctgtg ggccgctctg 540
tagacgaggc tctccgccta gtccaggcct ttcagtatac agacgagcat ggggaagtct 600
gccctgctgg ctggaagccc ggcagtgaca ccatcaagcc caatgtggat gacagcaagg 660
aatacttctc caaacacaac tgagatgggt aaacatcggt gagcctgaag cttggatttc 720
acctgtgccc caacctggat gtcctgtgct ggcccagaaa atgctagatt ttcctccact 780
ctctgaaggg gctggagtct aggctgaggc tttctcatta cccacctgga atctggtgaa 840
tagtgatcct gccctgagca cacctagctg ggcccaggtc tataggaaac caataaagta 900
ttagggacag tgtaaaaaaa aaaa 924
<210> 50
<211> 198
<212> PRT
<213> Mus musculus
<400> 50
Met Ala Ser Gly Asn Ala Gln Ile Gly Lys Ser Ala Pro Asp Phe Thr
1 5 10 15
Ala Thr Ala Val Val Asp Gly Ala Phe Lys Glu Ile Lys Leu Ser Asp
20 25 30
Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr
35 40 45
Phe Val Cys Pro Thr Glu Ile Ile Ala Phe Ser Asp His Ala Glu Asp
50 55 60
Phe Arg Lys Leu Gly Cys Glu Val Leu Gly Val Ser Val Asp Ser Gln
65 70 75 80
Phe Thr His Leu Ala Trp Ile Asn Thr Pro Arg Lys Glu Gly Gly Leu
85 90 95
Gly Pro Leu Asn Ile Pro Leu Leu Ala Asp Val Thr Lys Ser Leu Ser
100 105 110
Gln Asn Tyr Gly Val Leu Lys Asn Asp Glu Gly Ile Ala Tyr Arg Gly
115 120 125
Leu Phe Ile Ile Asp Ala Lys Gly Val Leu Arg Gln Ile Thr Val Asn
130 135 140
Asp Leu Pro Val Gly Arg Ser Val Asp Glu Ala Leu Arg Leu Val Gln
145 150 155 160
Ala Phe Gln Tyr Thr Asp Glu His Gly Glu Val Cys Pro Ala Gly Trp
165 170 175
Lys Pro Gly Ser Asp Thr Ile Lys Pro Asn Val Asp Asp Ser Lys Glu
180 185 190
Tyr Phe Ser Lys His Asn
195
<210> 51
<211> 877
<212> DNA
<213> Rattus norvegicus
<400> 51
gaattcggca cgagggtcgt ccgcgtgtcc ggctcttgcc cacgcagtca tggcctccgg 60
caacgcgcac atcggaaagc ctgcccctga cttcacgggc accgccgtgg tggatggtgc 120
ctttaaggaa atcaagcttt cagactacag agggaagtac gtggtcctct ttttctatcc 180
actggacttc acttttgttt gccccacgga gatcatcgct tttagcgacc acgctgagga 240
cttccgaaag ctaggctgcg aggtgctggg agtgtctgtg gactctcagt tcacccacct 300
ggcctggatc aataccccac ggaaggaggg aggcttgggc ccactgaata tccctctgct 360
tgctgatgtg actaaaagct tgtcccagaa ttacggcgtg ttgaaaaatg atgagggcat 420
cgcttacagg ggcctcttta tcatcgatgc caagggtgtc cttcgccaga tcacagtcaa 480
cgacctacct gtgggacgct ctgtagatga ggctctccgc ctcgtccagg cctttcagta 540
tacagatgag catggggaag tctgtcctgc tggctggaag cccggcagtg acaccatcaa 600
acccaatgtg gatgacagca aggaatactt ctccaaacac aactgagatg ggtaaacatc 660
ggtgagcctg aatcccggat ctcacctgcg cccttacctg gatgtcctgt gctggcccag 720
aaaacgctag atcttcctct acattctaaa ggggctggag gctaggccga ggctttctca 780
ttacccacct ggaatctggt gaatagtgac cctgccctga gcacacccag ctgggcccag 840
gtctatagga aaccaataaa gtattaggga cagtgta 877
<210> 52
<211> 198
<212> PRT
<213> Rattus norvegicus
<400> 52
Met Ala Ser Gly Asn Ala His Ile Gly Lys Pro Ala Pro Asp Phe Thr
1 5 10 15
Gly Thr Ala Val Val Asp Gly Ala Phe Lys Glu Ile Lys Leu Ser Asp
20 25 30
Tyr Arg Gly Lys Tyr Val Val Leu Phe Phe Tyr Pro Leu Asp Phe Thr
35 40 45
Phe Val Cys Pro Thr Glu Ile Ile Ala Phe Ser Asp His Ala Glu Asp
50 55 60
Phe Arg Lys Leu Gly Cys Glu Val Leu Gly Val Ser Val Asp Ser Gln
65 70 75 80
Phe Thr His Leu Ala Trp Ile Asn Thr Pro Arg Lys Glu Gly Gly Leu
85 90 95
Gly Pro Leu Asn Ile Pro Leu Leu Ala Asp Val Thr Lys Ser Leu Ser
100 105 110
Gln Asn Tyr Gly Val Leu Lys Asn Asp Glu Gly Ile Ala Tyr Arg Gly
115 120 125
Leu Phe Ile Ile Asp Ala Lys Gly Val Leu Arg Gln Ile Thr Val Asn
130 135 140
Asp Leu Pro Val Gly Arg Ser Val Asp Glu Ala Leu Arg Leu Val Gln
145 150 155 160
Ala Phe Gln Tyr Thr Asp Glu His Gly Glu Val Cys Pro Ala Gly Trp
165 170 175
Lys Pro Gly Ser Asp Thr Ile Lys Pro Asn Val Asp Asp Ser Lys Glu
180 185 190
Tyr Phe Ser Lys His Asn
195
<210> 53
<211> 1089
<212> DNA
<213> Oryza sativa
<400> 53
gccttcgtct cgacacgttt gcattgcagc agctcataag tttcttcttc gtttctgctc 60
ccagtgctaa ggcagcacag tcgttcgtcg ccatgccagg gctcaccatc ggcgacaccg 120
tccccaacct ggagctggac tccacccacg gcaagatccg catccacgac ttcgtcggcg 180
acacctatgt catcctcttc tcccaccccg gcgacttcac cccggtctgc accacggagc 240
tggcagccat ggccggctac gccaaggagt tcgacaagag gggcgtcaag ctgctcggca 300
tctcctgcga cgacgtgcag tctcacaagg actggatcaa ggacatcgag gcctacaagc 360
ctgggaaccg cgtgacgtac ccgatcatgg ccgatccgag ccgcgaggcc atcaagcagc 420
tgaacatggt cgacccggac gagaaggatt ccaacggcgg ccacctcccg tcccgcgcgc 480
tgcacatcgt cggccccgac aagaaggtga agctgagctt cctgtacccg gcgtgcgtgg 540
ggcggaacat ggatgaggtg gtgcgtgcgg tcgacgcgct gcagacggcg gcgaagcacg 600
cggtggcgac gccggtgaac tggaagcccg gcgagcgcgt cgtcatccct cccggcgtct 660
ccgacgacga ggcgaaggag aagttccccc aggggttcga caccgccgac ctgccgtccg 720
gcaagggcta cctccgcttc accaaggtcg gctagatcat atcgatatcg acctcgctct 780
tcgtacatca tgtgcgccac gcgtgcgtga tagcgtgtgc tggcgtgatg actatgcgag 840
atgcatccct gtgtgtgttg gtgtggataa tgccgctacg tttggaacag tagtgcattt 900
actctgtgct actgtctgaa ctttggctgt ttggcagact gtttatgtac ccgtatgttc 960
gcccctgtac taatagagtg ggtgttgtgg ttggcaagta ctctcctcgg acaacatttt 1020
aactttgact actaataaca aacaaattaa aaagatcaat cagatgttac tagacatctt 1080
aattttatt 1089
<210> 54
<211> 220
<212> PRT
<213> Oryza sativa
<400> 54
Met Pro Gly Leu Thr Ile Gly Asp Thr Val Pro Asn Leu Glu Leu Asp
1 5 10 15
Ser Thr His Gly Lys Ile Arg Ile His Asp Phe Val Gly Asp Thr Tyr
20 25 30
Val Ile Leu Phe Ser His Pro Gly Asp Phe Thr Pro Val Cys Thr Thr
35 40 45
Glu Leu Ala Ala Met Ala Gly Tyr Ala Lys Glu Phe Asp Lys Arg Gly
50 55 60
Val Lys Leu Leu Gly Ile Ser Cys Asp Asp Val Gln Ser His Lys Asp
65 70 75 80
Trp Ile Lys Asp Ile Glu Ala Tyr Lys Pro Gly Asn Arg Val Thr Tyr
85 90 95
Pro Ile Met Ala Asp Pro Ser Arg Glu Ala Ile Lys Gln Leu Asn Met
100 105 110
Val Asp Pro Asp Glu Lys Asp Ser Asn Gly Gly His Leu Pro Ser Arg
115 120 125
Ala Leu His Ile Val Gly Pro Asp Lys Lys Val Lys Leu Ser Phe Leu
130 135 140
Tyr Pro Ala Cys Val Gly Arg Asn Met Asp Glu Val Val Arg Ala Val
145 150 155 160
Asp Ala Leu Gln Thr Ala Ala Lys His Ala Val Ala Thr Pro Val Asn
165 170 175
Trp Lys Pro Gly Glu Arg Val Val Ile Pro Pro Gly Val Ser Asp Asp
180 185 190
Glu Ala Lys Glu Lys Phe Pro Gln Gly Phe Asp Thr Ala Asp Leu Pro
195 200 205
Ser Gly Lys Gly Tyr Leu Arg Phe Thr Lys Val Gly
210 215 220
<210> 55
<211> 465
<212> DNA
<213> Oryza sativa
<400> 55
atggcgtgcg ccttctccgt ctcctctgcc gcggcgcctc tcgcctcccc gaagggggac 60
ctgccgttgg tcgggaacaa ggcgccggac ttcgaggcgg aggccatgtt cgaccagggg 120
ttcatcaagt ctaaatgcat gtttgtaagc tctgcagaga tcactgcttt cagcgacaga 180
tatgaggagt ttgagaagat aaatactgaa gttctcggtg tttcgattga cagtgtgggg 240
attgctctga gaggattatt catcattgac aaggagggtg tgattcagca ttctaccatt 300
aacaaccttg ctattggccg tagcgtggat gagacgctta ggacccttca ggccctacag 360
tatgtccaag aaaacccgga tgaggtttgc ccagctggat ggaaacctgg ggagaagtca 420
atgaagcctg accccaagga cagcaaggag gaacaagaat gctga 465
<210> 56
<211> 154
<212> PRT
<213> Oryza sativa
<400> 56
Met Ala Cys Ala Phe Ser Val Ser Ser Ala Ala Ala Pro Leu Ala Ser
1 5 10 15
Pro Lys Gly Asp Leu Pro Leu Val Gly Asn Lys Ala Pro Asp Phe Glu
20 25 30
Ala Glu Ala Met Phe Asp Gln Gly Phe Ile Lys Ser Lys Cys Met Phe
35 40 45
Val Ser Ser Ala Glu Ile Thr Ala Phe Ser Asp Arg Tyr Glu Glu Phe
50 55 60
Glu Lys Ile Asn Thr Glu Val Leu Gly Val Ser Ile Asp Ser Val Gly
65 70 75 80
Ile Ala Leu Arg Gly Leu Phe Ile Ile Asp Lys Glu Gly Val Ile Gln
85 90 95
His Ser Thr Ile Asn Asn Leu Ala Ile Gly Arg Ser Val Asp Glu Thr
100 105 110
Leu Arg Thr Leu Gln Ala Leu Gln Tyr Val Gln Glu Asn Pro Asp Glu
115 120 125
Val Cys Pro Ala Gly Trp Lys Pro Gly Glu Lys Ser Met Lys Pro Asp
130 135 140
Pro Lys Asp Ser Lys Glu Glu Gln Glu Cys
145 150
<210> 57
<211> 1085
<212> DNA
<213> Oryza sativa
<400> 57
cattccatca cagacagttc gcagaatcgc agcagcttag cttaattact tttttcacca 60
actcaacttt cagttaattt ccggttaatc ctcgattcct catcatgcct ggactcaccc 120
tcggcgacgt cgtccccgac ctggagctcg acaccaccca cggcaagatc cgcctccacg 180
acttcgtcgg cgacgcctac gtcatcatct tctcccaccc cgctgacttc acgccggtct 240
gcacgacgga gctgtcggag atggcgggct acgccggcga gttcgacaag aggggcgtca 300
agctcctcgg cttctcctgc gacgacgtcg agtcgcacaa ggactggatc aaggacatcg 360
aggcctacaa gcctggccgc cgcgtcggct tcccgatcgt cgccgacccg gacagggagg 420
cgatcaggca gctcaacatg atcgacgccg acgagaagga caccgccggc ggcgagctcc 480
ccaaccgggc gctccacatc gtcgggccgg acaagaaggt gaagctgagc ttcctgttcc 540
cggcgtgcac ggggcggaac atggcggagg tgctgcgcgc gacggacgcg ctgctgacgg 600
cggcgaggca ccgggtggcg acgccggtga actggaagcc cggcgagcgc gtcgtcatcc 660
cccccggcgt ctccgacgag gaggccaagg cgaggttccc ggccgggttc gagaccgccc 720
agctgccctc caacaagtgc tacctccgct tcacccaggt ggactgagag actgatggtg 780
agggagggag ggagagatct gggccgtcgg tttcgtgtgt aataaaccaa cgcacgacgt 840
agatgcttcc acgtgtgtgt ttcccgtgct gcttcgattg atcgatcgat cattcggtaa 900
gtactctagt tatgtgtaat ctgctgtttg ggtgtagtgg tgcatttgct gttctgttgc 960
ctgaaagtga cgaacggatt atgtttgtca tttgtatgta aaatgtaacc gtatgttttt 1020
tatttatccc ttccgaaatt actgtggaat atagtgaagt aatgctgtta ataaacagcc 1080
cgttt 1085
<210> 58
<211> 220
<212> PRT
<213> Oryza sativa
<400> 58
Met Pro Gly Leu Thr Leu Gly Asp Val Val Pro Asp Leu Glu Leu Asp
1 5 10 15
Thr Thr His Gly Lys Ile Arg Leu His Asp Phe Val Gly Asp Ala Tyr
20 25 30
Val Ile Ile Phe Ser His Pro Ala Asp Phe Thr Pro Val Cys Thr Thr
35 40 45
Glu Leu Ser Glu Met Ala Gly Tyr Ala Gly Glu Phe Asp Lys Arg Gly
50 55 60
Val Lys Leu Leu Gly Phe Ser Cys Asp Asp Val Glu Ser His Lys Asp
65 70 75 80
Trp Ile Lys Asp Ile Glu Ala Tyr Lys Pro Gly Arg Arg Val Gly Phe
85 90 95
Pro Ile Val Ala Asp Pro Asp Arg Glu Ala Ile Arg Gln Leu Asn Met
100 105 110
Ile Asp Ala Asp Glu Lys Asp Thr Ala Gly Gly Glu Leu Pro Asn Arg
115 120 125
Ala Leu His Ile Val Gly Pro Asp Lys Lys Val Lys Leu Ser Phe Leu
130 135 140
Phe Pro Ala Cys Thr Gly Arg Asn Met Ala Glu Val Leu Arg Ala Thr
145 150 155 160
Asp Ala Leu Leu Thr Ala Ala Arg His Arg Val Ala Thr Pro Val Asn
165 170 175
Trp Lys Pro Gly Glu Arg Val Val Ile Pro Pro Gly Val Ser Asp Glu
180 185 190
Glu Ala Lys Ala Arg Phe Pro Ala Gly Phe Glu Thr Ala Gln Leu Pro
195 200 205
Ser Asn Lys Cys Tyr Leu Arg Phe Thr Gln Val Asp
210 215 220
<210> 59
<211> 1248
<212> DNA
<213> Oryza sativa
<400> 59
atcgattccc ccaacatatt agggctcacg cctcccaaag tcaaaacagc ccagcccgaa 60
caagcatttc ctcgaacact tcgccctcca ccaccatggc cgccgccgcc tccaccctcg 120
cctccctctc cgccaccgcg gccgcggccg ccggcaagcg cctcctcctc tcctccccct 180
cccgctccct ctccctctcc ctcgcctccc gcggccgcat cgccgtcatg ccccacctcc 240
gcgctggcat cctctccgcc gcaccgagga gggcggtgtc ggcctcggcc ccggccgcgg 300
ccaccatcgc ggtcggggac aagctccccg acgcgacgct ctcctacttc gactcgcccg 360
acggggagct gaagacggtg accgtgcgcg acctcaccgc cgggaagaag gtggtcctct 420
tcgcggtccc cggcgcgttc accccgacct gcacgcagaa gcacgtcccg gggttcgtcg 480
ccaaggccgg ggagctccgc gccaaggggg tcgacgccgt ggcctgcgtc tccgtcaacg 540
acgcgttcgt gatgcgggcg tggaaggaga gcctcggcgt cggcgacgag gtgctcctcc 600
tctccgacgg caacggcgag ctcgcccgcg ccatgggcgt cgagctcgac ctctccgaca 660
agcccgccgg cctcggcgtg cggtcccgcc gctacgcgct cctggcggag gacggcgtcg 720
tcaaggtgct caacctcgag gagggcggcg ccttcaccac cagcagcgcc gaggagatgc 780
tcaaggcgct ctgaagcgtg aacaactcaa gccatcctcc acttttcatc tcaaatctcc 840
atagctcggt tcgttgccta cttctctcaa gtgttcgctt cttttcctga ataataaatc 900
atggcaacaa tggtggaccg tgcagagtag tgttgtcgtt ttgatgtgtg aagcttctat 960
agcgaacata gtgtgcaatt tttaggtaac atatatgagt cttggccttg cactgtttgt 1020
caggtagtaa caacttggca cagctataga ctgtagtaac agagttcctt tcatgttgaa 1080
tggtgaggct gtgatgtgtt ctagagctga ataaacgtgc tctggtaaat actgtcacca 1140
gatcagacta tggagtagta gtaagatttt gcttggttaa ttgggcaatg gctatttttc 1200
aggatcgttc agttgagata aacatgtttt gctgttcaga tgagttcg 1248
<210> 60
<211> 232
<212> PRT
<213> Oryza sativa
<400> 60
Met Ala Ala Ala Ala Ser Thr Leu Ala Ser Leu Ser Ala Thr Ala Ala
1 5 10 15
Ala Ala Ala Gly Lys Arg Leu Leu Leu Ser Ser Pro Ser Arg Ser Leu
20 25 30
Ser Leu Ser Leu Ala Ser Arg Gly Arg Ile Ala Val Met Pro His Leu
35 40 45
Arg Ala Gly Ile Leu Ser Ala Ala Pro Arg Arg Ala Val Ser Ala Ser
50 55 60
Ala Pro Ala Ala Ala Thr Ile Ala Val Gly Asp Lys Leu Pro Asp Ala
65 70 75 80
Thr Leu Ser Tyr Phe Asp Ser Pro Asp Gly Glu Leu Lys Thr Val Thr
85 90 95
Val Arg Asp Leu Thr Ala Gly Lys Lys Val Val Leu Phe Ala Val Pro
100 105 110
Gly Ala Phe Thr Pro Thr Cys Thr Gln Lys His Val Pro Gly Phe Val
115 120 125
Ala Lys Ala Gly Glu Leu Arg Ala Lys Gly Val Asp Ala Val Ala Cys
130 135 140
Val Ser Val Asn Asp Ala Phe Val Met Arg Ala Trp Lys Glu Ser Leu
145 150 155 160
Gly Val Gly Asp Glu Val Leu Leu Leu Ser Asp Gly Asn Gly Glu Leu
165 170 175
Ala Arg Ala Met Gly Val Glu Leu Asp Leu Ser Asp Lys Pro Ala Gly
180 185 190
Leu Gly Val Arg Ser Arg Arg Tyr Ala Leu Leu Ala Glu Asp Gly Val
195 200 205
Val Lys Val Leu Asn Leu Glu Glu Gly Gly Ala Phe Thr Thr Ser Ser
210 215 220
Ala Glu Glu Met Leu Lys Ala Leu
225 230
<210> 61
<211> 946
<212> DNA
<213> Oryza sativa
<400> 61
acacccaaac ccgacgaaca gccgcagctg caggccacgc atcctcgccg tgaatctccc 60
accgcgctcc ggcgatggca ttcgcggtct ccaccgcctg caggccgtcc ctgctcctgc 120
ccccgcgcca gcgctcgtcg ccgccgcggc cgcggccgct cctctgcacg ccctccaccg 180
ccgccttccg ccgcggcgcc ctcagcgcga caacaacgcc aacgccggcg cgcgcagcac 240
tgccgtcgac gacggggagg aacaggatcg tctgcggcaa ggtgagcaag ggcagcgcgg 300
cgcccaactt cacgctgagg gaccaggacg ggagggcggt gtcgctgtcc aagttcaagg 360
ggaggccggt ggtggtgtac ttctaccccg ccgacgagac ccccggatgc accaagcagg 420
cctgcgcctt ccgcgactcc tacgagaagt tcaagaaggc cggcgccgag gtcatcggca 480
tcagcggcga cgacgccgcc tcccacaagg agttcaagaa gaagtacaag ctgccgttca 540
cgctgctgag cgacgagggg aacaaggtga ggaaggagtg gggtgtgccg gctgacctgt 600
tcgggacgct gccgggaagg cagacgtacg tgctcgacaa gaacggcgtc gtccagtaca 660
tctacaacaa ccagttccag cccgagaagc acattggcga gaccctcaag atcctccaga 720
gcctctgatt ctcttcttct tcttcctcct tttttaacta caatctctca tgtatgatcc 780
atcacagtat accgagaaat taatccatct gttaatctct tctcgatcgt ttttctccct 840
cggcatgtgt atagctagtg tatctgtaac tctgtgagta tatatacagt caaaatcggt 900
gggctgctag ctctgaattt tgccgtaagg cactctgatt ttctct 946
<210> 62
<211> 217
<212> PRT
<213> Oryza sativa
<400> 62
Met Ala Phe Ala Val Ser Thr Ala Cys Arg Pro Ser Leu Leu Leu Pro
1 5 10 15
Pro Arg Gln Arg Ser Ser Pro Pro Arg Pro Arg Pro Leu Leu Cys Thr
20 25 30
Pro Ser Thr Ala Ala Phe Arg Arg Gly Ala Leu Ser Ala Thr Thr Thr
35 40 45
Pro Thr Pro Ala Arg Ala Ala Leu Pro Ser Thr Thr Gly Arg Asn Arg
50 55 60
Ile Val Cys Gly Lys Val Ser Lys Gly Ser Ala Ala Pro Asn Phe Thr
65 70 75 80
Leu Arg Asp Gln Asp Gly Arg Ala Val Ser Leu Ser Lys Phe Lys Gly
85 90 95
Arg Pro Val Val Val Tyr Phe Tyr Pro Ala Asp Glu Thr Pro Gly Cys
100 105 110
Thr Lys Gln Ala Cys Ala Phe Arg Asp Ser Tyr Glu Lys Phe Lys Lys
115 120 125
Ala Gly Ala Glu Val Ile Gly Ile Ser Gly Asp Asp Ala Ala Ser His
130 135 140
Lys Glu Phe Lys Lys Lys Tyr Lys Leu Pro Phe Thr Leu Leu Ser Asp
145 150 155 160
Glu Gly Asn Lys Val Arg Lys Glu Trp Gly Val Pro Ala Asp Leu Phe
165 170 175
Gly Thr Leu Pro Gly Arg Gln Thr Tyr Val Leu Asp Lys Asn Gly Val
180 185 190
Val Gln Tyr Ile Tyr Asn Asn Gln Phe Gln Pro Glu Lys His Ile Gly
195 200 205
Glu Thr Leu Lys Ile Leu Gln Ser Leu
210 215
<210> 63
<211> 770
<212> DNA
<213> Oryza sativa
<400> 63
atctcccttc cctgtcgatt accttctctc cttcctctgt tcctcctctc ctccacacat 60
ccaggcaggc aacacaagaa tcatccggga gagcgacatg gccccggttg ccgtgggcga 120
caccctcccc gacggccagc tggggtggtt cgacggggag gacaagctgc agcaggtctc 180
cgtccacggc ctcgccgccg gcaagaaggt cgtcctcttc ggcgtccccg gtgccttcac 240
cccgacctgc agcaatcagc atgtgccagg attcataaat caggctgagc agctcaaagc 300
caagggtgta gacgacatct tgcttgtcag tgttaacgac ccctttgtca tgaaggcgtg 360
ggcaaagtca taccctgaga ataagcatgt gaaattcctt gccgatggtt tgggaacata 420
caccaaggca cttggtcttg agcttgacct ttcggagaaa gggcttggta ttcgttcgag 480
acggtttgct ctccttgctg acaacctcaa ggttactgtt gcaaacattg aggaaggtgg 540
ccaattcaca atctctggtg ctgaggagat cctcaaggca ctgtaagagc ttcagctctt 600
aggaacggca gcgatcactt ggacctatcg tgtcaatctt gtttaaattt gtctgcaaaa 660
tacttgtgcg aataaaattg tcgatgagct gcctagttgt gaggacttta tgataatgtt 720
tgaatctgta tccactgttg aatcaagtag taatgttcag tgctcatgtt 770
<210> 64
<211> 162
<212> PRT
<213> Oryza sativa
<400> 64
Met Ala Pro Val Ala Val Gly Asp Thr Leu Pro Asp Gly Gln Leu Gly
1 5 10 15
Trp Phe Asp Gly Glu Asp Lys Leu Gln Gln Val Ser Val His Gly Leu
20 25 30
Ala Ala Gly Lys Lys Val Val Leu Phe Gly Val Pro Gly Ala Phe Thr
35 40 45
Pro Thr Cys Ser Asn Gln His Val Pro Gly Phe Ile Asn Gln Ala Glu
50 55 60
Gln Leu Lys Ala Lys Gly Val Asp Asp Ile Leu Leu Val Ser Val Asn
65 70 75 80
Asp Pro Phe Val Met Lys Ala Trp Ala Lys Ser Tyr Pro Glu Asn Lys
85 90 95
His Val Lys Phe Leu Ala Asp Gly Leu Gly Thr Tyr Thr Lys Ala Leu
100 105 110
Gly Leu Glu Leu Asp Leu Ser Glu Lys Gly Leu Gly Ile Arg Ser Arg
115 120 125
Arg Phe Ala Leu Leu Ala Asp Asn Leu Lys Val Thr Val Ala Asn Ile
130 135 140
Glu Glu Gly Gly Gln Phe Thr Ile Ser Gly Ala Glu Glu Ile Leu Lys
145 150 155 160
Ala Leu
<210> 65
<211> 1249
<212> DNA
<213> Oryza sativa
<400> 65
gagagccaac acggtgcatc tctcagccac acagccccac ccgcgccatg tcactcgcca 60
ccgccgccgc cggagcgcaa ccgttcgtcc gctcctcctc ctccgccgcc gcggcgtcct 120
cgtcgcggcc cctgctcgcc gtcgccgccg cccgccaccg ccgcccgcat ggatctctcg 180
ccgccgccgc cgccgcggca aggcggcgtc gtcgtcgtcc gctcctccag gtgcgcgcgg 240
caaggacgga gtccacgggc gtctccgtcg ggttccgcgc gccccagttc gagctcccgg 300
agccactgac ggggaagctc tggacattgg atgacttcga aggcaacccc gcgctgctgg 360
ttatgtttgt atgtaatcac tgtccattcg taaagcatct caaaaaagat attgcgaagc 420
tcacctcatt ctacatggag aaagggcttg ctgctgttgc catatcctcg aactcaattg 480
tgacacaccc acaggatggt cctgattaca tagctgagga agcaaaattg tataaatact 540
ctttcccgta tctatatgat gagtctcaag aagttgctaa agcttttcga gccgtctgca 600
cgccagagtt ttacttgttc aaaaaggatg gacgaaggcc atttgagctt ttctaccatg 660
ggcagtttga cgattcaaga ccgagtaaca acgtgccagt taccggaagg gatttaagtc 720
gtgcgattga ttgtgcactt agtggacaag agctaccttt tgtgccaaaa cccagtgtcg 780
ggtgcagcat caaatggcac ccatgaagag cgtattgcat tgtcatgtgc tggaatatag 840
atgtttttcc cccttaaatt gaaggttgaa catggggatt gaggtgagcc atgctctcta 900
ctactagaag tatggaagca cacacatagt agatttatga tagctaattt cacatagtag 960
atttatgata gctaatttat aatgtaattt ttaagggaaa tagatgcagt tgaggccttg 1020
tggagctgat tcttaacgtt gtgggggctg ttcaacttga gagttgcaaa actagacatg 1080
aatggcgtgg atagtgttat gttgtgtgct ggtgtctcat cttggccgga aaaagaaaaa 1140
ctgatggatg taactggtat ttgtgcaaca atgggataat gcacacaagt acaataaccc 1200
attattatgg ctaacacaac acccacgggt gaaaattaaa gatgagggc 1249
<210> 66
<211> 252
<212> PRT
<213> Oryza sativa
<400> 66
Met Ser Leu Ala Thr Ala Ala Ala Gly Ala Gln Pro Phe Val Arg Ser
1 5 10 15
Ser Ser Ser Ala Ala Ala Ala Ser Ser Ser Arg Pro Leu Leu Ala Val
20 25 30
Ala Ala Ala Arg His Arg Arg Pro His Gly Ser Leu Ala Ala Ala Ala
35 40 45
Ala Ala Ala Arg Arg Arg Arg Arg Arg Pro Leu Leu Gln Val Arg Ala
50 55 60
Ala Arg Thr Glu Ser Thr Gly Val Ser Val Gly Phe Arg Ala Pro Gln
65 70 75 80
Phe Glu Leu Pro Glu Pro Leu Thr Gly Lys Leu Trp Thr Leu Asp Asp
85 90 95
Phe Glu Gly Asn Pro Ala Leu Leu Val Met Phe Val Cys Asn His Cys
100 105 110
Pro Phe Val Lys His Leu Lys Lys Asp Ile Ala Lys Leu Thr Ser Phe
115 120 125
Tyr Met Glu Lys Gly Leu Ala Ala Val Ala Ile Ser Ser Asn Ser Ile
130 135 140
Val Thr His Pro Gln Asp Gly Pro Asp Tyr Ile Ala Glu Glu Ala Lys
145 150 155 160
Leu Tyr Lys Tyr Ser Phe Pro Tyr Leu Tyr Asp Glu Ser Gln Glu Val
165 170 175
Ala Lys Ala Phe Arg Ala Val Cys Thr Pro Glu Phe Tyr Leu Phe Lys
180 185 190
Lys Asp Gly Arg Arg Pro Phe Glu Leu Phe Tyr His Gly Gln Phe Asp
195 200 205
Asp Ser Arg Pro Ser Asn Asn Val Pro Val Thr Gly Arg Asp Leu Ser
210 215 220
Arg Ala Ile Asp Cys Ala Leu Ser Gly Gln Glu Leu Pro Phe Val Pro
225 230 235 240
Lys Pro Ser Val Gly Cys Ser Ile Lys Trp His Pro
245 250
<210> 67
<211> 994
<212> DNA
<213> Oryza sativa
<400> 67
aaatcccaac agagaagcat ttcctcgaac acatcgccgt cgccgccctc catggccgct 60
cccaccgcag cagctctctc caccctctcc accgccagcg tcacctccgg caagcgcttc 120
atcacctcct ccttctccct ctccttctcc tcccgccccc tcgcaacagg cgtccgcgcc 180
gcgggggcga gagcggcgcg gaggtcggcg gcgtcggcgt ccaccgtggt ggcgaccatc 240
gccgtcggag acaagctccc cgacgcgacg ctgtcctact tcgacccggc ggacggcgag 300
ctgaagacgg tgacggtggc ggagctgacg gcgggcagga aggcggtgct gttcgcggtg 360
cccggcgcgt tcacgccgac gtgctcgcag aagcacctcc cggggttcat cgagaaggcc 420
ggggagctcc acgccaaggg ggtggacgcc attgcctgcg tgtcggtgaa cgacgcgttc 480
gtgatgcgcg cgtggaagga gagcctgggc ctcggcgacg ccgacgtgct cctcctctcc 540
gacggcaacc tggagctcac gcgcgcgctc ggcgtcgaga tggacctctc cgacaagccc 600
atggggctcg gcgtcaggtc gcgccgctac gcgctcctcg ccgacgacgg cgtcgtcaag 660
gtgctcaacc tcgaggaggg cggcgccttc accaccagca gcgccgagga gatgctcaag 720
gcgctctgaa gatggaatcc gagctctcgt aggtggcaac aatggcagga tcagcccgtt 780
gctctcgcgc gttggtgagt agcgtcgtcg ttgtgaagag gaaattttgt gtgtgttttt 840
tttcggttga atgttgcatg ccatgtgctt gacgaaatga cggaataaca aaagaaaaaa 900
aactactttt atttttttgt tgaaatttgc aaaccatgtg tttgacgaaa tgtcgagata 960
tgaaagctgt gaaatcgctt acgtcacgtg cacc 994
<210> 68
<211> 225
<212> PRT
<213> Oryza sativa
<400> 68
Met Ala Ala Pro Thr Ala Ala Ala Leu Ser Thr Leu Ser Thr Ala Ser
1 5 10 15
Val Thr Ser Gly Lys Arg Phe Ile Thr Ser Ser Phe Ser Leu Ser Phe
20 25 30
Ser Ser Arg Pro Leu Ala Thr Gly Val Arg Ala Ala Gly Ala Arg Ala
35 40 45
Ala Arg Arg Ser Ala Ala Ser Ala Ser Thr Val Val Ala Thr Ile Ala
50 55 60
Val Gly Asp Lys Leu Pro Asp Ala Thr Leu Ser Tyr Phe Asp Pro Ala
65 70 75 80
Asp Gly Glu Leu Lys Thr Val Thr Val Ala Glu Leu Thr Ala Gly Arg
85 90 95
Lys Ala Val Leu Phe Ala Val Pro Gly Ala Phe Thr Pro Thr Cys Ser
100 105 110
Gln Lys His Leu Pro Gly Phe Ile Glu Lys Ala Gly Glu Leu His Ala
115 120 125
Lys Gly Val Asp Ala Ile Ala Cys Val Ser Val Asn Asp Ala Phe Val
130 135 140
Met Arg Ala Trp Lys Glu Ser Leu Gly Leu Gly Asp Ala Asp Val Leu
145 150 155 160
Leu Leu Ser Asp Gly Asn Leu Glu Leu Thr Arg Ala Leu Gly Val Glu
165 170 175
Met Asp Leu Ser Asp Lys Pro Met Gly Leu Gly Val Arg Ser Arg Arg
180 185 190
Tyr Ala Leu Leu Ala Asp Asp Gly Val Val Lys Val Leu Asn Leu Glu
195 200 205
Glu Gly Gly Ala Phe Thr Thr Ser Ser Ala Glu Glu Met Leu Lys Ala
210 215 220
Leu
225
<210> 69
<211> 959
<212> DNA
<213> Oryza sativa
<400> 69
tacctatgga gacggtcgcc tcgctctcgc gcgccgcgct cgccggcgcg cccgccgcta 60
cacgcgcgac agcgtcgccc gtgaacaggg ccgtggtccc tgcggcgtcc cggccgcgcg 120
ggggacgcct ttgctgccga cgctcgctga cggccgtctc cgcggcggca ggggcttccc 180
ctcccgtctc cccgtcgcct agccccgatg gcggctcccc cggcgtgtgg gacgctctcg 240
gcggcgtgtc cgtgctcgcc gccggcaccg gcgaagccgt tcagctcagg gacctgtggg 300
accccaccga gggggtggcc gtggtggcgc tgctccggca cttcgggtgc ttctgctgct 360
gggagctggc ctctgttctg aaggaatcca tggcgaaatt cgacgctgcc ggggccaagc 420
tgatcgccat cggcgtcggg actcctgaca aagctcgcat tctcgccgat gggctgccgt 480
tccctgttga tagcttgtac gctgaccccg agcgcaaggc ttacgacgta ttggggcttt 540
accatggtct gggtcggaca ttaatcagtc ctgcgaagat gtactcgggg cttaattcca 600
tcaagaaggt aaccaagaac tacacgctca agggcacacc agcagacctg acgggtatct 660
tgcagcaggg tggtatgctt gtgttcagag ggaaagagtt gctgtactca tggaaagaca 720
aaggcacggg tgatcatgct cctctggatg atgtcctcaa cgcttgctgc aatcgaactt 780
cttgaggtct ctagcagtcg gaagatgtgt atgtaaatat atgaaatgct cagcatgcca 840
aacagagagc aattagactc aacagtacta gatgttcgat taattatgca ttgttggttt 900
gcttatgtac ttagcatgat attggattag ctacccaatg gacatgacac tacagtctg 959
<210> 70
<211> 259
<212> PRT
<213> Oryza sativa
<400> 70
Met Glu Thr Val Ala Ser Leu Ser Arg Ala Ala Leu Ala Gly Ala Pro
1 5 10 15
Ala Ala Thr Arg Ala Thr Ala Ser Pro Val Asn Arg Ala Val Val Pro
20 25 30
Ala Ala Ser Arg Pro Arg Gly Gly Arg Leu Cys Cys Arg Arg Ser Leu
35 40 45
Thr Ala Val Ser Ala Ala Ala Gly Ala Ser Pro Pro Val Ser Pro Ser
50 55 60
Pro Ser Pro Asp Gly Gly Ser Pro Gly Val Trp Asp Ala Leu Gly Gly
65 70 75 80
Val Ser Val Leu Ala Ala Gly Thr Gly Glu Ala Val Gln Leu Arg Asp
85 90 95
Leu Trp Asp Pro Thr Glu Gly Val Ala Val Val Ala Leu Leu Arg His
100 105 110
Phe Gly Cys Phe Cys Cys Trp Glu Leu Ala Ser Val Leu Lys Glu Ser
115 120 125
Met Ala Lys Phe Asp Ala Ala Gly Ala Lys Leu Ile Ala Ile Gly Val
130 135 140
Gly Thr Pro Asp Lys Ala Arg Ile Leu Ala Asp Gly Leu Pro Phe Pro
145 150 155 160
Val Asp Ser Leu Tyr Ala Asp Pro Glu Arg Lys Ala Tyr Asp Val Leu
165 170 175
Gly Leu Tyr His Gly Leu Gly Arg Thr Leu Ile Ser Pro Ala Lys Met
180 185 190
Tyr Ser Gly Leu Asn Ser Ile Lys Lys Val Thr Lys Asn Tyr Thr Leu
195 200 205
Lys Gly Thr Pro Ala Asp Leu Thr Gly Ile Leu Gln Gln Gly Gly Met
210 215 220
Leu Val Phe Arg Gly Lys Glu Leu Leu Tyr Ser Trp Lys Asp Lys Gly
225 230 235 240
Thr Gly Asp His Ala Pro Leu Asp Asp Val Leu Asn Ala Cys Cys Asn
245 250 255
Arg Thr Ser
<210> 71
<211> 1183
<212> DNA
<213> Oryza sativa
<400> 71
tccgcaacga cctccacacc gcaacggtcc actcgctcgc ctccgtctcc ctcccgcgtc 60
tagggtttcg ccacgtctca cgcagccatg gccgcggcgg ccgcgtccac ctcgctcccc 120
gtcccgcgcg tctccctccc gccgtccgct cgcccagccg ccgctccccg gcacggtctc 180
ctcatccccg gtcgccgtgg gtgcttccgt ctccgcggct caccagcggc accggccgcc 240
gccgcctcgg gctccccttc cgtgccttcc tcttccccgg aggctgggtc gggcatcggg 300
gatgccctcg gtggcgtcgc catctactcc gcggccaccg gcgagcccgt gctgttcagg 360
gacctgtggg accagaacga gggaatggct gttgttgccc tgctaaggca ttttgggtgc 420
ccttgctgtt gggagttggc ctctgtgttg agggatacaa aagagagatt tgattcagct 480
ggtgtcaagc taatagccgt tggtgttggc actccagata aagcccgtat tcttgctgag 540
cgtttaccat ttccattgga ctacctctac gcagatcctg agcgcaaggc ctatgatctc 600
ttgggtttgt attttggtat tggtcgcaca ttcttcaatc cagccagtgc aagtgtgttt 660
tcacgatttg actccctcaa ggaggcagtg aagaactata caattgaagc caccccagat 720
gatagggcta gtgttctaca acagggtgga atgtttgtgt tcagagggaa agaattaata 780
tatgcaagga aagatgaggg cactggtgat catgcacctc tggatgatgt cctcaacatc 840
tgttgtaaag cccctgcggc atgatattgt gtaatcaatg tcccatgaga attttcatag 900
cctggttctg ttcgtgtccc aaagttgtat gcagaaaagc atctcttgat tttggaaggc 960
tggcttctgc aaggatagta tctctttgtc tgtacgtctg atctaccatg ctgttgatat 1020
gtaatatatc agttgaaaac ttgagggatg taggcagacc aaaggacttt ctcatgccat 1080
aagctcagca gttcttttcc ttttcctcat agaaatgtac taattataga agagaatctt 1140
acactgtaca ataagtttgt gttaaagttg gcgaaatttt cct 1183
<210> 72
<211> 258
<212> PRT
<213> Oryza sativa
<400> 72
Met Ala Ala Ala Ala Ala Ser Thr Ser Leu Pro Val Pro Arg Val Ser
1 5 10 15
Leu Pro Pro Ser Ala Arg Pro Ala Ala Ala Pro Arg His Gly Leu Leu
20 25 30
Ile Pro Gly Arg Arg Gly Cys Phe Arg Leu Arg Gly Ser Pro Ala Ala
35 40 45
Pro Ala Ala Ala Ala Ser Gly Ser Pro Ser Val Pro Ser Ser Ser Pro
50 55 60
Glu Ala Gly Ser Gly Ile Gly Asp Ala Leu Gly Gly Val Ala Ile Tyr
65 70 75 80
Ser Ala Ala Thr Gly Glu Pro Val Leu Phe Arg Asp Leu Trp Asp Gln
85 90 95
Asn Glu Gly Met Ala Val Val Ala Leu Leu Arg His Phe Gly Cys Pro
100 105 110
Cys Cys Trp Glu Leu Ala Ser Val Leu Arg Asp Thr Lys Glu Arg Phe
115 120 125
Asp Ser Ala Gly Val Lys Leu Ile Ala Val Gly Val Gly Thr Pro Asp
130 135 140
Lys Ala Arg Ile Leu Ala Glu Arg Leu Pro Phe Pro Leu Asp Tyr Leu
145 150 155 160
Tyr Ala Asp Pro Glu Arg Lys Ala Tyr Asp Leu Leu Gly Leu Tyr Phe
165 170 175
Gly Ile Gly Arg Thr Phe Phe Asn Pro Ala Ser Ala Ser Val Phe Ser
180 185 190
Arg Phe Asp Ser Leu Lys Glu Ala Val Lys Asn Tyr Thr Ile Glu Ala
195 200 205
Thr Pro Asp Asp Arg Ala Ser Val Leu Gln Gln Gly Gly Met Phe Val
210 215 220
Phe Arg Gly Lys Glu Leu Ile Tyr Ala Arg Lys Asp Glu Gly Thr Gly
225 230 235 240
Asp His Ala Pro Leu Asp Asp Val Leu Asn Ile Cys Cys Lys Ala Pro
245 250 255
Ala Ala
<210> 73
<211> 917
<212> DNA
<213> Oryza sativa
<400> 73
ctcggcgcgg ccacagccgc agaaccacac ctaggccgct cgaagaccca cgtagcttcc 60
atccaagctt accgccatgg ccgcgcgcgc gccgctcccc gtaccgcacg cggccgccac 120
cagcccgcga ccggctgcgg cgtcgagcct cctccgcgcg aggggcccgt gcgcctccct 180
cctctacccg cgccgcctcc gcttctccgt tgcgccggtg gccgccgcca agcccgaggc 240
cgtcgggagg gccggggagg cagctgcggc gccggtggaa gggctcgcga aatccctgca 300
gggggtggag gtgttcgatc tgagcggaaa ggcggtgccc gttgttgatc tgtggaagga 360
caggaaggcc atcgttgcgt tcgcccgcca ttttggatgc gtgctgtgcc gtaagagggc 420
cgatcttctc gcggctaagc aggatgcaat ggaggctgca ggggttgctc ttgttttaat 480
cggaccaggt actgttgaac aggcaaaggc attttatgac caaaccaaat tcaaaggaga 540
agtatacgct gatccaagtc actcatcata taatgccctt gaatttgcat ttgggctgtt 600
ctcaacgttt actccatcgg ccggtttgaa gattatacag ttgtacatgg aaggatacag 660
gcaggattgg gaactgtcgt tcgagaagac caccagaacg aaaggtggat ggtatcaagg 720
gggcctactt gttgcaggac caggcatcga caatattttg tatatccaca aggacaaaga 780
agcaggagat gaccctgaca tggatgatgt cttgaaagct tgctgttcct agatcactag 840
tatcctatat catttctgtt aacctccaga ccttgaagac acatgtaaat attttgccaa 900
gttaaagtat gttatgt 917
<210> 74
<211> 251
<212> PRT
<213> Oryza sativa
<400> 74
Met Ala Ala Arg Ala Pro Leu Pro Val Pro His Ala Ala Ala Thr Ser
1 5 10 15
Pro Arg Pro Ala Ala Ala Ser Ser Leu Leu Arg Ala Arg Gly Pro Cys
20 25 30
Ala Ser Leu Leu Tyr Pro Arg Arg Leu Arg Phe Ser Val Ala Pro Val
35 40 45
Ala Ala Ala Lys Pro Glu Ala Val Gly Arg Ala Gly Glu Ala Ala Ala
50 55 60
Ala Pro Val Glu Gly Leu Ala Lys Ser Leu Gln Gly Val Glu Val Phe
65 70 75 80
Asp Leu Ser Gly Lys Ala Val Pro Val Val Asp Leu Trp Lys Asp Arg
85 90 95
Lys Ala Ile Val Ala Phe Ala Arg His Phe Gly Cys Val Leu Cys Arg
100 105 110
Lys Arg Ala Asp Leu Leu Ala Ala Lys Gln Asp Ala Met Glu Ala Ala
115 120 125
Gly Val Ala Leu Val Leu Ile Gly Pro Gly Thr Val Glu Gln Ala Lys
130 135 140
Ala Phe Tyr Asp Gln Thr Lys Phe Lys Gly Glu Val Tyr Ala Asp Pro
145 150 155 160
Ser His Ser Ser Tyr Asn Ala Leu Glu Phe Ala Phe Gly Leu Phe Ser
165 170 175
Thr Phe Thr Pro Ser Ala Gly Leu Lys Ile Ile Gln Leu Tyr Met Glu
180 185 190
Gly Tyr Arg Gln Asp Trp Glu Leu Ser Phe Glu Lys Thr Thr Arg Thr
195 200 205
Lys Gly Gly Trp Tyr Gln Gly Gly Leu Leu Val Ala Gly Pro Gly Ile
210 215 220
Asp Asn Ile Leu Tyr Ile His Lys Asp Lys Glu Ala Gly Asp Asp Pro
225 230 235 240
Asp Met Asp Asp Val Leu Lys Ala Cys Cys Ser
245 250
<210> 75
<211> 886
<212> DNA
<213> Oryza sativa
<400> 75
acgcgtgagt tcgtgacgcg tcacgccccg cggccttccc ctcccaaaaa gcggcaggac 60
gcaacctgat ccccatcccc cgagcaagca aagcggagga acgcgatggc gtcggcgctg 120
ctgaggaagg cgacggtagg cggctccgcg gcggcggcgg cggcgaggtg ggcttccagg 180
gggctcgcgt cggtgggctc cggctccgac atcgtctcgg cggcgcccgg cgtgtcgctg 240
cagaaggccc gctcctggga cgagggcgtc gccaccaact tctccaccac ccctctcaag 300
gacatcttcc atgggaagaa agtggtcatc ttcggcctgc ctggtgcata cacaggagtc 360
tgttcacagg cacacgtccc tagttataaa aataacattg acaagttgaa agcaaaaggg 420
gttgactctg ttatctgtgt ctctgtgaat gacccttatg ccctgaatgg atgggcagaa 480
aagctacagg caaaagatgc tattgaattt tatggtgatt ttgatgggag tttccacaaa 540
agcttggatt tggaagtaga cctctctgct gctttgcttg gccgccgttc ccacaggtgg 600
tcagcctttg ttgacgatgg gaagatcaag gctttcaatg ttgaggtagc tccttctgac 660
ttcaaggttt ctggtgccga ggtgatcttg gaccaaatct gatccgagta acgaaattct 720
gtcgttgttt gttttctcat gcagcatgca tgcttttgct gtagtaaata aacgaaaact 780
cgactactcg agtatccatg taaagatgtt tgtagtctgc cttgctacgc ccagaatatt 840
tgttttcctg ttacaaatca gcttgccggg caacatgttt gtcagc 886
<210> 76
<211> 198
<212> PRT
<213> Oryza sativa
<400> 76
Met Ala Ser Ala Leu Leu Arg Lys Ala Thr Val Gly Gly Ser Ala Ala
1 5 10 15
Ala Ala Ala Ala Arg Trp Ala Ser Arg Gly Leu Ala Ser Val Gly Ser
20 25 30
Gly Ser Asp Ile Val Ser Ala Ala Pro Gly Val Ser Leu Gln Lys Ala
35 40 45
Arg Ser Trp Asp Glu Gly Val Ala Thr Asn Phe Ser Thr Thr Pro Leu
50 55 60
Lys Asp Ile Phe His Gly Lys Lys Val Val Ile Phe Gly Leu Pro Gly
65 70 75 80
Ala Tyr Thr Gly Val Cys Ser Gln Ala His Val Pro Ser Tyr Lys Asn
85 90 95
Asn Ile Asp Lys Leu Lys Ala Lys Gly Val Asp Ser Val Ile Cys Val
100 105 110
Ser Val Asn Asp Pro Tyr Ala Leu Asn Gly Trp Ala Glu Lys Leu Gln
115 120 125
Ala Lys Asp Ala Ile Glu Phe Tyr Gly Asp Phe Asp Gly Ser Phe His
130 135 140
Lys Ser Leu Asp Leu Glu Val Asp Leu Ser Ala Ala Leu Leu Gly Arg
145 150 155 160
Arg Ser His Arg Trp Ser Ala Phe Val Asp Asp Gly Lys Ile Lys Ala
165 170 175
Phe Asn Val Glu Val Ala Pro Ser Asp Phe Lys Val Ser Gly Ala Glu
180 185 190
Val Ile Leu Asp Gln Ile
195
<210> 77
<211> 22
<212> PRT
<213> Artificial sequence
<220>
<223> motif 1
<220>
<221> UNSURE
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> UNSURE
<222> (11)..(11)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> VARIANT
<222> (14)..(14)
<223> /replace = "Gly"
<220>
<221> VARIANT
<222> (15)..(15)
<223> /replace = "Met"
<220>
<221> VARIANT
<222> (19)..(19)
<223> /replace = "Gly"
<220>
<221> VARIANT
<222> (21)..(21)
<223> /replace = "Val"
<220>
<221> VARIANT
<222> (22)..(22)
<223> /replace = "Asn"
<400> 77
Pro Leu Val Gly Asn Xaa Ala Pro Asp Phe Xaa Ala Glu Ala Val Phe
1 5 10 15
Asp Gln Glu Phe Ile Lys
20
<210> 78
<211> 22
<212> PRT
<213> Artificial sequence
<220>
<223> motif 2
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace = "Val"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Tyr"
<220>
<221> UNSURE
<222> (7)..(7)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> VARIANT
<222> (10)..(10)
<223> /replace = "Lys"
<220>
<221> VARIANT
<222> (12)..(12)
<223> /replace = "Ala"
<220>
<221> VARIANT
<222> (13)..(13)
<223> /replace = "Glu"
<220>
<221> VARIANT
<222> (14)..(14)
<223> /replace = "Asp"
<220>
<221> VARIANT
<222> (15)..(15)
<223> /replace = "Tyr"
<220>
<221> VARIANT
<222> (16)..(16)
<223> /replace = "Asp" /replace = "Asn"
<220>
<221> VARIANT
<222> (20)..(20)
<223> /replace = "His"
<400> 78
Tyr Pro Leu Ile Ser Asp Xaa Thr Lys Ser Ile Ser Lys Ser Phe Gly
1 5 10 15
Val Leu Ile Pro Asp Gln
20
<210> 79
<211> 2194
<212> DNA
<213> Oryza sativa
<400> 79
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210> 80
<211> 1264
<212> DNA
<213> Oryza sativa
<400> 80
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140
tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200
taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260
gatc 1264
<210> 81
<211> 54
<212> DNA
<213> Artificial sequence
<220>
<223> primer: forward primer prm8756
<400> 81
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gtctgttgct tctt 54
<210> 82
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> primer: reverse primer prm8757
<400> 82
ggggaccact ttgtacaaga aagctgggtt cgagctaaat agctgagaag ag 52
<210> 83
<211> 1317
<212> DNA
<213> Arabidopsis thaliana
<400> 83
cggacaggcc acgtcgtgtc ctaaacctct tagcctttcc ctttataagt caatcttgtg 60
tcggcttcga ctcccaacat acacaaaaca ctaaaagtag aagaaaaatg gcgactctta 120
aggtttctga ttctgttcct gctccttctg atgatgctga gcaattgaga accgcttttg 180
aaggatgggg tacgaacgag gacttgatca tatcaatctt ggctcacaga agtgctgaac 240
agaggaaagt catcaggcaa gcataccacg aaacctacgg cgaagacctt ctcaagactc 300
ttgacaagga gctctctaac gatttcgaga gagctatctt gttgtggact cttgaacccg 360
gtgagcgtga tgctttattg gctaatgaag ctacaaaaag atggacttca agcaaccaag 420
ttcttatgga agttgcttgc acaaggacat caacgcagct gcttcacgct aggcaagctt 480
accatgctcg ctacaagaag tctcttgaag aggacgttgc tcaccacact accggtgact 540
tcagaaagct tttggtttct cttgttacct catacaggta cgaaggagat gaagtgaaca 600
tgacattggc taagcaagaa gctaagctgg tccatgagaa aatcaaggac aagcactaca 660
atgatgagga tgttattaga atcttgtcca caagaagcaa agctcagatc aatgctactt 720
ttaaccgtta ccaagatgat catggcgagg aaattctcaa gagtcttgag gaaggagatg 780
atgatgacaa gttccttgca cttttgaggt caaccattca gtgcttgaca agaccagagc 840
tttactttgt cgatgttctt cgttcagcaa tcaacaaaac tggaactgat gaaggagcac 900
tcactagaat tgtgaccaca agagctgaga ttgacttgaa ggtcattgga gaggagtacc 960
agcgcaggaa cagcattcct ttggagaaag ctattaccaa agacactcgt ggagattacg 1020
agaagatgct cgtcgcactt ctcggtgaag atgatgctta atcaatcaat cctccacaga 1080
gaaacataag ctgctctaca gcttctgtta tctcttatct ccctctctct ctctttgatg 1140
agtttcaaat cgtttgattt tgtttctaca aaaaccttgt ttgtttctgt tgtgtgtttt 1200
gagttcctaa ataatgcaaa agagagagac agagagaacc agtgtggtct cttaagttat 1260
atatatatga agagcattgg cctaaaacac agactaacaa gtagttctgg ttttgac 1317
<210> 84
<211> 317
<212> PRT
<213> Arabidopsis thaliana
<400> 84
Met Ala Thr Leu Lys Val Ser Asp Ser Val Pro Ala Pro Ser Asp Asp
1 5 10 15
Ala Glu Gln Leu Arg Thr Ala Phe Glu Gly Trp Gly Thr Asn Glu Asp
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Ser Ala Glu Gln Arg Lys Val
35 40 45
Ile Arg Gln Ala Tyr His Glu Thr Tyr Gly Glu Asp Leu Leu Lys Thr
50 55 60
Leu Asp Lys Glu Leu Ser Asn Asp Phe Glu Arg Ala Ile Leu Leu Trp
65 70 75 80
Thr Leu Glu Pro Gly Glu Arg Asp Ala Leu Leu Ala Asn Glu Ala Thr
85 90 95
Lys Arg Trp Thr Ser Ser Asn Gln Val Leu Met Glu Val Ala Cys Thr
100 105 110
Arg Thr Ser Thr Gln Leu Leu His Ala Arg Gln Ala Tyr His Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Thr Gly Asp
130 135 140
Phe Arg Lys Leu Leu Val Ser Leu Val Thr Ser Tyr Arg Tyr Glu Gly
145 150 155 160
Asp Glu Val Asn Met Thr Leu Ala Lys Gln Glu Ala Lys Leu Val His
165 170 175
Glu Lys Ile Lys Asp Lys His Tyr Asn Asp Glu Asp Val Ile Arg Ile
180 185 190
Leu Ser Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Phe Asn Arg Tyr
195 200 205
Gln Asp Asp His Gly Glu Glu Ile Leu Lys Ser Leu Glu Glu Gly Asp
210 215 220
Asp Asp Asp Lys Phe Leu Ala Leu Leu Arg Ser Thr Ile Gln Cys Leu
225 230 235 240
Thr Arg Pro Glu Leu Tyr Phe Val Asp Val Leu Arg Ser Ala Ile Asn
245 250 255
Lys Thr Gly Thr Asp Glu Gly Ala Leu Thr Arg Ile Val Thr Thr Arg
260 265 270
Ala Glu Ile Asp Leu Lys Val Ile Gly Glu Glu Tyr Gln Arg Arg Asn
275 280 285
Ser Ile Pro Leu Glu Lys Ala Ile Thr Lys Asp Thr Arg Gly Asp Tyr
290 295 300
Glu Lys Met Leu Val Ala Leu Leu Gly Glu Asp Asp Ala
305 310 315
<210> 85
<211> 56
<212> DNA
<213> Artificial sequence
<220>
<223> forward primer: P08727
<400> 85
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc gactcttaag gtttct 56
<210> 86
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> reverse primer: P09025
<400> 86
ggggaccact ttgtacaaga aagctgggtt taagcatcat cttcaccgag 50
<210> 87
<211> 14
<212> PRT
<213> Artificial sequence
<220>
<223> signature sequence 1
<220>
<221> VARIANT
<222> (1)..(1)
<223> / replace = "Leu" / replace = "Val"
<220>
<221> VARIANT
<222> (2)..(2)
<223> / replace = "Val" / replace = "Leu" / replace = "Ile"
<220>
<221> VARIANT
<222> (3)..(3)
<223> / replace = "Val" / replace = "Met" / replace = "Ile" / replace =
"Cys"
<220>
<221> UNSURE
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Leu, Ser, Ile, Val, Gln or Met
<220>
<221> VARIANT
<222> (5)..(5)
<223> / replace = "Phe"
<220>
<221> VARIANT
<222> (6)..(6)
<223> / replace = "Val" / replace = "Met" / replace = "Thr" / replace =
"Ala"
<220>
<221> VARIANT
<222> (7)..(7)
<223> / replace = "Pro" / replace = "Tyr" / replace = "Met" / replace =
"Phe"
<220>
<221> VARIANT
<222> (8)..(8)
<223> / replace = "Glu" / replace = "Ser" / replace = "His"
<220>
<221> VARIANT
<222> (9)..(9)
<223> / replace = "Ala"
<220>
<221> UNSURE
<222> (10)..(10)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Ala, Val, Pro, Gly, Ser, Thr or Trp
<220>
<221> VARIANT
<222> (11)..(11)
<223> / replace = "Ser" / replace = "Glu" / replace = "Ala"
<400> 87
Ala Met Leu Xaa Trp Ile Leu Asp Pro Xaa Gly Arg Asp Ala
1 5 10
<210> 88
<211> 19
<212> PRT
<213> Artificial sequence
<220>
<223> signature sequence 2
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Ile" /replace = "Val" /replace = "Cys" /replace =
"Gly"
<220>
<221> UNSURE
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Lys, Arg, Gln, Ser, Glu, Ala or Met
<220>
<221> VARIANT
<222> (5)..(5)
<223> /replace = "Arg" /replace = "Trp" /replace = "Met"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Thr" /replace = "Val"
<220>
<221> VARIANT
<222> (8)..(8)
<223> /replace = "Asn"
<220>
<221> VARIANT
<222> (9)..(9)
<223> /replace = "Ala" /replace = "Thr" /replace = "Glu"
<220>
<221> UNSURE
<222> (10)..(10)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Thr, Ser, Lys, Asn, Gly, Asp, Ala, Glu, Gln, or Arg
<220>
<221> VARIANT
<222> (11)..(11)
<223> /replace = "Ala" /replace = "Val" /replace = "Leu" /replace =
"Met"
<220>
<221> VARIANT
<222> (12)..(12)
<223> /replace = "Ile" /replace = "Leu"
<220>
<221> VARIANT
<222> (13)..(13)
<223> /replace = "Thr"
<220>
<221> UNSURE
<222> (14)..(14)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Asn, Ala, Arg, Glu, Asp, Ser or Gln
<220>
<221> VARIANT
<222> (15)..(15)
<223> /replace = "Val" /replace = "Thr"
<220>
<221> VARIANT
<222> (17)..(17)
<223> /replace = "Ala" /replace = "Gly"
<220>
<221> VARIANT
<222> (18)..(18)
<223> /replace = "Gln" /replace = "Lys"
<220>
<221> VARIANT
<222> (19)..(19)
<223> /replace = "Ser"
<400> 88
Ala Phe Xaa Gly Phe Gly Cys Asp Ser Xaa Thr Val Ile Xaa Ile Leu
1 5 10 15
Thr His Arg
<210> 89
<211> 17
<212> PRT
<213> Artificial sequence
<220>
<223> signature sequence 3
<220>
<221> VARIANT
<222> (1)..(1)
<223> /replace = "Ser"
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Asn" /replace = "Glu" /replace = "Thr"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace = "Glu" /replace = "Lys"
<220>
<221> UNSURE
<222> (4)..(4)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Ser Thr, Asp, Glu, Trp, Asn or Lys
<220>
<221> UNSURE
<222> (5)..(5)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Thr, Ala, Ser, Met, His, Asp, Gly, or Trp
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Thr" /replace = "Ser" /replace = "Asn"
<220>
<221> VARIANT
<222> (9)..(9)
<223> /replace = "Ile" /replace = "Ala" /replace = "Gly"
<220>
<221> VARIANT
<222> (10)..(10)
<223> /replace = "Ile" /replace = "Phe"
<220>
<221> VARIANT
<222> (11)..(11)
<223> /replace = "Thr" /replace = "Cys" /replace = "Ser" /replace =
"Ala"
<220>
<221> VARIANT
<222> (12)..(12)
<223> /replace = "Ser"
<220>
<221> VARIANT
<222> (14)..(14)
<223> /replace = "Ala"
<220>
<221> VARIANT
<222> (15)..(15)
<223> /replace = "Asp"
<220>
<221> VARIANT
<222> (16)..(16)
<223> /replace = "Val" /replace = "Phe" /replace = "Leu" /replace =
"Lys" /replace = "His"
<220>
<221> VARIANT
<222> (17)..(17)
<223> /replace = "Ser"
<400> 89
Thr Asp Asp Xaa Xaa Leu Ile Arg Val Val Val Thr Arg Thr Glu Ile
1 5 10 15
Asp
<210> 90
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> signtaure sequence 4
<220>
<221> VARIANT
<222> (1)..(1)
<223> /replace = "His"
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Tyr"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace = "Glu" /replace = "Val" /replace = "Ser"
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace = "Glu" /replace = "Asp"
<220>
<221> VARIANT
<222> (5)..(5)
<223> /replace = "Ala" /replace = "Leu" /replace = "Ile"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Val" /replace = "Ile"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "His" /replace = "Asp"
<220>
<221> UNSURE
<222> (8)..(8)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Lys, Glu, Asp, Thr, Leu, Ser, Gln, Arg, Asn or Ala
<220>
<221> VARIANT
<222> (9)..(9)
<223> /replace = "Ala"
<220>
<221> VARIANT
<222> (10)..(10)
<223> /replace = "Ile" /replace = "Leu"
<400> 90
Tyr Phe Ala Lys Val Leu Arg Xaa Ser Met
1 5 10
<210> 91
<211> 7
<212> PRT
<213> Artificial sequence
<220>
<223> signature sequence 5
<220>
<221> VARIANT
<222> (1)..(1)
<223> /replace = "Gly" /replace = "Lys" /replace = "Ser"
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Ile" /replace = "Met"
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace = "Glu"
<220>
<221> VARIANT
<222> (5)..(5)
<223> /replace = "His"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Val" /replace = "Leu"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Ala" /replace = "Glu"
<400> 91
Tyr Leu Glu His Asp Ile Gly
1 5
<210> 92
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> signature sequence 6
<220>
<221> VARIANT
<222> (1)..(1)
<223> /replace = "Leu" /replace = "Val" /replace = "Ile" /replace =
"Thr"
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Leu" /replace = "Val"
<220>
<221> VARIANT
<222> (3)..(3)
<223> /replace = "Gln" /replace = "Tyr"
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace = "Val"
<220>
<221> VARIANT
<222> (5)..(5)
<223> /replace = "Leu" /replace = "Val" /replace = "Ile"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Ser" /replace = "Gly" /replace = "Ala"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Asp" /replace = "Thr"
<400> 92
Phe Ile Arg Ile Phe Thr Glu Arg Ser
1 5
<210> 93
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> signature sequence 7
<220>
<221> VARIANT
<222> (2)..(2)
<223> /replace = "Lys" /replace = "Met" /replace = "Glu" /replace =
"Gln"
<220>
<221> UNSURE
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid, preferably one of
Thr, Asp, Asn, Lys, Ser, Arg or Ala
<220>
<221> VARIANT
<222> (4)..(4)
<223> /replace = "Thr" /replace = "Leu" /replace = "Met" /replace =
"Ile"
<220>
<221> VARIANT
<222> (5)..(5)
<223> /replace = "Ile"
<220>
<221> VARIANT
<222> (6)..(6)
<223> /replace = "Ile" /replace = "Val"
<220>
<221> VARIANT
<222> (7)..(7)
<223> /replace = "Thr" /replace = "Val" /replace = "Ala"
<220>
<221> VARIANT
<222> (9)..(9)
<223> /replace = "Ile" /replace = "Leu" /replace = "Ala" /replace =
"Met"
<220>
<221> VARIANT
<222> (10)..(10)
<223> /replace = "Ser"
<400> 93
Tyr Arg Xaa Phe Leu Leu Ser Leu Val Gly
1 5 10
<210> 94
<211> 2194
<212> DNA
<213> Oryza sativa
<400> 94
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210> 95
<211> 1244
<212> DNA
<213> Oryza sativa
<400> 95
aaaaccaccg agggacctga tctgcaccgg ttttgatagt tgagggaccc gttgtgtctg 60
gttttccgat cgagggacga aaatcggatt cggtgtaaag ttaagggacc tcagatgaac 120
ttattccgga gcatgattgg gaagggagga cataaggccc atgtcgcatg tgtttggacg 180
gtccagatct ccagatcact cagcaggatc ggccgcgttc gcgtagcacc cgcggtttga 240
ttcggcttcc cgcaaggcgg cggccggtgg ccgtgccgcc gtagcttccg ccggaagcga 300
gcacgccgcc gccgccgacc cggctctgcg tttgcaccgc cttgcacgcg atacatcggg 360
atagatagct actactctct ccgtttcaca atgtaaatca ttctactatt ttccacattc 420
atattgatgt taatgaatat agacatatat atctatttag attcattaac atcaatatga 480
atgtaggaaa tgctagaatg acttacattg tgaattgtga aatggacgaa gtacctacga 540
tggatggatg caggatcatg aaagaattaa tgcaagatcg tatctgccgc atgcaaaatc 600
ttactaattg cgctgcatat atgcatgaca gcctgcatgc gggcgtgtaa gcgtgttcat 660
ccattaggaa gtaaccttgt cattacttat accagtacta catactatat agtattgatt 720
tcatgagcaa atctacaaaa ctggaaagca ataagaaata cgggactgga aaagactcaa 780
cattaatcac caaatatttc gccttctcca gcagaatata tatctctcca tcttgatcac 840
tgtacacact gacagtgtac gcataaacgc agcagccagc ttaactgtcg tctcaccgtc 900
gcacactggc cttccatctc aggctagctt tctcagccac ccatcgtaca tgtcaactcg 960
gcgcgcgcac aggcacaaat tacgtacaaa acgcatgacc aaatcaaaac caccggagaa 1020
gaatcgctcc cgcgcgcggc ggcgacgcgc acgtacgaac gcacgcacgc acgcccaacc 1080
ccacgacacg atcgcgcgcg acgccggcga caccggccgt ccacccgcgc cctcacctcg 1140
ccgactataa atacgtaggc atctgcttga tcttgtcatc catctcacca ccaaaaaaaa 1200
aaggaaaaaa aaacaaaaca caccaagcca aataaaagcg acaa 1244
<210> 96
<211> 1141
<212> DNA
<213> Gossypium hirsutum
<400> 96
cagattcaga aagaaataaa ggaagaagaa gcaatggcca ctcttacagt gcccacgaca 60
gttccttcgg tgtctgaaga ttgtgaacag ctaagaaaag ccttttcagg atggggaact 120
aatgagggct taatcataga tatattgggt cacagaaatg ccgagcaacg aaacttgatt 180
cgaaaaacct acgctgaaac ctatggagag gatctcctca aggcactaga caaggagctc 240
tcgaatgact ttgagaggct ggttttgctt tgggctcttg atcctgctga acgtgatgcc 300
cttttggcta atgaagccac caaaaggtgg acttcaagca atcaggtcct tatggaaata 360
gcttgcacaa ggtctgccaa ccaactgctt cacgcaaggc aggcttatca tgctcgttat 420
aagaagtcgc ttgaagagga tgttgctcat cacacgactg gcgacttccg taagctcctc 480
ctacctctag tgagttcata cagatatgag ggagaggagg tgaacatgaa tctggcgaaa 540
acagaggcga agttgcttca tgagaaaatt tcagacaaag cttacagtga tgacgatgtc 600
ataagggttt tggctacaag aagcaaggca cagatcaatg caactctgaa tcactacaaa 660
aatgaatatg gaaatgacat aaacaaggac ttgaaggctg atcctaagga tgagttcctt 720
gcactactaa ggtccacagt gaagtgcttg gtctatccgg aaaagtattt tgagaaggtt 780
cttcgcctag caatcaatag acgaggaacg gatgaaggag ctcttactag agttgtttgc 840
actagggctg aggttgatct aaagatcata gcagatgagt accagcgaag gaacagtgtc 900
ccactgactc gtgccattgt caaggacact catggagact atgaaaaatt gctgctggta 960
cttgcaggac atgtggagaa ttgaatctga tatcatgaga caatttcctg gtgaataaat 1020
gtttatgacc aaactataat ggtctagtgt ggttattgat gttttcctgt ttttctatgt 1080
agtattgcga gttatatgct atccaagaat tcgaagtcta tttaaaaaaa aaaaaaaaaa 1140
a 1141
<210> 97
<211> 316
<212> PRT
<213> Gossypium hirsutum
<400> 97
Met Ala Thr Leu Thr Val Pro Thr Thr Val Pro Ser Val Ser Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Lys Ala Phe Ser Gly Trp Gly Thr Asn Glu Gly
20 25 30
Leu Ile Ile Asp Ile Leu Gly His Arg Asn Ala Glu Gln Arg Asn Leu
35 40 45
Ile Arg Lys Thr Tyr Ala Glu Thr Tyr Gly Glu Asp Leu Leu Lys Ala
50 55 60
Leu Asp Lys Glu Leu Ser Asn Asp Phe Glu Arg Leu Val Leu Leu Trp
65 70 75 80
Ala Leu Asp Pro Ala Glu Arg Asp Ala Leu Leu Ala Asn Glu Ala Thr
85 90 95
Lys Arg Trp Thr Ser Ser Asn Gln Val Leu Met Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ala Asn Gln Leu Leu His Ala Arg Gln Ala Tyr His Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Thr Gly Asp
130 135 140
Phe Arg Lys Leu Leu Leu Pro Leu Val Ser Ser Tyr Arg Tyr Glu Gly
145 150 155 160
Glu Glu Val Asn Met Asn Leu Ala Lys Thr Glu Ala Lys Leu Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Asp Val Ile Arg Val
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asn Glu Tyr Gly Asn Asp Ile Asn Lys Asp Leu Lys Ala Asp Pro
210 215 220
Lys Asp Glu Phe Leu Ala Leu Leu Arg Ser Thr Val Lys Cys Leu Val
225 230 235 240
Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Leu Ala Ile Asn Arg
245 250 255
Arg Gly Thr Asp Glu Gly Ala Leu Thr Arg Val Val Cys Thr Arg Ala
260 265 270
Glu Val Asp Leu Lys Ile Ile Ala Asp Glu Tyr Gln Arg Arg Asn Ser
275 280 285
Val Pro Leu Thr Arg Ala Ile Val Lys Asp Thr His Gly Asp Tyr Glu
290 295 300
Lys Leu Leu Leu Val Leu Ala Gly His Val Glu Asn
305 310 315
<210> 98
<211> 1112
<212> DNA
<213> Lavatera thuringiaca
<400> 98
aatggctact cttacagttc cctccacact tccgtcagtg tctgaagatt gtgaacaact 60
caggaaagcc ttctcaggat ggggaactaa tgaggactta atcataaata tattgggtca 120
ccgaaatgcg gacgaacgaa actcgattcg aaaagcttat actgaaaccc atggagaaga 180
tctcctcaag gcactggaca aggaactctc aaatgacttt gagaggctgg ttctgctttg 240
gactcttgat cctcctgaac gtgatgcact tttggcaaat gaagccacca aaaggtggac 300
ttcaagcaat caggtaatta tggaaatagc ctgcagaagt tcttctgacc aactgcttcg 360
cgcgaggcag gcttatcatg ttcgttataa gaaatcgctt gaagaggatg ttgcccatca 420
cacaactggc gacttccgta agcttctcct acctcttgtg agttcataca gatacgaggg 480
agatgaagtg aacatgactc tggcgaaaac agaggccaag ttactccatg agaaaatctc 540
aaacaaagct tacagtgatg acgatgtcat cagggttttg gctacgagaa gcaagtcaca 600
gatcaacgaa cgtcttaatc actacaaaaa tgaatacgca actgatataa acaaggacct 660
gaaggctgac cctaaggatg agttccttgc actgctaagg tccacagtga agtgcttggt 720
ctaccctgaa aagtatttcg agaaggttct tcgtctagca atcaataaac gaggaacgga 780
tgaaggagct cttacgaggg ttgtttccac cagggctgag gttgatctaa agatcatagc 840
agatgagtac cagcgaagga acagtgtccc actgactcgt gctattgtca aggacactaa 900
tggagactac gaaaaattgc tgctggtact tgctggagag gtggaggctt gaaccggttt 960
tcatgagatg attttgtgtt gaataaaaac ttaatgaccg gaactctaat ggtctagtgt 1020
tgctattatg ttatcctgtt ttttttcttc tatggtactg tgagttttat gcaataaagg 1080
cttgttattt agaaaaaaaa aaaaaaaaaa aa 1112
<210> 99
<211> 316
<212> PRT
<213> Lavatera thuringiaca
<400> 99
Met Ala Thr Leu Thr Val Pro Ser Thr Leu Pro Ser Val Ser Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Lys Ala Phe Ser Gly Trp Gly Thr Asn Glu Asp
20 25 30
Leu Ile Ile Asn Ile Leu Gly His Arg Asn Ala Asp Glu Arg Asn Ser
35 40 45
Ile Arg Lys Ala Tyr Thr Glu Thr His Gly Glu Asp Leu Leu Lys Ala
50 55 60
Leu Asp Lys Glu Leu Ser Asn Asp Phe Glu Arg Leu Val Leu Leu Trp
65 70 75 80
Thr Leu Asp Pro Pro Glu Arg Asp Ala Leu Leu Ala Asn Glu Ala Thr
85 90 95
Lys Arg Trp Thr Ser Ser Asn Gln Val Ile Met Glu Ile Ala Cys Arg
100 105 110
Ser Ser Ser Asp Gln Leu Leu Arg Ala Arg Gln Ala Tyr His Val Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Thr Gly Asp
130 135 140
Phe Arg Lys Leu Leu Leu Pro Leu Val Ser Ser Tyr Arg Tyr Glu Gly
145 150 155 160
Asp Glu Val Asn Met Thr Leu Ala Lys Thr Glu Ala Lys Leu Leu His
165 170 175
Glu Lys Ile Ser Asn Lys Ala Tyr Ser Asp Asp Asp Val Ile Arg Val
180 185 190
Leu Ala Thr Arg Ser Lys Ser Gln Ile Asn Glu Arg Leu Asn His Tyr
195 200 205
Lys Asn Glu Tyr Ala Thr Asp Ile Asn Lys Asp Leu Lys Ala Asp Pro
210 215 220
Lys Asp Glu Phe Leu Ala Leu Leu Arg Ser Thr Val Lys Cys Leu Val
225 230 235 240
Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Leu Ala Ile Asn Lys
245 250 255
Arg Gly Thr Asp Glu Gly Ala Leu Thr Arg Val Val Ser Thr Arg Ala
260 265 270
Glu Val Asp Leu Lys Ile Ile Ala Asp Glu Tyr Gln Arg Arg Asn Ser
275 280 285
Val Pro Leu Thr Arg Ala Ile Val Lys Asp Thr Asn Gly Asp Tyr Glu
290 295 300
Lys Leu Leu Leu Val Leu Ala Gly Glu Val Glu Ala
305 310 315
<210> 100
<211> 2040
<212> DNA
<213> Brassica rapa
<400> 100
atggcgtctc tcaaagtccc taccaacgtt cctcttcccg aggaagacgc cgagcaactc 60
cacaaggctt ttgcaggatg gggtaccaac gagaagctga tcatatcaat cctagctcac 120
aggacctcag cacaacgcag cttaatccgc agcgcttatg ccgctgctta caatgaggat 180
ctcctcaagg ccttagacaa agagctttct agtgactttg agcgagttgt catgttgtgg 240
actcttgatc cagcggagag agatgctttc cttgctaaag aatctaccaa aatgttcacc 300
aagaacaatt gggttcttgt tgaaatcgca tgcactaggt gtcctcttga tcttttcaag 360
gtcaaacaag cttaccaagc acgttacaag aaatctctag aggaagatgt tgcgcaacac 420
acatctggtg accttcgtaa gctcttgctt cctcttgtta gtacttttag gtacgaagga 480
gatgaggtga acatgaggct tgcaagatcc gaagctaagt tacttcacga gaaggtctca 540
gagaaagcct ttagtgatga tgacttcatc agaatcttga caacaagaag caaagcacag 600
ctcggtgcaa ctcttaacca ctacaataat gagtacggaa acgctattaa caagcacttg 660
aaggaagatt cagatgatga gtacctgaag ctactaagag ctgcgatcac gtgtttgaca 720
taccctgaga agcattttga gaaggttttg cgtctagcaa ttaacaaaat ggggactgat 780
gagtgggcac taacccgagt tgtgactaca cgaactgaag ttgatatgga acgtatcaaa 840
gaggaatatc aacgaaggaa cagcattcct ttgcaccatg ccgtcgctaa agacacttct 900
ggtgattatg aggatatgct tgtttctctt ctcggacatg gagatgaagg gactctcgac 960
ggatcttttg ctggagataa gcgcctcggc ttctcgtctt cttcacagtc ctcacgtcgt 1020
ctcgccctat ctggtgggtc gtctctccaa caacgaatcg agaggactct cttgccactg 1080
ctgctctcgg gttatcggag acaagctcca gtgaactccc ctctaactgc cccagacatg 1140
tctcgatttt gcagatccga agaaccttct ggttctcttg gtctctcatc atttggtggc 1200
tccttcctca ccagagccgg gtctagcgtc aattcacctg ctcctctctc atcaatttat 1260
gttaatccgg cgaccgatgt aggtggaact ccactccggc gaccagatct gttccttaaa 1320
agtttgagaa gacaagcatc ctccagcgac attcctcttc cccgctccat cctctccatc 1380
ctccatgttt ggcctcctcc acccttcaga ttgtgtaaac ttggtttaaa acgattgcat 1440
gaagatccat accaccaacc actgcaaaca taccttctat cacagcggtt tgcaaatttg 1500
gcgtccgatg taggtgggaa ttcactccgg catacagttt tgagccatat gtttatgaat 1560
atgacgtctg atgtgagtgg gaatccactc cggcctccag ctctgagcca tcaaaagcta 1620
gtaaggccaa tttgtcggcg cattattctc acctcttttt ctgttgtgga gatcacttta 1680
ctaccatgtc tcccttctat gaatggagaa aatttctcag attcttttcc gagcttcagt 1740
tgcagtttac tcactggttt gttactttat ggagcggtcc gtacggggcc tgaaggtgca 1800
atcgagacta cttcggtttt tcttgttggt gaagactgtc tttcaacgtc acttgtgact 1860
atctctcaac tatccaactt tgccgtggaa gctttattga cgcattcaaa cttgatattg 1920
aattcgctgt caacttcata tgaagattta ttatgcttgt ttctaattgc tattatagtt 1980
catgaattgt ccacaagagg atgtttagtt ctcttttggc tttgtagtcc ttgcatttga 2040
<210> 101
<211> 679
<212> PRT
<213> Brassica rapa
<400> 101
Met Ala Ser Leu Lys Val Pro Thr Asn Val Pro Leu Pro Glu Glu Asp
1 5 10 15
Ala Glu Gln Leu His Lys Ala Phe Ala Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Thr Ser Ala Gln Arg Ser Leu
35 40 45
Ile Arg Ser Ala Tyr Ala Ala Ala Tyr Asn Glu Asp Leu Leu Lys Ala
50 55 60
Leu Asp Lys Glu Leu Ser Ser Asp Phe Glu Arg Val Val Met Leu Trp
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Phe Leu Ala Lys Glu Ser Thr
85 90 95
Lys Met Phe Thr Lys Asn Asn Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Cys Pro Leu Asp Leu Phe Lys Val Lys Gln Ala Tyr Gln Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala Gln His Thr Ser Gly Asp
130 135 140
Leu Arg Lys Leu Leu Leu Pro Leu Val Ser Thr Phe Arg Tyr Glu Gly
145 150 155 160
Asp Glu Val Asn Met Arg Leu Ala Arg Ser Glu Ala Lys Leu Leu His
165 170 175
Glu Lys Val Ser Glu Lys Ala Phe Ser Asp Asp Asp Phe Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Leu Gly Ala Thr Leu Asn His Tyr
195 200 205
Asn Asn Glu Tyr Gly Asn Ala Ile Asn Lys His Leu Lys Glu Asp Ser
210 215 220
Asp Asp Glu Tyr Leu Lys Leu Leu Arg Ala Ala Ile Thr Cys Leu Thr
225 230 235 240
Tyr Pro Glu Lys His Phe Glu Lys Val Leu Arg Leu Ala Ile Asn Lys
245 250 255
Met Gly Thr Asp Glu Trp Ala Leu Thr Arg Val Val Thr Thr Arg Thr
260 265 270
Glu Val Asp Met Glu Arg Ile Lys Glu Glu Tyr Gln Arg Arg Asn Ser
275 280 285
Ile Pro Leu His His Ala Val Ala Lys Asp Thr Ser Gly Asp Tyr Glu
290 295 300
Asp Met Leu Val Ser Leu Leu Gly His Gly Asp Glu Gly Thr Leu Asp
305 310 315 320
Gly Ser Phe Ala Gly Asp Lys Arg Leu Gly Phe Ser Ser Ser Ser Gln
325 330 335
Ser Ser Arg Arg Leu Ala Leu Ser Gly Gly Ser Ser Leu Gln Gln Arg
340 345 350
Ile Glu Arg Thr Leu Leu Pro Leu Leu Leu Ser Gly Tyr Arg Arg Gln
355 360 365
Ala Pro Val Asn Ser Pro Leu Thr Ala Pro Asp Met Ser Arg Phe Cys
370 375 380
Arg Ser Glu Glu Pro Ser Gly Ser Leu Gly Leu Ser Ser Phe Gly Gly
385 390 395 400
Ser Phe Leu Thr Arg Ala Gly Ser Ser Val Asn Ser Pro Ala Pro Leu
405 410 415
Ser Ser Ile Tyr Val Asn Pro Ala Thr Asp Val Gly Gly Thr Pro Leu
420 425 430
Arg Arg Pro Asp Leu Phe Leu Lys Ser Leu Arg Arg Gln Ala Ser Ser
435 440 445
Ser Asp Ile Pro Leu Pro Arg Ser Ile Leu Ser Ile Leu His Val Trp
450 455 460
Pro Pro Pro Pro Phe Arg Leu Cys Lys Leu Gly Leu Lys Arg Leu His
465 470 475 480
Glu Asp Pro Tyr His Gln Pro Leu Gln Thr Tyr Leu Leu Ser Gln Arg
485 490 495
Phe Ala Asn Leu Ala Ser Asp Val Gly Gly Asn Ser Leu Arg His Thr
500 505 510
Val Leu Ser His Met Phe Met Asn Met Thr Ser Asp Val Ser Gly Asn
515 520 525
Pro Leu Arg Pro Pro Ala Leu Ser His Gln Lys Leu Val Arg Pro Ile
530 535 540
Cys Arg Arg Ile Ile Leu Thr Ser Phe Ser Val Val Glu Ile Thr Leu
545 550 555 560
Leu Pro Cys Leu Pro Ser Met Asn Gly Glu Asn Phe Ser Asp Ser Phe
565 570 575
Pro Ser Phe Ser Cys Ser Leu Leu Thr Gly Leu Leu Leu Tyr Gly Ala
580 585 590
Val Arg Thr Gly Pro Glu Gly Ala Ile Glu Thr Thr Ser Val Phe Leu
595 600 605
Val Gly Glu Asp Cys Leu Ser Thr Ser Leu Val Thr Ile Ser Gln Leu
610 615 620
Ser Asn Phe Ala Val Glu Ala Leu Leu Thr His Ser Asn Leu Ile Leu
625 630 635 640
Asn Ser Leu Ser Thr Ser Tyr Glu Asp Leu Leu Cys Leu Phe Leu Ile
645 650 655
Ala Ile Ile Val His Glu Leu Ser Thr Arg Gly Cys Leu Val Leu Phe
660 665 670
Trp Leu Cys Ser Pro Cys Ile
675
<210> 102
<211> 1146
<212> DNA
<213> Gossypium hirsutum
<400> 102
caaccctcaa agttccagtt cacgttcctt ctccttctga ggatgctgaa tggcaacttc 60
ggaaagcttt tgaaggctgg ggtacgaacg agcaattgat tatcgacata ttggctcaca 120
ggaatgcagc acagcgcaat tcaattcgga aagtttatgg tgaagcttat ggggaagatc 180
ttctcaagtg tttggagaag gaacttacaa gtgatttcga gcgggctgtg ctgcttttta 240
cgttggaccc tgcagagcga gatgctcatc tggctaatga agctacaaag aagttcacat 300
caagcaattg gattctcatg gagatagctt gcagtaggtc ttcgcatgaa ctactcaatg 360
tgaaaaaggc gtatcatgct cgttataaga aatcccttga agaagatgtt gctcaccaca 420
ctaccggaga gtaccgcaag cttttggtcc ctcttgttag tgcattccga tatgagggag 480
aggaggtgaa catgacattg gcaaaatctg aggctaagat acttcatgat aaaatttcgg 540
acaagcatta taccgatgag gaggtgatta ggattgtatc aacaaggagt aaggcacagc 600
tcaatgcaac tctcaaccat tacaatactt cattcggcaa tgctatcaac aaggatttga 660
aggctgatcc cagtgatgaa ttcctcaaat tactaagagc tgtgatcaag tgcttgacca 720
ccccagagca atatttcgag aaggttttac gtcaagccat caataagttg ggatccgatg 780
aatgggctct tacccgagtc gtcacaactc gtgcagaggt cgacatggta cgtattaagg 840
aggcatatca acgaagaaac agcatccctc tcgaacaagc aattgctaaa gatacttcgg 900
gtgactatga gaagtttctt cttgccttga tcggagctgg agatgcatga accgtcttcg 960
gtattaagtt cctctgtatg aatgtttagt ttgccttatc cgctatgact taataattta 1020
tgcttggttt ttcatcgttt tcattatcta aagcattgct tgcttccatg atagaacatt 1080
caaaataaaa tgattgagtt cgtttaaaaa aaaaaaaaaa aaaaaaaagg aaaaaaaaaa 1140
aaaaaa 1146
<210> 103
<211> 315
<212> PRT
<213> Gossypium hirsutum
<400> 103
Thr Leu Lys Val Pro Val His Val Pro Ser Pro Ser Glu Asp Ala Glu
1 5 10 15
Trp Gln Leu Arg Lys Ala Phe Glu Gly Trp Gly Thr Asn Glu Gln Leu
20 25 30
Ile Ile Asp Ile Leu Ala His Arg Asn Ala Ala Gln Arg Asn Ser Ile
35 40 45
Arg Lys Val Tyr Gly Glu Ala Tyr Gly Glu Asp Leu Leu Lys Cys Leu
50 55 60
Glu Lys Glu Leu Thr Ser Asp Phe Glu Arg Ala Val Leu Leu Phe Thr
65 70 75 80
Leu Asp Pro Ala Glu Arg Asp Ala His Leu Ala Asn Glu Ala Thr Lys
85 90 95
Lys Phe Thr Ser Ser Asn Trp Ile Leu Met Glu Ile Ala Cys Ser Arg
100 105 110
Ser Ser His Glu Leu Leu Asn Val Lys Lys Ala Tyr His Ala Arg Tyr
115 120 125
Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Thr Gly Glu Tyr
130 135 140
Arg Lys Leu Leu Val Pro Leu Val Ser Ala Phe Arg Tyr Glu Gly Glu
145 150 155 160
Glu Val Asn Met Thr Leu Ala Lys Ser Glu Ala Lys Ile Leu His Asp
165 170 175
Lys Ile Ser Asp Lys His Tyr Thr Asp Glu Glu Val Ile Arg Ile Val
180 185 190
Ser Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn His Tyr Asn
195 200 205
Thr Ser Phe Gly Asn Ala Ile Asn Lys Asp Leu Lys Ala Asp Pro Ser
210 215 220
Asp Glu Phe Leu Lys Leu Leu Arg Ala Val Ile Lys Cys Leu Thr Thr
225 230 235 240
Pro Glu Gln Tyr Phe Glu Lys Val Leu Arg Gln Ala Ile Asn Lys Leu
245 250 255
Gly Ser Asp Glu Trp Ala Leu Thr Arg Val Val Thr Thr Arg Ala Glu
260 265 270
Val Asp Met Val Arg Ile Lys Glu Ala Tyr Gln Arg Arg Asn Ser Ile
275 280 285
Pro Leu Glu Gln Ala Ile Ala Lys Asp Thr Ser Gly Asp Tyr Glu Lys
290 295 300
Phe Leu Leu Ala Leu Ile Gly Ala Gly Asp Ala
305 310 315
<210> 104
<211> 1180
<212> DNA
<213> Capsicum annuum
<400> 104
aaaaatggca agtctaaccg ttccagcaca tgttccttcg gctgctgaag actgtgaaca 60
actccgatct gccttcaaag gatggggaac aaatgagaag ttgatcatat caattttggc 120
tcatagaact gctgctcagc gcaaattgat tcgtcaaact tatgctgaga ctttcggaga 180
ggatctactt aaagagttgg acagagaact tacccatgat tttgagaaat tggtgctagt 240
gtggacgttg gatccttcag aacgtgatgc tcatttggct aaggaagcta ctaagagatg 300
gacaaaaagc aactttgttc ttgtggagct agcttgtacc agatcgccta aagaactggt 360
tttggctagg gaagcttatc atgcacgtta caagaaatct cttgaagagg atgttgccta 420
tcacactact ggggatcacc gcaagctttt ggtacctctt gtgagctcct accgatatgg 480
aggagaggag gtggacttgc gccttgctaa agcagaatct aaaattctgc atgagaagat 540
ctccgataag gcttacagtg atgatgaggt cattagaatt ttagccacaa ggagcaaagc 600
gcaactcaat gctactttga atcattacaa agatgaacat ggtgaggata tcctaaagca 660
attggaagat ggggatgagt ttgttgcact attgagggcc accattaaag gtcttgtcta 720
cccggagcac tattttgtgg aggttcttcg tgatgcaatc aacaggagag ggacagagga 780
agatcatctg acaagagtta ttgctacaag ggctgaggtc gatctgaaga ttatcgctga 840
tgagtaccag aagagggata gcattcccct gggtcgcgcc attgccaaag atacaagagg 900
agattatgag agtatgctgt tggctttgct tggacaagag gaggactgag gaggatttgg 960
ccacttatgt tttacaatga caagaataaa tatgccatcc cctatatgag aattggcatc 1020
cgttgtatgt ttgatgattg agtgtggtct gtttatgagc ttttagtcct tttttcttct 1080
cgtgagaaac ttctaatatg caactttgtg ctgtctacat atgttttcta ataatatgca 1140
tcgattagtt ctaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1180
<210> 105
<211> 322
<212> PRT
<213> Capsicum annuum
<400> 105
Met Ala His His His His His His Met Ala Ser Leu Thr Val Pro Ala
1 5 10 15
His Val Pro Ser Ala Ala Glu Asp Cys Glu Gln Leu Arg Ser Ala Phe
20 25 30
Lys Gly Trp Gly Thr Asn Glu Lys Leu Ile Ile Ser Ile Leu Ala His
35 40 45
Arg Thr Ala Ala Gln Arg Lys Leu Ile Arg Gln Thr Tyr Ala Glu Thr
50 55 60
Phe Gly Glu Asp Leu Leu Lys Glu Leu Asp Arg Glu Leu Thr His Asp
65 70 75 80
Phe Glu Lys Leu Val Leu Val Trp Thr Leu Asp Pro Ser Glu Arg Asp
85 90 95
Ala His Leu Ala Lys Glu Ala Thr Lys Arg Trp Thr Lys Ser Asn Phe
100 105 110
Val Leu Val Glu Leu Ala Cys Thr Arg Ser Pro Lys Glu Leu Val Leu
115 120 125
Ala Arg Glu Ala Tyr His Ala Arg Tyr Lys Lys Ser Leu Glu Glu Asp
130 135 140
Val Ala Tyr His Thr Thr Gly Asp His Arg Lys Leu Leu Val Pro Leu
145 150 155 160
Val Ser Ser Tyr Arg Tyr Gly Gly Glu Glu Val Asp Leu Arg Leu Ala
165 170 175
Lys Ala Glu Ser Lys Ile Leu His Glu Lys Ile Ser Asp Lys Ala Tyr
180 185 190
Ser Asp Asp Glu Val Ile Arg Ile Leu Ala Thr Arg Ser Lys Ala Gln
195 200 205
Leu Asn Ala Thr Leu Asn His Tyr Lys Asp Glu His Gly Glu Asp Ile
210 215 220
Leu Lys Gln Leu Glu Asp Gly Asp Glu Phe Val Ala Leu Leu Arg Ala
225 230 235 240
Thr Ile Lys Gly Leu Val Tyr Pro Glu His Tyr Phe Val Glu Val Leu
245 250 255
Arg Asp Ala Ile Asn Arg Arg Gly Thr Glu Glu Asp His Leu Thr Arg
260 265 270
Val Ile Ala Thr Arg Ala Glu Val Asp Leu Lys Ile Ile Ala Asp Glu
275 280 285
Tyr Gln Lys Arg Asp Ser Ile Pro Leu Gly Arg Ala Ile Ala Lys Asp
290 295 300
Thr Arg Gly Asp Tyr Glu Ser Met Leu Leu Ala Leu Leu Gly Gln Glu
305 310 315 320
Glu Asp
<210> 106
<211> 1197
<212> DNA
<213> Nicotiana tabacum
<400> 106
catccacaat tctccacagt acaagaaaac aaaaaaatgg cgagtcttaa agttccaaca 60
tctgttccag aaccttatga agatgctgag caactcaaaa aagcttttgc tggatggggt 120
acaaatgagg cacttattat tcagattctg gcacatagaa atgcagcaca acgcaagtta 180
atccgagaaa cttatgctgc agcttatgga gaggatcttc tcaaggactt ggatgctgaa 240
ctgacaagtg attttcagcg tgcagtgctt ctgtggactt tgagtcctgc tgagcgcgac 300
gcctacttgg ttaatgaagc taccaaacgt ctgacttcta gcaattgggt tatcttggaa 360
attgcttgta caaggtcttc tgatgatctc tttaaggcga ggcaggccta ccatgctcga 420
tacaagaaat cacttgaaga agatgttgct tatcacacaa ctggggattt ccgtaagctt 480
ttggttcctc ttttaactgc attcagatac gaaggagaag aggcgaacat gacattggca 540
agaaaggagg caaatatact acacgagaag atctctgaca aggcttacaa tgatgaggag 600
ctcatccgaa ttatttctac taggagtaaa gcacagctga atgcaacatt caaccactac 660
cttgaccaac atggcagtga aatcaacaag gatctggaaa ctgattctga tgatgagtac 720
ctgaaattac tcagcgcagc aatagaatgc ttgaaaaccc cagagaaaca ctttgagaaa 780
gttcttcgat tggctatcaa gggtacaggc acagacgaat gggaccttac tagagttgtc 840
actactcggg ctgaagttga catggaacgt atcaaagaag agtaccataa gaggaacagt 900
gttccattgg accgtgcaat tgctggagac acttcaggag actatgaaag gatgcttctg 960
gctttgattg ggcatggaga tgcttgaatg gaatatgtgt tctaagattg gataagaaac 1020
tatttcctaa tgtctgaagt ttgaatttgt ttgatgatgt gtgcatgtat gcccagagtt 1080
tggtttgcat tatatggatt taaataatcc aggtgttgtg ttttgttttt ttcttcactt 1140
gtcatagttt ggttctatat attcggactt cctcaaccag tgatcttatt gtttatc 1197
<210> 107
<211> 316
<212> PRT
<213> Nicotiana tabacum
<400> 107
Met Ala Ser Leu Lys Val Pro Thr Ser Val Pro Glu Pro Tyr Glu Asp
1 5 10 15
Ala Glu Gln Leu Lys Lys Ala Phe Ala Gly Trp Gly Thr Asn Glu Ala
20 25 30
Leu Ile Ile Gln Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Arg Glu Thr Tyr Ala Ala Ala Tyr Gly Glu Asp Leu Leu Lys Asp
50 55 60
Leu Asp Ala Glu Leu Thr Ser Asp Phe Gln Arg Ala Val Leu Leu Trp
65 70 75 80
Thr Leu Ser Pro Ala Glu Arg Asp Ala Tyr Leu Val Asn Glu Ala Thr
85 90 95
Lys Arg Leu Thr Ser Ser Asn Trp Val Ile Leu Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ser Asp Asp Leu Phe Lys Ala Arg Gln Ala Tyr His Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Asp
130 135 140
Phe Arg Lys Leu Leu Val Pro Leu Leu Thr Ala Phe Arg Tyr Glu Gly
145 150 155 160
Glu Glu Ala Asn Met Thr Leu Ala Arg Lys Glu Ala Asn Ile Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Asn Asp Glu Glu Leu Ile Arg Ile
180 185 190
Ile Ser Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Phe Asn His Tyr
195 200 205
Leu Asp Gln His Gly Ser Glu Ile Asn Lys Asp Leu Glu Thr Asp Ser
210 215 220
Asp Asp Glu Tyr Leu Lys Leu Leu Ser Ala Ala Ile Glu Cys Leu Lys
225 230 235 240
Thr Pro Glu Lys His Phe Glu Lys Val Leu Arg Leu Ala Ile Lys Gly
245 250 255
Thr Gly Thr Asp Glu Trp Asp Leu Thr Arg Val Val Thr Thr Arg Ala
260 265 270
Glu Val Asp Met Glu Arg Ile Lys Glu Glu Tyr His Lys Arg Asn Ser
275 280 285
Val Pro Leu Asp Arg Ala Ile Ala Gly Asp Thr Ser Gly Asp Tyr Glu
290 295 300
Arg Met Leu Leu Ala Leu Ile Gly His Gly Asp Ala
305 310 315
<210> 108
<211> 1086
<212> DNA
<213> Gossypium hirsutum
<400> 108
gggcaggttc ttcacaaaaa agaaaagaaa aattacagtg aaaatggcaa cccttaaagt 60
tccagctcat gtacctgccc cttctgagga tgctgagcaa cttcgtaaag cttttgaagg 120
atggggtaca aatgagcaat tgattatcga cattttggct cacaggaatg cagctcagcg 180
caatttgatt cgtaaaactt atcgtgaagc ttatggggaa gatctcctta agtctttgga 240
tgaggaactt tcaagtgact ttgagcgagc tgtggtgctg tttactttgg accctgcaga 300
gcgtgatgca tttctggctc atgaagctac aaagaggttc acatcaagcc attgggttct 360
catggaaatt gcttgcacta ggtcttcaca tgaactgttc aatgtgagga aggcgtatca 420
cgatctttac aagaaatccc ttgaagaaga tgttgcgcac cataccaagg gagactaccg 480
caagcttttg gtcccacttg ttagtgcatt ccgataccag ggagaggagg tgaacatgac 540
actggcaagg tcggaggcaa agatacttcg tgagaagata tcagacaagc agtacagtga 600
tgaggaggtc atcaggattg taacaacacg gagtaaggca cagttaaatg ctactctgaa 660
tcattacaat actgcatttg ggaatgctat caacaaggat ttgaaggccg accctgaaga 720
cgaattcctc aaattgctga gagctgcaat caagtgcttg actgtccctg agaaatattt 780
tgagaaggtg ctacgtcaag caatcaataa gctgggaaca gatgaatggg ctcttactag 840
agtggtcgcc actcgggcgg aggtagacat ggtgcgtatt aaggaggaat atcagcgaag 900
aaacagtgtg accctggaaa aagcgattgc tggagatacc tctggagact atgagaaaat 960
gctgcttgcg ttgattggag ctggagacgt ctgagctgct ttcctatatt gagttgttgg 1020
tatgaaaatt tagtttgcaa tttgaggtgt gagttatgtt tgtttggttg agggtgtgcc 1080
aatcgc 1086
<210> 109
<211> 316
<212> PRT
<213> Gossypium hirsutum
<400> 109
Met Ala Thr Leu Lys Val Pro Ala His Val Pro Ala Pro Ser Glu Asp
1 5 10 15
Ala Glu Gln Leu Arg Lys Ala Phe Glu Gly Trp Gly Thr Asn Glu Gln
20 25 30
Leu Ile Ile Asp Ile Leu Ala His Arg Asn Ala Ala Gln Arg Asn Leu
35 40 45
Ile Arg Lys Thr Tyr Arg Glu Ala Tyr Gly Glu Asp Leu Leu Lys Ser
50 55 60
Leu Asp Glu Glu Leu Ser Ser Asp Phe Glu Arg Ala Val Val Leu Phe
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Phe Leu Ala His Glu Ala Thr
85 90 95
Lys Arg Phe Thr Ser Ser His Trp Val Leu Met Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ser His Glu Leu Phe Asn Val Arg Lys Ala Tyr His Asp Leu
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala His His Thr Lys Gly Asp
130 135 140
Tyr Arg Lys Leu Leu Val Pro Leu Val Ser Ala Phe Arg Tyr Gln Gly
145 150 155 160
Glu Glu Val Asn Met Thr Leu Ala Arg Ser Glu Ala Lys Ile Leu Arg
165 170 175
Glu Lys Ile Ser Asp Lys Gln Tyr Ser Asp Glu Glu Val Ile Arg Ile
180 185 190
Val Thr Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn His Tyr
195 200 205
Asn Thr Ala Phe Gly Asn Ala Ile Asn Lys Asp Leu Lys Ala Asp Pro
210 215 220
Glu Asp Glu Phe Leu Lys Leu Leu Arg Ala Ala Ile Lys Cys Leu Thr
225 230 235 240
Val Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Gln Ala Ile Asn Lys
245 250 255
Leu Gly Thr Asp Glu Trp Ala Leu Thr Arg Val Val Ala Thr Arg Ala
260 265 270
Glu Val Asp Met Val Arg Ile Lys Glu Glu Tyr Gln Arg Arg Asn Ser
275 280 285
Val Thr Leu Glu Lys Ala Ile Ala Gly Asp Thr Ser Gly Asp Tyr Glu
290 295 300
Lys Met Leu Leu Ala Leu Ile Gly Ala Gly Asp Val
305 310 315
<210> 110
<211> 1196
<212> DNA
<213> Nicotiana tabacum
<400> 110
gcatttacga gttttgacaa tcatatcttc cacagacaga aaaaaaatgg ctagtcttac 60
tgttccggca gaagttcctt cagttgctga agactgtgaa caactccgat ctgccttcaa 120
aggatgggga acaaatgaga agttgatcat atcaattttg gctcatagaa atgctgctca 180
acgcaagttg attcaacaga cttatgctga gacttttggt gaagatctcc ttaaagagtt 240
ggacagagaa cttaccaatg attttgagaa attggtggta gtgtggacat tggatccttc 300
agaacgcgat gcctatttgg ctaaggaagc tactaagaga tggacaaaaa gcaattttgt 360
tcttgtggag attgcttgta ccagatctcc taaagaattg gttttggcaa gggaagctta 420
tcatgctcgt ttcaagaaat ctcttgaaga ggacgttgct tatcacacta ctggggaaca 480
cccccagctt ttggtacctc ttgtgagctc ctaccgatat ggaggggacg aggtggactt 540
gcgccttgct aaagcagaag ctaaaatact gcacgagaag atctccgata aggcttacag 600
tgacgatgag gtcatcagaa ttctagccac aaggagcaaa gcacagatca atgctactct 660
gaaccattac aaagatgaat atgaagaaga tatcctgaag caattggaag agggggatga 720
gtttgttgga ctattgaggg caaccataaa aggtcttgtc taccccgagc actacttcgt 780
ggaggttctt cgagatgcaa ttaacaggag aggaacagat gaagatcatc tgaccagagt 840
tatcgctaca agggctgagg ttgatatgaa gattatcgct gatgagtacc agaagaggga 900
tagcatccct ctgggtcggg ccatcgccaa agatacaaga ggagattatg agagtatgtt 960
gttggctctg cttggacaag aggaggacta agaaggtttt gcttctgttt cataatgacc 1020
agaataaaca tgctatcccc tatatttgag agttggcatc cgttgtatgc ttgatgatta 1080
agcgtggtct gtttaacgtg agcttttagt ccttttcttc ttgtgataaa ctttgaatgt 1140
acaactttat gctatctaag aatgtttttc taaaaaaaaa aaaaaaaaaa aaaaaa 1196
<210> 111
<211> 314
<212> PRT
<213> Nicotiana tabacum
<400> 111
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Gln Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Thr Asn Asp Phe Glu Lys Leu Val Val Val Trp
65 70 75 80
Thr Leu Asp Pro Ser Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ala Thr
85 90 95
Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His Ala Arg
115 120 125
Phe Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Glu
130 135 140
His Pro Gln Leu Leu Val Pro Leu Val Ser Ser Tyr Arg Tyr Gly Gly
145 150 155 160
Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Glu Val Ile Arg Ile
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asp Glu Tyr Glu Glu Asp Ile Leu Lys Gln Leu Glu Glu Gly Asp
210 215 220
Glu Phe Val Gly Leu Leu Arg Ala Thr Ile Lys Gly Leu Val Tyr Pro
225 230 235 240
Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg Arg Gly
245 250 255
Thr Asp Glu Asp His Leu Thr Arg Val Ile Ala Thr Arg Ala Glu Val
260 265 270
Asp Met Lys Ile Ile Ala Asp Glu Tyr Gln Lys Arg Asp Ser Ile Pro
275 280 285
Leu Gly Arg Ala Ile Ala Lys Asp Thr Arg Gly Asp Tyr Glu Ser Met
290 295 300
Leu Leu Ala Leu Leu Gly Gln Glu Glu Asp
305 310
<210> 112
<211> 945
<212> DNA
<213> Solanum tuberosum
<400> 112
atggcaagtc ttacagttcc ggcagaagtt ccttccgtag ctgaagactg tgaacaactc 60
cgatctgcct tcaaaggatg gggaacgaac gagaagttga ttatatcaat tttggctcat 120
agaaatgctg ctcagcgcaa attgattcga cagacttatg ctgaaacttt tggggaagat 180
ctacttaaag agttggacag agaacttacc catgattttg agaaattggt gctaatatgg 240
acactggatc cgtcagaacg tgatgcctat ttggctaagg aagctactaa gagatggaca 300
aaaagcaact ttgttcttgt ggagatagct tgtactagat ctcctaaaga actggttttg 360
gcaagggaag cttatcatgc tcgtaacaag aaatctcttg aagaggacgt tgcttatcac 420
actactgggg atcaccgcaa gcttttggta cctcttgtga gctcctaccg atatggagga 480
gacgaggtgg acttgcgcct tgctaaagca gaatctaaag tactgcatga gaagatctcc 540
gataaggctt acagtgacga tgaggtcatt agaattttag ccacaaggag caaagcgcaa 600
ctcaatgcta ctttgaatca ttacaaagat gaatatggtg aggatatcct aaagcaattg 660
gaagatgagg atgagtttgt tgcactattg agggccacca taaaaggtct tgtctaccct 720
gagcactatt tcgtggaggt tcttcgtgat gcaattaaca ggagaggaac agaggaagat 780
catctgagcc gagttatcgc tacaagggct gaggtggatc tgaagactat cgctaacgag 840
taccagaaga gggatagcat tcctctgggt cgcgccattg ccaaagatac aggaggagat 900
tatgagaata tgctggtggc tttacttgga caagaggagg aatga 945
<210> 113
<211> 314
<212> PRT
<213> Solanum tuberosum
<400> 113
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Arg Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Thr His Asp Phe Glu Lys Leu Val Leu Ile Trp
65 70 75 80
Thr Leu Asp Pro Ser Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ala Thr
85 90 95
Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His Ala Arg
115 120 125
Asn Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Asp
130 135 140
His Arg Lys Leu Leu Val Pro Leu Val Ser Ser Tyr Arg Tyr Gly Gly
145 150 155 160
Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ser Lys Val Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Glu Val Ile Arg Ile
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asp Glu Tyr Gly Glu Asp Ile Leu Lys Gln Leu Glu Asp Glu Asp
210 215 220
Glu Phe Val Ala Leu Leu Arg Ala Thr Ile Lys Gly Leu Val Tyr Pro
225 230 235 240
Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg Arg Gly
245 250 255
Thr Glu Glu Asp His Leu Ser Arg Val Ile Ala Thr Arg Ala Glu Val
260 265 270
Asp Leu Lys Thr Ile Ala Asn Glu Tyr Gln Lys Arg Asp Ser Ile Pro
275 280 285
Leu Gly Arg Ala Ile Ala Lys Asp Thr Gly Gly Asp Tyr Glu Asn Met
290 295 300
Leu Val Ala Leu Leu Gly Gln Glu Glu Glu
305 310
<210> 114
<211> 1160
<212> DNA
<213> Lycopersicon esculentum
<400> 114
atggcaagtc ttacagttcc ggcagaagtt ccttcagtcg ctgaagactg tgaacaactc 60
cgatctgcct tcaaaggatg gggaacgaat gagaagttga ttatatcaat tttggctcat 120
agaaatgcgg ctcaacgcaa attgattcga cagacttatg ctgagacttt tggggaagat 180
ctgcttaaag agttggacag agaacttact catgattttg agaaattggt ggtagtatgg 240
acactggatc ctgcagaacg tgatgcctat ttggctaagg aagctactaa gagatggaca 300
aaaagcaact ttgttcttgt ggagatagct tgtaccagat ctcctaaaga actggttttg 360
gcaagagaag cttatcatgc tcgtaacaag aaatctctcg aagaggacgt tgcttatcac 420
actactgggg atcaccgcaa gcttttggta cctcttgtga gctcctaccg atatggggga 480
gatgaggtgg acttgcgact tgctaaagca gaatctaaag tgctgcatga gaagatctcc 540
gataaggctt acagtgacga tgaggtcatt agaattttag ccacaaggag caaagcgcaa 600
ctcaatgcta ctttgaatca ttacaaagat gaatatggtg aggatatcct aaagcaatta 660
gaagatgagg atgagtttgt tgcactgtta agggccacca taaaaggtct tgtctacccc 720
gagcactatt tcgtggaggt tcttcgtgat gcaattaaca ggagaggaac agaggaagat 780
catctaaccc gagttatcgc tacaagggct gaggtcgatc tgaagactat cgctaacgag 840
taccagaaga gggatagcgt tcctctgggt cgcgccattg ccaaagatac aggaggagat 900
tatgagaata tgctggtggc tttacttgga caagaggagg aataagaagc ggattggctc 960
acttctgttt ataatgacca gataatatgc cattctccat atatttcaga gttggcatgt 1020
gtttgatgat tgagagtggt ctgttcacat gagctttagt ccttttcttc ttgtgagaaa 1080
ctttgaatat gaatctttgt gctgtctaaa aatgttctct aatgatttgc atccactaaa 1140
aaaaaaaaaa aaaaaaaaaa 1160
<210> 115
<211> 314
<212> PRT
<213> Lycopersicon esculentum
<400> 115
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Arg Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Thr His Asp Phe Glu Lys Leu Val Val Val Trp
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ala Thr
85 90 95
Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His Ala Arg
115 120 125
Asn Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Asp
130 135 140
His Arg Lys Leu Leu Val Pro Leu Val Ser Ser Tyr Arg Tyr Gly Gly
145 150 155 160
Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ser Lys Val Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Glu Val Ile Arg Ile
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asp Glu Tyr Gly Glu Asp Ile Leu Lys Gln Leu Glu Asp Glu Asp
210 215 220
Glu Phe Val Ala Leu Leu Arg Ala Thr Ile Lys Gly Leu Val Tyr Pro
225 230 235 240
Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg Arg Gly
245 250 255
Thr Glu Glu Asp His Leu Thr Arg Val Ile Ala Thr Arg Ala Glu Val
260 265 270
Asp Leu Lys Thr Ile Ala Asn Glu Tyr Gln Lys Arg Asp Ser Val Pro
275 280 285
Leu Gly Arg Ala Ile Ala Lys Asp Thr Gly Gly Asp Tyr Glu Asn Met
290 295 300
Leu Val Ala Leu Leu Gly Gln Glu Glu Glu
305 310
<210> 116
<211> 1242
<212> DNA
<213> Lycopersicon esculentum
<400> 116
atgtctagtc ttaaagttcc agcatcagtt ccagatcctt atgaagatgc tgagcaactc 60
aaaaaagctt ttaaaggatg gggcacaaat gaggaactta ttattcagat tctggctcat 120
aggaatgcca gacaacgcaa gttaatccga gattcttatg ctgctgctta tggagaggat 180
cttctcaagg acttggattc tgaactgaca agtgattttc agcgtgtggt gcttctctgg 240
actttgagtc ctgctgagcg cgacgcctac ttggttaatg aggctaccaa acgtctgact 300
gctagcaatt ggggtatcat ggaaattgct tgtaccaggt cttctgatga tctttttaag 360
gcgaggcagg cctaccatgc tccatacaag aaatcacttg aagaagatgt tgcttatcat 420
acagtggggg atttccgtaa gcttttggtt cctcttataa ctgcattcag atatgaagga 480
gatgaggtga acatgacatt agcaagaaag ggaagcaaat atctgcatga gaagatctct 540
gacaaggctt accatgacga ggagatcatc cgaatcattt ctactaggag taaagcacag 600
ctgagtgcta cgttcaacca ctaccatgat caccatggcc atgaaatcat caaggatctg 660
gaagctgatg atgacgatga gtacctgaaa ctactcagag cagcaataga atgcttgaaa 720
cccagagaac actttgagaa agttcttcga ttggctatca agaagctggg tacagacgaa 780
tgggatctta ctagagttgt tgccactcgg gctgaagttg acatggagcg tatcaaagaa 840
gagtaccata ggaggaacag tgttacattg gaccgtgcaa ttgctggaga cacttcagga 900
gactatgaaa aaatgcttct ggctctgatt gggcacggag atgcttgaat tacatgtgct 960
gaaaccttaa gataataaaa aactctactt attttctgaa ctttcatttg cttttatgat 1020
ctatggtgtg tactctcaga gtttggttct gtgtttatat gaactaaaaa cactcgggag 1080
ttgagttgtg ttttgttttc gccttcactt ttcatttcgg acttctactg gttttgcctg 1140
ctaaataagc atagcttcaa ctttggcttg aacggatctt gtttctttat aactcagaaa 1200
tagattatgt atcttggttc gtaaaaaaaa aaaaaaaaaa aa 1242
<210> 117
<211> 315
<212> PRT
<213> Lycopersicon esculentum
<400> 117
Met Ser Ser Leu Lys Val Pro Ala Ser Val Pro Asp Pro Tyr Glu Asp
1 5 10 15
Ala Glu Gln Leu Lys Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Glu
20 25 30
Leu Ile Ile Gln Ile Leu Ala His Arg Asn Ala Arg Gln Arg Lys Leu
35 40 45
Ile Arg Asp Ser Tyr Ala Ala Ala Tyr Gly Glu Asp Leu Leu Lys Asp
50 55 60
Leu Asp Ser Glu Leu Thr Ser Asp Phe Gln Arg Val Val Leu Leu Trp
65 70 75 80
Thr Leu Ser Pro Ala Glu Arg Asp Ala Tyr Leu Val Asn Glu Ala Thr
85 90 95
Lys Arg Leu Thr Ala Ser Asn Trp Gly Ile Met Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ser Asp Asp Leu Phe Lys Ala Arg Gln Ala Tyr His Ala Pro
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Val Gly Asp
130 135 140
Phe Arg Lys Leu Leu Val Pro Leu Ile Thr Ala Phe Arg Tyr Glu Gly
145 150 155 160
Asp Glu Val Asn Met Thr Leu Ala Arg Lys Gly Ser Lys Tyr Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr His Asp Glu Glu Ile Ile Arg Ile
180 185 190
Ile Ser Thr Arg Ser Lys Ala Gln Leu Ser Ala Thr Phe Asn His Tyr
195 200 205
His Asp His His Gly His Glu Ile Ile Lys Asp Leu Glu Ala Asp Asp
210 215 220
Asp Asp Glu Tyr Leu Lys Leu Leu Arg Ala Ala Ile Glu Cys Leu Lys
225 230 235 240
Pro Arg Glu His Phe Glu Lys Val Leu Arg Leu Ala Ile Lys Lys Leu
245 250 255
Gly Thr Asp Glu Trp Asp Leu Thr Arg Val Val Ala Thr Arg Ala Glu
260 265 270
Val Asp Met Glu Arg Ile Lys Glu Glu Tyr His Arg Arg Asn Ser Val
275 280 285
Thr Leu Asp Arg Ala Ile Ala Gly Asp Thr Ser Gly Asp Tyr Glu Lys
290 295 300
Met Leu Leu Ala Leu Ile Gly His Gly Asp Ala
305 310 315
<210> 118
<211> 1226
<212> DNA
<213> Arabidopsis thaliana
<400> 118
ttacttaagt aggacgacgt gcgtctgctt cgtctcatta caaagcagaa gaaacacaaa 60
cagaggcaga gatcttaaga gttaaagact aatcccaaca atggcgtctc tcaaagtccc 120
aagcaatgtt cctcttcccg aagatgacgc cgagcaactc cacaaggctt tttcaggatg 180
gggtaccaac gagaagctga tcatatcaat actagctcac aggaacgcag cacaacgcag 240
cttgatccgc agcgtttatg cagctaccta caatgaggat cttctcaaag cattagacaa 300
agagctttct agcgactttg agagagctgt gatgttgtgg actcttgatc caccagagag 360
agatgcttat ttggctaaag aatccaccaa gatgttcacc aagaacaatt gggttcttgt 420
tgaaatcgct tgcacaaggc ctgctcttga gcttatcaag gtcaagcaag cttaccaagc 480
tcgatacaag aaatcaatcg aggaagatgt cgcgcaacac acatctggtg accttcgtaa 540
gctcttgctt cctcttgtga gcactttcag gtatgaagga gatgatgtga acatgatgct 600
tgcaagatct gaagctaaga tacttcacga gaaggtctca gagaaatctt acagtgacga 660
tgacttcatc agaatcttga caacaagaag caaagcacag ctcggtgcaa cactcaacca 720
ctacaacaac gagtatggaa acgccattaa caagaacttg aaggaagagt cggacgacaa 780
tgactacatg aaactactaa gagctgtaat cacatgtttg acataccctg agaagcattt 840
tgagaaggtt cttcgtctat caatcaacaa aatgggaaca gacgaatggg gactaacccg 900
agtcgtgact acacgaactg aagttgacat ggaacgcatc aaagaggaat atcagcgaag 960
aaacagcatt cctttggacc gtgctatcgc caaagacact tctggtgact atgaggacat 1020
gcttgttgct cttctcggac atggcgatgc ttgaaactgt ttcaactttc gagttcctcc 1080
tttctcttac tgcatggttt gttttaaata aaagagttgt gaaactggtt ctgcaactat 1140
ttatcaatga tcgtttgagt ttgttaaatt tgaatcaaaa tctgtttttc tttcttttaa 1200
atacaatcta aagcacaaac taaagc 1226
<210> 119
<211> 317
<212> PRT
<213> Arabidopsis thaliana
<400> 119
Met Ala Ser Leu Lys Val Pro Ser Asn Val Pro Leu Pro Glu Asp Asp
1 5 10 15
Ala Glu Gln Leu His Lys Ala Phe Ser Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Ser Leu
35 40 45
Ile Arg Ser Val Tyr Ala Ala Thr Tyr Asn Glu Asp Leu Leu Lys Ala
50 55 60
Leu Asp Lys Glu Leu Ser Ser Asp Phe Glu Arg Ala Val Met Leu Trp
65 70 75 80
Thr Leu Asp Pro Pro Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ser Thr
85 90 95
Lys Met Phe Thr Lys Asn Asn Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Pro Ala Leu Glu Leu Ile Lys Val Lys Gln Ala Tyr Gln Ala Arg
115 120 125
Tyr Lys Lys Ser Ile Glu Glu Asp Val Ala Gln His Thr Ser Gly Asp
130 135 140
Leu Arg Lys Leu Leu Leu Pro Leu Val Ser Thr Phe Arg Tyr Glu Gly
145 150 155 160
Asp Asp Val Asn Met Met Leu Ala Arg Ser Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Val Ser Glu Lys Ser Tyr Ser Asp Asp Asp Phe Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Leu Gly Ala Thr Leu Asn His Tyr
195 200 205
Asn Asn Glu Tyr Gly Asn Ala Ile Asn Lys Asn Leu Lys Glu Glu Ser
210 215 220
Asp Asp Asn Asp Tyr Met Lys Leu Leu Arg Ala Val Ile Thr Cys Leu
225 230 235 240
Thr Tyr Pro Glu Lys His Phe Glu Lys Val Leu Arg Leu Ser Ile Asn
245 250 255
Lys Met Gly Thr Asp Glu Trp Gly Leu Thr Arg Val Val Thr Thr Arg
260 265 270
Thr Glu Val Asp Met Glu Arg Ile Lys Glu Glu Tyr Gln Arg Arg Asn
275 280 285
Ser Ile Pro Leu Asp Arg Ala Ile Ala Lys Asp Thr Ser Gly Asp Tyr
290 295 300
Glu Asp Met Leu Val Ala Leu Leu Gly His Gly Asp Ala
305 310 315
<210> 120
<211> 1172
<212> DNA
<213> Nicotiana tabacum
<400> 120
ctgcttgcat tttcgagtct tgacaatcat aaaaatggct agtcttactg ttccggcaga 60
agttccttca gtagctgaag actgtgaaca actccgatct gccttcaaag ggtggggaac 120
aaacgagaag ttgatcatat caattttggc tcatagaaat gctgctcaac gcaagttgat 180
tcaacagact tatgctgaga cttttggtga agatctcctt aaagagttgg acagagaact 240
taccaatgat tttgagaaat tggtggtagt gtggacattg gatccttcag aacgcgatgc 300
ctatttggct aaggaagcta ctaagagatg gacaaaaagc aattttgttc ttgtggaaat 360
agcttgtacc agatctccta aagaattggt tttggcacgg gaagcttatc atgctcgtta 420
caagaaatct cttgaagagg acgttgctta tcacactact ggggaacacc gcaagctttt 480
ggtagctctt gtgagctcct atcgatatgg aggagacgag gtggacttgc gtcttgctaa 540
agctgaagct aaaatactgc atgagaagat ctccgataag gcttacagtg acaatgaggt 600
catcagaatt ctagccacaa ggagtaaagc acagatcaat gctactctga atcattacaa 660
agatgaatat gaagaggata tcctaaagca attggaagag ggggatgagt ttgttggact 720
attgagggca accataaaag gtcttgtcta caccgagcac tacttcgtgg aggttcttcg 780
agatgcaatt aacaggagag gaacagagga agatcatctg accagagtta tcgctacaag 840
ggctgaggtt gatatgaaga ctatcgctga tgagtaccag aagagggata gcatccatct 900
gggtcgcgcc attgccaaag atacaagagg agattatgag agtatgttgt tggctctgct 960
tggacaagag gaggactaag aaggatttgc tttataatga ccggaataaa tatgatatcc 1020
cctatatttg agagttggca tccgctgtat gtttgatgat tgagcgtggt ctgtttaacg 1080
tgagcgttga gtccttttct tctcactttg aatatgcaac tttatgctat ctaagaatat 1140
ttttttataa aaaaaaaaaa aaaaaaaaaa aa 1172
<210> 121
<211> 314
<212> PRT
<213> Nicotiana tabacum
<400> 121
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Gln Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Thr Asn Asp Phe Glu Lys Leu Val Val Val Trp
65 70 75 80
Thr Leu Asp Pro Ser Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ala Thr
85 90 95
Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His Ala Arg
115 120 125
Tyr Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr Gly Glu
130 135 140
His Arg Lys Leu Leu Val Ala Leu Val Ser Ser Tyr Arg Tyr Gly Gly
145 150 155 160
Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asn Glu Val Ile Arg Ile
180 185 190
Leu Ala Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Leu Asn His Tyr
195 200 205
Lys Asp Glu Tyr Glu Glu Asp Ile Leu Lys Gln Leu Glu Glu Gly Asp
210 215 220
Glu Phe Val Gly Leu Leu Arg Ala Thr Ile Lys Gly Leu Val Tyr Thr
225 230 235 240
Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg Arg Gly
245 250 255
Thr Glu Glu Asp His Leu Thr Arg Val Ile Ala Thr Arg Ala Glu Val
260 265 270
Asp Met Lys Thr Ile Ala Asp Glu Tyr Gln Lys Arg Asp Ser Ile His
275 280 285
Leu Gly Arg Ala Ile Ala Lys Asp Thr Arg Gly Asp Tyr Glu Ser Met
290 295 300
Leu Leu Ala Leu Leu Gly Gln Glu Glu Asp
305 310
<210> 122
<211> 1215
<212> DNA
<213> Solanum tuberosum
<400> 122
atcactctgc attttcgagt cttcacaatc atatcctcct aaccacacac agaagaaaaa 60
aaaatggcaa gtcttacagt tccggcagaa gttccttccg tcgctgaaga ctgtgaacaa 120
ctccgatctg ccttcaaagg atggggaacg aacgagaagt tgattatatc aattttggct 180
catagaaatg ctgctcagcg caaattgatt cgacagactt atgctgaaac ttttggggaa 240
gatctactta aagagattgg gacaggaaga aacttaaccc atgattttga gaaattggtg 300
ctaatatgga cactggatcc gtcagaacgt gatgcctatt tggctaagga agctactaag 360
agatggacaa aaagcaactt tgttcttgtg gagatagctt gtactagatc tcctaaagaa 420
ctggttttgg caagggaagc ttatcatgct cgtaacaaga aatctctcga agaggacgtt 480
gcttatcaca ctactgggga tcaccgcaag cttttggtac ctcttgtgag ctcctaccga 540
tatggaggag acgaggtgga cttgcgcctt gctaaagcag aatctaaagt actgcatgag 600
aagatctccg ataaggctta cagtgacgat gaggtcatta gaattttagc cacaaggagc 660
aaagcgcaac tcaatgctac tttgaatcat tacaaagatg aatatggtga ggatatccta 720
aagcaattgg aagatgagga tgagtttgtt gcactattga gggccaccat aaaaggtctt 780
gtctaccctg agcactattt cgtggaggtt cttcgtgatg caattaacag gagaggaaca 840
gaggaagatc atctgagccg agttattgct acaagggctg aggtcgatct gaagactatc 900
gctaacgagt accagaagag ggatagcatt cctctgggtc gcgccattgc caaagataca 960
ggaggagatt atgagaatat gctggtggct ttacttggac aagaggagga atgaggagga 1020
ttggctcact tctgtgttat aatgaccaga ataaatatgc catctcccat atatttcaga 1080
gttggcatct gtttgatgat tgagtgtggt ctgttttcac atgagctttt agtccttttc 1140
ttcgtgtgag aaactttgaa tatgcatctt tgtgctgtct aaaaatattt tctaaaaaaa 1200
aaaaaaaaaa aaaaa 1215
<210> 123
<211> 316
<212> PRT
<213> Solanum tuberosum
<400> 123
Met Ala Ser Leu Thr Val Pro Ala Glu Val Pro Ser Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Ser Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asn Ala Ala Gln Arg Lys Leu
35 40 45
Ile Arg Gln Thr Tyr Ala Glu Thr Phe Gly Glu Asp Leu Leu Lys Glu
50 55 60
Ile Gly Thr Gly Arg Asn Leu Thr His Asp Phe Glu Lys Leu Val Leu
65 70 75 80
Ile Trp Thr Leu Asp Pro Ser Glu Arg Asp Ala Tyr Leu Ala Lys Glu
85 90 95
Ala Thr Lys Arg Trp Thr Lys Ser Asn Phe Val Leu Val Glu Ile Ala
100 105 110
Cys Thr Arg Ser Pro Lys Glu Leu Val Leu Ala Arg Glu Ala Tyr His
115 120 125
Ala Arg Asn Lys Lys Ser Leu Glu Glu Asp Val Ala Tyr His Thr Thr
130 135 140
Gly Asp His Arg Lys Leu Leu Val Pro Leu Val Ser Ser Tyr Arg Tyr
145 150 155 160
Gly Gly Asp Glu Val Asp Leu Arg Leu Ala Lys Ala Glu Ser Lys Val
165 170 175
Leu His Glu Lys Ile Ser Asp Lys Ala Tyr Ser Asp Asp Glu Val Ile
180 185 190
Arg Ile Leu Ala Thr Arg Ser Lys Ala Gln Leu Asn Ala Thr Leu Asn
195 200 205
His Tyr Lys Asp Glu Tyr Gly Glu Asp Ile Leu Lys Gln Leu Glu Asp
210 215 220
Glu Asp Glu Phe Val Ala Leu Leu Arg Ala Thr Ile Lys Gly Leu Val
225 230 235 240
Tyr Pro Glu His Tyr Phe Val Glu Val Leu Arg Asp Ala Ile Asn Arg
245 250 255
Arg Gly Thr Glu Glu Asp His Leu Ser Arg Val Ile Ala Thr Arg Ala
260 265 270
Glu Val Asp Leu Lys Thr Ile Ala Asn Glu Tyr Gln Lys Arg Asp Ser
275 280 285
Ile Pro Leu Gly Arg Ala Ile Ala Lys Asp Thr Gly Gly Asp Tyr Glu
290 295 300
Asn Met Leu Val Ala Leu Leu Gly Gln Glu Glu Glu
305 310 315
<210> 124
<211> 1176
<212> DNA
<213> Arabidopsis thaliana
<400> 124
catacagaaa tttcacttgt tcgaaaaatg gcttctctca aagttcccgc cactgttcct 60
cttcccgaag aagacgctga gcaactctac aaagccttta aaggatgggg aaccaatgag 120
aggatgatca tatcaatctt ggctcacaga aatgcaacgc aacgtagttt cattcgtgcc 180
gtttatgctg ctaactacaa taaggatctt ctcaaggaat tagacagaga gctttccggt 240
gactttgagc gagctgtgat gttgtggact tttgaaccag cggagagaga tgcttatttg 300
gcaaaagaat ctaccaaaat gttcaccaaa aacaattggg ttcttgtcga aatcgcttgt 360
actagatctg ctcttgaact ctttaatgcc aagcaagcat accaagcccg ctacaagacc 420
tccctcgagg aagacgtcgc ataccacaca tctggagaca ttcgaaagct cttggtacct 480
cttgtgagca cttttaggta cgatggagat gaagtgaaca tgacgttagc taggtccgag 540
gctaagatac ttcacgagaa gatcaaggaa aaggcttatg ctgatgatga tctcataaga 600
atcttgacaa ccaggagcaa agcacaaatc agcgcaactc tcaatcacta caaaaacaat 660
ttcggaactt ccatgagcaa atacctaaag gaggattcgg aaaacgaata cattcaattg 720
ctcaaagccg tgatcaaatg cttgacatat ccagagaagt attttgagaa agttctacgt 780
caagccatca acaaattggg aacagatgag tggggactaa cgagagtggt cactacacga 840
gcagagtttg acatggaacg gatcaaagag gaatatatac gtagaaacag tgttcctctt 900
gatcgagcca ttgctaaaga cactcatggt gactatgagg atatacttct cgctcttctc 960
ggacatgacc atgcttgaaa taacatttgc aagttttgtt taagaaaaaa aactaaattt 1020
tatcgctttg tgtttaataa aacagttgtg gttggacttg caacttggtc atgttaagaa 1080
tttagtgtct tcagtttcat ttgtcgtcga tgttttcagt tatttttttt tttaaatcta 1140
aaaattataa aaccatatca aaaattatta ttgatc 1176
<210> 125
<211> 316
<212> PRT
<213> Arabidopsis thaliana
<400> 125
Met Ala Ser Leu Lys Val Pro Ala Thr Val Pro Leu Pro Glu Glu Asp
1 5 10 15
Ala Glu Gln Leu Tyr Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Arg
20 25 30
Met Ile Ile Ser Ile Leu Ala His Arg Asn Ala Thr Gln Arg Ser Phe
35 40 45
Ile Arg Ala Val Tyr Ala Ala Asn Tyr Asn Lys Asp Leu Leu Lys Glu
50 55 60
Leu Asp Arg Glu Leu Ser Gly Asp Phe Glu Arg Ala Val Met Leu Trp
65 70 75 80
Thr Phe Glu Pro Ala Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ser Thr
85 90 95
Lys Met Phe Thr Lys Asn Asn Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ala Leu Glu Leu Phe Asn Ala Lys Gln Ala Tyr Gln Ala Arg
115 120 125
Tyr Lys Thr Ser Leu Glu Glu Asp Val Ala Tyr His Thr Ser Gly Asp
130 135 140
Ile Arg Lys Leu Leu Val Pro Leu Val Ser Thr Phe Arg Tyr Asp Gly
145 150 155 160
Asp Glu Val Asn Met Thr Leu Ala Arg Ser Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Ile Lys Glu Lys Ala Tyr Ala Asp Asp Asp Leu Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Ile Ser Ala Thr Leu Asn His Tyr
195 200 205
Lys Asn Asn Phe Gly Thr Ser Met Ser Lys Tyr Leu Lys Glu Asp Ser
210 215 220
Glu Asn Glu Tyr Ile Gln Leu Leu Lys Ala Val Ile Lys Cys Leu Thr
225 230 235 240
Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Gln Ala Ile Asn Lys
245 250 255
Leu Gly Thr Asp Glu Trp Gly Leu Thr Arg Val Val Thr Thr Arg Ala
260 265 270
Glu Phe Asp Met Glu Arg Ile Lys Glu Glu Tyr Ile Arg Arg Asn Ser
275 280 285
Val Pro Leu Asp Arg Ala Ile Ala Lys Asp Thr His Gly Asp Tyr Glu
290 295 300
Asp Ile Leu Leu Ala Leu Leu Gly His Asp His Ala
305 310 315
<210> 126
<211> 1182
<212> DNA
<213> Medicago sativa
<400> 126
ctctcacgtt ccgtctccat cagaagacag tgaacaattg cgcggtgctt ttcaaggatg 60
gggaacgaat gaaggcttga taatatcgat cctggctcat agaaatgcag ctcagcgtaa 120
gtcgatccgc gaaacttaca cgcagaccca tggagaagat cttcttaaag atcttgacaa 180
agaactttca agtgattttg agaaagctgt gctgctgtgg acattggatc cggccgagcg 240
tgatgcattt ttagccaatc aagcaactaa aatgttgact tcaaacaatt cgatcatcgt 300
ggaaattgct tccacaagat ctccacttga acttcttaag gcaaagcaag catatcaagt 360
ccgtttcaaa aagtcccttg aagaagatgt tgcctatcat acttctggtg acatccgcaa 420
gcttttggtt cctcttgtgg gcatacaccg ttatgaggga gatgaggtga acatgacatt 480
ggcaaaatct gaagctaaat tgcttcatga gaagattgcg gataaggctt acaatcatga 540
tgacctgatc aggattgtaa caacaaggag taaagcgcaa ttaaatgcaa ctttgaatca 600
ctataacaat gagtttggga atgtaataga caaggatttg gaaactgatt cggatgatga 660
atatctgaaa ttattgaggg cagcaattaa gggcttgacc taccctgaga aatattttga 720
ggaactcctt aggctggcta taaacaagat gggaaccgat gaaaatgctc ttactagagt 780
ggtgacaact agagctgagg ttgatttgca gcgaattgcg gaggaatacc agagaagaaa 840
cagtgttcct ctggaccgtg caattgacaa agacacttct ggagactatc agaaaattct 900
ccttgcactg atgggacatg atgagtaagt tcttaatctg tccagtagtc atggagtggc 960
tgtttggact atctgttttc ccttcatcat cagcgtgatt ttgctgcgga tctcttgata 1020
gtatacagaa ttcggtgact tgctgtggta actatgcttg tgatatgtat gaactattgt 1080
ggttttaaat aatatgtttt gaatatggac tgaaattcaa aacagaactt tgccttctta 1140
aataatgaaa cagctatcat atttctctcc ttaaaaaaaa aa 1182
<210> 127
<211> 308
<212> PRT
<213> Medicago sativa
<400> 127
Ser His Val Pro Ser Pro Ser Glu Asp Ser Glu Gln Leu Arg Gly Ala
1 5 10 15
Phe Gln Gly Trp Gly Thr Asn Glu Gly Leu Ile Ile Ser Ile Leu Ala
20 25 30
His Arg Asn Ala Ala Gln Arg Lys Ser Ile Arg Glu Thr Tyr Thr Gln
35 40 45
Thr His Gly Glu Asp Leu Leu Lys Asp Leu Asp Lys Glu Leu Ser Ser
50 55 60
Asp Phe Glu Lys Ala Val Leu Leu Trp Thr Leu Asp Pro Ala Glu Arg
65 70 75 80
Asp Ala Phe Leu Ala Asn Gln Ala Thr Lys Met Leu Thr Ser Asn Asn
85 90 95
Ser Ile Ile Val Glu Ile Ala Ser Thr Arg Ser Pro Leu Glu Leu Leu
100 105 110
Lys Ala Lys Gln Ala Tyr Gln Val Arg Phe Lys Lys Ser Leu Glu Glu
115 120 125
Asp Val Ala Tyr His Thr Ser Gly Asp Ile Arg Lys Leu Leu Val Pro
130 135 140
Leu Val Gly Ile His Arg Tyr Glu Gly Asp Glu Val Asn Met Thr Leu
145 150 155 160
Ala Lys Ser Glu Ala Lys Leu Leu His Glu Lys Ile Ala Asp Lys Ala
165 170 175
Tyr Asn His Asp Asp Leu Ile Arg Ile Val Thr Thr Arg Ser Lys Ala
180 185 190
Gln Leu Asn Ala Thr Leu Asn His Tyr Asn Asn Glu Phe Gly Asn Val
195 200 205
Ile Asp Lys Asp Leu Glu Thr Asp Ser Asp Asp Glu Tyr Leu Lys Leu
210 215 220
Leu Arg Ala Ala Ile Lys Gly Leu Thr Tyr Pro Glu Lys Tyr Phe Glu
225 230 235 240
Glu Leu Leu Arg Leu Ala Ile Asn Lys Met Gly Thr Asp Glu Asn Ala
245 250 255
Leu Thr Arg Val Val Thr Thr Arg Ala Glu Val Asp Leu Gln Arg Ile
260 265 270
Ala Glu Glu Tyr Gln Arg Arg Asn Ser Val Pro Leu Asp Arg Ala Ile
275 280 285
Asp Lys Asp Thr Ser Gly Asp Tyr Gln Lys Ile Leu Leu Ala Leu Met
290 295 300
Gly His Asp Glu
305
<210> 128
<211> 951
<212> DNA
<213> Brassica rapa
<400> 128
atggcgtctc tcaaagttcc tgctagtgtt cctcttccag aagaagatgc cgagcagctc 60
cagaaggcct ttaaaggatg gggaaccaac gagaggatga tcatatcaat cttggctcac 120
agaaatgccg agcaacgcag cttcatccgt gctgtttatg ctgctaacta caataaggat 180
cttctcaagg aattagacaa agagctatcc ggtgacttcg agcgagctgt gatgttgtgg 240
acacttgaac cagcggagag agatgcgtat ttggctaagg aatcaacaaa aatgttcact 300
aaagacaatt gggttctagt tgaaatcgct tgtactagat cttcccttga gtttttcaag 360
gccaagcaag cataccaagt tcgctacaag acatctattg aggaagatgt cgcctaccac 420
acatctggag atgtccgaaa gctcttggtt cctcttgtga gtacctttag gtacgatgga 480
gatgaagtaa acatgatgat tgctaagtct gaggctaaga tacttcacga gaagatggag 540
gcgaaggatt acaatgatgg agatctcatt agaatcctga caacaagaag caaagctcaa 600
atcagtgcaa cactcaacca cttcaaaaat aagttcggaa cttccattac aaaatacctt 660
aaagaggatt ccgacaacga atatgttcag ctacttaaag ccgtgatcaa atgcttgact 720
tatccagaga aatattttga gaaagttctt cgtcaagcca tcaacaaaat gggaactgac 780
gagtggggac ttactagagt ggtcaccaca cgagctgagc tcgacatgga acggatcaaa 840
gaggaatact tgcgcaggaa cagtgtccca cttgaccgag ccattgccaa agacactcat 900
ggtgactatg aggatattct tctagctctt atcggacatg gccatgcttg a 951
<210> 129
<211> 316
<212> PRT
<213> Brassica rapa
<400> 129
Met Ala Ser Leu Lys Val Pro Ala Ser Val Pro Leu Pro Glu Glu Asp
1 5 10 15
Ala Glu Gln Leu Gln Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Arg
20 25 30
Met Ile Ile Ser Ile Leu Ala His Arg Asn Ala Glu Gln Arg Ser Phe
35 40 45
Ile Arg Ala Val Tyr Ala Ala Asn Tyr Asn Lys Asp Leu Leu Lys Glu
50 55 60
Leu Asp Lys Glu Leu Ser Gly Asp Phe Glu Arg Ala Val Met Leu Trp
65 70 75 80
Thr Leu Glu Pro Ala Glu Arg Asp Ala Tyr Leu Ala Lys Glu Ser Thr
85 90 95
Lys Met Phe Thr Lys Asp Asn Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Ser Ser Leu Glu Phe Phe Lys Ala Lys Gln Ala Tyr Gln Val Arg
115 120 125
Tyr Lys Thr Ser Ile Glu Glu Asp Val Ala Tyr His Thr Ser Gly Asp
130 135 140
Val Arg Lys Leu Leu Val Pro Leu Val Ser Thr Phe Arg Tyr Asp Gly
145 150 155 160
Asp Glu Val Asn Met Met Ile Ala Lys Ser Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Met Glu Ala Lys Asp Tyr Asn Asp Gly Asp Leu Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Ile Ser Ala Thr Leu Asn His Phe
195 200 205
Lys Asn Lys Phe Gly Thr Ser Ile Thr Lys Tyr Leu Lys Glu Asp Ser
210 215 220
Asp Asn Glu Tyr Val Gln Leu Leu Lys Ala Val Ile Lys Cys Leu Thr
225 230 235 240
Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Gln Ala Ile Asn Lys
245 250 255
Met Gly Thr Asp Glu Trp Gly Leu Thr Arg Val Val Thr Thr Arg Ala
260 265 270
Glu Leu Asp Met Glu Arg Ile Lys Glu Glu Tyr Leu Arg Arg Asn Ser
275 280 285
Val Pro Leu Asp Arg Ala Ile Ala Lys Asp Thr His Gly Asp Tyr Glu
290 295 300
Asp Ile Leu Leu Ala Leu Ile Gly His Gly His Ala
305 310 315
<210> 130
<211> 1235
<212> DNA
<213> Arabidopsis thaliana
<400> 130
ccttgaggaa aaaaaactaa aacggctcta aattgaaaac aaaagaagag agagagagag 60
agagacgaag aaacagagag attctctcga aaatggccac cattagagta ccaaacgaag 120
ttccttctcc agctcaggat tctgaaactc tcaaacaagc tattcgcgga tggggaacag 180
atgagaaggc gattatacga gttttagggc aaagagacca gagccagaga aggaagatta 240
gagaaagttt tagagagatt tatggcaaag atcttatcga tgttctatcc tccgaactgt 300
ctggtgattt catgaaagct gtggtttcgt ggacgtatga tccagcagag agagacgcaa 360
ggcttgtgaa caagattttg aacaaggaga agaagaagaa aagcttagag aatttgaagg 420
ttatagtaga gatctcttgc acgacttccc caaaccattt gattgctgtg aggaaagctt 480
attgttcact ctttgactct tctcttgaag aacacattgc ttcttctctg ccttttcctc 540
ttgcaaagtt actggtgaca ttggcaagta cattcagata tgacaaagat aggactgatg 600
cagaagtagc tactattgag gcggctatgc tacgtgaagc catagagaag aaacaattag 660
atcatgacca tgtcctgtac atattaggaa cgcgtagtat ctatcagctc agagaaactt 720
ttgttgctta caagaagaat tatggggtca caattgataa ggatgttgat ggatgtccag 780
gagatgctga tctgagaagt ctattgaagg tggcaatctt ttgtattgat actcctgaga 840
aacactttgc aaaggtggta agagattcga ttgagggttt tggaacagat gaggattcgt 900
tgacgagggc gattgtgacg cgtgcagaga tcgatttgat gaaagtaaga ggagagtatt 960
tcaacatgta taatacaagc atggacaatg ctattactgg tgatatttct ggagactaca 1020
aggacttcat tatcacctta cttggatcca aaatctgatc gttctttcgt ttctttgtca 1080
gttgttatat tcttggcttt gcttgtgact tgtataatca atcaatacat tgtattccaa 1140
ctccagtttg aattgtttaa aaaataatca aatttctctt gattcttgca tttttgaatc 1200
aaagcaaatc tatgtttaat tttgttttca aaatt 1235
<210> 131
<211> 321
<212> PRT
<213> Arabidopsis thaliana
<400> 131
Met Ala Thr Ile Arg Val Pro Asn Glu Val Pro Ser Pro Ala Gln Asp
1 5 10 15
Ser Glu Thr Leu Lys Gln Ala Ile Arg Gly Trp Gly Thr Asp Glu Lys
20 25 30
Ala Ile Ile Arg Val Leu Gly Gln Arg Asp Gln Ser Gln Arg Arg Lys
35 40 45
Ile Arg Glu Ser Phe Arg Glu Ile Tyr Gly Lys Asp Leu Ile Asp Val
50 55 60
Leu Ser Ser Glu Leu Ser Gly Asp Phe Met Lys Ala Val Val Ser Trp
65 70 75 80
Thr Tyr Asp Pro Ala Glu Arg Asp Ala Arg Leu Val Asn Lys Ile Leu
85 90 95
Asn Lys Glu Lys Lys Lys Lys Ser Leu Glu Asn Leu Lys Val Ile Val
100 105 110
Glu Ile Ser Cys Thr Thr Ser Pro Asn His Leu Ile Ala Val Arg Lys
115 120 125
Ala Tyr Cys Ser Leu Phe Asp Ser Ser Leu Glu Glu His Ile Ala Ser
130 135 140
Ser Leu Pro Phe Pro Leu Ala Lys Leu Leu Val Thr Leu Ala Ser Thr
145 150 155 160
Phe Arg Tyr Asp Lys Asp Arg Thr Asp Ala Glu Val Ala Thr Ile Glu
165 170 175
Ala Ala Met Leu Arg Glu Ala Ile Glu Lys Lys Gln Leu Asp His Asp
180 185 190
His Val Leu Tyr Ile Leu Gly Thr Arg Ser Ile Tyr Gln Leu Arg Glu
195 200 205
Thr Phe Val Ala Tyr Lys Lys Asn Tyr Gly Val Thr Ile Asp Lys Asp
210 215 220
Val Asp Gly Cys Pro Gly Asp Ala Asp Leu Arg Ser Leu Leu Lys Val
225 230 235 240
Ala Ile Phe Cys Ile Asp Thr Pro Glu Lys His Phe Ala Lys Val Val
245 250 255
Arg Asp Ser Ile Glu Gly Phe Gly Thr Asp Glu Asp Ser Leu Thr Arg
260 265 270
Ala Ile Val Thr Arg Ala Glu Ile Asp Leu Met Lys Val Arg Gly Glu
275 280 285
Tyr Phe Asn Met Tyr Asn Thr Ser Met Asp Asn Ala Ile Thr Gly Asp
290 295 300
Ile Ser Gly Asp Tyr Lys Asp Phe Ile Ile Thr Leu Leu Gly Ser Lys
305 310 315 320
Ile
<210> 132
<211> 951
<212> DNA
<213> Arabidopsis thaliana
<400> 132
atggcaacaa tgaaaatacc aatgacggta ccttctcctc gagtcgatgc tgaccaactc 60
tttaaggcct tcaaaggaag aggctgcgat acttcggtga tcatcaacat cttagctcat 120
cgcaatgcaa cacaacgagc tctcatcgaa caagaatacg aaaccaaatt ctcggatgac 180
ctccgaaaac gtctccactc tgagcttcat ggtcatctca agaaagccgt tcttttgtgg 240
atgcctgaag cagtggagcg agacgcttca atactgaaac gctccttaag aggagccgtg 300
actgatcata aagcgattgc tgagattata tgcacacgat ctggctctca gcttcgtcag 360
atcaaacagg tctactcaaa cactttcggt gtgaaacttg aagaggacat cgaatccgaa 420
gcttctggca atcacaaaag agttttgctc gcgtatttga acactacgcg atatgaagga 480
ccagagatcg ataatgcgag tgtagagaac gatgctagga ctctcaagag cgcggttgca 540
aggaagcata aatctgatga ccagacgttg attcagatat tcactgaccg aagcaggact 600
catttggtcg ctgtaagatc tacttaccgt tccatgtacg gcaaagaact tggaaaggcc 660
ataagagatg agactcgcgg gaacttcgag catgtccttc taacaatttt acaatgtgct 720
gaaaactctt gtttctattt cgcaaaggca ttgaggaaat caatgaaagg attaggaaca 780
gatgacacgg cgttgataag aatcgtggtg acgagagcag aggtggatat gcagttcatc 840
atcacagaat accgtaagag atacaagaag actttgtaca atgctgttca ttctgataca 900
actagtcatt acaggacttt tctcctctct cttttaggcc ccaacgtttg a 951
<210> 133
<211> 316
<212> PRT
<213> Arabidopsis thaliana
<400> 133
Met Ala Thr Met Lys Ile Pro Met Thr Val Pro Ser Pro Arg Val Asp
1 5 10 15
Ala Asp Gln Leu Phe Lys Ala Phe Lys Gly Arg Gly Cys Asp Thr Ser
20 25 30
Val Ile Ile Asn Ile Leu Ala His Arg Asn Ala Thr Gln Arg Ala Leu
35 40 45
Ile Glu Gln Glu Tyr Glu Thr Lys Phe Ser Asp Asp Leu Arg Lys Arg
50 55 60
Leu His Ser Glu Leu His Gly His Leu Lys Lys Ala Val Leu Leu Trp
65 70 75 80
Met Pro Glu Ala Val Glu Arg Asp Ala Ser Ile Leu Lys Arg Ser Leu
85 90 95
Arg Gly Ala Val Thr Asp His Lys Ala Ile Ala Glu Ile Ile Cys Thr
100 105 110
Arg Ser Gly Ser Gln Leu Arg Gln Ile Lys Gln Val Tyr Ser Asn Thr
115 120 125
Phe Gly Val Lys Leu Glu Glu Asp Ile Glu Ser Glu Ala Ser Gly Asn
130 135 140
His Lys Arg Val Leu Leu Ala Tyr Leu Asn Thr Thr Arg Tyr Glu Gly
145 150 155 160
Pro Glu Ile Asp Asn Ala Ser Val Glu Asn Asp Ala Arg Thr Leu Lys
165 170 175
Ser Ala Val Ala Arg Lys His Lys Ser Asp Asp Gln Thr Leu Ile Gln
180 185 190
Ile Phe Thr Asp Arg Ser Arg Thr His Leu Val Ala Val Arg Ser Thr
195 200 205
Tyr Arg Ser Met Tyr Gly Lys Glu Leu Gly Lys Ala Ile Arg Asp Glu
210 215 220
Thr Arg Gly Asn Phe Glu His Val Leu Leu Thr Ile Leu Gln Cys Ala
225 230 235 240
Glu Asn Ser Cys Phe Tyr Phe Ala Lys Ala Leu Arg Lys Ser Met Lys
245 250 255
Gly Leu Gly Thr Asp Asp Thr Ala Leu Ile Arg Ile Val Val Thr Arg
260 265 270
Ala Glu Val Asp Met Gln Phe Ile Ile Thr Glu Tyr Arg Lys Arg Tyr
275 280 285
Lys Lys Thr Leu Tyr Asn Ala Val His Ser Asp Thr Thr Ser His Tyr
290 295 300
Arg Thr Phe Leu Leu Ser Leu Leu Gly Pro Asn Val
305 310 315
<210> 134
<211> 1337
<212> DNA
<213> Arabidopsis thaliana
<400> 134
acagaaacca aaccaagagc cggaaatcaa aaacagtaat aaaagatcaa ctgcaagaaa 60
atggctcttc ctctcgagct cgaaagcctc actgaagcca tctcagctgg gatgggaatg 120
ggagttgatg agaatgcatt gataagcaca ctggggaaat cgcaaaagga acatagaaaa 180
ttgtttagga aagcaagcaa aagtttcttt gttgaagatg aggaaagagc ttttgagaaa 240
tgtcatgatc acttcgtcag acacctcaag cttgagttct cccgcttcaa tactgcggtg 300
gtgatgtggg caatgcatcc atgggagaga gatgcaaggt tggtgaagaa agctttgaag 360
aaaggagaag aagcttacaa cctcatcgtt gaggtctcat gcacacgctc tgctgaggat 420
ctcctcggtg cacgtaaagc ttaccactct ctcttcgacc aatcaatgga agaagacatt 480
gcctctcacg tccacggtcc tcagcgcaag ttgcttgtgg ggctcgtgag tgcttataga 540
tacgaaggaa ataaggtgaa ggatgattct gccaaatccg atgctaagat tctagccgaa 600
gcagtggctt cttcaggcga agaagccgtg gagaaggatg aggttgttag gattttgacc 660
acaagaagca aacttcatct ccaacatctc tacaaacact ttaacgaaat caaaggctct 720
gatcttcttg ggggtgtatc taagtcttct cttctcaatg aagcattgat ttgtttgctc 780
aaaccggctc tgtatttcag caagattttg gatgcgtctc tgaacaaaga cgcagacaag 840
actaccaaga aatggttgac aagagtgttc gttacaagag cagatcatag tgatgagatg 900
aatgagatca aagaagagta caataacctt tatggtgaga ctttggctca aagaatccaa 960
gagaagataa aagggaacta cagagatttc ttgctcacac ttctctccaa atccgattga 1020
tttcgtgttg agaaacctat taccaatact tttggttatt gaagatttat gatttccctt 1080
tttatggttt tatgtttcta attcctaaat ttgcgttttc tctaccgttt ggtaataaag 1140
acatgaaaat ttgatgaact cggtgaatcg agagtaagag ttttgcgatt gtgacaatga 1200
gtgattaata caaggattaa gctccaataa aaaaatgttg cataaatcag aaatgaaact 1260
tgtaactctt cttttcttta tgtgaaactt gtaactctat ttgaaagatt ctatgtgacc 1320
actaaaccga attacgg 1337
<210> 135
<211> 319
<212> PRT
<213> Arabidopsis thaliana
<400> 135
Met Ala Leu Pro Leu Glu Leu Glu Ser Leu Thr Glu Ala Ile Ser Ala
1 5 10 15
Gly Met Gly Met Gly Val Asp Glu Asn Ala Leu Ile Ser Thr Leu Gly
20 25 30
Lys Ser Gln Lys Glu His Arg Lys Leu Phe Arg Lys Ala Ser Lys Ser
35 40 45
Phe Phe Val Glu Asp Glu Glu Arg Ala Phe Glu Lys Cys His Asp His
50 55 60
Phe Val Arg His Leu Lys Leu Glu Phe Ser Arg Phe Asn Thr Ala Val
65 70 75 80
Val Met Trp Ala Met His Pro Trp Glu Arg Asp Ala Arg Leu Val Lys
85 90 95
Lys Ala Leu Lys Lys Gly Glu Glu Ala Tyr Asn Leu Ile Val Glu Val
100 105 110
Ser Cys Thr Arg Ser Ala Glu Asp Leu Leu Gly Ala Arg Lys Ala Tyr
115 120 125
His Ser Leu Phe Asp Gln Ser Met Glu Glu Asp Ile Ala Ser His Val
130 135 140
His Gly Pro Gln Arg Lys Leu Leu Val Gly Leu Val Ser Ala Tyr Arg
145 150 155 160
Tyr Glu Gly Asn Lys Val Lys Asp Asp Ser Ala Lys Ser Asp Ala Lys
165 170 175
Ile Leu Ala Glu Ala Val Ala Ser Ser Gly Glu Glu Ala Val Glu Lys
180 185 190
Asp Glu Val Val Arg Ile Leu Thr Thr Arg Ser Lys Leu His Leu Gln
195 200 205
His Leu Tyr Lys His Phe Asn Glu Ile Lys Gly Ser Asp Leu Leu Gly
210 215 220
Gly Val Ser Lys Ser Ser Leu Leu Asn Glu Ala Leu Ile Cys Leu Leu
225 230 235 240
Lys Pro Ala Leu Tyr Phe Ser Lys Ile Leu Asp Ala Ser Leu Asn Lys
245 250 255
Asp Ala Asp Lys Thr Thr Lys Lys Trp Leu Thr Arg Val Phe Val Thr
260 265 270
Arg Ala Asp His Ser Asp Glu Met Asn Glu Ile Lys Glu Glu Tyr Asn
275 280 285
Asn Leu Tyr Gly Glu Thr Leu Ala Gln Arg Ile Gln Glu Lys Ile Lys
290 295 300
Gly Asn Tyr Arg Asp Phe Leu Leu Thr Leu Leu Ser Lys Ser Asp
305 310 315
<210> 136
<211> 1110
<212> DNA
<213> Arabidopsis thaliana
<400> 136
gtctcatcta gagagctaga gaaatattca gtggtcggag aatggcgtct ctcaaaattc 60
cagcaaatat tcctcttccc gaagaagact ccgagcagct ccacaaggca ttcaaaggat 120
ggggaactaa tgaagggatg atcatatcaa ttttggctca tagaaacgca acgcaacgca 180
gtttcattcg tgccgtttat gctgctaact acaataagga tcttctcaag gaattagacg 240
gagagctttc tggtgacttt gagagagttg tgatgttgtg gactcttgat ccaacggaga 300
gagatgcgta tttggccaat gaatctacca aattgttcac caaaaacatt tgggtcctag 360
ttgaaatcgc ttgtactaga ccttctcttg agtttttcaa gaccaagcaa gcataccatg 420
ttcgctacaa gacctctctc gaggaagatg ttgcatacca tacatctgga aatatccgaa 480
agctattggt tcctcttgtg agcaccttca ggtacgatgg aaatgctgat gaggtcaacg 540
tgaagctggc tagatccgaa gctaagacac ttcacaagaa gatcactgag aaggcttaca 600
ctgatgaaga tctcatcaga atcttgacaa caaggagcaa agcacagatc aatgcaacac 660
tcaatcactt caaggacaag tttggaagtt ccattaacaa gtttctcaaa gaagattcga 720
acgatgatta tgttcaatta ctcaaaaccg cgatcaaatg cttgacatat ccagagaagt 780
actttgagaa ggttctacgt cgagccatca acaggatggg aacagacgag tgggcactta 840
ctagagtggt cactacaaga gcagaggtcg acctggagcg gatcaaagaa gaatacttac 900
gcaggaacag tgttcctctt gatcgagcca ttgctaatga cacttctggt gactacaagg 960
atatgcttct cgcccttctt ggacatgacc atgcttgaaa caacatcatc gtttcatagt 1020
cttttataag acagttgtta tttgtttttc attttctttg aactttggtc cttagttttt 1080
acattttact gcaacaactt attctggttt 1110
<210> 137
<211> 318
<212> PRT
<213> Arabidopsis thaliana
<400> 137
Met Ala Ser Leu Lys Ile Pro Ala Asn Ile Pro Leu Pro Glu Glu Asp
1 5 10 15
Ser Glu Gln Leu His Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Gly
20 25 30
Met Ile Ile Ser Ile Leu Ala His Arg Asn Ala Thr Gln Arg Ser Phe
35 40 45
Ile Arg Ala Val Tyr Ala Ala Asn Tyr Asn Lys Asp Leu Leu Lys Glu
50 55 60
Leu Asp Gly Glu Leu Ser Gly Asp Phe Glu Arg Val Val Met Leu Trp
65 70 75 80
Thr Leu Asp Pro Thr Glu Arg Asp Ala Tyr Leu Ala Asn Glu Ser Thr
85 90 95
Lys Leu Phe Thr Lys Asn Ile Trp Val Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Pro Ser Leu Glu Phe Phe Lys Thr Lys Gln Ala Tyr His Val Arg
115 120 125
Tyr Lys Thr Ser Leu Glu Glu Asp Val Ala Tyr His Thr Ser Gly Asn
130 135 140
Ile Arg Lys Leu Leu Val Pro Leu Val Ser Thr Phe Arg Tyr Asp Gly
145 150 155 160
Asn Ala Asp Glu Val Asn Val Lys Leu Ala Arg Ser Glu Ala Lys Thr
165 170 175
Leu His Lys Lys Ile Thr Glu Lys Ala Tyr Thr Asp Glu Asp Leu Ile
180 185 190
Arg Ile Leu Thr Thr Arg Ser Lys Ala Gln Ile Asn Ala Thr Leu Asn
195 200 205
His Phe Lys Asp Lys Phe Gly Ser Ser Ile Asn Lys Phe Leu Lys Glu
210 215 220
Asp Ser Asn Asp Asp Tyr Val Gln Leu Leu Lys Thr Ala Ile Lys Cys
225 230 235 240
Leu Thr Tyr Pro Glu Lys Tyr Phe Glu Lys Val Leu Arg Arg Ala Ile
245 250 255
Asn Arg Met Gly Thr Asp Glu Trp Ala Leu Thr Arg Val Val Thr Thr
260 265 270
Arg Ala Glu Val Asp Leu Glu Arg Ile Lys Glu Glu Tyr Leu Arg Arg
275 280 285
Asn Ser Val Pro Leu Asp Arg Ala Ile Ala Asn Asp Thr Ser Gly Asp
290 295 300
Tyr Lys Asp Met Leu Leu Ala Leu Leu Gly His Asp His Ala
305 310 315
<210> 138
<211> 951
<212> DNA
<213> Arabidopsis thaliana
<400> 138
atggccacca ttgtttctcc tccacatttc tcccctgtcg aagacgctga aaacatcaag 60
gcggcttgtc aaggatgggg aaccaatgaa aatgccatca tctcgatctt aggacaccgg 120
aatttgttcc agaggaagct cataagacaa gcttaccagg agatttacca tgaggatctc 180
attcaccagc tcaaatctga gctctctggc aattttgaga gagctatttg cttgtgggtc 240
ttggatcctc cagagagaga tgctctcttg gctaacttgg ctcttcaaaa gcctattcct 300
gactacaagg ttcttgtcga aattgcctgc atgagatccc ctgaagatat gttagctgct 360
agacgtgctt accgttgcct ctacaagcat tctcttgagg aagacttggc ctcccgtact 420
attggcgaca tcaggagact cttggttgca atggtgtctg cttataaata tgatggagaa 480
gaaattgatg agatgctggc gcaatcagag gctgcgattc ttcatgatga aatccttggt 540
aaggctgttg atcacgaaga aacgatcagg gtgttaagta caaggagcag catgcagctt 600
agcgcaatct tcaaccgcta caaggatata tatggcacat cgatcactaa ggatctcctc 660
aatcacccta caaatgagta cctgagtgca ctacgtgcag ccatcaggtg catcaaaaac 720
cctacccggt attatgcaaa ggttttgcgc aattcaatca acacggtggg gactgatgaa 780
gatgctctga accgtgtgat tgtcacacga gcagaaaagg acctgacgaa tataactggg 840
ctgtacttta agaggaacaa tgtgagtctc gatcaagcta tagcaaaaga gacatcaggg 900
gactacaagg cctttcttct agctttgcta ggacatggaa aacaacttta g 951
<210> 139
<211> 316
<212> PRT
<213> Arabidopsis thaliana
<400> 139
Met Ala Thr Ile Val Ser Pro Pro His Phe Ser Pro Val Glu Asp Ala
1 5 10 15
Glu Asn Ile Lys Ala Ala Cys Gln Gly Trp Gly Thr Asn Glu Asn Ala
20 25 30
Ile Ile Ser Ile Leu Gly His Arg Asn Leu Phe Gln Arg Lys Leu Ile
35 40 45
Arg Gln Ala Tyr Gln Glu Ile Tyr His Glu Asp Leu Ile His Gln Leu
50 55 60
Lys Ser Glu Leu Ser Gly Asn Phe Glu Arg Ala Ile Cys Leu Trp Val
65 70 75 80
Leu Asp Pro Pro Glu Arg Asp Ala Leu Leu Ala Asn Leu Ala Leu Gln
85 90 95
Lys Pro Ile Pro Asp Tyr Lys Val Leu Val Glu Ile Ala Cys Met Arg
100 105 110
Ser Pro Glu Asp Met Leu Ala Ala Arg Arg Ala Tyr Arg Cys Leu Tyr
115 120 125
Lys His Ser Leu Glu Glu Asp Leu Ala Ser Arg Thr Ile Gly Asp Ile
130 135 140
Arg Arg Leu Leu Val Ala Met Val Ser Ala Tyr Lys Tyr Asp Gly Glu
145 150 155 160
Glu Ile Asp Glu Met Leu Ala Gln Ser Glu Ala Ala Ile Leu His Asp
165 170 175
Glu Ile Leu Gly Lys Ala Val Asp His Glu Glu Thr Ile Arg Val Leu
180 185 190
Ser Thr Arg Ser Ser Met Gln Leu Ser Ala Ile Phe Asn Arg Tyr Lys
195 200 205
Asp Ile Tyr Gly Thr Ser Ile Thr Lys Asp Leu Leu Asn His Pro Thr
210 215 220
Asn Glu Tyr Leu Ser Ala Leu Arg Ala Ala Ile Arg Cys Ile Lys Asn
225 230 235 240
Pro Thr Arg Tyr Tyr Ala Lys Val Leu Arg Asn Ser Ile Asn Thr Val
245 250 255
Gly Thr Asp Glu Asp Ala Leu Asn Arg Val Ile Val Thr Arg Ala Glu
260 265 270
Lys Asp Leu Thr Asn Ile Thr Gly Leu Tyr Phe Lys Arg Asn Asn Val
275 280 285
Ser Leu Asp Gln Ala Ile Ala Lys Glu Thr Ser Gly Asp Tyr Lys Ala
290 295 300
Phe Leu Leu Ala Leu Leu Gly His Gly Lys Gln Leu
305 310 315
<210> 140
<211> 1298
<212> DNA
<213> Oryza sativa
<400> 140
gttgcagatt actaccacca cctccccaaa atcccaatcg aatcgaaatc gaatcgagtc 60
gagtcgccgc cggagccgga gacggaggcg gcagcggcgc agcggtaatg gcgagcctca 120
ccctgccgcc ggcgcccacc aaccctcgcc aggacgccat cgacctccac aaggccttca 180
aagggtttgg ctgtgatagt acaacagtta taaatatact tactcatcgt gactcgatgc 240
aacgcgcgct cattcaacag gaatacagga ctatgtattc tgaggatctc tctcgccgta 300
tatcatctga actcagtgga caccacaaga aagcaatgct gctatggatt cttgatcctg 360
ctggacgaga tgcaactgtt ttgagagaag ctctgagtgg tgatactatt gacctgagag 420
cagccactga gataatatgt tccaggacac catcgcagct gcaaataatg aaacagactt 480
atcatgcaaa atttggtact tatcttgagc acgacattgg tcagcgcaca tcaggcgacc 540
atcagaagct cttgcttgct tatgtgggga ttccacgcta tgaaggtcct gaggttgatc 600
ctactatagt gacacacgat gcaaaggacc tctataaagc tggtgagaaa aggctgggca 660
ctgatgagaa gaccttcatc cgcattttca ctgaacgcag ctgggcacac atggcatctg 720
ttgcctctgc ttaccatcat atgtatgatc ggtcactgga gaaggttgtg aagagcgaaa 780
catctggaaa ctttgaactt gctctgctaa ctatcctcag atgcgctgag aatccagcca 840
agtattttgc aaaggtcttg cggaagtcca tgaaaggtat gggcactgat gatagtacac 900
ttataagggt tgtagtaaca aggactgaga tcgacatgca atatatcaag gctgagtact 960
acaagaaata caaaaaatca ttagctgaag ctatccattc cgagacctca ggaaattatc 1020
gaacattcct cctttctcta gttggtagcc attaggctac atttcgtcga ccctgtggca 1080
cttgacgttc catgactatc ctaaatgcag tggttctacc tggaaactgt aaaatttcgc 1140
catcattgtg ctctctattc gtgtgtgctt gcttaaaaat gtgtgtatat atataacctg 1200
ggcattaaat agttggtgct taatatggtt tggtggttcc atctgacaag tcactcgtta 1260
ctcggtgcat ttattcgaat aagtgatggt atttggtc 1298
<210> 141
<211> 315
<212> PRT
<213> Oryza sativa
<400> 141
Met Ala Ser Leu Thr Leu Pro Pro Ala Pro Thr Asn Pro Arg Gln Asp
1 5 10 15
Ala Ile Asp Leu His Lys Ala Phe Lys Gly Phe Gly Cys Asp Ser Thr
20 25 30
Thr Val Ile Asn Ile Leu Thr His Arg Asp Ser Met Gln Arg Ala Leu
35 40 45
Ile Gln Gln Glu Tyr Arg Thr Met Tyr Ser Glu Asp Leu Ser Arg Arg
50 55 60
Ile Ser Ser Glu Leu Ser Gly His His Lys Lys Ala Met Leu Leu Trp
65 70 75 80
Ile Leu Asp Pro Ala Gly Arg Asp Ala Thr Val Leu Arg Glu Ala Leu
85 90 95
Ser Gly Asp Thr Ile Asp Leu Arg Ala Ala Thr Glu Ile Ile Cys Ser
100 105 110
Arg Thr Pro Ser Gln Leu Gln Ile Met Lys Gln Thr Tyr His Ala Lys
115 120 125
Phe Gly Thr Tyr Leu Glu His Asp Ile Gly Gln Arg Thr Ser Gly Asp
130 135 140
His Gln Lys Leu Leu Leu Ala Tyr Val Gly Ile Pro Arg Tyr Glu Gly
145 150 155 160
Pro Glu Val Asp Pro Thr Ile Val Thr His Asp Ala Lys Asp Leu Tyr
165 170 175
Lys Ala Gly Glu Lys Arg Leu Gly Thr Asp Glu Lys Thr Phe Ile Arg
180 185 190
Ile Phe Thr Glu Arg Ser Trp Ala His Met Ala Ser Val Ala Ser Ala
195 200 205
Tyr His His Met Tyr Asp Arg Ser Leu Glu Lys Val Val Lys Ser Glu
210 215 220
Thr Ser Gly Asn Phe Glu Leu Ala Leu Leu Thr Ile Leu Arg Cys Ala
225 230 235 240
Glu Asn Pro Ala Lys Tyr Phe Ala Lys Val Leu Arg Lys Ser Met Lys
245 250 255
Gly Met Gly Thr Asp Asp Ser Thr Leu Ile Arg Val Val Val Thr Arg
260 265 270
Thr Glu Ile Asp Met Gln Tyr Ile Lys Ala Glu Tyr Tyr Lys Lys Tyr
275 280 285
Lys Lys Ser Leu Ala Glu Ala Ile His Ser Glu Thr Ser Gly Asn Tyr
290 295 300
Arg Thr Phe Leu Leu Ser Leu Val Gly Ser His
305 310 315
<210> 142
<211> 1222
<212> DNA
<213> Oryza sativa
<400> 142
ctccccgccg cataaatccc cttcgcctcc ccgccgcgcc ccgcggcgtc gcacgatctc 60
actgaggcat aaagtgagag accgtgattg gatcgatcac cggagcgacg atcaatggcg 120
acgctcaccg tgcccgccgc cgtgccgccc gtcgccgagg actgcgagca gctgcgcaag 180
gcgttcaaag ggtggggcac gaacgagaag ctcatcatct ccatcctcgc ccaccgcgac 240
gcggcgcagc gccgggcgat ccgccgcgcc tacgccgagg cgtacggcga ggagctgctc 300
cgcgccctca acgacgagat ccacggcaaa ttcgagaggg cggtgatcca gtggacgctg 360
gacccggcgg agcgggacgc ggtgctggcg aacgaggagg cgaggaagtg gcacccgggg 420
ggccgcgcgc tcgtcgagat cgcgtgcacg cgcactccat cgcagctctt cgctgcgaag 480
caggcgtacc acgagcgctt caagaggtcg ctcgaggagg acgtcgcggc gcacatcacc 540
ggcgactacc gtaagctttt ggtgccactt gtgactgtat atcgctatga tgggccagag 600
gtgaacacat cgttggcaca ttctgaagcc aaaatactcc atgagaagat ccatgacaag 660
gcttacagtg acgatgaaat catcaggatt ctcaccacaa ggagcaaagc acagttacta 720
gcaacattca atagttacaa tgatcagttc ggccatccaa tcactaagga tcttaaagct 780
gatcctaagg acgagttcct tggtacacta agggcgatca taagatgctt cacttgccct 840
gacagatact ttgagaaagt cattcgattg gctctaggag gaatgggcac agacgagaac 900
tctcttacaa ggatcataac aactcgtgcc gaggtagacc tgaagctgat aaaggaggcc 960
taccagaaga gaaacagtgt cccattggag cgagctgttg ctaaagatac aaccagagac 1020
tacgaggata tactccttgc cctccttgga gcagagtgag gtgtatatct gctccatctc 1080
gtctgtctga tcctccttgt ttgatcggaa aataagatct gcatagaact gtgttctatt 1140
ttgttgtttc tgaatgatac aagtgagcta gtctgcatag cagtgctcat ataataaaat 1200
ctgtcctgca tactggtttg tc 1222
<210> 143
<211> 314
<212> PRT
<213> Oryza sativa
<400> 143
Met Ala Thr Leu Thr Val Pro Ala Ala Val Pro Pro Val Ala Glu Asp
1 5 10 15
Cys Glu Gln Leu Arg Lys Ala Phe Lys Gly Trp Gly Thr Asn Glu Lys
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asp Ala Ala Gln Arg Arg Ala
35 40 45
Ile Arg Arg Ala Tyr Ala Glu Ala Tyr Gly Glu Glu Leu Leu Arg Ala
50 55 60
Leu Asn Asp Glu Ile His Gly Lys Phe Glu Arg Ala Val Ile Gln Trp
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Val Leu Ala Asn Glu Glu Ala
85 90 95
Arg Lys Trp His Pro Gly Gly Arg Ala Leu Val Glu Ile Ala Cys Thr
100 105 110
Arg Thr Pro Ser Gln Leu Phe Ala Ala Lys Gln Ala Tyr His Glu Arg
115 120 125
Phe Lys Arg Ser Leu Glu Glu Asp Val Ala Ala His Ile Thr Gly Asp
130 135 140
Tyr Arg Lys Leu Leu Val Pro Leu Val Thr Val Tyr Arg Tyr Asp Gly
145 150 155 160
Pro Glu Val Asn Thr Ser Leu Ala His Ser Glu Ala Lys Ile Leu His
165 170 175
Glu Lys Ile His Asp Lys Ala Tyr Ser Asp Asp Glu Ile Ile Arg Ile
180 185 190
Leu Thr Thr Arg Ser Lys Ala Gln Leu Leu Ala Thr Phe Asn Ser Tyr
195 200 205
Asn Asp Gln Phe Gly His Pro Ile Thr Lys Asp Leu Lys Ala Asp Pro
210 215 220
Lys Asp Glu Phe Leu Gly Thr Leu Arg Ala Ile Ile Arg Cys Phe Thr
225 230 235 240
Cys Pro Asp Arg Tyr Phe Glu Lys Val Ile Arg Leu Ala Leu Gly Gly
245 250 255
Met Gly Thr Asp Glu Asn Ser Leu Thr Arg Ile Ile Thr Thr Arg Ala
260 265 270
Glu Val Asp Leu Lys Leu Ile Lys Glu Ala Tyr Gln Lys Arg Asn Ser
275 280 285
Val Pro Leu Glu Arg Ala Val Ala Lys Asp Thr Thr Arg Asp Tyr Glu
290 295 300
Asp Ile Leu Leu Ala Leu Leu Gly Ala Glu
305 310
<210> 144
<211> 1152
<212> DNA
<213> Oryza sativa
<400> 144
agcacagcac agcacacatc tcgtccagtc catccatggc gagcctgagc gtgccgccgg 60
tgccgacgga cccgcggcgc gacgcgatcg acctccacag ggcgttcaag gggttcggct 120
gcgacgccac ggcggtgacc gccatcctcg cccaccgcga cgcctcccag cgcgccctaa 180
tccggcgcca ctacgcggcg gtctaccacc aggacctcct ccaccgcctc gccgccgagc 240
tctcgggcca ccacaagcgc gccgtcctgc tctgggtgct cgacccggcg tcccgcgacg 300
ccgccgtcct ccaccaggcg ctcaacggcg acgtcaccga catgagggcg gccaccgagg 360
tggtgtgctc caggacgccg tcgcagctgc tcgtggtgag gcaggcctac ctcgccaggt 420
tcggcggcgg cggcggcggc ggcctcgagc acgacgtcgc cgtcagggcg tccggcgacc 480
accagaggct gcttctggcg tacctgcgct cgccgcggta cgaggggccc gaggtggtcg 540
acatggcggc ggcggcgcgc gacgccaggg agctgtacag ggccggcgag aggcggctcg 600
gcaccgacga gaggacgttc atccgcgtct tctccgagcg cagcgccgcc cacatggcgg 660
ccgtcgccgc cgcgtaccac cacatgtacg accgctccct cgagaaggct gtgaagagtg 720
aaacttcagg gaactttggg tttggcctgc tgacaatcct caggtgcgcc gagagcccgg 780
ccaagtactt cgccaaggtg ctccacgagg cgatgaaggg gctgggcacc aacgacacga 840
cgctgatcag ggtggtgacg acgagggcgg aggtggacat gcagtacatc aaggcggagt 900
accaccggag ctacaagcgc tcgctcgccg acgccgtcca ctccgagacc tccggcaact 960
accgcacctt cctcctctcc ctcatcggcc gcgaccgcta acgtcgattg gtttcggtct 1020
ctttgagcgt gtgttaaggg acgcatttgt tccatagcgc acaaacatgg caattattta 1080
tgtgcgtgtg tagtggtgtg ttcgaacgtt cgtttttcgt gtaataaaaa aaattgagtt 1140
tgctgtcttg tg 1152
<210> 145
<211> 321
<212> PRT
<213> Oryza sativa
<400> 145
Met Ala Ser Leu Ser Val Pro Pro Val Pro Thr Asp Pro Arg Arg Asp
1 5 10 15
Ala Ile Asp Leu His Arg Ala Phe Lys Gly Phe Gly Cys Asp Ala Thr
20 25 30
Ala Val Thr Ala Ile Leu Ala His Arg Asp Ala Ser Gln Arg Ala Leu
35 40 45
Ile Arg Arg His Tyr Ala Ala Val Tyr His Gln Asp Leu Leu His Arg
50 55 60
Leu Ala Ala Glu Leu Ser Gly His His Lys Arg Ala Val Leu Leu Trp
65 70 75 80
Val Leu Asp Pro Ala Ser Arg Asp Ala Ala Val Leu His Gln Ala Leu
85 90 95
Asn Gly Asp Val Thr Asp Met Arg Ala Ala Thr Glu Val Val Cys Ser
100 105 110
Arg Thr Pro Ser Gln Leu Leu Val Val Arg Gln Ala Tyr Leu Ala Arg
115 120 125
Phe Gly Gly Gly Gly Gly Gly Gly Leu Glu His Asp Val Ala Val Arg
130 135 140
Ala Ser Gly Asp His Gln Arg Leu Leu Leu Ala Tyr Leu Arg Ser Pro
145 150 155 160
Arg Tyr Glu Gly Pro Glu Val Val Asp Met Ala Ala Ala Ala Arg Asp
165 170 175
Ala Arg Glu Leu Tyr Arg Ala Gly Glu Arg Arg Leu Gly Thr Asp Glu
180 185 190
Arg Thr Phe Ile Arg Val Phe Ser Glu Arg Ser Ala Ala His Met Ala
195 200 205
Ala Val Ala Ala Ala Tyr His His Met Tyr Asp Arg Ser Leu Glu Lys
210 215 220
Ala Val Lys Ser Glu Thr Ser Gly Asn Phe Gly Phe Gly Leu Leu Thr
225 230 235 240
Ile Leu Arg Cys Ala Glu Ser Pro Ala Lys Tyr Phe Ala Lys Val Leu
245 250 255
His Glu Ala Met Lys Gly Leu Gly Thr Asn Asp Thr Thr Leu Ile Arg
260 265 270
Val Val Thr Thr Arg Ala Glu Val Asp Met Gln Tyr Ile Lys Ala Glu
275 280 285
Tyr His Arg Ser Tyr Lys Arg Ser Leu Ala Asp Ala Val His Ser Glu
290 295 300
Thr Ser Gly Asn Tyr Arg Thr Phe Leu Leu Ser Leu Ile Gly Arg Asp
305 310 315 320
Arg
<210> 146
<211> 1272
<212> DNA
<213> Oryza sativa
<400> 146
cgggtctcct ctcctccccc gccgacgcgc actcgatccc ccccgcctcc gcctccgcct 60
ccgcctccgc gtcgcccatc tcgagatccc ccgcatggcg acgctcaccg tcccctccgc 120
cgtcccgccc gtcgccgacg actgcgacca gctccgcaag gccttccaag ggtggggcac 180
gaacgaggcg ctcatcatct ccatcctggc ccaccgcgac gcggcgcagc ggcgcgccat 240
ccgccgcgcc tacgccgaca cctacggcga ggagctcctc cgcagcatca ccgacgagat 300
ctccggcgac ttcgagaggg ccgtgatcct gtggacgctg gacccggcgg agcgcgacgc 360
ggtgctcgcc aacgaggtcg cgaggaagtg gtacccaggg agcgggagcc gcgtgctggt 420
cgagatcgcg tgcgcgcgcg gccccgcgca gctgttcgcg gtcaggcagg cctaccacga 480
gcgcttcaag cgctcgctcg aggaggacgt cgcggcgcac gccactggtg acttccgcaa 540
gctcttggtg ccacttataa gtgcttaccg ctatgagggg ccggaagtca acacaaagtt 600
ggcacattca gaagccaaaa ttctgcatga gaagatccag cataaggcat atggtgatga 660
tgagatcatc agaattctca ctactaggag caaggctcag ttgattgcga cattcaatcg 720
ttacaatgat gaatatggtc acccaatcaa caaggatctc aaggctgatc ccaaggacga 780
gttcctttcc acgctgcgtg caatcatccg ctgcttctgt tgccctgaca ggtacttcga 840
gaaagtcatc aggttggcca tcgcaggcat gggaacagac gagaactccc tcactaggat 900
cattaccact cgtgccgagg tggatctgaa gctgatcacg gaggcgtacc agaagaggaa 960
cagtgtcccg ctggagcgtg cggtcgcagg ggacacctcc ggggactacg agaggatgct 1020
tcttgctctt ctgggtcagg agcagtgagc catgcctatc ttgcccagtc acacacttca 1080
tgtgatcatg tcatatcaga gaataaacct gttatgcagg ggacacagcc gtggtgatta 1140
tgatgttgtt tttccagtgt acggtactgt ttgctgcagc ttgcataaca gtgacgatga 1200
aataaatcat agtggaatgc gttggctcat gggacctcac ttattttgca actttttgac 1260
aggtcttatt tc 1272
<210> 147
<211> 317
<212> PRT
<213> Oryza sativa
<400> 147
Met Ala Thr Leu Thr Val Pro Ser Ala Val Pro Pro Val Ala Asp Asp
1 5 10 15
Cys Asp Gln Leu Arg Lys Ala Phe Gln Gly Trp Gly Thr Asn Glu Ala
20 25 30
Leu Ile Ile Ser Ile Leu Ala His Arg Asp Ala Ala Gln Arg Arg Ala
35 40 45
Ile Arg Arg Ala Tyr Ala Asp Thr Tyr Gly Glu Glu Leu Leu Arg Ser
50 55 60
Ile Thr Asp Glu Ile Ser Gly Asp Phe Glu Arg Ala Val Ile Leu Trp
65 70 75 80
Thr Leu Asp Pro Ala Glu Arg Asp Ala Val Leu Ala Asn Glu Val Ala
85 90 95
Arg Lys Trp Tyr Pro Gly Ser Gly Ser Arg Val Leu Val Glu Ile Ala
100 105 110
Cys Ala Arg Gly Pro Ala Gln Leu Phe Ala Val Arg Gln Ala Tyr His
115 120 125
Glu Arg Phe Lys Arg Ser Leu Glu Glu Asp Val Ala Ala His Ala Thr
130 135 140
Gly Asp Phe Arg Lys Leu Leu Val Pro Leu Ile Ser Ala Tyr Arg Tyr
145 150 155 160
Glu Gly Pro Glu Val Asn Thr Lys Leu Ala His Ser Glu Ala Lys Ile
165 170 175
Leu His Glu Lys Ile Gln His Lys Ala Tyr Gly Asp Asp Glu Ile Ile
180 185 190
Arg Ile Leu Thr Thr Arg Ser Lys Ala Gln Leu Ile Ala Thr Phe Asn
195 200 205
Arg Tyr Asn Asp Glu Tyr Gly His Pro Ile Asn Lys Asp Leu Lys Ala
210 215 220
Asp Pro Lys Asp Glu Phe Leu Ser Thr Leu Arg Ala Ile Ile Arg Cys
225 230 235 240
Phe Cys Cys Pro Asp Arg Tyr Phe Glu Lys Val Ile Arg Leu Ala Ile
245 250 255
Ala Gly Met Gly Thr Asp Glu Asn Ser Leu Thr Arg Ile Ile Thr Thr
260 265 270
Arg Ala Glu Val Asp Leu Lys Leu Ile Thr Glu Ala Tyr Gln Lys Arg
275 280 285
Asn Ser Val Pro Leu Glu Arg Ala Val Ala Gly Asp Thr Ser Gly Asp
290 295 300
Tyr Glu Arg Met Leu Leu Ala Leu Leu Gly Gln Glu Gln
305 310 315
<210> 148
<211> 1491
<212> DNA
<213> Oryza sativa
<400> 148
agtaatacgc aaggaatacc tggatcatac gatacgaata tctagagaca aaacatgatt 60
tgagtgattg atgatcgaga aagaagctca aaaggtcttg aaaagtcgaa acgtccatca 120
ctgaaattcg gtttcatgcc ctcagatccc attgctgagt aggacgcaga ttttcttcct 180
tcctaccatt tcctttctct tgcttccttt ttggtcattt gagatagctt tatccatcct 240
ttagcaaaaa ggaaaccaat agctagcaat acttgccatc atatatacct gggcaatggc 300
cggccaagca aactcagttc tctacattga acacttcagg tttgagtaga catggcctct 360
cggtgtcttg ttaccacagg ttttgaggat gagtgcagag agatccatga tgcgtgcaac 420
cagccacgcc gtttgagcgt tctcttggct catcggagcc catcggagag gcagaaaatc 480
aaggcgactt accgtacagt gttcggcgaa gatctcgccg gagaagtgca gaaaatcctc 540
atggtcaacc aggaagatga gctctgcaag ctgctctacc tgtgggtgct cgacccgtcg 600
gagcgcgacg cgatcatggc tcgggacgcc gtcgagaatg gcggcgccac ggattaccgg 660
gtcctggtgg agatcttcac acgccggaag cagaaccagc tcttcttcac caatcaggca 720
taccttgcca ggttcaagaa gaacctggag caggacatgg tcacagagcc gtctcatcct 780
taccagaggc tattggtagc acttgcaacc tcccacaagt cgcaccacga tgaacttagt 840
cggcacattg caaaatgtga cgccaggagg ctctatgatg cgaagaacag cggcatggga 900
tcggtcgacg aggctgtcat tcttgagatg ttcagcaaga ggagcatccc acagctcagg 960
ctagcattct gcagttacaa gcacatatat gggcatgact acaccaaggc actgaagaaa 1020
aatggcttcg gtgagtttga acaatctttg agggttgttg tgaagtgcat ctacaatcct 1080
tccatgtatt tctccaagct gctgcataga agtctgcaat gctcagcgac caataaaagg 1140
ttggttacaa gggctatttt gggcagtgac gatgtcgata tggacaagat caagtcagtg 1200
ttcaaaagta gttatggaaa ggaccttgag gatttcatcc ttgaaagctt gcctgagaat 1260
gattacagag actttctttt aggtgcggcc aaggggtcaa gggcctcatg aagtctgtgg 1320
agagagatcc ttgaattatc tagggaaagt aaagggtgca tatactgctt tgcatgtaag 1380
agcaaattga ccatcaaaaa cagcagtttt atgttatctg agaataggat ttaggtgaga 1440
acatcatgct cattttgttt attttgggtg aaaaaagtta tcagttcaac t 1491
<210> 149
<211> 319
<212> PRT
<213> Oryza sativa
<400> 149
Met Ala Ser Arg Cys Leu Val Thr Thr Gly Phe Glu Asp Glu Cys Arg
1 5 10 15
Glu Ile His Asp Ala Cys Asn Gln Pro Arg Arg Leu Ser Val Leu Leu
20 25 30
Ala His Arg Ser Pro Ser Glu Arg Gln Lys Ile Lys Ala Thr Tyr Arg
35 40 45
Thr Val Phe Gly Glu Asp Leu Ala Gly Glu Val Gln Lys Ile Leu Met
50 55 60
Val Asn Gln Glu Asp Glu Leu Cys Lys Leu Leu Tyr Leu Trp Val Leu
65 70 75 80
Asp Pro Ser Glu Arg Asp Ala Ile Met Ala Arg Asp Ala Val Glu Asn
85 90 95
Gly Gly Ala Thr Asp Tyr Arg Val Leu Val Glu Ile Phe Thr Arg Arg
100 105 110
Lys Gln Asn Gln Leu Phe Phe Thr Asn Gln Ala Tyr Leu Ala Arg Phe
115 120 125
Lys Lys Asn Leu Glu Gln Asp Met Val Thr Glu Pro Ser His Pro Tyr
130 135 140
Gln Arg Leu Leu Val Ala Leu Ala Thr Ser His Lys Ser His His Asp
145 150 155 160
Glu Leu Ser Arg His Ile Ala Lys Cys Asp Ala Arg Arg Leu Tyr Asp
165 170 175
Ala Lys Asn Ser Gly Met Gly Ser Val Asp Glu Ala Val Ile Leu Glu
180 185 190
Met Phe Ser Lys Arg Ser Ile Pro Gln Leu Arg Leu Ala Phe Cys Ser
195 200 205
Tyr Lys His Ile Tyr Gly His Asp Tyr Thr Lys Ala Leu Lys Lys Asn
210 215 220
Gly Phe Gly Glu Phe Glu Gln Ser Leu Arg Val Val Val Lys Cys Ile
225 230 235 240
Tyr Asn Pro Ser Met Tyr Phe Ser Lys Leu Leu His Arg Ser Leu Gln
245 250 255
Cys Ser Ala Thr Asn Lys Arg Leu Val Thr Arg Ala Ile Leu Gly Ser
260 265 270
Asp Asp Val Asp Met Asp Lys Ile Lys Ser Val Phe Lys Ser Ser Tyr
275 280 285
Gly Lys Asp Leu Glu Asp Phe Ile Leu Glu Ser Leu Pro Glu Asn Asp
290 295 300
Tyr Arg Asp Phe Leu Leu Gly Ala Ala Lys Gly Ser Arg Ala Ser
305 310 315
<210> 150
<211> 1393
<212> DNA
<213> Oryza sativa
<400> 150
atggaaaaat accatgaaat acaaatggaa aaaatagggt agagcccaga gcattggatg 60
tgcagattaa agctatacta ctagcattca agtttttttc aactctgctg cgtaggaggc 120
gtgtgtgtgc catgtgttgc tggtgctgct gcctggactg catccataac atacctccac 180
tcaatctcct cttcctccat ttctcccccc attctctctc ctcctcagct gcttctgcag 240
gtggaggaga agcagcagca gcagcagctg ttgctcccat ggcttccatc tctgtcccaa 300
acccagctcc ttcccctaca gaggatgcag agagcataag aaaggcagtg caaggatggg 360
gaacggacga gaatgcgctg atcgagatcc tcggccaccg gacggcggcg cagcgggcgg 420
agatcgccgt cgcctacgag ggcctctacg acgagaccct cctcgacagg ctccactccg 480
agctctccgg cgacttccgt agcgcgttga tgctgtggac gatggacccg gcggcgcggg 540
acgccaagct ggccaacgag gccctgaaga agaagaagaa gggcgagctc cgccacatct 600
gggtgctcgt cgaggtcgcc tgcgcgtcgt cgccggacca cctcgtcgcc gtcaggaagg 660
cctaccgcgc cgcctacgcc tcgtcgctgg aggaggacgt ggcgtcgtgc tcgctgttcg 720
gggacccgct caggcggttc ctggtgcgcc tcgtgagctc ctaccggtac ggcggcggtg 780
gcgtcgacgg cgagctggcg atcgccgagg cggcggagct gcacgacgcg gtggtgggca 840
gggggcaggc gctgcacggc gacgacgtcg tccgcatcgt cggcacgagg agcaaggcgc 900
agctcgcggt gacgctggag cggtacaggc aggagcacgg caagggcatc gacgaggtcc 960
tcgacggccg ccgcggcgac cagctcgcgg cggtgctcaa ggccgcgctc tggtgcctca 1020
cctcgccgga gaagcatttc gctgaggtga tccggacatc gattctaggg cttggcaccg 1080
acgaggagat gctgacgaga gggatcgtgt cgcgggcgga ggtggacatg gagaaggtga 1140
aggaggagta caaggtcagg tacaacacca cggtcaccgc cgacgtccgc ggcgacacgt 1200
cggggtacta catgaacacg cttctcaccc tcgtcggccc tgagaagtag ccatgtagca 1260
gcttggacat tttattgctt gctcatttga tttgaacaaa atacaccgtg tgatgttgca 1320
gttattagta aaatgcgagt aggatcgatg ttgttttcgt tgggtggatt aataatggag 1380
catgttttat cgc 1393
<210> 151
<211> 372
<212> PRT
<213> Oryza sativa
<400> 151
Met Cys Cys Trp Cys Cys Cys Leu Asp Cys Ile His Asn Ile Pro Pro
1 5 10 15
Leu Asn Leu Leu Phe Leu His Phe Ser Pro His Ser Leu Ser Ser Ser
20 25 30
Ala Ala Ser Ala Gly Gly Gly Glu Ala Ala Ala Ala Ala Ala Val Ala
35 40 45
Pro Met Ala Ser Ile Ser Val Pro Asn Pro Ala Pro Ser Pro Thr Glu
50 55 60
Asp Ala Glu Ser Ile Arg Lys Ala Val Gln Gly Trp Gly Thr Asp Glu
65 70 75 80
Asn Ala Leu Ile Glu Ile Leu Gly His Arg Thr Ala Ala Gln Arg Ala
85 90 95
Glu Ile Ala Val Ala Tyr Glu Gly Leu Tyr Asp Glu Thr Leu Leu Asp
100 105 110
Arg Leu His Ser Glu Leu Ser Gly Asp Phe Arg Ser Ala Leu Met Leu
115 120 125
Trp Thr Met Asp Pro Ala Ala Arg Asp Ala Lys Leu Ala Asn Glu Ala
130 135 140
Leu Lys Lys Lys Lys Lys Gly Glu Leu Arg His Ile Trp Val Leu Val
145 150 155 160
Glu Val Ala Cys Ala Ser Ser Pro Asp His Leu Val Ala Val Arg Lys
165 170 175
Ala Tyr Arg Ala Ala Tyr Ala Ser Ser Leu Glu Glu Asp Val Ala Ser
180 185 190
Cys Ser Leu Phe Gly Asp Pro Leu Arg Arg Phe Leu Val Arg Leu Val
195 200 205
Ser Ser Tyr Arg Tyr Gly Gly Gly Gly Val Asp Gly Glu Leu Ala Ile
210 215 220
Ala Glu Ala Ala Glu Leu His Asp Ala Val Val Gly Arg Gly Gln Ala
225 230 235 240
Leu His Gly Asp Asp Val Val Arg Ile Val Gly Thr Arg Ser Lys Ala
245 250 255
Gln Leu Ala Val Thr Leu Glu Arg Tyr Arg Gln Glu His Gly Lys Gly
260 265 270
Ile Asp Glu Val Leu Asp Gly Arg Arg Gly Asp Gln Leu Ala Ala Val
275 280 285
Leu Lys Ala Ala Leu Trp Cys Leu Thr Ser Pro Glu Lys His Phe Ala
290 295 300
Glu Val Ile Arg Thr Ser Ile Leu Gly Leu Gly Thr Asp Glu Glu Met
305 310 315 320
Leu Thr Arg Gly Ile Val Ser Arg Ala Glu Val Asp Met Glu Lys Val
325 330 335
Lys Glu Glu Tyr Lys Val Arg Tyr Asn Thr Thr Val Thr Ala Asp Val
340 345 350
Arg Gly Asp Thr Ser Gly Tyr Tyr Met Asn Thr Leu Leu Thr Leu Val
355 360 365
Gly Pro Glu Lys
370
<210> 152
<211> 1341
<212> DNA
<213> Oryza sativa
<400> 152
ggtcttttcc ggccgctccc ggcgcccgcc ggccatgtca acaacaagct cgtcaaaaac 60
cgccacgtgc cctctctgcc acgccgacgt gctgctgcca cggcggcggt cagccggctc 120
ctcgacgcac agaagccacg acctcgacga cggccccgct ccgccgtcgc cggagtccag 180
ctgccgcagc aacgccgcgg tgtgcgggtg cgcccgctgc cggcgccctg atctgatcag 240
tcccggaacc ggcatgcgga tgaggaacag attcggcgat ggccccaaca ggatatcagc 300
ccagagtgga gcatggctgt gccgagagcg cacggcggag acttgccgga gcacaagtag 360
ccggtccggc cgctaccggc gcctgcagcc tgcagcggtc gccggaacac gacgcgccga 420
actcataaag cggctgcaag agctctgcca cccagcaaat aaccttccaa attgttctgc 480
ttcttggcaa ccacagcgac agcggcagaa aacaattgat cgaattccag atagcctaga 540
ttgtggggtg acaatggaaa ggggcaagaa caagcgtgat ggaagtgaca atgggctcat 600
cttctctaac ctaatgcacg gtgttgctgc cggcatctat gggtatcctc ctcaccaggg 660
atacactcag gctcagagct acctactgct gccggaagca tatccacctc ctccgtggac 720
ataccctctt tctagtgctt accctcctca acctgttggt tacccttcag gtggctaccc 780
tcctgcagtc tactctgact cgtatctgca ccaaggtagc agagttgcgc gggagcaatg 840
ccctctatca tattccaata atgctgtcac ttgcagggag gatgggcaaa tgaactgtga 900
aaatggaaca gtaaatatgg agaaaagtgc aatgtcctca aataagatgg ctactagtct 960
actaaagagt tgcggcaatg tgatgccatg cagaaatatg gagagaagtg gcccagccat 1020
gtataaggtg gacatgcgcg gcagtacgaa gcaattctct atgggcagca agatgatgat 1080
gtgtctgatt gtgtttggat gtctgatagc tgccttggat atgtttagaa atgttgcaca 1140
aaaacagatg ttttctgtcg ttagtttact ttcttttgta gtcgcgacct atgtctgcta 1200
ggagtctcta catgtaccgt aaaattgctc tttgtgtaat gtgtacttct tcatcctgta 1260
aaaatagaat cccaatcaaa ctatatatgg tttgtctgtc gggctttcaa tacaatctga 1320
gtgtcctctc tttacctttg t 1341
<210> 153
<211> 388
<212> PRT
<213> Oryza sativa
<400> 153
Met Ser Thr Thr Ser Ser Ser Lys Thr Ala Thr Cys Pro Leu Cys His
1 5 10 15
Ala Asp Val Leu Leu Pro Arg Arg Arg Ser Ala Gly Ser Ser Thr His
20 25 30
Arg Ser His Asp Leu Asp Asp Gly Pro Ala Pro Pro Ser Pro Glu Ser
35 40 45
Ser Cys Arg Ser Asn Ala Ala Val Cys Gly Cys Ala Arg Cys Arg Arg
50 55 60
Pro Asp Leu Ile Ser Pro Gly Thr Gly Met Arg Met Arg Asn Arg Phe
65 70 75 80
Gly Asp Gly Pro Asn Arg Ile Ser Ala Gln Ser Gly Ala Trp Leu Cys
85 90 95
Arg Glu Arg Thr Ala Glu Thr Cys Arg Ser Thr Ser Ser Arg Ser Gly
100 105 110
Arg Tyr Arg Arg Leu Gln Pro Ala Ala Val Ala Gly Thr Arg Arg Ala
115 120 125
Glu Leu Ile Lys Arg Leu Gln Glu Leu Cys His Pro Ala Asn Asn Leu
130 135 140
Pro Asn Cys Ser Ala Ser Trp Gln Pro Gln Arg Gln Arg Gln Lys Thr
145 150 155 160
Ile Asp Arg Ile Pro Asp Ser Leu Asp Cys Gly Val Thr Met Glu Arg
165 170 175
Gly Lys Asn Lys Arg Asp Gly Ser Asp Asn Gly Leu Ile Phe Ser Asn
180 185 190
Leu Met His Gly Val Ala Ala Gly Ile Tyr Gly Tyr Pro Pro His Gln
195 200 205
Gly Tyr Thr Gln Ala Gln Ser Tyr Leu Leu Leu Pro Glu Ala Tyr Pro
210 215 220
Pro Pro Pro Trp Thr Tyr Pro Leu Ser Ser Ala Tyr Pro Pro Gln Pro
225 230 235 240
Val Gly Tyr Pro Ser Gly Gly Tyr Pro Pro Ala Val Tyr Ser Asp Ser
245 250 255
Tyr Leu His Gln Gly Ser Arg Val Ala Arg Glu Gln Cys Pro Leu Ser
260 265 270
Tyr Ser Asn Asn Ala Val Thr Cys Arg Glu Asp Gly Gln Met Asn Cys
275 280 285
Glu Asn Gly Thr Val Asn Met Glu Lys Ser Ala Met Ser Ser Asn Lys
290 295 300
Met Ala Thr Ser Leu Leu Lys Ser Cys Gly Asn Val Met Pro Cys Arg
305 310 315 320
Asn Met Glu Arg Ser Gly Pro Ala Met Tyr Lys Val Asp Met Arg Gly
325 330 335
Ser Thr Lys Gln Phe Ser Met Gly Ser Lys Met Met Met Cys Leu Ile
340 345 350
Val Phe Gly Cys Leu Ile Ala Ala Leu Asp Met Phe Arg Asn Val Ala
355 360 365
Gln Lys Gln Met Phe Ser Val Val Ser Leu Leu Ser Phe Val Val Ala
370 375 380
Thr Tyr Val Cys
385
<210> 154
<211> 1276
<212> DNA
<213> Oryza sativa
<400> 154
ataggtcaac ttgaatcttg ttcaaaaatt cttttcaagt cttaggtagg tcactgttgg 60
tgccaccttc ttgagaagtt tatgatctgc atgttcacct aagatatcca gtcaagtgct 120
aaaaaggtca caaaaatggg aggcagaaag gacaatcatg actcctcaaa tgccgacaaa 180
gggttccatg gagcgtatcc aagcggttac cctggtgcat atcccctaat gcaaggatac 240
cctaattcac ctggacaata tccgactccc ggtggatacc ctagtgcacc accgggacaa 300
tacccaccag ccggtgggta ccctggtgca caatatccac caagcggtta ccctccatca 360
caaggtgggt accctccagg agcgtatcca ccatcaggat atccacaaca accaggctac 420
ccgccagctg gttacccagg tcatggccat ggtccaccca tgcaaggagg tgggcatggt 480
gcaggcgcat ctggctatgg agcgctgctc gccggaggcg ccgcggtggc ggctgctgcg 540
gtgggagctc acatggtacg acccggcggc ggtggcggcc acgggatgtt cggccaccat 600
ggtggcaaat tcaagaaagg aaagttcaag catggcaagt acggcaagca caagaagttt 660
gggcgcaagt ggaagtgata agcaaactaa attgcactgc agtttgcctc cggtttcttg 720
tttggttgaa gtgctatagc atgatgggat taagtgtcca tttaccatat atatatatat 780
atattcatcg aaatataacc atacgagatc ttattttaaa gataattgta ataaatataa 840
tggtgtaatg gatcacaaat tagaaaaaag gtttaggaga aaaaacattt tgagcttgct 900
aacagaaaat taaacccacc ataagcaatc agaataggcc acatgtgaat ggctatatcc 960
ggttaaatcc gccgaatcca atcatcgaac tcttatttcc cacaaaccaa actcatccag 1020
cctcatgcac ctaactaatc acatccatcc ttagacgatg catgcgtgtg gacattcttg 1080
ccaaaaccaa caattagccg tgagagccca aacaactgag tactccagcc tacgattgtc 1140
aggatatttt ctcatctaac ttattctagt attaggagtt atgaagatat gaaaagccat 1200
tttagttcag aaaattgtac gataaatcat gtaacctgtt tctgaaatgg aaataaaata 1260
tgagaaaaag atacta 1276
<210> 155
<211> 180
<212> PRT
<213> Oryza sativa
<400> 155
Met Gly Gly Arg Lys Asp Asn His Asp Ser Ser Asn Ala Asp Lys Gly
1 5 10 15
Phe His Gly Ala Tyr Pro Ser Gly Tyr Pro Gly Ala Tyr Pro Leu Met
20 25 30
Gln Gly Tyr Pro Asn Ser Pro Gly Gln Tyr Pro Thr Pro Gly Gly Tyr
35 40 45
Pro Ser Ala Pro Pro Gly Gln Tyr Pro Pro Ala Gly Gly Tyr Pro Gly
50 55 60
Ala Gln Tyr Pro Pro Ser Gly Tyr Pro Pro Ser Gln Gly Gly Tyr Pro
65 70 75 80
Pro Gly Ala Tyr Pro Pro Ser Gly Tyr Pro Gln Gln Pro Gly Tyr Pro
85 90 95
Pro Ala Gly Tyr Pro Gly His Gly His Gly Pro Pro Met Gln Gly Gly
100 105 110
Gly His Gly Ala Gly Ala Ser Gly Tyr Gly Ala Leu Leu Ala Gly Gly
115 120 125
Ala Ala Val Ala Ala Ala Ala Val Gly Ala His Met Val Arg Pro Gly
130 135 140
Gly Gly Gly Gly His Gly Met Phe Gly His His Gly Gly Lys Phe Lys
145 150 155 160
Lys Gly Lys Phe Lys His Gly Lys Tyr Gly Lys His Lys Lys Phe Gly
165 170 175
Arg Lys Trp Lys
180
Claims (49)
- 서열번호 2의 2-Cys PRX(2-Cysteine peroxiredoxin)를 암호화하는 핵산 서열을 식물 뿌리에 도입 및 발현하는 단계를 포함하는 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항에 있어서, 상기 도입 및 발현은 T-DNA 활성화 태킹, TILLING, 또는 상동 재조합의 하나 이상에 의해 수행되는(effected) 것을 특징으로 하는 방법.
- 삭제
- 제1항에 있어서, 상기 향상된 수확량 관련 형질은 하기 중 하나 이상인 것을 특징으로 하는 방법:(i) 향상된 초기 활력; (ii) 증가된 지상부 생물량(biomass); (iii) 증가된 뿌리 생물량(biomass); (iv) 원추화서당 증가된 꽃의 수; (v) 증가된 종자 충만율(fill rate); (vi) 식물체당 증가된 총 종자 수확량; (vii) 증가된 (충만된) 종자 수; (viii) 증가된 수확 지수; 또는 (ix) 증가된 천립당 중량 (TKW).
- 제1항에 있어서, 상기 향상된 수확량 관련 형질은 비생물적 스트레스 조건하에서 얻어진 것을 특징으로 하는 방법.
- 제10항에 있어서, 상기 비생물적 스트레스는 하나 이상의 수분 스트레스, 염 스트레스, 산화적 스트레스 및 이온 스트레스로부터 선택된 삼투 스트레스인 것을 특징으로 하는 방법.
- 제10항에 있어서, 상기 비생물적 스트레스 내성은 하기 중 하나 이상으로부터 선택된 향상된 수확량 관련 형질로서 나타나는 것을 특징으로 하는 방법: 대조구 식물에 비해 각각 (i) 향상된 초기 활력; (ii) 증가된 지상부 생물량(biomass); (iii) 증가된 뿌리 (굵은 및 가는) 생물량(biomass); (iv) 원추화서당 증가된 꽃의 수; (v) 증가된 종자 충만율; (vi) 식물체당 증가된 총 종자 수확량; (vii) 증가된 (충만된) 종자 수; (viii) 증가된 수확 지수; 또는 (ix) 증가된 천립당 중량 (TKW).
- 제1항에 있어서, 상기 핵산 서열은 뿌리 특이적 프로모터에 작동가능하게 연결된 것을 특징으로 하는 방법.
- 삭제
- 뿌리 특이적 프로모터에 작동가능하게 연결된, 2-Cys PRX 폴리펩티드를 암호화하는 핵산 외래도입유전자(transgene)를 포함하는 것을 특징으로 하는, 제1항에 따른 방법에 의해 수득된 대조구 식물에 비해 수확량 관련 형질이 향상된 종자를 포함하는 식물 또는 식물의 일부.
- 삭제
- 삭제
- 삭제
- 하기 단계를 포함하는 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는 형질전환 식물의 제조 방법:(i) 뿌리 특이적 프로모터의 조절하에서 제1항에 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열을 식물, 식물의 일부 또는 식물 세포에 도입 및 발현하는 단계; 및(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
- 제19항에 있어서, 상기 향상된 수확량 관련 형질이 증가된 비생물적 스트레스 조건하에서 발생하는 것을 특징으로 하는 방법.
- 제1항에 정의된 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열의 조절된 발현으로 인해, 대조구 식물에 비하여 향상된 수확량 관련 형질을 가진 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포 또는 식물의 일부.
- 제21항에 있어서, 상기 식물이 작물 식물 또는 단자엽 식물 또는 벼, 옥수수, 밀, 보리, 기장, 호밀, 라이밀, 수수 및 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물 유래의 형질전환 식물 세포 또는 식물의 일부.
- 제22항에 따른 2-Cys PRX 폴리펩티드를 암호화하는 핵산 서열을 포함하는 식물의 종자.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP07108768 | 2007-05-23 | ||
EP07108768.8 | 2007-05-23 | ||
US93222607P | 2007-05-29 | 2007-05-29 | |
US60/932,226 | 2007-05-29 | ||
EP07110086 | 2007-06-12 | ||
EP07110086.1 | 2007-06-12 | ||
US93799407P | 2007-06-29 | 2007-06-29 | |
US60/937,994 | 2007-06-29 | ||
PCT/EP2008/056381 WO2008142163A2 (en) | 2007-05-23 | 2008-05-23 | Plants having enhanced yield-related traits and a method for making the same |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100035688A KR20100035688A (ko) | 2010-04-06 |
KR101255413B1 true KR101255413B1 (ko) | 2013-04-17 |
Family
ID=39735038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020097026438A KR101255413B1 (ko) | 2007-05-23 | 2008-05-23 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
Country Status (11)
Country | Link |
---|---|
US (2) | US8878006B2 (ko) |
EP (2) | EP2172556B1 (ko) |
KR (1) | KR101255413B1 (ko) |
CN (2) | CN101688214A (ko) |
AR (1) | AR066714A1 (ko) |
AU (1) | AU2008252852B2 (ko) |
BR (1) | BRPI0811185A2 (ko) |
CA (1) | CA2685848A1 (ko) |
DE (1) | DE112008001326T5 (ko) |
MX (1) | MX2009012451A (ko) |
WO (1) | WO2008142163A2 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11674148B2 (en) | 2021-08-03 | 2023-06-13 | Seoul National University R&Db Foundation | OSNF-YA5 gene from Oryza sativa for increasing nitrogen availability of plant and uses thereof |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102811617A (zh) | 2010-01-22 | 2012-12-05 | 拜耳知识产权有限责任公司 | 杀螨和/或杀虫活性物质结合物 |
EP2353387A1 (de) | 2010-02-05 | 2011-08-10 | Bayer CropScience AG | Verwendung von Succinat-Dehydrogenase (SDH)-Inhibitoren in der Behandlung von Pflanzenarten der Familie der Süßgräser |
EA201290937A1 (ru) * | 2010-03-19 | 2013-06-28 | Басф Плант Сайенс Компани Гмбх | Растения с улучшенными характеристиками урожайности и способ их получения |
KR101329224B1 (ko) * | 2011-02-25 | 2013-11-13 | 경상대학교산학협력단 | 벼로부터 유래한 1 시스테인 퍼록시레독신 프로모터 |
CN102229662B (zh) * | 2011-06-14 | 2013-02-20 | 中山大学 | 一种莲膜联蛋白及其表达载体和应用 |
CN103717076B (zh) | 2011-08-10 | 2016-04-13 | 拜耳知识产权股份有限公司 | 含有特定特特拉姆酸衍生物的活性化合物组合物 |
KR101383377B1 (ko) * | 2012-06-15 | 2014-04-10 | 대한민국 | 유전자를 이용하여 벼의 분얼과 뿌리생장을 조절하는 방법 |
JP2016514964A (ja) * | 2013-03-14 | 2016-05-26 | モンサント テクノロジー エルエルシー | 植物調節エレメントおよびその使用 |
KR101700619B1 (ko) | 2014-11-14 | 2017-01-31 | 대한민국 | Hox25 유전자 및 상기 유전자를 포함하는 과발현 벡터로 형질전환된 식물체 |
MX2018001408A (es) | 2015-08-07 | 2018-03-15 | Bayer Cropscience Nv | Uso de anexina para para mejorar el rendimiento en condiciones de estres en plantas. |
CN105132440B (zh) * | 2015-09-23 | 2018-08-21 | 安徽农业大学 | 与小麦叶片叶绿素含量和粒重相关的基因、其Indel标记及应用 |
EP3494223B1 (en) * | 2016-08-05 | 2023-02-15 | Limagrain Europe | Constructs and methods for controlling stomatal closure in plants |
US11613762B2 (en) * | 2017-08-25 | 2023-03-28 | Université Catholique de Louvain | Plants with modified lipid metabolism and methods for making the same |
US11720638B2 (en) | 2019-05-30 | 2023-08-08 | Onlineseedsales Llc | Embryonic plant listing system |
CN112813072A (zh) * | 2021-02-02 | 2021-05-18 | 河北师范大学 | 一种膜联蛋白基因在植物水分胁迫中的应用 |
CN112680457A (zh) * | 2021-02-02 | 2021-04-20 | 河北师范大学 | 一种膜联蛋白基因在植物热胁迫中的应用 |
CN114605514B (zh) * | 2022-03-31 | 2023-06-13 | 河北师范大学 | 蛋白质VvANN1在提高植物抗旱性中的应用 |
CN116724877B (zh) * | 2023-04-27 | 2024-06-21 | 广西壮族自治区农业科学院 | 一种保持巴马火麻雌雄异株群体纯合的方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005116082A1 (en) | 2004-05-27 | 2005-12-08 | Industry-Academic Cooperation Foundation Gyeong Sang National University | 2-cysteine peroxiredoxin complex exhibiting function acting as molecular chaperone and uses thereof |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4962028A (en) | 1986-07-09 | 1990-10-09 | Dna Plant Technology Corporation | Plant promotors |
AU3756889A (en) | 1988-06-01 | 1990-01-05 | The Texas A & M University System | Method for transforming plants via the shoot apex |
AU4115693A (en) | 1992-04-24 | 1993-11-29 | Sri International | In vivo homologous sequence targeting in eukaryotic cells |
WO1994012015A1 (en) | 1992-11-30 | 1994-06-09 | Chua Nam Hai | Expression motifs that confer tissue- and developmental-specific expression in plants |
AU687961B2 (en) | 1993-11-19 | 1998-03-05 | Biotechnology Research And Development Corporation | Chimeric regulatory regions and gene cassettes for expression of genes in plants |
EP0733059B1 (en) | 1993-12-09 | 2000-09-13 | Thomas Jefferson University | Compounds and methods for site-directed mutations in eukaryotic cells |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
GB9703146D0 (en) | 1997-02-14 | 1997-04-02 | Innes John Centre Innov Ltd | Methods and means for gene silencing in transgenic plants |
GB9720148D0 (en) | 1997-09-22 | 1997-11-26 | Innes John Centre Innov Ltd | Gene silencing materials and methods |
JP2004527201A (ja) * | 1998-04-09 | 2004-09-09 | アリゾナ ボード オブ リーゼンツ | アルフィン1の発現、ならびに根の生長および根の特定の遺伝子活性化の増大したトランスジェニック植物を生産する方法 |
US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
CA2366104C (en) | 1999-07-22 | 2010-07-06 | Japan As Represented By Director General Of National Institute Of Agrobiological Resources, Ministry Of Agriculture, Forestry And Fisheries | Ultra-fast transformation technique for monocotyledons |
AU780117B2 (en) | 1999-08-26 | 2005-03-03 | Basf Plant Science Gmbh | Plant gene expression, controlled by constitutive plant V-ATpase promoters |
WO2001064928A2 (en) * | 2000-03-01 | 2001-09-07 | Research & Development Institute, Inc. | Transgenic plants with increased seed yield, biomass and harvest index |
ATE357517T1 (de) * | 2000-08-01 | 2007-04-15 | Temasek Life Sciences Lab Ltd | Isolierung und charakterisierung eines fiber- spezifischen ss-tubulin-promoters aus baumwolle |
AUPR221300A0 (en) | 2000-12-20 | 2001-01-25 | Malaysian Palm Oil Board | A molecular marker |
WO2004013304A2 (en) * | 2002-08-02 | 2004-02-12 | Basf Plant Science Gmbh | Sugar and lipid metabolism regulators in plants iv |
EP1433854A1 (fr) * | 2002-12-23 | 2004-06-30 | Universite Libre De Bruxelles | Plante génétiquement modifiée présentant une floraison accélérée |
WO2004065596A2 (en) | 2003-01-21 | 2004-08-05 | Cropdesign N.V. | Use of the regulatory sequence of the rice gos2 gene for the gene expression in dicotyledonous plants or plant cells |
DE602004006477T2 (de) | 2003-02-04 | 2008-02-14 | Cropdesign N.V. | Promotor aus reis |
JP2004283028A (ja) | 2003-03-19 | 2004-10-14 | Japan Science & Technology Agency | 植物における活性窒素ストレスの抑制方法 |
US20060143729A1 (en) * | 2004-06-30 | 2006-06-29 | Ceres, Inc. | Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics |
EP2302062A1 (en) * | 2003-10-20 | 2011-03-30 | CropDesign N.V. | Identification of E2F target genes and uses thereof |
KR20030086551A (ko) | 2003-10-22 | 2003-11-10 | 금호석유화학 주식회사 | 식물로부터의 아넥신을 인코드하는 핵산 분자 |
-
2008
- 2008-05-23 DE DE112008001326T patent/DE112008001326T5/de not_active Withdrawn
- 2008-05-23 BR BRPI0811185-5A2A patent/BRPI0811185A2/pt not_active Application Discontinuation
- 2008-05-23 AR ARP080102196A patent/AR066714A1/es unknown
- 2008-05-23 AU AU2008252852A patent/AU2008252852B2/en not_active Expired - Fee Related
- 2008-05-23 KR KR1020097026438A patent/KR101255413B1/ko not_active IP Right Cessation
- 2008-05-23 EP EP09179238.2A patent/EP2172556B1/en not_active Not-in-force
- 2008-05-23 CA CA002685848A patent/CA2685848A1/en not_active Abandoned
- 2008-05-23 CN CN200880017173A patent/CN101688214A/zh active Pending
- 2008-05-23 MX MX2009012451A patent/MX2009012451A/es not_active Application Discontinuation
- 2008-05-23 EP EP08759981A patent/EP2069508A2/en not_active Withdrawn
- 2008-05-23 US US12/601,023 patent/US8878006B2/en not_active Expired - Fee Related
- 2008-05-23 CN CN201510648503.4A patent/CN105112441A/zh active Pending
- 2008-05-23 WO PCT/EP2008/056381 patent/WO2008142163A2/en active Application Filing
-
2014
- 2014-09-26 US US14/497,793 patent/US20150033412A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005116082A1 (en) | 2004-05-27 | 2005-12-08 | Industry-Academic Cooperation Foundation Gyeong Sang National University | 2-cysteine peroxiredoxin complex exhibiting function acting as molecular chaperone and uses thereof |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11674148B2 (en) | 2021-08-03 | 2023-06-13 | Seoul National University R&Db Foundation | OSNF-YA5 gene from Oryza sativa for increasing nitrogen availability of plant and uses thereof |
Also Published As
Publication number | Publication date |
---|---|
CN105112441A (zh) | 2015-12-02 |
MX2009012451A (es) | 2009-12-02 |
EP2172556A2 (en) | 2010-04-07 |
KR20100035688A (ko) | 2010-04-06 |
EP2069508A2 (en) | 2009-06-17 |
BRPI0811185A2 (pt) | 2014-10-07 |
AU2008252852A1 (en) | 2008-11-27 |
DE112008001326T5 (de) | 2010-07-01 |
CN101688214A (zh) | 2010-03-31 |
AU2008252852B2 (en) | 2014-08-07 |
EP2172556B1 (en) | 2015-07-22 |
CA2685848A1 (en) | 2008-11-27 |
US20100170011A1 (en) | 2010-07-01 |
US8878006B2 (en) | 2014-11-04 |
WO2008142163A3 (en) | 2009-02-26 |
EP2172556A3 (en) | 2010-06-23 |
WO2008142163A2 (en) | 2008-11-27 |
US20150033412A1 (en) | 2015-01-29 |
AR066714A1 (es) | 2009-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101255413B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
US9617557B2 (en) | Plants having increased yield-related traits by expressing a growth-regulating factor (GRF) polypeptide and method for making the same | |
KR101255415B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
EP2193203B1 (en) | Plants having increased yield-related traits and a method for making the same | |
US8697948B2 (en) | Plants having enhanced yield-related traits and a method for making the same | |
KR101754083B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
AU2009209600B2 (en) | Plants having increased yield-related traits and a method for making the same | |
KR101269929B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
US9175303B2 (en) | Plants having enhanced yield-related traits and a method for making the same | |
MX2011001475A (es) | Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas. | |
US20090019606A1 (en) | Plants Having Increased Yield And A Method For Making The Same | |
MX2011002028A (es) | Plantas que tienen rasgos relacionados con rendimiento mejoradas y un metodo para producirlas. | |
MX2011006178A (es) | Plantas que tienen mejores rasgos relacionados con el rendimiento y/o mejor tolerancia al estres abiotico y un metodo para producirlas. | |
US20130019347A1 (en) | Plants having enhanced yield-related traits and a method for making the same | |
EP2225378B1 (en) | Plants having increased yield-related traits and a method for making the same | |
US20130025002A1 (en) | Plants having enhanced yield-related traits and a method for making the same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20160308 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |