KR20080075908A - 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법 - Google Patents
배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법 Download PDFInfo
- Publication number
- KR20080075908A KR20080075908A KR1020087016525A KR20087016525A KR20080075908A KR 20080075908 A KR20080075908 A KR 20080075908A KR 1020087016525 A KR1020087016525 A KR 1020087016525A KR 20087016525 A KR20087016525 A KR 20087016525A KR 20080075908 A KR20080075908 A KR 20080075908A
- Authority
- KR
- South Korea
- Prior art keywords
- plant
- dyad
- ser
- lys
- glu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/02—Preparation of hybrid cells by fusion of two or more cells, e.g. protoplast fusion
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
- C12N15/829—Female sterility
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Gastroenterology & Hepatology (AREA)
- Botany (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 발명은 DYAD 유전자, 그의 돌연변이체 및 자성 부모 식물의 이형접합성을 유지하는 식물을 제조하기 위한 이들의 용도에 관한 것이다. 본 발명은 또한 dyad 표현형을 가지며 따라서 구성적으로(constitutively) 또는 조건부로 자성 부모의 이형접합성을 유지하는 식물, 식물 조직, 및 식물의 종자를 포괄한다. 본 발명은 무성생식 식물의 방식으로 원하는 잡종 표현형을 전파시키고 식물 유전자형의 배수성을 증가시켜서, 증가된 바이오매스를 갖는 식물을 생성하기 위해 유용하다.
배수성, 무성생식 종자, 이형접합성, DYAD, dyad 돌연변이체.
Description
본 발명은 배아에 모계 게놈(maternal genome)의 완전한 이배체 상보체를 갖는 종자를 생산하기 위한 목적으로 생식세포형성(gametogenesis) 및 종자 발달을 처리(manipulate)하기 위한, 애기장대(Arabidopsis), 보에케라(Boechera) 및 쌀의 DYAD 유전자 및 유전자 산물의 용도에 관한 것이다. 본 발명은 또한 화분 형성에 대한 실질적인 효과 없이 퇴화되지 않은 암 배우체(unreduced female gametophyte)를 생성하기 위한 변형된 DYAD 유전자의 용도에 관한 것이다.
식물의 생활사(life cycle)는 이배체 포자체 생성 및 반수체 배우체 생성을 교대시킨다. 감수분열은 식물의 생활사의 이배체 포자체 단계와 반수체 배우체 단계 간의 전환을 의미한다. 감수분열은 반수체 포자의 형성을 가져온다. 동물과 달리, 식물에서, 감수분열 생성물은 다세포 반수체 배우체를 형성하기 위해 추가적인 분열을 수행한다. 생식세포의 분화는 감수분열 생성물의 분열 후에, 배우체 발달의 후기 단계에 일어난다. 따라서, 수정 전 유성생식 과정은 두 개의 개별적인 단계들을 포함한다: 감수분열 및 반수체 포자의 형성을 포함하는 포자 형성; 및 상 기 포자의, 수정 및 배아의 성장을 지지하기 위해 요구되는 생식 세포 및 관련 세포들을 포함하는 배우체로의 발달.
대부분의 식물 종들은 유성 생식으로 번식한다; 그러나, 일부 식물 종들은 무성 생식을 통해 번식할 수 있다. 용어 단위생식(apomixis)은 일반적으로 임의의 형태의 무성 생식에 의한 유성 생식의 대체로 받아들여진다(Koltunow A. and Grossniklauss U. Annu. Rev. Plant Biol. Vol. 54: 547-74, 2003). 단위 생식은 식물에서 난자와 정자의 결합 없이 배아가 형성되는 종자 형성을 포함한, 유전적으로 조절되는 번식 방법이다. 단위 생식의 세 개의 기본적인 유형이 있다: 1) 주심(nucellus)으로부터 유래된 배낭 내의 염색체가 감소되지 않은 난(chromosomally unreduced egg)으로부터 단위생식에 의해 배아가 발달하는 것인 무포자 생식(apospory), 2) 거대포자 모 세포(megaspore mother cell)로부터 유래된 배낭 내의 감소되지 않은 난으로부터 단위생식에 의해 배아가 발달하는 것인 복상 포자생식(diplospory), 및 3) 배아가 체세포로부터 직접 발달하는 것인 부정배 형성(adventitious embryony). 앞의 두 종류의 단위 생식은 양 경우 모두 배아가 자성 배우체 또는 배낭으로부터 발달하고, 부정배 형성에서, 배아는 중간의 자성 배우체 단계(intermediate female gametophyte stage) 없이 체세포로부터 직접 발달하기 때문에, 앞의 두 종류의 무성생식은 은 배우체 단위 생식(gametophytic apomixis)으로 분류된다. 따라서, 배우체 단위 생식은 하기의 두 성분을 포함한다: i) 위감수분열(apomeiosis), 또는 부모 유전자형을 유지하는 감소되지 않은 자성 배우체(배낭)의 형성, 및 ii) 배유(endosperm)로 발달하는 중심 세포(central cell)의 수정을 포함하는 또는 상기 수정을 포함하지 않는 배아의 단위생식에 의한 발달(parthenogenetic development).
단위 생식은 따라서 모계 부모와 유전적으로 동일한 배아를 생성하기 위해 자성 감수분열(female meiosis) 및 배우자 접합(syngamy)을 우회하는 생식 과정이다. 상기 세 종류의 단위 생식은 그들이 이형접합성의 정도에 관계없이 임의의 유전형이 순종을 번식하게 할 수 있기 때문에, 경제적 잠재력을 갖는다. 단위 생식으로, 특히 적응성(adpative) 유전자형 또는 잡종 유전자형의 자손들은 반복적인 생활사 동안 그들의 유전자형을 유지한다. 잡종 강세(hybrid vigour)를 확립하는 것 외에, 단위 생식은 잡종 생산을 위한 효율적인 웅성 불임 또는 수정능력 회복 시스템(fertility restoration system)이 알려지거나 또는 개발되지 않은 작물에서 상업적인 잡종 생산을 가능하게 할 수 있다. 따라서, 단위 생식은 잡종 개발을 보다 효율적이게 한다. 단위 생식은 또한 우수한 웅성 불임 시스템을 갖는 식물 종에서 잡종 생산을 단순화시키고 유전적 다양성을 증가시킨다. 절대적인 또는 높은 수준의 단위 생식을 조절하는 유전자를 재배된 종들에 도입하고 순종-생산 F1 잡종(true-breeding F1 hybrid)을 생산하기 위해 교차-융화적(cross-compatible) 유성 유전자형 및 무성생식 유전자형을 용이하게 혼성화시킬 수 있는 것은 매우 바람직하다. 단위 생식의 중요한 작물로의 전달은 세포질-핵 웅성 불임 및 고비용의 노동-집약적 생산 과정에 대한 필요 없이 순종-번식 잡종(true-breeding hybrid)의 개발 및 잡종의 상업적 생산을 가능하게 할 것이다. 절대적인 무성생식 F1 잡종(obligately apomictic Fl hybrid)은 종자를 통해 무기한으로 순종을 번식하고 상기 종자를 통한 영양(vegetative) 생식 또는 무성(clonal) 생식 방법을 제공하는 것으로 간주될 수 있다. 단위 생식에 의해 번식하는 재배 작물(cultivated crop)의 개발은 또한 개발도상국에서 식량 안보에 대한 큰 기여를 제공할 것이다(Spillane C, SteimerA, and Grossniklaus U, Sex. Plant Reprod. 14: 179-187, 2001).
실제로, 단위 생식을 조절하는 대부분의 공지된 유전자들은 야생종에서 발견되며, 이들은 재배 종(cultivated species)과 관계가 멀다. 재배 종과 야생 종간의 종간 교배(interspecific cross)가 이루어질 수 있으나, 게놈 간의 염색체 쌍 형성은 일반적으로 낮거나 존재하지 않아서, 이 방법의 실패를 초래한다.
단위 생식을 재배 작물에 도입하기 위해 고려될 수 있는 두 가지 일반적인 전략이 있다. 첫째는 야생 관련 종(wild relative)로부터 재배종으로의 유전자 이입(introgression)에 의한 것이다. 둘째는 유성 종(sexual species)에서 단위생식의 양상을 부여할 수 있는 유전자를 확인하고, 및 완전한 레퍼토리의 단위 생식을 생성하기 위해 이 유전자들을 점증시키는 것의 의한 것이다. 그 후, 이 유전자들은 유전자이식(transgenic) 방법을 이용하여 재배작물로 도입될 수 있다. 따라서, 예를 들면, 하나 이상의 유전자의 발현이 위감수 분열을 도입(engineer)하기 위해 이용될 수 있고, 이 유전자들은 단위 생식에 의한 배아 발생(parthenogenetic embryo development)을 유도하기 위해 또 다른 세트의 유전자 또는 다른 처리들과 조합될 수 있다. 식물에서 단위생식을 유도하는 방법은 본 발명이 속하는 기술 분야에서 알려져 있다(예를 들면, 미국특허 제5,840,567호 참조). 본 발명과 함께 사용되기 위한, 단위생식에 의한 발생을 유도하는 바람직한 방법은 방사선 조사된 화분을 이용하여 식물을 수분시키고, 그에 의해 상기 식물을 수정에 대해 불활성화시키는 방법이다. (Pandey K.K. and Phung M., Theoret. Appl. Genet., Vol. 62:295-300, 1982; Lofti M. et al, Plant Cell Reprod., Vol. 21:1121-1128, 2003).
이 방법은 다수의 식물 종에서 이용되고 불완전한 꽃을 갖는 식물(자웅동주 및 자웅이주)에 가장 용이하게 적용될 수 있는 것으로 보인다는 점에서 바람직하다. 그러나, 이 방법은 웅성-불임이 되거나 또는 자성 화분이 기계적으로 제거되거나 분리된 완전한 꽃을 갖는 자웅동체성(hermaphroditic ) 식물에 적용될 수 있다.
화분을 불임으로 만드는 방사선 조사의 특정한 선량은 종의 구체적 특징에 따라 변할 것이다. 일반적으로, 약 10 내지 2000 그레이(Gray)의 선량이 충분하다. 바람직하게는, 상기 선량은 약 100 내지 500 그레이, 보다 바람직하게는 200 내지 250 그레이이다.
단위생식의 성공적인 유도는 배의 존재 여부에 대한 종자의 스크리닝에 의해, 예를 들면, 절개에 의해, 또는 Lofti M. et al., Plant Cell Reprod., Vol. 21: 1121-1128, 2003에 기재된 바와 같이 액체 배지에서의 배양 후에 라이트 박스(light box) 상의 종자의 관찰에 의해 검출될 수 있다.
무성생식 생식 특성을 정상적인 유성 생식 작물에 도입하는 것이 시도되었다. Asker S. (Hereditas, Vol. 91: 231-241, 1979)는 밀, 사탕무, 및 옥수수에 의한 시도가 성공적이지 않았다고 보고했다. PCT 국제공개 WO 89/00810 (Maxon et al, 1989)은 재배되지 않은(nondomesticated) 중성(sterile) 알팔파 식물로부터의 추출물을 이용하여 재배 식물에 단위 생식의 생식 형태를 유도하는 것을 개시한다. 웅성 불임의 유도가 사탕수수, 해바라기, 진주 조(pearl millet), 및 토마토에서 평가된 경우, 사탕수수, 진주 조, 및 해바라기에서 종자 세트(seed set)의 감소가 있었고, 토마토에서는 과실 세트의 감소가 있었다.
시트러스(Parlevliet J. E. et al., in Citrus. Proc. Am. Soc. Hort. Sci., Vol. 74: 252-260, 1959)에서 균일하고 질병- 및 바이러스-불포함 근경(rootstock)을 생성하고 버플그래스(buffelgrass)(Bashaw, Crop Science, Vol. 20: 112, 1980) 및 포아(Poa)(Pepin et al., Crop Science, Vol. 11: 445-448, 1971)에서 개량된 품종을 생성하기 위해 단위 생식이 효과적으로 이용되나, 단위 생식은 재배 작물 식물로는 성공적으로 이전되지 않았다.
단위 생식을 도입하기 위한 제2 접근방법은 유성생식 종으로부터 단위 생식 관련 유전자의 확인 및 조작을 포함한다. 단위 생식의 발생적 관점은 단위 생식은 유성 생식과 관련되며 유성생식 경로에서도 역할을 하는 유전자의 작용을 포함한다는 것을 시사했다(Tucker M.R. et al., Plant Cell, Vol. 15(7): 1524- 1537, 2003). 유성 생식에서, 일반적으로 피하층으로부터 발생 중인 배주(ovule)의 정점을 향해 형성되는 유래된 거대포자 모 세포는 확대되고 감수분열 및 두 번의 세포 분열을 거쳐서 각각 반수체 염색체 수를 갖는 거대포자의 선형 4세포체(linear tetrad)를 형성한다. 상이한 식물 종들 중에서 가장 흔한 것은, 가장 정점의 3개의 포자들이 퇴화하고 기능성의 합점 포자(functional chalazal spore)가 세포 확대를 동반한 3회의 핵 분열을 수행하여 하나의 난, 두개의 배낭 핵(polar nucleus), 두 개의 조세포(synergid) 및 3개의 반족 세포(antipodal cell)를 갖는 배낭을 형성한다. 단위생식은 특정 종들에서 복수 개의 유전자의 작용을 필요로 하는 것으로 확인된 바와 같이, 복수의 단계 및 단위생식의 완전한 경로의 제어를 필요로 하는 과정이다(van Dijk et al., Heredity, Vol. 83: 715-721,1999; Matzk F., et al., Plant Cell, 17(l):13-24, 2005). 개별적으로 작동되는 경로에서 하나의 유전자 또는 서브세트의 유전자에 의해 제어되는 개별적인 성분들이 수정능력에 부정적인 효과를 가지며(Spillane , C, Steimer A. and Grossniklaus U., Sex. Plant Reprod. Vol. 14: 179-87, 2001), 효율적으로 단위 생식을 촉진할 수 있는 것은 전체 경로를 포함한 유전자의 완전한 세트의 조화된 작용 뿐인 것으로 사료된다. 애기장대(Arabidopsis) 돌연변이체의 유전적 및 분자적 분석은 포자형성 및 배우자 형성의 단계들에서 역할을 수행하는 다수의 유전자의 식별을 가져왔다(Yang W. C. and Sundaresan V., Curr. Opin. Plant Biol. Vol. 3(1): 53-57, 2000). 애기장대의 dyad 돌연변이체는 자성 불임을 유발하는 것으로 확인되고(Siddiqi I. et al., Development, Vol. 127(1):197- 207, 2000) 그에 대한 분석은 dyad 돌연변이 식물은 자성 감수분열이 불완전하다는 것을 보여주었다. dyad 돌연변이체에서 대다수의 자성 감수 모세포(meiocyte)는 1회의 감수분열을 수행하여 4개가 아닌 2개의 세포를 생성하고, 배우자 형성을 포함한 발생의 추가적인 단계에서의 정지(arrest)로 이어진다. dyad 돌연변이체에서 웅성 감수분열, 화분 발달, 및 웅성 수정능력은 정상인 것으로 확인되었다(Siddiqi I. et al., Development, Vol. 127(l):197-207, 2000; Reddy T. V., et al., Development, Vol. 130 (24):5975-5987, 2003). 자성 감수분열 동안 감수분열 염색체의 분석은 상동 염색체가 접합(synapsis)을 수행하지 않고 염색체의 수가 감소되는 제1 감수 분열이 등수 분열(equational division)로 대체된다는 것을 보여주었다(Agashe B., Prasad C. K ., and Siddiqi L, Development, Vol. 129(16), 3935-3943, 2002). 독립적인 연구에서 DYAD 유전자와 동일한, SWII 유전자가 확인되었다(Motamayor J. C, et al., Sex. Plant Reprod. Vol. 12:209-218, 2000; Mercier R., et al., Genes and Dev. Vol. 15: 1859-1871, 2001). 이 연구들에 의해 확인된 유전자는 하기에서 DYAD 유전자로 지칭된다. 애기장대로부터 유래된 야생형 DYAD 유전자는 639개의 아미노산으로 구성된 단백질(서열번호 5)을 코딩한다. 애기장대에서 DYAD 유전자의 세 개의 대립형질이 개시되었다. 이들은: i) 508번 아미노산에서 절단(truncation)을 가져서, 야생형 단백질에 존재하는 C-말단의 130개의 아미노산이 결실된 단백질을 코딩하는 dyad; ii) 야생형 단백질의 생성량을 감소시켜, 일부 자성 감수 모세포는 등수 제1 감수 분열을 수행하고, 다른 감수 모세포들은 감소성(reductional) 분열을 수행하게 하는 것인 swil.l; 및 iii) 394번 위치에서 종결 코돈을 생성하고 dyad와 유사한 자성 표현형을 유발하고, 또한, 웅성 불임을 초래하는 웅성 감수분열의 결함을 유발하는 swil.2이다. 보에케라(Boechera)에서 dyad 대립형질에 해당하는 위치는 아미노산 서열의 508번 위치에서 프레임쉬프트(frameshift)를 유발하고 10개의 추가적인 코돈 후에(즉, 518번 위치) 종결 코돈을 초래하는 돌연변이일 것이다. 쌀에서 상응하는 위치는 각각 563번 및 572번이다.
본 발명의 임의의 이론에 구속되지 않으면서, 본 발명자들은 폴리펩티드의 카르복시-말단으로부터 394번(애기장대의 경우, 및 기타 종에서 상응하는 위치)의 부분을 갖는 DYAD 단백질의 양의 감소는 자성 감수 모세포가 등수성(equational) 제1 감수분열을 수행하여 자성 생식세포에서 자성 유전자형(및 따라서 이형접합형)의 유지를 초래하는 표현형을 생성하는 것으로 제안한다. 394번에서 508번까지의 도메인(애기 장대에서, 및 다른 종에서 상응하는 위치)을 갖는 DYAD 단백질의 정상적인 양(또는 그에 유사한 양)의 유지는 정상적인 화분 발달을 가져오나, 식물에서 이 도메인의 제거는 웅성 불임 표현형을 생성한다.
본 발명의 이전에, dyad 또는 swil.2 대립형질에 대해 동형접합인 식물체는 종자 세트(seed set)를 보이는 것으로 보고된 바 없었다. swil.l 대립형질을 갖는 식물은 동형접합인 경우 감소된 종자 세트를 보이나, 생성된 종자들은 그들의 염색체 구성에 대해 분석되어 이배체인 것으로 확인되었고, 그에 의해 종자들이 정상적인 거대포자 형성 및 거대배우자 형성으로부터 유래된다는 것을 보여주는 것으로 보고되었다 (Motamayor J. C, et al., Sex. Plant Reprod. Vol. 12:209-218, 2000). 전술된 바와 같이, dyad, swil.l, 및 swil.2에서 등수성 1회의 감수 분열의 결과로 생성된 포자는 정지된 상태로 남고 본 발명의 이전에는 이들이 자성 생식세포로 발달할 수 있는 잠재력을 갖는지 여부가 알려지지 않았다. 또한, 본 발명의 이전에는 등수성 단일 자성 감수 분열 동안 염색체들이 재조합을 경험하고, 그 결과 분열의 생성물은 부모의 이형접합성(parental heterozygocity)을 상실하는지 여부는 알려지지 않았다. 등수 분열을 동반하는 재조합의 실현가능성(plausibility)은 이배체 세포들이 감수분열에 들어가고 감수분열성 재조합(meiotic recombination)을 경험하고, 성장 배지로 이전 시 감수분열로부터 벗어나서 유사분열에 의해 분열할 수 있다는 것을 보여준 효모에서의 연구에 의해 지지된다. 그와 같은 유사분열성 분열은 재조합이 유전자와 동원체 간에 일어난 경우, 유전적 마커에 대한 이형접합성의 상실을 초래할 수 있다 (Esposito R. E. and Esposito M. S., Proc. Natl. Acad. Sci. USA Vol. 71(8): 3172-3176 1974). 본 발명은 상이한 dyad 동형접합 돌연변이체 식물에서 관찰되는 등수 제1 감수분열의 생성물이 단위 생식의 중요한 성분인 위감수분열의 특징적인 특성을 갖는, 기능성의 감소되지 않은(unreduced) 배낭을 생성할 수 있다는 발견에 관한 것이다.
본 발명은 배아 유전형이 모계 게놈의 완전한 이배체 상보체(full diploid complement of the maternal genome)를 포함하는 종자를 생산하기 위해 배우자 생성 및 종자 발달을 조작하기 위한 애기장대, 보에케라, 쌀, 포플러스(Populus) 및 기타 식물의 DYAD 유전자, 특히, 그의 돌연변이 대립형질, 및 그들의 유전자 생성물의 용도에 관한 것이다. 일 구체예에서, 애기장대 및 기타 식물 종류에서 삼배체 종자가 생성된다.
본 발명은 또한 DYAD 유전자의 돌연변이 대립형질 및 유전자 생성물을 이용하여 잡종(heterotic) 식물을 생산하는 방법을 제공한다. 일부 구체예에서, 상기 식물체 및 종자는 모계 게놈의 완전한 이배체 상보체를 포함하고, 부계 게놈으로부터의 기여를 전혀 포함하지 않으며, 따라서, 진정한 무수정체(apomict)를 나타낸다. 이 구체예들의 일부 예에서, 모계 게놈을 기여하는 식물체는 바람직한 표현형을 갖는 다양한 대립형질들을 갖는 잡종이고, 본 발명의 방법은 그와 같은 대립형질의 조합의 고정(fixation) 및 용이한 전달(propagation)을 가능하게 한다.
본 발명은 모계 게놈의 완전한 이배체 상보체를 포함하는 종자의 형성을 가져오는 DYAD 유전자 및 그의 유전자 생성물의 용도에 관한 것이다. 본 발명은 씨 없는 과실을 생산하고, 맵핑 연구를 위한 삼염색체 계통(trisomic line)을 작제하고, 부모 식물의 이형접합성 및 단위생식의 유지를 위해 이용될 수 있는 삼배체 식물의 제조를 위해 유용하다. 본 발명에서 이용되는 DYAD의 대립형질은 감소되지 않은 (이배체) 배낭의 형성을 유발한다. 본 발명은 또한 실질적으로 화분 발달에 영향을 미치지 않으면서 감소되지 않은 배낭의 형성을 유발하기 위한 DYAD 유전자의 용도에 관한 것이다. 본 발명은 또한 삼배체의 자가수분에 의해 보다 높은 배수체를 생성하기 위한 DYAD 유전자의 용도에 관한 것이고, 이는 증가된 바이오매스를 갖는 식물체를 생성하는 목적을 위해 유용할 것이다.
본 발명의 다양한 구체예들이 본 발명의 상이한 양태를 보여주며, 본 발명의 상이한 장점들을 제공할 수 있는 것으로 이해되어야 한다. 각각의 구체예가 본 발명의 모든 장점들을 갖는 것은 아니다.
정의:
구(phrase) "핵산 서열(nucleic acid sequence)"은 5' 말단으로부터 3' 말단으로 판독되는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기들의 중합체 구조를 의미한다. 이중-가닥 핵산의 경우, "핵산 서열(nucleic acid sequence)"은 나머지 한 가닥에 그의 상보체(complement)를 포함한다.
"핵산(nucleic acid)" 또는 "폴리뉴클레오티드(polynucleotide)"는 DNA 또는 RNA(또는 일부 경우에 티오포스페이트와 같은 데옥시리보뉴클레오티드 또는 리보뉴클레오티드의 유사체, 또는 PNA 유사체, 또는 뉴클레오티드 염기의 유도체를 갖는 뉴클레오티드)의 단일-가닥 또는 이중-가닥 중합체를 의미하며, 염색체 DNA, 자가복제 플라스미드, DNA 또는 RNA의 감염성 중합체(infectious polymer) 및 주로 구조적 역할을 수행하는 DNA 또는 RNA(또는 유사체)를 포함한다.
용어 "폴리뉴클레오티드 서열(polynucleotide sequence)"은 종종 "폴리뉴클레오티드"와 호환가능하나, 때때로 분자 자체보다는, 분자의 서열 정보를 의미할 수 있다.
"프로모터(promoter)"는 작동가능하게 연결된 핵산의 전사를 지시하는 핵산 조절 서열(control sequence)의 배열로 정의된다. 본 명세서에서 사용된 "식물 프로모터(plant promoter)"는 식물에서 기능하는 프로모터이다. 프로모터는 전사의 개시 부위 부근의 필요한 핵산 서열, 예를 들면, 기부 폴리머라아제(basal polymerase) II 타입 프로모터의 경우, TATA 요소를 포함한다. 프로모터는 또한 전사 개시 부위로부터 수천 염기쌍만큼 떨어져 위치할 수 있는 원위 인핸서(distal enhancer) 또는 억제자(repressor) 요소를 선택적으로 포함한다. "구성성(constitutive)" 프로모터는 대부분의 환경 및 발생 조건 하에서 활성을 갖는 프로모터이다. "유도성(inducible)" 프로모터는 환경 또는 발생 제어 하에서 활성을 갖는 프로모터이다. 용어 "작동가능하게 연결된(operably linked)"은 핵산 발현 조절 서열(예를 들면, 프로모터 또는 전사 인자 결합 부위들의 배열)과 제2 핵산 서열 간의 기능적 연결로서, 상기 발현 조절 서열은 상기 제2 서열에 상응하는 핵산의 전사를 지시하는 것인 기능적 연결을 의미한다.
"발현 카세트(expression cassette)"는 하기의 세 가지 주요한 요소를 포함한다: i) 프로모터; ii) 상기 프로모터에 작동가능하게 연결되고 상기 발현 카세트가 세포 내로 도입되는 경우 상기 프로모터에 의해 그 전사가 지시되는 것인 "코딩 폴리뉴클레오티드(coding polynucleotide)" 또는 "코딩 서열(coding sequence)"로 지칭될 수 있는 제2 폴리뉴클레오티드; 및 iii) 전사의 종료를 지시하고 상기 제2 폴리뉴클레오티드의 바로 하류에 위치하는 종결자(terminator) 폴리뉴클레오티드.
용어 "식물(plant)"은 전체 식물, 식물 기관(예를 들면, 잎, 줄기, 꽃, 뿌리, 등), 종자 및 식물 세포 및 그들의 자손(progeny)을 포함한다. 본 발명의 방법에서 이용될 수 있는 식물의 종류는 일반적으로 속씨 식물(angiosperm)(단자엽 식물 및 쌍자엽 식물), 및 겉씨 식물(gymnosperm)을 포함한, 형질전환 기법이 적용될 수 있는 고등 식물의 종류만큼 광범위하다. 이는 배수체(polyploid), 이배체(diploid) 및 반수체(haploid)를 포함한, 다양한 배수성 수준의 식물체를 포함한다. 본 발명의 일부 구체예에서, 상기 식물은 자웅동주(monoecious) 식물인 것이 바람직하다.
폴리뉴클레오티드는 상이한 서열을 가지며 외래 종으로부터 유래되거나, 또는 동일한 종으로부터 기원하나 그의 원래 형태로부터 변형된 경우, 개체에 대해 "이종기원(heterologous)"이거나 또는 제2 폴리뉴클레오티드이다. 예를 들면, 이종기원의 코딩 서열에 작동가능하게 연결된 프로모터는 상기 프로모터가 기원된 종과 상이한 종으로부터의 코딩 서열을 의미하거나, 또는 동일한 종으로부터 기원하나, 천연의 대립형질 변이체와 상이한 코딩 서열을 의미한다.
개별적인 식물에 "외생(exogenous)"인 폴리뉴클레오티드는 유성 교배(sexual cross)가 아닌 다른 수단에 의해 식물로 도입된 폴리뉴클레오티드이다. 상기 도입이 달성될 수 있는 수단의 예가 하기에서 설명되며, 아그로박테리움-매개 형질전환, 바이올리스틱(biolistic) 방법, 전기천공(electroporation) 등을 포함한다. 외생 핵산을 포함하는 식물은 본 명세서에서 R1 세대 형질전환 식물로 지칭된다. 유성 교배로부터 발생하거나 또는 자가수분(selfing)에 의해 발생한 형질전환 식물이 그와 같은 식물의 자손이다.
본 발명에서 사용된 "DYAD 핵산" 또는 "DYAD 폴리뉴클레오티드 서열"은 감수분열의 제어에 관여하는 폴리펩티드를 코딩하고 돌연변이가 발생하는 경우, 감소되지 않은 자성 배우체 형성과 관련하여 단위생식의 측면들을 가능하게 하는 핵산의 부분서열(subsequence), 또는 전장(full length) 폴리뉴클레오티드 서열이다.
"DYAD 유전자"는 숙주 세포, 바람직하게는 식물에서 DYAD 유전자 생성물의 발현을 제공하는 프로모터 및 기타 전사 및 번역 조절 서열과 함께 DYAD 핵산을 포함한다.
DYAD 유전자는 애기장대(Arabidopsis) DYAD 유전자(서열번호 1)에 의해 코딩되는 폴리펩티드와 상당한 서열 동일성(sequence identity)을 가지며 쌀(Genbank ID: 62733414) 및 기타 식물에서 확인된 폴리펩티드를 코딩하는 단백질-코딩 부분을 포함하는 전사체(transcript)를 생성하는 일련의 식물 유전자이다. DYAD 유전자는 또한 포플러스 트리코카르파(Populus trichocarpa) 및 옥수수(Zea mays)에서도 확인되었다(실시예 9). DYAD 유전자는 야생형 애기장대에 단일 카피로 존재한다. 또한, 상기 유전자는 생식 조직의 세포들 중 매우 작은 집단을 차지하는 포자 모세포에서만 발현되기 때문에 그 전사체의 존재(abundance)는 매우 낮다. 애기장대 DYAD 유전자는 감수분열시 염색체 배열(meiotic chromosome organization)에서 결정적인 역할을 수행하는 것으로 이전에 확인되었다(Agashe B., Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-39432002). 따라서, 그의 기능은 쌀에서 밀접하게 관련된 유전자의 존재에 의해 나타나는 바와 같이 다른 식물 종에서 보존될 가능성이 높다. 본 출원에 기재된 데이터는 보에케라도 서열상 애기장대 DYAD 유전자와 밀접하게 관련된 DYAD 유전자를 갖는다는 것을 확립한다.
형질전환 유전자(transgene)의 발현 및 내생(endogenous) 유전자 억제(예를 들면, RNA 간섭, 안티센스 또는 센스 억제에 의한 억제)의 경우에, 당업자(one of skill)는 사용된 폴리뉴클레오티드 서열이 그것이 유래된 유전자의 서열 또는 억제 대상 폴리뉴클레오티드의 유전자의 서열과 동일할 필요는 없으나, "실질적으로 동일(substantially identical)"한 정도일 수 있다는 것을 인식할 것이다. 하기에서 설명되는 바와 같이, 이와 같은 실질적으로 동일한 변이체는 용어 DYAD 핵산에 의해 명확하게 포괄된다.
기능 폴리펩티드(functional polypeptide)를 생성하기 위해 폴리뉴클레오티드 서열이 전사되고 번역되는 경우, 당업자는 코돈 축퇴성(codon degeneracy) 때문에 다수의 폴리뉴클레오티드 서열이 동일한 폴리펩티드를 코딩할 것이라는 것을 인식할 것이다. 이와 같은 변이체들은 용어 "DYAD 핵산"에 의해 명확하게 포괄된다. 또한, 상기 용어는 명확하게 본 명세서에 개시되고, 야생형 DYAD 폴리펩티드의 돌연변이체이거나 또는 (예를 들면, DYAD 폴리펩티드에서 아미노산의 보존적 치환으로부터 초래된) DYAD 폴리펩티드의 기능을 보유한 폴리펩티드를 코딩하는 DYAD 폴리뉴클레오티드 서열과 실질적으로 동일한(하기에서 기재된 바와 같이 결정됨) 서열들을 포함한다. 또한, 변이체들은 하기에 기재된 바와 같은 우성 음성 돌열변이체(dominant negative mutant) 및 미성숙(premature) 번역 종결을 초래하는 넌센스 돌연변이체 또는 프레임쉬프트 돌연변이체를 코딩하는 것들일 수 있다.
두 개의 핵산 또는 폴리펩티드는 하기에 기재된 바와 같이 최대로 대응(correspondence)되도록 정렬되었을 때, 두 개의 분자들에서 뉴클레오티드 또는 아미노산 잔기의 서열이 각각 동일하면, "동일(identical)"하다고 한다. 둘 이상의 핵산 또는 폴리펩티드 서열에 대해 용어 "동일한" 또는 "백분율 동일성(percent identity)"은 비교 창(comparison window)에 대해 최대로 대응되도록 정렬되어 하기의 서열 비교 알고리즘 중 하나를 이용하여 비교되거나, 또는 수동 정렬(manual alignment) 및 육안 조사(visual inspection)를 통해 측정된 경우, 동일하거나 또는 특정 백분율의 동일한 아미노산 잔기 또는 뉴클레오티드를 갖는, 둘 이상의 서열 또는 부분서열을 지칭한다. 서열 동일성의 백분율이 단백질 또는 펩티드에 대해 사용되는 경우, 동일하지 않는 잔기 위치들은 종종 아미노산 잔기가 유사한 화학성 특성(예를 들면, 전하 또는 소수성)을 갖는 다른 아미노산 잔기로 치환되어, 분자의 기능적 특성을 변화시키지 않는, 보존적 아미노산 치환에 의해서만 상이하다는 것이 인식된다. 서열들이 보존적 치환으로 상이한 경우, 백분율 서열 동일성은 치환의 보존적 속성을 보정하기 위해 상향 조정될 수 있다. 이와 같은 조정을 위한 수단들이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 통상적으로, 이는 보존적 치환을 완전한 불일치(mismatch)가 아닌 부분적 불일치로 평가하고, 그에 의해 백분율 서열 동일성을 증가시키는 것을 수반한다. 따라서, 예를 들면, 동일한 아미노산에 1점이 주어지고, 비-보존적 치환에 0점이 주어지는 경우, 보존적 치환에는 0과 1 사이의 점수가 주어진다. 보존적 치환의 평점은 예를 들면, 프로그램 PC/GENE (Intelligenetics, Mountain View, Calif., USA)에서 구현된 바와 같이, Meyers & Miller, Computer Applic. Biol. Sci. 4:11-17 (1988)의 알고리즘에 따라 계산된다.
두 개의 핵산 또는 폴리펩티드에서, 구 "실질적으로 동일한(substantially identical)"은 비교 창에 대해 최대로 대응되도록 정렬되어 하기의 서열 비교 알고리즘 중 하나를 이용하여 비교되거나, 또는 수동 정렬 및 육안 조사를 통해 측정된 경우, 60% 이상, 바람직하게는 80%, 가장 바람직하게는 90-95%의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 서열 또는 부분서열을 지칭한다. 이 정의는 또한 테스트 서열이 기준 서열(reference sequence)에 대해 실질적 동일성을 갖는 경우 실질적인 서열 또는 부분서열 상동성(complementarity)을 갖는, 테스트 서열의 상동체를 의미한다.
서열 비교를 위해, 일반적으로 하나의 서열이 기준 서열로 작용하며, 이에 대해 테스트 서열이 비교된다. 서열 비교 알고리즘을 사용하는 경우, 테스트 서열과 기준 서열이 컴퓨터에 입력되고, 필요한 경우, 부분서열 위치(coordinate)가 지정되고, 서열 알고리즘 프로그램 파라미터들이 지정된다. 프로그램 파라미터에 대한 디폴트(default) 값들이 일반적으로 이용되나, 파라미터에 대한 대안적인 값들이 지정될 수 있다. 그 후, 서열 비교 알고리즘은 프로그램 파라미터에 근거하여, 기준 서열 대비 테스트 서열에 대한 백분율 서열 동일성을 계산한다.
본 명세서에서 사용된 "비교 창(comparison window)"은 두 개의 서열이 최적으로 정렬된 후 동일한 수의 연속된 위치들의 기준 서열에 대해 하나의 서열이 비교되는 것인, 통상적으로 20 내지 600개, 일반적으로 약 50개 내지 약 200개, 보다 일반적으로 약 100개 내지 약 150개의 연속된 위치들의 세그먼트를 포함한다. 비교를 위한 서열의 정렬 방법은 본 발명이 속하는 기술 분야에서 잘 알려져 있다. 비교를 위한 서열의 최적 정렬은 예를 들면, Smith & Waterman, Adv. Appl. Math. 2:482 (1981)의 국소 상동성 알고리즘(local homology algorithm), Needleman & Wunsch, J. Mol. Biol. 48:443 (1970)의 상동성 배열 알고리즘(homology alignment algorithm), Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85:2444 (1988)의 유사성 탐색 방법, 이 알고리즘들(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.)의 전산화 구현(computerized implementation) 또는 수동 정렬 및 육안 조사에 의해 수행될 수 있다.
일반적인 알고리즘의 일 예는 PILEUP이다. PILEUP는 관계와 백분율 서열 동일성을 보여주기 위해 점진적인 쌍대 정렬(progressive, pairwise alignement)을 이용하여 관련 서열들의 군으로부터 복수 개의 서열 정렬을 생성한다. PILEUP는 또한 정렬을 생성하기 위해 이용된 클러스터링 관계(clustering relationship)를 보여주는 트리(tree) 또는 덴도그램(dendogram)을 작성한다. PILEUP는 Feng D. F., & Doolittle, R.F., J. Mol. Evol. Vol. 35:351-360 (1987)의 점진적 정렬 방법의 단순화를 이용한다. 이용된 방법은 Higgins & Sharp, CABIOS 5:151-153 (1989)에 의해 설명된 방법과 유사하다. 상기 프로그램은 각각 5,000개의 뉴클레오티드 또는 아미노산으로 구성된 최대 길이를 갖는, 300개까지의 서열을 정렬시킬 수 있다. 다중 정렬 절차는 두 개의 가장 유사한 서열들의 정렬로 개시되어, 두 개의 정렬된 서열들의 클러스터를 생성한다. 그 후, 이 클러스터는 그 다음 가장 관련된 서열 또는 정렬된 서열의 클러스터에 정렬된다. 두 개의 서열 클러스터는 두 개의 개별적인 서열의 쌍대 정렬의 단순한 확장에 의해 정렬된다. 최종 정렬은 일련의 점진적, 쌍대 정렬에 의해 달성된다. 상기 프로그램은 서열 비교를 위한 영역에 특정한 서열 및 그들의 아미노산 또는 뉴클레오티드 위치를 지정하고, 프로그램 파라미터를 지정하는 것에 의해 실행된다. 예를 들면, 하기의 파라미터를 이용하여 백분율 서열 동일성 관계를 결정하기 위해 기준 서열이 다른 테스트 서열에 비교될 수 있다: 디폴트 갭 가중치(default gap weight)(3.00), 디폴트 갭 길이 가중치(default gap length weight)(0.10), 및 가중된 말단 갭(weighted end gap).
백분율 서열 동일성 및 서열 유사성을 결정하기 위해 적합한 알고리즘의 또 다른 예는 Altschul S.F., et al., J. Mol. Biol. Vol. 215: 403-410 (1990)에 기재된, BLAST 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/)로부터 입수가능하다. 이 알고리즘은 먼저 데이터베이스 서열 내의 동일한 길이의 단어와 정렬되었을 때, 특정한 양의 값을 갖는 역치(threshold) 점수 T와 일치하거나, 또는 이를 만족시키는, 질의 서열(query sequence)에서 길이 W의 짧은 단어를 식별하는 것에 의해 높은 점수의 서열쌍(high scoring sequence pair: HSP)을 식별하는 단계를 포함한다. T는 인접 단어 점수 역치(neighborhood word score threshold)로 지칭된다(Altschul S. F., et al., J. Mol. Biol. Vol. 215: 403- 410 (1990).). 이와 같은 초기의 인접 단어 히트(neighborhood word hit)는 그들을 포함하는 보다 긴 HSP를 찾기 위한 검색을 개시하는 시드(seed)로 작용한다. 단어 히트는 누적 정렬 점수(cumulative alignment score)가 증가될 수 있는 한, 각 서열을 따라 양 방향으로 확장된다. 각 방향으로의 단어 히트의 확장은 누적 정렬 점수가 그의 최대 달성 값으로부터 양 X 만큼 감소되거나; 누점 점수가 하나 이상의 음의 점수 잔기 정렬의 누적 때문에 0 이하가 되거나; 또는 각 서열의 말단에 도달하는 경우, 중단된다. BLAST 알고리즘 파라미터 W, T, 및 X는 정렬의 민감도(sensitivity) 및 속도를 결정한다. BLAST 프로그램은 11의 단어 길이(W), 50의 BLOSUM62 평가 매트릭스(see Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1989)) 정렬(B), 10의 기대값(E), M=5, N=-4, 및 양 가닥의 비교를 디폴트로 이용한다.
BLAST 알고리즘은 또한 두 개의 서열 간의 유사성의 통계적 분석을 수행한다(예를 들면, Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5787 (1993) 참조). BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 두 개의 뉴클레오티드 또는 아미노산 서열 간의 일치(match)가 우연에 의해 일어날 확률의 지표를 제공하는, 최소 합 확률(smallest sum probability)(P(N))이다. 예를 들면, 핵산은 테스트 핵산과 기준 핵산의 비교에서 최소 합 확률이 약 0.2보다 작고, 보다 바랍직하게는 약 0.01보다 작고, 가장 바람직하게는 약 0.001보다 작은 경우 기준 서열에 유사한 것으로 간주된다.
"보존적으로 변형된 변이체(conservatively modified variant)"는 아미노산 및 핵산 서열 모두에 적용된다. 특정한 핵산 서열에 대해, 보존적으로 변형된 변이체는 동일하거나 또는 본질적으로 동일한 아미노산 서열을 코딩하는 핵산을 의미하거나, 또는 핵산이 아미노산 서열을 코딩하지 않는 경우, 본질적으로 동일한 서열을 의미한다. 유전자 코드의 축퇴성 때문에, 다수의 기능적으로 동일한 핵산이 임의의 주어진 단백질을 코딩한다. 예를 들면, 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산인 알라닌을 코딩한다. 따라서, 알라닌이 하나의 코돈에 의해 특정된 모든 위치에서, 상기 코돈은 코딩된 폴리펩티드를 변경시키지 않으면서 기재된 상응하는 코돈 중 하나로 변경될 수 있다. 그와 같은 핵산 변이는 보존적으로 변형된 변이의 일종인 "침묵 변이(silent variation)"이다. 폴리펩티드를 코딩하는 모든 핵산 서열은 또한 핵산의 모든 가능한 침묵 변이를 기술한다. 당업자는 핵산에서 각 코돈(정상적으로 메티오닌에 대한 유일한 코돈인, AUG 제외)은 기능적으로 동일한 분자를 생성하기 위해 변형될 수 있다는 것을 이해할 것이다. 따라서, 폴리펩티드를 코딩하는 핵산의 침묵 변이체 각각은 각각의 기재된 서열에 내재된다.
"본질적으로 동일한 서열(essentially identical sequence)"은 서열의 변이가 분자의 의도된 기능에 영향을 미치지 않는 서열이다.
아미노산 서열에 대해, 당업자는 코딩된 서열에서 하나의 아미노산 또는 낮은 비율의 아미노산을 변형시키거나, 첨가하거나 또는 결실시키는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 개별적인 치환, 결실 또는 첨가는 그 변경이 아미노산의 화학적으로 유사한 아미노산에 의한 치환을 초래하는 경우, "보존적으로 변형된 변이체(conservatively modified variant)"라는 것을 인식할 것이다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표(conservative substitution table)이 본 발명이 속하는 기술 분야에서 잘 알려져 있다.
하기의 여섯 개의 그룹 각각은 상호 간에 보존적 치환인 아미노산들을 포함한다:
1) 알라닌(A), 세린(S), 쓰레오닌(T);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 라이신(K);
5) 이소루이신(I), 루이신(L), 메티오닌(M), 발린(V); 및
6) 페닐알라닌(F), 티로신(Y), 트립토판(W). (예를 들면, Creighton, Proteins (1984) 참조).
두 개의 핵산 서열 또는 폴리펩티드가 실질적으로 동일하다는 표시는 제1 핵산에 의해 코딩된 폴리펩티드가 제2 핵산에 의해 코딩된 폴리펩티드에 대해 생성된 항체에 면역학적으로 교차 반응한다는 것이다. 따라서, 폴리펩티드는 일반적으로, 예를 들면, 두 개의 펩티드가 보존적 치환에 의해서만 상이한 경우, 제2 폴리펩티드와 실질적으로 동일하다. 두 개의 핵산이 실질적으로 동일하다는 또 다른 표시는 두 개의 분자 또는 그들의 상보체들이 하기에 기재된 바와 같은 엄격한(stringent) 조건 하에서 상호 간에 혼성화된다는 것이다.
구 "선택적으로(또는 특이적으로) 혼성화한다(selectively (or specifically) hybridizes to)"는 서열이 복잡한 혼합물(예를 들면, 전체 세포 또는 라이브러리 DNA 또는 RNA)에 존재하는 경우, 엄격한 혼성화 조건 하에서 하나의 분자가 특정한 뉴클레오티드 서열에만 결합하거나, 듀플렉스(duplex)를 형성하거나 또는 혼성화하는 것을 의미한다.
구 "엄격한 혼성화 조건(stringent hybridization condition)"은 프로브가 통상적으로 핵산의 복잡한 혼합물에서 다른 서열에는 혼성화되지 않고, 그의 표적 부분서열에 혼성화되는 조건을 의미한다. 엄격한 조건은 서열-의존적이며, 상이한 상황에서 다를 것이다. 보다 긴 서열은 보다 높은 온도에서 특이적으로 혼성화된다. 핵산의 혼성화에 대한 상세한 안내는 Tijssen, Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Probes, "Overview of principles of hybridization and the strategy of nucleic acid assays", Elsevier (1993)에서 찾을 수 있다. 일반적으로, 높은 엄격성 조건(highly stringent condition)은 정의된 이온 강도 및 pH에서 특정한 서열에 대한 용융점(Tm)보다 약 5-10 ℃ 낮게 선택된다. 낮은 엄격성 조건(low stringency condition)은 일반적으로 Tm보다 약 15-30℃ 낮게 선택된다. Tm은 (정의된 이온 강도, pH 및 핵산 농도 하에서) 평형 상태에서 표적에 상보적인 프로브의 50%가 표적 서열에 혼성화되는 온도(표적 서열은 과량으로 존재하기 때문에, Tm에서, 평형 상태에서 50%의 프로브가 차지됨)이다. 엄격한 조건은 pH 7.0 내지 8.3에서 염 농도가 약 1.0M 소디움 이온 미만이고, 일반적으로 약 0.01 내지 1.0M 소디움 이온 농도(또는 다른 염)이며, 온도는 짧은 프로브(예를 들면, 10 내지 50개의 뉴클레오티드로 구성)의 경우 약 30 ℃이상이고, 긴 프로브(예를 들면, 50개보다 많은 수의 뉴클레오티드로 구성)의 경우 60 ℃이상인 조건일 것이다. 엄격한 조건은 또한 포름아미드와 같은 불안정화제의 첨가에 의해 달성될 수 있다. 선택적 또는 특이적 혼성화를 위해, 양성 신호는 배경 혼성화(background hybridization)의 2배 이상이고, 바람직하게는 배경 혼성화의 10배이다.
엄격한 조건 하에서 상호 간에 혼성화하지 않는 핵산은 그들이 코딩하는 폴리펩티드가 실질적으로 동일한 경우, 여전히 실질적으로 동일하다. 이는 예를 들면, 유전자 코드에 의해 허용되는 최대 코돈 축퇴성을 이용하여 한 카피의 핵산이 생성된 경우 발생한다. 그와 같은 경우에, 핵산은 일반적으로 적당하게 엄격한(moderately stringent) 혼성화 조건 하에서 혼성화한다.
본 발명에서, 사용될 DYAD 핵산을 포함하는 게놈 DNA 또는 cDNA는 본 명세서에 개시된 핵산 서열을 이용하여 엄격한 조건 하에서 표준 서던 블롯(Southern blot)으로 확인될 수 있다. 본 발명의 개시 목적으로, 그와 같은 혼성화를 위해 적합한 엄격한 조건은 37 ℃에서 40% 포름아미드, 1M NaCl, 1% SDS를 포함하는 완충액에서의 혼성화 및 약 50 ℃ 이상, 통상적으로 약 55 ℃, 최대 약 60 ℃의 온도에서 20분 동안 0.1X 내지 1X SSC, 바람직하게는 0.5X SSC, 보다 바람직하게는 0.2X SSC에 의한 1회 이상의 세척을 포함하는 조건 또는 그와 동등한 조건이다. 양성 혼성화(positive hybridization)는 배경 혼성화의 두 배 이상이다. 당업자는 유사한 엄격성 조건을 제공하기 위해 대안적인 혼성화 및 세척 조건이 이용될 수 있다는 것을 용이하게 인식할 것이다.
두 개의 폴리뉴클레오티드가 실질적으로 동일하다는 또 다른 표시는 한 쌍의 올리고뉴클레오티드 프라이머에 의해 증폭된, 기준 서열이 cDNA 또는 게놈 라이브러리로부터 테스트 서열을 분리하거나 또는 예를 들면, 노던 블롯 또는 서던 블롯으로 테스트 서열을 확인하기 위한 엄격한 혼성화 조건에서 프로브로 이용될 수 있는 경우이다.
"식물 잡종(plant hybrid)"은 동일한 식물 종의 두 품종을 교배하여 수득된 식물로 정의된다.
"종간 잡종(interspecific hybrid)"은 상이한 종의 두 식물체를 교배하여 수득된 식물로 정의된다.
생식 사건(reproductive event)에서 "자성 부모(female parent)"는 종자를 형성하는 식물로 정의된다.
본 발명은 DYAD 유전자 및 그의 생성물 및 종자 발달과 단위생식의 제어를 위한 분자 유전학적 방식의 적용을 포함하는 방법에 관한 것이다. 본 발명은 또한 원형 단백질(native protein)의 C-말단 부분이 결핍된 DYAD 폴리펩티드의 절단형(truncated form)을 발현하고, 화분 생존력 분석(pollen viability assay) 및 웅성 감수분열에서 염색체 분리의 현미경 관찰에 의해 결정되는 바와 같이 화분 발달은 실질적으로 변화되지 않게 유지하면서, 감소되지 않은 자성 배우체의 발생을 유발하는, DYAD 유전자의 돌연변이체 대립형질에 관한 것이다. 본 발명은 또한 원형 DYAD 폴리펩티드의 C-말단 부분이 결핍된 DYAD 폴리펩티드를 코딩하는 DYAD 유전자의 자성-특이적 돌연변이 대립형질로서, 식물에서 상기 돌연변이 폴리펩티드의 발현은 감소되지 않은 자성 배우체 발생을 초래하나, 화분 발달에는 실질적으로 영향을 미치지 않는 것인 DYAD 유전자의 자성-특이적 돌연변이 대립형질에 관한 것이다. 그와 같은 돌연변이 대립형질은 예를 들면, 애기장대로부터의 돌연변이 대립형질의 경우, 서열번호 5의 원형 폴리펩티드 서열의 509번 아미노산 내지 639번 아미노산 부분의 전체 또는 일부가 결핍되나, 394번 아미노산까지의 폴리펩티드 서열을 코딩하는 모든 영역을 포함하는 DYAD 폴리펩티드를 발현한다. 또한, 본 발명은 엄격한 조건 하에서 서열번호 4의 서열에 혼성화되고, 원형의 DYAD 폴리펩티드의 C-말단 결실 유도체를 코딩하고, 상기 결실은 비교 창을 이용한 서열번호 5와의 비교에 의해 결정된, 서열번호 5의 509번 아미노산 내지 639번 아미노산의 영역에 해당하는 것인 뉴클레오티드 서열을 제공한다. 보에케라, 쌀, 및 포플러 DYAD 단백질의 상응하는 부분들이 도 11을 참조하여 확인될 수 있다. 본 발명의 조성물은 또한 원형 DYAD 폴리펩티드 서열의 C-말단 결실 유도체, 및 전술된 DYAD 폴리펩티드 및 단백질 서열, 예를 들면, 융합 단백질을 조건부로 식물 세포의 핵으로 수송하는 글루코코르티코이드 호르몬 수용체 단백질로부터 형성된 융합 단백질, 및 그들을 코딩하는 핵산을 포함한다.
본 발명의 방법은 부모의 유전형을 유지하는 감소되지 않는 자성 생식 세포를 생성하기 위해 식물에서 DYAD 폴리뉴클레오티드 서열의 발현을 포함한다. 그와 같은 감소되지 않은 자성 생식세포의 생성은 단위생식을 도입하고 잡종강세(heterosis)를 고정하기 위해, 및 삼배체 식물을 생성하기 위해 유용하다. 본 발명의 일 구체예에서, DYAD 폴리뉴클레오티드 서열은 여러 공지된 형질전환 방법 중 하나에 의해 식물의 게놈으로 도입될 수 있고, 상기 서열은 상기 식물에서 안티센스 또는 이중가닥 RNA로 발현되어, 내생 DYAD 유전자의 억제를 초래하고 감소되지 않는 자성 생식세포의 생성을 유발한다. 본 발명의 또 다른 구체예에서, DYAD 폴리뉴클레오티드 서열의 C-말단 결실이 발현 카세트의 일부로서 식물의 게놈으로 도입되어, 감소되지 않은 자성 배우체의 형성을 초래하고, 동시에 화분의 발달은 실질적으로 영향받지 않은 상태로 유지한다. 그 후, 식물에서 감소되지 않은 자성 배우체 형성을 초래하는 DYAD 폴리뉴클레오티드 서열의 발현은 단위생식에 의한 난 세포의 배아로의 발달에 의해 무성생식 종자(apomictic seed)를 생성하기 위해 이용될 수 있다. 식물 잡종에서 그와 같은 DYAD 폴리뉴클레오티드 서열의 발현은 부모의 유전형을 보유한 감소되지 않은 자성 생식세포의 형성을 초래하고, 그에 의해 다음 세대에서 잡종강세의 고정을 가져온다. 잡종강세의 고정은 두 개의 상이한 유전형의 부모 품종 간의 교배에 의존하지 않고 자가수분에 의해 잡종 종자의 조작을 가능하게 하기 때문에 매우 유용하다.
본 발명의 또 다른 구체예는 무성생식 종자를 생성하기 위해 이용될 수 있는, 감소되지 않는 자성 생식세포의 형성을 가져오는 식물 종의 종간 잡종에서 DYAD 폴리뉴클레오티드 서열의 발현이다. 그와 같은 무성생식 종자의 생성은 하나의 식물종으로부터 또 다른 식물 종으로 농업적으로 유용한 유전자를 이입(introgress)하기에 유용하다. 본 발명의 또 다른 구체예는 DYAD 폴리뉴클레오티드 서열 또는 DYAD 폴리펩티드 서열의 조건부 또는 제어 발현 및/또는 그들의 활성을 포함한다. 그와 같은 조건부 발현은 필요한 경우에만, 감소되지 않는 자성 생식세포의 생성 및 따라서, 무성생식 종자의 생성을 촉진하기 위해 이용될 수 있다. 식물에서 폴리뉴클레오티드 및 폴리펩티드 서열의 조건부 발현 또는 활성을 실현하는 방법은 본 발명이 속하는 기술 분야에서 잘 알려져 있고 에탄올 유도성 유전자 발현(Devaux et al., Plant J., Vol. 36(6): 918-930 ,2003), 활성의 스테로이드 호르몬 유도성 조절(Schena M., Lloyd A. M. and Davis R. W., Proc. Natl. Acad. Sci. USA Vol. 88(23): 10421-10425, 1991), 및 발현의 테트라시클린 매개 조절(Bohner S. et al., Plant J. Vol. 9(1): 87-95, 1999)을 포함하나, 이에 한정되지 않는다.
하기의 실시예 6은 dyad 돌연변이 표현형을 보이는 식물의 동질적 집단이 개발될 수 있는 것인 본 발명의 일 구체예를 설명한다. DYAD RNAi 또는 안티센스 작제물이 조건부 프로모터의 제어 하에 발현되는 것인 조건부 DYAD RNAi 또는 안티센스를 이용하는 것에 의해 동일한 것이 달성될 수 있다. 본 발명의 또 다른 표현은 식물에서 DYAD 유전자의 상보성 카피가 dyad의 돌연변이 대립형질에 대해 동형접합인 유전적 배경에서, 조건부 프로모터의 제어 하에 발현되는 것이다. 본 발명의 또 다른 표현은 트랜스활성자(transactivator)의 제어 하에 발현되는 프로모터의 제어 하에 발현되는 DYAD RNAi 또는 안티센스 작제물을 가지며, 트랜스활성자가 결여된 것인 제1 식물을 상기 트랜스활성자를 발현하는 제2 식물과 교배시키는 것을 이용한다.
본 명세서에 기재된 바와 같이 제조된 분리된 서열이 다수의 기법에서, 예를 들면, 내생 DYAD 유전자 발현을 억제 또는 변경하기 위해 이용될 수 있다. 식물에서 DYAD 유전자 발현 또는 DYAD 활성의 조절은 예를 들면, 무성생식 종자를 생성하기 위한 시스템의 일부로 특히 유용하다.
DYAD
핵산의 분리
일반적으로, 하기에 기재된 재조합 DNA 기법에서 명명법 및 실험 방법(laboratory procedure)은 본 발명이 속하는 기술 분야에서 잘 알려지고 통상적으로 이용되는 것들이다. 클로닝, DNA 및 RNA 분리, 증폭 및 정제를 위한 표준 기법들이 사용된다. 일반적으로 DNA 리가아제, DNA 폴리머라아제, 제한효소(restriction endonuclease) 등을 포함하는 효소 반응은 제조사의 설명서에 따라 수행된다. 이 기법들 및 기타 다양한 기법들이 일반적으로 Sambrook et al., Molecular Cloning-A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N. Y., (1989)에 따라 수행된다.
DYAD 핵산의 분리가 다수의 기법에 의해 이루어질 수 있다. 예를 들면, 본 명세서에 개시된 서열에 근거한 올리고뉴클레오티드 프로브가 cDNA 또는 게놈 DNA 라이브러리에서 원하는 유전자를 식별하기 위해 이용될 수 있다. 게놈 라이브러리를 구축하기 위해, 예를 들면, 제한효소를 이용한 무작위 단편화(random fragmentation)에 의해 게놈 DNA의 큰 세그먼트들이 생성되고, 적합한 벡터로 패키징될 수 있는 직렬연쇄체(concatamer)를 형성하기 위해 벡터 DNA에 라이게이션된다. cDNA 라이브러리를 제조하기 위해, 원하는 조직, 예를 들면, 배주로부터 mRNA를 분리하고, 상기 mRNA로부터 DYAD 유전자 전사체를 포함하는 cDNA 라이브러리를 제조한다.. 대안적으로, cDNA는 DYAD 유전자 또는 그 상동체(homolog)가 발현되는 다른 조직으로부터 추출된 mRNA로부터 제조될 수 있다.
그 후, 본 명세서에 개시된 크로닝된 DYAD 유전자의 서열에 근거한 프로브를 이용하여 cDNA 또는 게놈 라이브러리가 스크리닝될 수 있다. 프로브는 동일한 식물 종 또는 상이한 식물 종에서 상동 유전자를 분리하기 위해 게놈 DNA 또는 cDNA 서열과 혼성화하기 위해 이용될 수 있다. 대안적으로, DYAD 폴리펩티드에 대해 형성된 항체가 mRNA 발현 라이브러리를 스크리닝하기 위해 이용될 수 있다.
대안적으로, 대상이 되는 핵산이 증폭 기법을 이용하여 핵산 시료로부터 증폭될 수 있다. 예를 들면, 중합효소 연쇄 반응(PCR) 기술이 게놈 DNA, cDNA, 게놈 라이브러리 또는 cDNA 라이브러리로부터 직접 DYAD 유전자의 서열을 증폭하기 위해 이용될 수 있다. PCR 및 기타 인 비트로 증폭 방법은 또한 예를 들면, 발현될 단백질을 코딩하는 핵산 서열을 클로닝하거나, 시료에서 원하는 mRNA의 존재를 검출하기 위한 프로브로서 이용될 핵산을 제조하거나, 핵산의 서열을 결정하거나 또는 다른 목적을 위해 유용할 수 있다. PCR의 전반적인 개요의 경우, PCR Protocols: A Guide to Methods and Applications. (Innis, M, Gelfand, D., Sninsky, J. and White, T., eds.), Academic Press, San Diego (1990)을 참조한다.
식물 조직으로부터 DYAD 서열을 식별하기 위해 적합한 프라이머 및 프로브는 본 명세서에 제공된 서열들과 다른 DYAD 관련 유전자 또는 그들이 코딩하는 단백질의 비교로부터 생성될 수 있다. 예를 들면, 보에케라 홀보엘리(Boechera holboelli) DYAD는 쌀로부터 유래된 밀접하게 관련된 유전자(Genbank ID No. 50917243)와 비교될 수 있다. 이 기법들을 이용하여, 당업자는 적합한 프라이머 및 프로브 서열을 제조하기 위해 본 명세서에 개시된 유전자 또는 폴리펩티드에서 보존된 영역을 확인할 수 있다. DYAD 관련 유전자에서 보존된 영역에 특이적으로 혼성화하는 프라이머가 광범위하게 다양한 식물종들로부터 서열을 증폭시키기 위해 이용될 수 있다. 전술된 조건을 이용한 표준 핵산 혼성화 기법이 전장 cDNA 또는 게놈 클론을 확인하기 위해 이용될 수 있다.
DYAD
활성 또는 유전자 발현의 조절
DYAD 유전자는 자성 배우체의 감수분열 및 배수성을 조절하는데 관여하기 때문에, 내생 DYAD 활성 또는 유전자 발현의 억제는 다수의 상황에서 유용하다. 예를 들면, 전술된 바와 같은 C-말단 결실을 갖는 대립형질의 사용에 의한 DYAD 발현의 억제 또는 DYAD 활성의 변경이 종자를 갖지 않거나(absent) 또는 작은/퇴행된 종자를 갖는 과실("씨 없는 과실(seedless fruit)"로 지칭됨)의 생성을 위해 이용될 수 있다. 대부분의 식물 종에서, 삼배체의 형성은 감수분열에서 염색체의 불균형 분리(unbalanced segregation) 때문에 배아세포(germ cell)의 형성에서 결함을 유발하고 종자의 부재 또는 작은/퇴행된 종자의 형성을 초래한다. 내생 DYAD 발현 또는 활성의 억제는 배수성의 조절을 가능하게 한다. 따라서, DYAD 활성이 억제되거나 변형된 본 발명의 식물의 일부 구체예에서, 종자가 존재하지 않거나 퇴행되고 씨없는 과실이 생성된다.
본 발명의 핵산의 또 다른 용도는 단위생식 식물 계통(apomictic plant line)(즉, 배주에서 무성생식 과정이 일어나는 것인 식물, 단위생식의 검토를 위해 KolrunowA., Plant Cell, Vol.5: 1425-1437 (1993) 참조)의 개발에 있다. 단위생식은 전통적인 육종에 의해 용이하게 유지될 수 없는 복잡한 이종접합형 유전형을 선택하고 고정시키기 위한 신규한 수단을 제공한다. 따라서, 예를 들면, 원하는 특성(예를 들면, 잡종강세)을 갖는 신규한 잡종 계통이 수득되어 용이하게 유지될 수 있다.
본 발명이 속하는 기술 분야의 당업자는 DYAD 활성 또는 유전자 발현을 조정하기 위해 다수의 방법이 이용될 수 있다는 것을 인식할 것이다. 식물 세포에서 DYAD 활성은 유전자, 전사, 전사후, 번역, 또는 번역후 수준에서 조정될 수 있다. 이와 같은 각 수준에서 DYAD 활성을 조정하는 기법은 일반적으로 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있고 일부는 하기에서 간략하게 논의된다.
식물 유전자에 유전적 돌연변이를 도입하는 방법은 잘 알려져 있다. 예를 들면, 종자 또는 기타 식물 물질이 표준 기법에 따라, 돌연변이 유발성(mutagenic) 화학물질로 처리될 수 있다. 그와 같은 화학 물질은 하기를 포함하나, 이에 한정되지 않는다: 디에틸 술페이트, 에틸렌 이민, 에틸 메탄술포네이트 및 N-니트로소-N-에틸우레아. 대안적으로, 예를 들면, X-선, 감마선, 또는 고속 중성자(fast neutron)와 같은 공급원으로부터의 이온화 방사선이 이용될 수 있다. DYAD 뉴클레오티드 서열을 증폭하는 PCR 프라이머를 이용하여 돌연변이가 유발된 식물의 합쳐진 집단의 분자 스크리닝 및 뒤이은 DYAD 폴리뉴클레오티드 서열에 유전적 돌연변이를 갖는 식물을 확인하기 위한 PCR 산물의 분석에 의해 DYAD 유전자 서열에 돌연변이를 갖는 식물체가 식별될 수 있다. 특정한 유전자 서열에 돌연변이를 갖는 식물을 스크리닝하고 식별하는 방법이 개시되었다(Henikoff S., Bradley T. J. and Comai L., Plant Physiol. Vol. 135(2): 630-636, 2004).
대안적으로, 인 비보에서 DYAD 유전자를 특이적으로 결실시키거나 또는 변경시키는 것에 의해 표적화된 유전자 파괴(targeted gene disruption)를 유도하기 위해 상동성 재조합(homologous recombination)이 이용될 수 있다(일반적으로, Grewal and Klar, Genetics 146: 1221-1238 (1997) 및 Xu et al., Genes Dev. 10: 2411-2422 (1996) 참조). 식물에서 상동성 재조합이 입증되었다(Puchta et al., Experientia 50: 277-284 (1994), Swoboda et al., EMBO J. 13: 484-489 (1994); Offringa et al., Proc. Natl. Acad. Sci. USA 90: 7346-7350 (1993); 및 Kempin et al. Nature 389:802-803 (1997)).
상동성 재조합 기술을 본 발명의 유전자에 적용하는 경우, 본 명세서에 개시된 돌연변이와 같은, DYAD 유전자 서열의 선택된 부분(5'-상류, 3'-하류, 및 유전자내(intragenic) 영역 포함)에 있는 돌연변이가 인 비트로로 제조되고 표준 기법을 이용하여 원하는 식물에 도입된다. 상동성 재조합의 효율성은 사용된 벡터에 의존적인 것으로 알려져 있기 때문에, Mountford et al. Proc. Natl. Acad. Sci. USA 91: 4303-4307 (1994); 및 Vaulont et al. Transgenic Res. 4: 247-255 (1995)에 기재된 바와 같은, 디시스트론성 유전자 표적 벡터(dicistronic gene targeting vector)의 이용이 형질전환 식물에서 변경된 DYAD 유전자 발현을 선택하는 효율성을 증가시키기 위해 편리하게 이용된다. 돌연변이된 유전자는 형질전환 식물 세포에서 야생형 유전자의 상동성 재조합 및 표적화된 치환이 일어나, DYAD 활성의 억제를 초래하는 방식으로 표적 야생형 유전자와 상호작용한다.
대안적으로, 양 말단에 이중 헤어핀 캡(double hairpin cap)을 갖는 듀플렉스 구조인 RNA 및 DNA 잔기의 연속된 부분(contiguous stretch)으로 구성된 올리고뉴클레오티드가 이용될 수 있다. RNA/DNA 서열은 표적 DYAD의 서열과 정렬되고, 원하는 뉴클레오티드 변화를 포함하도록 설계된다. 염색체 외부에 존재하는(extrachromosomal) T-DNA 플라스미드로의 키메라 올리고뉴클레오티드(chimeric oligonucleotide)의 도입은 소수의 형질전환된 식물 세포에서 키메라 분자에 의해 주도되는 효율적이고 특이적인 DYAD 유전자 전환(conversion)을 초래한다. 이 방법은 Cole-Strauss et al. Science 273:1386-1389 (1996) 및 Yoon et al. Proc. Natl. Acad. Sci. USA 93: 2071-2076 (1996)에 기재된다.
식물 세포를 트랜스포손(transposon) 또는 T-DNA 서열을 포함하는 작제물로 형질전환시키는 것에 의해 재조합 DNA 기법을 이용하여 유전자 발현을 불활성화시킬 수 있다. 이 방법에 의해 제조된 DYAD 돌연변이체는 표준 기법에 따라 식별된다. 예를 들면, PCR에 의해 또는 노던 블롯 또는 역전사 및 뒤이은 PCR(RT-PCR)에 의해 DYAD mRNA의 존재 또는 부재를 검출하는 것에 의해 돌연변이체가 검출될 수 있다. 돌연변이체는 또한 수정능력(fertility), 자성 감수분열, 및 거대포자 발달의 변경에 대해 분석하는 것에 의해 선택될 수 있다.
본 명세서에 기재된 바와 같이 제조된 분리된 핵산 서열은 또한 다양한 수준에서 내생 DYAD 유전자 발현을 조절하기 위한 다수의 기법에서 이용될 수 있다. 본 명세서에 개시된 서열로부터의 부분서열이 전사, RNA 축적, 번역, 등을 조절하기 위해 이용될 수 있다.
식물에서 유전자 발현을 억제하기 위해 다수의 방법들이 이용될 수 있다. 예를 들면, RNA 간섭(RNAi) 기술이 편리하게 이용될 수 있다. 이를 달성하기 위해, 원하는 유전자로부터의 핵산 세그먼트가, 두 개의 카피가 통상적으로 5 내지 2000개의 뉴클레오티드로 구성된 길이, 바람직하게는 30 내지 500개의 뉴클레오티드로 구성된 길이, 및 보다 바람직하게는 50 내지 200개의 뉴클레오티드로 구성된 길이일 수 있는 스페이서에 의해 분리된 것인 역위 반복부(inverted repead)로서 클로닝된다. 상기 역위 반복부는 두 카피가 모두 전사되어 그 길이 전체 또는 일부에 걸쳐 자가-상보성(self-complementary)인 RNA 종을 생성하도록 프로모터 및 이어진 종결자(terminator)에 작동가능하게 연결된다. 그 후, 상기 작제물은 식물로 형질전환되고 이중가닥 RNA가 생성된다.
또 다른 예로서, DYAD 유전자 발현을 억제하기 위해 안티센스 기법이 편리하게 이용될 수 있다. 이를 달성하기 위해, 원하는 유전자로부터의 핵산 세그먼트가 클로닝되고 RNA의 안티센스 가닥이 전사되도록 프로모터에 작동가능하게 연결된다. 그 후, 상기 작제물이 식물로 형질전환되고, RNA의 안티센스 가닥이 생성된다. 식물 세포에서, RNA 번역의 억제(Bourque Plant Sci. (Limerick) 105: 125-149 (1995); Pantopoulos In Progress in Nucleic Acid Research and Molecular Biology, Vol. 48. Cohn, W. E. and K. Moldave (Ed.). Academic Press, Inc.: San Diego, Calif., USA; London, England, UK. p. 181-238; Heiser et al. Plant Sci. (Shannon) 127: 61-69 (1997) 참조) 및 대상 단백질을 코딩하는 mRNA의 축적의 방지, (Baulcombe Plant Mol. Bio. 32:79-88 (1996); Prins and Goldbach Arch. Virol. 141: 2259-2276 (1996); Metzlaff et al. Cell 88: 845-854 (1997), Sheehy et al., Proc. Nat. Acad. Sci. USA, 85:8805-8809 (1988), and Hiatt et al., U.S. Pat. No. 4,801,340 참조)를 포함한 안티센스 억제가 유전자 조절의 모든 수준에서 작용할 수 있는 것으로 제안되었다.
도입될 핵산 세그먼트는 내생 DYAD 유전자 또는 억제될 유전자의 적어도 일부와 실질적으로 동일할 것이다. 그러나, 발현을 억제하기 위해 서열이 반드시 완전하게 동일할 필요는 없다. 본 발명의 벡터는 억제 효과가 표적 유전자에 대해 상동성 또는 실질적인 상동성을 보이는 유전자들의 패밀리에 속하는 다른 유전자들에 적용될 수 있도록 설계된다.
안티센스 억제의 경우, 도입된 서열은 또한 일차 전사 생성물 또는 완전히 가공된 mRNA에 대해 전장일 필요는 없다. 일반적으로, 보다 높은 상동성이 보다 짧은 서열의 이용을 보상하기 위해 이용될 수 있다. 또한, 도입된 서열은 동일한 인트론 또는 엑손 패턴을 가질 필요가 없으며, 비-코딩 세그먼트(non-coding segment)의 상동성이 동일하게 효과적일 수 있다. 정상적으로, 약 30 또는 40개의 뉴클레오티드 내지 전장(full-length) 뉴클레오티드의 서열이 이용될 수 있으나, 100개 이상의 뉴클레오티드의 서열이 바람직하고, 200개 이상의 뉴클레오티드의 서열이 보다 바람직하며, 약 500개 내지 약 1700개의 뉴클레오티드의 서열이 특히 바람직하다.
DYAD 유전자 발현을 억제하기 위해 다수의 유전자 영역이 표적화될 수 있다. 표적은 예를 들면, 코딩 영역, 인트론, 엑손/인트론 연결부(junction)로부터의 서열, 5' 또는 3'-UTR(untranslated region) 등을 포함할 수 있다. 일부 구체예에서, 조절 단백질이 그의 세포- 및/또는 조직-특이적 발현을 위해 요구되는 DYAD 유전자 서열에 결합하는 능력을 제거하도록 작제물이 설계될 수 있다. 그와 같은 전사 조절 서열은 유전자의 코딩 영역의 5'-, 3'- 또는 그 내부에 위치될 수 있으며, 유전자 전사를 촉진(양성 조절 요소) 또는 억제(음성 조절 요소)할 수 있다. 이 서열들은 본 발명이 속하는 기술 분야에서 당업자에게 잘 알려진, 표준 결실 기법을 이용하여 식별될 수 있다. 일단 상기 서열이 식별되면, 이 서열들을 표적화하는 안티센스 작제물이 특정 조직, 예를 들면, 발달 중인 배주 및/또는 종자에서 유전자 전사를 조절하기 위해 식물로 도입된다.
올리고뉴클레오티드-기반 삼중-나선(triple-helix) 형성이 DYAD 유전자 발현을 중단시키기 위해 이용될 수 있다. 트리플렉스(triplex) DNA는 DNA 전사 및 복제를 억제하고, 부위-특이적 돌연변이를 생성하며, DNA를 절단하고, 상동성 재조합을 유도할 수 있다(예를 들면, Havre and Glazer J. Virology 67:7324-7331 (1993); Scanlon et al. FASEB J. 9:1288- 1296 (1995); Giovannangeli et al. Biochemistry 35:10539-10548 (1996); Chan and Glazer J. Mol. Medicine (Berlin) 75: 267-282 (1997) 참조). 안티센스 조절을 위해 식별된 동일한 서열을 표적화하기 위해 삼중 나선 DNA가 이용될 수 있다.
촉매활성의 RNA 분자 또는 리보자임(ribozyme)이 또한 DYAD 유전자의 발현을 억제하기 위해 이용될 수 있다. 실질적으로 모든 표적 RNA와 특이적으로 쌍을 형성하고 특정한 위치에서 포스포디에스테르 백본을 절단하여, 표적 RNA를 기능적으로 불활성화시키는 리보자임을 설계할 수 있다. 이 절단을 수행할 때, 리보자임 자체는 변경되지 않으며, 따라서 재생되어 다른 분자들을 절단하기 위해 이용될 수 있어서, 진정한 효소로 작용한다. 안티센스 RNA 내에 리보자임 서열의 내포는 그들에 RNA-절단 활성을 부여하여, 그에 의해 작제물의 활성을 증가시킨다. 따라서, 리보자임은 안티센스 조절을 위해 식별된 동일한 서열을 표적화하기 위해 이용될 수 있다.
다수의 종류의 리보자임이 확인되었다. 한 종류의 리보자임은 식물에서 자가-절단(self-cleavage) 및 복제가 가능한 다수의 소형 원형 RNA로부터 유래된다. 상기 RNA는 단독으로(비로이드 RNA) 또는 헬퍼 바이러스(새틀라이트(satellite) RNA)와 함께 복제한다. 예는 ASBV(아보카도 선블로치 비로이드: avocado sunblotch viroid)로부터의 RNA 및 TRSV(토바코 링스폿 바이러스: tobacco ringspot virus), LTSV(루세르네 트랜션트 스트리크 바이러스: lucerne transient streak virus), VTMoV(벨벳 토바코 모틀 바이러스: velvet tobacco mottle virus), SNMV(솔라눔 노디플로룸 모틀 바이러스: solanum nodiflorum mottle virus) 및 SCMoV(서브터레니언 클로버 모틀 바이러스: subterranean clover mottle virus)로부터의 새틀라이트(satellite) RNA를 포함한다. 표적 RNA-특이적 리보자임의 설계 및 용도가 Zhao and Pick Nature 365:448-451 (1993); Eastham and Ahlering J. Urology 156:1186-1188 (1996); Sokol and Murray Transgenic Res. 5:363-371 (1996); Sun et al. Mol.Biotechnology 7:241-251 (1997); 및 Haseloff et al. Nature, 334:585-591 (1988)에 기재된다.
억제의 또 다른 방법은 센스 보조억제(cosuppression)이다. 센스 배향으로 구성된 핵산의 도입은 표적 유전자의 전사를 차단하기 위한 효과적인 수단으로 확인되었다. 내생 유전자의 발현을 조절하기 위한 이 방법의 이용의 예를 위해, Assaad et al. Plant Mol. Bio. 22: 1067-1085 (1993); Flavell Proc. Natl. Acad. Sci. USA 91: 3490-3496 (1994); Stam et al. Annals Bot. 79: 3-12 (1997); Napoli et al., The Plant Cell 2:279-289 (1990); 및 미국특허 제5,034,323호, 제5,231,020호, 및 제5,283,184호를 참조한다.
도입되는 서열이 코딩 서열 자체를 포함하지 않고, 내생 서열의 일차 전사체에 존재하는 서열에 상동적인 인트론 또는 비번역 서열(UTR)만을 포함하는 경우, 억제 효과가 일어날 수 있다. 도입되는 서열은 일반적으로 억제대상으로 의도된 내생 서열과 실질적으로 동일하다. 이 최소의 동일성은 일반적으로 약 65%보다 높으나, 보다 높은 동일성이 내생 서열의 보다 효과적인 억제를 발휘할 것이다. 약 80%를 초과하는 훨씬 더 높은 동일성이 바람직하나, 약 95% 내지 절대적 동일성이 가장 바람직할 것이다. 안티센스 조절의 경우와 같이, 그 효과는 상동성 또는 실질적인 상동성을 보이는 유전자의 유사한 패밀리에 속하는 다른 단백질에도 적용될 것이다.
센스 억제의 경우, 절대적 동일성보다 낮은 동일성이 요구되는, 도입되는 서열은 또한 일차 전사 생성물 또는 완전히 가공된 mRNA에 대해, 전장(full-length)일 필요는 없다. 과다발현자인 식물의 동시 생산을 피하기 위해, 이것이 바람직할 수 있다. 전장보다 짧은 길이의 서열에서 보다 높은 동일성이 보다 길고, 보다 낮은 동일성의 서열을 보완한다. 또한, 도입되는 서열은 동일한 인트론 또는 엑손 패턴을 가지지 않아도 되고, 비-코딩 세그먼트의 동일성이 동일하게 효과적일 것이다. 일반적으로, 안티센스 조절에 대해 전술된 크기 범위의 서열이 이용된다. 또한, 안티센스 조절을 위해 앞서 언급되었던 동일한 유전자 영역이 보조억제 기술을 이용하여 표적화될 수 있다.
대안적으로, DYAD 세포-특이적 유전자 발현을 위해 요구되는 단백질의 제거가 DYAD 활성을 조절할 수 있다. 따라서, 조절 단백질 및/또는 DYAD 유전자 발현을 조절하는 서열의 발현이 본 명세서에 기재된 방법을 이용하여 조정될 수 있다.
또 다른 방법은 DYAD mRNA 번역의 조작된(engineered) tRNA 억제의 이용이다. 이 방법은 미성숙 종결 코돈을 포함하는 표적 유전자를 트랜스활성화(transactivate)시키기 위한 억제자 tRNA의 이용을 포함한다(Betzner et al. Plant J.I 1:587-595 (1997); 및 Choisne et al. Plant J.11: 597-604 (1997) 참조). 앰버(amber) 종결 코돈을 포함하는 구성적으로 발현되는 DYAD 유전자를 포함하는 식물 계통이 먼저 생성된다. 각각 세포-타입 특이적 프로모터의 지시 하에 있는 tRNA 억제자 유전자 작제물을 포함하는 것인 복수의 식물 계통들이 또한 생성된다. 그 후, tRNA 유전자 작제물이 표적화된 방식으로 DYAD 활성을 활성화시키기 위해 DYAD 계통으로 교배된다. 이 tRNA 억제자 계통은 또한 임의의 타입의 유전자의 발현을 동일한 세포 또는 조직 타입으로 표적화시키기 위해 이용될 수 있다.
다른 단백질에 결합하는 능력이 불완전한 DYAD 폴리펩티드의 우성-음성 형태의 생산은 내생 DYAD 활성을 억제하기 위한 편리한 수단이다. 이 방법은 내생 단백질과 불완전한 복합체를 형성하고 그에 의해 복합체가 제대로 형성될 수 없게 하는 돌연변이 DYAD 폴리펩티드를 코딩하는 작제물에 의한 식물의 형질전환을 포함한다. 돌연변이 폴리펩티드는 아미노산 치환, 첨가, 결실 등에 의해 일차 구조 수준에서 천연 서열로부터 변할 수 있다. 이 변형은 최종의 변형된 단백질 사슬을 생성하기 위해 다수의 조합으로 이용될 수 있다. 표적 유전자를 불활성화시키기 위한 우성 음성 돌연변이체의 이용이 Mizukami et al. Plant Cell 8:831-845 (1996)에 기재된다.
DYAD 단백질이 그 자체 또는 다른 단백질과 상호작용하는 능력에 영향을 미치는 또 다른 전략은 DYAD에 특이적인 항체의 이용을 포함한다. 이 방법에서, DYAD-특이적 Ab의 세포-특이적 발현이 항체:항원 인식을 통해 기능성 도메인을 불활성화시키기 위해 이용된다(Hupp et al. Cell 83:237-245 (1995) 참조).
DYAD
유전자 발현을 강화하기 위한 본 발명의 핵산의 용도
본 명세서에서 개시된 바와 같이 제조된 분리된 서열이 또한 내생 유전자 발현을 강화 또는 증가시키기 위해 특정한 DYAD 핵산의 발현을 도입하기 위해 이용될 수 있다. 강화된 발현은 또한 예를 들면, 식물이 종자를 형성(set)하는 것을 방지하여 영양 생장(vegetative growth)을 증가시키기 위해 이용될 수 있다. 유전자의 과다발현이 바람직한 경우, 상이한 종으로부터의 원하는 유전자가 잠재적인 센스 보조억제 효과를 감소시키기 위해 이용될 수 있다.
당업자는 다른 단백질처럼, 본 발명의 유전자에 의해 코딩된 폴리펩티드가 상이한 기능을 수행하는 상이한 도메인을 갖는다는 것을 인식할 것이다. 따라서, 상기 단백질의 원하는 기능 도메인이 발현되는 한, 상기 유전자 서열이 전장(full-lenght)일 필요는 없다.
변형된 단백질 사슬은 또한 본 발명이 속하는 기술 분야에서 당업자에게 잘 알려지고 하기에서 상세하게 설명되는 다양한 재조합 DNA 기법을 이용하여 용이하게 설계될 수 있다. 예를 들면, 단백질 사슬은 아미노산 치환, 첨가, 결실, 등에 의해 일차 구조 수준에서 천연 서열로부터 변할 수 있다. 이 변형들은 최종의 변형된 단백질 사슬을 생성하기 위해 다수의 조합으로 이용될 수 있다.
재조합 벡터의 제조
전술된 기법에서 분리된 서열을 이용하기 위해, 식물 세포의 형질전환을 위해 적합한 재조합 DNA 벡터가 제조된다. 다양한 고등 식물 종을 형질전환시키기 위한 기법들이 잘 알려져 있고 학술 및 과학 문헌에 개시된다. 예를 들면, Weising et al. Ann. Rev. Genet. 22:421-477 (1988)을 참조한다. 원하는 폴리펩티드를 코딩하는 DNA 서열, 예를 들면, 전장 단백질, 또는 DYAD와 세포내 국소화 서열(intracellular localization sequence)의 융합 단백질, 또는 절단된 DYAD 단백질을 코딩하는 cDNA 서열은 바람직하게는 형질전환된 식물의 의도된 조직에서 유전자로부터의 서열의 전사를 지시할 전사 및 번역 개시 조절 서열과 조합될 것이다.
예를 들면, 과다발현을 위해, 재생된(regenerated) 식물의 모든 조직에서 유전자의 발현을 지시할 식물 프로모터 단편이 이용될 수 있다. 그와 같은 프로모터는 본 명세서에서 "구성성(constitutive)" 프로모터로 지칭되며 대부분의 환경 조건 및 발생 또는 세포 분화의 단계들에서 활성을 갖는다. 구성성 프로모터의 예는 CaMV(cauliflower mosaic virus) 35S 전사 개시 영역이다. 아그로박테리움 투메파시엔스의 T-DNA로부터 유래된 1'- 또는 2'- 프로모터, 및 다양한 식물 유전자로부터의 기타 전사 개시 영역이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다. 그와 같은 유전자는 예를 들면, 애기장대로터 유래된 ACTl1(Huang et al. Plant Mol. Biol. 33:125-139 (1996)), 애기장대로터 유래된 Cat3(GenBank No. U43147, Zhong et al., Mol. Gen. Genet. 251:196-203 (1996)), 브라시카 나푸스(Brassica napus)로부터 유래된 스테아로일-아실 담체 단백질 불포화효소(desaturase)를 코딩하는 유전자(Genbank No. X74782, Solocombe et al. Plant Physiol. 104:1167-1176 (1994)), 옥수수로부터 유래된 GPc1(GenBank No. X15596, Martinez et al. J. Mol. Biol 208:551-565 (1989)), 및 옥수수로부터 유래된 Gpc2 (GenBank No. U45855, Manjunath et al., Plant Mol. Biol. 33:97-112 (1997))를 포함한다.
대안적으로, 식물 프로모터는 특정한 조직에서 DYAD 핵산의 발현을 지시할 수 있거나, 또는 보다 정확한 환경적 제어 또는 발생적 제어 하에 있을 수 있다. 유도성 프로모터에 의해 전사를 달성할 수 있는 환경적 조건의 예는 혐기성 조건, 상승된 온도, 또는 광의 존재를 포함한다. 그와 같은 프로모터는 "유도성(inducible)" 또는 "조직-특이적(tissue-specific)" 프로모터로 지칭된다. 당업자는 조직-특이적 프로모터가 표적 조직이 아닌 다른 조직들에서 작동가능하게 연결된 서열의 발현을 추진시킬 수 있다는 것을 인식할 것이다. 따라서, 본 명세서에서 사용된 조직-특이적 프로모터는 표적 조직에서 우선적으로 발현을 추진시키는 프로모터이나, 또한 다른 조직에서도 일부 발현을 초래할 수 있다. 조건부 발현, 조직-특이적 발현, 또는 상기 두 가지의 조합은 또한, DYAD 핵산이 이종(heterologous) 또는 합성 트랜스활성자(transactivator)에 의해 구동되는 합성 프로모터의 제어 하에 배치될 수 있는 것인, 트랜스활성자를 이용하여 달성될 수 있다. 트랜스활성자의 조직-특이적 및/또는 조건부 발현은 DYAD 핵산의 상응하는 발현을 추진시킬 것이다. 식물에서 이용된 트랜스활성자 및 유도성 시스템의 예는 mGal4:VP16/UAS, pOp/LhG4, GVE/VGE, GVG, pOp6/LhGR, 및 XVE를 포함한다(Moore et al., The Plant Journal 45: 651-683 (2006)에서 검토됨).
발생적 제어(developmental control) 하에 있는 프로모터의 예는 과실, 종자 또는 꽃과 같은 특정한 조직에서만(또는 주로) 전사를 개시하는 프로모터를 포함한다. 배주, 꽃, 또는 종자에서 핵산의 발현을 지시하는 프로모터가 특히 본 발명에서 유용하다. 본 명세서에서 사용된 종자-특이적 프로모터는 종자 조직에서 발현을 지시하는 프로모터이다. 그와 같은 프로모터는 예를 들면, 배주-특이적(난 세포 또는 중심 세포(central cell)와 같은 자성 배우체 또는 모계 조직(maternal tissue)에서 발현을 지시하는 프로모터를 포함), 배아-특이적, 배유-특이적, 외피-특이적, 종피-특이적 프로모터 또는 그들의 조합을 포함한다. 예는 Reiser et al. Cell 83:735-742 (1995)에 기재된 배주-특이적 BELl 유전자로부터의 프로모터(GenBank No. U39944), 및 웅성 감수모세포(meicyte) 특이적 DUET 유전자로부터의 프로모터(Reddy T. V., et al., Development, Vol. 130 (24):5975-5987, 2003)를 포함한다. 기타 적합한 종자 특이적 프로모터는 하기의 유전자로부터 유래된다: 옥수수로부터의 MACl(Sheridan et al. Genetics 142:1009-1020 (1996), 옥수수로부터의 Cat3(GenBank No. L05934, Abler et al. Plant Mol. Biol. 22:10131-1038 (1993), 옥수수로부터의 올레오신 18 kD을 코딩하는 유전자(GenBank No. J05212, Lee et al. Plant Mol. Biol. 26:1981-1987 (1994)), 애기장대로부터의 비비파로우스(viviparous)-1(Genbank No. U93215), 애기장대로부터의 올레오신을 코딩하는 유전자(Genbank No. Z17657), 애기장대로부터의 Atmycl(Urao et al. Plant Mol. Biol. 32:571-576 (1996), 애기장대로부터의 2S 종자 저장 단백질(seed storage protein) 유전자 패밀리(Conceicao et al. Plant J. 5:493-505 (1994)), 브라시카 나푸스로부터의 올레오신 20 kD을 코딩하는 유전자 (GenBank No. M63985), 브라시카 나푸스로부터의 napA(GenBank No. J02798, Josefsson et al. JBL 26:12196-1301 (1987), 브라시카 나푸스로부터의 나핀(napin) 유전자 패밀리(Sjodahl et al. Planta 197:264-271 (1995), 브라시카 나푸스로부터의 2S 저장 단백질을 코딩하는 유전자(Dasgupta et al. Gene 133:301-302 (1993)), 대두로부터의 올레오신 A(Genbank No. U09118) 및 올레오신 B(Genbank No. U09119)를 코딩하는 유전자 및 대두로부터의 저분자량 황-풍부 단백질(sulphur rich protein)을 코딩하는 유전자 (Choi et al. Mol. Gen., Genet. 246:266-268 (1995)).
또한, 본 명세서에 개시된 DYAD 유전자로부터의 프로모터 서열은 본 발명의 DYAD 폴리뉴클레오티드 또는 이종 서열의 발현을 추진하기 위해 이용될 수 있다. 적절한 폴리펩티드 발현이 바람직한 경우, 코딩 영역의 3'-말단에 있는 폴리아데닐화(polyadenylation) 영역이 포함되어야 한다. 폴리아데닐화 영역은 천연 유전자, 또는 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다.
본 발명의 유전자로부터의 서열(예를 들면, 프로모터 또는 코딩 영역)을 포함하는 벡터는 일반적으로 식물 세포에 선택가능한 표현형을 부여하는 마커 유전자를 포함할 것이다. 예를 들면, 상기 마커는 살생물제(biocide) 저항성, 특히, 항생제 저항성, 예를 들면, 카나마이신, G418, 블레오마이신, 히그로마이신에 대한 저항성, 또는 제초제 저항성, 예를 들면, 클로로술푸론 또는 바스타(Basta)에 대한 저항성을 코딩할 수 있다.
형질전환 식물의 생산
본 발명의 DNA 작제물이 다양한 통상적 기법에 의해 원하는 식물 숙주의 게놈으로 도입될 수 있다. 예를 들면, 상기 DNA 작제물은 식물 세포 원형질체의 전기천공 또는 미세주입(microinjection)과 같은 기법을 이용하여 식물 세포의 게놈 DNA로 직접 도입될 수 있거나, 또는 DNA 작제물은 DNA 입자 충격(particle bombardment)과 같은 탄도 방법(ballistic method)을 이용하여 식물 조직으로 직접 도입될 수 있다.
미세주입 기법은 본 발명이 속하는 기술 분야에서 공지되어 있고, 과학 및 특허 문헌에 잘 개시되어 있다. 폴리에틸렌 글리콜 침전을 이용한 DNA 작제물의 도입이 Paszkowski et al. Embo J. 3:2717-2722 (1984)에 기재되어 있다. 전기천공 기법은 Fromm et al. Proc. Natl. Acad. Sci. USA 82:5824 (1985)에 기재되어 있다. 입자충돌식 형질전환 기법(ballistic transformation technique)은 Klein et al. Nature 327:70-73 (1987)에 기재되어 있다.
대안적으로, DNA 작제물은 적합한 T-DNA 플랭킹 영역(flanking region)과 결합되어 통상적인 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 숙주 벡터로 도입될 수 있다. 식물 세포가 아그로박테리움 투메파시엔스에 의해 감염되면, 아그로박테리움 투메파시엔스 숙주의 병독성(virulence) 기능이 상기 작제물 및 인접한 마커의 식물 세포 DNA로의 삽입을 지시할 것이다. 무장해제(disarming) 및 이중 벡터(binary vector)의 이용을 포함한 아그로박테리움 투메파시엔스-매개 형질전환 기법이 과학 학술 문헌에 잘 기재되어 있다. 예를 들면, Horsch et al. Science 233:496-498 (1984), and Fraley et al. Proc. Natl. Acad. Sci. USA 80:4803 (1983)를 참조한다.
전술된 형질전환 기법으로부터 유래된 형질전환된 식물 세포들은 형질전환된 유전형 및 따라서 증가된 종자 매스와 같은 원하는 표현형을 갖는 전체 식물을 재생하기 위해 배양될 수 있다. 그와 같은 재생 기법은 조직 배양 성장 배지 내에서 특정한 식물 호르몬(phytohormone)의 조작에 의존하며, 통상적으로 원하는 뉴클레오티드 서열과 함께 도입된 살생물제 및/또는 제초제 마커에 의존한다. 배양된 원형질체로부터의 식물 재생은 Evans et al., Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, pp. 124-176, MacMillilan Publishing Company, New York, 1983; 및 Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985에 기재된다. 재생은 또한 식물 캘러스(callus), 외식편(explant), 기관, 또는 그의 부분들로부터 수득될 수 있다. 그와 같은 재생 기법이 Klee et al. Ann. Rev. of Plant Phys. 38:467-486 (1987)에 전반적으로 기재된다.
본 발명의 핵산은 본질적으로 임의의 식물에 원하는 특성을 부여하기 위해 이용될 수 있다. 따라서, 본 발명은 아나카르디움(Anacardium), 아라키스(Arachis), 아스파라거스(Asparagus), 아트로파(Atropa), 아베나(Avena), 브라시카(Brassica), 시트러스(Citrus), 시트룰러스(Citrullus), 카프시쿰(Capsicum), 카르타무스(Carthamus), 코코스(Cocos), 코페아(Coffea), 쿠쿠미스(Cucumis), 쿠쿠르비타(Cucurbita), 다우쿠스(Daucus), 엘라에이스(Elaeis), 프라가리아(Fragaria), 글리신(Glycine), 고시피움(Gossypium), 헬리안투스(Helianthus), 헤테로칼리스(Heterocallis), 호르데움(Hordeum), 히오스키아무스(Hyoscyamus), 락투카(Lactuca), 리눔(Linum), 롤리움(Lolium), 루피누스(Lupinus), 리코페르시콘(Lycopersicon), 말루스(Malus), 마니호트(Manihot), 마조라나(Majorana), 메디카고(Medicago), 니코티아나(Nicotiana), 올레아(Olea), 오리자(Oryza), 파니에움(Panieum), 판네세툼(Pannesetum), 페르세아(Persea), 파세올루스(Phaseolus), 피스타치아(Pistachia), 피숨(Pisum), 피루스(Pyrus), 프루누스(Prunus), 라파누스(Raphanus), 리시누스(Ricinus), 세칼(Secale), 세네시오(Senecio), 시나피스(Sinapis), 솔라눔(Solanum), 소르굼(Sorghum), 테오브로무스(Theobromus), 트리고넬라(Trigonella), 트리티쿰(Triticum), 비시아(Vicia), 비티스(Vitis), 비그나(Vigna), 및 제아(Zea) 속에 속하는 종을 포함한 다양한 식물에 대해 이용될 수 있다.
당업자는 발현 카세트가 형질전환 식물에 안정적으로 내포되고 작동가능한 것으로 확정된 후, 발현 카세트가 유성 교배에 의해 다른 식물로 도입될 수 있다는 것을 인식할 것이다. 다수의 표준 육종 기법들 중 임의의 기법이 교배대상 종에 따라 이용될 수 있다.
본 발명의 식물로부터 수득된 종자는 원하는 특성을 갖는 식물을 식별하기 위해 공지된 절차에 따라 분석될 수 있다. DYAD 유전자 발현을 제어하기 위해 안티센스 또는 기타 기법들이 이용되는 경우, 원하는 식물을 스크리닝하기 위해 RT-PCR 또는 노던 블롯 분석이 이용될 수 있다. 또한, 수정-독립적 생식 발생(fertilization independent reproductive development)의 존재가 검출될 수 있다. 예를 들면, 무배아 종자(embryo-free seed)형성하거나, 수정 후 발육되지 않는 종자를 형성하거나, 또는 수정의 부재 하에 과실을 형성하는 능력에 대해 식물체가 스크리닝될 수 있다. 이 절차는 부분적으로 이용될 특정 식물 종에 의존하나, 당업자에게 잘 알려진 방법에 따라 수행될 것이다.
하기의 실시예는 본 발명의 예시로서 제공되며 본 발명의 범위를 한정하는 것으로 해석되어서는 안 된다.
도 1은 dyad 돌연변이 식물에서 감소된 종자 세트를 나타낸다. 최빈값의 범위(modal range)는 식물당 1개 내지 10개의 종자이다.
도 2는 알렉산더 염색(Alexander staining)을 이용하여 dyad 돌연변이체 식물의 정상적인 화분 생존력을 나타낸다. (도 2A) 야생형. (도 2B) dyad.
도 3은 야생형 및 dyad 돌연변이체에서 웅성 및 자성 감수분열을 나타낸다. (도 3A-C) 야생형. (도 3D-F) dyad. (도 3A, D) 제1 감수분열의 종료(말기) 시 웅성 감수모세포. (도 3B, E) 사분염색체(tetrad) 기에 있는 웅성 감수모세포. (도 3C, F) 일차 후기(anaphase 1)에 있는 자성 감수모세포. dyad는 등수 웅성 감수분열(equational female meiosis)을 수행한다.
도 4는 이배체 dyad 돌연변이체 식물의 대표적 자손의 염색체 배수성을 나타 낸다. (도 4A) 15개의 염색체를 보여주는 삼배체 자손 식물의 체세포. (도 4B) 9:6 분리를 보이는 15개의 염색체를 갖는 삼배체 자손 식물에서 웅성 제1 감수분열. (도 4C) 10개의 염색체를 보이는 이배체 자손 식물의 체세포.
도 5는 보에케라 홀보엘리(Boechera holboelli) DYAD 상동체에 의한 dyad 돌연변이체의 상보작용(complementation)을 나타낸다: (도 5A) 신장되지 않은 장각과(unelongated siliques)를 보이는 dyad 돌연변이체. (도 5B) 종자를 함유한 신장된 장각과를 보이는, BhDYAD 유전자로 형질전환된 dyad 돌연변이체. (도 5C) dyad 돌연변이체 식물(1), 상보된 식물(2) 및 야생형 식물(3)로부터의 장각과의 비교. (도 5D) 완전한 종자 세트를 보이는, 절개된 장각과. (도 5E) 야생형 식물체로부터의 절개된 장각과.
도 6은 DYAD 조건부 상보작용 계통(conditional complementation line)을 구축하기 위해 이용된 pBI101.3::Dyad::(△)GR 카세트를 도시하는 다이아그램이다.
도 7은 실시예 6에 기재된 바와 같은 DYAD의 내생 좌(endogenous locus)의 유전형을 분석하기 위한 CAPS 다형성을 보여주는 폴리아크릴아미드 겔이다. 도 7A: KNEF/KNER 프라이머로 증폭된 생성물로부터의 HinF1 처리 단편들의 분리. 도 7B: KKF/KKR 프라이머로 증폭된 생성물로부터의 HinF1 처리 단편들의 분리.
도 8은 실시예 6에서 dyad 표현형의 조건부 상보작용을 보여준다.
도 8A: 덱사메타손 처리 전과 후의 신장되지 않은 장각과(dyad 표현형)를 보여주는 개화. 화살표는 처리의 개시시 가장 어린 개화된 꽃의 위치를 표시한다. 처리 개시 5-7일 후에, 장각과는 신장을 보였다(야생형 표현형). 도 8B: 덱사메타 손 처리 전 중성(sterile)(dyad) 표현형을 보이는 분리된 장각과. 도 8C: 덱사메타손 처리에 의한 조건부 상보작용 후 복구된 야생형 표현형. 도 8D: 덱사메타손 처리 후 완전한 종자 세트를 보이는 분열된 개화 장각과(split open silique).
도 9는 실시예 6의 dyad 표현형의 조건부 상보작용 후 배주의 형태를 보여준다.
도 9A: 덱사메타손 처리 전 성숙 배주 단계에서 dyad 표현형 및 배낭의 부재를 보이는 제거된 배주(cleared ovule). 도 9B: 덱사메타손 처리 후 복구된 배낭.
도 10은 dyad 돌연변이체에 의해 생산된 종자의 크기의 변이 및 이배체 애기장대 품종과 사배체 애기장대 품종 간의 상호교배(reciprocal cross)로부터 수득된 종자의 크기 차이를 도시한다.
도 1OA: 자가수분된 야생형 이배체 Col-O 식물로부터의 종자는 크기가 일정하게 정상이다. 도 1OB: 사배체 식물로부터의 종자. 도 1OC: 자가수분된 dyad 식물로부터의 종자 크기는 대형(L), 정상(N), 및 축소형(S) 간에 변했다. 도 10D: 모계 과잉(maternal excess) -- 이배체 웅성 식물에 교배된 사배체 자성 식물로부터의 종자는 축소형이다. 도 1OE: 부계 과잉(paternal excess) -- 이배체 자성 식물에 교배된 사배체 웅성 식물로부터의 종자는 모계 과잉 교배로부터의 종자에 비해 크기가 더 크다.
도 11은 http://www.ebi.ac.uk/clustalw에 있는 Clustal W에 디폴트 파라미터를 적용하여 이용한, 애기장대(서열번호 5), 보에케라(서열번호 18), 쌀(서열번호 51), 및 포플러(포풀러스 트리코카르파)(서열번호 26)로부터의 DYAD 단백질의 단백질 서열의 정렬을 보여준다.
도 12는 Clustal W (1.82)를 이용한, 추정적(putative) 옥수수 DYAD 폴리펩티드 서열(서열번호 55 및 54)과 쌀 DYAD 폴리펩티드 서열(서열번호 51)의 정렬을 도시한다. 도 12A: 쌀 DYAD의 1번 내지 147번 아미노산의 정렬. 도 12B: 쌀 DYAD의 317번 내지 803번 아미노산의 정렬.
도 13은 쌀로부터의 DYAD 폴리펩티드 서열의, DYAD-코딩 서열을 포함하는 것으로 확인된 두 개의 옥수수(Zea mays) 콘티그(contig)로의 맵핑을 도시한다.
실시예
1:
dyad
돌연변이체는 불완전한 자성 수정 능력(
fertility
) 및
감소된
종자 세트를 보인다.
EMS로 돌연변이 유발시킨(EMS mutagenized) M2 식물 중 애기장대의 중성(sterile) 돌연변이체의 스크리닝에서 dyad 돌연변이체를 분리하였다(Siddiqi I. et. al. Development Vol. 127(1): 197-207 (2000)). 상호교배에 의한 수정능력 분석은 상기 돌연변이체는 자성 불임이나 웅성은 수정능력을 가진다는 것을 보여주었다. 자성 포자형성 및 배주 발달의 분석은 dyad가 불완전 자성 감수분열을 수행하여 감수분열 세포 주기를 통한 불완전 진행 때문에 단일 감수분열 및 뒤이은 대다수의 배주에서 중단(arrest) 및 자성 생식세포의 발생 실패를 초래한다는 것을 나타냈다. 감수모세포의 염색체 전개(chromosome spread)의 관찰에 의한 자성 감수분열의 분석은 dyad 돌연변이체에서 자성 감수분열이 비정상이라는 것을 나타냈다: 염색체는 시냅시스에 실패하고 정상적으로 제1 감수분열에서 일어나는 감소 분 열 대신에, 등수 분열을 수행했다(Agashe B., Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)).
도 1에 도시된 바와 같이, dyad 돌연변이체에서 종자 세트(seed set)는 야생형에 비해 크게 감소되었고, 상이한 dyad 돌연변이 식물들 간에 종자 세트의 정도에서 변이를 관찰되었다. 종자 세트는 산발적이고 임의적이어서 갯수의 측면에서 집단 내의 식물들 간에 균일성이 관찰되지 않았다. 종자 세트의 양식은 식물당 1개 내지 10개이나, 드물게 관찰된(500개의 식물 중 하나) 최대 약 275개까지 변화했다.
실시예
2:
dyad
돌연변이체에서
웅성
감수분열 및 수정능력은 정상이다.
알렉산더 염색을 이용하여 화분 생존력을 조사하고 화분이 완전히 생존력을 가지며 야생형과 유사한 것으로 확인하였다(도 2). 감수모세포의 염색체 전개의 분석에 의한 웅성 감수분열의 관찰은 웅성 감수분열이 정상이고 반수체 포자의 사세포체의 생성을 초래했다는 것을 보여주었다(도 3). 따라서, dyad 돌연변이체에서 웅성 감수분열, 웅성 수정능력, 및 화분 발달 및 기능은 정상이었다. 반면에, dyad에서 자성 감수분열은 비정상이었다. dyad에서 상동 염색체의 접합은 일어나지 않았고 야생형 자성 감수분열의 감소성 제1 감수분열(도 3C)은 등수 분열로 대체되었다(도 3E).
실시예
3:
dyad
돌연변이체로부터
수득된
종자는 발아하여 삼배체 식물을 생 성한다.
dyad 돌연변이체에서 생성된 종자는 소수의 자성 감수모세포에서의 정상적인 감수분열로부터 유래되며, 이는 정상적인 기능성 배낭을 생성하고 그 후 반수체 화분에 의해 수정되고 종자로 발달되는 것이 가능하다. 상기의 경우라면, 이 종자들은 dyad 돌연변이체에서 일어나는 비정상적인 자성 감수분열로부터 벗어난 개체(escapee)일 것이다. 이 가능성을 조사하기 위해, dyad 식물체로부터의 종자(n=169)를 발아시키고 높은 효율성(>90%)으로 발아하며 비정상적인 모종(seedling)을 가져오는 일부(10%)를 제외하고는 형태학적으로 정상인 모종을 생산한다는 것을 확인했다. 발아하는 모종에서 형태, 대칭성 및 자엽의 수의 변이는 관찰되지 않았다. 이는 제1 감수분열에서 염색체의 무작위 분리를 수행하여 모종 단계에서 다양한 발달 이상(developmental abnormality)을 보이는 이수체(aneuploid) 자손의 보다 높은 비율을 초래하는 AtSpoll-1 및 AtDmcl과 같은 다른 감수분열 돌연변이체로부터 유래되는 모종과 대비된다(Grelon M. et al., The EMBO J., VoI 20: 589-600, 2001, Couteau F. et al., Plant Cell, Vol. 11(9): 1623-1634 , 1999). 토양으로 이식 후 뒤이은 모종의 영양 생장도 정상이었고 영양 생장이 야생형 및 부모 dyad 돌연변이체 식물과 유사한 식물로 성장했다. 관찰된 주요한 차이점은 식물이 추대(bolting)를 개시했을 때 꽃의 크기에 있었다. 대다수의 식물(n=41/52)에서, 야생형 대비 꽃 크기의 상당한 증가를 관찰하였다. 증가된 꽃 크기는 활력(vigour)의 증가 또는 유리한 환경적 영향에서 기인한 것일 수 있었다. 상기 식물체들은 제어된 환경에서 생장되었기 때문에, 본 발명자들은 후 자의 가능성을 배제했다. 꽃 기관 크기의 증가에 대한 다른 가능한 이유는 배수성의 증가일 수 있었다. 배수성의 증가는 영양 구조 및 꽃 구조, 특히, 화분립의 크기의 증가에 의해 나타난다(Altmann T., et al., Plant Cell Reports. Vol. 13: 652 - 656, 1994). 체세포 및 웅성 감수모세포에서 염색체의 분석에 의해 무작위로 채취된 식물로부터의 꽃눈을 대상으로 그들의 배수성 수준을 조사하였다. 감수분열 염색체 전개의 조사에 의해, 19개 중 17개의 (17/19) 경우에서, 상기 식물은 삼배체이고 나머지 2개는 이배체인 것으로 확인하였다(도 4). dyad 돌연변이체에서 화분 발달 및 웅성 감수분열은 정상이었으나, 감소형 자성 감수분열은 등수 분열로 치환되었기 때문에, 이 결과들은 삼배체인 종자의 대부분은 감소되지 않은(이배체) 난 세포의 정상적인 반수체 정자에 의한 수정으로부터 생성되며 소수의 배주에서 정상적인 자성 감수분열로부터 생성되는 것이 아니라는 것, 즉, 대다수의 종자는 비정상적인 감수분열로부터 벗어난 개체들(escapee)이 아니라는 것을 시사했다.
실시예
4:
dyad
로부터
유래된
삼배체 식물은 모든 이형접합형
마커의
유지를 보여준다.
dyad 돌연변이체에서 형성된 삼배체 종자는 dyad에서 일어나는 등수 자성 감수분열과 일치되는, 정상적인 반수체 화분에 의한 감소되지 않은 배낭의 수정 생성물일 수 있다. 그와 같은 감소되지 않은 배낭이 염색체가 일가(univalent)이고 재조합을 수행하지 못하는 것인 거대포자 모세포의 등수 분열의 생성물로부터 유래되 는 감소되지 않은 거대포자로부터 형성되는 경우, 상기 감소되지 않은 배낭의 유전형은 이배체 부모 식물의 유전형과 동일할 것이다. 따라서, 부모 식물이 분자 마커에 대해 이형접합인 경우, 삼배체 자손도 그 마커에 대해 이형접합일 것이다. 동원체에 연관되지 않은 마커가 이형접합 조건에서 고려되는 경우, 재조합의 완전한 부재시 부모의 이형접합의 100% 전달이 결과적으로 생성된 자성 생식세포 및 삼배체 자손에서 달성될 것이다. 재조합 및 교배가 일어나는 경우, 결과적으로 생성된 삼배체 자손에서 100% 이형접합성이 유지되지 않을 것이다. 동원체에 연관되지 않은 마커의 경우, 감소되지 않은 배낭에서 33%의 빈도로 및 삼배체 자손에서 16.7%의 빈도로 동형접합을 예상할 수 있으며, 재조합의 완전한 부재시 동형접합체는 없을 것이다. 이형접합성의 상실 없이 감소되지 않는 배낭의 형성은 단위생식의 조작 및 잡종강세의 고정을 위해 매우 바람직하다. 본 발명자들은 마이크로새틀라이트(microsatellite)를 이용하여 dyad 돌연변이체 식물의 삼배체 자손들 중에서 이형접합성의 상실을 측정하였다. 야생형 Nossen (No-O)과 dyad 돌연변이체 Columbia (Col) 생태형 간 교배의 분리되는 F2 집단에서 dyad 돌연변이체 식물을 식별하였다. TAIR 데이터베이스(www.arabidopsis.org)로부터 5개의 애기장대 염색체 각각에 분포되고 동원체에 연관되지 않은 (>35 cM) 후보 마커들을 수득하였다. F2 집단을 생성하기 위해 이용된 부모 식물을 조사하여 다형성을 확인하고, 그 결과에 근거하여, 본 발명자들은 50개의 F2 dyad 돌연변이체 식물의 유전형을 결정하고 각 식물이 이형접합인 마커들을 확인하기 위해 4개의 상이한 염색체 상에 있는 5개의 상이한 마커들(표 1)을 선택하였다. 상기 50개의 F2 식물체로부터 개별적으 로 자가수분된 종자들을 회수하고 다양한 수의 동기(sibling)로 구성된 50개의 상이한 패밀리로 생장시켰다. 이는 50개의 패밀리에 분포된 총 196개의 식물을 생성했다. 부모 식물이 이형접합인 마커들에 대해 각 패밀리의 모든 구성식물의 유전형을 분석하여 각 마커에 대해 50개의 F2 패밀리 모두에 걸쳐 분포된 74개 내지 119개의 식물을 생성했다.
표 1 : 이형접합성의 상실 및 재조합을 측정하기 위한 dyad 식물의 자손의 마커 분석.
a제6열에 있는 괄호 안의 숫자는 해당 마커에 대해 분석된 전체 식물 대비 동형접합체의 백분율을 나타낸다.
마커 | 염색체 No. | 연관도 상의 위치(cM) | 동원체 위치(근사치)(cM) | 분석된 식물의 수 | 동형접합체의 수a |
nga168 | 2 | 73.77 | 15 | 119 | 11(9.24) |
nga6 | 3 | 86.41 | 49 | 108 | 7(6.48) |
nga162 | 3 | 20.5 | 49 | 74 | 8(10.81) |
nga1107 | 4 | 104.73 | 28 | 107 | 11(10.28) |
nga225 | 5 | 14.32 | 71 | 103 | 9(8.73) |
스크리닝된 196개 식물 중에서, 본 발명자들은 부모 식물이 이형접합인 하나 이상의 마커에 대해 동형접합인 35개의 식물을 수득했다. 감수분열 염색체 전개를 수행하여 이 35개의 식물 중에서 22개의 배수성을 결정했다. 21개의 식물은 이배체이고 다른 하나는 13개의 염색체를 갖는 초이배체(hyperdiploid)로 확인되었다. 따라서, 분석에 따르면, 이형접합성의 상실은 거의 이배체에서만 관찰되었다. 이형접합성의 상실을 보이지 않은 식물 중에서, 별개의 F2 패밀리로부터 무작위로 15개의 식물을 선택하여 그들의 배수성을 조사했다. 15개의 식물체 모두 삼배체로 확인되었다.
따라서, 결과는 이배체 dyad 돌연변이체 식물로부터의 자손의 주요한 종류를 구성하는 삼배체에서 이형접합성의 상실이 없다는 것을 나타냈다. 삼배체에서 이형접합체의 상실를 확인하지 못한 것은 그들의 형성에 대한 대안적인 가능한 메카니즘, 이형접합성의 상실이 예측되는, 다정자수정(polyspermy), 즉, 두 개의 별개의 웅성 생식세포에 의한 반수체 자성 생식세포의 수정을 배제시켰다. 본 발명자들의 발견은 dyad 돌연변이체 식물의 삼배체 자손이 부모 식물의 유전형을 유지하는 감소되지 않은 배낭의 수정으로부터 유래된다는 것을 보여주었다. 감소되지 않은 배낭의 형성이 단위생식의 주요한 양태이다.
실시예
5:
보에케라
홀보엘리로부터의
DYAD
상동체의
분리 및 기능 규명(
characterization
)
Bho5Bam (서열번호 39) 및 Bho3Bam (서열번호 40) 프라이머를 이용하여, 통성(facultatively) 단위생식 보에케라 홀보엘리 수탁 이배체 그린랜드(Diploid Greenland) 및 삼배체 콜로라도(Triploid Colorado)(Naumova T. N., et al, Sex. Plant Reprod. Vol. 14: 195-200, 2001)로부터의 DYAD 상동체의 3 kB 게놈 코딩 영역을 클로닝하였다. BhDYAD 게놈 클론(서열번호 16)을 애기장대 DYAD 프로모터에 작동가능하게 연결하고 상보작용에 대해 테스트하기 위해 dyad 돌연변이체 식물을 형질전환하기 위해 사용하였다. 또한, BhDYAD cDNA를 증폭시키고 그 서열을 결정하였다(서열번호 17). 아그로박테리움 매개 인 플란타 진공 침투 형질전환( Agrobacterium mediated in planta vacuum infiltration transformation)은 dyad에 대해 이형접합인 F1 식물에 발현 작제물을 동원시켰다. 본 발명자들은 42개의 형질전환체를 수득했고, 이 중에서 9개의 형질전환체는 CAPS 및 dyad 좌의 측면에 접한(flank) 마이크로새틀라이트 마커에 의해 결정된 바와 같이 dyad 돌연변이체 대립형질에 대해 동형접합이었다(Agashe B, Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)). 상기 9개의 형질전환체 중에서, 4개의 형질전환체는 dyad 돌연변이체 표현형의 상보작용(complementation)을 보였고, 이는 완전한 종자 세트를 함유하는 것으로 확인된 잘 신장된 장각과(도 5)에 의해 판단될 수 있었다. 나머지 5개의 식물은 아마도 보조억제 때문에 중성(sterile)이었다.
애기장대 식물의 성장
dyad 돌연변이를 갖는 애기장대 변종이 이전에 개시되었다(Siddiqi I., et. al., Development. Vol. 127(1): 197-207 (2000)). 마이크로새틀라이트 마커 분석을 위해 이용된 F2 집단은 개시된 바와 같이 변종 No-O (Nossen ecotype)와 Col-O 생태형 배경의 dyad 돌연변이체 간의 교배로부터 유래되었다(Siddiqi L, et. al., Development. Vol. 127(1): 197-207 (2000)). 개시된 바와 같이 식물을 제어된 환경에서 생장시켰다(Siddiqi L, et. al., Development. Vol. 127(1): 197- 207 (2000)).
페트리 플레이트(Petri plate)에서 종자를 발아시키기 위해, 종자를 10분간 에탄올로 표면 살균시키고 뒤이어 그들을 5분간 0.025% 수은이염화물(mercuric chloride)로 처리하였다. 수은이염화물의 잔류물을 완전히 제거하기 위해 상기 종자들을 멸균수로 3회 세척하였다. 상기 종자를 미지근한 0.5% 상부 아가(top agar)에 재현탁시키고 2% 수크로오스가 보충된 MS 아가 플레이트(0.7%) 상에 균일하게 도말했다. 상기 플레이트를 층류 후드(laminar flow hood)에서 1시간 동안 건조시키고 상기 플레이트를 파라필름으로 밀봉하고 층화(stratification)를 위해 3일 동안 콜드 룸에서 4℃에 방치하였다. 그 후, 상기 플레이트를 배양 챔버로 옮겼다. 그 후 2주 후에 발아 빈도를 계수하였다.
화분에서 종자를 생장시키기 위해, 식물을 생장시키기 위해 사용된 합성 배지를 동일 비율의 소일라이트(Soilrite):페를라이트(Perlite):베르미큘라이트(Vermiculite)를 혼합하는 것에 의해 제조하였다(Keltech Energies Ltd., Karnataka 574 108, India). 상기 화분용 혼합물(pot mixture)을 모세관이 형성될 수 있도록 하부에 구멍이 있는 화분에 고르게 적용하고 상기 화분을 하기와 같은 주요 염(major salt)을 포함하는 1X MS 용액에 담궜다: 단위 리터당 CaCl2 (4mM), MgSO4 (1.5mM), KNO3 (18.8mM), NH4NO3 (20.6mM), KH2PO4 (1.25mM pH 5.6), 미량 염(Minor Salt)(H3BO3 (7OmM), MnC12 (14mM), CuSO4 (0.5mM), ZnSO4 (1mM), NaMoO4 (0.2mM), NaCl (1OmM), CoC12 (0.01mM)) 1 ml (1000X)에 첨가된 Fe-EDTA (2OmM)를 첨가했다. 종자를 화분의 표면상에 고르게 도말하고 사란(Saran) 랩으로 덮고 층화를 위해 4-8 ℃에서 3일간 방치하고 그 후, 배양 챔버로 옮겼다. 이식의 경우, 모종을 토양 매질로 옮긴 후 화분을 사란 랩으로 덮고 직접 배양 챔버에 배치했다. 일단 화분용 믹스에서 식물이 확립되면 사란 랩을 제거했다. 증류수를 이용하여 일정한 간격으로 물을 주었다.
종자 세트 분석
dyad 동형접합 식물에서 종자 세트의 빈도를 측정하기 위해 Col-O 생태형 배경에 dyad 돌연변이를 갖는 F2 분리 집단을 이용하였다. 식물이 꽃피는 것을 중단하는 최종 단계까지 dyad 돌연변이체 식물을 생장시켰다. 이 단계 후에, 물주기를 중단하고 장각과가 수확 성숙기에 도달하게 하였다. 그동안, 황색으로 되고 떨어지려는 가장 낮은 장각과가 개별적으로 벌어져 열렸고 종자가 있는 경우, 단일 식물 기준으로 종자를 수확했다. 또한, 종자 손실을 피하기 위해 일정한 간격으로 필요한 종자들을 수확했다. 최종적으로, 단일 식물 단위로 채집된 종자를 모아서 식물 당 총 종자의 수를 계수했다.
화분 생존력
개시된 바와 같이, 꽃밥에 있는 소포자(microspore)를 위한 생체 염색(vital staining)을 수행하였다(Alexander M. P., Stain Technol. Vol. 44(3): 117-122, 1971).
감수분열 전개(
Meiotic
Spreads)
개시된 바와 같이, 웅성 및 자성 감수분열 전개의 분석을 수행하였다(Agashe B, Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)).
식물
DNA
분리
마이크로새틀라이트 마커 분석을 위한 게놈 DNA를 약간 변형된, Dellaporta S. L., et al., Plant Mol. Bio. Rep., Vol. 1: 19-21 (1983)에 기재된 방법에 따라 분리하였다. 개별적인 식물로부터 약 500 mg의 잎 조직을 채취하여 1.5 ml 에펜도르프 튜브에 넣고 액화질소로 급속 동결시켰다. 그 후, 상기 조직을 미소막자(micropestle)를 이용하여 미세분말로 분쇄하였다. 이 분말에 200 ㎕의 새로 제조된 추출 완충액(100 mM Tris (pH 8), 50 mM EDTA, 500 mM NaCl, 1.4% SDS, 및 1OmM β-머캅토에탄올)을 첨가하고 미소막자로 곱게 균질화시켰다. 동일 부피의 2X CTAB를 첨가하고 상기 혼합물을 가볍게 볼텍싱하였다. 그 후, 상기 혼합물을 진탕 수조(shaking water bath)에서 65℃에서 5분간 인큐베이션하였다. 그 후, 시료를 냉각시키고 동일 부피의 24:1 클로로포름:이소아밀 알코올을 첨가하고 가볍게 혼합하고 1300 rpm에서 10분간 원심분리하였다. DNA를 포함하는 수성상을 새로운 에펜도르프 튜브로 옮기고 2/3 부피의 매우 차가운(ice-cold) 이소프로판올을 첨가하여 DNA를 침전시켰다. 4℃에서 13000 rpm으로 20분간 원심분리에 의해 DNA를 펠릿으로 침전시켰다. 상기 DNA 펠릿을 70% 에탄올로 세척하고 30분간 자연건조시키고 DNAase 불포함 RNAse (20 ug/ml)를 함유한 멸균수 또는 TE 완충액(pH 8.0) 50 ㎕에 현탁시켰다.
마커
분석
Col-O 및 No-O 생태형의 부모 조사(parental survey)에 근거하여, 4개의 상이한 염색체로부터 동원체에 알맞게 연관되지 않은 5개의 마이크로새틀라이트 마커를 선택하였다. 주어진 마커에 대해 이형접합인 dyad 식물을 선택하기 위해 이 마커들을 F2(No-O x Col-O (dyad)) 분리 집단에 이용하였다. 이 dyad 식물로부터의 종자를 채취하여 개별적인 페트리 플레이트에서 발아시켜 각 자손이 특정한 모 dyad 식물의 친족(sib)을 구성하게 하였다. 주어진 마커에 대해 이형접합인 다양한 식물로부터 친족에 대한 유사한 데이터를 마커 분석에서 함께 고려하였다.
마이크로새틀라이트 마커의 목록 및 그들의 위치가 표 1에 기재된다. 마이크로새틀라이트를 증폭시키기 위해 이용된 프라이머 서열은 TAIR 웹사이트 (www.arabidopsis.org)로부터 얻었다:
nga 162
ngal62F 서열번호 6
ngal62R 서열번호 7
nga225
nga225F 서열번호 8
nga225R 서열번호 9
ngal68
ngal68F 서열번호 10
ngal68R 서열번호 11
ngallO7
ngall07F 서열번호 12
ngall07R 서열번호 13
nga6
nga6F 서열번호 14
nga6R 서열번호 15
2 mM MgCl2, 0.2 mM의 각각의 dNTP, 1 유닛의 Taq DNA 폴리머라아제(Perkin-Elmer/Cetus), 및 5 pmole의 정방향 및 역방향 플랭킹 프라이머를 포함하는 1X PCR 완충액(Perkin Elmer)에서 55 ℃의 어닐링 온도 및 72 ℃에서 20초간의 신장으로 PCR을 수행하였다. PCR 생성물을 150V로 3시간 동안 8% 폴리아크릴아미드 겔 상에서 분리시키고 에티디움 브로미드(EtBr)로 염색하고 Syngene 겔 도큐멘테이션 시스템(Synoptics Inc. UK)으로 기록하였다.
식물 물질
보에케라 홀보엘리의 통성 단위생식 이배체 그린랜드 및 삼배체 콜로라도 기탁물은 Kim Boutilier에 의해 기증되었다(Naumova T. N., et al., Sex. Plant Reprod. Vol. 14: 195-200, 2001). 상기 식물을 애기장대에 대해 기재된 배지를 포함하는 화분에서 애기장대의 생장조건과 동일한 조건 하에서 생장시켰다
DYAD
프로모터의
클로닝
프라이머 pg2r4 (서열번호 48) 및 PDYBAM (서열번호 47)을 이용하여 Col-O 생태형으로부터 1.8 kb DYAD 프로모터 영역을 증폭시키고 그 생성물을 제조사의 설명서에 따라 pGEMT 벡터(Promega)에 클로닝시켰다.
보에케라
홀보엘리로부터
DYAD
상동체의
클로닝
보에케라 홀보엘리로부터의 애기장대 DYAD 상동체의 게놈 코딩 영역(BhDYAD)을 5' 말단에 BamH1 부위를 갖는 프라이머: Bho5BAM (서열번호 39) 및 Bho3BAM (서열번호 40)로 증폭시켰다. 결과물인 3kb 단편을 pGEMT에 클로닝시켰다.
애기장대
DYAD
프로모터 하에
BhDYAD
를 구동시키는 이중벡터
pCAMBIA1300
의 작제
BhDYAD를 3 kb BamH1 단편으로서 pGEMT로부터 분리시키고 식물 선택성 마커 히그로마이신을 갖는 pCAMBIA1300 벡터에 클로닝시켰다. 프라이머 BDY3 (서열번호 36) 및 OCSR (서열번호 38)을 이용하여 배향을 확인하였다. pGEMT 벡터로부터 SacI 단편으로서 1.6 kb DYAD 프로모터 영역(서열번호 22)을 분리시키고 pCAMBIA1300 벡터 내에 BhDYAD의 상류에 삽입시켰다. 프라이머 ismr4 (서열번호 37) 및 bdyl (서열번호 35)을 이용하여, BhDYAD 서열에 대한 프로모터의 배향을 확 인하였다.
삼조
교배(
triparental
mating)
전술된 바와 같이 구축된 이중 벡터 pCAMBIA의 아그로박테리움(AGL1)으로의 이전은 개시된 바와 같은 삼조 교배에 의해 수행하였다(Agashe B, Prasad C. K., and Siddiqi I , Development, Vol. 129(16): 3935-3943 (2002)).
애기장대 식물의 형질전환
BhDYAD의 상보작용 분석을 위해, Col-O x dyad의 F1 식물을 애기장대 DYAD 프로모터에 의해 구동되는 BhDYAD를 갖는 작제물로 형질전환시켰다. Bechtold N. and Pelletier G., Methods Mol. Biol., Vol. 82: 259-66 (1998)에 따라 아그로박테리움 매개 인 플란타 진공 침투 형질전환을 수행하였다.
형질전환체의 선택
진공 침투된 F1 식물로부터의 T0 종자를 0.8% 박토 아가(Bacto Agar), 1mM KN03 및 1% 수크로오스 및 20 ㎍/ml 히그로마이신을 포함하는 페트리 플레이트에 플레이팅하였다. 3일간 냉 층화(cold stratification) 후에, 상기 플레이트를 생장 챔버로 옮겼다. 이전 후 최소 5일 후에 잘 신장된 뿌리, 직립한 배축(erect hypocotyl) 및 잘 전개된 자엽형 잎(cotyledonary leaves)에 의해 히그로마이신에 내성을 갖는 형질전환체를 식별할 수 있다. 선택된 형질전환체를 히그로마이신을 포함하는 MS 플레이트로 옮기고, 저항성이 확립된 후, 그들을 최종적으로 토양 매질로 옮겼다. 또한, 식물체를 대상으로 앞서 기재된 바와 같이 bdy3 및 OCSR 프라이머를 이용하여 삽입물의 존재에 대해 확인하였다.
dyad
좌에서 접합자(
zygosity
)에 대한 유전자형 분석(
genotyping
)
분리되는 dyad F2 집단으로부터의 세 개의 유전형을 공동우성(codominant) CAPS 마커(Konieczny A. and Ausubel F. M., Plant J., Vol. 4(2): 403-410, 1993) 및 가변성 마이크로새틀라이트에 의해 확인하였다. dyad 돌연변이체 대립형질의 플랭킹 서열은 랜즈베르그 에렉타(Landsberg erecta) 생태형으로부터 유래되고 야생형 대립형질로부터의 플랭킹 서열은 콜럼비아(Columbia) 생태형 서열을 갖는다. 따라서, dyad 좌와 밀접하게 연관되고 그의 양쪽 측면에 위치한 CAP 마커(KNEF (서열번호 31) 및 KNER(서열번호 32), KKF(서열번호 33) 및 KKR(서열번호 34)) 및 DYAD에 밀접하게 연관된 마이크로새클라이트 마커 프라이머(KMF(서열번호 29) 및 KMR(서열번호 30))를 개발하기 위해 이 플랭킹 서열의 SNP를 이용하였다(Agashe B, Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)). 전술된 마커를 이용한 dyad 좌에서의 유전형 분석이 개시되었다(Agashe B, Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)).
RNA
분리 및
cDNA
합성
이배체 그린랜드 식물로부터 잘 발달된 단아(single bud)를 이용하여 제조사의 설명서에 따라 TriZol 시약(Invitrogen)에 의해 전체 RNA 분리를 수행하였다. cDNA 합성용 Superscript™ Choice 시스템(GIBCO BRL)을 이용하여 제1 가닥 cDNA 합성을 위해 4 ㎍의 전체 RNA를 사용하였다. 프라이머 5RF3(서열번호 41) 및 Bho3BAM (서열번호 40)을 이용하여 클로닝을 위해 상기 cDNA를 증폭시켰다. 결과물인 1.9 KB 단편을 pGEMT에 클로닝하고 서열을 결정하였다. 그 결과는 서열번호 17로 서열목록에 제시된다. 상응하는 DYAD 단백질의 아미노산 서열은 서열번호 18로 표시된다.
실시예
6:
DYAD
의 조건부
대립형질의
작제
및
dyad
돌연변이체 표현형을 보이는 형질전환 식물의 동질적 집단의 개발
DYAD 유전자의 조건부 대립형질(conditional allel)을 작제하기 위해 이용된 전략은 랫트 글루코코르티코이드 수용체(GR)의 호르몬 결합 도메인(서열번호 27)의 DYAD의 C-말단으로의 융합 및 dyad 돌연변이체 대립형질에 대해 동형접합인 식물(dy/dy)의 게놈으로의 상기 융합 작제물의 통합에 근거한다. 스테로이드 호르몬의 부재시 GR 도메인은 세포질 국소화를 부여할 수 없으나, DYAD의 작용 부위는 핵에 있기 때문에 DYAD-GR 융합 단백질 스스로는 dyad 돌연변이체를 상보할 수 없다. 그러나, 스테로이드 호르몬의 존재 시, 상기 융합 단백질은 세포질 결합 부위로부터 방출되어 dyad 돌연변이체를 보완할 수 있는 핵으로 전이될 수 있게 된다. 상기 작제물을 구축하는 단계는 하기와 같다: 식물 이중 벡터 pBI101.3을 BamH1 및 SacI로 처리하여 GUS 리포터 유전자를 제거하고 이를 GR 도메인을 포함하는 BamH1-SacI 단편으로 치환한다(A.M. Lloyd et al., Science 266, 436-439 (1994)).
결과물인 플라스미드를 pBI101.3::GR로 명명하였다. 그 후, 프라이머 DyCF (서열번호 43) 및 DyPB (서열번호 42)(종결 코돈을 변형시키고 BamH1 및 PstI를 위한 제한효소 인식 부위를 도입하는 서열을 포함함)를 이용하여 DYAD 유전자의 304-bp C-말단 영역을 PCR로 증폭시켰다. 상기 변형된 서열을 Pl 클론 MFG13 (Ace No. AB025621)의 위치(coordinate) 9684 내지 3878에 해당하는 전체 DYAD 유전자를 포함하는 5.8 kb 게놈 클론(서열번호 28)을 갖는 pBS(KS)::Dyad 플라스미드에 216 bp PstI 단편으로 클로닝시켜 pBS(KS)::Dyad*를 생성했다. 결과물인 플라스미드는 그 종결 코돈 TGA가 GGG로 치환되고 상기 치환된 코돈을 따라 BamH1 부위를 갖는 DYAD 유전자를 포함했다. Sall 및 BamH1에 의한 처리 후에 pBSII(KS)::Dyad*로부터의 MFG13의 9684번 내지 9416번 뉴클레오티드를 포함하는 269 bp SalI-BamH1 단편을 pBI101.3::GR에 클로닝시켰다. 그 후, 9417-5335로부터의 DYAD의 나머지 부분을 pBS(KS)::Dyad*로부터의 BamH1- BamH1 단편으로서 GR 도멘인의 DYAD의 C-말단으로의 프레임 융합을 초래한 이전 단계의 생성물에 클로닝시켰다. pBI101.3::Dyad△GR로 명명된 최종 플라스미드가 도 6에 도시된다.
상기 작제물을 헬퍼 대장균 변종 HB101[pRK2013]을 이용한 삼조 교배에 의해 아그로박테리움 변종 AGL1으로 도입시켰다. T-DNA 영역을 인-플란타 형질전환에 의해 dyad 돌연변이체 대립형질(+/dy)에 대해 이형접합인 애기장대 식물(TO)로 형질전환시켰다(Bechtold N. and Pelletier G., Methods Mol. Biol., Vol. 82: 259- 66, 1998). 카나마이신(50 mg/리터)을 함유하는 MS 아가 플레이트 상에 종자를 플레이팅하는 것에 의해 카나마이신 저항성을 갖는 T1 모종을 선택하고 MS + 카나마이신 플레이트로 옮겨서 저항성 표현형을 확인하였다. DyCF (서열번호 43) 및 GRrev (서열번호 44) 프라이머를 이용한 PCR에 의해 형질전환체를 더 확인하였다. 확인된 카나마이신 저항성 모종들을 토양으로 옮기고 성체 단계까지 생장시켰다. 추대(bolting) 및 최초 8-10개의 장각과의 발달 후에, 식물에 10 μM 덱사메타손 + 0.015% Silwet L-77을 매일 분무하는 것 외에 3일 간격으로 10 μM 덱사메타손을 포함한 물을 주었다. 덱사메타손 처리 전에 불임을 보였던 여러 개의 식물이 덱사메타손 처리 개시 5-7일 후에 수정능력을 갖게 된다는 것이 주목되었다. 식물 물질의 일부를 서던 분석(Southern analysis)에 이용하여 삽입물의 카피 수를 결정하고 dyad 좌와 밀접하게 연관되고 이를 플랭킹하는 PCR 기반 CAPS 마커들을 이용하여 dyad 좌에 대해 유전형 분석을 수행하였다. dyad 돌연변이체는 원래 Ler 배경에서 분리되고 Col 변종으로 이입되었다. 따라서, CAPS 마커의 Ler 대립형질은 dyad 돌연변이체에 특징적이며, 반면에 Col 대립형질은 야생형을 나타낸다(도 7). 한 카피 이상의 dyad 돌연변이체 대립형질을 갖는 식물에서 단일 카피 삽입이 확인되었고 이 식물로부터의 종자를 MS + 카나마이신 플레이트 상에 플레이팅하였다. 카나마이신 저항성 모종을 토양으로 옮기고 dyad 좌에 대해 유전형을 분석하였다. dyad 돌연변이체 대립형질에 대해 동형접합인 식물을 식별하고 성체 단계까지 생장시켰다. 추대 후에, 초기부터 최초 8-10개의 꽃의 개화기까지 모든 식물에 물을 주고, 그 후, 전술된 바와 같이 덱사메타손을 함유한 용액으로 물을 주었다. 조 건부 불임(conditional sterility)을 보이는 계통들을 상이한 단일 카피 삽입(single copy insertion)을 스크리닝하는 것에 의해 식별하였다. 예로서, 도 8에 도시된 계통 No. 33은 생식 성장의 초기 동안 불임을 보이고 덱사메타손 처리 후 수정능력을 갖게 되는 dyad 돌연변이체 식물(dy/dy)를 생성했다. 덱사메타손 처리 전에 분리된 눈으로부터의 배주는 dyad 돌연변이체 표현형을 보였으나, 덱사메타손 처리 후에 분리된 눈으로부터의 배주는 야생형 표현형을 보였다(도 9). 동형접합 dyad 돌연변이체 식물로부터 종자를 채취하여 T3 패밀리를 생성하고 패밀리에 대한 스크리닝에서 DYAD-GR 삽입에 대해 동형접합인 T3 패밀리를 식별하였고, 이들은 모두 카나마이신 저항성 모종을 생성했다. 이 결과들은 일련의 조건(덱사메타손의 부재) 하에서 dyad 돌연변이체 표현형을 보이고 덱사메타손이 공급(또는 분무)되면 야생형 표현형을 보이는 식물을 생성하게 하는, DYAD의 조건부 대립형질의 작제 및 그의 식물로의 도입을 보여준다. 이 결과들은 또한 모두 dyad 돌연변이체 표현형을 보이는 식물의 동질적 집단의 개발을 가능하게 한다.
본 연구에서 이용된 글루코코르티코이드 수용체 도메인 서열 (914 bp) (서열번호 27)
pBS(KS)::Dyad에 Sal1 단편으로서의 클로닝을 위해 이용된 DYAD 게놈 서열 (5807 bp) (서열번호 28)
실시예
7: 삼배체(3n)인
dyad
돌연변이체의 자가수분 종자는 자성 배우체로부터의 이배체(2n) 기여를 포함한다.
사배체(4n) 야생형 애기장대와 이배체(2n) 야생형 애기장대 식물 간의 상호교배(reciprocal cross)를 수행하였다. 양 경우 모두에서, 생성된 종자는 삼배체였다. 그러나, 웅성 부모는 사배체이고 자성 부모는 이배체인 경우, 생성된 종자는 컸으나, 웅성 부모는 이배체이고 자성 부모는 사배체인 경우, 종자는 축소되었다. 이 결과들은 도 10에 도시되며 종자의 각 카테고리당 100개 종자의 중량(100-seed weight)은 표 2에 표시된다.
표 2: 다양한 교배의 식물로부터 수득된 100개 종자의 중량
종자 카테고리
종자 중량(㎍)
이배체 콜럼비아 야생형(WT) 종자 - 2142
사배체 랜즈베르그 에렉타 - 3352
이배체 콜럼비아 x 사배체 La-er ㎍ (부계 과잉) - 3004
사배체 La-er x 이배체 콜럼비아 (모계 과잉) - 1302
dyad 대형 카테고리 종자 - 3453
dyad 정상 카테고리 종자 - 2012
dyad 축소형 카테고리 종자 - 1379
이 결과들은 선행기술에서 알려진 것들을 재현한 것이다(Scott RJ et al., Development 125, 3329-3341, 1998). 임의의 메카니즘 이론에 의해 한정되지 않으면서, 종자 발달의 조절에서 부계 및 모계 게놈의 비등가성(nonequivalence)은 모든 종자 간에 자원의 균등한 분배를 제공하는 것에 의해 배아의 생장을 제한하는 모계 부모와 보다 많은 자원을 확보하는 것에 의해 적응도(fitness)가 증가되는 각각의 배아 간의 자원 분배에 대한 경쟁으로부터 일어나는 부모-자손 충돌 이론(parent-offspring conflict theory)(Haig D. and Westoby M., Am. Nat. Vol. 134: 147-155, 1989)에 따라 설명되었다. Haig D. and Westoby M., Am. Nat. Vol. 134: 147-155, 1989에 따르면, 배아에서 모계에 의해 발현되는(maternally expressed) 각인 유전자(imprinted gene)는 배아의 생장을 제한하기 위해 작용하나, 부계에 의해 발현되는 유전자는 증가된 배아의 생장의 촉진한다. 따라서, 여분의 부계 게놈 등가물(extra paternal genome equivalent)을 포함하는 종자는 배아의 생장을 촉진하는 유전자 생성물의 과량 때문에 정상보다 크며, 반면에 여분의 모계 게놈 등가물을 포함하는 종자는 배아의 생장을 한정하는 유전자 생성물의 과량 때문에 정상보다 더 작다.
dyad 돌연변이체의 자가수분 종자에서 모계 및 부계 기여를 파악하기 위해, 종자들을 크기에 대해 분석하였다. dyad 돌연변이체 식물로부터 수득된 자가수분 종자은 크기가 이질적이고 도 10에 도시된 바와 같이, 대형(large), 정상(normal) 및 축소형(shrunken)의 세 개의 카테고리로 분류되었다. 7개의 개별적인 dyad 돌연변이체 식물로부터의 크기 분류 분포는 하기와 같다:
표 3: dyad 돌연변이체 식물로부터의 종자의 크기 분류 분포:
식물 No. | N | L | S |
1. | 18 | 7 | 79 |
2. | 44 | 26 | 64 |
3. | 25 | 25 | 36 |
4. | 47 | 21 | 33 |
5. | 46 | 5 | 52 |
6. | 58 | 16 | 98 |
7. | 16 | 6 | 37 |
합계 | 254 | 106 | 399 |
복수 개의 식물로부터 각 분류의 종자를 시료로 채취하고, 발아시키고 식물로 생장시켰다. 감수분열 전개(meiotic spread)에서 각 식물의 배수성을 염색체 수에 의해 결정하였다. 그 결과가 하기의 표 4에 표시된다:
표 4: 자가수분된 dyad 돌연변이체에서 각 종자 분류로부터의 식물의 배수성
카테고리 | 이배체 | 삼배체 | 사배체 | 기타(이수성) |
축소형(shrunken) | 2(4) | 41(85) | - | 5(11) |
대형(large) | 26(72) | 3(8.5) | 3(8.5) | 4(11) |
정상(normal) | 5(14) | 26(76) | - | 4(10) |
괄호 안의 숫자는 각 카테고리에서 조사된 총 식물 대비 백분율을 표시한다.
이 데이터는 대부분의 삼배체는 크기가 축소되며 종자의 축소형 카테고리의 대부분을 차지한다는 것을 보여준다. 대부분의 삼배체가 축소형이라는 관찰은 그들이 과다한 모계 기여(2n)로부터 생성되며 과다한 부계 기여로부터 생성되지 않아서, 삼배체에서 1n인 부계 기여를 갖는다는 것을 보여준다. 모든 삼배체가 부모의 이형접합성(parental heterozygosity)을 유지한다는 실시예 4의 결과와 함께, 이 결과들은 이형접합성의 유지가 모계 부모로부터 수득되며, 따라서 삼배체는 부모의 이형접합성을 유지한 감소되지 않은 자성 배우체로부터 생성된다는 것을 나타낸다.
dyad의 삼배체가 2n 자성 기여로부터 생성된다는 것을 확인하기 위해, 본 발명자들은 자성인 dyad 돌연변이체를 웅성인 계통 ETC60 (DYAD에 대해 야생형)에 교배시켜 F1 종자를 생성했다. ETC60 계통(미국특허출원 제10/857,539호에 개시됨)은 카나마이신 저항성 유전자를 갖는 Ds 트랜스포손의 단일 카피를 갖는다. F1의 야생형 이배체 식물에 대한 추가적인 교배 후 카나마이신 저항성의 분리를 추적하여, F1 식물에서 웅성 배우체로부터 배수성 기여를 결정할 수 있다. 제1 교배로부터의 종자를 발아시키고 모종을 토양으로 옮겼다. 6개의 F1 식물을 대상으로 카나마이신 저항성-특이적 프라이머(KanF 서열번호 49 및 KanR 서열번호 50)를 이용하여 카나마이신 저항성 유전자의 존재에 대해 테스트하고, 유전자-특이적 프라이머 GLTF (서열번호 46)와 조합된 트랜스포손 특이적 Ds5-2 프라이머(서열번호 45)를 이용하여 ETC60의 트랜스포손의 카피에 대해 테스트하였다. 6개의 식물 모두는 카나마이신 저항성을 갖는 Ds 요소에 대해 양성이었고 또한 DYAD의 야생형 카피를 포함하는 교배된 식물에 대해 예상되는 바와 같이 수정능력을 가졌다. 감수분열 염색체의 전개를 이용하여 상기 6개의 식물의 배수성을 조사하였다. 3개의 식물은 15개의 염색체를 갖는 삼배체이고, 2개의 식물은 16개의 염색체를 가졌으며, 1개의 식물은 17개의 염색체를 갖는 것으로 확인되었다. 이 결과는 자성 배우체가 감소되지 않은/초이배체(hyperdiploid) 포자로부터 생성되었을 가능성을 시사한다. 반 수체 화분에 의한 감소되지 않은 자성 생식세포의 수정은 카나마이신 저항성 유전자에 대해 단수성(simplex)일(Kkk) (근사(near)) 삼배체를 생성할 것이다. 대안적으로, 삼배체는 반수체 자성 생식세포의 감소되지 않은 웅성 생식세포에 의한 수정으로부터 생성되거나 또는 삼배체가 카나마이신 저항성 유전자에 대해 이수성(duplex)일(KKk), 두 개의 감소된 웅성 생식세포에 의한 수정으로부터 생성될 수 있다.
단수성 조건 식물(simplex condition plant)이 카나마이신 저항성을 갖지 않는 야생형 식물에 교배되는 경우, 결과물인 식물에서 카나마이신 저항성 대비 감수성의 분리비는 1:1일 것이다. 그러나, 이수성(duplex) 조건 식물이 야생형 식물에 교배되는 경우, 상기 분리비는 5:1일 것이다. 앞서 수득된 삼배체 식물 중 2개와 야생형 식물의 교배를 수행하고, 수득된 종자를 대상으로 카나마이신 저항성의 분리를 평가하였다. 표 5에 표시된 결과는 카나마이신 저항성에 대한 1:1 분리를 나타내어, 다정자 침입을 배제하고, 삼배체는 감소되지 않은 자성 배우체로부터 생성된다는 것을 보여준다.
표 5: 교배에서 KanR 표현형의 분리
종자의 총수 | KanR 모종 | KanS 모종 | 발아되지 않은 종자* | χ2 테스트에 의한 적합도에 대한 통계적 유의성 | |
식물 1 | 581 | 254 | 236 | 91 | 1:1**χ2 =0.660;P>0.01 NS 5:1***χ2 =240.18;P<<0.001 S |
식물 2 | 321 | 121 | 132 | 68 | 1:1**χ2 =0.578;P>0.01 NS 5:1***χ2 =138.21;P<<0.001 S |
* 상기 종자는 삼배체 부모의 이배체 부모에 대한 교배의 결과이기 때문에, 일부 종자는 이수성(aneuploidy)으로 인해 발아될 것으로 예상되지 않음.
** 1:1 비의 적합도(goodness of fit)에 대한 유의성 테스트는 발아되지 않은 종자를 제외하고 계산됨.
*** 5:1 비의 적합도에 대한 유의성 테스트는 KanR 카테고리에 발아되지 않은 종자를 포함시켜 계산됨. 이론적으로, 발아되지 않은 종자의 50%만이 각 카테고리에 포함되어야 하나(수득된 KanR and KanS 모종의 비에 근거하여), 유의성 수준을 증가시키기 위해, 본 발명자들은 전체 발아되지 않은 로트(lot)를 KanR 카테고리에 포함시킴. 이는 본 발명자들이 전체 발아되지 않은 로트(lot)를 KanR 카테고리에 포함시키더라고, 5:1 비에 대한 적합도가 유의하지 않고, 따라서 1:1 비만을 제공하는 조건을 강력하게 지지하는 것을 배제함.
S χ2 테스트에서 유의하며, 주어진 비를 따르지 않는다는 것을 나타냄.
NS χ2 테스트에서 유의하지 않으며, 주어진 비를 따른다는 것을 나타냄.
실시예
8: 포플러(
포플러스
트리코카르파
(
Populus
trichocarpa
))로부터의 DYAD 유전자 및 코딩 서열
포플러로부터의 DYAD 유전자의 추가적인 예는 http://www.ornl.gov/sci/ipgc에서 찾을 수 있다.
cDNA 서열의 코딩 부분의 번역은 도 11에서 Clustal W 프로그램을 이용하여 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 야생형 DYAD 단백질의 아미노산 서열에 비교된 아미노산 서열을 제공한다.
http://www.ornl.gov/sci/ipgc에 있는 AtDyad 상동체 포플러스 트리코카르파(Populus trichocarpa)
게놈 영역(서열번호 24)
엑손
인트론
최초 ATG의 상류 2444 bp 포함
데이터베이스에 있는 전사체/CDS(2493 bp)(서열번호 25)
데이터베이스에 있는 단백질 서열(83O aa) (서열번호 26)
>eugene3.00030791 [Poptr1:554158]
실시예
9: 옥수수
DYAD
폴리뉴클레오티드 및 폴리펩티드의 식별
웹사이트(www.plantgdb.org)에서 TBLASTN 및 쌀 DYAD 단백질(서열번호 51)을 질의(query)로 이용한 검색은 콘티그 ZmGSStucl1-12-04.1016.1(서열번호 52) 및 ZmGSStucl1-12-04.1016.2 (서열번호 53)에 해당하는 옥수수 게놈의 영역 내에 추정적인(putative) DYAD 유전자의 존재를 밝혔다. 수동 편집(manual editing)과 함께 GENSCAN (http://genes.mit.edu)을 이용한 상기 영역의 주석(annotation)은 쌀 DYAD 폴리펩티드 서열과 정렬될 수 있는 추정적인 옥수수 폴리펩티드 서열의 확인을 가져왔다(도 12). 본 발명은 상기 옥수수 폴리펩티드 서열 및 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 용도를 포괄한다.
제아 마이스(Z. mays)로부터 수득된 폴리펩티드 서열을 하기의 뉴클레오티드 위치(coordinate)에 의해 표시된 바와 같이 콘티그 뉴클레오티드 서열에 맵핑시켰다. 상기 콘티그 서열에 의해 코딩된 조립된 부분적 Zm DYAD 폴리펩티드 서열도 표시된다.
ZmGSStucl1-12-04.1016.1(서열번호 52) 위치 및 개념적 번역(conceptual translation)
Z. mays 조립된 폴리펩티드: (서열번호 54)
ZmGSStucl1-12-04.1016.2(서열번호 53) 위치 및 개념적 번역
774 MSLFIS 757; 574 KPQVKK......PTYHA 418;315 GAFYEID......SIRVVK 237; 144 VSECTN......SNHAAR l;
Z. mays 조립된 폴리펩티드: (서열번호 55)
실시예
10: 단위생식을 위한 일반적인 절차
최적 방사선조사량의 결정:
1. 이용될 자성 부모 식물과 동일한 종 또는 관련된 종의 웅성 부모 식물로부터 꽃밥을 채취하고 1, 5, 10, 20, 30, 50, 70, 100, 150, 200 krad을 포함하는 조사량 범위에서 이온화 방사선으로 조사한다.
2. DNA 마커(마이크로새틀라이트, CAPS, 또는 RAPD)에 대해 하나 이상의 열성 표현형 마커를 갖는다는 점에서 상기 조사된 화분 부모와 상이한 자성 식물로부터의 자성 꽃 또는 수술이 제거된(emasculated) 꽃을 수분시킨다. 바람직하게는,이온화 방사선의 각 조사량 당 수분을 위해 10-50개의 꽃을 이용한다.
3. 수분된 꽃으로부터 종자를 채취하고 동일한 조사량이 조사된 화분으로 수분된 꽃으로부터의 종자를 합친다.
4. 종자를 발아시키고 식물로 생장시켜, 각 조사량 당 약 20-100개의 식물을 생성한다.
5.표현형 마커 또는 DNA 마커에 대해 식물의 유전형을 평가하고 모계 부모를 닮은 식물의 비율을 계산한다.
6. 높은 비율의 살아있는 식물 및 높은 비율의 모계 부모를 닮은 식물의 최적 조합을 생성하는 조사량을 선택한다.
dyad 돌연변이체 식물에서 단위생식의 유도:
1. 전술된 바와 같이 결정된 적합한 조사량의 이온화 방사선을 이용하여 조사된 화분으로 dyad 돌연변이체 식물을 수분시킨다.
2. 종자를 채취한다.
3. 종자를 발아시켜 식물로 생장시킨다.
단위생식 식물의 식별:
1. 자성 부모에 의해 운반되는 열성 표현형 마커에 대해 식물을 평가한다. 상기 열성 표현형을 보이는 식물을 단위생식에 의한 것(parthenogenetic)으로 분류한다. 또한, 식물을 식물 조직으로부터 DNA를 분리하고 다형성 마커(polymorphic marker)에 대해 DNA를 분석하는 것에 의해 DNA 마커에 대해 평가할 수 있다. 자성 부모의 특징적인 마커 패턴을 보이고 웅성 부모에 대한 마커 밴드를 갖지 않는 식물을 단위생식에 의한 것으로 분류한다. 따라서, 수분 실험으로부터의 단위생식성 식물의 백분율이 계산될 수 있다.
2. 단위생식성 식물을 자성 부모가 이형접합인 마커에 대해 조사할 수 있다. 자성 dyad 돌연변이 부모가 이형접합인 모든 마커에 대해 이형접합성을 유지하는 식물은 무성생식에 의한 식물(apomictic) 식물이다.
상이한 작물 종에 대해 이용될 수 있는 가능한 분자 마커들에 대한 참조문헌들이 하기에 열거된다:
밀:
www.gramene.org
1. Torada et al. (2006). SSR-based linkage map with new markers using an intraspecif[iota]c population of common wheat. Theor Appl Genet. 2006 Apr;112(6):1042-51.
2. Song et al. (2005). Development and mapping of microsatellite (SSR) markers in wheat. Theor Appl Genet. 2005 Feb;110(3):550-60.
쌀:
www.gramene.org
1. Harushima et al. (1998). A high-density rice genetic linkage map with 2275 markers..." Genetics 148: 479-494.
2. Causse et al. (1994). Saturated molecular map of the rice genome based on an interspecific backcross population. Genetics. 1994 Dec;138(4):1251-74.
옥수수: Coe et al. (2002). "Access to the maize genome: an integrated physical and genetic map". Plant Physiol. 128: 9-12.
www.gramene.org
보리: www.gramene.org
Wenzl et al. (2006). A high-density consensus map of barley linking DArT markers to SSR, RFLP and STS loci and agricultural traits. BMC Genomics. 2006 Aug 12;7(l):206
귀리: www , gramene . org
De Koeyer et al. (2004). A molecular linkage map with associated QTLs from a hulless x covered spring oat population. Theor Appl Genet. 2004 May;108(7):1285-98.
진주 조(Pearl millet): www. gramene . org
An integrated genetic map and a new set of simple sequence repeat markers for pearl millet, Pennisetum glaucum. Theor Appl Genet. 2004 Nov;109(7):1485-93.
수수: Chittenden et al. (1994). "A detailed RFLP map of Sorghum bicolor ...". Theor. Appl. Genet. 87: 925-933.
꽃양배추(Brassica oleracea): Bohuon et al. (1998). "Comparison of a Brassica oleracea genetic map with the genome of Arabidopsis thaliana". Genetics 150: 393-401.
적갓(Brassica juncea): Pradhan et al. (2003). A high-density linkage map in Brassica juncea (Indian mustard) using AFLP and RFLP markers. Theor Appl Genet. 2003 Feb;106(4):607-14.
유채(Brassica napus): Piquemal et al. (2005). Construction of an oilseed rape (Brassica napus L.) genetic map with SSR markers. Theor Appl Genet. 2005 Nov;l 11(8):1514-23.
순무(Brassica rapa): Kole et al. (1997). Genetic linkage map of a Brassica rapa recombinant inbred population. J. Hered. 88:553-557
면화(Cotton): Rong et al. (2004). "A 3347-locus genetic recombination map ..." Genetics 166: 389-417.
토마토: Zhang et al. (2002). A molecular linkage map of tomato displaying chromosomal locations of resistance gene analogs based on a Lycopersicon esculentum x Lycopersicon hirsutum cross. Genome 2002 Feb;45(l): 133-46.
가지: Doganlar et al. (2002)A comparative genetic linkage map of eggplant(Solanum melongena) and its implications for genome evolution in the solanaceae. Genetics 161(4):1697-711
고추(Capsicum): Genome mapping in capsicum and the evolution of genome structure in the solanaceae. Genetics 152(3): 1183-202.
감자: Tanksley et al. (1992). High density molecular linkage maps of the tomato and potato genomes. Genetics 132(4): 1141-1160.
대두: Ferreira et al. (2000). Soybean genetic map of RAPD markers assigned to an existing scaffold RFLP map. J. Hered. 91(5): 392-396.
포플러(Populus): Yin et al. (2001). Preliminary interspecific genetic maps of the populus genome constructed from RAPD markers. Genome 2001 Aug;44(4):602-9.
Tuskan et al. (2004). Characterization of microsatellites revealed by genomic sequencing of Populus trichocarpa. Canadian J. Forest Res. 34(1): 85-93.
플라스미드 pBI101.3::Dyad△GR로 형질전환된 대장균 변종 DH5α의 시료를 국제 기탁 기구(International Depository Authority), MTCC(Microbial Type Culture Collection) 및 Gene Bank, IMTECH(Institute of Microbial Technology), CSIR(Council of Scientific and Industrial Research)(Sector-39A, Chandigarh - 160 036, India)에 기탁하였다. 상기 시료를 2006년 12월 1일에 기탁하여 Internal Reference No. BI507를 지정받았다. 웅성인 dyad 돌연변이체와 야생형 자성 식물의 교배로부터 수득되고 dyad 돌연변이체에 대해 분리되는 F2 집단의 2500개 이상의 종자를 포함하는 시료를 American Type Culture Collection (Manassas, VA20108, USA)에 기탁하였다. 상기 시료를 2006년 12월 1일에 기탁하여 Internal Reference No. ISDYF2C를 지정받았다. dyad 및 Dyad△GR 삽입에 대해 동형접합이고 덱사메타손에 대한 반응에서 조건부 수정능력을 보이는 2500개 이상 의 종자(계통 번호 33으로부터 유래)를 포함하는 시료를 ATCC)American Type Culture Collection)(Manassas, VA20108, USA)에 기탁하였다. 상기 시료를 2006년 12월 1일에 기탁하여 Internal Reference No. 33-5DYGR을 지정받았다.
과학 정기간행물 및 특허 문헌의 다양한 게재물이 본 명세서에서 인용된다. 그와 같은 각각의 게재물은 이에 의해 참조로 그 전체가 그와 같은 이용을 위한 모든 목적을 위해 본 명세서에 포함된다.
SEQUENCE LISTING
<110> SIDDIQI, Imran
<120> NUCLEIC ACIDS AND METHODS FOR PRODUCING SEEDS HAVING A FULL
DIPLOID COMPLEMENT OF THE MATERNAL GENOME IN THE EMBRYO
<130> 2761-0127PUS1
<160> 55
<170> PatentIn version 3.3
<210> 1
<211> 1979
<212> DNA
<213> Arabidopsis dyad
<220>
<221> CDS
<222> (31)..(1587)
<400> 1
gaggaacgaa gattatcgag agcaaaaatc atg agt agt acg atg ttc gtg aaa 54
Met Ser Ser Thr Met Phe Val Lys
1 5
cgg aat ccg att aga gaa acc acc gcc ggg aaa atc tct tcg ccg tcg 102
Arg Asn Pro Ile Arg Glu Thr Thr Ala Gly Lys Ile Ser Ser Pro Ser
10 15 20
tca ccg act ttg aat gtt gca gtc gcg cat ata aga gct gga tct tat 150
Ser Pro Thr Leu Asn Val Ala Val Ala His Ile Arg Ala Gly Ser Tyr
25 30 35 40
tac gaa atc gat gct tcg att ctt cct cag aga tcg ccg gaa aat ctt 198
Tyr Glu Ile Asp Ala Ser Ile Leu Pro Gln Arg Ser Pro Glu Asn Leu
45 50 55
aaa tcg att aga gtc gtc atg gtg agc aaa atc acg gcg agt gac gtg 246
Lys Ser Ile Arg Val Val Met Val Ser Lys Ile Thr Ala Ser Asp Val
60 65 70
tct ctc cgg tac cca agc atg ttt tca ctc cga tcg cat ttc gat tac 294
Ser Leu Arg Tyr Pro Ser Met Phe Ser Leu Arg Ser His Phe Asp Tyr
75 80 85
agt agg atg aac cgg aat aaa ccg atg aag aag agg agt ggt ggt ggt 342
Ser Arg Met Asn Arg Asn Lys Pro Met Lys Lys Arg Ser Gly Gly Gly
90 95 100
ctt ctt cct gtt ttc gac gag agt cat gtg atg gct tcg gag cta gct 390
Leu Leu Pro Val Phe Asp Glu Ser His Val Met Ala Ser Glu Leu Ala
105 110 115 120
gga gac ttg ctt tac aga aga atc gca cct cat gaa ctt tct atg aat 438
Gly Asp Leu Leu Tyr Arg Arg Ile Ala Pro His Glu Leu Ser Met Asn
125 130 135
aga aat tcc tgg ggt ttc tgg gtt tct agt tct tct cgc agg aac aaa 486
Arg Asn Ser Trp Gly Phe Trp Val Ser Ser Ser Ser Arg Arg Asn Lys
140 145 150
ttt cca aga agg gag gtg gtt tct caa ccg gcg tac aat act cgt ctc 534
Phe Pro Arg Arg Glu Val Val Ser Gln Pro Ala Tyr Asn Thr Arg Leu
155 160 165
tgt cgc gct gct tca ccg gag gga aag tgc tcg tct gag ctg aaa tcg 582
Cys Arg Ala Ala Ser Pro Glu Gly Lys Cys Ser Ser Glu Leu Lys Ser
170 175 180
gga ggg atg atc aag tgg gga agg aga ttg cgt gtg cag tat cag agt 630
Gly Gly Met Ile Lys Trp Gly Arg Arg Leu Arg Val Gln Tyr Gln Ser
185 190 195 200
cgg cat att gat act agg aag aat aag gaa ggt gag gag agt tct aga 678
Arg His Ile Asp Thr Arg Lys Asn Lys Glu Gly Glu Glu Ser Ser Arg
205 210 215
gtg aag gat gaa gtt tac aaa gaa gaa gag atg gag aaa gaa gag gat 726
Val Lys Asp Glu Val Tyr Lys Glu Glu Glu Met Glu Lys Glu Glu Asp
220 225 230
gat gat gat ggg aat gaa ata gga ggc act aaa caa gag gca aag gag 774
Asp Asp Asp Gly Asn Glu Ile Gly Gly Thr Lys Gln Glu Ala Lys Glu
235 240 245
ata act aat gga aat cgt aag aga aag ctg att gaa tca agt act gag 822
Ile Thr Asn Gly Asn Arg Lys Arg Lys Leu Ile Glu Ser Ser Thr Glu
250 255 260
aga ctc gct cag aaa gct aag gtt tat gat cag aag aag gaa act caa 870
Arg Leu Ala Gln Lys Ala Lys Val Tyr Asp Gln Lys Lys Glu Thr Gln
265 270 275 280
att gtg gtt tat aag agg aaa tca gag agg aag ttc att gat aga tgg 918
Ile Val Val Tyr Lys Arg Lys Ser Glu Arg Lys Phe Ile Asp Arg Trp
285 290 295
tct gtt gag agg tac aaa cta gct gag agg aac atg tta aaa gtg atg 966
Ser Val Glu Arg Tyr Lys Leu Ala Glu Arg Asn Met Leu Lys Val Met
300 305 310
aag gag aag aat gca gtg ttt ggc aac tcc ata ctc agg cca gag ttg 1014
Lys Glu Lys Asn Ala Val Phe Gly Asn Ser Ile Leu Arg Pro Glu Leu
315 320 325
agg tca gaa gca agg aag ctg att ggt gac aca ggt cta ttg gat cat 1062
Arg Ser Glu Ala Arg Lys Leu Ile Gly Asp Thr Gly Leu Leu Asp His
330 335 340
ctg ctt aag cac atg gct ggt aag gtg gct cct gga ggt caa gat agg 1110
Leu Leu Lys His Met Ala Gly Lys Val Ala Pro Gly Gly Gln Asp Arg
345 350 355 360
ttt atg aga aag cac aat gca gat ggg gca atg gag tat tgg ttg gag 1158
Phe Met Arg Lys His Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu
365 370 375
agt tct gat ttg att cac ata agg aaa gaa gca gga gtt aaa gat cct 1206
Ser Ser Asp Leu Ile His Ile Arg Lys Glu Ala Gly Val Lys Asp Pro
380 385 390
tac tgg act cct cca cct ggt tgg aag ctt ggt gac aac cct tct caa 1254
Tyr Trp Thr Pro Pro Pro Gly Trp Lys Leu Gly Asp Asn Pro Ser Gln
395 400 405
gat cct gtc tgc gct gga gaa atc cgt gac atc aga gaa gaa tta gct 1302
Asp Pro Val Cys Ala Gly Glu Ile Arg Asp Ile Arg Glu Glu Leu Ala
410 415 420
agc ctg aaa aga gaa ttg aag aaa ctt gcg tca aag aag gaa gag gag 1350
Ser Leu Lys Arg Glu Leu Lys Lys Leu Ala Ser Lys Lys Glu Glu Glu
425 430 435 440
gag ctt gtt atc atg act acg cct aat tct tgt gtt act agt cag aat 1398
Glu Leu Val Ile Met Thr Thr Pro Asn Ser Cys Val Thr Ser Gln Asn
445 450 455
gat aat ctg atg act cca gca aag gaa atc tac gct gat ctg ctg aaa 1446
Asp Asn Leu Met Thr Pro Ala Lys Glu Ile Tyr Ala Asp Leu Leu Lys
460 465 470
aag aaa tac aaa att gag gac cag cta gtg att att gga gaa acc ttg 1494
Lys Lys Tyr Lys Ile Glu Asp Gln Leu Val Ile Ile Gly Glu Thr Leu
475 480 485
cgt aaa atg gag gaa gac atg gga tgg ctt aag aaa aca gtg gac gag 1542
Arg Lys Met Glu Glu Asp Met Gly Trp Leu Lys Lys Thr Val Asp Glu
490 495 500
aac tat cct aaa aac cag act caa cag aga cac ctt tgc tac tag 1587
Asn Tyr Pro Lys Asn Gln Thr Gln Gln Arg His Leu Cys Tyr
505 510 515
aggattcacc accaatacag acactagaag gagaagtgaa ggtggtgaac aagggtaacc 1647
aaatcacaga gtcacctcaa aacagagaaa aaggaaggaa gcatgatcaa caagaaagat 1707
caccactttc actaataagc aacactggtt tcagaatctg caggcctgtg gggatgttcg 1767
catggcccca attgcctgct cttgctgctg ctactgatac taatgcttct tcgccaagtc 1827
acagacaagc ctacccatcc ccttttccag tcaagccact tgcagctaag cgtcctcttg 1887
gcttgacgtt tcccttcacc atcatacccg aagaagctcc caagaatctc ttcaacgttt 1947
gaagttgtca ctggaaactg atgcatcaga tc 1979
<210> 2
<211> 1527
<212> DNA
<213> Arabidopsis
<400> 2
atgagtagta cgatgttcgt gaaacggaat ccgattagag aaaccaccgc cgggaaaatc 60
tcttcgccgt cgtcaccgac tttgaatgtt gcagtcgcgc atataagagc tggatcttat 120
tacgaaatcg atgcttcgat tcttcctcag agatcgccgg aaaatcttaa atcgattaga 180
gtcgtcatgg tgagcaaaat cacggcgagt gacgtgtctc tccggtaccc aagcatgttt 240
tcactccgat cgcatttcga ttacagtagg atgaaccgga ataaaccgat gaagaagagg 300
agtggtggtg gtcttcttcc tgttttcgac gagagtcatg tgatggcttc ggagctagct 360
ggagacttgc tttacagaag aatcgcacct catgaacttt ctatgaatag aaattcctgg 420
ggtttctggg tttctagttc ttctcgcagg aacaaatttc caagaaggga ggtggtttct 480
caaccggcgt acaatactcg tctctgtcgc gctgcttcac cggagggaaa gtgctcgtct 540
gagctgaaat cgggagggat gatcaagtgg ggaaggagat tgcgtgtgca gtatcagagt 600
cggcatattg atactaggaa gaataaggaa ggtgaggaga gttctagagt gaaggatgaa 660
gtttacaaag aagaagagat ggagaaagaa gaggatgatg atgatgggaa tgaaatagga 720
ggcactaaac aagaggcaaa ggagataact aatggaaatc gtaagagaaa gctgattgaa 780
tcaagtactg agagactcgc tcagaaagct aaggtttatg atcagaagaa ggaaactcaa 840
attgtggttt ataagaggaa atcagagagg aagttcattg atagatggtc tgttgagagg 900
tacaaactag ctgagaggaa catgttaaaa gtgatgaagg agaagaatgc agtgtttggc 960
aactccatac tcaggccaga gttgaggtca gaagcaagga agctgattgg tgacacaggt 1020
ctattggatc atctgcttaa gcacatggct ggtaaggtgg ctcctggagg tcaagatagg 1080
tttatgagaa agcacaatgc agatggggca atggagtatt ggttggagag ttctgatttg 1140
attcacataa ggaaagaagc aggagttaaa gatccttact ggactcctcc acctggttgg 1200
aagcttggtg acaacccttc tcaagatcct gtctgcgctg gagaaatccg tgacatcaga 1260
gaagaattag ctagcctgaa aagagaattg aagaaacttg cgtcaaagaa ggaagaggag 1320
gagcttgtta tcatgactac gcctaattct tgtgttacta gtcagaatga taatctgatg 1380
actccagcaa aggaaatcta cgctgatctg ctgaaaaaga aatacaaaat tgaggaccag 1440
ctagtgatta ttggagaaac cttgcgtaaa atggaggaag acatgggatg gcttaagaaa 1500
acagtggacg agaactatcc taaataa 1527
<210> 3
<211> 508
<212> PRT
<213> Arabidopsis
<400> 3
Met Ser Ser Thr Met Phe Val Lys Arg Asn Pro Ile Arg Glu Thr Thr
1 5 10 15
Ala Gly Lys Ile Ser Ser Pro Ser Ser Pro Thr Leu Asn Val Ala Val
20 25 30
Ala His Ile Arg Ala Gly Ser Tyr Tyr Glu Ile Asp Ala Ser Ile Leu
35 40 45
Pro Gln Arg Ser Pro Glu Asn Leu Lys Ser Ile Arg Val Val Met Val
50 55 60
Ser Lys Ile Thr Ala Ser Asp Val Ser Leu Arg Tyr Pro Ser Met Phe
65 70 75 80
Ser Leu Arg Ser His Phe Asp Tyr Ser Arg Met Asn Arg Asn Lys Pro
85 90 95
Met Lys Lys Arg Ser Gly Gly Gly Leu Leu Pro Val Phe Asp Glu Ser
100 105 110
His Val Met Ala Ser Glu Leu Ala Gly Asp Leu Leu Tyr Arg Arg Ile
115 120 125
Ala Pro His Glu Leu Ser Met Asn Arg Asn Ser Trp Gly Phe Trp Val
130 135 140
Ser Ser Ser Ser Arg Arg Asn Lys Phe Pro Arg Arg Glu Val Val Ser
145 150 155 160
Gln Pro Ala Tyr Asn Thr Arg Leu Cys Arg Ala Ala Ser Pro Glu Gly
165 170 175
Lys Cys Ser Ser Glu Leu Lys Ser Gly Gly Met Ile Lys Trp Gly Arg
180 185 190
Arg Leu Arg Val Gln Tyr Gln Ser Arg His Ile Asp Thr Arg Lys Asn
195 200 205
Lys Glu Gly Glu Glu Ser Ser Arg Val Lys Asp Glu Val Tyr Lys Glu
210 215 220
Glu Glu Met Glu Lys Glu Glu Asp Asp Asp Asp Gly Asn Glu Ile Gly
225 230 235 240
Gly Thr Lys Gln Glu Ala Lys Glu Ile Thr Asn Gly Asn Arg Lys Arg
245 250 255
Lys Leu Ile Glu Ser Ser Thr Glu Arg Leu Ala Gln Lys Ala Lys Val
260 265 270
Tyr Asp Gln Lys Lys Glu Thr Gln Ile Val Val Tyr Lys Arg Lys Ser
275 280 285
Glu Arg Lys Phe Ile Asp Arg Trp Ser Val Glu Arg Tyr Lys Leu Ala
290 295 300
Glu Arg Asn Met Leu Lys Val Met Lys Glu Lys Asn Ala Val Phe Gly
305 310 315 320
Asn Ser Ile Leu Arg Pro Glu Leu Arg Ser Glu Ala Arg Lys Leu Ile
325 330 335
Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met Ala Gly Lys
340 345 350
Val Ala Pro Gly Gly Gln Asp Arg Phe Met Arg Lys His Asn Ala Asp
355 360 365
Gly Ala Met Glu Tyr Trp Leu Glu Ser Ser Asp Leu Ile His Ile Arg
370 375 380
Lys Glu Ala Gly Val Lys Asp Pro Tyr Trp Thr Pro Pro Pro Gly Trp
385 390 395 400
Lys Leu Gly Asp Asn Pro Ser Gln Asp Pro Val Cys Ala Gly Glu Ile
405 410 415
Arg Asp Ile Arg Glu Glu Leu Ala Ser Leu Lys Arg Glu Leu Lys Lys
420 425 430
Leu Ala Ser Lys Lys Glu Glu Glu Glu Leu Val Ile Met Thr Thr Pro
435 440 445
Asn Ser Cys Val Thr Ser Gln Asn Asp Asn Leu Met Thr Pro Ala Lys
450 455 460
Glu Ile Tyr Ala Asp Leu Leu Lys Lys Lys Tyr Lys Ile Glu Asp Gln
465 470 475 480
Leu Val Ile Ile Gly Glu Thr Leu Arg Lys Met Glu Glu Asp Met Gly
485 490 495
Trp Leu Lys Lys Thr Val Asp Glu Asn Tyr Pro Lys
500 505
<210> 4
<211> 1920
<212> DNA
<213> Arabidopsis
<400> 4
atgagtagta cgatgttcgt gaaacggaat ccgattagag aaaccaccgc cgggaaaatc 60
tcttcgccgt cgtcaccgac tttgaatgtt gcagtcgcgc atataagagc tggatcttat 120
tacgaaatcg atgcttcgat tcttcctcag agatcgccgg aaaatcttaa atcgattaga 180
gtcgtcatgg tgagcaaaat cacggcgagt gacgtgtctc tccggtaccc aagcatgttt 240
tcactccgat cgcatttcga ttacagtagg atgaaccgga ataaaccgat gaagaagagg 300
agtggtggtg gtcttcttcc tgttttcgac gagagtcatg tgatggcttc ggagctagct 360
ggagacttgc tttacagaag aatcgcacct catgaacttt ctatgaatag aaattcctgg 420
ggtttctggg tttctagttc ttctcgcagg aacaaatttc caagaaggga ggtggtttct 480
caaccggcgt acaatactcg tctctgtcgc gctgcttcac cggagggaaa gtgctcgtct 540
gagctgaaat cgggagggat gatcaagtgg ggaaggagat tgcgtgtgca gtatcagagt 600
cggcatattg atactaggaa gaataaggaa ggtgaggaga gttctagagt gaaggatgaa 660
gtttacaaag aagaagagat ggagaaagaa gaggatgatg atgatgggaa tgaaatagga 720
ggcactaaac aagaggcaaa ggagataact aatggaaatc gtaagagaaa gctgattgaa 780
tcaagtactg agagactcgc tcagaaagct aaggtttatg atcagaagaa ggaaactcaa 840
attgtggttt ataagaggaa atcagagagg aagttcattg atagatggtc tgttgagagg 900
tacaaactag ctgagaggaa catgttaaaa gtgatgaagg agaagaatgc agtgtttggc 960
aactccatac tcaggccaga gttgaggtca gaagcaagga agctgattgg tgacacaggt 1020
ctattggatc atctgcttaa gcacatggct ggtaaggtgg ctcctggagg tcaagatagg 1080
tttatgagaa agcacaatgc agatggggca atggagtatt ggttggagag ttctgatttg 1140
attcacataa ggaaagaagc aggagttaaa gatccttact ggactcctcc acctggttgg 1200
aagcttggtg acaacccttc tcaagatcct gtctgcgctg gagaaatccg tgacatcaga 1260
gaagaattag ctagcctgaa aagagaattg aagaaacttg cgtcaaagaa ggaagaggag 1320
gagcttgtta tcatgactac gcctaattct tgtgttacta gtcagaatga taatctgatg 1380
actccagcaa aggaaatcta cgctgatctg ctgaaaaaga aatacaaaat tgaggaccag 1440
ctagtgatta ttggagaaac cttgcgtaaa atggaggaag acatgggatg gcttaagaaa 1500
acagtggacg agaactatcc taaaaagcca gactcaacag agacaccttt gctactagag 1560
gattcaccac caatacagac actagaagga gaagtgaagg tggtgaacaa gggtaaccaa 1620
atcacagagt cacctcaaaa cagagaaaaa ggaaggaagc atgatcaaca agaaagatca 1680
ccactttcac taataagcaa cactggtttc agaatctgca ggcctgtggg gatgttcgca 1740
tggccccaat tgcctgctct tgctgctgct actgatacta atgcttcttc gccaagtcac 1800
agacaagcct acccatcccc ttttccagtc aagccacttg cagctaagcg tcctcttggc 1860
ttgacgtttc ccttcaccat catacccgaa gaagctccca agaatctctt caacgtttga 1920
<210> 5
<211> 639
<212> PRT
<213> Arabidopsis
<400> 5
Met Ser Ser Thr Met Phe Val Lys Arg Asn Pro Ile Arg Glu Thr Thr
1 5 10 15
Ala Gly Lys Ile Ser Ser Pro Ser Ser Pro Thr Leu Asn Val Ala Val
20 25 30
Ala His Ile Arg Ala Gly Ser Tyr Tyr Glu Ile Asp Ala Ser Ile Leu
35 40 45
Pro Gln Arg Ser Pro Glu Asn Leu Lys Ser Ile Arg Val Val Met Val
50 55 60
Ser Lys Ile Thr Ala Ser Asp Val Ser Leu Arg Tyr Pro Ser Met Phe
65 70 75 80
Ser Leu Arg Ser His Phe Asp Tyr Ser Arg Met Asn Arg Asn Lys Pro
85 90 95
Met Lys Lys Arg Ser Gly Gly Gly Leu Leu Pro Val Phe Asp Glu Ser
100 105 110
His Val Met Ala Ser Glu Leu Ala Gly Asp Leu Leu Tyr Arg Arg Ile
115 120 125
Ala Pro His Glu Leu Ser Met Asn Arg Asn Ser Trp Gly Phe Trp Val
130 135 140
Ser Ser Ser Ser Arg Arg Asn Lys Phe Pro Arg Arg Glu Val Val Ser
145 150 155 160
Gln Pro Ala Tyr Asn Thr Arg Leu Cys Arg Ala Ala Ser Pro Glu Gly
165 170 175
Lys Cys Ser Ser Glu Leu Lys Ser Gly Gly Met Ile Lys Trp Gly Arg
180 185 190
Arg Leu Arg Val Gln Tyr Gln Ser Arg His Ile Asp Thr Arg Lys Asn
195 200 205
Lys Glu Gly Glu Glu Ser Ser Arg Val Lys Asp Glu Val Tyr Lys Glu
210 215 220
Glu Glu Met Glu Lys Glu Glu Asp Asp Asp Asp Gly Asn Glu Ile Gly
225 230 235 240
Gly Thr Lys Gln Glu Ala Lys Glu Ile Thr Asn Gly Asn Arg Lys Arg
245 250 255
Lys Leu Ile Glu Ser Ser Thr Glu Arg Leu Ala Gln Lys Ala Lys Val
260 265 270
Tyr Asp Gln Lys Lys Glu Thr Gln Ile Val Val Tyr Lys Arg Lys Ser
275 280 285
Glu Arg Lys Phe Ile Asp Arg Trp Ser Val Glu Arg Tyr Lys Leu Ala
290 295 300
Glu Arg Asn Met Leu Lys Val Met Lys Glu Lys Asn Ala Val Phe Gly
305 310 315 320
Asn Ser Ile Leu Arg Pro Glu Leu Arg Ser Glu Ala Arg Lys Leu Ile
325 330 335
Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met Ala Gly Lys
340 345 350
Val Ala Pro Gly Gly Gln Asp Arg Phe Met Arg Lys His Asn Ala Asp
355 360 365
Gly Ala Met Glu Tyr Trp Leu Glu Ser Ser Asp Leu Ile His Ile Arg
370 375 380
Lys Glu Ala Gly Val Lys Asp Pro Tyr Trp Thr Pro Pro Pro Gly Trp
385 390 395 400
Lys Leu Gly Asp Asn Pro Ser Gln Asp Pro Val Cys Ala Gly Glu Ile
405 410 415
Arg Asp Ile Arg Glu Glu Leu Ala Ser Leu Lys Arg Glu Leu Lys Lys
420 425 430
Leu Ala Ser Lys Lys Glu Glu Glu Glu Leu Val Ile Met Thr Thr Pro
435 440 445
Asn Ser Cys Val Thr Ser Gln Asn Asp Asn Leu Met Thr Pro Ala Lys
450 455 460
Glu Ile Tyr Ala Asp Leu Leu Lys Lys Lys Tyr Lys Ile Glu Asp Gln
465 470 475 480
Leu Val Ile Ile Gly Glu Thr Leu Arg Lys Met Glu Glu Asp Met Gly
485 490 495
Trp Leu Lys Lys Thr Val Asp Glu Asn Tyr Pro Lys Lys Pro Asp Ser
500 505 510
Thr Glu Thr Pro Leu Leu Leu Glu Asp Ser Pro Pro Ile Gln Thr Leu
515 520 525
Glu Gly Glu Val Lys Val Val Asn Lys Gly Asn Gln Ile Thr Glu Ser
530 535 540
Pro Gln Asn Arg Glu Lys Gly Arg Lys His Asp Gln Gln Glu Arg Ser
545 550 555 560
Pro Leu Ser Leu Ile Ser Asn Thr Gly Phe Arg Ile Cys Arg Pro Val
565 570 575
Gly Met Phe Ala Trp Pro Gln Leu Pro Ala Leu Ala Ala Ala Thr Asp
580 585 590
Thr Asn Ala Ser Ser Pro Ser His Arg Gln Ala Tyr Pro Ser Pro Phe
595 600 605
Pro Val Lys Pro Leu Ala Ala Lys Arg Pro Leu Gly Leu Thr Phe Pro
610 615 620
Phe Thr Ile Ile Pro Glu Glu Ala Pro Lys Asn Leu Phe Asn Val
625 630 635
<210> 6
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> nga162F primer used for microsatellite marker analysis
<400> 6
ctctgtcact cttttcctct gg 22
<210> 7
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> nga162R primer used for microsatellite marker analysis
<400> 7
catgcaattt gcatctgagg 20
<210> 8
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> nga225F primer used for microsatellite marker analysis
<400> 8
tctccccact agttttgtgt cc 22
<210> 9
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> nga225R primer used for microsatellite marker analysis
<400> 9
gaaatccaaa tcccagagag g 21
<210> 10
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> nga168F primer used for microsatellite marker analysis
<400> 10
gaggacatgt ataggagcct cg 22
<210> 11
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> nga168R primer used for microsatellite marker analysis
<400> 11
tcgtctactg cactgccg 18
<210> 12
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> nga1107F primer used for microsatellite marker analysis
<400> 12
cgacgaatcg acagaattag g 21
<210> 13
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> nga1107R primer used for microsatellite marker analysis
<400> 13
gcgaaaaaac aaaaaaatcc a 21
<210> 14
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> nga6F primer used for microsatellite marker analysis
<400> 14
atggagaagc ttacactgat c 21
<210> 15
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> nga6R primer used for microsatellite marker analysis
<400> 15
tggatttctt cctctcttca c 21
<210> 16
<211> 3001
<212> DNA
<213> Boechera holboelli
<400> 16
gatctgatgc atcagtttca ggtgacagct tcaaacgttg aagagatttg ttggagcttc 60
ttcgggagtg tcggtgaaag gaaacggcaa gccgagaggg ggcttagctg caagtggctt 120
gactggacaa agagatgggt aaattggtcc gtgacttggc gaagaagcaa gttctttagc 180
attactgttt gacaacacag tatcagtagc agcagcaaga gcaggcaatt tgggccatgc 240
gaaaatcccc acaggcctgc agattctgaa accagtgttg cttataagtg aaagtggtga 300
tcgttcttgt tgatcatgct tcttgcattt ttctctgttt tgaggtgact ctgtgatttg 360
gtttcccttg ttcacctcct tcacttctcc ttctagtgtc tccattgttg gcgaatccgc 420
tagtaccaaa ggtgtcgctg atgagtctgg ctttcgagga aagttctcgt ccactgtttt 480
cttaagccat cccatgtctt cctgcaatat ttgcattcat aaaaacacaa atgtttcatc 540
attcattacc agcaaagtgg catctaatag agacagtgga aatgtttgat cacacacgct 600
aaatggaccc attttacatg gcattcagtg cgtttctcca agggagtttc ctagtgacta 660
cttgatagtt actaaatcat agcaaattta gaagatttta cattttaagt aatggttcag 720
ctagaactag taaggagagt gtcagtgttt agaaactcag tctgggattt atatacctcc 780
attgtacaca aggtttctcc aattatcact agctggtcct caattttgta tttcttcttt 840
agcagatcag cgtagatttc ctgagatgaa gtagcagaga tgttcaaaac gtaccataaa 900
ccagtatcac aagatagaga gatctgttac tgtttcaagc tcttaccttt gctggagtcg 960
tcaaattatc attgtccacg ttctgactag taacacaaga atttggtgta gtcacgataa 1020
caagctcctc ctcttccttc tttgacgcca gtttctccaa ttctcttctc aagaccaaga 1080
caaacatgaa ttacaaaatt gctataagta acaaaagaga tgatcatata accaattcaa 1140
taagttaatt cttctacctt ttcaggctag ctaattcttc tctgatctca cggatttctc 1200
cggcgcagac aggatcttga gtagggttgt caccaagctt ccaaccaggt ggaggcgtcc 1260
agtaaggatc ttcaactcct gcttctttcc ttatgtgaat caaatcagaa ctctccaacc 1320
aatactccat tgccccatct gcattgtgct ttctcataaa cctatcttga cctccaggag 1380
ccaccttacc tgccatgtgc ttaagcatat gatctaaaag accagtgtca ccgatcagct 1440
tccttgcttc tgaccttaac tgtgacctga gtatggagtt gccaaacact gcatttttct 1500
ccttcatcac ttttaacatg ttcctctcag ctagtttgta ccttcaaatt ccaaaattaa 1560
ccacaatcaa tcagatgaac caagacaaat ccaatttcag agatcatcaa attcgttaaa 1620
tattcacttt acctatcaac agaccatctg ccaatgaatt tcttctctgc tcttctctta 1680
tagaccacga tttgattttc cttcttctga tcataaacct tagccctctg agcgagtctc 1740
tcagtactgg attcaatcag ctttctctta cgatttccat cagtcatctc gtttgcaatc 1800
tgtttagtct cttctgtttc attcccatca tcatcatcat cattttcttc ctcaatctct 1860
tctttgcaaa cccctccctc cttcactcca gaactctcct taccttccgt attcttctta 1920
caatcaatat gccgactctt gtactgcaca cgcaatctcc tcccccactt aatcatttct 1980
ccagatctca gctcagacca acattttccc tccggtgaag ccgcgcgaca gagcctagta 2040
ttgtacgccg gttgagaaat catcttgttc ctgcgagaag aagcagaaga aacccagaaa 2100
ctccacgaat ttctgttcat agaaacttca tgaggtgcga ttcttctgta aagcaaatct 2160
ccagctagct ccgaaaccat cacatggctc tcgtcaaaaa gaggaagaag accaccacca 2220
ctcctcttct tcaaaggttt attccggttc atcctgctgc aatcgaaatg cgatcggagt 2280
gagtacatgc ttgggtatcg gagagacacg tcgctcgccg tgattttgct cacctgcaac 2340
aacaaccaaa aaaacgccaa aatcactcga aaacccagac gaacaacaaa aatgcagatc 2400
cgtctctaat ggtgaaacaa aaagcagaga atccattaaa taccatgacg actctaatcg 2460
atttaaggtt ctccggcgat ctttgaggaa gaatcgaaga atcgatttcg taatacgatc 2520
caactcttat atgcgcgact gcaactggaa gaacaaaacc aaagaaaaaa aaactggaat 2580
tagaagaaaa gcgagaaaat caacaaaaac ggggaaacta tagcttcagt gttttaccat 2640
tcacagtcga tgacgatggc gaagaatttt ttccggcaga gatttctcta atcggattcc 2700
gtttcaggaa catcgttccc tgtagaagaa gaagaagtat ataactcaga gaggttcact 2760
atttttttat ttttgtgttg aatcaaaaat ggaaactgtt aaggaccgga gaatatattt 2820
gaaaaaagct gactctgcga gtataacaag aaaacacacg cgctctctgg tacgcgcgtg 2880
ggagacacaa aggcaacaga atcaagcggt gatgattttt attttctacc gtcatgagag 2940
tgttagagac tgagctatta cagagagaga gagagagatc ttacgctcat gatttttgct 3000
c 3001
<210> 17
<211> 1947
<212> DNA
<213> Boechera holboelli
<400> 17
atgagcggaa cgatgttcct gaaacggaat ccgattagag aaatctctgc cggaaaaaat 60
tcttcgccat cgtcatcgac tgtgaatgtt gcagtcgcgc atataagagt tggatcgtat 120
tacgaaatcg attcttcgat tcttcctcaa agatcgccgg agaaccttaa atcgattaga 180
gtcgtcatgg tgagcaaaat cacggcgagc gacgtgtctc tccgataccc aagcatgtac 240
tcactccgat cgcatttcga ttgcagcagg atgaaccgga ataaaccttt gaagaagagg 300
agtggtggtg gtcttcttcc tctttttgac gagagccatg tgatggtttc ggagctagct 360
ggagatttgc tttacagaag aatcgcacct catgaagttt ctatgaacag aaattcgtgg 420
agtttctggg tttcttctgc ttcttctcgc aggaacaaga tgatttctca accggcgtac 480
aatactaggc tctgtcgcgc ggcttcaccg gagggaaaat gttggtctga gctgagatct 540
ggagaaatga ttaagtgggg gaggagattg cgtgtgcagt acaagagtcg gcatattgat 600
tgtaagaaga atacggaagg taaggagagt tctggagtga aggagggagg ggtttgcaaa 660
gaagagattg aggaagaaaa tgatgatgat gatgatggga atgaaacaga agagactaaa 720
cagattgcaa acgagatgac tgatggaaat cgtaagagaa agctgattga atccagtact 780
gagagactcg ctcagagggc taaggtttat gatcagaaga aggaaaatca aatcgtggtc 840
tataagagaa gagcagagaa gaaattcatt ggcagatggt ctgttgatag gtacaaacta 900
gctgagagga acatgttaaa agtgatgaag gagaaaaatg cagtgtttgg caactccata 960
ctcaggtcac agttaaggtc agaagcaagg aagctgatcg gtgacactgg tcttttagat 1020
catatgctta agcacatggc aggtaaggtg gctcctggag gtcaagatag gtttatgaga 1080
aagcacaatg cagatggggc aatggagtat tggttggaga gttctgattt gattcacata 1140
aggaaagaag caggagttga agatccttac tggacgcctc cacctggttg gaagcttggt 1200
gacaacccta ctcaagatcc tgtctgcgcc ggagaaatcc gtgagatcag agaagaatta 1260
gctagcctga gaagagaatt ggagaaactg gcgtcaaaga aggaagagga ggagcttgtt 1320
atcgtgacta caccaaattc ttgtgttact agtcagaacg tggacaatga taatttgacg 1380
actccagcaa aggaaatcta cgctgatctg ctaaagaaga aatacaaaat tgaggaccag 1440
ctagtgataa ttggagaaac cttgtgtaca atggaggaag acatgggatg gcttaagaaa 1500
acagtggacg agaactttcc tcgaaagcca gactcatcag cgacaccttt ggtactagcg 1560
gattcgccaa caatggagac actagaagga gaagtgaagg aggtgaacaa gggaaaccaa 1620
atcacagagt cacctcaaaa cagagaaaaa tgcaagaagc atgatcaaca agaacgatca 1680
ccactttcac ttataagcaa cactggtttc agaatctgca ggcctgtggg gattttcgca 1740
tggcccaaat tgcctgctct tgctgctgct actgatactg tgttgtcaaa cagtaatgct 1800
aaagaacttg cttcttcgcc aagtcacgga ccaatttacc catctctttg tccagtcaag 1860
ccacttgcag ctaagccccc tctcggcttg ccgtttcctt tcaccgacac tcccgaagaa 1920
gctccaacaa atctcttcaa cgtttga 1947
<210> 18
<211> 648
<212> PRT
<213> Boechera holboelli
<400> 18
Met Ser Gly Thr Met Phe Leu Lys Arg Asn Pro Ile Arg Glu Ile Ser
1 5 10 15
Ala Gly Lys Asn Ser Ser Pro Ser Ser Ser Thr Val Asn Val Ala Val
20 25 30
Ala His Ile Arg Val Gly Ser Tyr Tyr Glu Ile Asp Ser Ser Ile Leu
35 40 45
Pro Gln Arg Ser Pro Glu Asn Leu Lys Ser Ile Arg Val Val Met Val
50 55 60
Ser Lys Ile Thr Ala Ser Asp Val Ser Leu Arg Tyr Pro Ser Met Tyr
65 70 75 80
Ser Leu Arg Ser His Phe Asp Cys Ser Arg Met Asn Arg Asn Lys Pro
85 90 95
Leu Lys Lys Arg Ser Gly Gly Gly Leu Leu Pro Leu Phe Asp Glu Ser
100 105 110
His Val Met Val Ser Glu Leu Ala Gly Asp Leu Leu Tyr Arg Arg Ile
115 120 125
Ala Pro His Glu Val Ser Met Asn Arg Asn Ser Trp Ser Phe Trp Val
130 135 140
Ser Ser Ala Ser Ser Arg Arg Asn Lys Met Ile Ser Gln Pro Ala Tyr
145 150 155 160
Asn Thr Arg Leu Cys Arg Ala Ala Ser Pro Glu Gly Lys Cys Trp Ser
165 170 175
Glu Leu Arg Ser Gly Glu Met Ile Lys Trp Gly Arg Arg Leu Arg Val
180 185 190
Gln Tyr Lys Ser Arg His Ile Asp Cys Lys Lys Asn Thr Glu Gly Lys
195 200 205
Glu Ser Ser Gly Val Lys Glu Gly Gly Val Cys Lys Glu Glu Ile Glu
210 215 220
Glu Glu Asn Asp Asp Asp Asp Asp Gly Asn Glu Thr Glu Glu Thr Lys
225 230 235 240
Gln Ile Ala Asn Glu Met Thr Asp Gly Asn Arg Lys Arg Lys Leu Ile
245 250 255
Glu Ser Ser Thr Glu Arg Leu Ala Gln Arg Ala Lys Val Tyr Asp Gln
260 265 270
Lys Lys Glu Asn Gln Ile Val Val Tyr Lys Arg Arg Ala Glu Lys Lys
275 280 285
Phe Ile Gly Arg Trp Ser Val Asp Arg Tyr Lys Leu Ala Glu Arg Asn
290 295 300
Met Leu Lys Val Met Lys Glu Lys Asn Ala Val Phe Gly Asn Ser Ile
305 310 315 320
Leu Arg Ser Gln Leu Arg Ser Glu Ala Arg Lys Leu Ile Gly Asp Thr
325 330 335
Gly Leu Leu Asp His Met Leu Lys His Met Ala Gly Lys Val Ala Pro
340 345 350
Gly Gly Gln Asp Arg Phe Met Arg Lys His Asn Ala Asp Gly Ala Met
355 360 365
Glu Tyr Trp Leu Glu Ser Ser Asp Leu Ile His Ile Arg Lys Glu Ala
370 375 380
Gly Val Glu Asp Pro Tyr Trp Thr Pro Pro Pro Gly Trp Lys Leu Gly
385 390 395 400
Asp Asn Pro Thr Gln Asp Pro Val Cys Ala Gly Glu Ile Arg Glu Ile
405 410 415
Arg Glu Glu Leu Ala Ser Leu Arg Arg Glu Leu Glu Lys Leu Ala Ser
420 425 430
Lys Lys Glu Glu Glu Glu Leu Val Ile Val Thr Thr Pro Asn Ser Cys
435 440 445
Val Thr Ser Gln Asn Val Asp Asn Asp Asn Leu Thr Thr Pro Ala Lys
450 455 460
Glu Ile Tyr Ala Asp Leu Leu Lys Lys Lys Tyr Lys Ile Glu Asp Gln
465 470 475 480
Leu Val Ile Ile Gly Glu Thr Leu Cys Thr Met Glu Glu Asp Met Gly
485 490 495
Trp Leu Lys Lys Thr Val Asp Glu Asn Phe Pro Arg Lys Pro Asp Ser
500 505 510
Ser Ala Thr Pro Leu Val Leu Ala Asp Ser Pro Thr Met Glu Thr Leu
515 520 525
Glu Gly Glu Val Lys Glu Val Asn Lys Gly Asn Gln Ile Thr Glu Ser
530 535 540
Pro Gln Asn Arg Glu Lys Cys Lys Lys His Asp Gln Gln Glu Arg Ser
545 550 555 560
Pro Leu Ser Leu Ile Ser Asn Thr Gly Phe Arg Ile Cys Arg Pro Val
565 570 575
Gly Ile Phe Ala Trp Pro Lys Leu Pro Ala Leu Ala Ala Ala Thr Asp
580 585 590
Thr Val Leu Ser Asn Ser Asn Ala Lys Glu Leu Ala Ser Ser Pro Ser
595 600 605
His Gly Pro Ile Tyr Pro Ser Leu Cys Pro Val Lys Pro Leu Ala Ala
610 615 620
Lys Pro Pro Leu Gly Leu Pro Phe Pro Phe Thr Asp Thr Pro Glu Glu
625 630 635 640
Ala Pro Thr Asn Leu Phe Asn Val
645
<210> 19
<211> 508
<212> PRT
<213> Boechera holboelli
<400> 19
Met Ser Gly Thr Met Phe Leu Lys Arg Asn Pro Ile Arg Glu Ile Ser
1 5 10 15
Ala Gly Lys Asn Ser Ser Pro Ser Ser Ser Thr Val Asn Val Ala Val
20 25 30
Ala His Ile Arg Val Gly Ser Tyr Tyr Glu Ile Asp Ser Ser Ile Leu
35 40 45
Pro Gln Arg Ser Pro Glu Asn Leu Lys Ser Ile Arg Val Val Met Val
50 55 60
Ser Lys Ile Thr Ala Ser Asp Val Ser Leu Arg Tyr Pro Ser Met Tyr
65 70 75 80
Ser Leu Arg Ser His Phe Asp Cys Ser Arg Met Asn Arg Asn Lys Pro
85 90 95
Leu Lys Lys Arg Ser Gly Gly Gly Leu Leu Pro Leu Phe Asp Glu Ser
100 105 110
His Val Met Val Ser Glu Leu Ala Gly Asp Leu Leu Tyr Arg Arg Ile
115 120 125
Ala Pro His Glu Val Ser Met Asn Arg Asn Ser Trp Ser Phe Trp Val
130 135 140
Ser Ser Ala Ser Ser Arg Arg Asn Lys Met Ile Ser Gln Pro Ala Tyr
145 150 155 160
Asn Thr Arg Leu Cys Arg Ala Ala Ser Pro Glu Gly Lys Cys Trp Ser
165 170 175
Glu Leu Arg Ser Gly Glu Met Ile Lys Trp Gly Arg Arg Leu Arg Val
180 185 190
Gln Tyr Lys Ser Arg His Ile Asp Cys Lys Lys Asn Thr Glu Gly Lys
195 200 205
Glu Ser Ser Gly Val Lys Glu Gly Gly Val Cys Lys Glu Glu Ile Glu
210 215 220
Glu Glu Asn Asp Asp Asp Asp Asp Gly Asn Glu Thr Glu Glu Thr Lys
225 230 235 240
Gln Ile Ala Asn Glu Met Thr Asp Gly Asn Arg Lys Arg Lys Leu Ile
245 250 255
Glu Ser Ser Thr Glu Arg Leu Ala Gln Arg Ala Lys Val Tyr Asp Gln
260 265 270
Lys Lys Glu Asn Gln Ile Val Val Tyr Lys Arg Arg Ala Glu Lys Lys
275 280 285
Phe Ile Gly Arg Trp Ser Val Asp Arg Tyr Lys Leu Ala Glu Arg Asn
290 295 300
Met Leu Lys Val Met Lys Glu Lys Asn Ala Val Phe Gly Asn Ser Ile
305 310 315 320
Leu Arg Ser Gln Leu Arg Ser Glu Ala Arg Lys Leu Ile Gly Asp Thr
325 330 335
Gly Leu Leu Asp His Met Leu Lys His Met Ala Gly Lys Val Ala Pro
340 345 350
Gly Gly Gln Asp Arg Phe Met Arg Lys His Asn Ala Asp Gly Ala Met
355 360 365
Glu Tyr Trp Leu Glu Ser Ser Asp Leu Ile His Ile Arg Lys Glu Ala
370 375 380
Gly Val Glu Asp Pro Tyr Trp Thr Pro Pro Pro Gly Trp Lys Leu Gly
385 390 395 400
Asp Asn Pro Thr Gln Asp Pro Val Cys Ala Gly Glu Ile Arg Glu Ile
405 410 415
Arg Glu Glu Leu Ala Ser Leu Arg Arg Glu Leu Glu Lys Leu Ala Ser
420 425 430
Lys Lys Glu Glu Glu Glu Leu Val Ile Val Thr Thr Pro Asn Ser Cys
435 440 445
Val Thr Ser Gln Asn Val Asp Asn Asp Asn Leu Thr Thr Pro Ala Lys
450 455 460
Glu Ile Tyr Ala Asp Leu Leu Lys Lys Lys Tyr Lys Ile Glu Asp Gln
465 470 475 480
Leu Val Ile Ile Gly Glu Thr Leu Cys Thr Met Glu Glu Asp Met Gly
485 490 495
Trp Leu Lys Lys Thr Val Asp Glu Asn Phe Pro Arg
500 505
<210> 20
<211> 1680
<212> DNA
<213> Oryza
<400> 20
atggacgcgg agatggcggc tcctgcgctt gcggcagctc atctgctgga ctcgcccatg 60
aggccacagg tgagcagata ctactccaag aagaggggta gcagccacag cagaaatggc 120
aaggatgatg ccaaccatga cgagtccaag aaccaatcac ccggcttgcc cctgagcaga 180
cagagcctgt cctcatctgc cacccacacc taccacaccg gagggttcta cgagatcgac 240
cacgagaagc ttccccccaa atccccaatt catctcaagt ccatacgcgt ggtaaaggtg 300
agcggctaca caagcctgga cgtcacagtg agcttcccgt ccctcctggc gctgcgaagc 360
ttcttctcct cctccccacg gtcgtgcact gggccggagc tcgacgagcg cttcgtcatg 420
agcagcaacc acgcggcccg catcctgcgc cgtcgggtgg ccgaggagga gctcgcgggc 480
gacgtgatgc accaggacag cttctggctc gtcaagccct gcctctatga cttctccgcg 540
tcgtcaccac atgatgtgct gaccccgtcg ccgccgcctg ccacagcgca ggcgaaggcg 600
ccggcagcca gttcctgcct tctcgacacc ttgaagtgcg acggcgccgg gtggggcgtg 660
aggcgccgtg tcaggtacat tggtcgccac cacgatgctt ccaaggaggc cagcgctgcc 720
agcctcgatg gctacaacac agaggtcagc gtccaggagg agcagcagca gcgactgcgg 780
cttcgactgc ggttgcgaca acgccgggag caggaagaca acaagagcac tagcaatggc 840
aagaggaagc gggaggaggc agagagcagc atggacaaga gcagagccgc caggaagaag 900
aaagccaaga cttacaagag tcccaagaag gtggagaaga ggcgcgtcgt ggaggctaaa 960
gacggcgacc ctcggcgcgg caaggaccgg tggtcggccg agcggtacgc agcggcggag 1020
aggagcctgc tggatataat gcgctcccat ggtgcctgct tcggtgcgcc ggtgatgcgg 1080
caggctctgc gggaggaagc ccgcaagcat atcggtgaca ccggcctcct tgaccacctg 1140
ctcaagcaca tggccggcag ggtaccggaa ggcagcgcgg accggttccg tcgccggcac 1200
aatgcggatg gtgccatgga gtactggctg gagccggcgg agcttgccga ggtacggcgg 1260
ctggctggag tgtctgatcc atactgggtg ccgccacctg ggtggaagcc aggtgatgac 1320
gtgtccgcag tcgccggtga cctcctggtc aagaagaagg tggaagagct cgctgaggag 1380
gttgatggtg taaaaaggca catcgagcag ctcagttcta atttggtgca gctggagaag 1440
gaaacaaaat ctgaggcaga gcgatcttac agctctagga aggagaagta tcagaagttg 1500
atgaaggcaa atgaaaagct cgagaaacag gtgttatcta tgaaggataa atacaagctt 1560
gtgctggaga agaatgataa actggaggaa cagatggcta gtctctccag ctccttcctt 1620
tctttgaagg aacaattgct gctgccaaga aatggagata atctgaacat ggaaaggtaa 1680
<210> 21
<211> 559
<212> PRT
<213> Oryza
<400> 21
Met Asp Ala Glu Met Ala Ala Pro Ala Leu Ala Ala Ala His Leu Leu
1 5 10 15
Asp Ser Pro Met Arg Pro Gln Val Ser Arg Tyr Tyr Ser Lys Lys Arg
20 25 30
Gly Ser Ser His Ser Arg Asn Gly Lys Asp Asp Ala Asn His Asp Glu
35 40 45
Ser Lys Asn Gln Ser Pro Gly Leu Pro Leu Ser Arg Gln Ser Leu Ser
50 55 60
Ser Ser Ala Thr His Thr Tyr His Thr Gly Gly Phe Tyr Glu Ile Asp
65 70 75 80
His Glu Lys Leu Pro Pro Lys Ser Pro Ile His Leu Lys Ser Ile Arg
85 90 95
Val Val Lys Val Ser Gly Tyr Thr Ser Leu Asp Val Thr Val Ser Phe
100 105 110
Pro Ser Leu Leu Ala Leu Arg Ser Phe Phe Ser Ser Ser Pro Arg Ser
115 120 125
Cys Thr Gly Pro Glu Leu Asp Glu Arg Phe Val Met Ser Ser Asn His
130 135 140
Ala Ala Arg Ile Leu Arg Arg Arg Val Ala Glu Glu Glu Leu Ala Gly
145 150 155 160
Asp Val Met His Gln Asp Ser Phe Trp Leu Val Lys Pro Cys Leu Tyr
165 170 175
Asp Phe Ser Ala Ser Ser Pro His Asp Val Leu Thr Pro Ser Pro Pro
180 185 190
Pro Ala Thr Ala Gln Ala Lys Ala Pro Ala Ala Ser Ser Cys Leu Leu
195 200 205
Asp Thr Leu Lys Cys Asp Gly Ala Gly Trp Gly Val Arg Arg Arg Val
210 215 220
Arg Tyr Ile Gly Arg His His Asp Ala Ser Lys Glu Ala Ser Ala Ala
225 230 235 240
Ser Leu Asp Gly Tyr Asn Thr Glu Val Ser Val Gln Glu Glu Gln Gln
245 250 255
Gln Arg Leu Arg Leu Arg Leu Arg Leu Arg Gln Arg Arg Glu Gln Glu
260 265 270
Asp Asn Lys Ser Thr Ser Asn Gly Lys Arg Lys Arg Glu Glu Ala Glu
275 280 285
Ser Ser Met Asp Lys Ser Arg Ala Ala Arg Lys Lys Lys Ala Lys Thr
290 295 300
Tyr Lys Ser Pro Lys Lys Val Glu Lys Arg Arg Val Val Glu Ala Lys
305 310 315 320
Asp Gly Asp Pro Arg Arg Gly Lys Asp Arg Trp Ser Ala Glu Arg Tyr
325 330 335
Ala Ala Ala Glu Arg Ser Leu Leu Asp Ile Met Arg Ser His Gly Ala
340 345 350
Cys Phe Gly Ala Pro Val Met Arg Gln Ala Leu Arg Glu Glu Ala Arg
355 360 365
Lys His Ile Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met
370 375 380
Ala Gly Arg Val Pro Glu Gly Ser Ala Asp Arg Phe Arg Arg Arg His
385 390 395 400
Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu Pro Ala Glu Leu Ala
405 410 415
Glu Val Arg Arg Leu Ala Gly Val Ser Asp Pro Tyr Trp Val Pro Pro
420 425 430
Pro Gly Trp Lys Pro Gly Asp Asp Val Ser Ala Val Ala Gly Asp Leu
435 440 445
Leu Val Lys Lys Lys Val Glu Glu Leu Ala Glu Glu Val Asp Gly Val
450 455 460
Lys Arg His Ile Glu Gln Leu Ser Ser Asn Leu Val Gln Leu Glu Lys
465 470 475 480
Glu Thr Lys Ser Glu Ala Glu Arg Ser Tyr Ser Ser Arg Lys Glu Lys
485 490 495
Tyr Gln Lys Leu Met Lys Ala Asn Glu Lys Leu Glu Lys Gln Val Leu
500 505 510
Ser Met Lys Asp Lys Tyr Lys Leu Val Leu Glu Lys Asn Asp Lys Leu
515 520 525
Glu Glu Gln Met Ala Ser Leu Ser Ser Ser Phe Leu Ser Leu Lys Glu
530 535 540
Gln Leu Leu Leu Pro Arg Asn Gly Asp Asn Leu Asn Met Glu Arg
545 550 555
<210> 22
<211> 1612
<212> DNA
<213> Artificial Sequence
<220>
<223> DYAD Promoter
<400> 22
gagctctttg gtccggagac ggtagaagac gacaaagcac tgacctttca tctctcggcg 60
atcgaaaaaa tcactctctt tcctcatcag acccgacccg ttatgaaggt atccagaccc 120
gtttattttg atccatctca tagtcggatc cccaaaaaaa ttcagcttag attggcccat 180
ttaggcccgt ttacagtttt ttactttttt cttaattatc tttttaacat cttacattat 240
acatatttga ctcaacaaaa aaatataact taaatgtatt gttgactgtt tttgataatt 300
aagaaaaaaa tatttttaaa ttattaaaaa tattgttgac tcaacaaaaa aatataactt 360
aaatgtattg ggcaaataat catggtcata agtcctcaag cttattattt gttttgattg 420
gtttaaatac tttataaaaa aaatatcaat tatatcatgt tattacgtaa attaagcttt 480
ttgattttaa aaaagcttca gctcaataaa gaaaaacaga ttcagttatc attggagtat 540
aaaattggtc gatacattag agacattaat ccttacatca taaacaattt aatgtgaata 600
aaacatcata aatcacatat cattatccga aaataatcat atgtaagaat aatcactgtg 660
acaaaaaaaa aaaacaattc ctcacgtgtg tagtcggtcc ccactctagt agcagtagct 720
taatgatgcc ttctccgcac gtgtaacacg aaatttattc gctacggcca attacattaa 780
ccttcaggtc ttatcaccgt taaattttca aaatgacaca cgtggcatca atccgtaata 840
tcactacgtc tgctttcaat ctttcattgt agatgatttc gtacaccaat ttccgcgaac 900
gtttacagtt tagatacagt ttgagggcaa atctgtcaat atacgccaac ttgctgcgaa 960
agcaatatag tcacgtgccg tgcacacgca tataagactc acacactcac accactctct 1020
ctctctctct aacctcatat ataaagccac ctcccagatt cattaaatgc gacatttcaa 1080
aacttttctt tttgctgtct tccccataag ctctctgctg attaaaaaga ttttctggta 1140
taaaacaaaa ttcttcaaat atttctgggt ttatgttttc tctctatttc tcagaaatgc 1200
tttaatttct ccatccgcgt ccatgttttt ttttctccgt tgctgatttt gattttttta 1260
atccagtgaa aaggaggaac gaagattatc gagagcaaaa atcatgagtg taagatctct 1320
ctcgctctca gattttattt tttttcgctg tgatataaat ggctcagtca ctatcagtct 1380
catgatgaga aaaataaaac tcatcaccgc ttgattctgt ttccttagtg tctcccacgc 1440
gcgtaccaga aagcgcgtgt gtgtttcttg ttatactcgc agagtcaggt tttttcaaat 1500
atattctctc caggcagcag caacaacaac aaaccgattt tttcattatt ccttataaca 1560
atttttgatt ctccagaaaa aaaatatctc tcttagtttt tctcttgttc ta 1612
<210> 23
<211> 2412
<212> DNA
<213> Oryza
<400> 23
atggacgcgg agatggcggc tcctgcgctt gcggcagctc atctgctgga ctcgcccatg 60
aggccacagg tgagcagata ctactccaag aagaggggta gcagccacag cagaaatggc 120
aaggatgatg ccaaccatga cgagtccaag aaccaatcac ccggcttgcc cctgagcaga 180
cagagcctgt cctcatctgc cacccacacc taccacaccg gagggttcta cgagatcgac 240
cacgagaagc ttccccccaa atccccaatt catctcaagt ccatacgcgt ggtaaaggtg 300
agcggctaca caagcctgga cgtcacagtg agcttcccgt ccctcctggc gctgcgaagc 360
ttcttctcct cctccccacg gtcgtgcact gggccggagc tcgacgagcg cttcgtcatg 420
agcagcaacc acgcggcccg catcctgcgc cgtcgggtgg ccgaggagga gctcgcgggc 480
gacgtgatgc accaggacag cttctggctc gtcaagccct gcctctatga cttctccgcg 540
tcgtcaccac atgatgtgct gaccccgtcg ccgccgcctg ccacagcgca ggcgaaggcg 600
ccggcagcca gttcctgcct tctcgacacc ttgaagtgcg acggcgccgg gtggggcgtg 660
aggcgccgtg tcaggtacat tggtcgccac cacgatgctt ccaaggaggc cagcgctgcc 720
agcctcgatg gctacaacac agaggtcagc gtccaggagg agcagcagca gcgactgcgg 780
cttcgactgc ggttgcgaca acgccgggag caggaagaca acaagagcac tagcaatggc 840
aagaggaagc gggaggaggc agagagcagc atggacaaga gcagagccgc caggaagaag 900
aaagccaaga cttacaagag tcccaagaag gtggagaaga ggcgcgtcgt ggaggctaaa 960
gacggcgacc ctcggcgcgg caaggaccgg tggtcggccg agcggtacgc agcggcggag 1020
aggagcctgc tggatataat gcgctcccat ggtgcctgct tcggtgcgcc ggtgatgcgg 1080
caggctctgc gggaggaagc ccgcaagcat atcggtgaca ccggcctcct tgaccacctg 1140
ctcaagcaca tggccggcag ggtaccggaa ggcagcgcgg accggttccg tcgccggcac 1200
aatgcggatg gtgccatgga gtactggctg gagccggcgg agcttgccga ggtacggcgg 1260
ctggctggag tgtctgatcc atactgggtg ccgccacctg ggtggaagcc aggtgatgac 1320
gtgtccgcag tcgccggtga cctcctggtc aagaagaagg tggaagagct cgctgaggag 1380
gttgatggtg taaaaaggca catcgagcag ctcagttcta atttggtgca gctggagaag 1440
gaaacaaaat ctgaggcaga gcgatcttac agctctagga aggagaagta tcagaagttg 1500
atgaaggcaa atgaaaagct cgagaaacag gtgttatcta tgaaggacat gtatgagcat 1560
ctggttcaga aaaagggtaa gctgaagaag gaggtgctgt ccttgaagga taaatacaag 1620
cttgtgctgg agaagaatga taaactggag gaacagatgg ctagtctctc cagctccttc 1680
ctttctttga aggaacaatt gctgctgcca agaaatggag ataatctgaa catggaaagg 1740
gaaagggtgg aagtgacttt gggcaagcaa gaaggccttg ttcccggcga accactgtat 1800
gttgatggtg gtgaccggat cagccagcaa gcagatgcca ccgtcgtcca agtcggcgag 1860
aagaggacgg cgaggaagag cagcttccgc atctgcaagc cacagggaac gttcatgtgg 1920
ccacacatgg cgtctggcac gagcatggcc atcagtgggg gaggcagcag cagctgccct 1980
gtcgcctccg ggccagagca gctccctcgc agcagcagct gccccagcat tgggcctggt 2040
ggcctcccgc cgtcgtcacg agccccagcc gaggtggtgg tcgcgtcgcc actggacgag 2100
cacgtggcgt tccgcggggg cttcaacacg ccgccctcgg catcgtccac caacgccgcc 2160
gctgccgcca agctgcctcc cctgcccagc ccgacgtcac ctctccagac acgggccctg 2220
ttcgccgctg gcttcactgt cccggcatta cacaacttct ccggcctcac cttacgccat 2280
gtggactcct cgtcgccgtc gtccgcgcca tgcggtgcta gggagaagat ggtgaccctg 2340
ttcgatggag actgccgggg gatcagcgtc gtgggcaccg agctggcact ggccactccg 2400
tcctactgct ga 2412
<210> 24
<211> 6329
<212> DNA
<213> Populus trichocarpa
<400> 24
cattcgttat ggctaacgga gtcactgggc cttacatgca tccacagacc aggtgccgga 60
gtgctggtgc aaaaccaatt tattgaattt ctgaacaatt ggagacgaaa taaatgtctt 120
tacttcttca aacccttgat ttaaaagtaa atgtattatc ttttattgat ttttttattc 180
aattcctaga attagtagct tgaagaattt attaaattta tcagataaat gagagggata 240
tacccttaaa atcgtcaaaa ataaatctca atttacttat aaattgaaga ataccttctt 300
aaaaataaaa taaaattgcg tgccatccct ctttagtaga ttttggcgct actcgtgtgg 360
tgtgggtaca gagaagaata ttaatatacc cgagctggaa ctagaaggtc acccgccata 420
tccaatgagg caatcccgaa cctctcccac aagcaagcat ccgccacgtg gtcagaagct 480
acagaggtta tgacctggct aaacgattgg ctaccaggaa ccaatggctc ctcaaaggcc 540
atagataaat aaatctaaga gccagtttct ttagctctca actctctcaa ccatctatac 600
aacatttcca gaggcaacaa gactcgggag gggtaaaacg gtaaaatggg agacgttact 660
gtagaggagg gaggggggga ccagaatcca ggtcacgtga ggcgcatccc gtctggtaat 720
aatcattact atttttttct ctctttatag cagaaatgca ccaccatcgt tggtttcaca 780
acagaaaaaa ctccctcccc cttctctctg cgttttctct caagctgttt tttcttgctc 840
tccaaacaat ccatcacaag tagcttttga aacagaaatt gaaaaaaaaa ggtctcgttt 900
tatatttatt tttgctgttt aattttcaac ctgatttttt tcatgtgcat taattaatta 960
atgctggtgt agttactctt tggctggttg aatcggtgct ggtactggat aaaacatctc 1020
aaaaggaatg acccatttgc atgtcattaa ggggtgcatg tgtttgaatg aggaattcaa 1080
acaagtcctg acatgagtat gcattttcct gtggttaaca gatataggtt gtttggctcc 1140
tggaagattc tcaaaattga gatttcaagc tcaaaagtgt ttttgataca ctttccaagc 1200
ttcatgatct ttaatttacc agtggtgttt ttcctagtta gtgtacttta aaggtcgcat 1260
aatgatcggt agtacttagc tttgattttg cattcccgtt cgcttcttct tgttttcagt 1320
ctctgcgtac caacaatata gagattctcc tggctgtgca agaatcacta tatctatcta 1380
tctatctatc aggccttaac cttgctttct tttctgatca atccttgtgt ttatgattga 1440
ttaatgagat taattgtatg tttgcttcaa atgattatct tatatatagt ctgattttcc 1500
ctttctttaa tcatgtccat atatgtttat tcgccggggg gccgggaagg acgagaggta 1560
cgactagcta gtattaactt gtgcagttga aactgtttct ctatgtgcag aagatgacta 1620
ccatggagct ggttgatgtt gcagtgatag accacccatc ggtgagtttg ttctctcttc 1680
tcctcaatcc cactcccact ctccactccc caaccaccac acccctttct ttctgttact 1740
cctctatttc tcttctcgta acccacgcgc tcttttatct ctcaaatcaa gtcgctgatt 1800
actagtctac taaagttttc aaatactcaa ccgaattcct aatctttgtc tcacgctcac 1860
acacatacca aatccacacg cgcgtcccct acaatttgtt acgcaaatca aaccccgctc 1920
tacacatcct tggtgcccaa gtaagtgaaa tgatgatttt acataacaaa aaccacataa 1980
ttattatgct atgtaacggt atattctata cattctctat cgagtattgc acacgagggg 2040
cttatgcata cataaatcct cacccctttt aaaggagaag ggcaatacag tgattttggt 2100
tgtgcttgtg aaaatgcagg aaataaaaag gaggcagaac tccgaggacg ccgatagaag 2160
gctttttttg ggcggacatt gcctgcatca cccaacattt accacagcac caccatttgg 2220
taatatttgt aacacacacg cacacacgcc cgagcaacaa atctctccct cttttttatc 2280
ccttttgttt cctctctctc tctctctctc tctcacttga tttctctctt ctgatttgct 2340
gatttttttt actgctcgta ctagctagct agctctactc ctatagctca cagtactgca 2400
agtacgtagt actactgcag ctgctgctag tgctagtagt agctatgtcg ttttccacgc 2460
taagagctct tgtttctgat caaaataagg aattctctga ttactctttg ttttccatgc 2520
ttaataatga agacccagct gagcatatta aagtgagctc tttttatgaa gttgatcact 2580
ccaagctgcc tcataaatcc cctgatcaac tcaacaaaac ccgggttgtg atggtatttt 2640
ttatacaatt caacaatatt cttaaacccg gctcaacatt tttttctctc tgctttaaaa 2700
tttgttggtg tttgtttctg cttgaataaa tatctcaggt gaatgaaaag accaggatga 2760
gagtctcgct gaggtttcca agcatcaatt ctctaagatg ttacttcaat gagattgaag 2820
ctattaatta caagaaagac atgaaaacga agaagcagca gctaccagca ttcgacgaga 2880
aatacattat aggatcagaa gttgcagggg aagctcttta taggagaatc tcttctcaag 2940
aaatggcaga caagagttac tcatggagtt tctggatggt taaacatcct tcggtttcac 3000
ctcgaaaagt gtcataccca cctacaagta ctcatgttaa taaatttgtt ggtgcaagga 3060
aggtgtctct catgtctgag ctcaacggga caggcatggt taagtggggt cagcgccggc 3120
aggtcaggtt cttggctaaa cacgtagagg ataaacgtga aatagtgatt gcatcgaagg 3180
atttgattaa aagcgaagaa gagaaagaca gtgatggtag tgatgatgac acagacgatg 3240
aggacgagga ggaggtcgat gttaagttag tagtaaacaa gtcaagtgaa gctaaaagga 3300
aattacgtaa gagaaagtgt caaggtgggt ctggtattag caaattatca ccaaaaaaga 3360
aaaggcgtaa aattgaaaag aagaaccaga ttgtggtcta taggcaaaag aagaacaaac 3420
tcatcaagaa ttctattgac agatggtctg cggggaggta ataaagcttt tattagttaa 3480
taaactaaat tcagatcgtc atttgtgtta atatattttt ttgattagtg tctatatgta 3540
gctagctaat ttggttgggt gatttctgtg aaggtataaa ttggctgagg aaaacatgtt 3600
aaaggtaatg aaagagcaaa atgctgtgtt tcgacgccca attttaaggc cagaattgag 3660
agctgaggca cggaagttga ttggggatac tgggctgtta gaccacttgt tgaagcatat 3720
gtcagggaag gtggctccgg gaggagaaga gagattcaga aggaggcata acgcagatgg 3780
agcaatggag tattggctgg agaaggctga tttggttgat atcaggaaag aggctggtgt 3840
gcaggatcct tattggacac ctccacctgg gtggaaacct ggtgataatc ctagtcagga 3900
tccagtttgt gctagagaga tcaaggaact cagagaagaa attgctaaaa ttaaagggta 3960
ctggtccttc tgttttaact aggattgatt gtctttcaat tttgtgtggt cttttagctt 4020
gttagtgctg ttgatctggt aatgcccacc agtttttctc tgttactctt ggggtgaatt 4080
gtgtgcgcta ctgattccat ctctcgcgta tgtgttgttc ttatgggggg cagggagatg 4140
gaggcaatgg tgtctaaaaa acacggggag gaattagcaa tggtggcagc accgaattat 4200
tctcctacaa gtcaggacat ggagcatgac aacttcttaa ttccactgaa ggtaatagat 4260
atgaaagttt gaccagattt ttggactgac ccaagttctt ctcttgacaa tccatgtact 4320
atttttgcag gaaatgtaca ttgatttggt gaataagaag gtaaagatgg aggaacaact 4380
aaaggaaatt tcagaatctt tgtatgggat gaaggtagga gagcatgaga attcttcctt 4440
taataattat cattttcttt tcaattgaag tgtgtaagat ttgatatgaa tgattctttc 4500
cacgttatga cgttctgggt gctactagtg tatataagat tcgttcaaat aagaaattcc 4560
tgggtgattg catgatccac atcattgaaa gatggtagta acaaactgac catctgatgc 4620
atgtatctat tctagataat aagttgatgc ataaattgcc atgaaaccat ttgagaagct 4680
gttatattta gaggcttgat atgggagtgt tgcttattcc agactagatt tttgcaatta 4740
tttagttcaa tttaaagctc aaaatcccac attaaatagt ttcataaatg atgaatgttc 4800
tggcagtgga tttccgttgt ccttggtagt actttctaat ctggacagca tttatattgt 4860
aacaatgata cgcttaatga tgatcttagg atgaattggt tagttatgaa tttagttgtc 4920
cttacagtgc aacggggagg cttggctgca tttattgttg tagcatttaa ttatgcattg 4980
aacgcggtca ttattgtgat gatggaaata tttaattgat gcaggaagaa atggagaagc 5040
taaaaaccag agtggagaaa tcaaacagag cagaatcaac tgaaaagcca gctttattaa 5100
tgggctcaac agagtcaatc acgccagcag gaactggaag aaaggggaaa ggagtaatgc 5160
atcaggaaaa agaagcaacg gttttagggg aatcagcaca agaacaatgc aagtcatcat 5220
caggaggcat catagcacca agaacagaat caccagcacc aacggaggac agggcagcaa 5280
agatagagag gctgaaaagc gggtttagaa tatgcaagcc ccagggaagt ttcctgtggc 5340
cggatatgac taccttaacc cctcaccctc aggttgtggt cctactagaa gacctcattg 5400
cggtacaaac acctccctca gtgtcctcca ctacaccaaa acaatctcac ttcctctttg 5460
ctcctccatc tcaaacccat acaccccacc gtactttccc tgtgaagcca ttagctgaga 5520
gaaggcctgt caccattccc caatccacag ctgccacgac tccaaccagc tgtcctcccc 5580
ttgatcaaat gactcactcc cagtatgaga atagcagcat ttccacttct actaccatca 5640
ccaccactac caaaacccct ctcatcaacc ttaatgagcc actgaatacc aatcaaactg 5700
atgattatgg attgttttat gggtctcagt ctcatgctga agcctctcct caccctgtca 5760
cttaccaaag aagacatcat caaaatgtga ccaccagtat tgccatgcca agtgtatgtg 5820
tacttatcaa atctcaattt caattcatac ccatatttta gtgatactat catagtatac 5880
aagttgactc ctttttcatt ttctgtatgt tttacacagt tgggacccac aaagaaaggg 5940
atgatgagcc aatgggagga aggtgatcgg agaaaaggaa tgataaggta ctgtgagcag 6000
tgtgagcagc aacagggatg ctcctctgcc tcttccattg catcttcttc cttgccaatg 6060
ggaaagggga cttggttggc tctggctact tctaaggctt ccgtggagca caaatctaaa 6120
aggggttaaa caatctataa taataatagt agtagtaata atggctagtt tattatgcta 6180
gagtagttat tagttaaacc cctggaaaaa cattgattag gttgggtttc acttaatgct 6240
ttccctgtct ttgggcaagg aatcttctta acatagttat atacatatgg catatacaag 6300
gcacaaagag cttttagcgt ataggaaaa 6329
<210> 25
<211> 2493
<212> DNA
<213> Populus trichocarpa
<400> 25
atgtcgtttt ccacgctaag agctcttgtt tctgatcaaa ataaggaatt ctctgattac 60
tctttgtttt ccatgcttaa taatgaagac ccagctgagc atattaaagt gagctctttt 120
tatgaagttg atcactccaa gctgcctcat aaatcccctg atcaactcaa caaaacccgg 180
gttgtgatgg tgaatgaaaa gaccaggatg agagtctcgc tgaggtttcc aagcatcaat 240
tctctaagat gttacttcaa tgagattgaa gctattaatt acaagaaaga catgaaaacg 300
aagaagcagc agctaccagc attcgacgag aaatacatta taggatcaga agttgcaggg 360
gaagctcttt ataggagaat ctcttctcaa gaaatggcag acaagagtta ctcatggagt 420
ttctggatgg ttaaacatcc ttcggtttca cctcgaaaag tgtcataccc acctacaagt 480
actcatgtta ataaatttgt tggtgcaagg aaggtgtctc tcatgtctga gctcaacggg 540
acaggcatgg ttaagtgggg tcagcgccgg caggtcaggt tcttggctaa acacgtagag 600
gataaacgtg aaatagtgat tgcatcgaag gatttgatta aaagcgaaga agagaaagac 660
agtgatggta gtgatgatga cacagacgat gaggacgagg aggaggtcga tgttaagtta 720
gtagtaaaca agtcaagtga agctaaaagg aaattacgta agagaaagtg tcaaggtggg 780
tctggtatta gcaaattatc accaaaaaag aaaaggcgta aaattgaaaa gaagaaccag 840
attgtggtct ataggcaaaa gaagaacaaa ctcatcaaga attctattga cagatggtct 900
gcggggaggt ataaattggc tgaggaaaac atgttaaagg taatgaaaga gcaaaatgct 960
gtgtttcgac gcccaatttt aaggccagaa ttgagagctg aggcacggaa gttgattggg 1020
gatactgggc tgttagacca cttgttgaag catatgtcag ggaaggtggc tccgggagga 1080
gaagagagat tcagaaggag gcataacgca gatggagcaa tggagtattg gctggagaag 1140
gctgatttgg ttgatatcag gaaagaggct ggtgtgcagg atccttattg gacacctcca 1200
cctgggtgga aacctggtga taatcctagt caggatccag tttgtgctag agagatcaag 1260
gaactcagag aagaaattgc taaaattaaa ggggagatgg aggcaatggt gtctaaaaaa 1320
cacggggagg aattagcaat ggtggcagca ccgaattatt ctcctacaag tcaggacatg 1380
gagcatgaca acttcttaat tccactgaag gaaatgtaca ttgatttggt gaataagaag 1440
gtaaagatgg aggaacaact aaaggaaatt tcagaatctt tgtatgggat gaaggaagaa 1500
atggagaagc taaaaaccag agtggagaaa tcaaacagag cagaatcaac tgaaaagcca 1560
gctttattaa tgggctcaac agagtcaatc acgccagcag gaactggaag aaaggggaaa 1620
ggagtaatgc atcaggaaaa agaagcaacg gttttagggg aatcagcaca agaacaatgc 1680
aagtcatcat caggaggcat catagcacca agaacagaat caccagcacc aacggaggac 1740
agggcagcaa agatagagag gctgaaaagc gggtttagaa tatgcaagcc ccagggaagt 1800
ttcctgtggc cggatatgac taccttaacc cctcaccctc aggttgtggt cctactagaa 1860
gacctcattg cggtacaaac acctccctca gtgtcctcca ctacaccaaa acaatctcac 1920
ttcctctttg ctcctccatc tcaaacccat acaccccacc gtactttccc tgtgaagcca 1980
ttagctgaga gaaggcctgt caccattccc caatccacag ctgccacgac tccaaccagc 2040
tgtcctcccc ttgatcaaat gactcactcc cagtatgaga atagcagcat ttccacttct 2100
actaccatca ccaccactac caaaacccct ctcatcaacc ttaatgagcc actgaatacc 2160
aatcaaactg atgattatgg attgttttat gggtctcagt ctcatgctga agcctctcct 2220
caccctgtca cttaccaaag aagacatcat caaaatgtga ccaccagtat tgccatgcca 2280
agtttgggac ccacaaagaa agggatgatg agccaatggg aggaaggtga tcggagaaaa 2340
ggaatgataa ggtactgtga gcagtgtgag cagcaacagg gatgctcctc tgcctcttcc 2400
attgcatctt cttccttgcc aatgggaaag gggacttggt tggctctggc tacttctaag 2460
gcttccgtgg agcacaaatc taaaaggggt taa 2493
<210> 26
<211> 830
<212> PRT
<213> Populus trichocarpa
<400> 26
Met Ser Phe Ser Thr Leu Arg Ala Leu Val Ser Asp Gln Asn Lys Glu
1 5 10 15
Phe Ser Asp Tyr Ser Leu Phe Ser Met Leu Asn Asn Glu Asp Pro Ala
20 25 30
Glu His Ile Lys Val Ser Ser Phe Tyr Glu Val Asp His Ser Lys Leu
35 40 45
Pro His Lys Ser Pro Asp Gln Leu Asn Lys Thr Arg Val Val Met Val
50 55 60
Asn Glu Lys Thr Arg Met Arg Val Ser Leu Arg Phe Pro Ser Ile Asn
65 70 75 80
Ser Leu Arg Cys Tyr Phe Asn Glu Ile Glu Ala Ile Asn Tyr Lys Lys
85 90 95
Asp Met Lys Thr Lys Lys Gln Gln Leu Pro Ala Phe Asp Glu Lys Tyr
100 105 110
Ile Ile Gly Ser Glu Val Ala Gly Glu Ala Leu Tyr Arg Arg Ile Ser
115 120 125
Ser Gln Glu Met Ala Asp Lys Ser Tyr Ser Trp Ser Phe Trp Met Val
130 135 140
Lys His Pro Ser Val Ser Pro Arg Lys Val Ser Tyr Pro Pro Thr Ser
145 150 155 160
Thr His Val Asn Lys Phe Val Gly Ala Arg Lys Val Ser Leu Met Ser
165 170 175
Glu Leu Asn Gly Thr Gly Met Val Lys Trp Gly Gln Arg Arg Gln Val
180 185 190
Arg Phe Leu Ala Lys His Val Glu Asp Lys Arg Glu Ile Val Ile Ala
195 200 205
Ser Lys Asp Leu Ile Lys Ser Glu Glu Glu Lys Asp Ser Asp Gly Ser
210 215 220
Asp Asp Asp Thr Asp Asp Glu Asp Glu Glu Glu Val Asp Val Lys Leu
225 230 235 240
Val Val Asn Lys Ser Ser Glu Ala Lys Arg Lys Leu Arg Lys Arg Lys
245 250 255
Cys Gln Gly Gly Ser Gly Ile Ser Lys Leu Ser Pro Lys Lys Lys Arg
260 265 270
Arg Lys Ile Glu Lys Lys Asn Gln Ile Val Val Tyr Arg Gln Lys Lys
275 280 285
Asn Lys Leu Ile Lys Asn Ser Ile Asp Arg Trp Ser Ala Gly Arg Tyr
290 295 300
Lys Leu Ala Glu Glu Asn Met Leu Lys Val Met Lys Glu Gln Asn Ala
305 310 315 320
Val Phe Arg Arg Pro Ile Leu Arg Pro Glu Leu Arg Ala Glu Ala Arg
325 330 335
Lys Leu Ile Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met
340 345 350
Ser Gly Lys Val Ala Pro Gly Gly Glu Glu Arg Phe Arg Arg Arg His
355 360 365
Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu Lys Ala Asp Leu Val
370 375 380
Asp Ile Arg Lys Glu Ala Gly Val Gln Asp Pro Tyr Trp Thr Pro Pro
385 390 395 400
Pro Gly Trp Lys Pro Gly Asp Asn Pro Ser Gln Asp Pro Val Cys Ala
405 410 415
Arg Glu Ile Lys Glu Leu Arg Glu Glu Ile Ala Lys Ile Lys Gly Glu
420 425 430
Met Glu Ala Met Val Ser Lys Lys His Gly Glu Glu Leu Ala Met Val
435 440 445
Ala Ala Pro Asn Tyr Ser Pro Thr Ser Gln Asp Met Glu His Asp Asn
450 455 460
Phe Leu Ile Pro Leu Lys Glu Met Tyr Ile Asp Leu Val Asn Lys Lys
465 470 475 480
Val Lys Met Glu Glu Gln Leu Lys Glu Ile Ser Glu Ser Leu Tyr Gly
485 490 495
Met Lys Glu Glu Met Glu Lys Leu Lys Thr Arg Val Glu Lys Ser Asn
500 505 510
Arg Ala Glu Ser Thr Glu Lys Pro Ala Leu Leu Met Gly Ser Thr Glu
515 520 525
Ser Ile Thr Pro Ala Gly Thr Gly Arg Lys Gly Lys Gly Val Met His
530 535 540
Gln Glu Lys Glu Ala Thr Val Leu Gly Glu Ser Ala Gln Glu Gln Cys
545 550 555 560
Lys Ser Ser Ser Gly Gly Ile Ile Ala Pro Arg Thr Glu Ser Pro Ala
565 570 575
Pro Thr Glu Asp Arg Ala Ala Lys Ile Glu Arg Leu Lys Ser Gly Phe
580 585 590
Arg Ile Cys Lys Pro Gln Gly Ser Phe Leu Trp Pro Asp Met Thr Thr
595 600 605
Leu Thr Pro His Pro Gln Val Val Val Leu Leu Glu Asp Leu Ile Ala
610 615 620
Val Gln Thr Pro Pro Ser Val Ser Ser Thr Thr Pro Lys Gln Ser His
625 630 635 640
Phe Leu Phe Ala Pro Pro Ser Gln Thr His Thr Pro His Arg Thr Phe
645 650 655
Pro Val Lys Pro Leu Ala Glu Arg Arg Pro Val Thr Ile Pro Gln Ser
660 665 670
Thr Ala Ala Thr Thr Pro Thr Ser Cys Pro Pro Leu Asp Gln Met Thr
675 680 685
His Ser Gln Tyr Glu Asn Ser Ser Ile Ser Thr Ser Thr Thr Ile Thr
690 695 700
Thr Thr Thr Lys Thr Pro Leu Ile Asn Leu Asn Glu Pro Leu Asn Thr
705 710 715 720
Asn Gln Thr Asp Asp Tyr Gly Leu Phe Tyr Gly Ser Gln Ser His Ala
725 730 735
Glu Ala Ser Pro His Pro Val Thr Tyr Gln Arg Arg His His Gln Asn
740 745 750
Val Thr Thr Ser Ile Ala Met Pro Ser Leu Gly Pro Thr Lys Lys Gly
755 760 765
Met Met Ser Gln Trp Glu Glu Gly Asp Arg Arg Lys Gly Met Ile Arg
770 775 780
Tyr Cys Glu Gln Cys Glu Gln Gln Gln Gly Cys Ser Ser Ala Ser Ser
785 790 795 800
Ile Ala Ser Ser Ser Leu Pro Met Gly Lys Gly Thr Trp Leu Ala Leu
805 810 815
Ala Thr Ser Lys Ala Ser Val Glu His Lys Ser Lys Arg Gly
820 825 830
<210> 27
<211> 914
<212> DNA
<213> Rat
<400> 27
ggatcctgaa gctcgaaaaa caaagaaaaa aatcaaaggg attcagcaag ccactgcagg 60
agtctcacaa gacacttcgg aaaatcctaa caaaacaata gttcctgcag cattaccaca 120
gctcacccct accttggtgt cactgctgga ggtgattgaa cccgaggtgt tgtatgcagg 180
atatgatagc tctgttccag attcagcatg gagaattatg accacactca acatgttagg 240
tgggcgtcaa gtgattgcag cagtgaaatg ggcaaaggcg ataccaggct tcagaaactt 300
acacctggat gaccaaatga ccctgctaca gtactcatgg atgtttctca tggcatttgc 360
cctgggttgg agatcataca gacaatcaag tggaaacctg ctctgctttg ctcctgatct 420
gattattaat gagcagagaa tgtctctacc ctgcatgtat gaccaatgta aacacatgct 480
gtttgtctcc tctgaattac aaagattgca ggtatcctat gaagagtatc tctgtatgaa 540
aaccttactg cttctctcct cagttcctaa ggaaggtctg aagagccaag agttatttga 600
tgagattcga atgacttata tcaaagagct aggaaaagcc atcgtcaaaa gggaagggaa 660
ctccagtcag aactggcaac ggttttacca actgacaaag cttctggact ccatgcatga 720
ggtggttgag aatctcctta cctactgctt ccagacattt ttggataaga ccatgagtat 780
tgaattccca gagatgttag ctgaaatcat cactaatcag ataccaaaat attcaaatgg 840
aaatatcaaa aagcttctgt ttcatcaaaa atgactgacc tagttctaga gcggccgcca 900
ccgcggtgga gctc 914
<210> 28
<211> 5807
<212> DNA
<213> Arabidopsis thaliana
<220>
<223> DYAD Genomic sequence used for cloning as a Sal1 fragment
<400> 28
gtcgactttt tgtttgacca gtgtatttgg tttgacttca gatttggcaa gtacgaagct 60
tatgcgcttt tgcaatcgaa acaagggaaa aatctgtact ttgttagctg cgtgacttga 120
gctctttggt ccggagacgg tagaagacga caaagcactg acctttcatc tctcggcgat 180
cgaaaaaatc actctctttc ctcatcagac ccgacccgtt atgaaggtat ccagacccgt 240
ttattttgat ccatctcata gtcggatccc caaaaaaatt cagcttagat tggcccattt 300
aggcccgttt acagtttttt acttttttct taattatctt tttaacatct tacattatac 360
atatttgact caacaaaaaa atataactta aatgtattgt tgactgtttt tgataattaa 420
gaaaaaaata tttttaaatt attaaaaata ttgttgactc aacaaaaaaa tataacttaa 480
atgtattggg caaataatca tggtcataag tcctcaagct tattatttgt tttgattggt 540
ttaaatactt tataaaaaaa atatcaatta tatcatgtta ttacgtaaat taagcttttt 600
gattttaaaa aagcttcagc tcaataaaga aaaacagatt cagttatcat tggagtataa 660
aattggtcga tacattagag acattaatcc ttacatcata aacaatttaa tgtgaataaa 720
acatcataaa tcacatatca ttatccgaaa ataatcatat gtaagaataa tcactgtgac 780
aaaaaaaaaa aacaattcct cacgtgtgta gtcggtcccc actctagtag cagtagctta 840
atgatgcctt ctccgcacgt gtaacacgaa atttattcgc tacggccaat tacattaacc 900
ttcaggtctt atcaccgtta aattttcaaa atgacacacg tggcatcaat ccgtaatatc 960
actacgtctg ctttcaatct ttcattgtag atgatttcgt acaccaattt ccgcgaacgt 1020
ttacagttta gatacagttt gagggcaaat ctgtcaatat acgccaactt gctgcgaaag 1080
caatatagtc acgtgccgtg cacacgcata taagactcac acactcacac cactctctct 1140
ctctctctaa cctcatatat aaagccacct cccagattca ttaaatgcga catttcaaaa 1200
cttttctttt tgctgtcttc cccataagct ctctgctgat taaaaagatt ttctggtata 1260
aaacaaaatt cttcaaatat ttctgggttt atgttttctc tctatttctc agaaatgctt 1320
taatttctcc atccgcgtcc atgttttttt ttctccgttg ctgattttga tttttttaat 1380
ccagtgaaaa ggaggaacga agattatcga gagcaaaaat catgagtgta agatctctct 1440
cgctctcaga ttttattttt tttcgctgtg atataaatgg ctcagtcact atcagtctca 1500
tgatgagaaa aataaaactc atcaccgctt gattctgttt ccttagtgtc tcccacgcgc 1560
gtaccagaaa gcgcgtgtgt gtttcttgtt atactcgcag agtcaggttt tttcaaatat 1620
attctctcca ggcagcagca acaacaacaa accgattttt tcattattcc ttataacaat 1680
ttttgattct ccagaaaaaa aatatctctc ttagtttttc tcttgttcta cagagtacga 1740
tgttcgtgaa acggaatccg attagagaaa ccaccgccgg gaaaatctct tcgccgtcgt 1800
caccgacttt gaatggtaaa ctactgaagc tatagtttct tcgtttttgt tgattttctc 1860
gcttctcttc taatttctga atttttggtt tgggtttgtt cttacagttg cagtcgcgca 1920
tataagagct ggatcttatt acgaaatcga tgcttcgatt cttcctcaga gatcgccgga 1980
aaatcttaaa tcgattagag tcgtcatggt attcactcga ttctctgctt ttttcacctt 2040
ttattataga cagatctcgt tttttgttgt tcgtctgggt tttcgagtga ttttttaagg 2100
tttattgatg caggtgagca aaatcacggc gagtgacgtg tctctccggt acccaagcat 2160
gttttcactc cgatcgcatt tcgattacag taggatgaac cggaataaac cgatgaagaa 2220
gaggagtggt ggtggtcttc ttcctgtttt cgacgagagt catgtgatgg cttcggagct 2280
agctggagac ttgctttaca gaagaatcgc acctcatgaa ctttctatga atagaaattc 2340
ctggggtttc tgggtttcta gttcttctcg caggaacaaa tttccaagaa gggaggtggt 2400
ttctcaaccg gcgtacaata ctcgtctctg tcgcgctgct tcaccggagg gaaagtgctc 2460
gtctgagctg aaatcgggag ggatgatcaa gtggggaagg agattgcgtg tgcagtatca 2520
gagtcggcat attgatacta ggaagaataa ggaaggtgag gagagttcta gagtgaagga 2580
tgaagtttac aaagaagaag agatggagaa agaagaggat gatgatgatg ggaatgaaat 2640
aggaggcact aaacaagagg caaaggagat aactaatgga aatcgtaaga gaaagctgat 2700
tgaatcaagt actgagagac tcgctcagaa agctaaggtt tatgatcaga agaaggaaac 2760
tcaaattgtg gtttataaga ggaaatcaga gaggaagttc attgatagat ggtctgttga 2820
gaggtaaaat gcataaaaat taacgaattt tatgatctct gaatttggat tttccttggt 2880
tctattgatt gattgtggtt aattttgaag gtacaaacta gctgagagga acatgttaaa 2940
agtgatgaag gagaagaatg cagtgtttgg caactccata ctcaggccag agttgaggtc 3000
agaagcaagg aagctgattg gtgacacagg tctattggat catctgctta agcacatggc 3060
tggtaaggtg gctcctggag gtcaagatag gtttatgaga aagcacaatg cagatggggc 3120
aatggagtat tggttggaga gttctgattt gattcacata aggaaagaag caggagttaa 3180
agatccttac tggactcctc cacctggttg gaagcttggt gacaaccctt ctcaagatcc 3240
tgtctgcgct ggagaaatcc gtgacatcag agaagaatta gctagcctga aaaggtagaa 3300
aagttattga attggttata cgatcatctc cctttagttg tcttattgca attttaactc 3360
atgtctgtct tggtcttgag aagagaattg aagaaacttg cgtcaaagaa ggaagaggag 3420
gagcttgtta tcatgactac gcctaattct tgtgttacta gtcagaatga taatctgatg 3480
actccagcaa aggtaagagc tcgaaacaat agctgaggcc tctctcttgt gaaaatgttt 3540
tatgctactt tgtgaacatc tctgctgctt tttcttagga aatctacgct gatctgctga 3600
aaaagaaata caaaattgag gaccagctag tgattattgg agaaaccttg cgtaaaatgg 3660
aggtatgtat atccctagat tgagtttcca agtagacaca aacccttact taaaatgtaa 3720
aatcttgatt tagtaactat cacaagtagt cataggaaac tcccttggag gataacagtg 3780
aaccatgtaa aatgggccca tttagcgtat gtgataaatg atttcctctg tctctatgag 3840
agaccacttt gctgatagtc gaataatgat gaaacatttg tgttactata aatgcaaata 3900
ttgcaggaag acatgggatg gcttaagaaa acagtggacg agaactatcc taaaaagcca 3960
gactcaacag agacaccttt gctactagag gattcaccac caatacagac actagaagga 4020
gaagtgaagg tggtgaacaa gggtaaccaa atcacagagt cacctcaaaa cagagaaaaa 4080
ggaaggaagc atgatcaaca agaaagatca ccactttcac taataagcaa cactggtttc 4140
agaatctgca ggcctgtggg gatgttcgca tggccccaat tgcctgctct tgctgctgct 4200
actgatacta atgcttcttc gccaagtcac agacaagcct acccatcccc ttttccagtc 4260
aagccacttg cagctaagcg tcctcttggc ttgacgtttc ccttcaccat catacccgaa 4320
gaagctccca agaatctctt caacgtttga agttgtcact ggaaactgat gcatcagatc 4380
ttactttccc tacaagtaag ctgatgtgaa ctggtaaggt ctcttccatg aaatatataa 4440
taacttacaa gcgagcaggt atttaaaagt accacttata tttatataag gaactatatt 4500
tatgggaata atttggcaac tttttgaaat tattcctctt taatttaggg attttacgtc 4560
tctggttatt aattatatat agagagagat gatttgaaat agagaggctt atcataggaa 4620
tatattcttt tgaaagacag ggatcatcat attctgtatt actgaacaat ttctataatg 4680
atacagttat atatatatat atatacttat tattcaattc ctagcgcttt tgattttaaa 4740
tatattattt tcgtgtagtt gattaatttt gaaaaacttg tattacgcat atgaattatg 4800
tcccgttgat ctataaaaat catattttgc gattaagcac aaactataaa agtatgttta 4860
agttcctgcg ggttgaccag tttcacttta aaatcttggt ctttgggatg agtttgccga 4920
taaattttgt gacttatggt tatctaataa tacgaatgtt atactttcca aaatttgaaa 4980
aaaacaatat gaatacttta ttattatctt tttccttcca tttctcttcc cgcgttttgt 5040
tgttcgaccg atcttgtagt acatgtgttc taatttgaac gtcgagaacc attaaagaag 5100
gaagaaagaa aagaaaaaaa aaaacttttt tctcatttcg agatttccta accatttggt 5160
ggtgcaggtt taagtttcgc tcgctctcct aaaaccaaac gtccaaaccc gttctctaga 5220
ctagttctgc tgcgaaacac gacacacacc aagtcaccaa tattacttga atccacgtca 5280
aataaacaat ggtcattcaa tatggttaat gcaacactcg agtaacttta ttttcaaaga 5340
aatttgcaca aagtcatgtt atgatatggt gtataatatt tgtgtatata tccggccaaa 5400
aaacataaca agttttttat aaaaaaaaaa attaattata tatctaaaat atagaatagc 5460
tagtaataaa actagtgaga aacaaattta aaacaaatta agcaactatg ttatttgcca 5520
aattgacaat tttaaatatt atggcgtatt taaaaaaaat taggagccac ttgtgattta 5580
tttgtatcaa ctagtaaatt ttaaacataa aaatcattta taaatataaa taaatattat 5640
catatttatg tagaaagagt ctcatcagtc tgatagtcaa tcacttgtgc gcaaagaaat 5700
ttgacgaaag gggttacaaa aaaatggcca gcacagcatc atcatgtccc cgaccttata 5760
ttataagatt tgtatatttt atccataaat tgtatataac cgtcgac 5807
<210> 29
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Microsatellite marker primer
<400> 29
gacatgattt aacataatgc caatta 26
<210> 30
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Microsatellite marker primer
<400> 30
cgaatagaaa ctcatttagg aacct 25
<210> 31
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> SNP KNEF
<400> 31
cgtctctaag ttgtttaagg ggtta 25
<210> 32
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> SNP KNER
<400> 32
tcacgcaagt taattatgta agatga 26
<210> 33
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> SNP KKF
<400> 33
aaagagagta gaactcgctc aatgt 25
<210> 34
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> SNP KKR
<400> 34
tatcaacagc tcgttactgg actg 24
<210> 35
<211> 26
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer bdy1
<400> 35
catgaggtgc gattcttctg taaagc 26
<210> 36
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer BDY3
<400> 36
ggaagaggag gagcttgtta tcatgac 27
<210> 37
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer ismr4
<400> 37
tccgcgaacg tttacagttt agatacag 28
<210> 38
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer OCSR
<400> 38
gaaccgaaac cggcggtaag g 21
<210> 39
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Bho5BAM
<400> 39
cgggatccga tctgatgcat cagtttcagg tg 32
<210> 40
<211> 32
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Bho3BAM
<400> 40
cgggatccga gcaaaaatca tgagcgtaag at 32
<210> 41
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer 5RF3
<400> 41
agtacgatgc tcgcgaaacg gaatc 25
<210> 42
<211> 42
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer DyPB
<400> 42
aaaactgcag ggatccccaa cgttgaagag attcttggga gc 42
<210> 43
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer DyCF
<400> 43
ccaaatcaca gagtcacctc aaaacag 27
<210> 44
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GRrev
<400> 44
gtaaaaccgt tgccagttct gactg 25
<210> 45
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer Ds5-2
<400> 45
cgttccgttt tcgtttttta cc 22
<210> 46
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer GLTF
<400> 46
aatgcacccg aaagtctatt tgc 23
<210> 47
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer PDYBAM
<400> 47
acggatccta gaacaagaga aaaactaaga gagatattt 39
<210> 48
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer PG2R4
<400> 48
tctggggctc gtcgactttt tgtt 24
<210> 49
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KanF
<400> 49
gccaacgcta tgtcctgata g 21
<210> 50
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer KanR
<400> 50
gattgaacaa gatggattgc ac 22
<210> 51
<211> 803
<212> PRT
<213> Oryza
<400> 51
Met Asp Ala Glu Met Ala Ala Pro Ala Leu Ala Ala Ala His Leu Leu
1 5 10 15
Asp Ser Pro Met Arg Pro Gln Val Ser Arg Tyr Tyr Ser Lys Lys Arg
20 25 30
Gly Ser Ser His Ser Arg Asn Gly Lys Asp Asp Ala Asn His Asp Glu
35 40 45
Ser Lys Asn Gln Ser Pro Gly Leu Pro Leu Ser Arg Gln Ser Leu Ser
50 55 60
Ser Ser Ala Thr His Thr Tyr His Thr Gly Gly Phe Tyr Glu Ile Asp
65 70 75 80
His Glu Lys Leu Pro Pro Lys Ser Pro Ile His Leu Lys Ser Ile Arg
85 90 95
Val Val Lys Val Ser Gly Tyr Thr Ser Leu Asp Val Thr Val Ser Phe
100 105 110
Pro Ser Leu Leu Ala Leu Arg Ser Phe Phe Ser Ser Ser Pro Arg Ser
115 120 125
Cys Thr Gly Pro Glu Leu Asp Glu Arg Phe Val Met Ser Ser Asn His
130 135 140
Ala Ala Arg Ile Leu Arg Arg Arg Val Ala Glu Glu Glu Leu Ala Gly
145 150 155 160
Asp Val Met His Gln Asp Ser Phe Trp Leu Val Lys Pro Cys Leu Tyr
165 170 175
Asp Phe Ser Ala Ser Ser Pro His Asp Val Leu Thr Pro Ser Pro Pro
180 185 190
Pro Ala Thr Ala Gln Ala Lys Ala Pro Ala Ala Ser Ser Cys Leu Leu
195 200 205
Asp Thr Leu Lys Cys Asp Gly Ala Gly Trp Gly Val Arg Arg Arg Val
210 215 220
Arg Tyr Ile Gly Arg His His Asp Ala Ser Lys Glu Ala Ser Ala Ala
225 230 235 240
Ser Leu Asp Gly Tyr Asn Thr Glu Val Ser Val Gln Glu Glu Gln Gln
245 250 255
Gln Arg Leu Arg Leu Arg Leu Arg Leu Arg Gln Arg Arg Glu Gln Glu
260 265 270
Asp Asn Lys Ser Thr Ser Asn Gly Lys Arg Lys Arg Glu Glu Ala Glu
275 280 285
Ser Ser Met Asp Lys Ser Arg Ala Ala Arg Lys Lys Lys Ala Lys Thr
290 295 300
Tyr Lys Ser Pro Lys Lys Val Glu Lys Arg Arg Val Val Glu Ala Lys
305 310 315 320
Asp Gly Asp Pro Arg Arg Gly Lys Asp Arg Trp Ser Ala Glu Arg Tyr
325 330 335
Ala Ala Ala Glu Arg Ser Leu Leu Asp Ile Met Arg Ser His Gly Ala
340 345 350
Cys Phe Gly Ala Pro Val Met Arg Gln Ala Leu Arg Glu Glu Ala Arg
355 360 365
Lys His Ile Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met
370 375 380
Ala Gly Arg Val Pro Glu Gly Ser Ala Asp Arg Phe Arg Arg Arg His
385 390 395 400
Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu Pro Ala Glu Leu Ala
405 410 415
Glu Val Arg Arg Leu Ala Gly Val Ser Asp Pro Tyr Trp Val Pro Pro
420 425 430
Pro Gly Trp Lys Pro Gly Asp Asp Val Ser Ala Val Ala Gly Asp Leu
435 440 445
Leu Val Lys Lys Lys Val Glu Glu Leu Ala Glu Glu Val Asp Gly Val
450 455 460
Lys Arg His Ile Glu Gln Leu Ser Ser Asn Leu Val Gln Leu Glu Lys
465 470 475 480
Glu Thr Lys Ser Glu Ala Glu Arg Ser Tyr Ser Ser Arg Lys Glu Lys
485 490 495
Tyr Gln Lys Leu Met Lys Ala Asn Glu Lys Leu Glu Lys Gln Val Leu
500 505 510
Ser Met Lys Asp Met Tyr Glu His Leu Val Gln Lys Lys Gly Lys Leu
515 520 525
Lys Lys Glu Val Leu Ser Leu Lys Asp Lys Tyr Lys Leu Val Leu Glu
530 535 540
Lys Asn Asp Lys Leu Glu Glu Gln Met Ala Ser Leu Ser Ser Ser Phe
545 550 555 560
Leu Ser Leu Lys Glu Gln Leu Leu Leu Pro Arg Asn Gly Asp Asn Leu
565 570 575
Asn Met Glu Arg Glu Arg Val Glu Val Thr Leu Gly Lys Gln Glu Gly
580 585 590
Leu Val Pro Gly Glu Pro Leu Tyr Val Asp Gly Gly Asp Arg Ile Ser
595 600 605
Gln Gln Ala Asp Ala Thr Val Val Gln Val Gly Glu Lys Arg Thr Ala
610 615 620
Arg Lys Ser Ser Phe Arg Ile Cys Lys Pro Gln Gly Thr Phe Met Trp
625 630 635 640
Pro His Met Ala Ser Gly Thr Ser Met Ala Ile Ser Gly Gly Gly Ser
645 650 655
Ser Ser Cys Pro Val Ala Ser Gly Pro Glu Gln Leu Pro Arg Ser Ser
660 665 670
Ser Cys Pro Ser Ile Gly Pro Gly Gly Leu Pro Pro Ser Ser Arg Ala
675 680 685
Pro Ala Glu Val Val Val Ala Ser Pro Leu Asp Glu His Val Ala Phe
690 695 700
Arg Gly Gly Phe Asn Thr Pro Pro Ser Ala Ser Ser Thr Asn Ala Ala
705 710 715 720
Ala Ala Ala Lys Leu Pro Pro Leu Pro Ser Pro Thr Ser Pro Leu Gln
725 730 735
Thr Arg Ala Leu Phe Ala Ala Gly Phe Thr Val Pro Ala Leu His Asn
740 745 750
Phe Ser Gly Leu Thr Leu Arg His Val Asp Ser Ser Ser Pro Ser Ser
755 760 765
Ala Pro Cys Gly Ala Arg Glu Lys Met Val Thr Leu Phe Asp Gly Asp
770 775 780
Cys Arg Gly Ile Ser Val Val Gly Thr Glu Leu Ala Leu Ala Thr Pro
785 790 795 800
Ser Tyr Cys
<210> 52
<211> 5335
<212> DNA
<213> Z. mays
<400> 52
gtagagatgg caatgggtac ccgaaacccg aatacccgac gggttttccc cgatatgaag 60
gcgggtacgg gatgatttct ctacccgcgg gtatgttaat gggtaaaaaa ctctacccgt 120
tgggtagacg ggtacggata tgggttggta cgtctatccg tgggtaaaat atacccgcat 180
caataacact ataaacatct aatagagtcc aacttagcta gaataaaatc cttctctagt 240
tatcatttat ctagatacca agttatgtaa tcatatgatt tgttatatgt gaaattgaag 300
ttgtttttat atgtttattt aatattttga gtgattggta tattggaatt taattctttc 360
cgagcgggta cgggttaccc gatgggtaaa aatacccgcg cggatacggg tatgggtaag 420
attttatacc cgcgagcata tatgggtaac ctgacgggta gatttttttt tgatgggtac 480
gggtatagaa tggtactacc cgacgggtat gtacccgttg ccatccctag acacgagcat 540
gctacggaag gagcggtggg aggtcttagg ctggtgccaa tgggggctag aagggaggcg 600
agaagggccc tctaccgccc cgcgcgaggc gataggcagg cgagagggag agagagggcg 660
acagcactca cgcccggcga gagcgggcga tatcgccccg ctctcgcccg cgttggcgcg 720
cgcgtctggg cgagagggag gcgagaggga ggcgagaggg gggcgacgca ctgacggggc 780
gagagtgagg cgggcgagag tgcggtggcg cgacgtgatt ggtccacgtg tgccacgtgg 840
actagccgtt ttttaccgtt tggagtccaa aaaattcgaa aaaattgcaa aaaatcacaa 900
atttcattcc caatccatct ataaatatcc ctacctgttg gaggtcataa ttagatttat 960
gtaattttct attaattgtt atgtaatttt ttaattgtca tgtacttttc ttttaattat 1020
tatacacttt gtaattttaa attcaataaa aaatattatg ttgtgtgatt tgtaagcgtt 1080
gaaacaaatc tgtgtgaatt atttaatcct gaaatagaaa agctgatgtg gctatgggct 1140
gaggctatag cctgctacag cctgtgcact ggagcagcag aggcgagagt ggaggcgaga 1200
gctgacgtgg caggggcgag agagaggctg tgcactggac tcagcctaac tgcaactgga 1260
cttgcactgc tggagcgaga aggaaggcga cgcaccaacc aaccggtaca gcgctgcgag 1320
aacaagtgaa caaccaaacg caccaggcgg gggtctccgt ctctatagtt gggatttggg 1380
aacagttccg tcactgtgtg ttactgttac cgcagtgaaa gactgatggg ctcttgggtc 1440
ggtggatcct gtacgaaaga ctgatgggct cttgactgcc aagtcagcat atgttgcaca 1500
attttgagga tcttttttgt ccttttaatg catcaaccat ttggagccct catgcggagg 1560
gaaagcagga attcttcact ggctgctcat tcaaaaacaa gattctaaca gctgacaacc 1620
ttacctggag gcattggccc tgcaacccgg tctgcactct atgcaatcag gattgggaag 1680
acagctatac atctatgctt caaatgtcct tttgcctcac atgtttggga ttctttaaga 1740
atctggtcca ataatctcat tcaacatcct agcactagca gcgacgtcca aagcattgtt 1800
gactggtggc tgcgatcttc tatgcataga accaaaagca tccacagaac ggtggcaggg 1860
attaaaatct gagtgaggtc ccagcttaga tctcaatcta tcttgctgtt gtgcggctgc 1920
gccttgtaaa tagctcctgt aaccttccct ctgtacgact caatctcctt tcattcttat 1980
atgaattagc agtgctcctg ctactttttt caaaaaaaaa tcaccagcat caagaacata 2040
cagattgtaa ggggaaatta aatatcacca atatatatat gcccgaaaaa attggtcaca 2100
cttaatatgt agtgcagcag gcatacaaga atgacccggt atattctata acatgactct 2160
atatgcccta tggtgccagc aaaatcgaca catctcaact ccaaatgtgt catgcaccat 2220
ggacagggga gaatgggaga tgaccatacc caactgactt actgaagaga ccaatccaat 2280
gcaacgactt tagcttcaac ctgagaatta actagaaact gacgaacctg agatggctac 2340
ggaagtacga ttatgccaca aagactgctc aagtgagttc atattccctt tttcttatct 2400
tttttctctc tctctttttt tctctctctc tctgtattta cgctacgtgt tgctcctttg 2460
ttacaaagac agaaaattgg agcaccctga ggccaaccat ccaaagcttt gcttgcagat 2520
ggggaagagg cgatgatcct gaagtggaaa ggtaggagta ggtcagcagt aggatggagt 2580
agccagggcc agctcggttc ccaccgcgct gatcccgccg gcgtctgcat cgaacaggac 2640
cctcttcccc tctagcaggc cggaaccgca ggccccggac gatgacgacg aggtgtcctg 2700
cacagcccac gatcagtcga acatgaatca gcttgcacgt ttcttgactg gttatggtta 2760
gctagtagcc tagtactaat gcttgccgac agcaatggaa cagcaggcca gagtccagac 2820
tatagaacca gaggataaag agaaagcaag caaagtggac ttaccacatc gcgtcgagtc 2880
aggccggaga aatgcatcag cttttgggga ctaaacccag aagcagcagc agtaacagtg 2940
tcaaacagct tctgcggctg caggggcgac ctcgggctgg gcagggacag ctgcagcttg 3000
gcagcgtcgt tggtggacga cgccgagggc ggcgtagaga agtgggcgcc aaacatcacg 3060
tgctcgtcca ggccggacgc cgccgccacc acctcaactg ggcctcgcga cgaccgcggg 3120
aggcccggca tactggggaa actggtgctg cgagggatcc ccgggcctgg cgtggcggcg 3180
gccgggcagg tgctgctggc gcccctgccg atggtcatgc cagacgccat gctcggcaac 3240
aggaacttgc cctgtggctt acagacgcgg aagctgctct tcctttccgc cctgtcttgg 3300
ccgccttgga tgacggtgcc ggtcatctgc tcaccggaag caacgaacag tgctgtgcgg 3360
ggaacagctt cacttggagc cagttccagc ttcagagcca ctaccagctg atcctgcacc 3420
actcaattct gtttacttca actcatggaa gatgtcagat gtacatttgc ataggctgag 3480
aaaaatcaat aaaaagagtg cattgccata caaggagcta ccttgaaaga aaggaaggag 3540
ctggagaggt aggtaacctg ctcctctaac ttatcattct tgtcagctat atgctcgtac 3600
ttttcctgaa attaaacagt ggttcactaa ctgtatttgg agttacacgg atctagcagg 3660
caaaatgtgc ataggaatag atgctacaga taaaaaagat cattgtgaat gtcatagctg 3720
tctcctgtct gcatgaatgt accttgaagg atgacacctc cttcttcagc tcaccattca 3780
tctgaaccac attctcacac atgtcctgaa aataaaaggc aatatcattt ctgaaaattc 3840
agcaagcaga cttagcaaag acatagcttt ttattttgca aggatatcga agtcatagct 3900
tccctgtaaa tttaataagt gaagacaaat caataacggg catggtttct cagttctcat 3960
tttgtttgaa attactgaag ccaaattagt aacaggcata gtttctcggt tgtcatttag 4020
tttgaaacta actaccacat ttttcctagc agacaatgtt gctgcatcca tgcgcttacc 4080
ttcaaacaga gcacctgctt ctcaagcttt tcattagccc tcacagcacg ctggtacttc 4140
tcctgacaaa caaattgata agctttcatt agtgcatcca aaatgggcat gccaaatagt 4200
ttctatcagt tagtatagtc aatgtgagaa gtaaaacaga gaaactgtag ttcatgctag 4260
tcagatcatg cacatcagta catcctggat tcagaatttc agagactgga caaggaacta 4320
gctatgttct tacagacagc aagcattatg aaacatcaga gaaactgaac cgggagtcca 4380
ggactggcat tctattctag cacttcaaaa aacctcccgt caacatacga aatgatgtac 4440
atgacttgca caacccaacc caacatacag aaacatggaa aatgctctaa tgcctatgat 4500
tttccaaaat aaagagaggt gcaaatacat atccaagtat acagaaatat ccacatcagt 4560
gccactacca tatcttgctc agtttaatca gaagcagcag ccttcaaaag ttaagggaac 4620
aacgaattgt aacagggtaa aggagctgat cttttgcata ctttcaatga actgtagtct 4680
ctctctgcac cgaagtcccc atcatccttg cacaataact gctccatttg ccttcacaca 4740
ccaccacaag aataacttgg cataaaactc agaagaaacc ccttgtctat gtaagaactt 4800
agcagggtcg tagcactgat ggcttgaatt gccataaaac tatatattat agagtgcaga 4860
cagacaaaag gagtagaaaa agatatacct ttttacgcca ttgacctcct cggtgagctc 4920
ctcaacctgc ctcttgacta gaatgtcgcc ggcgacgagg gacacatcat cacctggttt 4980
ccatcccggc ggtggcaccc agtatggatc agatacaccg gcctgtttcc gtacctcagc 5040
aagctcggct ggctcaagcc agtactccat ggcaccatcc gcattgtgcc ggcgacgaaa 5100
ccggtgaacg ctgccttccg gcacccggcc agccatgtgc ttgagcaggt ggtcaaggag 5160
gccggtgtcg ccgatgtgct tgcgggcttc ctcccgcagc acctgccgca tcaccggtgc 5220
gccgaaccgt gcgtctcggg agcgcatgat gttgagcagg ctcttctctg ctgcggcgta 5280
gcgctcggct gaccaccggt ccttgccgtg cccgagggtc accgtccttg gattc 5335
<210> 53
<211> 4862
<212> DNA
<213> Z. mays
<400> 53
gcgcgcggcg tggttgctgc tcatgacgaa gcgctcgtct agttccggtc cggtgccggg 60
tgccgggtag gaggagaaga agctgcgcag cgcctgaagg gacgggaatt tcactgtgat 120
gtccaggttc gtgcactcgc tcacctaggt acaggccaga acttgctcaa acatatgcta 180
aacaaacaga ttaagaaatt gagagcagaa attgaatccc agaaagaaaa atctcacctt 240
aaccacccgt atggatttca gatggattgg ggatttaggg ggcaatttat cgtggtcgat 300
ctcgtagaaa gctcctgatg gaaatcgaac caatttacac aagtgtcaga tactcaggtg 360
ggcgtggcat gaataatagt agtgttaccg tgttgcatcg tatatgcccg tgctcaccag 420
cgtggtatgt ggggatggcg tcgaaggtca ggctctgtct gctcaggggc gacctgggtt 480
gaatcgtgga gtcgtggttg acatcatcct taccatttct gctatgacta ctgctcgtct 540
tcttcttgaa gtagtacttc ttcacctgtg gcttcttgtg atttgcaatg gtcacacaaa 600
caacgggtga gaccgagacg tgtatgattc ttggaaacaa aattatacac tgaaatggtc 660
aagttttttt ggagattgag agcgcgtgca tgtgcatggg agaactagtc tcgggaaaga 720
cagacaacag tcaacataat gtaccactgg accaacagaa atgaaaagag acatgcaaag 780
ggaacataca ggtacttttt aacatgaaga ctgccggttc gttaccataa ataatcatca 840
cctatcctaa aatgggttaa caaaaataac gaacggctta acaattaata aatatttatt 900
aagtcattta aggtgaatga tcattatctt gggtaacaaa tagtgttgtc tatatataca 960
cacaaattaa aattgaggtg tatatatata tatatagccc aaagacaaag tcaacttgaa 1020
atgttcaacg ataatggcaa gtggactaca gtatacaaag ggacaaattg tatagctatc 1080
taggaccttt ttaaaaaaat aaataaaaag caagcactat aaccatgcta attatagtgc 1140
gtgggttgat tcaaaacaac ccaacatcac gtcttcgtga aaaaaaaaga ataataacac 1200
tgatccagct agtggcacga atgtctagag ttcaattgca caaagaatcc caaataaaca 1260
aaagagagag agaaaaagat gcattatcca ttgtctgtag aaattagcac ataaaactca 1320
acatgcctag ggtgtttaat tagtttaaca acaatgaacc tgtttggaaa caccatagtt 1380
ttttttaaaa atgttttcta tattcagttt gtagaatgaa actggtttgt aaaaaaaact 1440
aagtgtgcat gtttggaagc cagttttttt aaaaacaatt tctaccattt ctgatacaca 1500
gagtaattga ttatattatc ccctttttat ttgttgccat atataaataa tataggttaa 1560
actcatattt ttaattcaaa attttcaaat aattaaccat tcaaatccga tagagcagac 1620
atcgagatga tcgcatgcat aggtctggag cggtggcaat caccataatt tccacaaaac 1680
caactaagaa cagtacgaaa tttgcgaggc aaaaaaccgg ttttaaatag aaaaggctag 1740
cttcctggtt tattagaagc tgggaatcca gttttttgaa actggagcaa aaaaattggc 1800
atgtttgaaa gcaccctagt ttctataatc tattttttca aagctgggtg tgcttccaaa 1860
cagaccctat taattgttac tccctccgtt tcgttttagt tgtcgctgga tagtacaaaa 1920
ttgaactatc cagcgacaac taaaaagaaa cggatggagt attcttttaa cagccatgtt 1980
ccctcatcag ctaccaatgc acgtataatt aactgaacaa actagtagta cgttgtactg 2040
tcctctagta gagtccatat ataggcaaca ctatagaaag tacactattc caaatcaagc 2100
aacggttcag caattttcaa aatgccgcac ttaatgtgct cagcagattt taacaaggct 2160
cacgttggag aaatgaccat gccttgctgt tttcacacta actatttttg tcaacctata 2220
tatagcattc atgcacttgt attaaaataa gcaagatcag tctaacaagt tgaacccatc 2280
agcggctctt gagtccagat aactaccacg gacaataaac tacttgcgag agcatcaaat 2340
caaaggatat atcgactaca gtacatctca gtaactatac atctcaaatt aaacatcgat 2400
ccagcgaaat atcgaattaa tcacccaaaa agcaactaat aaagcggcgc acaatatcct 2460
atatcattgt aactgaccgc gcgcagccgc agcagtaggt cagtggaaag agaaaccaac 2520
agatcaccac catacccaga tcacagaaag caaaaggtaa taatcgaact ggcaaaagtc 2580
gcagctagcg tctacgacgt gtagcaagac cggactggcc cgacacgtac gtaccggcga 2640
tgcctgcagc tgcagatgag ccgcgagcgc aggacccgcc tgcaccgtct ctacgtccat 2700
ctgcatgcgg gtcctcagag ttttttttgg gtctcctgca aaagcaaacg ggcaaacaaa 2760
cccaccgatc aagacaagta tatatatata gttcaaaaag agttaagcaa gaaggacaga 2820
gacccttcga tgatcgaaat gataacaaat tttcgaaacc catccaaatt gacccgcata 2880
tagatgaact aataataatg cgcactggca ttttccgacc aaactggcga gatttataaa 2940
ttgtaagttc gaagaaaaaa cattcaaaac tctagttccc aaaccaaagc accaaaaggc 3000
aggcaacaaa agtcaccaaa ctgagtctga ggttgaacgc ttcaagggga aaagagagcg 3060
cgcctcatct cgtctcgtct agcagcagcg cgttatgtgg caaaagtcgc ttgtacgaag 3120
aacctgcaag ctgctttctg ctgctagcgg caagccgcaa ccgcacggat cgatcgaagc 3180
aaaagcaagc gaggcccgag gaaacagcga caaggcagca gagatcggaa aggaaaaacg 3240
agctgctttt gcgatcgaag tatagaacca gcgagctttt tggcactgcc gcggaatcgc 3300
gcagcgcggt aggaagtggt ccgcgtgcgc ggcttcctcg tgcccggagc ctctctagca 3360
aaaaacccaa cagcatcaga cacctatagc agcagtgcag tacacccgta caacagttcg 3420
ttttgatcaa gcgggtttta ggtcacgccc ttttcgcatc aaattgagag aagggaacga 3480
accagatgga gaaaaatggc ccggatcaga acgaagaaga atgagagacc ggatgaacac 3540
acactgctac cagcagggcg cggttagaaa tagatcgcag aagaataccc acgacgcata 3600
catatgccag agcaattagg ccactactca cctgtgtggt atttacttgc tgctgctgct 3660
gcttctggga tcggggtggg atcgaatcaa aaagaaaagt agaggcaggc cgaaatgtgg 3720
cgagaaaatt gggtcgctag acaattctag tggagtgctt attctctgat cgatgtacct 3780
ggggacgatc gatcccgaaa ggcgggggga gctttgggga ggcgatcgag ctagttcatg 3840
gtggggagta gtggagtgga ggcaggcgcc gtgggtcggg aggtggggcg ctagggtttt 3900
tgttgttccg tgatcgatcg gcgtcggggg gctggggctc cgcctcttct cccccggctg 3960
cctcacctcg ttgatcaccg tgtccgcctc gtcgtgcggg gagccgggga ctagatagtg 4020
ccgtggagga gaatcctttt tctagagaga ggagtggggt ggcagggtgc agcgcgtgtg 4080
tgatgctgat gccgttgtag agagagaaaa atctaggaca gccaggctcg tcgcagaggg 4140
cagcaagcag caacctcctc acggaacggc ccgcacctgg tctgccgggg gatcgagcct 4200
atgacacgtg ggcccgctct gcccgcggac cagacgtgtc tgcaggcagc ccggcacggc 4260
agacgggtgg gtgttgtgcg ggcgacgacg atatatgcgg tgcccaagta gcggtggcga 4320
agcgcgcgag accttgtgga ccccatctgt cgggcgagag cgcgcggcgc accattacaa 4380
ggacgacgct tgcgaaacga tggcgcgggc gcgccggcac acgcgcatgg gggagtttgg 4440
gttgacattg tggcacttgg gatcggggcg gggtccgccg ggggctgtga tgatgatgag 4500
gcggaggcgg gcggagcaaa gcagagaaga aaccaattgc ttgcagttgc aggcacaggc 4560
cgtactaata aataaatgtg ggtacgctgg caacgctgcc actgttagct actagtagta 4620
gctacagatg cacggcccgg acgcaggcgt gcatgggatg atctctccac acgcgctctt 4680
ggtgcgtgcg tgtgcgagga ttctgtctac ggtttgcttg catgcacgct tgcggaggca 4740
gaggtagtca cgtcgtcaag cgtgaagccg tgaatcgatc cacgcacgca gcaatgcact 4800
ccccgtttct ccttttacgg atctaataat aattataata atacattata aatattattg 4860
tt 4862
<210> 54
<211> 469
<212> PRT
<213> Z. maize
<400> 54
Glu Ser Lys Asp Gly Asp Pro Arg His Gly Lys Asp Arg Trp Ser Ala
1 5 10 15
Glu Arg Tyr Ala Ala Ala Glu Lys Ser Leu Leu Asn Ile Met Arg Ser
20 25 30
Arg Asp Ala Arg Phe Gly Ala Pro Val Met Arg Gln Val Leu Arg Glu
35 40 45
Glu Ala Arg Lys His Ile Gly Asp Thr Gly Leu Leu Asp His Leu Leu
50 55 60
Lys His Met Ala Gly Arg Val Pro Glu Gly Ser Val His Arg Phe Arg
65 70 75 80
Arg Arg His Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu Pro Ala
85 90 95
Glu Leu Ala Glu Val Arg Lys Gln Ala Gly Val Ser Asp Pro Tyr Trp
100 105 110
Val Pro Pro Pro Gly Trp Lys Pro Gly Asp Asp Val Ser Leu Val Ala
115 120 125
Gly Asp Ile Leu Val Lys Arg Gln Val Glu Glu Leu Thr Glu Glu Val
130 135 140
Asn Gly Val Lys Arg Tyr Ile Glu Gln Leu Leu Cys Lys Asp Asp Gly
145 150 155 160
Asp Phe Gly Ala Glu Arg Asp Tyr Ser Ser Leu Lys Glu Lys Tyr Gln
165 170 175
Arg Ala Val Arg Ala Asn Glu Lys Leu Glu Lys Gln Val Leu Cys Leu
180 185 190
Lys Asp Met Cys Glu Asn Val Val Gln Met Asn Gly Glu Leu Lys Lys
195 200 205
Glu Val Ser Ser Phe Lys Glu Lys Tyr Glu His Ile Ala Asp Lys Asn
210 215 220
Asp Lys Leu Glu Glu Gln Val Thr Tyr Leu Ser Ser Ser Phe Leu Ser
225 230 235 240
Phe Lys Asp Gln Leu Val Val Ala Leu Lys Leu Glu Leu Ala Pro Ser
245 250 255
Glu Ala Val Pro Arg Thr Ala Leu Phe Val Ala Ser Gly Glu Gln Met
260 265 270
Thr Gly Thr Val Ile Gln Gly Gly Gln Asp Arg Ala Glu Arg Lys Ser
275 280 285
Ser Phe Arg Val Cys Lys Pro Gln Gly Lys Phe Leu Leu Pro Ser Met
290 295 300
Ala Ser Gly Met Thr Ile Gly Arg Gly Ala Ser Ser Thr Cys Pro Ala
305 310 315 320
Ala Ala Thr Pro Gly Pro Gly Ile Pro Arg Ser Thr Ser Phe Pro Ser
325 330 335
Met Pro Gly Leu Pro Arg Ser Ser Arg Gly Pro Val Glu Val Val Ala
340 345 350
Ala Ala Ser Gly Leu Asp Glu His Val Met Phe Gly Ala His Phe Ser
355 360 365
Thr Pro Pro Ser Ala Ser Ser Thr Asn Asp Ala Ala Lys Leu Gln Leu
370 375 380
Ser Leu Pro Ser Pro Arg Ser Pro Leu Gln Pro Gln Lys Leu Phe Asp
385 390 395 400
Thr Val Thr Ala Ala Ala Ser Gly Phe Ser Pro Gln Lys Leu Met His
405 410 415
Phe Ser Gly Leu Thr Arg Arg Asp Val Asp Thr Ser Ser Ser Ser Ser
420 425 430
Gly Ala Cys Gly Ser Gly Leu Leu Glu Gly Lys Arg Val Leu Phe Asp
435 440 445
Ala Asp Ala Gly Gly Ile Ser Ala Val Gly Thr Glu Leu Ala Leu Ala
450 455 460
Thr Pro Ser Tyr Cys
465
<210> 55
<211> 132
<212> PRT
<213> Z. mays
<400> 55
Met Ser Leu Phe Ile Ser Lys Pro Gln Val Lys Lys Tyr Tyr Phe Lys
1 5 10 15
Lys Lys Thr Ser Ser Ser His Ser Arg Asn Gly Lys Asp Asp Val Asn
20 25 30
His Asp Ser Thr Ile Gln Pro Arg Ser Pro Leu Ser Arg Gln Ser Leu
35 40 45
Thr Phe Asp Ala Ile Pro Thr Tyr His Ala Gly Ala Phe Tyr Glu Ile
50 55 60
Asp His Asp Lys Leu Pro Pro Lys Ser Pro Ile His Leu Lys Ser Ile
65 70 75 80
Arg Val Val Lys Val Ser Glu Cys Thr Asn Leu Asp Ile Thr Val Lys
85 90 95
Phe Pro Ser Leu Gln Ala Leu Arg Ser Phe Phe Ser Ser Tyr Pro Ala
100 105 110
Pro Gly Thr Gly Pro Glu Leu Asp Glu Arg Phe Val Met Ser Ser Asn
115 120 125
His Ala Ala Arg
130
1
Claims (35)
- dyad 대립형질에 대해 동형접합인 게놈을 포함하고 세포의 핵에서 조건부로 DYAD 단백질을 발현하는 식물.
- 제1항에 있어서, 상기 식물은 조건부로 자성 수정능력(female fertile)을 갖게 되는 것인 식물.
- 제1항에 있어서, 상기 식물은 상기 식물이 생성하는 종자에서 자성 부모의 이형접합성(female parental heterozygoxsity)의 유지에 대해 조건부가 되는 것인 식물.
- 제1항에 있어서, 상기 게놈은 스테로이드 호르몬 수용체 리간드 결합 도메인에 융합된 DYAD 단백질을 코딩하는 폴리뉴클레오티드의 하나 이상의 카피를 포함하는 것인 식물.
- 제4항에 있어서, 상기 스테로이드 호르몬 수용체 리간드 결합 도메인은 글루코코르티코이드 수용체 리간드 결합 도메인인 것인 식물.
- 제1항에 있어서, 상기 dyad 대립형질은 508번 내지 572번 위치의 아미노산에 서 절단된 DYAD 단백질이 발현되는 대립형질인 것인 식물.
- 제6항에 있어서, 상기 dyad 대립형질은 서열번호 1의 뉴클레오티드 서열을 갖는 폴리뉴클레오티드를 포함하거나, 또는 37℃에서 40% 포름아미드, 1M NaCl, 1% SDS의 조건 또는 그와 동등한 조건 하에서 서열번호 1, 서열번호 23, 또는 서열번호 25의 폴리뉴클레오티드의 상보체와 혼성화하는 뉴클레오티드 서열을 갖는 것인 식물.
- 제1항에 있어서, 상기 DYAD 단백질은 서열번호 4 또는 서열번호 17 또는 서열번호 23 또는 서열번호 25의 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 또는 37℃에서 40% 포름아미드, 1M NaCl, 1% SDS의 조건 또는 그와 동등한 조건 하에서 서열번호 1, 서열번호 23, 또는 서열번호 25의 상보체와 혼성화하는 폴리뉴클레오티드에 의해 코딩되는 것인 식물.
- 제7항에 있어서, 상기 DYAD 단백질은 서열번호 4 또는 서열번호 17 또는 서열번호 23 또는 서열번호 25의 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 또는 37℃에서 40% 포름아미드, 1M NaCl, 1% SDS의 조건 또는 그와 동등한 조건 하에서 서열번호 1, 서열번호 23, 또는 서열번호 25의 상보체와 혼성화하는 폴리뉴클레오티드에 의해 코딩되는 것인 식물.
- i) dyad에 대해 동형접합인 자성 부모 식물을 웅성 부모 식물로부터 유래된 화분으로 수분시키거나, 또는 dyad에 대해 동형접합인 상기 식물을 자가수분시키는 단계; 및ii) 상기 수분된 자성 부모 식물로부터 종자를 수득하는 단계를 포함하는, 자성 부모의 이형접합성을 유지하는 종자를 제조하는 방법.
- 제10항에 있어서, 상기 종자는 정상적인 크기이거나 또는 축소된 크기인 것인 방법.
- 제10항에 있어서, 상기 단계 i)에서 이용된 화분은 조사된(irradiated) 것인 방법.
- 제10항에 있어서, 상기 단계 i)에서 이용된 화분은 수정 능력을 가지며 상기 단계 ii)에서 수득된 종자는 삼배체인 것인 방법.
- i) dyad 대립형질에 대해 이형접합 또는 동형접합이고 DYAD 단백질을 핵에서 조건부로 발현하는 발현 작제물(expression construct)를 포함하는 제1 식물을 자가수분시키고 dyad 및 상기 발현 작제물에 대해 동형접합인 제2 식물을 수득하기 위해 선택하는 단계,ii) 상기 제2 식물의 종자 또는 상기 제2 식물의 자손인 식물의 종자를 수득 하고, 크기가 정상이거나 또는 축소된 종자를 선택하는 단계를 포함하는, dyad 대립형질에 대해 동형접합이고 세포의 핵에서 DYAD 단백질의 발현에 대해 조건부인 식물을 제공하는 배아 게놈을 갖는 종자를 수득하는 방법.
- 제14항에 있어서, 상기 제2 식물은 상기 제2 식물에 의해 생성된 종자의 배아에서 자성 부모 이형접합성의 유지에 대해 조건부인 것인 방법.
- 제14항에 있어서, 상기 제2 식물은 자성 불임(female sterility)에 대해 조건부인 것인 방법.
- i) dyad 대립형질 및 DYAD 단백질을 핵에서 조건부로 발현하는 발현 작제물에 대해 이형접합 또는 동형접합인 제1 식물을 자가수분시키고 dyad 및 상기 발현 작제물에 대해 동형접합인 제2 식물을 선택하는 단계,ii) 상기 선택된 제2 식물을 상기 DYAD 단백질이 발현되는 조건에 도입하는 단계를 포함하는, dyad 대립형질에 대해 동형접합이고 세포의 핵에서 DYAD 단백질의 발현에 대해 조건부인 식물을 수득하는 방법.
- 제17항에 있어서, 상기 제2 식물은 상기 T2 식물에 의해 생성된 종자의 배아에서 자성 부모 이형접합성의 유지에 대해 조건부인 것인 방법.
- 제17항에 있어서, 상기 제2 식물은 자성 불임에 대해 조건부인 것인 방법.
- 제1항의 식물의 종자 또는 조직.
- 제10항의 방법에 의해 수득된 종자.
- 제13항의 방법에 의해 수득된 삼배체 종자.
- DYAD 단백질의 발현을 위해 충분한 조건 하에서 제1항의 식물을 증식시키는 단계를 포함하는, dyad에 대해 동형접합인 식물 계통(plant line)을 유지하는 방법.
- DYAD 단백질의 발현을 위해 충분한 조건 하에서 제4항의 식물을 증식시키는 단계를 포함하는, dyad에 대해 동형접합인 식물 계통을 유지하는 방법.
- 제24항에 있어서, 상기 조건은 스테로이드 호르몬을 상기 식물에 적용하는 단계를 포함하는 것인 방법.
- i) 식물의 핵에서 DYAD 단백질을 조건부로 발현하는 발현 작제물을 포함하는 제1 식물을 자가수분시키거나, 또는 제2 식물을 수득하기 위해 두 개의 상기 제1 식물을 교배시키고 단축된 장각과(siliques) 또는 축소된 과일, 또는 감소된 종자 세트(reduced seed set)를 보이는 제2 식물을 선택하는 단계 및ii) 상기 선택된 제2 식물을 상기 DYAD 단백질이 발현되는 조건에 도입하는 단계를 포함하는, 핵에서 조건부로 발현되는 1 카피의 DYAD 유전자를 포함하는 식물을 수득하는 방법.
- 제26항에 있어서, 상기 제1 식물은 DYAD에 대해 야생형이거나, dyad에 대해 이형접합이거나 또는 dyad에 대해 동형접합인 것인 방법.
- 식물의 세포의 핵에서 야생형 DYAD 단백질을 조건부로 발현하는 작제물을 포함하는 벡터로 식물의 세포를 형질전환시키는 단계를 포함하는, 식물의 세포의 핵에서 야생형 DYAD 단백질을 조건부로 발현하는 식물을 수득하는 방법.
- 제28항에 있어서, 상기 식물은 dyad에 대해 동형접합인 식물인 것인 방법.
- 제28항에 있어서, 상기 식물은 dyad에 대해 이형접합인 식물인 것인 방법.
- 식물의 세포의 핵에서 야생형 DYAD 단백질의 조건부 발현을 제공하는 작제물에 대해 동형접합인 식물.
- 식물 세포의 핵에서 DYAD 유전자의 조건부 발현을 부여하는 발현 작제물.
- 제32항에 있어서, 상기 식물 세포는 거대포자 모세포(megaspore mother cell)인 것인 작제물.
- 제32항에 있어서, 상기 DYAD 유전자는 스테로이드 호르몬 수용체 리간드 결합 도메인에 융합된 것인 작제물.
- 제34항에 있어서, 상기 스테로이드 호르몬 수용체 리간드 결합 도메인은 글루코코르티코이드 수용체 리간드 결합 도메인인 것인 작제물.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IN3337/DEL/2005 | 2005-12-09 | ||
IN3337DE2005 | 2005-12-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20080075908A true KR20080075908A (ko) | 2008-08-19 |
Family
ID=38123263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020087016525A KR20080075908A (ko) | 2005-12-09 | 2006-12-08 | 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법 |
Country Status (14)
Country | Link |
---|---|
US (1) | US8878002B2 (ko) |
EP (1) | EP1963359A2 (ko) |
JP (1) | JP2009524409A (ko) |
KR (1) | KR20080075908A (ko) |
CN (1) | CN101379080B (ko) |
AU (1) | AU2006322972B9 (ko) |
BR (1) | BRPI0620572A2 (ko) |
CA (1) | CA2632723A1 (ko) |
EG (1) | EG25707A (ko) |
IL (1) | IL192003A0 (ko) |
RU (1) | RU2438297C2 (ko) |
TR (2) | TR200806177T2 (ko) |
WO (1) | WO2007066214A2 (ko) |
ZA (1) | ZA200805005B (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2007203378B2 (en) | 2000-06-14 | 2011-12-08 | Agriculture Victoria Services Pty Ltd | Modification of lignin biosynthesis (2) |
US8921653B2 (en) | 2001-06-14 | 2014-12-30 | Agriculture Victoria Services Pty Ltd | Modification of lignin biosynthesis |
WO2011003471A1 (en) * | 2009-07-10 | 2011-01-13 | Enza Zaden Beheer B.V. | Method for providing mature transgenic recalcitrant plants via induction of bbm during regeneration |
FR2952276A1 (fr) * | 2009-11-09 | 2011-05-13 | Inst Rech Developpement Ird | Induction de l'apomixie chez les plantes cultivees a reproduction sexuee et utilisation pour la reproduction de plantes totalement ou partiellement apomictiques |
US9210847B2 (en) * | 2011-05-06 | 2015-12-15 | Kenavis Corporation, Llc | Soybean varieties and methods for producing said varieties |
JP6978152B2 (ja) | 2015-09-04 | 2021-12-08 | キージーン ナムローゼ フェンノートシャップ | 複相胞子生殖遺伝子 |
BR112018006573A2 (pt) * | 2015-10-02 | 2018-10-09 | método para a produção de plantas haploides e subsequentes haploides duplicadas | |
WO2018015389A1 (en) * | 2016-07-18 | 2018-01-25 | University Of Bremen | Method of generating polyploid plants |
CA3138988A1 (en) | 2019-05-29 | 2020-12-03 | Keygene N.V. | Gene for parthenogenesis |
WO2022079087A1 (en) | 2020-10-13 | 2022-04-21 | Keygene N.V. | Modified promoter of a parthenogenesis gene |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5633441A (en) * | 1989-08-04 | 1997-05-27 | Plant Genetic Systems, N.V. | Plants with genetic female sterility |
US5478369A (en) * | 1990-06-12 | 1995-12-26 | Pioneer Hi-Bred International, Inc. | Nucleotide sequences mediating male fertility and method of using same |
US6051752A (en) * | 1994-01-21 | 2000-04-18 | Petosluis Recherche France | Genetic factor responsible for a defective endosperm phenotype in seeds, plants comprising said factor and their use in hybridization processes |
US5840567A (en) * | 1994-12-21 | 1998-11-24 | The Regents Of The University Of California | Simplified hybrid seed production by latent diploid parthenogenesis and parthenote cleavage |
WO1996027673A1 (en) * | 1995-03-03 | 1996-09-12 | Novartis Ag | Control of gene expression in plants by receptor mediated transactivation in the presence of a chemical ligand |
US5811636A (en) | 1995-09-22 | 1998-09-22 | The United States Of America As Represented By The Secretary Of Agriculture | Apomixis for producing true-breeding plant progenies |
US5710367A (en) * | 1995-09-22 | 1998-01-20 | The United States Of America As Represented By The Secretary Of Agriculture | Apomictic maize |
US20050155111A1 (en) | 2003-10-22 | 2005-07-14 | Carman John G. | Methods for increasing the frequency of apomixis expression in angiosperms |
US6750376B1 (en) * | 1997-02-05 | 2004-06-15 | Utah State University | Methods for producing apomictic plants |
JP2002510964A (ja) | 1997-02-05 | 2002-04-09 | ユタ・ステイト・ユニバーシティ | アポミクト植物の作出方法 |
FR2759708B1 (fr) | 1997-02-17 | 1999-08-27 | Orstom | Moyens pour identifier, isoler et caracteriser des sequences nucleotidiques impliquees dans l'apomixie |
EP0977836A4 (en) * | 1997-02-21 | 2002-10-16 | Univ California | "COTYLEDON1 HARDWOOD" TYPE GENES AND USES THEREOF |
US6028185A (en) * | 1998-01-07 | 2000-02-22 | The United States Of America As Represented By The Secretary Of Agriculture | Nucleic acid markers for apospory-specific genomic region |
US6239327B1 (en) * | 1998-04-16 | 2001-05-29 | Cold Spring Harbor Laboratory | Seed specific polycomb group gene and methods of use for same |
US6229064B1 (en) * | 1998-05-01 | 2001-05-08 | The Regents Of The University Of California | Nucleic acids that control endosperm development in plants |
AU777855B2 (en) | 1998-08-05 | 2004-11-04 | Mary Wilkes Eubanks | Novel genetic materials for transmission into maize |
GB9823098D0 (en) | 1998-10-22 | 1998-12-16 | Novartis Ag | Organic compounds |
US6825397B1 (en) * | 1998-11-09 | 2004-11-30 | Pioneer Hi-Bred International, Inc. | LEC1 trancriptional activator nucleic acids and methods of use thereof |
AU7614700A (en) | 1999-09-20 | 2001-04-24 | Cambia | Megagametophyte transcriptional control elements and uses thereof |
US6146282A (en) * | 1999-09-28 | 2000-11-14 | Mccready; Scott K. | Water slide system |
US7256322B2 (en) | 1999-10-01 | 2007-08-14 | Pioneer Hi-Bred International, Inc. | Wuschel (WUS) Gene Homologs |
WO2001031017A2 (en) | 1999-10-25 | 2001-05-03 | Südwestdeutsche Saatzucht | Plants with a modified flower and seed development |
BR0015276A (pt) | 1999-10-29 | 2002-07-16 | Univ Utah State | Métodos para estabilizar e controlar apomixia |
US6492577B1 (en) * | 2000-03-16 | 2002-12-10 | The Regents Of The University Of California | Leafy cotyledon2 genes and their uses |
CA2441876A1 (en) | 2001-04-10 | 2002-10-24 | Syngenta Participations Ag | Production of apomictic seed |
WO2003000038A2 (en) * | 2001-06-22 | 2003-01-03 | The Regents Of The University Of California | Compositions and methods for modulating plant development |
AU2002318409A1 (en) | 2001-06-25 | 2003-01-08 | Cold Spring Harbor Laboratory | Maternal effect gametophyte regulatory polynucleotide |
US20030082813A1 (en) | 2001-10-29 | 2003-05-01 | The Rockefeller University | Promotion of somatic embryogenesis in plants by wuschel gene expression |
-
2006
- 2006-11-13 US US11/598,021 patent/US8878002B2/en not_active Expired - Fee Related
- 2006-12-08 TR TR2008/06177T patent/TR200806177T2/xx unknown
- 2006-12-08 AU AU2006322972A patent/AU2006322972B9/en not_active Ceased
- 2006-12-08 CA CA002632723A patent/CA2632723A1/en not_active Abandoned
- 2006-12-08 RU RU2008127881/10A patent/RU2438297C2/ru not_active IP Right Cessation
- 2006-12-08 KR KR1020087016525A patent/KR20080075908A/ko not_active Application Discontinuation
- 2006-12-08 JP JP2008543936A patent/JP2009524409A/ja active Pending
- 2006-12-08 EP EP06842227A patent/EP1963359A2/en not_active Ceased
- 2006-12-08 TR TR2009/09478T patent/TR200909478T2/xx unknown
- 2006-12-08 WO PCT/IB2006/003529 patent/WO2007066214A2/en active Application Filing
- 2006-12-08 CN CN2006800521394A patent/CN101379080B/zh not_active Expired - Fee Related
- 2006-12-08 BR BRPI0620572-0A patent/BRPI0620572A2/pt not_active IP Right Cessation
-
2008
- 2008-06-05 IL IL192003A patent/IL192003A0/en unknown
- 2008-06-08 EG EG2008060954A patent/EG25707A/xx active
- 2008-06-09 ZA ZA2008/05005A patent/ZA200805005B/en unknown
Also Published As
Publication number | Publication date |
---|---|
CA2632723A1 (en) | 2007-06-14 |
AU2006322972A1 (en) | 2007-06-14 |
AU2006322972A2 (en) | 2008-07-31 |
US20070136895A1 (en) | 2007-06-14 |
US8878002B2 (en) | 2014-11-04 |
CN101379080A (zh) | 2009-03-04 |
RU2438297C2 (ru) | 2012-01-10 |
CN101379080B (zh) | 2013-04-17 |
WO2007066214A2 (en) | 2007-06-14 |
AU2006322972B9 (en) | 2014-06-12 |
TR200806177T2 (tr) | 2008-10-21 |
AU2006322972B2 (en) | 2013-08-01 |
IL192003A0 (en) | 2008-12-29 |
TR200909478T2 (tr) | 2011-01-21 |
EG25707A (en) | 2012-05-27 |
JP2009524409A (ja) | 2009-07-02 |
ZA200805005B (en) | 2012-08-29 |
BRPI0620572A2 (pt) | 2011-12-06 |
WO2007066214A3 (en) | 2007-12-27 |
EP1963359A2 (en) | 2008-09-03 |
RU2008127881A (ru) | 2010-01-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20110271405A1 (en) | Compositions and methods for increasing seed size and/or yield by expressing a modified transgene encoding a growth and/or development related protein | |
KR20080075908A (ko) | 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법 | |
WO2013060136A1 (zh) | 一种控制水稻籽粒粒长和粒重的半显性基因qGL3的克隆与应用 | |
JP2000505290A (ja) | シロイヌナズナgai遺伝子をコードする核酸 | |
US7439416B2 (en) | Indeterminate gametophyte 1 (ig1)gene from Zea mays and uses thereof | |
US11224181B2 (en) | Manipulation of self-incompatibility in plants | |
CN113874388A (zh) | 孤雌生殖基因 | |
CN104703998B (zh) | 植物中雄性育性的遗传减少 | |
JP2016013057A (ja) | 植物に多収性を付与する核酸、収量が増加した形質転換植物を作製する方法、植物の収量を増大させる方法 | |
Horn et al. | Gene cloning and characterization | |
US7220845B2 (en) | Nucleic acid molecules associated with plant cell proliferation and growth and uses thereof | |
US8410337B2 (en) | Plant tubby-like proteins | |
CA2343978A1 (en) | Novel method of regulating seed development in plants and genetic sequences therefor | |
KR101592863B1 (ko) | 왜성 표현형을 나타내는 D-h 유전자 및 이의 용도 | |
AU765258B2 (en) | Novel method of regulating seed development in plants and genetic sequences therefor | |
CA3134113A1 (en) | A method to improve the agronomic characteristics of plants | |
CA2369749A1 (en) | Gene involved in epigenetic gene silencing | |
MX2008007458A (en) | Nucleic acids and methods for producing seeds having a full diploid complement of the maternal genome in the embryo |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |