KR20080075908A - 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법 - Google Patents

배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법 Download PDF

Info

Publication number
KR20080075908A
KR20080075908A KR1020087016525A KR20087016525A KR20080075908A KR 20080075908 A KR20080075908 A KR 20080075908A KR 1020087016525 A KR1020087016525 A KR 1020087016525A KR 20087016525 A KR20087016525 A KR 20087016525A KR 20080075908 A KR20080075908 A KR 20080075908A
Authority
KR
South Korea
Prior art keywords
plant
dyad
ser
lys
glu
Prior art date
Application number
KR1020087016525A
Other languages
English (en)
Inventor
라비 마루싸찰람
모한 프렘 아난드 마리무쑤
임란 시디퀴
Original Assignee
카운슬 오브 사이언티픽 앤드 인더스트리얼 리서치
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 카운슬 오브 사이언티픽 앤드 인더스트리얼 리서치 filed Critical 카운슬 오브 사이언티픽 앤드 인더스트리얼 리서치
Publication of KR20080075908A publication Critical patent/KR20080075908A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/02Preparation of hybrid cells by fusion of two or more cells, e.g. protoplast fusion
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8287Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
    • C12N15/829Female sterility

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Botany (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

본 발명은 DYAD 유전자, 그의 돌연변이체 및 자성 부모 식물의 이형접합성을 유지하는 식물을 제조하기 위한 이들의 용도에 관한 것이다. 본 발명은 또한 dyad 표현형을 가지며 따라서 구성적으로(constitutively) 또는 조건부로 자성 부모의 이형접합성을 유지하는 식물, 식물 조직, 및 식물의 종자를 포괄한다. 본 발명은 무성생식 식물의 방식으로 원하는 잡종 표현형을 전파시키고 식물 유전자형의 배수성을 증가시켜서, 증가된 바이오매스를 갖는 식물을 생성하기 위해 유용하다.
배수성, 무성생식 종자, 이형접합성, DYAD, dyad 돌연변이체.

Description

배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를 생산하기 위한 핵산 및 방법{Nucleic acids and methods for producing seeds having a full diploid complement of the maternal genome in the embryo}
본 발명은 배아에 모계 게놈(maternal genome)의 완전한 이배체 상보체를 갖는 종자를 생산하기 위한 목적으로 생식세포형성(gametogenesis) 및 종자 발달을 처리(manipulate)하기 위한, 애기장대(Arabidopsis), 보에케라(Boechera) 및 쌀의 DYAD 유전자 및 유전자 산물의 용도에 관한 것이다. 본 발명은 또한 화분 형성에 대한 실질적인 효과 없이 퇴화되지 않은 암 배우체(unreduced female gametophyte)를 생성하기 위한 변형된 DYAD 유전자의 용도에 관한 것이다.
식물의 생활사(life cycle)는 이배체 포자체 생성 및 반수체 배우체 생성을 교대시킨다. 감수분열은 식물의 생활사의 이배체 포자체 단계와 반수체 배우체 단계 간의 전환을 의미한다. 감수분열은 반수체 포자의 형성을 가져온다. 동물과 달리, 식물에서, 감수분열 생성물은 다세포 반수체 배우체를 형성하기 위해 추가적인 분열을 수행한다. 생식세포의 분화는 감수분열 생성물의 분열 후에, 배우체 발달의 후기 단계에 일어난다. 따라서, 수정 전 유성생식 과정은 두 개의 개별적인 단계들을 포함한다: 감수분열 및 반수체 포자의 형성을 포함하는 포자 형성; 및 상 기 포자의, 수정 및 배아의 성장을 지지하기 위해 요구되는 생식 세포 및 관련 세포들을 포함하는 배우체로의 발달.
대부분의 식물 종들은 유성 생식으로 번식한다; 그러나, 일부 식물 종들은 무성 생식을 통해 번식할 수 있다. 용어 단위생식(apomixis)은 일반적으로 임의의 형태의 무성 생식에 의한 유성 생식의 대체로 받아들여진다(Koltunow A. and Grossniklauss U. Annu. Rev. Plant Biol. Vol. 54: 547-74, 2003). 단위 생식은 식물에서 난자와 정자의 결합 없이 배아가 형성되는 종자 형성을 포함한, 유전적으로 조절되는 번식 방법이다. 단위 생식의 세 개의 기본적인 유형이 있다: 1) 주심(nucellus)으로부터 유래된 배낭 내의 염색체가 감소되지 않은 난(chromosomally unreduced egg)으로부터 단위생식에 의해 배아가 발달하는 것인 무포자 생식(apospory), 2) 거대포자 모 세포(megaspore mother cell)로부터 유래된 배낭 내의 감소되지 않은 난으로부터 단위생식에 의해 배아가 발달하는 것인 복상 포자생식(diplospory), 및 3) 배아가 체세포로부터 직접 발달하는 것인 부정배 형성(adventitious embryony). 앞의 두 종류의 단위 생식은 양 경우 모두 배아가 자성 배우체 또는 배낭으로부터 발달하고, 부정배 형성에서, 배아는 중간의 자성 배우체 단계(intermediate female gametophyte stage) 없이 체세포로부터 직접 발달하기 때문에, 앞의 두 종류의 무성생식은 은 배우체 단위 생식(gametophytic apomixis)으로 분류된다. 따라서, 배우체 단위 생식은 하기의 두 성분을 포함한다: i) 위감수분열(apomeiosis), 또는 부모 유전자형을 유지하는 감소되지 않은 자성 배우체(배낭)의 형성, 및 ii) 배유(endosperm)로 발달하는 중심 세포(central cell)의 수정을 포함하는 또는 상기 수정을 포함하지 않는 배아의 단위생식에 의한 발달(parthenogenetic development).
단위 생식은 따라서 모계 부모와 유전적으로 동일한 배아를 생성하기 위해 자성 감수분열(female meiosis) 및 배우자 접합(syngamy)을 우회하는 생식 과정이다. 상기 세 종류의 단위 생식은 그들이 이형접합성의 정도에 관계없이 임의의 유전형이 순종을 번식하게 할 수 있기 때문에, 경제적 잠재력을 갖는다. 단위 생식으로, 특히 적응성(adpative) 유전자형 또는 잡종 유전자형의 자손들은 반복적인 생활사 동안 그들의 유전자형을 유지한다. 잡종 강세(hybrid vigour)를 확립하는 것 외에, 단위 생식은 잡종 생산을 위한 효율적인 웅성 불임 또는 수정능력 회복 시스템(fertility restoration system)이 알려지거나 또는 개발되지 않은 작물에서 상업적인 잡종 생산을 가능하게 할 수 있다. 따라서, 단위 생식은 잡종 개발을 보다 효율적이게 한다. 단위 생식은 또한 우수한 웅성 불임 시스템을 갖는 식물 종에서 잡종 생산을 단순화시키고 유전적 다양성을 증가시킨다. 절대적인 또는 높은 수준의 단위 생식을 조절하는 유전자를 재배된 종들에 도입하고 순종-생산 F1 잡종(true-breeding F1 hybrid)을 생산하기 위해 교차-융화적(cross-compatible) 유성 유전자형 및 무성생식 유전자형을 용이하게 혼성화시킬 수 있는 것은 매우 바람직하다. 단위 생식의 중요한 작물로의 전달은 세포질-핵 웅성 불임 및 고비용의 노동-집약적 생산 과정에 대한 필요 없이 순종-번식 잡종(true-breeding hybrid)의 개발 및 잡종의 상업적 생산을 가능하게 할 것이다. 절대적인 무성생식 F1 잡종(obligately apomictic Fl hybrid)은 종자를 통해 무기한으로 순종을 번식하고 상기 종자를 통한 영양(vegetative) 생식 또는 무성(clonal) 생식 방법을 제공하는 것으로 간주될 수 있다. 단위 생식에 의해 번식하는 재배 작물(cultivated crop)의 개발은 또한 개발도상국에서 식량 안보에 대한 큰 기여를 제공할 것이다(Spillane C, SteimerA, and Grossniklaus U, Sex. Plant Reprod. 14: 179-187, 2001).
실제로, 단위 생식을 조절하는 대부분의 공지된 유전자들은 야생종에서 발견되며, 이들은 재배 종(cultivated species)과 관계가 멀다. 재배 종과 야생 종간의 종간 교배(interspecific cross)가 이루어질 수 있으나, 게놈 간의 염색체 쌍 형성은 일반적으로 낮거나 존재하지 않아서, 이 방법의 실패를 초래한다.
단위 생식을 재배 작물에 도입하기 위해 고려될 수 있는 두 가지 일반적인 전략이 있다. 첫째는 야생 관련 종(wild relative)로부터 재배종으로의 유전자 이입(introgression)에 의한 것이다. 둘째는 유성 종(sexual species)에서 단위생식의 양상을 부여할 수 있는 유전자를 확인하고, 및 완전한 레퍼토리의 단위 생식을 생성하기 위해 이 유전자들을 점증시키는 것의 의한 것이다. 그 후, 이 유전자들은 유전자이식(transgenic) 방법을 이용하여 재배작물로 도입될 수 있다. 따라서, 예를 들면, 하나 이상의 유전자의 발현이 위감수 분열을 도입(engineer)하기 위해 이용될 수 있고, 이 유전자들은 단위 생식에 의한 배아 발생(parthenogenetic embryo development)을 유도하기 위해 또 다른 세트의 유전자 또는 다른 처리들과 조합될 수 있다. 식물에서 단위생식을 유도하는 방법은 본 발명이 속하는 기술 분야에서 알려져 있다(예를 들면, 미국특허 제5,840,567호 참조). 본 발명과 함께 사용되기 위한, 단위생식에 의한 발생을 유도하는 바람직한 방법은 방사선 조사된 화분을 이용하여 식물을 수분시키고, 그에 의해 상기 식물을 수정에 대해 불활성화시키는 방법이다. (Pandey K.K. and Phung M., Theoret. Appl. Genet., Vol. 62:295-300, 1982; Lofti M. et al, Plant Cell Reprod., Vol. 21:1121-1128, 2003).
이 방법은 다수의 식물 종에서 이용되고 불완전한 꽃을 갖는 식물(자웅동주 및 자웅이주)에 가장 용이하게 적용될 수 있는 것으로 보인다는 점에서 바람직하다. 그러나, 이 방법은 웅성-불임이 되거나 또는 자성 화분이 기계적으로 제거되거나 분리된 완전한 꽃을 갖는 자웅동체성(hermaphroditic ) 식물에 적용될 수 있다.
화분을 불임으로 만드는 방사선 조사의 특정한 선량은 종의 구체적 특징에 따라 변할 것이다. 일반적으로, 약 10 내지 2000 그레이(Gray)의 선량이 충분하다. 바람직하게는, 상기 선량은 약 100 내지 500 그레이, 보다 바람직하게는 200 내지 250 그레이이다.
단위생식의 성공적인 유도는 배의 존재 여부에 대한 종자의 스크리닝에 의해, 예를 들면, 절개에 의해, 또는 Lofti M. et al., Plant Cell Reprod., Vol. 21: 1121-1128, 2003에 기재된 바와 같이 액체 배지에서의 배양 후에 라이트 박스(light box) 상의 종자의 관찰에 의해 검출될 수 있다.
무성생식 생식 특성을 정상적인 유성 생식 작물에 도입하는 것이 시도되었다. Asker S. (Hereditas, Vol. 91: 231-241, 1979)는 밀, 사탕무, 및 옥수수에 의한 시도가 성공적이지 않았다고 보고했다. PCT 국제공개 WO 89/00810 (Maxon et al, 1989)은 재배되지 않은(nondomesticated) 중성(sterile) 알팔파 식물로부터의 추출물을 이용하여 재배 식물에 단위 생식의 생식 형태를 유도하는 것을 개시한다. 웅성 불임의 유도가 사탕수수, 해바라기, 진주 조(pearl millet), 및 토마토에서 평가된 경우, 사탕수수, 진주 조, 및 해바라기에서 종자 세트(seed set)의 감소가 있었고, 토마토에서는 과실 세트의 감소가 있었다.
시트러스(Parlevliet J. E. et al., in Citrus. Proc. Am. Soc. Hort. Sci., Vol. 74: 252-260, 1959)에서 균일하고 질병- 및 바이러스-불포함 근경(rootstock)을 생성하고 버플그래스(buffelgrass)(Bashaw, Crop Science, Vol. 20: 112, 1980) 및 포아(Poa)(Pepin et al., Crop Science, Vol. 11: 445-448, 1971)에서 개량된 품종을 생성하기 위해 단위 생식이 효과적으로 이용되나, 단위 생식은 재배 작물 식물로는 성공적으로 이전되지 않았다.
단위 생식을 도입하기 위한 제2 접근방법은 유성생식 종으로부터 단위 생식 관련 유전자의 확인 및 조작을 포함한다. 단위 생식의 발생적 관점은 단위 생식은 유성 생식과 관련되며 유성생식 경로에서도 역할을 하는 유전자의 작용을 포함한다는 것을 시사했다(Tucker M.R. et al., Plant Cell, Vol. 15(7): 1524- 1537, 2003). 유성 생식에서, 일반적으로 피하층으로부터 발생 중인 배주(ovule)의 정점을 향해 형성되는 유래된 거대포자 모 세포는 확대되고 감수분열 및 두 번의 세포 분열을 거쳐서 각각 반수체 염색체 수를 갖는 거대포자의 선형 4세포체(linear tetrad)를 형성한다. 상이한 식물 종들 중에서 가장 흔한 것은, 가장 정점의 3개의 포자들이 퇴화하고 기능성의 합점 포자(functional chalazal spore)가 세포 확대를 동반한 3회의 핵 분열을 수행하여 하나의 난, 두개의 배낭 핵(polar nucleus), 두 개의 조세포(synergid) 및 3개의 반족 세포(antipodal cell)를 갖는 배낭을 형성한다. 단위생식은 특정 종들에서 복수 개의 유전자의 작용을 필요로 하는 것으로 확인된 바와 같이, 복수의 단계 및 단위생식의 완전한 경로의 제어를 필요로 하는 과정이다(van Dijk et al., Heredity, Vol. 83: 715-721,1999; Matzk F., et al., Plant Cell, 17(l):13-24, 2005). 개별적으로 작동되는 경로에서 하나의 유전자 또는 서브세트의 유전자에 의해 제어되는 개별적인 성분들이 수정능력에 부정적인 효과를 가지며(Spillane , C, Steimer A. and Grossniklaus U., Sex. Plant Reprod. Vol. 14: 179-87, 2001), 효율적으로 단위 생식을 촉진할 수 있는 것은 전체 경로를 포함한 유전자의 완전한 세트의 조화된 작용 뿐인 것으로 사료된다. 애기장대(Arabidopsis) 돌연변이체의 유전적 및 분자적 분석은 포자형성 및 배우자 형성의 단계들에서 역할을 수행하는 다수의 유전자의 식별을 가져왔다(Yang W. C. and Sundaresan V., Curr. Opin. Plant Biol. Vol. 3(1): 53-57, 2000). 애기장대의 dyad 돌연변이체는 자성 불임을 유발하는 것으로 확인되고(Siddiqi I. et al., Development, Vol. 127(1):197- 207, 2000) 그에 대한 분석은 dyad 돌연변이 식물은 자성 감수분열이 불완전하다는 것을 보여주었다. dyad 돌연변이체에서 대다수의 자성 감수 모세포(meiocyte)는 1회의 감수분열을 수행하여 4개가 아닌 2개의 세포를 생성하고, 배우자 형성을 포함한 발생의 추가적인 단계에서의 정지(arrest)로 이어진다. dyad 돌연변이체에서 웅성 감수분열, 화분 발달, 및 웅성 수정능력은 정상인 것으로 확인되었다(Siddiqi I. et al., Development, Vol. 127(l):197-207, 2000; Reddy T. V., et al., Development, Vol. 130 (24):5975-5987, 2003). 자성 감수분열 동안 감수분열 염색체의 분석은 상동 염색체가 접합(synapsis)을 수행하지 않고 염색체의 수가 감소되는 제1 감수 분열이 등수 분열(equational division)로 대체된다는 것을 보여주었다(Agashe B., Prasad C. K ., and Siddiqi L, Development, Vol. 129(16), 3935-3943, 2002). 독립적인 연구에서 DYAD 유전자와 동일한, SWII 유전자가 확인되었다(Motamayor J. C, et al., Sex. Plant Reprod. Vol. 12:209-218, 2000; Mercier R., et al., Genes and Dev. Vol. 15: 1859-1871, 2001). 이 연구들에 의해 확인된 유전자는 하기에서 DYAD 유전자로 지칭된다. 애기장대로부터 유래된 야생형 DYAD 유전자는 639개의 아미노산으로 구성된 단백질(서열번호 5)을 코딩한다. 애기장대에서 DYAD 유전자의 세 개의 대립형질이 개시되었다. 이들은: i) 508번 아미노산에서 절단(truncation)을 가져서, 야생형 단백질에 존재하는 C-말단의 130개의 아미노산이 결실된 단백질을 코딩하는 dyad; ii) 야생형 단백질의 생성량을 감소시켜, 일부 자성 감수 모세포는 등수 제1 감수 분열을 수행하고, 다른 감수 모세포들은 감소성(reductional) 분열을 수행하게 하는 것인 swil.l; 및 iii) 394번 위치에서 종결 코돈을 생성하고 dyad와 유사한 자성 표현형을 유발하고, 또한, 웅성 불임을 초래하는 웅성 감수분열의 결함을 유발하는 swil.2이다. 보에케라(Boechera)에서 dyad 대립형질에 해당하는 위치는 아미노산 서열의 508번 위치에서 프레임쉬프트(frameshift)를 유발하고 10개의 추가적인 코돈 후에(즉, 518번 위치) 종결 코돈을 초래하는 돌연변이일 것이다. 쌀에서 상응하는 위치는 각각 563번 및 572번이다.
본 발명의 임의의 이론에 구속되지 않으면서, 본 발명자들은 폴리펩티드의 카르복시-말단으로부터 394번(애기장대의 경우, 및 기타 종에서 상응하는 위치)의 부분을 갖는 DYAD 단백질의 양의 감소는 자성 감수 모세포가 등수성(equational) 제1 감수분열을 수행하여 자성 생식세포에서 자성 유전자형(및 따라서 이형접합형)의 유지를 초래하는 표현형을 생성하는 것으로 제안한다. 394번에서 508번까지의 도메인(애기 장대에서, 및 다른 종에서 상응하는 위치)을 갖는 DYAD 단백질의 정상적인 양(또는 그에 유사한 양)의 유지는 정상적인 화분 발달을 가져오나, 식물에서 이 도메인의 제거는 웅성 불임 표현형을 생성한다.
본 발명의 이전에, dyad 또는 swil.2 대립형질에 대해 동형접합인 식물체는 종자 세트(seed set)를 보이는 것으로 보고된 바 없었다. swil.l 대립형질을 갖는 식물은 동형접합인 경우 감소된 종자 세트를 보이나, 생성된 종자들은 그들의 염색체 구성에 대해 분석되어 이배체인 것으로 확인되었고, 그에 의해 종자들이 정상적인 거대포자 형성 및 거대배우자 형성으로부터 유래된다는 것을 보여주는 것으로 보고되었다 (Motamayor J. C, et al., Sex. Plant Reprod. Vol. 12:209-218, 2000). 전술된 바와 같이, dyad, swil.l, 및 swil.2에서 등수성 1회의 감수 분열의 결과로 생성된 포자는 정지된 상태로 남고 본 발명의 이전에는 이들이 자성 생식세포로 발달할 수 있는 잠재력을 갖는지 여부가 알려지지 않았다. 또한, 본 발명의 이전에는 등수성 단일 자성 감수 분열 동안 염색체들이 재조합을 경험하고, 그 결과 분열의 생성물은 부모의 이형접합성(parental heterozygocity)을 상실하는지 여부는 알려지지 않았다. 등수 분열을 동반하는 재조합의 실현가능성(plausibility)은 이배체 세포들이 감수분열에 들어가고 감수분열성 재조합(meiotic recombination)을 경험하고, 성장 배지로 이전 시 감수분열로부터 벗어나서 유사분열에 의해 분열할 수 있다는 것을 보여준 효모에서의 연구에 의해 지지된다. 그와 같은 유사분열성 분열은 재조합이 유전자와 동원체 간에 일어난 경우, 유전적 마커에 대한 이형접합성의 상실을 초래할 수 있다 (Esposito R. E. and Esposito M. S., Proc. Natl. Acad. Sci. USA Vol. 71(8): 3172-3176 1974). 본 발명은 상이한 dyad 동형접합 돌연변이체 식물에서 관찰되는 등수 제1 감수분열의 생성물이 단위 생식의 중요한 성분인 위감수분열의 특징적인 특성을 갖는, 기능성의 감소되지 않은(unreduced) 배낭을 생성할 수 있다는 발견에 관한 것이다.
본 발명은 배아 유전형이 모계 게놈의 완전한 이배체 상보체(full diploid complement of the maternal genome)를 포함하는 종자를 생산하기 위해 배우자 생성 및 종자 발달을 조작하기 위한 애기장대, 보에케라, 쌀, 포플러스(Populus) 및 기타 식물의 DYAD 유전자, 특히, 그의 돌연변이 대립형질, 및 그들의 유전자 생성물의 용도에 관한 것이다. 일 구체예에서, 애기장대 및 기타 식물 종류에서 삼배체 종자가 생성된다.
본 발명은 또한 DYAD 유전자의 돌연변이 대립형질 및 유전자 생성물을 이용하여 잡종(heterotic) 식물을 생산하는 방법을 제공한다. 일부 구체예에서, 상기 식물체 및 종자는 모계 게놈의 완전한 이배체 상보체를 포함하고, 부계 게놈으로부터의 기여를 전혀 포함하지 않으며, 따라서, 진정한 무수정체(apomict)를 나타낸다. 이 구체예들의 일부 예에서, 모계 게놈을 기여하는 식물체는 바람직한 표현형을 갖는 다양한 대립형질들을 갖는 잡종이고, 본 발명의 방법은 그와 같은 대립형질의 조합의 고정(fixation) 및 용이한 전달(propagation)을 가능하게 한다.
본 발명은 모계 게놈의 완전한 이배체 상보체를 포함하는 종자의 형성을 가져오는 DYAD 유전자 및 그의 유전자 생성물의 용도에 관한 것이다. 본 발명은 씨 없는 과실을 생산하고, 맵핑 연구를 위한 삼염색체 계통(trisomic line)을 작제하고, 부모 식물의 이형접합성 및 단위생식의 유지를 위해 이용될 수 있는 삼배체 식물의 제조를 위해 유용하다. 본 발명에서 이용되는 DYAD의 대립형질은 감소되지 않은 (이배체) 배낭의 형성을 유발한다. 본 발명은 또한 실질적으로 화분 발달에 영향을 미치지 않으면서 감소되지 않은 배낭의 형성을 유발하기 위한 DYAD 유전자의 용도에 관한 것이다. 본 발명은 또한 삼배체의 자가수분에 의해 보다 높은 배수체를 생성하기 위한 DYAD 유전자의 용도에 관한 것이고, 이는 증가된 바이오매스를 갖는 식물체를 생성하는 목적을 위해 유용할 것이다.
본 발명의 다양한 구체예들이 본 발명의 상이한 양태를 보여주며, 본 발명의 상이한 장점들을 제공할 수 있는 것으로 이해되어야 한다. 각각의 구체예가 본 발명의 모든 장점들을 갖는 것은 아니다.
정의:
구(phrase) "핵산 서열(nucleic acid sequence)"은 5' 말단으로부터 3' 말단으로 판독되는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 염기들의 중합체 구조를 의미한다. 이중-가닥 핵산의 경우, "핵산 서열(nucleic acid sequence)"은 나머지 한 가닥에 그의 상보체(complement)를 포함한다.
"핵산(nucleic acid)" 또는 "폴리뉴클레오티드(polynucleotide)"는 DNA 또는 RNA(또는 일부 경우에 티오포스페이트와 같은 데옥시리보뉴클레오티드 또는 리보뉴클레오티드의 유사체, 또는 PNA 유사체, 또는 뉴클레오티드 염기의 유도체를 갖는 뉴클레오티드)의 단일-가닥 또는 이중-가닥 중합체를 의미하며, 염색체 DNA, 자가복제 플라스미드, DNA 또는 RNA의 감염성 중합체(infectious polymer) 및 주로 구조적 역할을 수행하는 DNA 또는 RNA(또는 유사체)를 포함한다.
용어 "폴리뉴클레오티드 서열(polynucleotide sequence)"은 종종 "폴리뉴클레오티드"와 호환가능하나, 때때로 분자 자체보다는, 분자의 서열 정보를 의미할 수 있다.
"프로모터(promoter)"는 작동가능하게 연결된 핵산의 전사를 지시하는 핵산 조절 서열(control sequence)의 배열로 정의된다. 본 명세서에서 사용된 "식물 프로모터(plant promoter)"는 식물에서 기능하는 프로모터이다. 프로모터는 전사의 개시 부위 부근의 필요한 핵산 서열, 예를 들면, 기부 폴리머라아제(basal polymerase) II 타입 프로모터의 경우, TATA 요소를 포함한다. 프로모터는 또한 전사 개시 부위로부터 수천 염기쌍만큼 떨어져 위치할 수 있는 원위 인핸서(distal enhancer) 또는 억제자(repressor) 요소를 선택적으로 포함한다. "구성성(constitutive)" 프로모터는 대부분의 환경 및 발생 조건 하에서 활성을 갖는 프로모터이다. "유도성(inducible)" 프로모터는 환경 또는 발생 제어 하에서 활성을 갖는 프로모터이다. 용어 "작동가능하게 연결된(operably linked)"은 핵산 발현 조절 서열(예를 들면, 프로모터 또는 전사 인자 결합 부위들의 배열)과 제2 핵산 서열 간의 기능적 연결로서, 상기 발현 조절 서열은 상기 제2 서열에 상응하는 핵산의 전사를 지시하는 것인 기능적 연결을 의미한다.
"발현 카세트(expression cassette)"는 하기의 세 가지 주요한 요소를 포함한다: i) 프로모터; ii) 상기 프로모터에 작동가능하게 연결되고 상기 발현 카세트가 세포 내로 도입되는 경우 상기 프로모터에 의해 그 전사가 지시되는 것인 "코딩 폴리뉴클레오티드(coding polynucleotide)" 또는 "코딩 서열(coding sequence)"로 지칭될 수 있는 제2 폴리뉴클레오티드; 및 iii) 전사의 종료를 지시하고 상기 제2 폴리뉴클레오티드의 바로 하류에 위치하는 종결자(terminator) 폴리뉴클레오티드.
용어 "식물(plant)"은 전체 식물, 식물 기관(예를 들면, 잎, 줄기, 꽃, 뿌리, 등), 종자 및 식물 세포 및 그들의 자손(progeny)을 포함한다. 본 발명의 방법에서 이용될 수 있는 식물의 종류는 일반적으로 속씨 식물(angiosperm)(단자엽 식물 및 쌍자엽 식물), 및 겉씨 식물(gymnosperm)을 포함한, 형질전환 기법이 적용될 수 있는 고등 식물의 종류만큼 광범위하다. 이는 배수체(polyploid), 이배체(diploid) 및 반수체(haploid)를 포함한, 다양한 배수성 수준의 식물체를 포함한다. 본 발명의 일부 구체예에서, 상기 식물은 자웅동주(monoecious) 식물인 것이 바람직하다.
폴리뉴클레오티드는 상이한 서열을 가지며 외래 종으로부터 유래되거나, 또는 동일한 종으로부터 기원하나 그의 원래 형태로부터 변형된 경우, 개체에 대해 "이종기원(heterologous)"이거나 또는 제2 폴리뉴클레오티드이다. 예를 들면, 이종기원의 코딩 서열에 작동가능하게 연결된 프로모터는 상기 프로모터가 기원된 종과 상이한 종으로부터의 코딩 서열을 의미하거나, 또는 동일한 종으로부터 기원하나, 천연의 대립형질 변이체와 상이한 코딩 서열을 의미한다.
개별적인 식물에 "외생(exogenous)"인 폴리뉴클레오티드는 유성 교배(sexual cross)가 아닌 다른 수단에 의해 식물로 도입된 폴리뉴클레오티드이다. 상기 도입이 달성될 수 있는 수단의 예가 하기에서 설명되며, 아그로박테리움-매개 형질전환, 바이올리스틱(biolistic) 방법, 전기천공(electroporation) 등을 포함한다. 외생 핵산을 포함하는 식물은 본 명세서에서 R1 세대 형질전환 식물로 지칭된다. 유성 교배로부터 발생하거나 또는 자가수분(selfing)에 의해 발생한 형질전환 식물이 그와 같은 식물의 자손이다.
본 발명에서 사용된 "DYAD 핵산" 또는 "DYAD 폴리뉴클레오티드 서열"은 감수분열의 제어에 관여하는 폴리펩티드를 코딩하고 돌연변이가 발생하는 경우, 감소되지 않은 자성 배우체 형성과 관련하여 단위생식의 측면들을 가능하게 하는 핵산의 부분서열(subsequence), 또는 전장(full length) 폴리뉴클레오티드 서열이다.
"DYAD 유전자"는 숙주 세포, 바람직하게는 식물에서 DYAD 유전자 생성물의 발현을 제공하는 프로모터 및 기타 전사 및 번역 조절 서열과 함께 DYAD 핵산을 포함한다.
DYAD 유전자는 애기장대(Arabidopsis) DYAD 유전자(서열번호 1)에 의해 코딩되는 폴리펩티드와 상당한 서열 동일성(sequence identity)을 가지며 쌀(Genbank ID: 62733414) 및 기타 식물에서 확인된 폴리펩티드를 코딩하는 단백질-코딩 부분을 포함하는 전사체(transcript)를 생성하는 일련의 식물 유전자이다. DYAD 유전자는 또한 포플러스 트리코카르파(Populus trichocarpa) 및 옥수수(Zea mays)에서도 확인되었다(실시예 9). DYAD 유전자는 야생형 애기장대에 단일 카피로 존재한다. 또한, 상기 유전자는 생식 조직의 세포들 중 매우 작은 집단을 차지하는 포자 모세포에서만 발현되기 때문에 그 전사체의 존재(abundance)는 매우 낮다. 애기장대 DYAD 유전자는 감수분열시 염색체 배열(meiotic chromosome organization)에서 결정적인 역할을 수행하는 것으로 이전에 확인되었다(Agashe B., Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-39432002). 따라서, 그의 기능은 쌀에서 밀접하게 관련된 유전자의 존재에 의해 나타나는 바와 같이 다른 식물 종에서 보존될 가능성이 높다. 본 출원에 기재된 데이터는 보에케라도 서열상 애기장대 DYAD 유전자와 밀접하게 관련된 DYAD 유전자를 갖는다는 것을 확립한다.
형질전환 유전자(transgene)의 발현 및 내생(endogenous) 유전자 억제(예를 들면, RNA 간섭, 안티센스 또는 센스 억제에 의한 억제)의 경우에, 당업자(one of skill)는 사용된 폴리뉴클레오티드 서열이 그것이 유래된 유전자의 서열 또는 억제 대상 폴리뉴클레오티드의 유전자의 서열과 동일할 필요는 없으나, "실질적으로 동일(substantially identical)"한 정도일 수 있다는 것을 인식할 것이다. 하기에서 설명되는 바와 같이, 이와 같은 실질적으로 동일한 변이체는 용어 DYAD 핵산에 의해 명확하게 포괄된다.
기능 폴리펩티드(functional polypeptide)를 생성하기 위해 폴리뉴클레오티드 서열이 전사되고 번역되는 경우, 당업자는 코돈 축퇴성(codon degeneracy) 때문에 다수의 폴리뉴클레오티드 서열이 동일한 폴리펩티드를 코딩할 것이라는 것을 인식할 것이다. 이와 같은 변이체들은 용어 "DYAD 핵산"에 의해 명확하게 포괄된다. 또한, 상기 용어는 명확하게 본 명세서에 개시되고, 야생형 DYAD 폴리펩티드의 돌연변이체이거나 또는 (예를 들면, DYAD 폴리펩티드에서 아미노산의 보존적 치환으로부터 초래된) DYAD 폴리펩티드의 기능을 보유한 폴리펩티드를 코딩하는 DYAD 폴리뉴클레오티드 서열과 실질적으로 동일한(하기에서 기재된 바와 같이 결정됨) 서열들을 포함한다. 또한, 변이체들은 하기에 기재된 바와 같은 우성 음성 돌열변이체(dominant negative mutant) 및 미성숙(premature) 번역 종결을 초래하는 넌센스 돌연변이체 또는 프레임쉬프트 돌연변이체를 코딩하는 것들일 수 있다.
두 개의 핵산 또는 폴리펩티드는 하기에 기재된 바와 같이 최대로 대응(correspondence)되도록 정렬되었을 때, 두 개의 분자들에서 뉴클레오티드 또는 아미노산 잔기의 서열이 각각 동일하면, "동일(identical)"하다고 한다. 둘 이상의 핵산 또는 폴리펩티드 서열에 대해 용어 "동일한" 또는 "백분율 동일성(percent identity)"은 비교 창(comparison window)에 대해 최대로 대응되도록 정렬되어 하기의 서열 비교 알고리즘 중 하나를 이용하여 비교되거나, 또는 수동 정렬(manual alignment) 및 육안 조사(visual inspection)를 통해 측정된 경우, 동일하거나 또는 특정 백분율의 동일한 아미노산 잔기 또는 뉴클레오티드를 갖는, 둘 이상의 서열 또는 부분서열을 지칭한다. 서열 동일성의 백분율이 단백질 또는 펩티드에 대해 사용되는 경우, 동일하지 않는 잔기 위치들은 종종 아미노산 잔기가 유사한 화학성 특성(예를 들면, 전하 또는 소수성)을 갖는 다른 아미노산 잔기로 치환되어, 분자의 기능적 특성을 변화시키지 않는, 보존적 아미노산 치환에 의해서만 상이하다는 것이 인식된다. 서열들이 보존적 치환으로 상이한 경우, 백분율 서열 동일성은 치환의 보존적 속성을 보정하기 위해 상향 조정될 수 있다. 이와 같은 조정을 위한 수단들이 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있다. 통상적으로, 이는 보존적 치환을 완전한 불일치(mismatch)가 아닌 부분적 불일치로 평가하고, 그에 의해 백분율 서열 동일성을 증가시키는 것을 수반한다. 따라서, 예를 들면, 동일한 아미노산에 1점이 주어지고, 비-보존적 치환에 0점이 주어지는 경우, 보존적 치환에는 0과 1 사이의 점수가 주어진다. 보존적 치환의 평점은 예를 들면, 프로그램 PC/GENE (Intelligenetics, Mountain View, Calif., USA)에서 구현된 바와 같이, Meyers & Miller, Computer Applic. Biol. Sci. 4:11-17 (1988)의 알고리즘에 따라 계산된다.
두 개의 핵산 또는 폴리펩티드에서, 구 "실질적으로 동일한(substantially identical)"은 비교 창에 대해 최대로 대응되도록 정렬되어 하기의 서열 비교 알고리즘 중 하나를 이용하여 비교되거나, 또는 수동 정렬 및 육안 조사를 통해 측정된 경우, 60% 이상, 바람직하게는 80%, 가장 바람직하게는 90-95%의 뉴클레오티드 또는 아미노산 잔기 동일성을 갖는 서열 또는 부분서열을 지칭한다. 이 정의는 또한 테스트 서열이 기준 서열(reference sequence)에 대해 실질적 동일성을 갖는 경우 실질적인 서열 또는 부분서열 상동성(complementarity)을 갖는, 테스트 서열의 상동체를 의미한다.
서열 비교를 위해, 일반적으로 하나의 서열이 기준 서열로 작용하며, 이에 대해 테스트 서열이 비교된다. 서열 비교 알고리즘을 사용하는 경우, 테스트 서열과 기준 서열이 컴퓨터에 입력되고, 필요한 경우, 부분서열 위치(coordinate)가 지정되고, 서열 알고리즘 프로그램 파라미터들이 지정된다. 프로그램 파라미터에 대한 디폴트(default) 값들이 일반적으로 이용되나, 파라미터에 대한 대안적인 값들이 지정될 수 있다. 그 후, 서열 비교 알고리즘은 프로그램 파라미터에 근거하여, 기준 서열 대비 테스트 서열에 대한 백분율 서열 동일성을 계산한다.
본 명세서에서 사용된 "비교 창(comparison window)"은 두 개의 서열이 최적으로 정렬된 후 동일한 수의 연속된 위치들의 기준 서열에 대해 하나의 서열이 비교되는 것인, 통상적으로 20 내지 600개, 일반적으로 약 50개 내지 약 200개, 보다 일반적으로 약 100개 내지 약 150개의 연속된 위치들의 세그먼트를 포함한다. 비교를 위한 서열의 정렬 방법은 본 발명이 속하는 기술 분야에서 잘 알려져 있다. 비교를 위한 서열의 최적 정렬은 예를 들면, Smith & Waterman, Adv. Appl. Math. 2:482 (1981)의 국소 상동성 알고리즘(local homology algorithm), Needleman & Wunsch, J. Mol. Biol. 48:443 (1970)의 상동성 배열 알고리즘(homology alignment algorithm), Pearson & Lipman, Proc. Natl. Acad. Sci. USA 85:2444 (1988)의 유사성 탐색 방법, 이 알고리즘들(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.)의 전산화 구현(computerized implementation) 또는 수동 정렬 및 육안 조사에 의해 수행될 수 있다.
일반적인 알고리즘의 일 예는 PILEUP이다. PILEUP는 관계와 백분율 서열 동일성을 보여주기 위해 점진적인 쌍대 정렬(progressive, pairwise alignement)을 이용하여 관련 서열들의 군으로부터 복수 개의 서열 정렬을 생성한다. PILEUP는 또한 정렬을 생성하기 위해 이용된 클러스터링 관계(clustering relationship)를 보여주는 트리(tree) 또는 덴도그램(dendogram)을 작성한다. PILEUP는 Feng D. F., & Doolittle, R.F., J. Mol. Evol. Vol. 35:351-360 (1987)의 점진적 정렬 방법의 단순화를 이용한다. 이용된 방법은 Higgins & Sharp, CABIOS 5:151-153 (1989)에 의해 설명된 방법과 유사하다. 상기 프로그램은 각각 5,000개의 뉴클레오티드 또는 아미노산으로 구성된 최대 길이를 갖는, 300개까지의 서열을 정렬시킬 수 있다. 다중 정렬 절차는 두 개의 가장 유사한 서열들의 정렬로 개시되어, 두 개의 정렬된 서열들의 클러스터를 생성한다. 그 후, 이 클러스터는 그 다음 가장 관련된 서열 또는 정렬된 서열의 클러스터에 정렬된다. 두 개의 서열 클러스터는 두 개의 개별적인 서열의 쌍대 정렬의 단순한 확장에 의해 정렬된다. 최종 정렬은 일련의 점진적, 쌍대 정렬에 의해 달성된다. 상기 프로그램은 서열 비교를 위한 영역에 특정한 서열 및 그들의 아미노산 또는 뉴클레오티드 위치를 지정하고, 프로그램 파라미터를 지정하는 것에 의해 실행된다. 예를 들면, 하기의 파라미터를 이용하여 백분율 서열 동일성 관계를 결정하기 위해 기준 서열이 다른 테스트 서열에 비교될 수 있다: 디폴트 갭 가중치(default gap weight)(3.00), 디폴트 갭 길이 가중치(default gap length weight)(0.10), 및 가중된 말단 갭(weighted end gap).
백분율 서열 동일성 및 서열 유사성을 결정하기 위해 적합한 알고리즘의 또 다른 예는 Altschul S.F., et al., J. Mol. Biol. Vol. 215: 403-410 (1990)에 기재된, BLAST 알고리즘이다. BLAST 분석을 수행하기 위한 소프트웨어는 미국 국립생물공학정보센터(National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/)로부터 입수가능하다. 이 알고리즘은 먼저 데이터베이스 서열 내의 동일한 길이의 단어와 정렬되었을 때, 특정한 양의 값을 갖는 역치(threshold) 점수 T와 일치하거나, 또는 이를 만족시키는, 질의 서열(query sequence)에서 길이 W의 짧은 단어를 식별하는 것에 의해 높은 점수의 서열쌍(high scoring sequence pair: HSP)을 식별하는 단계를 포함한다. T는 인접 단어 점수 역치(neighborhood word score threshold)로 지칭된다(Altschul S. F., et al., J. Mol. Biol. Vol. 215: 403- 410 (1990).). 이와 같은 초기의 인접 단어 히트(neighborhood word hit)는 그들을 포함하는 보다 긴 HSP를 찾기 위한 검색을 개시하는 시드(seed)로 작용한다. 단어 히트는 누적 정렬 점수(cumulative alignment score)가 증가될 수 있는 한, 각 서열을 따라 양 방향으로 확장된다. 각 방향으로의 단어 히트의 확장은 누적 정렬 점수가 그의 최대 달성 값으로부터 양 X 만큼 감소되거나; 누점 점수가 하나 이상의 음의 점수 잔기 정렬의 누적 때문에 0 이하가 되거나; 또는 각 서열의 말단에 도달하는 경우, 중단된다. BLAST 알고리즘 파라미터 W, T, 및 X는 정렬의 민감도(sensitivity) 및 속도를 결정한다. BLAST 프로그램은 11의 단어 길이(W), 50의 BLOSUM62 평가 매트릭스(see Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 (1989)) 정렬(B), 10의 기대값(E), M=5, N=-4, 및 양 가닥의 비교를 디폴트로 이용한다.
BLAST 알고리즘은 또한 두 개의 서열 간의 유사성의 통계적 분석을 수행한다(예를 들면, Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873-5787 (1993) 참조). BLAST 알고리즘에 의해 제공되는 유사성의 한 척도는 두 개의 뉴클레오티드 또는 아미노산 서열 간의 일치(match)가 우연에 의해 일어날 확률의 지표를 제공하는, 최소 합 확률(smallest sum probability)(P(N))이다. 예를 들면, 핵산은 테스트 핵산과 기준 핵산의 비교에서 최소 합 확률이 약 0.2보다 작고, 보다 바랍직하게는 약 0.01보다 작고, 가장 바람직하게는 약 0.001보다 작은 경우 기준 서열에 유사한 것으로 간주된다.
"보존적으로 변형된 변이체(conservatively modified variant)"는 아미노산 및 핵산 서열 모두에 적용된다. 특정한 핵산 서열에 대해, 보존적으로 변형된 변이체는 동일하거나 또는 본질적으로 동일한 아미노산 서열을 코딩하는 핵산을 의미하거나, 또는 핵산이 아미노산 서열을 코딩하지 않는 경우, 본질적으로 동일한 서열을 의미한다. 유전자 코드의 축퇴성 때문에, 다수의 기능적으로 동일한 핵산이 임의의 주어진 단백질을 코딩한다. 예를 들면, 코돈 GCA, GCC, GCG 및 GCU는 모두 아미노산인 알라닌을 코딩한다. 따라서, 알라닌이 하나의 코돈에 의해 특정된 모든 위치에서, 상기 코돈은 코딩된 폴리펩티드를 변경시키지 않으면서 기재된 상응하는 코돈 중 하나로 변경될 수 있다. 그와 같은 핵산 변이는 보존적으로 변형된 변이의 일종인 "침묵 변이(silent variation)"이다. 폴리펩티드를 코딩하는 모든 핵산 서열은 또한 핵산의 모든 가능한 침묵 변이를 기술한다. 당업자는 핵산에서 각 코돈(정상적으로 메티오닌에 대한 유일한 코돈인, AUG 제외)은 기능적으로 동일한 분자를 생성하기 위해 변형될 수 있다는 것을 이해할 것이다. 따라서, 폴리펩티드를 코딩하는 핵산의 침묵 변이체 각각은 각각의 기재된 서열에 내재된다.
"본질적으로 동일한 서열(essentially identical sequence)"은 서열의 변이가 분자의 의도된 기능에 영향을 미치지 않는 서열이다.
아미노산 서열에 대해, 당업자는 코딩된 서열에서 하나의 아미노산 또는 낮은 비율의 아미노산을 변형시키거나, 첨가하거나 또는 결실시키는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 개별적인 치환, 결실 또는 첨가는 그 변경이 아미노산의 화학적으로 유사한 아미노산에 의한 치환을 초래하는 경우, "보존적으로 변형된 변이체(conservatively modified variant)"라는 것을 인식할 것이다. 기능적으로 유사한 아미노산을 제공하는 보존적 치환 표(conservative substitution table)이 본 발명이 속하는 기술 분야에서 잘 알려져 있다.
하기의 여섯 개의 그룹 각각은 상호 간에 보존적 치환인 아미노산들을 포함한다:
1) 알라닌(A), 세린(S), 쓰레오닌(T);
2) 아스파르트산(D), 글루탐산(E);
3) 아스파라긴(N), 글루타민(Q);
4) 아르기닌(R), 라이신(K);
5) 이소루이신(I), 루이신(L), 메티오닌(M), 발린(V); 및
6) 페닐알라닌(F), 티로신(Y), 트립토판(W). (예를 들면, Creighton, Proteins (1984) 참조).
두 개의 핵산 서열 또는 폴리펩티드가 실질적으로 동일하다는 표시는 제1 핵산에 의해 코딩된 폴리펩티드가 제2 핵산에 의해 코딩된 폴리펩티드에 대해 생성된 항체에 면역학적으로 교차 반응한다는 것이다. 따라서, 폴리펩티드는 일반적으로, 예를 들면, 두 개의 펩티드가 보존적 치환에 의해서만 상이한 경우, 제2 폴리펩티드와 실질적으로 동일하다. 두 개의 핵산이 실질적으로 동일하다는 또 다른 표시는 두 개의 분자 또는 그들의 상보체들이 하기에 기재된 바와 같은 엄격한(stringent) 조건 하에서 상호 간에 혼성화된다는 것이다.
구 "선택적으로(또는 특이적으로) 혼성화한다(selectively (or specifically) hybridizes to)"는 서열이 복잡한 혼합물(예를 들면, 전체 세포 또는 라이브러리 DNA 또는 RNA)에 존재하는 경우, 엄격한 혼성화 조건 하에서 하나의 분자가 특정한 뉴클레오티드 서열에만 결합하거나, 듀플렉스(duplex)를 형성하거나 또는 혼성화하는 것을 의미한다.
구 "엄격한 혼성화 조건(stringent hybridization condition)"은 프로브가 통상적으로 핵산의 복잡한 혼합물에서 다른 서열에는 혼성화되지 않고, 그의 표적 부분서열에 혼성화되는 조건을 의미한다. 엄격한 조건은 서열-의존적이며, 상이한 상황에서 다를 것이다. 보다 긴 서열은 보다 높은 온도에서 특이적으로 혼성화된다. 핵산의 혼성화에 대한 상세한 안내는 Tijssen, Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Probes, "Overview of principles of hybridization and the strategy of nucleic acid assays", Elsevier (1993)에서 찾을 수 있다. 일반적으로, 높은 엄격성 조건(highly stringent condition)은 정의된 이온 강도 및 pH에서 특정한 서열에 대한 용융점(Tm)보다 약 5-10 ℃ 낮게 선택된다. 낮은 엄격성 조건(low stringency condition)은 일반적으로 Tm보다 약 15-30℃ 낮게 선택된다. Tm은 (정의된 이온 강도, pH 및 핵산 농도 하에서) 평형 상태에서 표적에 상보적인 프로브의 50%가 표적 서열에 혼성화되는 온도(표적 서열은 과량으로 존재하기 때문에, Tm에서, 평형 상태에서 50%의 프로브가 차지됨)이다. 엄격한 조건은 pH 7.0 내지 8.3에서 염 농도가 약 1.0M 소디움 이온 미만이고, 일반적으로 약 0.01 내지 1.0M 소디움 이온 농도(또는 다른 염)이며, 온도는 짧은 프로브(예를 들면, 10 내지 50개의 뉴클레오티드로 구성)의 경우 약 30 ℃이상이고, 긴 프로브(예를 들면, 50개보다 많은 수의 뉴클레오티드로 구성)의 경우 60 ℃이상인 조건일 것이다. 엄격한 조건은 또한 포름아미드와 같은 불안정화제의 첨가에 의해 달성될 수 있다. 선택적 또는 특이적 혼성화를 위해, 양성 신호는 배경 혼성화(background hybridization)의 2배 이상이고, 바람직하게는 배경 혼성화의 10배이다.
엄격한 조건 하에서 상호 간에 혼성화하지 않는 핵산은 그들이 코딩하는 폴리펩티드가 실질적으로 동일한 경우, 여전히 실질적으로 동일하다. 이는 예를 들면, 유전자 코드에 의해 허용되는 최대 코돈 축퇴성을 이용하여 한 카피의 핵산이 생성된 경우 발생한다. 그와 같은 경우에, 핵산은 일반적으로 적당하게 엄격한(moderately stringent) 혼성화 조건 하에서 혼성화한다.
본 발명에서, 사용될 DYAD 핵산을 포함하는 게놈 DNA 또는 cDNA는 본 명세서에 개시된 핵산 서열을 이용하여 엄격한 조건 하에서 표준 서던 블롯(Southern blot)으로 확인될 수 있다. 본 발명의 개시 목적으로, 그와 같은 혼성화를 위해 적합한 엄격한 조건은 37 ℃에서 40% 포름아미드, 1M NaCl, 1% SDS를 포함하는 완충액에서의 혼성화 및 약 50 ℃ 이상, 통상적으로 약 55 ℃, 최대 약 60 ℃의 온도에서 20분 동안 0.1X 내지 1X SSC, 바람직하게는 0.5X SSC, 보다 바람직하게는 0.2X SSC에 의한 1회 이상의 세척을 포함하는 조건 또는 그와 동등한 조건이다. 양성 혼성화(positive hybridization)는 배경 혼성화의 두 배 이상이다. 당업자는 유사한 엄격성 조건을 제공하기 위해 대안적인 혼성화 및 세척 조건이 이용될 수 있다는 것을 용이하게 인식할 것이다.
두 개의 폴리뉴클레오티드가 실질적으로 동일하다는 또 다른 표시는 한 쌍의 올리고뉴클레오티드 프라이머에 의해 증폭된, 기준 서열이 cDNA 또는 게놈 라이브러리로부터 테스트 서열을 분리하거나 또는 예를 들면, 노던 블롯 또는 서던 블롯으로 테스트 서열을 확인하기 위한 엄격한 혼성화 조건에서 프로브로 이용될 수 있는 경우이다.
"식물 잡종(plant hybrid)"은 동일한 식물 종의 두 품종을 교배하여 수득된 식물로 정의된다.
"종간 잡종(interspecific hybrid)"은 상이한 종의 두 식물체를 교배하여 수득된 식물로 정의된다.
생식 사건(reproductive event)에서 "자성 부모(female parent)"는 종자를 형성하는 식물로 정의된다.
본 발명은 DYAD 유전자 및 그의 생성물 및 종자 발달과 단위생식의 제어를 위한 분자 유전학적 방식의 적용을 포함하는 방법에 관한 것이다. 본 발명은 또한 원형 단백질(native protein)의 C-말단 부분이 결핍된 DYAD 폴리펩티드의 절단형(truncated form)을 발현하고, 화분 생존력 분석(pollen viability assay) 및 웅성 감수분열에서 염색체 분리의 현미경 관찰에 의해 결정되는 바와 같이 화분 발달은 실질적으로 변화되지 않게 유지하면서, 감소되지 않은 자성 배우체의 발생을 유발하는, DYAD 유전자의 돌연변이체 대립형질에 관한 것이다. 본 발명은 또한 원형 DYAD 폴리펩티드의 C-말단 부분이 결핍된 DYAD 폴리펩티드를 코딩하는 DYAD 유전자의 자성-특이적 돌연변이 대립형질로서, 식물에서 상기 돌연변이 폴리펩티드의 발현은 감소되지 않은 자성 배우체 발생을 초래하나, 화분 발달에는 실질적으로 영향을 미치지 않는 것인 DYAD 유전자의 자성-특이적 돌연변이 대립형질에 관한 것이다. 그와 같은 돌연변이 대립형질은 예를 들면, 애기장대로부터의 돌연변이 대립형질의 경우, 서열번호 5의 원형 폴리펩티드 서열의 509번 아미노산 내지 639번 아미노산 부분의 전체 또는 일부가 결핍되나, 394번 아미노산까지의 폴리펩티드 서열을 코딩하는 모든 영역을 포함하는 DYAD 폴리펩티드를 발현한다. 또한, 본 발명은 엄격한 조건 하에서 서열번호 4의 서열에 혼성화되고, 원형의 DYAD 폴리펩티드의 C-말단 결실 유도체를 코딩하고, 상기 결실은 비교 창을 이용한 서열번호 5와의 비교에 의해 결정된, 서열번호 5의 509번 아미노산 내지 639번 아미노산의 영역에 해당하는 것인 뉴클레오티드 서열을 제공한다. 보에케라, 쌀, 및 포플러 DYAD 단백질의 상응하는 부분들이 도 11을 참조하여 확인될 수 있다. 본 발명의 조성물은 또한 원형 DYAD 폴리펩티드 서열의 C-말단 결실 유도체, 및 전술된 DYAD 폴리펩티드 및 단백질 서열, 예를 들면, 융합 단백질을 조건부로 식물 세포의 핵으로 수송하는 글루코코르티코이드 호르몬 수용체 단백질로부터 형성된 융합 단백질, 및 그들을 코딩하는 핵산을 포함한다.
본 발명의 방법은 부모의 유전형을 유지하는 감소되지 않는 자성 생식 세포를 생성하기 위해 식물에서 DYAD 폴리뉴클레오티드 서열의 발현을 포함한다. 그와 같은 감소되지 않은 자성 생식세포의 생성은 단위생식을 도입하고 잡종강세(heterosis)를 고정하기 위해, 및 삼배체 식물을 생성하기 위해 유용하다. 본 발명의 일 구체예에서, DYAD 폴리뉴클레오티드 서열은 여러 공지된 형질전환 방법 중 하나에 의해 식물의 게놈으로 도입될 수 있고, 상기 서열은 상기 식물에서 안티센스 또는 이중가닥 RNA로 발현되어, 내생 DYAD 유전자의 억제를 초래하고 감소되지 않는 자성 생식세포의 생성을 유발한다. 본 발명의 또 다른 구체예에서, DYAD 폴리뉴클레오티드 서열의 C-말단 결실이 발현 카세트의 일부로서 식물의 게놈으로 도입되어, 감소되지 않은 자성 배우체의 형성을 초래하고, 동시에 화분의 발달은 실질적으로 영향받지 않은 상태로 유지한다. 그 후, 식물에서 감소되지 않은 자성 배우체 형성을 초래하는 DYAD 폴리뉴클레오티드 서열의 발현은 단위생식에 의한 난 세포의 배아로의 발달에 의해 무성생식 종자(apomictic seed)를 생성하기 위해 이용될 수 있다. 식물 잡종에서 그와 같은 DYAD 폴리뉴클레오티드 서열의 발현은 부모의 유전형을 보유한 감소되지 않은 자성 생식세포의 형성을 초래하고, 그에 의해 다음 세대에서 잡종강세의 고정을 가져온다. 잡종강세의 고정은 두 개의 상이한 유전형의 부모 품종 간의 교배에 의존하지 않고 자가수분에 의해 잡종 종자의 조작을 가능하게 하기 때문에 매우 유용하다.
본 발명의 또 다른 구체예는 무성생식 종자를 생성하기 위해 이용될 수 있는, 감소되지 않는 자성 생식세포의 형성을 가져오는 식물 종의 종간 잡종에서 DYAD 폴리뉴클레오티드 서열의 발현이다. 그와 같은 무성생식 종자의 생성은 하나의 식물종으로부터 또 다른 식물 종으로 농업적으로 유용한 유전자를 이입(introgress)하기에 유용하다. 본 발명의 또 다른 구체예는 DYAD 폴리뉴클레오티드 서열 또는 DYAD 폴리펩티드 서열의 조건부 또는 제어 발현 및/또는 그들의 활성을 포함한다. 그와 같은 조건부 발현은 필요한 경우에만, 감소되지 않는 자성 생식세포의 생성 및 따라서, 무성생식 종자의 생성을 촉진하기 위해 이용될 수 있다. 식물에서 폴리뉴클레오티드 및 폴리펩티드 서열의 조건부 발현 또는 활성을 실현하는 방법은 본 발명이 속하는 기술 분야에서 잘 알려져 있고 에탄올 유도성 유전자 발현(Devaux et al., Plant J., Vol. 36(6): 918-930 ,2003), 활성의 스테로이드 호르몬 유도성 조절(Schena M., Lloyd A. M. and Davis R. W., Proc. Natl. Acad. Sci. USA Vol. 88(23): 10421-10425, 1991), 및 발현의 테트라시클린 매개 조절(Bohner S. et al., Plant J. Vol. 9(1): 87-95, 1999)을 포함하나, 이에 한정되지 않는다.
하기의 실시예 6은 dyad 돌연변이 표현형을 보이는 식물의 동질적 집단이 개발될 수 있는 것인 본 발명의 일 구체예를 설명한다. DYAD RNAi 또는 안티센스 작제물이 조건부 프로모터의 제어 하에 발현되는 것인 조건부 DYAD RNAi 또는 안티센스를 이용하는 것에 의해 동일한 것이 달성될 수 있다. 본 발명의 또 다른 표현은 식물에서 DYAD 유전자의 상보성 카피가 dyad의 돌연변이 대립형질에 대해 동형접합인 유전적 배경에서, 조건부 프로모터의 제어 하에 발현되는 것이다. 본 발명의 또 다른 표현은 트랜스활성자(transactivator)의 제어 하에 발현되는 프로모터의 제어 하에 발현되는 DYAD RNAi 또는 안티센스 작제물을 가지며, 트랜스활성자가 결여된 것인 제1 식물을 상기 트랜스활성자를 발현하는 제2 식물과 교배시키는 것을 이용한다.
본 명세서에 기재된 바와 같이 제조된 분리된 서열이 다수의 기법에서, 예를 들면, 내생 DYAD 유전자 발현을 억제 또는 변경하기 위해 이용될 수 있다. 식물에서 DYAD 유전자 발현 또는 DYAD 활성의 조절은 예를 들면, 무성생식 종자를 생성하기 위한 시스템의 일부로 특히 유용하다.
DYAD 핵산의 분리
일반적으로, 하기에 기재된 재조합 DNA 기법에서 명명법 및 실험 방법(laboratory procedure)은 본 발명이 속하는 기술 분야에서 잘 알려지고 통상적으로 이용되는 것들이다. 클로닝, DNA 및 RNA 분리, 증폭 및 정제를 위한 표준 기법들이 사용된다. 일반적으로 DNA 리가아제, DNA 폴리머라아제, 제한효소(restriction endonuclease) 등을 포함하는 효소 반응은 제조사의 설명서에 따라 수행된다. 이 기법들 및 기타 다양한 기법들이 일반적으로 Sambrook et al., Molecular Cloning-A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N. Y., (1989)에 따라 수행된다.
DYAD 핵산의 분리가 다수의 기법에 의해 이루어질 수 있다. 예를 들면, 본 명세서에 개시된 서열에 근거한 올리고뉴클레오티드 프로브가 cDNA 또는 게놈 DNA 라이브러리에서 원하는 유전자를 식별하기 위해 이용될 수 있다. 게놈 라이브러리를 구축하기 위해, 예를 들면, 제한효소를 이용한 무작위 단편화(random fragmentation)에 의해 게놈 DNA의 큰 세그먼트들이 생성되고, 적합한 벡터로 패키징될 수 있는 직렬연쇄체(concatamer)를 형성하기 위해 벡터 DNA에 라이게이션된다. cDNA 라이브러리를 제조하기 위해, 원하는 조직, 예를 들면, 배주로부터 mRNA를 분리하고, 상기 mRNA로부터 DYAD 유전자 전사체를 포함하는 cDNA 라이브러리를 제조한다.. 대안적으로, cDNA는 DYAD 유전자 또는 그 상동체(homolog)가 발현되는 다른 조직으로부터 추출된 mRNA로부터 제조될 수 있다.
그 후, 본 명세서에 개시된 크로닝된 DYAD 유전자의 서열에 근거한 프로브를 이용하여 cDNA 또는 게놈 라이브러리가 스크리닝될 수 있다. 프로브는 동일한 식물 종 또는 상이한 식물 종에서 상동 유전자를 분리하기 위해 게놈 DNA 또는 cDNA 서열과 혼성화하기 위해 이용될 수 있다. 대안적으로, DYAD 폴리펩티드에 대해 형성된 항체가 mRNA 발현 라이브러리를 스크리닝하기 위해 이용될 수 있다.
대안적으로, 대상이 되는 핵산이 증폭 기법을 이용하여 핵산 시료로부터 증폭될 수 있다. 예를 들면, 중합효소 연쇄 반응(PCR) 기술이 게놈 DNA, cDNA, 게놈 라이브러리 또는 cDNA 라이브러리로부터 직접 DYAD 유전자의 서열을 증폭하기 위해 이용될 수 있다. PCR 및 기타 인 비트로 증폭 방법은 또한 예를 들면, 발현될 단백질을 코딩하는 핵산 서열을 클로닝하거나, 시료에서 원하는 mRNA의 존재를 검출하기 위한 프로브로서 이용될 핵산을 제조하거나, 핵산의 서열을 결정하거나 또는 다른 목적을 위해 유용할 수 있다. PCR의 전반적인 개요의 경우, PCR Protocols: A Guide to Methods and Applications. (Innis, M, Gelfand, D., Sninsky, J. and White, T., eds.), Academic Press, San Diego (1990)을 참조한다.
식물 조직으로부터 DYAD 서열을 식별하기 위해 적합한 프라이머 및 프로브는 본 명세서에 제공된 서열들과 다른 DYAD 관련 유전자 또는 그들이 코딩하는 단백질의 비교로부터 생성될 수 있다. 예를 들면, 보에케라 홀보엘리(Boechera holboelli) DYAD는 쌀로부터 유래된 밀접하게 관련된 유전자(Genbank ID No. 50917243)와 비교될 수 있다. 이 기법들을 이용하여, 당업자는 적합한 프라이머 및 프로브 서열을 제조하기 위해 본 명세서에 개시된 유전자 또는 폴리펩티드에서 보존된 영역을 확인할 수 있다. DYAD 관련 유전자에서 보존된 영역에 특이적으로 혼성화하는 프라이머가 광범위하게 다양한 식물종들로부터 서열을 증폭시키기 위해 이용될 수 있다. 전술된 조건을 이용한 표준 핵산 혼성화 기법이 전장 cDNA 또는 게놈 클론을 확인하기 위해 이용될 수 있다.
DYAD 활성 또는 유전자 발현의 조절
DYAD 유전자는 자성 배우체의 감수분열 및 배수성을 조절하는데 관여하기 때문에, 내생 DYAD 활성 또는 유전자 발현의 억제는 다수의 상황에서 유용하다. 예를 들면, 전술된 바와 같은 C-말단 결실을 갖는 대립형질의 사용에 의한 DYAD 발현의 억제 또는 DYAD 활성의 변경이 종자를 갖지 않거나(absent) 또는 작은/퇴행된 종자를 갖는 과실("씨 없는 과실(seedless fruit)"로 지칭됨)의 생성을 위해 이용될 수 있다. 대부분의 식물 종에서, 삼배체의 형성은 감수분열에서 염색체의 불균형 분리(unbalanced segregation) 때문에 배아세포(germ cell)의 형성에서 결함을 유발하고 종자의 부재 또는 작은/퇴행된 종자의 형성을 초래한다. 내생 DYAD 발현 또는 활성의 억제는 배수성의 조절을 가능하게 한다. 따라서, DYAD 활성이 억제되거나 변형된 본 발명의 식물의 일부 구체예에서, 종자가 존재하지 않거나 퇴행되고 씨없는 과실이 생성된다.
본 발명의 핵산의 또 다른 용도는 단위생식 식물 계통(apomictic plant line)(즉, 배주에서 무성생식 과정이 일어나는 것인 식물, 단위생식의 검토를 위해 KolrunowA., Plant Cell, Vol.5: 1425-1437 (1993) 참조)의 개발에 있다. 단위생식은 전통적인 육종에 의해 용이하게 유지될 수 없는 복잡한 이종접합형 유전형을 선택하고 고정시키기 위한 신규한 수단을 제공한다. 따라서, 예를 들면, 원하는 특성(예를 들면, 잡종강세)을 갖는 신규한 잡종 계통이 수득되어 용이하게 유지될 수 있다.
본 발명이 속하는 기술 분야의 당업자는 DYAD 활성 또는 유전자 발현을 조정하기 위해 다수의 방법이 이용될 수 있다는 것을 인식할 것이다. 식물 세포에서 DYAD 활성은 유전자, 전사, 전사후, 번역, 또는 번역후 수준에서 조정될 수 있다. 이와 같은 각 수준에서 DYAD 활성을 조정하는 기법은 일반적으로 본 발명이 속하는 기술 분야의 당업자에게 잘 알려져 있고 일부는 하기에서 간략하게 논의된다.
식물 유전자에 유전적 돌연변이를 도입하는 방법은 잘 알려져 있다. 예를 들면, 종자 또는 기타 식물 물질이 표준 기법에 따라, 돌연변이 유발성(mutagenic) 화학물질로 처리될 수 있다. 그와 같은 화학 물질은 하기를 포함하나, 이에 한정되지 않는다: 디에틸 술페이트, 에틸렌 이민, 에틸 메탄술포네이트 및 N-니트로소-N-에틸우레아. 대안적으로, 예를 들면, X-선, 감마선, 또는 고속 중성자(fast neutron)와 같은 공급원으로부터의 이온화 방사선이 이용될 수 있다. DYAD 뉴클레오티드 서열을 증폭하는 PCR 프라이머를 이용하여 돌연변이가 유발된 식물의 합쳐진 집단의 분자 스크리닝 및 뒤이은 DYAD 폴리뉴클레오티드 서열에 유전적 돌연변이를 갖는 식물을 확인하기 위한 PCR 산물의 분석에 의해 DYAD 유전자 서열에 돌연변이를 갖는 식물체가 식별될 수 있다. 특정한 유전자 서열에 돌연변이를 갖는 식물을 스크리닝하고 식별하는 방법이 개시되었다(Henikoff S., Bradley T. J. and Comai L., Plant Physiol. Vol. 135(2): 630-636, 2004).
대안적으로, 인 비보에서 DYAD 유전자를 특이적으로 결실시키거나 또는 변경시키는 것에 의해 표적화된 유전자 파괴(targeted gene disruption)를 유도하기 위해 상동성 재조합(homologous recombination)이 이용될 수 있다(일반적으로, Grewal and Klar, Genetics 146: 1221-1238 (1997) 및 Xu et al., Genes Dev. 10: 2411-2422 (1996) 참조). 식물에서 상동성 재조합이 입증되었다(Puchta et al., Experientia 50: 277-284 (1994), Swoboda et al., EMBO J. 13: 484-489 (1994); Offringa et al., Proc. Natl. Acad. Sci. USA 90: 7346-7350 (1993); 및 Kempin et al. Nature 389:802-803 (1997)).
상동성 재조합 기술을 본 발명의 유전자에 적용하는 경우, 본 명세서에 개시된 돌연변이와 같은, DYAD 유전자 서열의 선택된 부분(5'-상류, 3'-하류, 및 유전자내(intragenic) 영역 포함)에 있는 돌연변이가 인 비트로로 제조되고 표준 기법을 이용하여 원하는 식물에 도입된다. 상동성 재조합의 효율성은 사용된 벡터에 의존적인 것으로 알려져 있기 때문에, Mountford et al. Proc. Natl. Acad. Sci. USA 91: 4303-4307 (1994); 및 Vaulont et al. Transgenic Res. 4: 247-255 (1995)에 기재된 바와 같은, 디시스트론성 유전자 표적 벡터(dicistronic gene targeting vector)의 이용이 형질전환 식물에서 변경된 DYAD 유전자 발현을 선택하는 효율성을 증가시키기 위해 편리하게 이용된다. 돌연변이된 유전자는 형질전환 식물 세포에서 야생형 유전자의 상동성 재조합 및 표적화된 치환이 일어나, DYAD 활성의 억제를 초래하는 방식으로 표적 야생형 유전자와 상호작용한다.
대안적으로, 양 말단에 이중 헤어핀 캡(double hairpin cap)을 갖는 듀플렉스 구조인 RNA 및 DNA 잔기의 연속된 부분(contiguous stretch)으로 구성된 올리고뉴클레오티드가 이용될 수 있다. RNA/DNA 서열은 표적 DYAD의 서열과 정렬되고, 원하는 뉴클레오티드 변화를 포함하도록 설계된다. 염색체 외부에 존재하는(extrachromosomal) T-DNA 플라스미드로의 키메라 올리고뉴클레오티드(chimeric oligonucleotide)의 도입은 소수의 형질전환된 식물 세포에서 키메라 분자에 의해 주도되는 효율적이고 특이적인 DYAD 유전자 전환(conversion)을 초래한다. 이 방법은 Cole-Strauss et al. Science 273:1386-1389 (1996) 및 Yoon et al. Proc. Natl. Acad. Sci. USA 93: 2071-2076 (1996)에 기재된다.
식물 세포를 트랜스포손(transposon) 또는 T-DNA 서열을 포함하는 작제물로 형질전환시키는 것에 의해 재조합 DNA 기법을 이용하여 유전자 발현을 불활성화시킬 수 있다. 이 방법에 의해 제조된 DYAD 돌연변이체는 표준 기법에 따라 식별된다. 예를 들면, PCR에 의해 또는 노던 블롯 또는 역전사 및 뒤이은 PCR(RT-PCR)에 의해 DYAD mRNA의 존재 또는 부재를 검출하는 것에 의해 돌연변이체가 검출될 수 있다. 돌연변이체는 또한 수정능력(fertility), 자성 감수분열, 및 거대포자 발달의 변경에 대해 분석하는 것에 의해 선택될 수 있다.
본 명세서에 기재된 바와 같이 제조된 분리된 핵산 서열은 또한 다양한 수준에서 내생 DYAD 유전자 발현을 조절하기 위한 다수의 기법에서 이용될 수 있다. 본 명세서에 개시된 서열로부터의 부분서열이 전사, RNA 축적, 번역, 등을 조절하기 위해 이용될 수 있다.
식물에서 유전자 발현을 억제하기 위해 다수의 방법들이 이용될 수 있다. 예를 들면, RNA 간섭(RNAi) 기술이 편리하게 이용될 수 있다. 이를 달성하기 위해, 원하는 유전자로부터의 핵산 세그먼트가, 두 개의 카피가 통상적으로 5 내지 2000개의 뉴클레오티드로 구성된 길이, 바람직하게는 30 내지 500개의 뉴클레오티드로 구성된 길이, 및 보다 바람직하게는 50 내지 200개의 뉴클레오티드로 구성된 길이일 수 있는 스페이서에 의해 분리된 것인 역위 반복부(inverted repead)로서 클로닝된다. 상기 역위 반복부는 두 카피가 모두 전사되어 그 길이 전체 또는 일부에 걸쳐 자가-상보성(self-complementary)인 RNA 종을 생성하도록 프로모터 및 이어진 종결자(terminator)에 작동가능하게 연결된다. 그 후, 상기 작제물은 식물로 형질전환되고 이중가닥 RNA가 생성된다.
또 다른 예로서, DYAD 유전자 발현을 억제하기 위해 안티센스 기법이 편리하게 이용될 수 있다. 이를 달성하기 위해, 원하는 유전자로부터의 핵산 세그먼트가 클로닝되고 RNA의 안티센스 가닥이 전사되도록 프로모터에 작동가능하게 연결된다. 그 후, 상기 작제물이 식물로 형질전환되고, RNA의 안티센스 가닥이 생성된다. 식물 세포에서, RNA 번역의 억제(Bourque Plant Sci. (Limerick) 105: 125-149 (1995); Pantopoulos In Progress in Nucleic Acid Research and Molecular Biology, Vol. 48. Cohn, W. E. and K. Moldave (Ed.). Academic Press, Inc.: San Diego, Calif., USA; London, England, UK. p. 181-238; Heiser et al. Plant Sci. (Shannon) 127: 61-69 (1997) 참조) 및 대상 단백질을 코딩하는 mRNA의 축적의 방지, (Baulcombe Plant Mol. Bio. 32:79-88 (1996); Prins and Goldbach Arch. Virol. 141: 2259-2276 (1996); Metzlaff et al. Cell 88: 845-854 (1997), Sheehy et al., Proc. Nat. Acad. Sci. USA, 85:8805-8809 (1988), and Hiatt et al., U.S. Pat. No. 4,801,340 참조)를 포함한 안티센스 억제가 유전자 조절의 모든 수준에서 작용할 수 있는 것으로 제안되었다.
도입될 핵산 세그먼트는 내생 DYAD 유전자 또는 억제될 유전자의 적어도 일부와 실질적으로 동일할 것이다. 그러나, 발현을 억제하기 위해 서열이 반드시 완전하게 동일할 필요는 없다. 본 발명의 벡터는 억제 효과가 표적 유전자에 대해 상동성 또는 실질적인 상동성을 보이는 유전자들의 패밀리에 속하는 다른 유전자들에 적용될 수 있도록 설계된다.
안티센스 억제의 경우, 도입된 서열은 또한 일차 전사 생성물 또는 완전히 가공된 mRNA에 대해 전장일 필요는 없다. 일반적으로, 보다 높은 상동성이 보다 짧은 서열의 이용을 보상하기 위해 이용될 수 있다. 또한, 도입된 서열은 동일한 인트론 또는 엑손 패턴을 가질 필요가 없으며, 비-코딩 세그먼트(non-coding segment)의 상동성이 동일하게 효과적일 수 있다. 정상적으로, 약 30 또는 40개의 뉴클레오티드 내지 전장(full-length) 뉴클레오티드의 서열이 이용될 수 있으나, 100개 이상의 뉴클레오티드의 서열이 바람직하고, 200개 이상의 뉴클레오티드의 서열이 보다 바람직하며, 약 500개 내지 약 1700개의 뉴클레오티드의 서열이 특히 바람직하다.
DYAD 유전자 발현을 억제하기 위해 다수의 유전자 영역이 표적화될 수 있다. 표적은 예를 들면, 코딩 영역, 인트론, 엑손/인트론 연결부(junction)로부터의 서열, 5' 또는 3'-UTR(untranslated region) 등을 포함할 수 있다. 일부 구체예에서, 조절 단백질이 그의 세포- 및/또는 조직-특이적 발현을 위해 요구되는 DYAD 유전자 서열에 결합하는 능력을 제거하도록 작제물이 설계될 수 있다. 그와 같은 전사 조절 서열은 유전자의 코딩 영역의 5'-, 3'- 또는 그 내부에 위치될 수 있으며, 유전자 전사를 촉진(양성 조절 요소) 또는 억제(음성 조절 요소)할 수 있다. 이 서열들은 본 발명이 속하는 기술 분야에서 당업자에게 잘 알려진, 표준 결실 기법을 이용하여 식별될 수 있다. 일단 상기 서열이 식별되면, 이 서열들을 표적화하는 안티센스 작제물이 특정 조직, 예를 들면, 발달 중인 배주 및/또는 종자에서 유전자 전사를 조절하기 위해 식물로 도입된다.
올리고뉴클레오티드-기반 삼중-나선(triple-helix) 형성이 DYAD 유전자 발현을 중단시키기 위해 이용될 수 있다. 트리플렉스(triplex) DNA는 DNA 전사 및 복제를 억제하고, 부위-특이적 돌연변이를 생성하며, DNA를 절단하고, 상동성 재조합을 유도할 수 있다(예를 들면, Havre and Glazer J. Virology 67:7324-7331 (1993); Scanlon et al. FASEB J. 9:1288- 1296 (1995); Giovannangeli et al. Biochemistry 35:10539-10548 (1996); Chan and Glazer J. Mol. Medicine (Berlin) 75: 267-282 (1997) 참조). 안티센스 조절을 위해 식별된 동일한 서열을 표적화하기 위해 삼중 나선 DNA가 이용될 수 있다.
촉매활성의 RNA 분자 또는 리보자임(ribozyme)이 또한 DYAD 유전자의 발현을 억제하기 위해 이용될 수 있다. 실질적으로 모든 표적 RNA와 특이적으로 쌍을 형성하고 특정한 위치에서 포스포디에스테르 백본을 절단하여, 표적 RNA를 기능적으로 불활성화시키는 리보자임을 설계할 수 있다. 이 절단을 수행할 때, 리보자임 자체는 변경되지 않으며, 따라서 재생되어 다른 분자들을 절단하기 위해 이용될 수 있어서, 진정한 효소로 작용한다. 안티센스 RNA 내에 리보자임 서열의 내포는 그들에 RNA-절단 활성을 부여하여, 그에 의해 작제물의 활성을 증가시킨다. 따라서, 리보자임은 안티센스 조절을 위해 식별된 동일한 서열을 표적화하기 위해 이용될 수 있다.
다수의 종류의 리보자임이 확인되었다. 한 종류의 리보자임은 식물에서 자가-절단(self-cleavage) 및 복제가 가능한 다수의 소형 원형 RNA로부터 유래된다. 상기 RNA는 단독으로(비로이드 RNA) 또는 헬퍼 바이러스(새틀라이트(satellite) RNA)와 함께 복제한다. 예는 ASBV(아보카도 선블로치 비로이드: avocado sunblotch viroid)로부터의 RNA 및 TRSV(토바코 링스폿 바이러스: tobacco ringspot virus), LTSV(루세르네 트랜션트 스트리크 바이러스: lucerne transient streak virus), VTMoV(벨벳 토바코 모틀 바이러스: velvet tobacco mottle virus), SNMV(솔라눔 노디플로룸 모틀 바이러스: solanum nodiflorum mottle virus) 및 SCMoV(서브터레니언 클로버 모틀 바이러스: subterranean clover mottle virus)로부터의 새틀라이트(satellite) RNA를 포함한다. 표적 RNA-특이적 리보자임의 설계 및 용도가 Zhao and Pick Nature 365:448-451 (1993); Eastham and Ahlering J. Urology 156:1186-1188 (1996); Sokol and Murray Transgenic Res. 5:363-371 (1996); Sun et al. Mol.Biotechnology 7:241-251 (1997); 및 Haseloff et al. Nature, 334:585-591 (1988)에 기재된다.
억제의 또 다른 방법은 센스 보조억제(cosuppression)이다. 센스 배향으로 구성된 핵산의 도입은 표적 유전자의 전사를 차단하기 위한 효과적인 수단으로 확인되었다. 내생 유전자의 발현을 조절하기 위한 이 방법의 이용의 예를 위해, Assaad et al. Plant Mol. Bio. 22: 1067-1085 (1993); Flavell Proc. Natl. Acad. Sci. USA 91: 3490-3496 (1994); Stam et al. Annals Bot. 79: 3-12 (1997); Napoli et al., The Plant Cell 2:279-289 (1990); 및 미국특허 제5,034,323호, 제5,231,020호, 및 제5,283,184호를 참조한다.
도입되는 서열이 코딩 서열 자체를 포함하지 않고, 내생 서열의 일차 전사체에 존재하는 서열에 상동적인 인트론 또는 비번역 서열(UTR)만을 포함하는 경우, 억제 효과가 일어날 수 있다. 도입되는 서열은 일반적으로 억제대상으로 의도된 내생 서열과 실질적으로 동일하다. 이 최소의 동일성은 일반적으로 약 65%보다 높으나, 보다 높은 동일성이 내생 서열의 보다 효과적인 억제를 발휘할 것이다. 약 80%를 초과하는 훨씬 더 높은 동일성이 바람직하나, 약 95% 내지 절대적 동일성이 가장 바람직할 것이다. 안티센스 조절의 경우와 같이, 그 효과는 상동성 또는 실질적인 상동성을 보이는 유전자의 유사한 패밀리에 속하는 다른 단백질에도 적용될 것이다.
센스 억제의 경우, 절대적 동일성보다 낮은 동일성이 요구되는, 도입되는 서열은 또한 일차 전사 생성물 또는 완전히 가공된 mRNA에 대해, 전장(full-length)일 필요는 없다. 과다발현자인 식물의 동시 생산을 피하기 위해, 이것이 바람직할 수 있다. 전장보다 짧은 길이의 서열에서 보다 높은 동일성이 보다 길고, 보다 낮은 동일성의 서열을 보완한다. 또한, 도입되는 서열은 동일한 인트론 또는 엑손 패턴을 가지지 않아도 되고, 비-코딩 세그먼트의 동일성이 동일하게 효과적일 것이다. 일반적으로, 안티센스 조절에 대해 전술된 크기 범위의 서열이 이용된다. 또한, 안티센스 조절을 위해 앞서 언급되었던 동일한 유전자 영역이 보조억제 기술을 이용하여 표적화될 수 있다.
대안적으로, DYAD 세포-특이적 유전자 발현을 위해 요구되는 단백질의 제거가 DYAD 활성을 조절할 수 있다. 따라서, 조절 단백질 및/또는 DYAD 유전자 발현을 조절하는 서열의 발현이 본 명세서에 기재된 방법을 이용하여 조정될 수 있다.
또 다른 방법은 DYAD mRNA 번역의 조작된(engineered) tRNA 억제의 이용이다. 이 방법은 미성숙 종결 코돈을 포함하는 표적 유전자를 트랜스활성화(transactivate)시키기 위한 억제자 tRNA의 이용을 포함한다(Betzner et al. Plant J.I 1:587-595 (1997); 및 Choisne et al. Plant J.11: 597-604 (1997) 참조). 앰버(amber) 종결 코돈을 포함하는 구성적으로 발현되는 DYAD 유전자를 포함하는 식물 계통이 먼저 생성된다. 각각 세포-타입 특이적 프로모터의 지시 하에 있는 tRNA 억제자 유전자 작제물을 포함하는 것인 복수의 식물 계통들이 또한 생성된다. 그 후, tRNA 유전자 작제물이 표적화된 방식으로 DYAD 활성을 활성화시키기 위해 DYAD 계통으로 교배된다. 이 tRNA 억제자 계통은 또한 임의의 타입의 유전자의 발현을 동일한 세포 또는 조직 타입으로 표적화시키기 위해 이용될 수 있다.
다른 단백질에 결합하는 능력이 불완전한 DYAD 폴리펩티드의 우성-음성 형태의 생산은 내생 DYAD 활성을 억제하기 위한 편리한 수단이다. 이 방법은 내생 단백질과 불완전한 복합체를 형성하고 그에 의해 복합체가 제대로 형성될 수 없게 하는 돌연변이 DYAD 폴리펩티드를 코딩하는 작제물에 의한 식물의 형질전환을 포함한다. 돌연변이 폴리펩티드는 아미노산 치환, 첨가, 결실 등에 의해 일차 구조 수준에서 천연 서열로부터 변할 수 있다. 이 변형은 최종의 변형된 단백질 사슬을 생성하기 위해 다수의 조합으로 이용될 수 있다. 표적 유전자를 불활성화시키기 위한 우성 음성 돌연변이체의 이용이 Mizukami et al. Plant Cell 8:831-845 (1996)에 기재된다.
DYAD 단백질이 그 자체 또는 다른 단백질과 상호작용하는 능력에 영향을 미치는 또 다른 전략은 DYAD에 특이적인 항체의 이용을 포함한다. 이 방법에서, DYAD-특이적 Ab의 세포-특이적 발현이 항체:항원 인식을 통해 기능성 도메인을 불활성화시키기 위해 이용된다(Hupp et al. Cell 83:237-245 (1995) 참조).
DYAD 유전자 발현을 강화하기 위한 본 발명의 핵산의 용도
본 명세서에서 개시된 바와 같이 제조된 분리된 서열이 또한 내생 유전자 발현을 강화 또는 증가시키기 위해 특정한 DYAD 핵산의 발현을 도입하기 위해 이용될 수 있다. 강화된 발현은 또한 예를 들면, 식물이 종자를 형성(set)하는 것을 방지하여 영양 생장(vegetative growth)을 증가시키기 위해 이용될 수 있다. 유전자의 과다발현이 바람직한 경우, 상이한 종으로부터의 원하는 유전자가 잠재적인 센스 보조억제 효과를 감소시키기 위해 이용될 수 있다.
당업자는 다른 단백질처럼, 본 발명의 유전자에 의해 코딩된 폴리펩티드가 상이한 기능을 수행하는 상이한 도메인을 갖는다는 것을 인식할 것이다. 따라서, 상기 단백질의 원하는 기능 도메인이 발현되는 한, 상기 유전자 서열이 전장(full-lenght)일 필요는 없다.
변형된 단백질 사슬은 또한 본 발명이 속하는 기술 분야에서 당업자에게 잘 알려지고 하기에서 상세하게 설명되는 다양한 재조합 DNA 기법을 이용하여 용이하게 설계될 수 있다. 예를 들면, 단백질 사슬은 아미노산 치환, 첨가, 결실, 등에 의해 일차 구조 수준에서 천연 서열로부터 변할 수 있다. 이 변형들은 최종의 변형된 단백질 사슬을 생성하기 위해 다수의 조합으로 이용될 수 있다.
재조합 벡터의 제조
전술된 기법에서 분리된 서열을 이용하기 위해, 식물 세포의 형질전환을 위해 적합한 재조합 DNA 벡터가 제조된다. 다양한 고등 식물 종을 형질전환시키기 위한 기법들이 잘 알려져 있고 학술 및 과학 문헌에 개시된다. 예를 들면, Weising et al. Ann. Rev. Genet. 22:421-477 (1988)을 참조한다. 원하는 폴리펩티드를 코딩하는 DNA 서열, 예를 들면, 전장 단백질, 또는 DYAD와 세포내 국소화 서열(intracellular localization sequence)의 융합 단백질, 또는 절단된 DYAD 단백질을 코딩하는 cDNA 서열은 바람직하게는 형질전환된 식물의 의도된 조직에서 유전자로부터의 서열의 전사를 지시할 전사 및 번역 개시 조절 서열과 조합될 것이다.
예를 들면, 과다발현을 위해, 재생된(regenerated) 식물의 모든 조직에서 유전자의 발현을 지시할 식물 프로모터 단편이 이용될 수 있다. 그와 같은 프로모터는 본 명세서에서 "구성성(constitutive)" 프로모터로 지칭되며 대부분의 환경 조건 및 발생 또는 세포 분화의 단계들에서 활성을 갖는다. 구성성 프로모터의 예는 CaMV(cauliflower mosaic virus) 35S 전사 개시 영역이다. 아그로박테리움 투메파시엔스의 T-DNA로부터 유래된 1'- 또는 2'- 프로모터, 및 다양한 식물 유전자로부터의 기타 전사 개시 영역이 본 발명이 속하는 기술 분야의 당업자에게 알려져 있다. 그와 같은 유전자는 예를 들면, 애기장대로터 유래된 ACTl1(Huang et al. Plant Mol. Biol. 33:125-139 (1996)), 애기장대로터 유래된 Cat3(GenBank No. U43147, Zhong et al., Mol. Gen. Genet. 251:196-203 (1996)), 브라시카 나푸스(Brassica napus)로부터 유래된 스테아로일-아실 담체 단백질 불포화효소(desaturase)를 코딩하는 유전자(Genbank No. X74782, Solocombe et al. Plant Physiol. 104:1167-1176 (1994)), 옥수수로부터 유래된 GPc1(GenBank No. X15596, Martinez et al. J. Mol. Biol 208:551-565 (1989)), 및 옥수수로부터 유래된 Gpc2 (GenBank No. U45855, Manjunath et al., Plant Mol. Biol. 33:97-112 (1997))를 포함한다.
대안적으로, 식물 프로모터는 특정한 조직에서 DYAD 핵산의 발현을 지시할 수 있거나, 또는 보다 정확한 환경적 제어 또는 발생적 제어 하에 있을 수 있다. 유도성 프로모터에 의해 전사를 달성할 수 있는 환경적 조건의 예는 혐기성 조건, 상승된 온도, 또는 광의 존재를 포함한다. 그와 같은 프로모터는 "유도성(inducible)" 또는 "조직-특이적(tissue-specific)" 프로모터로 지칭된다. 당업자는 조직-특이적 프로모터가 표적 조직이 아닌 다른 조직들에서 작동가능하게 연결된 서열의 발현을 추진시킬 수 있다는 것을 인식할 것이다. 따라서, 본 명세서에서 사용된 조직-특이적 프로모터는 표적 조직에서 우선적으로 발현을 추진시키는 프로모터이나, 또한 다른 조직에서도 일부 발현을 초래할 수 있다. 조건부 발현, 조직-특이적 발현, 또는 상기 두 가지의 조합은 또한, DYAD 핵산이 이종(heterologous) 또는 합성 트랜스활성자(transactivator)에 의해 구동되는 합성 프로모터의 제어 하에 배치될 수 있는 것인, 트랜스활성자를 이용하여 달성될 수 있다. 트랜스활성자의 조직-특이적 및/또는 조건부 발현은 DYAD 핵산의 상응하는 발현을 추진시킬 것이다. 식물에서 이용된 트랜스활성자 및 유도성 시스템의 예는 mGal4:VP16/UAS, pOp/LhG4, GVE/VGE, GVG, pOp6/LhGR, 및 XVE를 포함한다(Moore et al., The Plant Journal 45: 651-683 (2006)에서 검토됨).
발생적 제어(developmental control) 하에 있는 프로모터의 예는 과실, 종자 또는 꽃과 같은 특정한 조직에서만(또는 주로) 전사를 개시하는 프로모터를 포함한다. 배주, 꽃, 또는 종자에서 핵산의 발현을 지시하는 프로모터가 특히 본 발명에서 유용하다. 본 명세서에서 사용된 종자-특이적 프로모터는 종자 조직에서 발현을 지시하는 프로모터이다. 그와 같은 프로모터는 예를 들면, 배주-특이적(난 세포 또는 중심 세포(central cell)와 같은 자성 배우체 또는 모계 조직(maternal tissue)에서 발현을 지시하는 프로모터를 포함), 배아-특이적, 배유-특이적, 외피-특이적, 종피-특이적 프로모터 또는 그들의 조합을 포함한다. 예는 Reiser et al. Cell 83:735-742 (1995)에 기재된 배주-특이적 BELl 유전자로부터의 프로모터(GenBank No. U39944), 및 웅성 감수모세포(meicyte) 특이적 DUET 유전자로부터의 프로모터(Reddy T. V., et al., Development, Vol. 130 (24):5975-5987, 2003)를 포함한다. 기타 적합한 종자 특이적 프로모터는 하기의 유전자로부터 유래된다: 옥수수로부터의 MACl(Sheridan et al. Genetics 142:1009-1020 (1996), 옥수수로부터의 Cat3(GenBank No. L05934, Abler et al. Plant Mol. Biol. 22:10131-1038 (1993), 옥수수로부터의 올레오신 18 kD을 코딩하는 유전자(GenBank No. J05212, Lee et al. Plant Mol. Biol. 26:1981-1987 (1994)), 애기장대로부터의 비비파로우스(viviparous)-1(Genbank No. U93215), 애기장대로부터의 올레오신을 코딩하는 유전자(Genbank No. Z17657), 애기장대로부터의 Atmycl(Urao et al. Plant Mol. Biol. 32:571-576 (1996), 애기장대로부터의 2S 종자 저장 단백질(seed storage protein) 유전자 패밀리(Conceicao et al. Plant J. 5:493-505 (1994)), 브라시카 나푸스로부터의 올레오신 20 kD을 코딩하는 유전자 (GenBank No. M63985), 브라시카 나푸스로부터의 napA(GenBank No. J02798, Josefsson et al. JBL 26:12196-1301 (1987), 브라시카 나푸스로부터의 나핀(napin) 유전자 패밀리(Sjodahl et al. Planta 197:264-271 (1995), 브라시카 나푸스로부터의 2S 저장 단백질을 코딩하는 유전자(Dasgupta et al. Gene 133:301-302 (1993)), 대두로부터의 올레오신 A(Genbank No. U09118) 및 올레오신 B(Genbank No. U09119)를 코딩하는 유전자 및 대두로부터의 저분자량 황-풍부 단백질(sulphur rich protein)을 코딩하는 유전자 (Choi et al. Mol. Gen., Genet. 246:266-268 (1995)).
또한, 본 명세서에 개시된 DYAD 유전자로부터의 프로모터 서열은 본 발명의 DYAD 폴리뉴클레오티드 또는 이종 서열의 발현을 추진하기 위해 이용될 수 있다. 적절한 폴리펩티드 발현이 바람직한 경우, 코딩 영역의 3'-말단에 있는 폴리아데닐화(polyadenylation) 영역이 포함되어야 한다. 폴리아데닐화 영역은 천연 유전자, 또는 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다.
본 발명의 유전자로부터의 서열(예를 들면, 프로모터 또는 코딩 영역)을 포함하는 벡터는 일반적으로 식물 세포에 선택가능한 표현형을 부여하는 마커 유전자를 포함할 것이다. 예를 들면, 상기 마커는 살생물제(biocide) 저항성, 특히, 항생제 저항성, 예를 들면, 카나마이신, G418, 블레오마이신, 히그로마이신에 대한 저항성, 또는 제초제 저항성, 예를 들면, 클로로술푸론 또는 바스타(Basta)에 대한 저항성을 코딩할 수 있다.
형질전환 식물의 생산
본 발명의 DNA 작제물이 다양한 통상적 기법에 의해 원하는 식물 숙주의 게놈으로 도입될 수 있다. 예를 들면, 상기 DNA 작제물은 식물 세포 원형질체의 전기천공 또는 미세주입(microinjection)과 같은 기법을 이용하여 식물 세포의 게놈 DNA로 직접 도입될 수 있거나, 또는 DNA 작제물은 DNA 입자 충격(particle bombardment)과 같은 탄도 방법(ballistic method)을 이용하여 식물 조직으로 직접 도입될 수 있다.
미세주입 기법은 본 발명이 속하는 기술 분야에서 공지되어 있고, 과학 및 특허 문헌에 잘 개시되어 있다. 폴리에틸렌 글리콜 침전을 이용한 DNA 작제물의 도입이 Paszkowski et al. Embo J. 3:2717-2722 (1984)에 기재되어 있다. 전기천공 기법은 Fromm et al. Proc. Natl. Acad. Sci. USA 82:5824 (1985)에 기재되어 있다. 입자충돌식 형질전환 기법(ballistic transformation technique)은 Klein et al. Nature 327:70-73 (1987)에 기재되어 있다.
대안적으로, DNA 작제물은 적합한 T-DNA 플랭킹 영역(flanking region)과 결합되어 통상적인 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 숙주 벡터로 도입될 수 있다. 식물 세포가 아그로박테리움 투메파시엔스에 의해 감염되면, 아그로박테리움 투메파시엔스 숙주의 병독성(virulence) 기능이 상기 작제물 및 인접한 마커의 식물 세포 DNA로의 삽입을 지시할 것이다. 무장해제(disarming) 및 이중 벡터(binary vector)의 이용을 포함한 아그로박테리움 투메파시엔스-매개 형질전환 기법이 과학 학술 문헌에 잘 기재되어 있다. 예를 들면, Horsch et al. Science 233:496-498 (1984), and Fraley et al. Proc. Natl. Acad. Sci. USA 80:4803 (1983)를 참조한다.
전술된 형질전환 기법으로부터 유래된 형질전환된 식물 세포들은 형질전환된 유전형 및 따라서 증가된 종자 매스와 같은 원하는 표현형을 갖는 전체 식물을 재생하기 위해 배양될 수 있다. 그와 같은 재생 기법은 조직 배양 성장 배지 내에서 특정한 식물 호르몬(phytohormone)의 조작에 의존하며, 통상적으로 원하는 뉴클레오티드 서열과 함께 도입된 살생물제 및/또는 제초제 마커에 의존한다. 배양된 원형질체로부터의 식물 재생은 Evans et al., Protoplasts Isolation and Culture, Handbook of Plant Cell Culture, pp. 124-176, MacMillilan Publishing Company, New York, 1983; 및 Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985에 기재된다. 재생은 또한 식물 캘러스(callus), 외식편(explant), 기관, 또는 그의 부분들로부터 수득될 수 있다. 그와 같은 재생 기법이 Klee et al. Ann. Rev. of Plant Phys. 38:467-486 (1987)에 전반적으로 기재된다.
본 발명의 핵산은 본질적으로 임의의 식물에 원하는 특성을 부여하기 위해 이용될 수 있다. 따라서, 본 발명은 아나카르디움(Anacardium), 아라키스(Arachis), 아스파라거스(Asparagus), 아트로파(Atropa), 아베나(Avena), 브라시카(Brassica), 시트러스(Citrus), 시트룰러스(Citrullus), 카프시쿰(Capsicum), 카르타무스(Carthamus), 코코스(Cocos), 코페아(Coffea), 쿠쿠미스(Cucumis), 쿠쿠르비타(Cucurbita), 다우쿠스(Daucus), 엘라에이스(Elaeis), 프라가리아(Fragaria), 글리신(Glycine), 고시피움(Gossypium), 헬리안투스(Helianthus), 헤테로칼리스(Heterocallis), 호르데움(Hordeum), 히오스키아무스(Hyoscyamus), 락투카(Lactuca), 리눔(Linum), 롤리움(Lolium), 루피누스(Lupinus), 리코페르시콘(Lycopersicon), 말루스(Malus), 마니호트(Manihot), 마조라나(Majorana), 메디카고(Medicago), 니코티아나(Nicotiana), 올레아(Olea), 오리자(Oryza), 파니에움(Panieum), 판네세툼(Pannesetum), 페르세아(Persea), 파세올루스(Phaseolus), 피스타치아(Pistachia), 피숨(Pisum), 피루스(Pyrus), 프루누스(Prunus), 라파누스(Raphanus), 리시누스(Ricinus), 세칼(Secale), 세네시오(Senecio), 시나피스(Sinapis), 솔라눔(Solanum), 소르굼(Sorghum), 테오브로무스(Theobromus), 트리고넬라(Trigonella), 트리티쿰(Triticum), 비시아(Vicia), 비티스(Vitis), 비그나(Vigna), 및 제아(Zea) 속에 속하는 종을 포함한 다양한 식물에 대해 이용될 수 있다.
당업자는 발현 카세트가 형질전환 식물에 안정적으로 내포되고 작동가능한 것으로 확정된 후, 발현 카세트가 유성 교배에 의해 다른 식물로 도입될 수 있다는 것을 인식할 것이다. 다수의 표준 육종 기법들 중 임의의 기법이 교배대상 종에 따라 이용될 수 있다.
본 발명의 식물로부터 수득된 종자는 원하는 특성을 갖는 식물을 식별하기 위해 공지된 절차에 따라 분석될 수 있다. DYAD 유전자 발현을 제어하기 위해 안티센스 또는 기타 기법들이 이용되는 경우, 원하는 식물을 스크리닝하기 위해 RT-PCR 또는 노던 블롯 분석이 이용될 수 있다. 또한, 수정-독립적 생식 발생(fertilization independent reproductive development)의 존재가 검출될 수 있다. 예를 들면, 무배아 종자(embryo-free seed)형성하거나, 수정 후 발육되지 않는 종자를 형성하거나, 또는 수정의 부재 하에 과실을 형성하는 능력에 대해 식물체가 스크리닝될 수 있다. 이 절차는 부분적으로 이용될 특정 식물 종에 의존하나, 당업자에게 잘 알려진 방법에 따라 수행될 것이다.
하기의 실시예는 본 발명의 예시로서 제공되며 본 발명의 범위를 한정하는 것으로 해석되어서는 안 된다.
도 1은 dyad 돌연변이 식물에서 감소된 종자 세트를 나타낸다. 최빈값의 범위(modal range)는 식물당 1개 내지 10개의 종자이다.
도 2는 알렉산더 염색(Alexander staining)을 이용하여 dyad 돌연변이체 식물의 정상적인 화분 생존력을 나타낸다. (도 2A) 야생형. (도 2B) dyad.
도 3은 야생형 및 dyad 돌연변이체에서 웅성 및 자성 감수분열을 나타낸다. (도 3A-C) 야생형. (도 3D-F) dyad. (도 3A, D) 제1 감수분열의 종료(말기) 시 웅성 감수모세포. (도 3B, E) 사분염색체(tetrad) 기에 있는 웅성 감수모세포. (도 3C, F) 일차 후기(anaphase 1)에 있는 자성 감수모세포. dyad는 등수 웅성 감수분열(equational female meiosis)을 수행한다.
도 4는 이배체 dyad 돌연변이체 식물의 대표적 자손의 염색체 배수성을 나타 낸다. (도 4A) 15개의 염색체를 보여주는 삼배체 자손 식물의 체세포. (도 4B) 9:6 분리를 보이는 15개의 염색체를 갖는 삼배체 자손 식물에서 웅성 제1 감수분열. (도 4C) 10개의 염색체를 보이는 이배체 자손 식물의 체세포.
도 5는 보에케라 홀보엘리(Boechera holboelli) DYAD 상동체에 의한 dyad 돌연변이체의 상보작용(complementation)을 나타낸다: (도 5A) 신장되지 않은 장각과(unelongated siliques)를 보이는 dyad 돌연변이체. (도 5B) 종자를 함유한 신장된 장각과를 보이는, BhDYAD 유전자로 형질전환된 dyad 돌연변이체. (도 5C) dyad 돌연변이체 식물(1), 상보된 식물(2) 및 야생형 식물(3)로부터의 장각과의 비교. (도 5D) 완전한 종자 세트를 보이는, 절개된 장각과. (도 5E) 야생형 식물체로부터의 절개된 장각과.
도 6은 DYAD 조건부 상보작용 계통(conditional complementation line)을 구축하기 위해 이용된 pBI101.3::Dyad::(△)GR 카세트를 도시하는 다이아그램이다.
도 7은 실시예 6에 기재된 바와 같은 DYAD의 내생 좌(endogenous locus)의 유전형을 분석하기 위한 CAPS 다형성을 보여주는 폴리아크릴아미드 겔이다. 도 7A: KNEF/KNER 프라이머로 증폭된 생성물로부터의 HinF1 처리 단편들의 분리. 도 7B: KKF/KKR 프라이머로 증폭된 생성물로부터의 HinF1 처리 단편들의 분리.
도 8은 실시예 6에서 dyad 표현형의 조건부 상보작용을 보여준다.
도 8A: 덱사메타손 처리 전과 후의 신장되지 않은 장각과(dyad 표현형)를 보여주는 개화. 화살표는 처리의 개시시 가장 어린 개화된 꽃의 위치를 표시한다. 처리 개시 5-7일 후에, 장각과는 신장을 보였다(야생형 표현형). 도 8B: 덱사메타 손 처리 전 중성(sterile)(dyad) 표현형을 보이는 분리된 장각과. 도 8C: 덱사메타손 처리에 의한 조건부 상보작용 후 복구된 야생형 표현형. 도 8D: 덱사메타손 처리 후 완전한 종자 세트를 보이는 분열된 개화 장각과(split open silique).
도 9는 실시예 6의 dyad 표현형의 조건부 상보작용 후 배주의 형태를 보여준다.
도 9A: 덱사메타손 처리 전 성숙 배주 단계에서 dyad 표현형 및 배낭의 부재를 보이는 제거된 배주(cleared ovule). 도 9B: 덱사메타손 처리 후 복구된 배낭.
도 10은 dyad 돌연변이체에 의해 생산된 종자의 크기의 변이 및 이배체 애기장대 품종과 사배체 애기장대 품종 간의 상호교배(reciprocal cross)로부터 수득된 종자의 크기 차이를 도시한다.
도 1OA: 자가수분된 야생형 이배체 Col-O 식물로부터의 종자는 크기가 일정하게 정상이다. 도 1OB: 사배체 식물로부터의 종자. 도 1OC: 자가수분된 dyad 식물로부터의 종자 크기는 대형(L), 정상(N), 및 축소형(S) 간에 변했다. 도 10D: 모계 과잉(maternal excess) -- 이배체 웅성 식물에 교배된 사배체 자성 식물로부터의 종자는 축소형이다. 도 1OE: 부계 과잉(paternal excess) -- 이배체 자성 식물에 교배된 사배체 웅성 식물로부터의 종자는 모계 과잉 교배로부터의 종자에 비해 크기가 더 크다.
도 11은 http://www.ebi.ac.uk/clustalw에 있는 Clustal W에 디폴트 파라미터를 적용하여 이용한, 애기장대(서열번호 5), 보에케라(서열번호 18), 쌀(서열번호 51), 및 포플러(포풀러스 트리코카르파)(서열번호 26)로부터의 DYAD 단백질의 단백질 서열의 정렬을 보여준다.
도 12는 Clustal W (1.82)를 이용한, 추정적(putative) 옥수수 DYAD 폴리펩티드 서열(서열번호 55 및 54)과 쌀 DYAD 폴리펩티드 서열(서열번호 51)의 정렬을 도시한다. 도 12A: 쌀 DYAD의 1번 내지 147번 아미노산의 정렬. 도 12B: 쌀 DYAD의 317번 내지 803번 아미노산의 정렬.
도 13은 쌀로부터의 DYAD 폴리펩티드 서열의, DYAD-코딩 서열을 포함하는 것으로 확인된 두 개의 옥수수(Zea mays) 콘티그(contig)로의 맵핑을 도시한다.
실시예 1: dyad 돌연변이체는 불완전한 자성 수정 능력( fertility ) 및 감소된 종자 세트를 보인다.
EMS로 돌연변이 유발시킨(EMS mutagenized) M2 식물 중 애기장대의 중성(sterile) 돌연변이체의 스크리닝에서 dyad 돌연변이체를 분리하였다(Siddiqi I. et. al. Development Vol. 127(1): 197-207 (2000)). 상호교배에 의한 수정능력 분석은 상기 돌연변이체는 자성 불임이나 웅성은 수정능력을 가진다는 것을 보여주었다. 자성 포자형성 및 배주 발달의 분석은 dyad가 불완전 자성 감수분열을 수행하여 감수분열 세포 주기를 통한 불완전 진행 때문에 단일 감수분열 및 뒤이은 대다수의 배주에서 중단(arrest) 및 자성 생식세포의 발생 실패를 초래한다는 것을 나타냈다. 감수모세포의 염색체 전개(chromosome spread)의 관찰에 의한 자성 감수분열의 분석은 dyad 돌연변이체에서 자성 감수분열이 비정상이라는 것을 나타냈다: 염색체는 시냅시스에 실패하고 정상적으로 제1 감수분열에서 일어나는 감소 분 열 대신에, 등수 분열을 수행했다(Agashe B., Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)).
도 1에 도시된 바와 같이, dyad 돌연변이체에서 종자 세트(seed set)는 야생형에 비해 크게 감소되었고, 상이한 dyad 돌연변이 식물들 간에 종자 세트의 정도에서 변이를 관찰되었다. 종자 세트는 산발적이고 임의적이어서 갯수의 측면에서 집단 내의 식물들 간에 균일성이 관찰되지 않았다. 종자 세트의 양식은 식물당 1개 내지 10개이나, 드물게 관찰된(500개의 식물 중 하나) 최대 약 275개까지 변화했다.
실시예 2: dyad 돌연변이체에서 웅성 감수분열 및 수정능력은 정상이다.
알렉산더 염색을 이용하여 화분 생존력을 조사하고 화분이 완전히 생존력을 가지며 야생형과 유사한 것으로 확인하였다(도 2). 감수모세포의 염색체 전개의 분석에 의한 웅성 감수분열의 관찰은 웅성 감수분열이 정상이고 반수체 포자의 사세포체의 생성을 초래했다는 것을 보여주었다(도 3). 따라서, dyad 돌연변이체에서 웅성 감수분열, 웅성 수정능력, 및 화분 발달 및 기능은 정상이었다. 반면에, dyad에서 자성 감수분열은 비정상이었다. dyad에서 상동 염색체의 접합은 일어나지 않았고 야생형 자성 감수분열의 감소성 제1 감수분열(도 3C)은 등수 분열로 대체되었다(도 3E).
실시예 3: dyad 돌연변이체로부터 수득된 종자는 발아하여 삼배체 식물을 생 성한다.
dyad 돌연변이체에서 생성된 종자는 소수의 자성 감수모세포에서의 정상적인 감수분열로부터 유래되며, 이는 정상적인 기능성 배낭을 생성하고 그 후 반수체 화분에 의해 수정되고 종자로 발달되는 것이 가능하다. 상기의 경우라면, 이 종자들은 dyad 돌연변이체에서 일어나는 비정상적인 자성 감수분열로부터 벗어난 개체(escapee)일 것이다. 이 가능성을 조사하기 위해, dyad 식물체로부터의 종자(n=169)를 발아시키고 높은 효율성(>90%)으로 발아하며 비정상적인 모종(seedling)을 가져오는 일부(10%)를 제외하고는 형태학적으로 정상인 모종을 생산한다는 것을 확인했다. 발아하는 모종에서 형태, 대칭성 및 자엽의 수의 변이는 관찰되지 않았다. 이는 제1 감수분열에서 염색체의 무작위 분리를 수행하여 모종 단계에서 다양한 발달 이상(developmental abnormality)을 보이는 이수체(aneuploid) 자손의 보다 높은 비율을 초래하는 AtSpoll-1 및 AtDmcl과 같은 다른 감수분열 돌연변이체로부터 유래되는 모종과 대비된다(Grelon M. et al., The EMBO J., VoI 20: 589-600, 2001, Couteau F. et al., Plant Cell, Vol. 11(9): 1623-1634 , 1999). 토양으로 이식 후 뒤이은 모종의 영양 생장도 정상이었고 영양 생장이 야생형 및 부모 dyad 돌연변이체 식물과 유사한 식물로 성장했다. 관찰된 주요한 차이점은 식물이 추대(bolting)를 개시했을 때 꽃의 크기에 있었다. 대다수의 식물(n=41/52)에서, 야생형 대비 꽃 크기의 상당한 증가를 관찰하였다. 증가된 꽃 크기는 활력(vigour)의 증가 또는 유리한 환경적 영향에서 기인한 것일 수 있었다. 상기 식물체들은 제어된 환경에서 생장되었기 때문에, 본 발명자들은 후 자의 가능성을 배제했다. 꽃 기관 크기의 증가에 대한 다른 가능한 이유는 배수성의 증가일 수 있었다. 배수성의 증가는 영양 구조 및 꽃 구조, 특히, 화분립의 크기의 증가에 의해 나타난다(Altmann T., et al., Plant Cell Reports. Vol. 13: 652 - 656, 1994). 체세포 및 웅성 감수모세포에서 염색체의 분석에 의해 무작위로 채취된 식물로부터의 꽃눈을 대상으로 그들의 배수성 수준을 조사하였다. 감수분열 염색체 전개의 조사에 의해, 19개 중 17개의 (17/19) 경우에서, 상기 식물은 삼배체이고 나머지 2개는 이배체인 것으로 확인하였다(도 4). dyad 돌연변이체에서 화분 발달 및 웅성 감수분열은 정상이었으나, 감소형 자성 감수분열은 등수 분열로 치환되었기 때문에, 이 결과들은 삼배체인 종자의 대부분은 감소되지 않은(이배체) 난 세포의 정상적인 반수체 정자에 의한 수정으로부터 생성되며 소수의 배주에서 정상적인 자성 감수분열로부터 생성되는 것이 아니라는 것, 즉, 대다수의 종자는 비정상적인 감수분열로부터 벗어난 개체들(escapee)이 아니라는 것을 시사했다.
실시예 4: dyad 로부터 유래된 삼배체 식물은 모든 이형접합형 마커의 유지를 보여준다.
dyad 돌연변이체에서 형성된 삼배체 종자는 dyad에서 일어나는 등수 자성 감수분열과 일치되는, 정상적인 반수체 화분에 의한 감소되지 않은 배낭의 수정 생성물일 수 있다. 그와 같은 감소되지 않은 배낭이 염색체가 일가(univalent)이고 재조합을 수행하지 못하는 것인 거대포자 모세포의 등수 분열의 생성물로부터 유래되 는 감소되지 않은 거대포자로부터 형성되는 경우, 상기 감소되지 않은 배낭의 유전형은 이배체 부모 식물의 유전형과 동일할 것이다. 따라서, 부모 식물이 분자 마커에 대해 이형접합인 경우, 삼배체 자손도 그 마커에 대해 이형접합일 것이다. 동원체에 연관되지 않은 마커가 이형접합 조건에서 고려되는 경우, 재조합의 완전한 부재시 부모의 이형접합의 100% 전달이 결과적으로 생성된 자성 생식세포 및 삼배체 자손에서 달성될 것이다. 재조합 및 교배가 일어나는 경우, 결과적으로 생성된 삼배체 자손에서 100% 이형접합성이 유지되지 않을 것이다. 동원체에 연관되지 않은 마커의 경우, 감소되지 않은 배낭에서 33%의 빈도로 및 삼배체 자손에서 16.7%의 빈도로 동형접합을 예상할 수 있으며, 재조합의 완전한 부재시 동형접합체는 없을 것이다. 이형접합성의 상실 없이 감소되지 않는 배낭의 형성은 단위생식의 조작 및 잡종강세의 고정을 위해 매우 바람직하다. 본 발명자들은 마이크로새틀라이트(microsatellite)를 이용하여 dyad 돌연변이체 식물의 삼배체 자손들 중에서 이형접합성의 상실을 측정하였다. 야생형 Nossen (No-O)과 dyad 돌연변이체 Columbia (Col) 생태형 간 교배의 분리되는 F2 집단에서 dyad 돌연변이체 식물을 식별하였다. TAIR 데이터베이스(www.arabidopsis.org)로부터 5개의 애기장대 염색체 각각에 분포되고 동원체에 연관되지 않은 (>35 cM) 후보 마커들을 수득하였다. F2 집단을 생성하기 위해 이용된 부모 식물을 조사하여 다형성을 확인하고, 그 결과에 근거하여, 본 발명자들은 50개의 F2 dyad 돌연변이체 식물의 유전형을 결정하고 각 식물이 이형접합인 마커들을 확인하기 위해 4개의 상이한 염색체 상에 있는 5개의 상이한 마커들(표 1)을 선택하였다. 상기 50개의 F2 식물체로부터 개별적으 로 자가수분된 종자들을 회수하고 다양한 수의 동기(sibling)로 구성된 50개의 상이한 패밀리로 생장시켰다. 이는 50개의 패밀리에 분포된 총 196개의 식물을 생성했다. 부모 식물이 이형접합인 마커들에 대해 각 패밀리의 모든 구성식물의 유전형을 분석하여 각 마커에 대해 50개의 F2 패밀리 모두에 걸쳐 분포된 74개 내지 119개의 식물을 생성했다.
표 1 : 이형접합성의 상실 및 재조합을 측정하기 위한 dyad 식물의 자손의 마커 분석.
a제6열에 있는 괄호 안의 숫자는 해당 마커에 대해 분석된 전체 식물 대비 동형접합체의 백분율을 나타낸다.
마커 염색체 No. 연관도 상의 위치(cM) 동원체 위치(근사치)(cM) 분석된 식물의 수 동형접합체의 수a
nga168 2 73.77 15 119 11(9.24)
nga6 3 86.41 49 108 7(6.48)
nga162 3 20.5 49 74 8(10.81)
nga1107 4 104.73 28 107 11(10.28)
nga225 5 14.32 71 103 9(8.73)
스크리닝된 196개 식물 중에서, 본 발명자들은 부모 식물이 이형접합인 하나 이상의 마커에 대해 동형접합인 35개의 식물을 수득했다. 감수분열 염색체 전개를 수행하여 이 35개의 식물 중에서 22개의 배수성을 결정했다. 21개의 식물은 이배체이고 다른 하나는 13개의 염색체를 갖는 초이배체(hyperdiploid)로 확인되었다. 따라서, 분석에 따르면, 이형접합성의 상실은 거의 이배체에서만 관찰되었다. 이형접합성의 상실을 보이지 않은 식물 중에서, 별개의 F2 패밀리로부터 무작위로 15개의 식물을 선택하여 그들의 배수성을 조사했다. 15개의 식물체 모두 삼배체로 확인되었다.
따라서, 결과는 이배체 dyad 돌연변이체 식물로부터의 자손의 주요한 종류를 구성하는 삼배체에서 이형접합성의 상실이 없다는 것을 나타냈다. 삼배체에서 이형접합체의 상실를 확인하지 못한 것은 그들의 형성에 대한 대안적인 가능한 메카니즘, 이형접합성의 상실이 예측되는, 다정자수정(polyspermy), 즉, 두 개의 별개의 웅성 생식세포에 의한 반수체 자성 생식세포의 수정을 배제시켰다. 본 발명자들의 발견은 dyad 돌연변이체 식물의 삼배체 자손이 부모 식물의 유전형을 유지하는 감소되지 않은 배낭의 수정으로부터 유래된다는 것을 보여주었다. 감소되지 않은 배낭의 형성이 단위생식의 주요한 양태이다.
실시예 5: 보에케라 홀보엘리로부터의 DYAD 상동체의 분리 및 기능 규명( characterization )
Bho5Bam (서열번호 39) 및 Bho3Bam (서열번호 40) 프라이머를 이용하여, 통성(facultatively) 단위생식 보에케라 홀보엘리 수탁 이배체 그린랜드(Diploid Greenland) 및 삼배체 콜로라도(Triploid Colorado)(Naumova T. N., et al, Sex. Plant Reprod. Vol. 14: 195-200, 2001)로부터의 DYAD 상동체의 3 kB 게놈 코딩 영역을 클로닝하였다. BhDYAD 게놈 클론(서열번호 16)을 애기장대 DYAD 프로모터에 작동가능하게 연결하고 상보작용에 대해 테스트하기 위해 dyad 돌연변이체 식물을 형질전환하기 위해 사용하였다. 또한, BhDYAD cDNA를 증폭시키고 그 서열을 결정하였다(서열번호 17). 아그로박테리움 매개 인 플란타 진공 침투 형질전환( Agrobacterium mediated in planta vacuum infiltration transformation)은 dyad에 대해 이형접합인 F1 식물에 발현 작제물을 동원시켰다. 본 발명자들은 42개의 형질전환체를 수득했고, 이 중에서 9개의 형질전환체는 CAPS 및 dyad 좌의 측면에 접한(flank) 마이크로새틀라이트 마커에 의해 결정된 바와 같이 dyad 돌연변이체 대립형질에 대해 동형접합이었다(Agashe B, Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)). 상기 9개의 형질전환체 중에서, 4개의 형질전환체는 dyad 돌연변이체 표현형의 상보작용(complementation)을 보였고, 이는 완전한 종자 세트를 함유하는 것으로 확인된 잘 신장된 장각과(도 5)에 의해 판단될 수 있었다. 나머지 5개의 식물은 아마도 보조억제 때문에 중성(sterile)이었다.
애기장대 식물의 성장
dyad 돌연변이를 갖는 애기장대 변종이 이전에 개시되었다(Siddiqi I., et. al., Development. Vol. 127(1): 197-207 (2000)). 마이크로새틀라이트 마커 분석을 위해 이용된 F2 집단은 개시된 바와 같이 변종 No-O (Nossen ecotype)와 Col-O 생태형 배경의 dyad 돌연변이체 간의 교배로부터 유래되었다(Siddiqi L, et. al., Development. Vol. 127(1): 197-207 (2000)). 개시된 바와 같이 식물을 제어된 환경에서 생장시켰다(Siddiqi L, et. al., Development. Vol. 127(1): 197- 207 (2000)).
페트리 플레이트(Petri plate)에서 종자를 발아시키기 위해, 종자를 10분간 에탄올로 표면 살균시키고 뒤이어 그들을 5분간 0.025% 수은이염화물(mercuric chloride)로 처리하였다. 수은이염화물의 잔류물을 완전히 제거하기 위해 상기 종자들을 멸균수로 3회 세척하였다. 상기 종자를 미지근한 0.5% 상부 아가(top agar)에 재현탁시키고 2% 수크로오스가 보충된 MS 아가 플레이트(0.7%) 상에 균일하게 도말했다. 상기 플레이트를 층류 후드(laminar flow hood)에서 1시간 동안 건조시키고 상기 플레이트를 파라필름으로 밀봉하고 층화(stratification)를 위해 3일 동안 콜드 룸에서 4℃에 방치하였다. 그 후, 상기 플레이트를 배양 챔버로 옮겼다. 그 후 2주 후에 발아 빈도를 계수하였다.
화분에서 종자를 생장시키기 위해, 식물을 생장시키기 위해 사용된 합성 배지를 동일 비율의 소일라이트(Soilrite):페를라이트(Perlite):베르미큘라이트(Vermiculite)를 혼합하는 것에 의해 제조하였다(Keltech Energies Ltd., Karnataka 574 108, India). 상기 화분용 혼합물(pot mixture)을 모세관이 형성될 수 있도록 하부에 구멍이 있는 화분에 고르게 적용하고 상기 화분을 하기와 같은 주요 염(major salt)을 포함하는 1X MS 용액에 담궜다: 단위 리터당 CaCl2 (4mM), MgSO4 (1.5mM), KNO3 (18.8mM), NH4NO3 (20.6mM), KH2PO4 (1.25mM pH 5.6), 미량 염(Minor Salt)(H3BO3 (7OmM), MnC12 (14mM), CuSO4 (0.5mM), ZnSO4 (1mM), NaMoO4 (0.2mM), NaCl (1OmM), CoC12 (0.01mM)) 1 ml (1000X)에 첨가된 Fe-EDTA (2OmM)를 첨가했다. 종자를 화분의 표면상에 고르게 도말하고 사란(Saran) 랩으로 덮고 층화를 위해 4-8 ℃에서 3일간 방치하고 그 후, 배양 챔버로 옮겼다. 이식의 경우, 모종을 토양 매질로 옮긴 후 화분을 사란 랩으로 덮고 직접 배양 챔버에 배치했다. 일단 화분용 믹스에서 식물이 확립되면 사란 랩을 제거했다. 증류수를 이용하여 일정한 간격으로 물을 주었다.
종자 세트 분석
dyad 동형접합 식물에서 종자 세트의 빈도를 측정하기 위해 Col-O 생태형 배경에 dyad 돌연변이를 갖는 F2 분리 집단을 이용하였다. 식물이 꽃피는 것을 중단하는 최종 단계까지 dyad 돌연변이체 식물을 생장시켰다. 이 단계 후에, 물주기를 중단하고 장각과가 수확 성숙기에 도달하게 하였다. 그동안, 황색으로 되고 떨어지려는 가장 낮은 장각과가 개별적으로 벌어져 열렸고 종자가 있는 경우, 단일 식물 기준으로 종자를 수확했다. 또한, 종자 손실을 피하기 위해 일정한 간격으로 필요한 종자들을 수확했다. 최종적으로, 단일 식물 단위로 채집된 종자를 모아서 식물 당 총 종자의 수를 계수했다.
화분 생존력
개시된 바와 같이, 꽃밥에 있는 소포자(microspore)를 위한 생체 염색(vital staining)을 수행하였다(Alexander M. P., Stain Technol. Vol. 44(3): 117-122, 1971).
감수분열 전개( Meiotic Spreads)
개시된 바와 같이, 웅성 및 자성 감수분열 전개의 분석을 수행하였다(Agashe B, Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)).
식물 DNA 분리
마이크로새틀라이트 마커 분석을 위한 게놈 DNA를 약간 변형된, Dellaporta S. L., et al., Plant Mol. Bio. Rep., Vol. 1: 19-21 (1983)에 기재된 방법에 따라 분리하였다. 개별적인 식물로부터 약 500 mg의 잎 조직을 채취하여 1.5 ml 에펜도르프 튜브에 넣고 액화질소로 급속 동결시켰다. 그 후, 상기 조직을 미소막자(micropestle)를 이용하여 미세분말로 분쇄하였다. 이 분말에 200 ㎕의 새로 제조된 추출 완충액(100 mM Tris (pH 8), 50 mM EDTA, 500 mM NaCl, 1.4% SDS, 및 1OmM β-머캅토에탄올)을 첨가하고 미소막자로 곱게 균질화시켰다. 동일 부피의 2X CTAB를 첨가하고 상기 혼합물을 가볍게 볼텍싱하였다. 그 후, 상기 혼합물을 진탕 수조(shaking water bath)에서 65℃에서 5분간 인큐베이션하였다. 그 후, 시료를 냉각시키고 동일 부피의 24:1 클로로포름:이소아밀 알코올을 첨가하고 가볍게 혼합하고 1300 rpm에서 10분간 원심분리하였다. DNA를 포함하는 수성상을 새로운 에펜도르프 튜브로 옮기고 2/3 부피의 매우 차가운(ice-cold) 이소프로판올을 첨가하여 DNA를 침전시켰다. 4℃에서 13000 rpm으로 20분간 원심분리에 의해 DNA를 펠릿으로 침전시켰다. 상기 DNA 펠릿을 70% 에탄올로 세척하고 30분간 자연건조시키고 DNAase 불포함 RNAse (20 ug/ml)를 함유한 멸균수 또는 TE 완충액(pH 8.0) 50 ㎕에 현탁시켰다.
마커 분석
Col-O 및 No-O 생태형의 부모 조사(parental survey)에 근거하여, 4개의 상이한 염색체로부터 동원체에 알맞게 연관되지 않은 5개의 마이크로새틀라이트 마커를 선택하였다. 주어진 마커에 대해 이형접합인 dyad 식물을 선택하기 위해 이 마커들을 F2(No-O x Col-O (dyad)) 분리 집단에 이용하였다. 이 dyad 식물로부터의 종자를 채취하여 개별적인 페트리 플레이트에서 발아시켜 각 자손이 특정한 모 dyad 식물의 친족(sib)을 구성하게 하였다. 주어진 마커에 대해 이형접합인 다양한 식물로부터 친족에 대한 유사한 데이터를 마커 분석에서 함께 고려하였다.
마이크로새틀라이트 마커의 목록 및 그들의 위치가 표 1에 기재된다. 마이크로새틀라이트를 증폭시키기 위해 이용된 프라이머 서열은 TAIR 웹사이트 (www.arabidopsis.org)로부터 얻었다:
nga 162
ngal62F 서열번호 6
ngal62R 서열번호 7
nga225
nga225F 서열번호 8
nga225R 서열번호 9
ngal68
ngal68F 서열번호 10
ngal68R 서열번호 11
ngallO7
ngall07F 서열번호 12
ngall07R 서열번호 13
nga6
nga6F 서열번호 14
nga6R 서열번호 15
2 mM MgCl2, 0.2 mM의 각각의 dNTP, 1 유닛의 Taq DNA 폴리머라아제(Perkin-Elmer/Cetus), 및 5 pmole의 정방향 및 역방향 플랭킹 프라이머를 포함하는 1X PCR 완충액(Perkin Elmer)에서 55 ℃의 어닐링 온도 및 72 ℃에서 20초간의 신장으로 PCR을 수행하였다. PCR 생성물을 150V로 3시간 동안 8% 폴리아크릴아미드 겔 상에서 분리시키고 에티디움 브로미드(EtBr)로 염색하고 Syngene 겔 도큐멘테이션 시스템(Synoptics Inc. UK)으로 기록하였다.
식물 물질
보에케라 홀보엘리의 통성 단위생식 이배체 그린랜드 및 삼배체 콜로라도 기탁물은 Kim Boutilier에 의해 기증되었다(Naumova T. N., et al., Sex. Plant Reprod. Vol. 14: 195-200, 2001). 상기 식물을 애기장대에 대해 기재된 배지를 포함하는 화분에서 애기장대의 생장조건과 동일한 조건 하에서 생장시켰다
DYAD 프로모터의 클로닝
프라이머 pg2r4 (서열번호 48) 및 PDYBAM (서열번호 47)을 이용하여 Col-O 생태형으로부터 1.8 kb DYAD 프로모터 영역을 증폭시키고 그 생성물을 제조사의 설명서에 따라 pGEMT 벡터(Promega)에 클로닝시켰다.
보에케라 홀보엘리로부터 DYAD 상동체의 클로닝
보에케라 홀보엘리로부터의 애기장대 DYAD 상동체의 게놈 코딩 영역(BhDYAD)을 5' 말단에 BamH1 부위를 갖는 프라이머: Bho5BAM (서열번호 39) 및 Bho3BAM (서열번호 40)로 증폭시켰다. 결과물인 3kb 단편을 pGEMT에 클로닝시켰다.
애기장대 DYAD 프로모터 하에 BhDYAD 를 구동시키는 이중벡터 pCAMBIA1300 의 작제
BhDYAD를 3 kb BamH1 단편으로서 pGEMT로부터 분리시키고 식물 선택성 마커 히그로마이신을 갖는 pCAMBIA1300 벡터에 클로닝시켰다. 프라이머 BDY3 (서열번호 36) 및 OCSR (서열번호 38)을 이용하여 배향을 확인하였다. pGEMT 벡터로부터 SacI 단편으로서 1.6 kb DYAD 프로모터 영역(서열번호 22)을 분리시키고 pCAMBIA1300 벡터 내에 BhDYAD의 상류에 삽입시켰다. 프라이머 ismr4 (서열번호 37) 및 bdyl (서열번호 35)을 이용하여, BhDYAD 서열에 대한 프로모터의 배향을 확 인하였다.
삼조 교배( triparental mating)
전술된 바와 같이 구축된 이중 벡터 pCAMBIA의 아그로박테리움(AGL1)으로의 이전은 개시된 바와 같은 삼조 교배에 의해 수행하였다(Agashe B, Prasad C. K., and Siddiqi I , Development, Vol. 129(16): 3935-3943 (2002)).
애기장대 식물의 형질전환
BhDYAD의 상보작용 분석을 위해, Col-O x dyad의 F1 식물을 애기장대 DYAD 프로모터에 의해 구동되는 BhDYAD를 갖는 작제물로 형질전환시켰다. Bechtold N. and Pelletier G., Methods Mol. Biol., Vol. 82: 259-66 (1998)에 따라 아그로박테리움 매개 인 플란타 진공 침투 형질전환을 수행하였다.
형질전환체의 선택
진공 침투된 F1 식물로부터의 T0 종자를 0.8% 박토 아가(Bacto Agar), 1mM KN03 및 1% 수크로오스 및 20 ㎍/ml 히그로마이신을 포함하는 페트리 플레이트에 플레이팅하였다. 3일간 냉 층화(cold stratification) 후에, 상기 플레이트를 생장 챔버로 옮겼다. 이전 후 최소 5일 후에 잘 신장된 뿌리, 직립한 배축(erect hypocotyl) 및 잘 전개된 자엽형 잎(cotyledonary leaves)에 의해 히그로마이신에 내성을 갖는 형질전환체를 식별할 수 있다. 선택된 형질전환체를 히그로마이신을 포함하는 MS 플레이트로 옮기고, 저항성이 확립된 후, 그들을 최종적으로 토양 매질로 옮겼다. 또한, 식물체를 대상으로 앞서 기재된 바와 같이 bdy3 및 OCSR 프라이머를 이용하여 삽입물의 존재에 대해 확인하였다.
dyad 좌에서 접합자( zygosity )에 대한 유전자형 분석( genotyping )
분리되는 dyad F2 집단으로부터의 세 개의 유전형을 공동우성(codominant) CAPS 마커(Konieczny A. and Ausubel F. M., Plant J., Vol. 4(2): 403-410, 1993) 및 가변성 마이크로새틀라이트에 의해 확인하였다. dyad 돌연변이체 대립형질의 플랭킹 서열은 랜즈베르그 에렉타(Landsberg erecta) 생태형으로부터 유래되고 야생형 대립형질로부터의 플랭킹 서열은 콜럼비아(Columbia) 생태형 서열을 갖는다. 따라서, dyad 좌와 밀접하게 연관되고 그의 양쪽 측면에 위치한 CAP 마커(KNEF (서열번호 31) 및 KNER(서열번호 32), KKF(서열번호 33) 및 KKR(서열번호 34)) 및 DYAD에 밀접하게 연관된 마이크로새클라이트 마커 프라이머(KMF(서열번호 29) 및 KMR(서열번호 30))를 개발하기 위해 이 플랭킹 서열의 SNP를 이용하였다(Agashe B, Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)). 전술된 마커를 이용한 dyad 좌에서의 유전형 분석이 개시되었다(Agashe B, Prasad C. K., and Siddiqi L, Development Vol. 129(16): 3935-3943 (2002)).
RNA 분리 및 cDNA 합성
이배체 그린랜드 식물로부터 잘 발달된 단아(single bud)를 이용하여 제조사의 설명서에 따라 TriZol 시약(Invitrogen)에 의해 전체 RNA 분리를 수행하였다. cDNA 합성용 Superscript™ Choice 시스템(GIBCO BRL)을 이용하여 제1 가닥 cDNA 합성을 위해 4 ㎍의 전체 RNA를 사용하였다. 프라이머 5RF3(서열번호 41) 및 Bho3BAM (서열번호 40)을 이용하여 클로닝을 위해 상기 cDNA를 증폭시켰다. 결과물인 1.9 KB 단편을 pGEMT에 클로닝하고 서열을 결정하였다. 그 결과는 서열번호 17로 서열목록에 제시된다. 상응하는 DYAD 단백질의 아미노산 서열은 서열번호 18로 표시된다.
실시예 6: DYAD 의 조건부 대립형질의 작제 dyad 돌연변이체 표현형을 보이는 형질전환 식물의 동질적 집단의 개발
DYAD 유전자의 조건부 대립형질(conditional allel)을 작제하기 위해 이용된 전략은 랫트 글루코코르티코이드 수용체(GR)의 호르몬 결합 도메인(서열번호 27)의 DYAD의 C-말단으로의 융합 및 dyad 돌연변이체 대립형질에 대해 동형접합인 식물(dy/dy)의 게놈으로의 상기 융합 작제물의 통합에 근거한다. 스테로이드 호르몬의 부재시 GR 도메인은 세포질 국소화를 부여할 수 없으나, DYAD의 작용 부위는 핵에 있기 때문에 DYAD-GR 융합 단백질 스스로는 dyad 돌연변이체를 상보할 수 없다. 그러나, 스테로이드 호르몬의 존재 시, 상기 융합 단백질은 세포질 결합 부위로부터 방출되어 dyad 돌연변이체를 보완할 수 있는 핵으로 전이될 수 있게 된다. 상기 작제물을 구축하는 단계는 하기와 같다: 식물 이중 벡터 pBI101.3을 BamH1 및 SacI로 처리하여 GUS 리포터 유전자를 제거하고 이를 GR 도메인을 포함하는 BamH1-SacI 단편으로 치환한다(A.M. Lloyd et al., Science 266, 436-439 (1994)).
결과물인 플라스미드를 pBI101.3::GR로 명명하였다. 그 후, 프라이머 DyCF (서열번호 43) 및 DyPB (서열번호 42)(종결 코돈을 변형시키고 BamH1 및 PstI를 위한 제한효소 인식 부위를 도입하는 서열을 포함함)를 이용하여 DYAD 유전자의 304-bp C-말단 영역을 PCR로 증폭시켰다. 상기 변형된 서열을 Pl 클론 MFG13 (Ace No. AB025621)의 위치(coordinate) 9684 내지 3878에 해당하는 전체 DYAD 유전자를 포함하는 5.8 kb 게놈 클론(서열번호 28)을 갖는 pBS(KS)::Dyad 플라스미드에 216 bp PstI 단편으로 클로닝시켜 pBS(KS)::Dyad*를 생성했다. 결과물인 플라스미드는 그 종결 코돈 TGA가 GGG로 치환되고 상기 치환된 코돈을 따라 BamH1 부위를 갖는 DYAD 유전자를 포함했다. Sall 및 BamH1에 의한 처리 후에 pBSII(KS)::Dyad*로부터의 MFG13의 9684번 내지 9416번 뉴클레오티드를 포함하는 269 bp SalI-BamH1 단편을 pBI101.3::GR에 클로닝시켰다. 그 후, 9417-5335로부터의 DYAD의 나머지 부분을 pBS(KS)::Dyad*로부터의 BamH1- BamH1 단편으로서 GR 도멘인의 DYAD의 C-말단으로의 프레임 융합을 초래한 이전 단계의 생성물에 클로닝시켰다. pBI101.3::Dyad△GR로 명명된 최종 플라스미드가 도 6에 도시된다.
상기 작제물을 헬퍼 대장균 변종 HB101[pRK2013]을 이용한 삼조 교배에 의해 아그로박테리움 변종 AGL1으로 도입시켰다. T-DNA 영역을 인-플란타 형질전환에 의해 dyad 돌연변이체 대립형질(+/dy)에 대해 이형접합인 애기장대 식물(TO)로 형질전환시켰다(Bechtold N. and Pelletier G., Methods Mol. Biol., Vol. 82: 259- 66, 1998). 카나마이신(50 mg/리터)을 함유하는 MS 아가 플레이트 상에 종자를 플레이팅하는 것에 의해 카나마이신 저항성을 갖는 T1 모종을 선택하고 MS + 카나마이신 플레이트로 옮겨서 저항성 표현형을 확인하였다. DyCF (서열번호 43) 및 GRrev (서열번호 44) 프라이머를 이용한 PCR에 의해 형질전환체를 더 확인하였다. 확인된 카나마이신 저항성 모종들을 토양으로 옮기고 성체 단계까지 생장시켰다. 추대(bolting) 및 최초 8-10개의 장각과의 발달 후에, 식물에 10 μM 덱사메타손 + 0.015% Silwet L-77을 매일 분무하는 것 외에 3일 간격으로 10 μM 덱사메타손을 포함한 물을 주었다. 덱사메타손 처리 전에 불임을 보였던 여러 개의 식물이 덱사메타손 처리 개시 5-7일 후에 수정능력을 갖게 된다는 것이 주목되었다. 식물 물질의 일부를 서던 분석(Southern analysis)에 이용하여 삽입물의 카피 수를 결정하고 dyad 좌와 밀접하게 연관되고 이를 플랭킹하는 PCR 기반 CAPS 마커들을 이용하여 dyad 좌에 대해 유전형 분석을 수행하였다. dyad 돌연변이체는 원래 Ler 배경에서 분리되고 Col 변종으로 이입되었다. 따라서, CAPS 마커의 Ler 대립형질은 dyad 돌연변이체에 특징적이며, 반면에 Col 대립형질은 야생형을 나타낸다(도 7). 한 카피 이상의 dyad 돌연변이체 대립형질을 갖는 식물에서 단일 카피 삽입이 확인되었고 이 식물로부터의 종자를 MS + 카나마이신 플레이트 상에 플레이팅하였다. 카나마이신 저항성 모종을 토양으로 옮기고 dyad 좌에 대해 유전형을 분석하였다. dyad 돌연변이체 대립형질에 대해 동형접합인 식물을 식별하고 성체 단계까지 생장시켰다. 추대 후에, 초기부터 최초 8-10개의 꽃의 개화기까지 모든 식물에 물을 주고, 그 후, 전술된 바와 같이 덱사메타손을 함유한 용액으로 물을 주었다. 조 건부 불임(conditional sterility)을 보이는 계통들을 상이한 단일 카피 삽입(single copy insertion)을 스크리닝하는 것에 의해 식별하였다. 예로서, 도 8에 도시된 계통 No. 33은 생식 성장의 초기 동안 불임을 보이고 덱사메타손 처리 후 수정능력을 갖게 되는 dyad 돌연변이체 식물(dy/dy)를 생성했다. 덱사메타손 처리 전에 분리된 눈으로부터의 배주는 dyad 돌연변이체 표현형을 보였으나, 덱사메타손 처리 후에 분리된 눈으로부터의 배주는 야생형 표현형을 보였다(도 9). 동형접합 dyad 돌연변이체 식물로부터 종자를 채취하여 T3 패밀리를 생성하고 패밀리에 대한 스크리닝에서 DYAD-GR 삽입에 대해 동형접합인 T3 패밀리를 식별하였고, 이들은 모두 카나마이신 저항성 모종을 생성했다. 이 결과들은 일련의 조건(덱사메타손의 부재) 하에서 dyad 돌연변이체 표현형을 보이고 덱사메타손이 공급(또는 분무)되면 야생형 표현형을 보이는 식물을 생성하게 하는, DYAD의 조건부 대립형질의 작제 및 그의 식물로의 도입을 보여준다. 이 결과들은 또한 모두 dyad 돌연변이체 표현형을 보이는 식물의 동질적 집단의 개발을 가능하게 한다.
본 연구에서 이용된 글루코코르티코이드 수용체 도메인 서열 (914 bp) (서열번호 27)
Figure 112008048942605-PCT00001
pBS(KS)::Dyad에 Sal1 단편으로서의 클로닝을 위해 이용된 DYAD 게놈 서열 (5807 bp) (서열번호 28)
Figure 112008048942605-PCT00002
Figure 112008048942605-PCT00003
Figure 112008048942605-PCT00004
Figure 112008048942605-PCT00005
Figure 112008048942605-PCT00006
실시예 7: 삼배체(3n)인 dyad 돌연변이체의 자가수분 종자는 자성 배우체로부터의 이배체(2n) 기여를 포함한다.
사배체(4n) 야생형 애기장대와 이배체(2n) 야생형 애기장대 식물 간의 상호교배(reciprocal cross)를 수행하였다. 양 경우 모두에서, 생성된 종자는 삼배체였다. 그러나, 웅성 부모는 사배체이고 자성 부모는 이배체인 경우, 생성된 종자는 컸으나, 웅성 부모는 이배체이고 자성 부모는 사배체인 경우, 종자는 축소되었다. 이 결과들은 도 10에 도시되며 종자의 각 카테고리당 100개 종자의 중량(100-seed weight)은 표 2에 표시된다.
표 2: 다양한 교배의 식물로부터 수득된 100개 종자의 중량
종자 카테고리 종자 중량(㎍)
이배체 콜럼비아 야생형(WT) 종자 - 2142
사배체 랜즈베르그 에렉타 - 3352
이배체 콜럼비아 x 사배체 La-er ㎍ (부계 과잉) - 3004
사배체 La-er x 이배체 콜럼비아 (모계 과잉) - 1302
dyad 대형 카테고리 종자 - 3453
dyad 정상 카테고리 종자 - 2012
dyad 축소형 카테고리 종자 - 1379
이 결과들은 선행기술에서 알려진 것들을 재현한 것이다(Scott RJ et al., Development 125, 3329-3341, 1998). 임의의 메카니즘 이론에 의해 한정되지 않으면서, 종자 발달의 조절에서 부계 및 모계 게놈의 비등가성(nonequivalence)은 모든 종자 간에 자원의 균등한 분배를 제공하는 것에 의해 배아의 생장을 제한하는 모계 부모와 보다 많은 자원을 확보하는 것에 의해 적응도(fitness)가 증가되는 각각의 배아 간의 자원 분배에 대한 경쟁으로부터 일어나는 부모-자손 충돌 이론(parent-offspring conflict theory)(Haig D. and Westoby M., Am. Nat. Vol. 134: 147-155, 1989)에 따라 설명되었다. Haig D. and Westoby M., Am. Nat. Vol. 134: 147-155, 1989에 따르면, 배아에서 모계에 의해 발현되는(maternally expressed) 각인 유전자(imprinted gene)는 배아의 생장을 제한하기 위해 작용하나, 부계에 의해 발현되는 유전자는 증가된 배아의 생장의 촉진한다. 따라서, 여분의 부계 게놈 등가물(extra paternal genome equivalent)을 포함하는 종자는 배아의 생장을 촉진하는 유전자 생성물의 과량 때문에 정상보다 크며, 반면에 여분의 모계 게놈 등가물을 포함하는 종자는 배아의 생장을 한정하는 유전자 생성물의 과량 때문에 정상보다 더 작다.
dyad 돌연변이체의 자가수분 종자에서 모계 및 부계 기여를 파악하기 위해, 종자들을 크기에 대해 분석하였다. dyad 돌연변이체 식물로부터 수득된 자가수분 종자은 크기가 이질적이고 도 10에 도시된 바와 같이, 대형(large), 정상(normal) 및 축소형(shrunken)의 세 개의 카테고리로 분류되었다. 7개의 개별적인 dyad 돌연변이체 식물로부터의 크기 분류 분포는 하기와 같다:
표 3: dyad 돌연변이체 식물로부터의 종자의 크기 분류 분포:
식물 No. N L S
1. 18 7 79
2. 44 26 64
3. 25 25 36
4. 47 21 33
5. 46 5 52
6. 58 16 98
7. 16 6 37
합계 254 106 399
복수 개의 식물로부터 각 분류의 종자를 시료로 채취하고, 발아시키고 식물로 생장시켰다. 감수분열 전개(meiotic spread)에서 각 식물의 배수성을 염색체 수에 의해 결정하였다. 그 결과가 하기의 표 4에 표시된다:
표 4: 자가수분된 dyad 돌연변이체에서 각 종자 분류로부터의 식물의 배수성
카테고리 이배체 삼배체 사배체 기타(이수성)
축소형(shrunken) 2(4) 41(85) - 5(11)
대형(large) 26(72) 3(8.5) 3(8.5) 4(11)
정상(normal) 5(14) 26(76) - 4(10)
괄호 안의 숫자는 각 카테고리에서 조사된 총 식물 대비 백분율을 표시한다.
이 데이터는 대부분의 삼배체는 크기가 축소되며 종자의 축소형 카테고리의 대부분을 차지한다는 것을 보여준다. 대부분의 삼배체가 축소형이라는 관찰은 그들이 과다한 모계 기여(2n)로부터 생성되며 과다한 부계 기여로부터 생성되지 않아서, 삼배체에서 1n인 부계 기여를 갖는다는 것을 보여준다. 모든 삼배체가 부모의 이형접합성(parental heterozygosity)을 유지한다는 실시예 4의 결과와 함께, 이 결과들은 이형접합성의 유지가 모계 부모로부터 수득되며, 따라서 삼배체는 부모의 이형접합성을 유지한 감소되지 않은 자성 배우체로부터 생성된다는 것을 나타낸다.
dyad의 삼배체가 2n 자성 기여로부터 생성된다는 것을 확인하기 위해, 본 발명자들은 자성인 dyad 돌연변이체를 웅성인 계통 ETC60 (DYAD에 대해 야생형)에 교배시켜 F1 종자를 생성했다. ETC60 계통(미국특허출원 제10/857,539호에 개시됨)은 카나마이신 저항성 유전자를 갖는 Ds 트랜스포손의 단일 카피를 갖는다. F1의 야생형 이배체 식물에 대한 추가적인 교배 후 카나마이신 저항성의 분리를 추적하여, F1 식물에서 웅성 배우체로부터 배수성 기여를 결정할 수 있다. 제1 교배로부터의 종자를 발아시키고 모종을 토양으로 옮겼다. 6개의 F1 식물을 대상으로 카나마이신 저항성-특이적 프라이머(KanF 서열번호 49 및 KanR 서열번호 50)를 이용하여 카나마이신 저항성 유전자의 존재에 대해 테스트하고, 유전자-특이적 프라이머 GLTF (서열번호 46)와 조합된 트랜스포손 특이적 Ds5-2 프라이머(서열번호 45)를 이용하여 ETC60의 트랜스포손의 카피에 대해 테스트하였다. 6개의 식물 모두는 카나마이신 저항성을 갖는 Ds 요소에 대해 양성이었고 또한 DYAD의 야생형 카피를 포함하는 교배된 식물에 대해 예상되는 바와 같이 수정능력을 가졌다. 감수분열 염색체의 전개를 이용하여 상기 6개의 식물의 배수성을 조사하였다. 3개의 식물은 15개의 염색체를 갖는 삼배체이고, 2개의 식물은 16개의 염색체를 가졌으며, 1개의 식물은 17개의 염색체를 갖는 것으로 확인되었다. 이 결과는 자성 배우체가 감소되지 않은/초이배체(hyperdiploid) 포자로부터 생성되었을 가능성을 시사한다. 반 수체 화분에 의한 감소되지 않은 자성 생식세포의 수정은 카나마이신 저항성 유전자에 대해 단수성(simplex)일(Kkk) (근사(near)) 삼배체를 생성할 것이다. 대안적으로, 삼배체는 반수체 자성 생식세포의 감소되지 않은 웅성 생식세포에 의한 수정으로부터 생성되거나 또는 삼배체가 카나마이신 저항성 유전자에 대해 이수성(duplex)일(KKk), 두 개의 감소된 웅성 생식세포에 의한 수정으로부터 생성될 수 있다.
단수성 조건 식물(simplex condition plant)이 카나마이신 저항성을 갖지 않는 야생형 식물에 교배되는 경우, 결과물인 식물에서 카나마이신 저항성 대비 감수성의 분리비는 1:1일 것이다. 그러나, 이수성(duplex) 조건 식물이 야생형 식물에 교배되는 경우, 상기 분리비는 5:1일 것이다. 앞서 수득된 삼배체 식물 중 2개와 야생형 식물의 교배를 수행하고, 수득된 종자를 대상으로 카나마이신 저항성의 분리를 평가하였다. 표 5에 표시된 결과는 카나마이신 저항성에 대한 1:1 분리를 나타내어, 다정자 침입을 배제하고, 삼배체는 감소되지 않은 자성 배우체로부터 생성된다는 것을 보여준다.
표 5: 교배에서 KanR 표현형의 분리
종자의 총수 KanR 모종 KanS 모종 발아되지 않은 종자* χ2 테스트에 의한 적합도에 대한 통계적 유의성
식물 1 581 254 236 91 1:1**χ2 =0.660;P>0.01 NS 5:1***χ2 =240.18;P<<0.001 S
식물 2 321 121 132 68 1:1**χ2 =0.578;P>0.01 NS 5:1***χ2 =138.21;P<<0.001 S
* 상기 종자는 삼배체 부모의 이배체 부모에 대한 교배의 결과이기 때문에, 일부 종자는 이수성(aneuploidy)으로 인해 발아될 것으로 예상되지 않음.
** 1:1 비의 적합도(goodness of fit)에 대한 유의성 테스트는 발아되지 않은 종자를 제외하고 계산됨.
*** 5:1 비의 적합도에 대한 유의성 테스트는 KanR 카테고리에 발아되지 않은 종자를 포함시켜 계산됨. 이론적으로, 발아되지 않은 종자의 50%만이 각 카테고리에 포함되어야 하나(수득된 KanR and KanS 모종의 비에 근거하여), 유의성 수준을 증가시키기 위해, 본 발명자들은 전체 발아되지 않은 로트(lot)를 KanR 카테고리에 포함시킴. 이는 본 발명자들이 전체 발아되지 않은 로트(lot)를 KanR 카테고리에 포함시키더라고, 5:1 비에 대한 적합도가 유의하지 않고, 따라서 1:1 비만을 제공하는 조건을 강력하게 지지하는 것을 배제함.
S χ2 테스트에서 유의하며, 주어진 비를 따르지 않는다는 것을 나타냄.
NS χ2 테스트에서 유의하지 않으며, 주어진 비를 따른다는 것을 나타냄.
실시예 8: 포플러( 포플러스 트리코카르파 ( Populus trichocarpa ))로부터의 DYAD 유전자 및 코딩 서열
포플러로부터의 DYAD 유전자의 추가적인 예는 http://www.ornl.gov/sci/ipgc에서 찾을 수 있다.
cDNA 서열의 코딩 부분의 번역은 도 11에서 Clustal W 프로그램을 이용하여 아라비돕시스 탈리아나(Arabidopsis thaliana)로부터의 야생형 DYAD 단백질의 아미노산 서열에 비교된 아미노산 서열을 제공한다.
http://www.ornl.gov/sci/ipgc에 있는 AtDyad 상동체 포플러스 트리코카르파(Populus trichocarpa)
게놈 영역(서열번호 24)
엑손
인트론
최초 ATG의 상류 2444 bp 포함
Figure 112008048942605-PCT00007
Figure 112008048942605-PCT00008
Figure 112008048942605-PCT00009
Figure 112008048942605-PCT00010
Figure 112008048942605-PCT00011
데이터베이스에 있는 전사체/CDS(2493 bp)(서열번호 25)
Figure 112008048942605-PCT00012
Figure 112008048942605-PCT00013
데이터베이스에 있는 단백질 서열(83O aa) (서열번호 26)
>eugene3.00030791 [Poptr1:554158]
Figure 112008048942605-PCT00014
실시예 9: 옥수수 DYAD 폴리뉴클레오티드 및 폴리펩티드의 식별
웹사이트(www.plantgdb.org)에서 TBLASTN 및 쌀 DYAD 단백질(서열번호 51)을 질의(query)로 이용한 검색은 콘티그 ZmGSStucl1-12-04.1016.1(서열번호 52) 및 ZmGSStucl1-12-04.1016.2 (서열번호 53)에 해당하는 옥수수 게놈의 영역 내에 추정적인(putative) DYAD 유전자의 존재를 밝혔다. 수동 편집(manual editing)과 함께 GENSCAN (http://genes.mit.edu)을 이용한 상기 영역의 주석(annotation)은 쌀 DYAD 폴리펩티드 서열과 정렬될 수 있는 추정적인 옥수수 폴리펩티드 서열의 확인을 가져왔다(도 12). 본 발명은 상기 옥수수 폴리펩티드 서열 및 상기 폴리펩티드를 코딩하는 폴리뉴클레오티드 서열의 용도를 포괄한다.
제아 마이스(Z. mays)로부터 수득된 폴리펩티드 서열을 하기의 뉴클레오티드 위치(coordinate)에 의해 표시된 바와 같이 콘티그 뉴클레오티드 서열에 맵핑시켰다. 상기 콘티그 서열에 의해 코딩된 조립된 부분적 Zm DYAD 폴리펩티드 서열도 표시된다.
ZmGSStucl1-12-04.1016.1(서열번호 52) 위치 및 개념적 번역(conceptual translation)
Figure 112008048942605-PCT00015
Z. mays 조립된 폴리펩티드: (서열번호 54)
Figure 112008048942605-PCT00016
ZmGSStucl1-12-04.1016.2(서열번호 53) 위치 및 개념적 번역
774 MSLFIS 757; 574 KPQVKK......PTYHA 418;315 GAFYEID......SIRVVK 237; 144 VSECTN......SNHAAR l;
Z. mays 조립된 폴리펩티드: (서열번호 55)
Figure 112008048942605-PCT00017
실시예 10: 단위생식을 위한 일반적인 절차
최적 방사선조사량의 결정:
1. 이용될 자성 부모 식물과 동일한 종 또는 관련된 종의 웅성 부모 식물로부터 꽃밥을 채취하고 1, 5, 10, 20, 30, 50, 70, 100, 150, 200 krad을 포함하는 조사량 범위에서 이온화 방사선으로 조사한다.
2. DNA 마커(마이크로새틀라이트, CAPS, 또는 RAPD)에 대해 하나 이상의 열성 표현형 마커를 갖는다는 점에서 상기 조사된 화분 부모와 상이한 자성 식물로부터의 자성 꽃 또는 수술이 제거된(emasculated) 꽃을 수분시킨다. 바람직하게는,이온화 방사선의 각 조사량 당 수분을 위해 10-50개의 꽃을 이용한다.
3. 수분된 꽃으로부터 종자를 채취하고 동일한 조사량이 조사된 화분으로 수분된 꽃으로부터의 종자를 합친다.
4. 종자를 발아시키고 식물로 생장시켜, 각 조사량 당 약 20-100개의 식물을 생성한다.
5.표현형 마커 또는 DNA 마커에 대해 식물의 유전형을 평가하고 모계 부모를 닮은 식물의 비율을 계산한다.
6. 높은 비율의 살아있는 식물 및 높은 비율의 모계 부모를 닮은 식물의 최적 조합을 생성하는 조사량을 선택한다.
dyad 돌연변이체 식물에서 단위생식의 유도:
1. 전술된 바와 같이 결정된 적합한 조사량의 이온화 방사선을 이용하여 조사된 화분으로 dyad 돌연변이체 식물을 수분시킨다.
2. 종자를 채취한다.
3. 종자를 발아시켜 식물로 생장시킨다.
단위생식 식물의 식별:
1. 자성 부모에 의해 운반되는 열성 표현형 마커에 대해 식물을 평가한다. 상기 열성 표현형을 보이는 식물을 단위생식에 의한 것(parthenogenetic)으로 분류한다. 또한, 식물을 식물 조직으로부터 DNA를 분리하고 다형성 마커(polymorphic marker)에 대해 DNA를 분석하는 것에 의해 DNA 마커에 대해 평가할 수 있다. 자성 부모의 특징적인 마커 패턴을 보이고 웅성 부모에 대한 마커 밴드를 갖지 않는 식물을 단위생식에 의한 것으로 분류한다. 따라서, 수분 실험으로부터의 단위생식성 식물의 백분율이 계산될 수 있다.
2. 단위생식성 식물을 자성 부모가 이형접합인 마커에 대해 조사할 수 있다. 자성 dyad 돌연변이 부모가 이형접합인 모든 마커에 대해 이형접합성을 유지하는 식물은 무성생식에 의한 식물(apomictic) 식물이다.
상이한 작물 종에 대해 이용될 수 있는 가능한 분자 마커들에 대한 참조문헌들이 하기에 열거된다:
밀:
www.gramene.org
1. Torada et al. (2006). SSR-based linkage map with new markers using an intraspecif[iota]c population of common wheat. Theor Appl Genet. 2006 Apr;112(6):1042-51.
2. Song et al. (2005). Development and mapping of microsatellite (SSR) markers in wheat. Theor Appl Genet. 2005 Feb;110(3):550-60.
쌀:
www.gramene.org
1. Harushima et al. (1998). A high-density rice genetic linkage map with 2275 markers..." Genetics 148: 479-494.
2. Causse et al. (1994). Saturated molecular map of the rice genome based on an interspecific backcross population. Genetics. 1994 Dec;138(4):1251-74.
옥수수: Coe et al. (2002). "Access to the maize genome: an integrated physical and genetic map". Plant Physiol. 128: 9-12.
www.gramene.org
보리: www.gramene.org
Wenzl et al. (2006). A high-density consensus map of barley linking DArT markers to SSR, RFLP and STS loci and agricultural traits. BMC Genomics. 2006 Aug 12;7(l):206
귀리: www , gramene . org
De Koeyer et al. (2004). A molecular linkage map with associated QTLs from a hulless x covered spring oat population. Theor Appl Genet. 2004 May;108(7):1285-98.
진주 조(Pearl millet): www. gramene . org
An integrated genetic map and a new set of simple sequence repeat markers for pearl millet, Pennisetum glaucum. Theor Appl Genet. 2004 Nov;109(7):1485-93.
수수: Chittenden et al. (1994). "A detailed RFLP map of Sorghum bicolor ...". Theor. Appl. Genet. 87: 925-933.
꽃양배추(Brassica oleracea): Bohuon et al. (1998). "Comparison of a Brassica oleracea genetic map with the genome of Arabidopsis thaliana". Genetics 150: 393-401.
적갓(Brassica juncea): Pradhan et al. (2003). A high-density linkage map in Brassica juncea (Indian mustard) using AFLP and RFLP markers. Theor Appl Genet. 2003 Feb;106(4):607-14.
유채(Brassica napus): Piquemal et al. (2005). Construction of an oilseed rape (Brassica napus L.) genetic map with SSR markers. Theor Appl Genet. 2005 Nov;l 11(8):1514-23.
순무(Brassica rapa): Kole et al. (1997). Genetic linkage map of a Brassica rapa recombinant inbred population. J. Hered. 88:553-557
면화(Cotton): Rong et al. (2004). "A 3347-locus genetic recombination map ..." Genetics 166: 389-417.
토마토: Zhang et al. (2002). A molecular linkage map of tomato displaying chromosomal locations of resistance gene analogs based on a Lycopersicon esculentum x Lycopersicon hirsutum cross. Genome 2002 Feb;45(l): 133-46.
가지: Doganlar et al. (2002)A comparative genetic linkage map of eggplant(Solanum melongena) and its implications for genome evolution in the solanaceae. Genetics 161(4):1697-711
고추(Capsicum): Genome mapping in capsicum and the evolution of genome structure in the solanaceae. Genetics 152(3): 1183-202.
감자: Tanksley et al. (1992). High density molecular linkage maps of the tomato and potato genomes. Genetics 132(4): 1141-1160.
대두: Ferreira et al. (2000). Soybean genetic map of RAPD markers assigned to an existing scaffold RFLP map. J. Hered. 91(5): 392-396.
포플러(Populus): Yin et al. (2001). Preliminary interspecific genetic maps of the populus genome constructed from RAPD markers. Genome 2001 Aug;44(4):602-9.
Tuskan et al. (2004). Characterization of microsatellites revealed by genomic sequencing of Populus trichocarpa. Canadian J. Forest Res. 34(1): 85-93.
플라스미드 pBI101.3::Dyad△GR로 형질전환된 대장균 변종 DH5α의 시료를 국제 기탁 기구(International Depository Authority), MTCC(Microbial Type Culture Collection) 및 Gene Bank, IMTECH(Institute of Microbial Technology), CSIR(Council of Scientific and Industrial Research)(Sector-39A, Chandigarh - 160 036, India)에 기탁하였다. 상기 시료를 2006년 12월 1일에 기탁하여 Internal Reference No. BI507를 지정받았다. 웅성인 dyad 돌연변이체와 야생형 자성 식물의 교배로부터 수득되고 dyad 돌연변이체에 대해 분리되는 F2 집단의 2500개 이상의 종자를 포함하는 시료를 American Type Culture Collection (Manassas, VA20108, USA)에 기탁하였다. 상기 시료를 2006년 12월 1일에 기탁하여 Internal Reference No. ISDYF2C를 지정받았다. dyad 및 Dyad△GR 삽입에 대해 동형접합이고 덱사메타손에 대한 반응에서 조건부 수정능력을 보이는 2500개 이상 의 종자(계통 번호 33으로부터 유래)를 포함하는 시료를 ATCC)American Type Culture Collection)(Manassas, VA20108, USA)에 기탁하였다. 상기 시료를 2006년 12월 1일에 기탁하여 Internal Reference No. 33-5DYGR을 지정받았다.
과학 정기간행물 및 특허 문헌의 다양한 게재물이 본 명세서에서 인용된다. 그와 같은 각각의 게재물은 이에 의해 참조로 그 전체가 그와 같은 이용을 위한 모든 목적을 위해 본 명세서에 포함된다.
SEQUENCE LISTING <110> SIDDIQI, Imran <120> NUCLEIC ACIDS AND METHODS FOR PRODUCING SEEDS HAVING A FULL DIPLOID COMPLEMENT OF THE MATERNAL GENOME IN THE EMBRYO <130> 2761-0127PUS1 <160> 55 <170> PatentIn version 3.3 <210> 1 <211> 1979 <212> DNA <213> Arabidopsis dyad <220> <221> CDS <222> (31)..(1587) <400> 1 gaggaacgaa gattatcgag agcaaaaatc atg agt agt acg atg ttc gtg aaa 54 Met Ser Ser Thr Met Phe Val Lys 1 5 cgg aat ccg att aga gaa acc acc gcc ggg aaa atc tct tcg ccg tcg 102 Arg Asn Pro Ile Arg Glu Thr Thr Ala Gly Lys Ile Ser Ser Pro Ser 10 15 20 tca ccg act ttg aat gtt gca gtc gcg cat ata aga gct gga tct tat 150 Ser Pro Thr Leu Asn Val Ala Val Ala His Ile Arg Ala Gly Ser Tyr 25 30 35 40 tac gaa atc gat gct tcg att ctt cct cag aga tcg ccg gaa aat ctt 198 Tyr Glu Ile Asp Ala Ser Ile Leu Pro Gln Arg Ser Pro Glu Asn Leu 45 50 55 aaa tcg att aga gtc gtc atg gtg agc aaa atc acg gcg agt gac gtg 246 Lys Ser Ile Arg Val Val Met Val Ser Lys Ile Thr Ala Ser Asp Val 60 65 70 tct ctc cgg tac cca agc atg ttt tca ctc cga tcg cat ttc gat tac 294 Ser Leu Arg Tyr Pro Ser Met Phe Ser Leu Arg Ser His Phe Asp Tyr 75 80 85 agt agg atg aac cgg aat aaa ccg atg aag aag agg agt ggt ggt ggt 342 Ser Arg Met Asn Arg Asn Lys Pro Met Lys Lys Arg Ser Gly Gly Gly 90 95 100 ctt ctt cct gtt ttc gac gag agt cat gtg atg gct tcg gag cta gct 390 Leu Leu Pro Val Phe Asp Glu Ser His Val Met Ala Ser Glu Leu Ala 105 110 115 120 gga gac ttg ctt tac aga aga atc gca cct cat gaa ctt tct atg aat 438 Gly Asp Leu Leu Tyr Arg Arg Ile Ala Pro His Glu Leu Ser Met Asn 125 130 135 aga aat tcc tgg ggt ttc tgg gtt tct agt tct tct cgc agg aac aaa 486 Arg Asn Ser Trp Gly Phe Trp Val Ser Ser Ser Ser Arg Arg Asn Lys 140 145 150 ttt cca aga agg gag gtg gtt tct caa ccg gcg tac aat act cgt ctc 534 Phe Pro Arg Arg Glu Val Val Ser Gln Pro Ala Tyr Asn Thr Arg Leu 155 160 165 tgt cgc gct gct tca ccg gag gga aag tgc tcg tct gag ctg aaa tcg 582 Cys Arg Ala Ala Ser Pro Glu Gly Lys Cys Ser Ser Glu Leu Lys Ser 170 175 180 gga ggg atg atc aag tgg gga agg aga ttg cgt gtg cag tat cag agt 630 Gly Gly Met Ile Lys Trp Gly Arg Arg Leu Arg Val Gln Tyr Gln Ser 185 190 195 200 cgg cat att gat act agg aag aat aag gaa ggt gag gag agt tct aga 678 Arg His Ile Asp Thr Arg Lys Asn Lys Glu Gly Glu Glu Ser Ser Arg 205 210 215 gtg aag gat gaa gtt tac aaa gaa gaa gag atg gag aaa gaa gag gat 726 Val Lys Asp Glu Val Tyr Lys Glu Glu Glu Met Glu Lys Glu Glu Asp 220 225 230 gat gat gat ggg aat gaa ata gga ggc act aaa caa gag gca aag gag 774 Asp Asp Asp Gly Asn Glu Ile Gly Gly Thr Lys Gln Glu Ala Lys Glu 235 240 245 ata act aat gga aat cgt aag aga aag ctg att gaa tca agt act gag 822 Ile Thr Asn Gly Asn Arg Lys Arg Lys Leu Ile Glu Ser Ser Thr Glu 250 255 260 aga ctc gct cag aaa gct aag gtt tat gat cag aag aag gaa act caa 870 Arg Leu Ala Gln Lys Ala Lys Val Tyr Asp Gln Lys Lys Glu Thr Gln 265 270 275 280 att gtg gtt tat aag agg aaa tca gag agg aag ttc att gat aga tgg 918 Ile Val Val Tyr Lys Arg Lys Ser Glu Arg Lys Phe Ile Asp Arg Trp 285 290 295 tct gtt gag agg tac aaa cta gct gag agg aac atg tta aaa gtg atg 966 Ser Val Glu Arg Tyr Lys Leu Ala Glu Arg Asn Met Leu Lys Val Met 300 305 310 aag gag aag aat gca gtg ttt ggc aac tcc ata ctc agg cca gag ttg 1014 Lys Glu Lys Asn Ala Val Phe Gly Asn Ser Ile Leu Arg Pro Glu Leu 315 320 325 agg tca gaa gca agg aag ctg att ggt gac aca ggt cta ttg gat cat 1062 Arg Ser Glu Ala Arg Lys Leu Ile Gly Asp Thr Gly Leu Leu Asp His 330 335 340 ctg ctt aag cac atg gct ggt aag gtg gct cct gga ggt caa gat agg 1110 Leu Leu Lys His Met Ala Gly Lys Val Ala Pro Gly Gly Gln Asp Arg 345 350 355 360 ttt atg aga aag cac aat gca gat ggg gca atg gag tat tgg ttg gag 1158 Phe Met Arg Lys His Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu 365 370 375 agt tct gat ttg att cac ata agg aaa gaa gca gga gtt aaa gat cct 1206 Ser Ser Asp Leu Ile His Ile Arg Lys Glu Ala Gly Val Lys Asp Pro 380 385 390 tac tgg act cct cca cct ggt tgg aag ctt ggt gac aac cct tct caa 1254 Tyr Trp Thr Pro Pro Pro Gly Trp Lys Leu Gly Asp Asn Pro Ser Gln 395 400 405 gat cct gtc tgc gct gga gaa atc cgt gac atc aga gaa gaa tta gct 1302 Asp Pro Val Cys Ala Gly Glu Ile Arg Asp Ile Arg Glu Glu Leu Ala 410 415 420 agc ctg aaa aga gaa ttg aag aaa ctt gcg tca aag aag gaa gag gag 1350 Ser Leu Lys Arg Glu Leu Lys Lys Leu Ala Ser Lys Lys Glu Glu Glu 425 430 435 440 gag ctt gtt atc atg act acg cct aat tct tgt gtt act agt cag aat 1398 Glu Leu Val Ile Met Thr Thr Pro Asn Ser Cys Val Thr Ser Gln Asn 445 450 455 gat aat ctg atg act cca gca aag gaa atc tac gct gat ctg ctg aaa 1446 Asp Asn Leu Met Thr Pro Ala Lys Glu Ile Tyr Ala Asp Leu Leu Lys 460 465 470 aag aaa tac aaa att gag gac cag cta gtg att att gga gaa acc ttg 1494 Lys Lys Tyr Lys Ile Glu Asp Gln Leu Val Ile Ile Gly Glu Thr Leu 475 480 485 cgt aaa atg gag gaa gac atg gga tgg ctt aag aaa aca gtg gac gag 1542 Arg Lys Met Glu Glu Asp Met Gly Trp Leu Lys Lys Thr Val Asp Glu 490 495 500 aac tat cct aaa aac cag act caa cag aga cac ctt tgc tac tag 1587 Asn Tyr Pro Lys Asn Gln Thr Gln Gln Arg His Leu Cys Tyr 505 510 515 aggattcacc accaatacag acactagaag gagaagtgaa ggtggtgaac aagggtaacc 1647 aaatcacaga gtcacctcaa aacagagaaa aaggaaggaa gcatgatcaa caagaaagat 1707 caccactttc actaataagc aacactggtt tcagaatctg caggcctgtg gggatgttcg 1767 catggcccca attgcctgct cttgctgctg ctactgatac taatgcttct tcgccaagtc 1827 acagacaagc ctacccatcc ccttttccag tcaagccact tgcagctaag cgtcctcttg 1887 gcttgacgtt tcccttcacc atcatacccg aagaagctcc caagaatctc ttcaacgttt 1947 gaagttgtca ctggaaactg atgcatcaga tc 1979 <210> 2 <211> 1527 <212> DNA <213> Arabidopsis <400> 2 atgagtagta cgatgttcgt gaaacggaat ccgattagag aaaccaccgc cgggaaaatc 60 tcttcgccgt cgtcaccgac tttgaatgtt gcagtcgcgc atataagagc tggatcttat 120 tacgaaatcg atgcttcgat tcttcctcag agatcgccgg aaaatcttaa atcgattaga 180 gtcgtcatgg tgagcaaaat cacggcgagt gacgtgtctc tccggtaccc aagcatgttt 240 tcactccgat cgcatttcga ttacagtagg atgaaccgga ataaaccgat gaagaagagg 300 agtggtggtg gtcttcttcc tgttttcgac gagagtcatg tgatggcttc ggagctagct 360 ggagacttgc tttacagaag aatcgcacct catgaacttt ctatgaatag aaattcctgg 420 ggtttctggg tttctagttc ttctcgcagg aacaaatttc caagaaggga ggtggtttct 480 caaccggcgt acaatactcg tctctgtcgc gctgcttcac cggagggaaa gtgctcgtct 540 gagctgaaat cgggagggat gatcaagtgg ggaaggagat tgcgtgtgca gtatcagagt 600 cggcatattg atactaggaa gaataaggaa ggtgaggaga gttctagagt gaaggatgaa 660 gtttacaaag aagaagagat ggagaaagaa gaggatgatg atgatgggaa tgaaatagga 720 ggcactaaac aagaggcaaa ggagataact aatggaaatc gtaagagaaa gctgattgaa 780 tcaagtactg agagactcgc tcagaaagct aaggtttatg atcagaagaa ggaaactcaa 840 attgtggttt ataagaggaa atcagagagg aagttcattg atagatggtc tgttgagagg 900 tacaaactag ctgagaggaa catgttaaaa gtgatgaagg agaagaatgc agtgtttggc 960 aactccatac tcaggccaga gttgaggtca gaagcaagga agctgattgg tgacacaggt 1020 ctattggatc atctgcttaa gcacatggct ggtaaggtgg ctcctggagg tcaagatagg 1080 tttatgagaa agcacaatgc agatggggca atggagtatt ggttggagag ttctgatttg 1140 attcacataa ggaaagaagc aggagttaaa gatccttact ggactcctcc acctggttgg 1200 aagcttggtg acaacccttc tcaagatcct gtctgcgctg gagaaatccg tgacatcaga 1260 gaagaattag ctagcctgaa aagagaattg aagaaacttg cgtcaaagaa ggaagaggag 1320 gagcttgtta tcatgactac gcctaattct tgtgttacta gtcagaatga taatctgatg 1380 actccagcaa aggaaatcta cgctgatctg ctgaaaaaga aatacaaaat tgaggaccag 1440 ctagtgatta ttggagaaac cttgcgtaaa atggaggaag acatgggatg gcttaagaaa 1500 acagtggacg agaactatcc taaataa 1527 <210> 3 <211> 508 <212> PRT <213> Arabidopsis <400> 3 Met Ser Ser Thr Met Phe Val Lys Arg Asn Pro Ile Arg Glu Thr Thr 1 5 10 15 Ala Gly Lys Ile Ser Ser Pro Ser Ser Pro Thr Leu Asn Val Ala Val 20 25 30 Ala His Ile Arg Ala Gly Ser Tyr Tyr Glu Ile Asp Ala Ser Ile Leu 35 40 45 Pro Gln Arg Ser Pro Glu Asn Leu Lys Ser Ile Arg Val Val Met Val 50 55 60 Ser Lys Ile Thr Ala Ser Asp Val Ser Leu Arg Tyr Pro Ser Met Phe 65 70 75 80 Ser Leu Arg Ser His Phe Asp Tyr Ser Arg Met Asn Arg Asn Lys Pro 85 90 95 Met Lys Lys Arg Ser Gly Gly Gly Leu Leu Pro Val Phe Asp Glu Ser 100 105 110 His Val Met Ala Ser Glu Leu Ala Gly Asp Leu Leu Tyr Arg Arg Ile 115 120 125 Ala Pro His Glu Leu Ser Met Asn Arg Asn Ser Trp Gly Phe Trp Val 130 135 140 Ser Ser Ser Ser Arg Arg Asn Lys Phe Pro Arg Arg Glu Val Val Ser 145 150 155 160 Gln Pro Ala Tyr Asn Thr Arg Leu Cys Arg Ala Ala Ser Pro Glu Gly 165 170 175 Lys Cys Ser Ser Glu Leu Lys Ser Gly Gly Met Ile Lys Trp Gly Arg 180 185 190 Arg Leu Arg Val Gln Tyr Gln Ser Arg His Ile Asp Thr Arg Lys Asn 195 200 205 Lys Glu Gly Glu Glu Ser Ser Arg Val Lys Asp Glu Val Tyr Lys Glu 210 215 220 Glu Glu Met Glu Lys Glu Glu Asp Asp Asp Asp Gly Asn Glu Ile Gly 225 230 235 240 Gly Thr Lys Gln Glu Ala Lys Glu Ile Thr Asn Gly Asn Arg Lys Arg 245 250 255 Lys Leu Ile Glu Ser Ser Thr Glu Arg Leu Ala Gln Lys Ala Lys Val 260 265 270 Tyr Asp Gln Lys Lys Glu Thr Gln Ile Val Val Tyr Lys Arg Lys Ser 275 280 285 Glu Arg Lys Phe Ile Asp Arg Trp Ser Val Glu Arg Tyr Lys Leu Ala 290 295 300 Glu Arg Asn Met Leu Lys Val Met Lys Glu Lys Asn Ala Val Phe Gly 305 310 315 320 Asn Ser Ile Leu Arg Pro Glu Leu Arg Ser Glu Ala Arg Lys Leu Ile 325 330 335 Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met Ala Gly Lys 340 345 350 Val Ala Pro Gly Gly Gln Asp Arg Phe Met Arg Lys His Asn Ala Asp 355 360 365 Gly Ala Met Glu Tyr Trp Leu Glu Ser Ser Asp Leu Ile His Ile Arg 370 375 380 Lys Glu Ala Gly Val Lys Asp Pro Tyr Trp Thr Pro Pro Pro Gly Trp 385 390 395 400 Lys Leu Gly Asp Asn Pro Ser Gln Asp Pro Val Cys Ala Gly Glu Ile 405 410 415 Arg Asp Ile Arg Glu Glu Leu Ala Ser Leu Lys Arg Glu Leu Lys Lys 420 425 430 Leu Ala Ser Lys Lys Glu Glu Glu Glu Leu Val Ile Met Thr Thr Pro 435 440 445 Asn Ser Cys Val Thr Ser Gln Asn Asp Asn Leu Met Thr Pro Ala Lys 450 455 460 Glu Ile Tyr Ala Asp Leu Leu Lys Lys Lys Tyr Lys Ile Glu Asp Gln 465 470 475 480 Leu Val Ile Ile Gly Glu Thr Leu Arg Lys Met Glu Glu Asp Met Gly 485 490 495 Trp Leu Lys Lys Thr Val Asp Glu Asn Tyr Pro Lys 500 505 <210> 4 <211> 1920 <212> DNA <213> Arabidopsis <400> 4 atgagtagta cgatgttcgt gaaacggaat ccgattagag aaaccaccgc cgggaaaatc 60 tcttcgccgt cgtcaccgac tttgaatgtt gcagtcgcgc atataagagc tggatcttat 120 tacgaaatcg atgcttcgat tcttcctcag agatcgccgg aaaatcttaa atcgattaga 180 gtcgtcatgg tgagcaaaat cacggcgagt gacgtgtctc tccggtaccc aagcatgttt 240 tcactccgat cgcatttcga ttacagtagg atgaaccgga ataaaccgat gaagaagagg 300 agtggtggtg gtcttcttcc tgttttcgac gagagtcatg tgatggcttc ggagctagct 360 ggagacttgc tttacagaag aatcgcacct catgaacttt ctatgaatag aaattcctgg 420 ggtttctggg tttctagttc ttctcgcagg aacaaatttc caagaaggga ggtggtttct 480 caaccggcgt acaatactcg tctctgtcgc gctgcttcac cggagggaaa gtgctcgtct 540 gagctgaaat cgggagggat gatcaagtgg ggaaggagat tgcgtgtgca gtatcagagt 600 cggcatattg atactaggaa gaataaggaa ggtgaggaga gttctagagt gaaggatgaa 660 gtttacaaag aagaagagat ggagaaagaa gaggatgatg atgatgggaa tgaaatagga 720 ggcactaaac aagaggcaaa ggagataact aatggaaatc gtaagagaaa gctgattgaa 780 tcaagtactg agagactcgc tcagaaagct aaggtttatg atcagaagaa ggaaactcaa 840 attgtggttt ataagaggaa atcagagagg aagttcattg atagatggtc tgttgagagg 900 tacaaactag ctgagaggaa catgttaaaa gtgatgaagg agaagaatgc agtgtttggc 960 aactccatac tcaggccaga gttgaggtca gaagcaagga agctgattgg tgacacaggt 1020 ctattggatc atctgcttaa gcacatggct ggtaaggtgg ctcctggagg tcaagatagg 1080 tttatgagaa agcacaatgc agatggggca atggagtatt ggttggagag ttctgatttg 1140 attcacataa ggaaagaagc aggagttaaa gatccttact ggactcctcc acctggttgg 1200 aagcttggtg acaacccttc tcaagatcct gtctgcgctg gagaaatccg tgacatcaga 1260 gaagaattag ctagcctgaa aagagaattg aagaaacttg cgtcaaagaa ggaagaggag 1320 gagcttgtta tcatgactac gcctaattct tgtgttacta gtcagaatga taatctgatg 1380 actccagcaa aggaaatcta cgctgatctg ctgaaaaaga aatacaaaat tgaggaccag 1440 ctagtgatta ttggagaaac cttgcgtaaa atggaggaag acatgggatg gcttaagaaa 1500 acagtggacg agaactatcc taaaaagcca gactcaacag agacaccttt gctactagag 1560 gattcaccac caatacagac actagaagga gaagtgaagg tggtgaacaa gggtaaccaa 1620 atcacagagt cacctcaaaa cagagaaaaa ggaaggaagc atgatcaaca agaaagatca 1680 ccactttcac taataagcaa cactggtttc agaatctgca ggcctgtggg gatgttcgca 1740 tggccccaat tgcctgctct tgctgctgct actgatacta atgcttcttc gccaagtcac 1800 agacaagcct acccatcccc ttttccagtc aagccacttg cagctaagcg tcctcttggc 1860 ttgacgtttc ccttcaccat catacccgaa gaagctccca agaatctctt caacgtttga 1920 <210> 5 <211> 639 <212> PRT <213> Arabidopsis <400> 5 Met Ser Ser Thr Met Phe Val Lys Arg Asn Pro Ile Arg Glu Thr Thr 1 5 10 15 Ala Gly Lys Ile Ser Ser Pro Ser Ser Pro Thr Leu Asn Val Ala Val 20 25 30 Ala His Ile Arg Ala Gly Ser Tyr Tyr Glu Ile Asp Ala Ser Ile Leu 35 40 45 Pro Gln Arg Ser Pro Glu Asn Leu Lys Ser Ile Arg Val Val Met Val 50 55 60 Ser Lys Ile Thr Ala Ser Asp Val Ser Leu Arg Tyr Pro Ser Met Phe 65 70 75 80 Ser Leu Arg Ser His Phe Asp Tyr Ser Arg Met Asn Arg Asn Lys Pro 85 90 95 Met Lys Lys Arg Ser Gly Gly Gly Leu Leu Pro Val Phe Asp Glu Ser 100 105 110 His Val Met Ala Ser Glu Leu Ala Gly Asp Leu Leu Tyr Arg Arg Ile 115 120 125 Ala Pro His Glu Leu Ser Met Asn Arg Asn Ser Trp Gly Phe Trp Val 130 135 140 Ser Ser Ser Ser Arg Arg Asn Lys Phe Pro Arg Arg Glu Val Val Ser 145 150 155 160 Gln Pro Ala Tyr Asn Thr Arg Leu Cys Arg Ala Ala Ser Pro Glu Gly 165 170 175 Lys Cys Ser Ser Glu Leu Lys Ser Gly Gly Met Ile Lys Trp Gly Arg 180 185 190 Arg Leu Arg Val Gln Tyr Gln Ser Arg His Ile Asp Thr Arg Lys Asn 195 200 205 Lys Glu Gly Glu Glu Ser Ser Arg Val Lys Asp Glu Val Tyr Lys Glu 210 215 220 Glu Glu Met Glu Lys Glu Glu Asp Asp Asp Asp Gly Asn Glu Ile Gly 225 230 235 240 Gly Thr Lys Gln Glu Ala Lys Glu Ile Thr Asn Gly Asn Arg Lys Arg 245 250 255 Lys Leu Ile Glu Ser Ser Thr Glu Arg Leu Ala Gln Lys Ala Lys Val 260 265 270 Tyr Asp Gln Lys Lys Glu Thr Gln Ile Val Val Tyr Lys Arg Lys Ser 275 280 285 Glu Arg Lys Phe Ile Asp Arg Trp Ser Val Glu Arg Tyr Lys Leu Ala 290 295 300 Glu Arg Asn Met Leu Lys Val Met Lys Glu Lys Asn Ala Val Phe Gly 305 310 315 320 Asn Ser Ile Leu Arg Pro Glu Leu Arg Ser Glu Ala Arg Lys Leu Ile 325 330 335 Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met Ala Gly Lys 340 345 350 Val Ala Pro Gly Gly Gln Asp Arg Phe Met Arg Lys His Asn Ala Asp 355 360 365 Gly Ala Met Glu Tyr Trp Leu Glu Ser Ser Asp Leu Ile His Ile Arg 370 375 380 Lys Glu Ala Gly Val Lys Asp Pro Tyr Trp Thr Pro Pro Pro Gly Trp 385 390 395 400 Lys Leu Gly Asp Asn Pro Ser Gln Asp Pro Val Cys Ala Gly Glu Ile 405 410 415 Arg Asp Ile Arg Glu Glu Leu Ala Ser Leu Lys Arg Glu Leu Lys Lys 420 425 430 Leu Ala Ser Lys Lys Glu Glu Glu Glu Leu Val Ile Met Thr Thr Pro 435 440 445 Asn Ser Cys Val Thr Ser Gln Asn Asp Asn Leu Met Thr Pro Ala Lys 450 455 460 Glu Ile Tyr Ala Asp Leu Leu Lys Lys Lys Tyr Lys Ile Glu Asp Gln 465 470 475 480 Leu Val Ile Ile Gly Glu Thr Leu Arg Lys Met Glu Glu Asp Met Gly 485 490 495 Trp Leu Lys Lys Thr Val Asp Glu Asn Tyr Pro Lys Lys Pro Asp Ser 500 505 510 Thr Glu Thr Pro Leu Leu Leu Glu Asp Ser Pro Pro Ile Gln Thr Leu 515 520 525 Glu Gly Glu Val Lys Val Val Asn Lys Gly Asn Gln Ile Thr Glu Ser 530 535 540 Pro Gln Asn Arg Glu Lys Gly Arg Lys His Asp Gln Gln Glu Arg Ser 545 550 555 560 Pro Leu Ser Leu Ile Ser Asn Thr Gly Phe Arg Ile Cys Arg Pro Val 565 570 575 Gly Met Phe Ala Trp Pro Gln Leu Pro Ala Leu Ala Ala Ala Thr Asp 580 585 590 Thr Asn Ala Ser Ser Pro Ser His Arg Gln Ala Tyr Pro Ser Pro Phe 595 600 605 Pro Val Lys Pro Leu Ala Ala Lys Arg Pro Leu Gly Leu Thr Phe Pro 610 615 620 Phe Thr Ile Ile Pro Glu Glu Ala Pro Lys Asn Leu Phe Asn Val 625 630 635 <210> 6 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> nga162F primer used for microsatellite marker analysis <400> 6 ctctgtcact cttttcctct gg 22 <210> 7 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> nga162R primer used for microsatellite marker analysis <400> 7 catgcaattt gcatctgagg 20 <210> 8 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> nga225F primer used for microsatellite marker analysis <400> 8 tctccccact agttttgtgt cc 22 <210> 9 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> nga225R primer used for microsatellite marker analysis <400> 9 gaaatccaaa tcccagagag g 21 <210> 10 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> nga168F primer used for microsatellite marker analysis <400> 10 gaggacatgt ataggagcct cg 22 <210> 11 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> nga168R primer used for microsatellite marker analysis <400> 11 tcgtctactg cactgccg 18 <210> 12 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> nga1107F primer used for microsatellite marker analysis <400> 12 cgacgaatcg acagaattag g 21 <210> 13 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> nga1107R primer used for microsatellite marker analysis <400> 13 gcgaaaaaac aaaaaaatcc a 21 <210> 14 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> nga6F primer used for microsatellite marker analysis <400> 14 atggagaagc ttacactgat c 21 <210> 15 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> nga6R primer used for microsatellite marker analysis <400> 15 tggatttctt cctctcttca c 21 <210> 16 <211> 3001 <212> DNA <213> Boechera holboelli <400> 16 gatctgatgc atcagtttca ggtgacagct tcaaacgttg aagagatttg ttggagcttc 60 ttcgggagtg tcggtgaaag gaaacggcaa gccgagaggg ggcttagctg caagtggctt 120 gactggacaa agagatgggt aaattggtcc gtgacttggc gaagaagcaa gttctttagc 180 attactgttt gacaacacag tatcagtagc agcagcaaga gcaggcaatt tgggccatgc 240 gaaaatcccc acaggcctgc agattctgaa accagtgttg cttataagtg aaagtggtga 300 tcgttcttgt tgatcatgct tcttgcattt ttctctgttt tgaggtgact ctgtgatttg 360 gtttcccttg ttcacctcct tcacttctcc ttctagtgtc tccattgttg gcgaatccgc 420 tagtaccaaa ggtgtcgctg atgagtctgg ctttcgagga aagttctcgt ccactgtttt 480 cttaagccat cccatgtctt cctgcaatat ttgcattcat aaaaacacaa atgtttcatc 540 attcattacc agcaaagtgg catctaatag agacagtgga aatgtttgat cacacacgct 600 aaatggaccc attttacatg gcattcagtg cgtttctcca agggagtttc ctagtgacta 660 cttgatagtt actaaatcat agcaaattta gaagatttta cattttaagt aatggttcag 720 ctagaactag taaggagagt gtcagtgttt agaaactcag tctgggattt atatacctcc 780 attgtacaca aggtttctcc aattatcact agctggtcct caattttgta tttcttcttt 840 agcagatcag cgtagatttc ctgagatgaa gtagcagaga tgttcaaaac gtaccataaa 900 ccagtatcac aagatagaga gatctgttac tgtttcaagc tcttaccttt gctggagtcg 960 tcaaattatc attgtccacg ttctgactag taacacaaga atttggtgta gtcacgataa 1020 caagctcctc ctcttccttc tttgacgcca gtttctccaa ttctcttctc aagaccaaga 1080 caaacatgaa ttacaaaatt gctataagta acaaaagaga tgatcatata accaattcaa 1140 taagttaatt cttctacctt ttcaggctag ctaattcttc tctgatctca cggatttctc 1200 cggcgcagac aggatcttga gtagggttgt caccaagctt ccaaccaggt ggaggcgtcc 1260 agtaaggatc ttcaactcct gcttctttcc ttatgtgaat caaatcagaa ctctccaacc 1320 aatactccat tgccccatct gcattgtgct ttctcataaa cctatcttga cctccaggag 1380 ccaccttacc tgccatgtgc ttaagcatat gatctaaaag accagtgtca ccgatcagct 1440 tccttgcttc tgaccttaac tgtgacctga gtatggagtt gccaaacact gcatttttct 1500 ccttcatcac ttttaacatg ttcctctcag ctagtttgta ccttcaaatt ccaaaattaa 1560 ccacaatcaa tcagatgaac caagacaaat ccaatttcag agatcatcaa attcgttaaa 1620 tattcacttt acctatcaac agaccatctg ccaatgaatt tcttctctgc tcttctctta 1680 tagaccacga tttgattttc cttcttctga tcataaacct tagccctctg agcgagtctc 1740 tcagtactgg attcaatcag ctttctctta cgatttccat cagtcatctc gtttgcaatc 1800 tgtttagtct cttctgtttc attcccatca tcatcatcat cattttcttc ctcaatctct 1860 tctttgcaaa cccctccctc cttcactcca gaactctcct taccttccgt attcttctta 1920 caatcaatat gccgactctt gtactgcaca cgcaatctcc tcccccactt aatcatttct 1980 ccagatctca gctcagacca acattttccc tccggtgaag ccgcgcgaca gagcctagta 2040 ttgtacgccg gttgagaaat catcttgttc ctgcgagaag aagcagaaga aacccagaaa 2100 ctccacgaat ttctgttcat agaaacttca tgaggtgcga ttcttctgta aagcaaatct 2160 ccagctagct ccgaaaccat cacatggctc tcgtcaaaaa gaggaagaag accaccacca 2220 ctcctcttct tcaaaggttt attccggttc atcctgctgc aatcgaaatg cgatcggagt 2280 gagtacatgc ttgggtatcg gagagacacg tcgctcgccg tgattttgct cacctgcaac 2340 aacaaccaaa aaaacgccaa aatcactcga aaacccagac gaacaacaaa aatgcagatc 2400 cgtctctaat ggtgaaacaa aaagcagaga atccattaaa taccatgacg actctaatcg 2460 atttaaggtt ctccggcgat ctttgaggaa gaatcgaaga atcgatttcg taatacgatc 2520 caactcttat atgcgcgact gcaactggaa gaacaaaacc aaagaaaaaa aaactggaat 2580 tagaagaaaa gcgagaaaat caacaaaaac ggggaaacta tagcttcagt gttttaccat 2640 tcacagtcga tgacgatggc gaagaatttt ttccggcaga gatttctcta atcggattcc 2700 gtttcaggaa catcgttccc tgtagaagaa gaagaagtat ataactcaga gaggttcact 2760 atttttttat ttttgtgttg aatcaaaaat ggaaactgtt aaggaccgga gaatatattt 2820 gaaaaaagct gactctgcga gtataacaag aaaacacacg cgctctctgg tacgcgcgtg 2880 ggagacacaa aggcaacaga atcaagcggt gatgattttt attttctacc gtcatgagag 2940 tgttagagac tgagctatta cagagagaga gagagagatc ttacgctcat gatttttgct 3000 c 3001 <210> 17 <211> 1947 <212> DNA <213> Boechera holboelli <400> 17 atgagcggaa cgatgttcct gaaacggaat ccgattagag aaatctctgc cggaaaaaat 60 tcttcgccat cgtcatcgac tgtgaatgtt gcagtcgcgc atataagagt tggatcgtat 120 tacgaaatcg attcttcgat tcttcctcaa agatcgccgg agaaccttaa atcgattaga 180 gtcgtcatgg tgagcaaaat cacggcgagc gacgtgtctc tccgataccc aagcatgtac 240 tcactccgat cgcatttcga ttgcagcagg atgaaccgga ataaaccttt gaagaagagg 300 agtggtggtg gtcttcttcc tctttttgac gagagccatg tgatggtttc ggagctagct 360 ggagatttgc tttacagaag aatcgcacct catgaagttt ctatgaacag aaattcgtgg 420 agtttctggg tttcttctgc ttcttctcgc aggaacaaga tgatttctca accggcgtac 480 aatactaggc tctgtcgcgc ggcttcaccg gagggaaaat gttggtctga gctgagatct 540 ggagaaatga ttaagtgggg gaggagattg cgtgtgcagt acaagagtcg gcatattgat 600 tgtaagaaga atacggaagg taaggagagt tctggagtga aggagggagg ggtttgcaaa 660 gaagagattg aggaagaaaa tgatgatgat gatgatggga atgaaacaga agagactaaa 720 cagattgcaa acgagatgac tgatggaaat cgtaagagaa agctgattga atccagtact 780 gagagactcg ctcagagggc taaggtttat gatcagaaga aggaaaatca aatcgtggtc 840 tataagagaa gagcagagaa gaaattcatt ggcagatggt ctgttgatag gtacaaacta 900 gctgagagga acatgttaaa agtgatgaag gagaaaaatg cagtgtttgg caactccata 960 ctcaggtcac agttaaggtc agaagcaagg aagctgatcg gtgacactgg tcttttagat 1020 catatgctta agcacatggc aggtaaggtg gctcctggag gtcaagatag gtttatgaga 1080 aagcacaatg cagatggggc aatggagtat tggttggaga gttctgattt gattcacata 1140 aggaaagaag caggagttga agatccttac tggacgcctc cacctggttg gaagcttggt 1200 gacaacccta ctcaagatcc tgtctgcgcc ggagaaatcc gtgagatcag agaagaatta 1260 gctagcctga gaagagaatt ggagaaactg gcgtcaaaga aggaagagga ggagcttgtt 1320 atcgtgacta caccaaattc ttgtgttact agtcagaacg tggacaatga taatttgacg 1380 actccagcaa aggaaatcta cgctgatctg ctaaagaaga aatacaaaat tgaggaccag 1440 ctagtgataa ttggagaaac cttgtgtaca atggaggaag acatgggatg gcttaagaaa 1500 acagtggacg agaactttcc tcgaaagcca gactcatcag cgacaccttt ggtactagcg 1560 gattcgccaa caatggagac actagaagga gaagtgaagg aggtgaacaa gggaaaccaa 1620 atcacagagt cacctcaaaa cagagaaaaa tgcaagaagc atgatcaaca agaacgatca 1680 ccactttcac ttataagcaa cactggtttc agaatctgca ggcctgtggg gattttcgca 1740 tggcccaaat tgcctgctct tgctgctgct actgatactg tgttgtcaaa cagtaatgct 1800 aaagaacttg cttcttcgcc aagtcacgga ccaatttacc catctctttg tccagtcaag 1860 ccacttgcag ctaagccccc tctcggcttg ccgtttcctt tcaccgacac tcccgaagaa 1920 gctccaacaa atctcttcaa cgtttga 1947 <210> 18 <211> 648 <212> PRT <213> Boechera holboelli <400> 18 Met Ser Gly Thr Met Phe Leu Lys Arg Asn Pro Ile Arg Glu Ile Ser 1 5 10 15 Ala Gly Lys Asn Ser Ser Pro Ser Ser Ser Thr Val Asn Val Ala Val 20 25 30 Ala His Ile Arg Val Gly Ser Tyr Tyr Glu Ile Asp Ser Ser Ile Leu 35 40 45 Pro Gln Arg Ser Pro Glu Asn Leu Lys Ser Ile Arg Val Val Met Val 50 55 60 Ser Lys Ile Thr Ala Ser Asp Val Ser Leu Arg Tyr Pro Ser Met Tyr 65 70 75 80 Ser Leu Arg Ser His Phe Asp Cys Ser Arg Met Asn Arg Asn Lys Pro 85 90 95 Leu Lys Lys Arg Ser Gly Gly Gly Leu Leu Pro Leu Phe Asp Glu Ser 100 105 110 His Val Met Val Ser Glu Leu Ala Gly Asp Leu Leu Tyr Arg Arg Ile 115 120 125 Ala Pro His Glu Val Ser Met Asn Arg Asn Ser Trp Ser Phe Trp Val 130 135 140 Ser Ser Ala Ser Ser Arg Arg Asn Lys Met Ile Ser Gln Pro Ala Tyr 145 150 155 160 Asn Thr Arg Leu Cys Arg Ala Ala Ser Pro Glu Gly Lys Cys Trp Ser 165 170 175 Glu Leu Arg Ser Gly Glu Met Ile Lys Trp Gly Arg Arg Leu Arg Val 180 185 190 Gln Tyr Lys Ser Arg His Ile Asp Cys Lys Lys Asn Thr Glu Gly Lys 195 200 205 Glu Ser Ser Gly Val Lys Glu Gly Gly Val Cys Lys Glu Glu Ile Glu 210 215 220 Glu Glu Asn Asp Asp Asp Asp Asp Gly Asn Glu Thr Glu Glu Thr Lys 225 230 235 240 Gln Ile Ala Asn Glu Met Thr Asp Gly Asn Arg Lys Arg Lys Leu Ile 245 250 255 Glu Ser Ser Thr Glu Arg Leu Ala Gln Arg Ala Lys Val Tyr Asp Gln 260 265 270 Lys Lys Glu Asn Gln Ile Val Val Tyr Lys Arg Arg Ala Glu Lys Lys 275 280 285 Phe Ile Gly Arg Trp Ser Val Asp Arg Tyr Lys Leu Ala Glu Arg Asn 290 295 300 Met Leu Lys Val Met Lys Glu Lys Asn Ala Val Phe Gly Asn Ser Ile 305 310 315 320 Leu Arg Ser Gln Leu Arg Ser Glu Ala Arg Lys Leu Ile Gly Asp Thr 325 330 335 Gly Leu Leu Asp His Met Leu Lys His Met Ala Gly Lys Val Ala Pro 340 345 350 Gly Gly Gln Asp Arg Phe Met Arg Lys His Asn Ala Asp Gly Ala Met 355 360 365 Glu Tyr Trp Leu Glu Ser Ser Asp Leu Ile His Ile Arg Lys Glu Ala 370 375 380 Gly Val Glu Asp Pro Tyr Trp Thr Pro Pro Pro Gly Trp Lys Leu Gly 385 390 395 400 Asp Asn Pro Thr Gln Asp Pro Val Cys Ala Gly Glu Ile Arg Glu Ile 405 410 415 Arg Glu Glu Leu Ala Ser Leu Arg Arg Glu Leu Glu Lys Leu Ala Ser 420 425 430 Lys Lys Glu Glu Glu Glu Leu Val Ile Val Thr Thr Pro Asn Ser Cys 435 440 445 Val Thr Ser Gln Asn Val Asp Asn Asp Asn Leu Thr Thr Pro Ala Lys 450 455 460 Glu Ile Tyr Ala Asp Leu Leu Lys Lys Lys Tyr Lys Ile Glu Asp Gln 465 470 475 480 Leu Val Ile Ile Gly Glu Thr Leu Cys Thr Met Glu Glu Asp Met Gly 485 490 495 Trp Leu Lys Lys Thr Val Asp Glu Asn Phe Pro Arg Lys Pro Asp Ser 500 505 510 Ser Ala Thr Pro Leu Val Leu Ala Asp Ser Pro Thr Met Glu Thr Leu 515 520 525 Glu Gly Glu Val Lys Glu Val Asn Lys Gly Asn Gln Ile Thr Glu Ser 530 535 540 Pro Gln Asn Arg Glu Lys Cys Lys Lys His Asp Gln Gln Glu Arg Ser 545 550 555 560 Pro Leu Ser Leu Ile Ser Asn Thr Gly Phe Arg Ile Cys Arg Pro Val 565 570 575 Gly Ile Phe Ala Trp Pro Lys Leu Pro Ala Leu Ala Ala Ala Thr Asp 580 585 590 Thr Val Leu Ser Asn Ser Asn Ala Lys Glu Leu Ala Ser Ser Pro Ser 595 600 605 His Gly Pro Ile Tyr Pro Ser Leu Cys Pro Val Lys Pro Leu Ala Ala 610 615 620 Lys Pro Pro Leu Gly Leu Pro Phe Pro Phe Thr Asp Thr Pro Glu Glu 625 630 635 640 Ala Pro Thr Asn Leu Phe Asn Val 645 <210> 19 <211> 508 <212> PRT <213> Boechera holboelli <400> 19 Met Ser Gly Thr Met Phe Leu Lys Arg Asn Pro Ile Arg Glu Ile Ser 1 5 10 15 Ala Gly Lys Asn Ser Ser Pro Ser Ser Ser Thr Val Asn Val Ala Val 20 25 30 Ala His Ile Arg Val Gly Ser Tyr Tyr Glu Ile Asp Ser Ser Ile Leu 35 40 45 Pro Gln Arg Ser Pro Glu Asn Leu Lys Ser Ile Arg Val Val Met Val 50 55 60 Ser Lys Ile Thr Ala Ser Asp Val Ser Leu Arg Tyr Pro Ser Met Tyr 65 70 75 80 Ser Leu Arg Ser His Phe Asp Cys Ser Arg Met Asn Arg Asn Lys Pro 85 90 95 Leu Lys Lys Arg Ser Gly Gly Gly Leu Leu Pro Leu Phe Asp Glu Ser 100 105 110 His Val Met Val Ser Glu Leu Ala Gly Asp Leu Leu Tyr Arg Arg Ile 115 120 125 Ala Pro His Glu Val Ser Met Asn Arg Asn Ser Trp Ser Phe Trp Val 130 135 140 Ser Ser Ala Ser Ser Arg Arg Asn Lys Met Ile Ser Gln Pro Ala Tyr 145 150 155 160 Asn Thr Arg Leu Cys Arg Ala Ala Ser Pro Glu Gly Lys Cys Trp Ser 165 170 175 Glu Leu Arg Ser Gly Glu Met Ile Lys Trp Gly Arg Arg Leu Arg Val 180 185 190 Gln Tyr Lys Ser Arg His Ile Asp Cys Lys Lys Asn Thr Glu Gly Lys 195 200 205 Glu Ser Ser Gly Val Lys Glu Gly Gly Val Cys Lys Glu Glu Ile Glu 210 215 220 Glu Glu Asn Asp Asp Asp Asp Asp Gly Asn Glu Thr Glu Glu Thr Lys 225 230 235 240 Gln Ile Ala Asn Glu Met Thr Asp Gly Asn Arg Lys Arg Lys Leu Ile 245 250 255 Glu Ser Ser Thr Glu Arg Leu Ala Gln Arg Ala Lys Val Tyr Asp Gln 260 265 270 Lys Lys Glu Asn Gln Ile Val Val Tyr Lys Arg Arg Ala Glu Lys Lys 275 280 285 Phe Ile Gly Arg Trp Ser Val Asp Arg Tyr Lys Leu Ala Glu Arg Asn 290 295 300 Met Leu Lys Val Met Lys Glu Lys Asn Ala Val Phe Gly Asn Ser Ile 305 310 315 320 Leu Arg Ser Gln Leu Arg Ser Glu Ala Arg Lys Leu Ile Gly Asp Thr 325 330 335 Gly Leu Leu Asp His Met Leu Lys His Met Ala Gly Lys Val Ala Pro 340 345 350 Gly Gly Gln Asp Arg Phe Met Arg Lys His Asn Ala Asp Gly Ala Met 355 360 365 Glu Tyr Trp Leu Glu Ser Ser Asp Leu Ile His Ile Arg Lys Glu Ala 370 375 380 Gly Val Glu Asp Pro Tyr Trp Thr Pro Pro Pro Gly Trp Lys Leu Gly 385 390 395 400 Asp Asn Pro Thr Gln Asp Pro Val Cys Ala Gly Glu Ile Arg Glu Ile 405 410 415 Arg Glu Glu Leu Ala Ser Leu Arg Arg Glu Leu Glu Lys Leu Ala Ser 420 425 430 Lys Lys Glu Glu Glu Glu Leu Val Ile Val Thr Thr Pro Asn Ser Cys 435 440 445 Val Thr Ser Gln Asn Val Asp Asn Asp Asn Leu Thr Thr Pro Ala Lys 450 455 460 Glu Ile Tyr Ala Asp Leu Leu Lys Lys Lys Tyr Lys Ile Glu Asp Gln 465 470 475 480 Leu Val Ile Ile Gly Glu Thr Leu Cys Thr Met Glu Glu Asp Met Gly 485 490 495 Trp Leu Lys Lys Thr Val Asp Glu Asn Phe Pro Arg 500 505 <210> 20 <211> 1680 <212> DNA <213> Oryza <400> 20 atggacgcgg agatggcggc tcctgcgctt gcggcagctc atctgctgga ctcgcccatg 60 aggccacagg tgagcagata ctactccaag aagaggggta gcagccacag cagaaatggc 120 aaggatgatg ccaaccatga cgagtccaag aaccaatcac ccggcttgcc cctgagcaga 180 cagagcctgt cctcatctgc cacccacacc taccacaccg gagggttcta cgagatcgac 240 cacgagaagc ttccccccaa atccccaatt catctcaagt ccatacgcgt ggtaaaggtg 300 agcggctaca caagcctgga cgtcacagtg agcttcccgt ccctcctggc gctgcgaagc 360 ttcttctcct cctccccacg gtcgtgcact gggccggagc tcgacgagcg cttcgtcatg 420 agcagcaacc acgcggcccg catcctgcgc cgtcgggtgg ccgaggagga gctcgcgggc 480 gacgtgatgc accaggacag cttctggctc gtcaagccct gcctctatga cttctccgcg 540 tcgtcaccac atgatgtgct gaccccgtcg ccgccgcctg ccacagcgca ggcgaaggcg 600 ccggcagcca gttcctgcct tctcgacacc ttgaagtgcg acggcgccgg gtggggcgtg 660 aggcgccgtg tcaggtacat tggtcgccac cacgatgctt ccaaggaggc cagcgctgcc 720 agcctcgatg gctacaacac agaggtcagc gtccaggagg agcagcagca gcgactgcgg 780 cttcgactgc ggttgcgaca acgccgggag caggaagaca acaagagcac tagcaatggc 840 aagaggaagc gggaggaggc agagagcagc atggacaaga gcagagccgc caggaagaag 900 aaagccaaga cttacaagag tcccaagaag gtggagaaga ggcgcgtcgt ggaggctaaa 960 gacggcgacc ctcggcgcgg caaggaccgg tggtcggccg agcggtacgc agcggcggag 1020 aggagcctgc tggatataat gcgctcccat ggtgcctgct tcggtgcgcc ggtgatgcgg 1080 caggctctgc gggaggaagc ccgcaagcat atcggtgaca ccggcctcct tgaccacctg 1140 ctcaagcaca tggccggcag ggtaccggaa ggcagcgcgg accggttccg tcgccggcac 1200 aatgcggatg gtgccatgga gtactggctg gagccggcgg agcttgccga ggtacggcgg 1260 ctggctggag tgtctgatcc atactgggtg ccgccacctg ggtggaagcc aggtgatgac 1320 gtgtccgcag tcgccggtga cctcctggtc aagaagaagg tggaagagct cgctgaggag 1380 gttgatggtg taaaaaggca catcgagcag ctcagttcta atttggtgca gctggagaag 1440 gaaacaaaat ctgaggcaga gcgatcttac agctctagga aggagaagta tcagaagttg 1500 atgaaggcaa atgaaaagct cgagaaacag gtgttatcta tgaaggataa atacaagctt 1560 gtgctggaga agaatgataa actggaggaa cagatggcta gtctctccag ctccttcctt 1620 tctttgaagg aacaattgct gctgccaaga aatggagata atctgaacat ggaaaggtaa 1680 <210> 21 <211> 559 <212> PRT <213> Oryza <400> 21 Met Asp Ala Glu Met Ala Ala Pro Ala Leu Ala Ala Ala His Leu Leu 1 5 10 15 Asp Ser Pro Met Arg Pro Gln Val Ser Arg Tyr Tyr Ser Lys Lys Arg 20 25 30 Gly Ser Ser His Ser Arg Asn Gly Lys Asp Asp Ala Asn His Asp Glu 35 40 45 Ser Lys Asn Gln Ser Pro Gly Leu Pro Leu Ser Arg Gln Ser Leu Ser 50 55 60 Ser Ser Ala Thr His Thr Tyr His Thr Gly Gly Phe Tyr Glu Ile Asp 65 70 75 80 His Glu Lys Leu Pro Pro Lys Ser Pro Ile His Leu Lys Ser Ile Arg 85 90 95 Val Val Lys Val Ser Gly Tyr Thr Ser Leu Asp Val Thr Val Ser Phe 100 105 110 Pro Ser Leu Leu Ala Leu Arg Ser Phe Phe Ser Ser Ser Pro Arg Ser 115 120 125 Cys Thr Gly Pro Glu Leu Asp Glu Arg Phe Val Met Ser Ser Asn His 130 135 140 Ala Ala Arg Ile Leu Arg Arg Arg Val Ala Glu Glu Glu Leu Ala Gly 145 150 155 160 Asp Val Met His Gln Asp Ser Phe Trp Leu Val Lys Pro Cys Leu Tyr 165 170 175 Asp Phe Ser Ala Ser Ser Pro His Asp Val Leu Thr Pro Ser Pro Pro 180 185 190 Pro Ala Thr Ala Gln Ala Lys Ala Pro Ala Ala Ser Ser Cys Leu Leu 195 200 205 Asp Thr Leu Lys Cys Asp Gly Ala Gly Trp Gly Val Arg Arg Arg Val 210 215 220 Arg Tyr Ile Gly Arg His His Asp Ala Ser Lys Glu Ala Ser Ala Ala 225 230 235 240 Ser Leu Asp Gly Tyr Asn Thr Glu Val Ser Val Gln Glu Glu Gln Gln 245 250 255 Gln Arg Leu Arg Leu Arg Leu Arg Leu Arg Gln Arg Arg Glu Gln Glu 260 265 270 Asp Asn Lys Ser Thr Ser Asn Gly Lys Arg Lys Arg Glu Glu Ala Glu 275 280 285 Ser Ser Met Asp Lys Ser Arg Ala Ala Arg Lys Lys Lys Ala Lys Thr 290 295 300 Tyr Lys Ser Pro Lys Lys Val Glu Lys Arg Arg Val Val Glu Ala Lys 305 310 315 320 Asp Gly Asp Pro Arg Arg Gly Lys Asp Arg Trp Ser Ala Glu Arg Tyr 325 330 335 Ala Ala Ala Glu Arg Ser Leu Leu Asp Ile Met Arg Ser His Gly Ala 340 345 350 Cys Phe Gly Ala Pro Val Met Arg Gln Ala Leu Arg Glu Glu Ala Arg 355 360 365 Lys His Ile Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met 370 375 380 Ala Gly Arg Val Pro Glu Gly Ser Ala Asp Arg Phe Arg Arg Arg His 385 390 395 400 Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu Pro Ala Glu Leu Ala 405 410 415 Glu Val Arg Arg Leu Ala Gly Val Ser Asp Pro Tyr Trp Val Pro Pro 420 425 430 Pro Gly Trp Lys Pro Gly Asp Asp Val Ser Ala Val Ala Gly Asp Leu 435 440 445 Leu Val Lys Lys Lys Val Glu Glu Leu Ala Glu Glu Val Asp Gly Val 450 455 460 Lys Arg His Ile Glu Gln Leu Ser Ser Asn Leu Val Gln Leu Glu Lys 465 470 475 480 Glu Thr Lys Ser Glu Ala Glu Arg Ser Tyr Ser Ser Arg Lys Glu Lys 485 490 495 Tyr Gln Lys Leu Met Lys Ala Asn Glu Lys Leu Glu Lys Gln Val Leu 500 505 510 Ser Met Lys Asp Lys Tyr Lys Leu Val Leu Glu Lys Asn Asp Lys Leu 515 520 525 Glu Glu Gln Met Ala Ser Leu Ser Ser Ser Phe Leu Ser Leu Lys Glu 530 535 540 Gln Leu Leu Leu Pro Arg Asn Gly Asp Asn Leu Asn Met Glu Arg 545 550 555 <210> 22 <211> 1612 <212> DNA <213> Artificial Sequence <220> <223> DYAD Promoter <400> 22 gagctctttg gtccggagac ggtagaagac gacaaagcac tgacctttca tctctcggcg 60 atcgaaaaaa tcactctctt tcctcatcag acccgacccg ttatgaaggt atccagaccc 120 gtttattttg atccatctca tagtcggatc cccaaaaaaa ttcagcttag attggcccat 180 ttaggcccgt ttacagtttt ttactttttt cttaattatc tttttaacat cttacattat 240 acatatttga ctcaacaaaa aaatataact taaatgtatt gttgactgtt tttgataatt 300 aagaaaaaaa tatttttaaa ttattaaaaa tattgttgac tcaacaaaaa aatataactt 360 aaatgtattg ggcaaataat catggtcata agtcctcaag cttattattt gttttgattg 420 gtttaaatac tttataaaaa aaatatcaat tatatcatgt tattacgtaa attaagcttt 480 ttgattttaa aaaagcttca gctcaataaa gaaaaacaga ttcagttatc attggagtat 540 aaaattggtc gatacattag agacattaat ccttacatca taaacaattt aatgtgaata 600 aaacatcata aatcacatat cattatccga aaataatcat atgtaagaat aatcactgtg 660 acaaaaaaaa aaaacaattc ctcacgtgtg tagtcggtcc ccactctagt agcagtagct 720 taatgatgcc ttctccgcac gtgtaacacg aaatttattc gctacggcca attacattaa 780 ccttcaggtc ttatcaccgt taaattttca aaatgacaca cgtggcatca atccgtaata 840 tcactacgtc tgctttcaat ctttcattgt agatgatttc gtacaccaat ttccgcgaac 900 gtttacagtt tagatacagt ttgagggcaa atctgtcaat atacgccaac ttgctgcgaa 960 agcaatatag tcacgtgccg tgcacacgca tataagactc acacactcac accactctct 1020 ctctctctct aacctcatat ataaagccac ctcccagatt cattaaatgc gacatttcaa 1080 aacttttctt tttgctgtct tccccataag ctctctgctg attaaaaaga ttttctggta 1140 taaaacaaaa ttcttcaaat atttctgggt ttatgttttc tctctatttc tcagaaatgc 1200 tttaatttct ccatccgcgt ccatgttttt ttttctccgt tgctgatttt gattttttta 1260 atccagtgaa aaggaggaac gaagattatc gagagcaaaa atcatgagtg taagatctct 1320 ctcgctctca gattttattt tttttcgctg tgatataaat ggctcagtca ctatcagtct 1380 catgatgaga aaaataaaac tcatcaccgc ttgattctgt ttccttagtg tctcccacgc 1440 gcgtaccaga aagcgcgtgt gtgtttcttg ttatactcgc agagtcaggt tttttcaaat 1500 atattctctc caggcagcag caacaacaac aaaccgattt tttcattatt ccttataaca 1560 atttttgatt ctccagaaaa aaaatatctc tcttagtttt tctcttgttc ta 1612 <210> 23 <211> 2412 <212> DNA <213> Oryza <400> 23 atggacgcgg agatggcggc tcctgcgctt gcggcagctc atctgctgga ctcgcccatg 60 aggccacagg tgagcagata ctactccaag aagaggggta gcagccacag cagaaatggc 120 aaggatgatg ccaaccatga cgagtccaag aaccaatcac ccggcttgcc cctgagcaga 180 cagagcctgt cctcatctgc cacccacacc taccacaccg gagggttcta cgagatcgac 240 cacgagaagc ttccccccaa atccccaatt catctcaagt ccatacgcgt ggtaaaggtg 300 agcggctaca caagcctgga cgtcacagtg agcttcccgt ccctcctggc gctgcgaagc 360 ttcttctcct cctccccacg gtcgtgcact gggccggagc tcgacgagcg cttcgtcatg 420 agcagcaacc acgcggcccg catcctgcgc cgtcgggtgg ccgaggagga gctcgcgggc 480 gacgtgatgc accaggacag cttctggctc gtcaagccct gcctctatga cttctccgcg 540 tcgtcaccac atgatgtgct gaccccgtcg ccgccgcctg ccacagcgca ggcgaaggcg 600 ccggcagcca gttcctgcct tctcgacacc ttgaagtgcg acggcgccgg gtggggcgtg 660 aggcgccgtg tcaggtacat tggtcgccac cacgatgctt ccaaggaggc cagcgctgcc 720 agcctcgatg gctacaacac agaggtcagc gtccaggagg agcagcagca gcgactgcgg 780 cttcgactgc ggttgcgaca acgccgggag caggaagaca acaagagcac tagcaatggc 840 aagaggaagc gggaggaggc agagagcagc atggacaaga gcagagccgc caggaagaag 900 aaagccaaga cttacaagag tcccaagaag gtggagaaga ggcgcgtcgt ggaggctaaa 960 gacggcgacc ctcggcgcgg caaggaccgg tggtcggccg agcggtacgc agcggcggag 1020 aggagcctgc tggatataat gcgctcccat ggtgcctgct tcggtgcgcc ggtgatgcgg 1080 caggctctgc gggaggaagc ccgcaagcat atcggtgaca ccggcctcct tgaccacctg 1140 ctcaagcaca tggccggcag ggtaccggaa ggcagcgcgg accggttccg tcgccggcac 1200 aatgcggatg gtgccatgga gtactggctg gagccggcgg agcttgccga ggtacggcgg 1260 ctggctggag tgtctgatcc atactgggtg ccgccacctg ggtggaagcc aggtgatgac 1320 gtgtccgcag tcgccggtga cctcctggtc aagaagaagg tggaagagct cgctgaggag 1380 gttgatggtg taaaaaggca catcgagcag ctcagttcta atttggtgca gctggagaag 1440 gaaacaaaat ctgaggcaga gcgatcttac agctctagga aggagaagta tcagaagttg 1500 atgaaggcaa atgaaaagct cgagaaacag gtgttatcta tgaaggacat gtatgagcat 1560 ctggttcaga aaaagggtaa gctgaagaag gaggtgctgt ccttgaagga taaatacaag 1620 cttgtgctgg agaagaatga taaactggag gaacagatgg ctagtctctc cagctccttc 1680 ctttctttga aggaacaatt gctgctgcca agaaatggag ataatctgaa catggaaagg 1740 gaaagggtgg aagtgacttt gggcaagcaa gaaggccttg ttcccggcga accactgtat 1800 gttgatggtg gtgaccggat cagccagcaa gcagatgcca ccgtcgtcca agtcggcgag 1860 aagaggacgg cgaggaagag cagcttccgc atctgcaagc cacagggaac gttcatgtgg 1920 ccacacatgg cgtctggcac gagcatggcc atcagtgggg gaggcagcag cagctgccct 1980 gtcgcctccg ggccagagca gctccctcgc agcagcagct gccccagcat tgggcctggt 2040 ggcctcccgc cgtcgtcacg agccccagcc gaggtggtgg tcgcgtcgcc actggacgag 2100 cacgtggcgt tccgcggggg cttcaacacg ccgccctcgg catcgtccac caacgccgcc 2160 gctgccgcca agctgcctcc cctgcccagc ccgacgtcac ctctccagac acgggccctg 2220 ttcgccgctg gcttcactgt cccggcatta cacaacttct ccggcctcac cttacgccat 2280 gtggactcct cgtcgccgtc gtccgcgcca tgcggtgcta gggagaagat ggtgaccctg 2340 ttcgatggag actgccgggg gatcagcgtc gtgggcaccg agctggcact ggccactccg 2400 tcctactgct ga 2412 <210> 24 <211> 6329 <212> DNA <213> Populus trichocarpa <400> 24 cattcgttat ggctaacgga gtcactgggc cttacatgca tccacagacc aggtgccgga 60 gtgctggtgc aaaaccaatt tattgaattt ctgaacaatt ggagacgaaa taaatgtctt 120 tacttcttca aacccttgat ttaaaagtaa atgtattatc ttttattgat ttttttattc 180 aattcctaga attagtagct tgaagaattt attaaattta tcagataaat gagagggata 240 tacccttaaa atcgtcaaaa ataaatctca atttacttat aaattgaaga ataccttctt 300 aaaaataaaa taaaattgcg tgccatccct ctttagtaga ttttggcgct actcgtgtgg 360 tgtgggtaca gagaagaata ttaatatacc cgagctggaa ctagaaggtc acccgccata 420 tccaatgagg caatcccgaa cctctcccac aagcaagcat ccgccacgtg gtcagaagct 480 acagaggtta tgacctggct aaacgattgg ctaccaggaa ccaatggctc ctcaaaggcc 540 atagataaat aaatctaaga gccagtttct ttagctctca actctctcaa ccatctatac 600 aacatttcca gaggcaacaa gactcgggag gggtaaaacg gtaaaatggg agacgttact 660 gtagaggagg gaggggggga ccagaatcca ggtcacgtga ggcgcatccc gtctggtaat 720 aatcattact atttttttct ctctttatag cagaaatgca ccaccatcgt tggtttcaca 780 acagaaaaaa ctccctcccc cttctctctg cgttttctct caagctgttt tttcttgctc 840 tccaaacaat ccatcacaag tagcttttga aacagaaatt gaaaaaaaaa ggtctcgttt 900 tatatttatt tttgctgttt aattttcaac ctgatttttt tcatgtgcat taattaatta 960 atgctggtgt agttactctt tggctggttg aatcggtgct ggtactggat aaaacatctc 1020 aaaaggaatg acccatttgc atgtcattaa ggggtgcatg tgtttgaatg aggaattcaa 1080 acaagtcctg acatgagtat gcattttcct gtggttaaca gatataggtt gtttggctcc 1140 tggaagattc tcaaaattga gatttcaagc tcaaaagtgt ttttgataca ctttccaagc 1200 ttcatgatct ttaatttacc agtggtgttt ttcctagtta gtgtacttta aaggtcgcat 1260 aatgatcggt agtacttagc tttgattttg cattcccgtt cgcttcttct tgttttcagt 1320 ctctgcgtac caacaatata gagattctcc tggctgtgca agaatcacta tatctatcta 1380 tctatctatc aggccttaac cttgctttct tttctgatca atccttgtgt ttatgattga 1440 ttaatgagat taattgtatg tttgcttcaa atgattatct tatatatagt ctgattttcc 1500 ctttctttaa tcatgtccat atatgtttat tcgccggggg gccgggaagg acgagaggta 1560 cgactagcta gtattaactt gtgcagttga aactgtttct ctatgtgcag aagatgacta 1620 ccatggagct ggttgatgtt gcagtgatag accacccatc ggtgagtttg ttctctcttc 1680 tcctcaatcc cactcccact ctccactccc caaccaccac acccctttct ttctgttact 1740 cctctatttc tcttctcgta acccacgcgc tcttttatct ctcaaatcaa gtcgctgatt 1800 actagtctac taaagttttc aaatactcaa ccgaattcct aatctttgtc tcacgctcac 1860 acacatacca aatccacacg cgcgtcccct acaatttgtt acgcaaatca aaccccgctc 1920 tacacatcct tggtgcccaa gtaagtgaaa tgatgatttt acataacaaa aaccacataa 1980 ttattatgct atgtaacggt atattctata cattctctat cgagtattgc acacgagggg 2040 cttatgcata cataaatcct cacccctttt aaaggagaag ggcaatacag tgattttggt 2100 tgtgcttgtg aaaatgcagg aaataaaaag gaggcagaac tccgaggacg ccgatagaag 2160 gctttttttg ggcggacatt gcctgcatca cccaacattt accacagcac caccatttgg 2220 taatatttgt aacacacacg cacacacgcc cgagcaacaa atctctccct cttttttatc 2280 ccttttgttt cctctctctc tctctctctc tctcacttga tttctctctt ctgatttgct 2340 gatttttttt actgctcgta ctagctagct agctctactc ctatagctca cagtactgca 2400 agtacgtagt actactgcag ctgctgctag tgctagtagt agctatgtcg ttttccacgc 2460 taagagctct tgtttctgat caaaataagg aattctctga ttactctttg ttttccatgc 2520 ttaataatga agacccagct gagcatatta aagtgagctc tttttatgaa gttgatcact 2580 ccaagctgcc tcataaatcc cctgatcaac tcaacaaaac ccgggttgtg atggtatttt 2640 ttatacaatt caacaatatt cttaaacccg gctcaacatt tttttctctc tgctttaaaa 2700 tttgttggtg tttgtttctg cttgaataaa tatctcaggt gaatgaaaag accaggatga 2760 gagtctcgct gaggtttcca agcatcaatt ctctaagatg ttacttcaat gagattgaag 2820 ctattaatta caagaaagac atgaaaacga agaagcagca gctaccagca ttcgacgaga 2880 aatacattat aggatcagaa gttgcagggg aagctcttta taggagaatc tcttctcaag 2940 aaatggcaga caagagttac tcatggagtt tctggatggt taaacatcct tcggtttcac 3000 ctcgaaaagt gtcataccca cctacaagta ctcatgttaa taaatttgtt ggtgcaagga 3060 aggtgtctct catgtctgag ctcaacggga caggcatggt taagtggggt cagcgccggc 3120 aggtcaggtt cttggctaaa cacgtagagg ataaacgtga aatagtgatt gcatcgaagg 3180 atttgattaa aagcgaagaa gagaaagaca gtgatggtag tgatgatgac acagacgatg 3240 aggacgagga ggaggtcgat gttaagttag tagtaaacaa gtcaagtgaa gctaaaagga 3300 aattacgtaa gagaaagtgt caaggtgggt ctggtattag caaattatca ccaaaaaaga 3360 aaaggcgtaa aattgaaaag aagaaccaga ttgtggtcta taggcaaaag aagaacaaac 3420 tcatcaagaa ttctattgac agatggtctg cggggaggta ataaagcttt tattagttaa 3480 taaactaaat tcagatcgtc atttgtgtta atatattttt ttgattagtg tctatatgta 3540 gctagctaat ttggttgggt gatttctgtg aaggtataaa ttggctgagg aaaacatgtt 3600 aaaggtaatg aaagagcaaa atgctgtgtt tcgacgccca attttaaggc cagaattgag 3660 agctgaggca cggaagttga ttggggatac tgggctgtta gaccacttgt tgaagcatat 3720 gtcagggaag gtggctccgg gaggagaaga gagattcaga aggaggcata acgcagatgg 3780 agcaatggag tattggctgg agaaggctga tttggttgat atcaggaaag aggctggtgt 3840 gcaggatcct tattggacac ctccacctgg gtggaaacct ggtgataatc ctagtcagga 3900 tccagtttgt gctagagaga tcaaggaact cagagaagaa attgctaaaa ttaaagggta 3960 ctggtccttc tgttttaact aggattgatt gtctttcaat tttgtgtggt cttttagctt 4020 gttagtgctg ttgatctggt aatgcccacc agtttttctc tgttactctt ggggtgaatt 4080 gtgtgcgcta ctgattccat ctctcgcgta tgtgttgttc ttatgggggg cagggagatg 4140 gaggcaatgg tgtctaaaaa acacggggag gaattagcaa tggtggcagc accgaattat 4200 tctcctacaa gtcaggacat ggagcatgac aacttcttaa ttccactgaa ggtaatagat 4260 atgaaagttt gaccagattt ttggactgac ccaagttctt ctcttgacaa tccatgtact 4320 atttttgcag gaaatgtaca ttgatttggt gaataagaag gtaaagatgg aggaacaact 4380 aaaggaaatt tcagaatctt tgtatgggat gaaggtagga gagcatgaga attcttcctt 4440 taataattat cattttcttt tcaattgaag tgtgtaagat ttgatatgaa tgattctttc 4500 cacgttatga cgttctgggt gctactagtg tatataagat tcgttcaaat aagaaattcc 4560 tgggtgattg catgatccac atcattgaaa gatggtagta acaaactgac catctgatgc 4620 atgtatctat tctagataat aagttgatgc ataaattgcc atgaaaccat ttgagaagct 4680 gttatattta gaggcttgat atgggagtgt tgcttattcc agactagatt tttgcaatta 4740 tttagttcaa tttaaagctc aaaatcccac attaaatagt ttcataaatg atgaatgttc 4800 tggcagtgga tttccgttgt ccttggtagt actttctaat ctggacagca tttatattgt 4860 aacaatgata cgcttaatga tgatcttagg atgaattggt tagttatgaa tttagttgtc 4920 cttacagtgc aacggggagg cttggctgca tttattgttg tagcatttaa ttatgcattg 4980 aacgcggtca ttattgtgat gatggaaata tttaattgat gcaggaagaa atggagaagc 5040 taaaaaccag agtggagaaa tcaaacagag cagaatcaac tgaaaagcca gctttattaa 5100 tgggctcaac agagtcaatc acgccagcag gaactggaag aaaggggaaa ggagtaatgc 5160 atcaggaaaa agaagcaacg gttttagggg aatcagcaca agaacaatgc aagtcatcat 5220 caggaggcat catagcacca agaacagaat caccagcacc aacggaggac agggcagcaa 5280 agatagagag gctgaaaagc gggtttagaa tatgcaagcc ccagggaagt ttcctgtggc 5340 cggatatgac taccttaacc cctcaccctc aggttgtggt cctactagaa gacctcattg 5400 cggtacaaac acctccctca gtgtcctcca ctacaccaaa acaatctcac ttcctctttg 5460 ctcctccatc tcaaacccat acaccccacc gtactttccc tgtgaagcca ttagctgaga 5520 gaaggcctgt caccattccc caatccacag ctgccacgac tccaaccagc tgtcctcccc 5580 ttgatcaaat gactcactcc cagtatgaga atagcagcat ttccacttct actaccatca 5640 ccaccactac caaaacccct ctcatcaacc ttaatgagcc actgaatacc aatcaaactg 5700 atgattatgg attgttttat gggtctcagt ctcatgctga agcctctcct caccctgtca 5760 cttaccaaag aagacatcat caaaatgtga ccaccagtat tgccatgcca agtgtatgtg 5820 tacttatcaa atctcaattt caattcatac ccatatttta gtgatactat catagtatac 5880 aagttgactc ctttttcatt ttctgtatgt tttacacagt tgggacccac aaagaaaggg 5940 atgatgagcc aatgggagga aggtgatcgg agaaaaggaa tgataaggta ctgtgagcag 6000 tgtgagcagc aacagggatg ctcctctgcc tcttccattg catcttcttc cttgccaatg 6060 ggaaagggga cttggttggc tctggctact tctaaggctt ccgtggagca caaatctaaa 6120 aggggttaaa caatctataa taataatagt agtagtaata atggctagtt tattatgcta 6180 gagtagttat tagttaaacc cctggaaaaa cattgattag gttgggtttc acttaatgct 6240 ttccctgtct ttgggcaagg aatcttctta acatagttat atacatatgg catatacaag 6300 gcacaaagag cttttagcgt ataggaaaa 6329 <210> 25 <211> 2493 <212> DNA <213> Populus trichocarpa <400> 25 atgtcgtttt ccacgctaag agctcttgtt tctgatcaaa ataaggaatt ctctgattac 60 tctttgtttt ccatgcttaa taatgaagac ccagctgagc atattaaagt gagctctttt 120 tatgaagttg atcactccaa gctgcctcat aaatcccctg atcaactcaa caaaacccgg 180 gttgtgatgg tgaatgaaaa gaccaggatg agagtctcgc tgaggtttcc aagcatcaat 240 tctctaagat gttacttcaa tgagattgaa gctattaatt acaagaaaga catgaaaacg 300 aagaagcagc agctaccagc attcgacgag aaatacatta taggatcaga agttgcaggg 360 gaagctcttt ataggagaat ctcttctcaa gaaatggcag acaagagtta ctcatggagt 420 ttctggatgg ttaaacatcc ttcggtttca cctcgaaaag tgtcataccc acctacaagt 480 actcatgtta ataaatttgt tggtgcaagg aaggtgtctc tcatgtctga gctcaacggg 540 acaggcatgg ttaagtgggg tcagcgccgg caggtcaggt tcttggctaa acacgtagag 600 gataaacgtg aaatagtgat tgcatcgaag gatttgatta aaagcgaaga agagaaagac 660 agtgatggta gtgatgatga cacagacgat gaggacgagg aggaggtcga tgttaagtta 720 gtagtaaaca agtcaagtga agctaaaagg aaattacgta agagaaagtg tcaaggtggg 780 tctggtatta gcaaattatc accaaaaaag aaaaggcgta aaattgaaaa gaagaaccag 840 attgtggtct ataggcaaaa gaagaacaaa ctcatcaaga attctattga cagatggtct 900 gcggggaggt ataaattggc tgaggaaaac atgttaaagg taatgaaaga gcaaaatgct 960 gtgtttcgac gcccaatttt aaggccagaa ttgagagctg aggcacggaa gttgattggg 1020 gatactgggc tgttagacca cttgttgaag catatgtcag ggaaggtggc tccgggagga 1080 gaagagagat tcagaaggag gcataacgca gatggagcaa tggagtattg gctggagaag 1140 gctgatttgg ttgatatcag gaaagaggct ggtgtgcagg atccttattg gacacctcca 1200 cctgggtgga aacctggtga taatcctagt caggatccag tttgtgctag agagatcaag 1260 gaactcagag aagaaattgc taaaattaaa ggggagatgg aggcaatggt gtctaaaaaa 1320 cacggggagg aattagcaat ggtggcagca ccgaattatt ctcctacaag tcaggacatg 1380 gagcatgaca acttcttaat tccactgaag gaaatgtaca ttgatttggt gaataagaag 1440 gtaaagatgg aggaacaact aaaggaaatt tcagaatctt tgtatgggat gaaggaagaa 1500 atggagaagc taaaaaccag agtggagaaa tcaaacagag cagaatcaac tgaaaagcca 1560 gctttattaa tgggctcaac agagtcaatc acgccagcag gaactggaag aaaggggaaa 1620 ggagtaatgc atcaggaaaa agaagcaacg gttttagggg aatcagcaca agaacaatgc 1680 aagtcatcat caggaggcat catagcacca agaacagaat caccagcacc aacggaggac 1740 agggcagcaa agatagagag gctgaaaagc gggtttagaa tatgcaagcc ccagggaagt 1800 ttcctgtggc cggatatgac taccttaacc cctcaccctc aggttgtggt cctactagaa 1860 gacctcattg cggtacaaac acctccctca gtgtcctcca ctacaccaaa acaatctcac 1920 ttcctctttg ctcctccatc tcaaacccat acaccccacc gtactttccc tgtgaagcca 1980 ttagctgaga gaaggcctgt caccattccc caatccacag ctgccacgac tccaaccagc 2040 tgtcctcccc ttgatcaaat gactcactcc cagtatgaga atagcagcat ttccacttct 2100 actaccatca ccaccactac caaaacccct ctcatcaacc ttaatgagcc actgaatacc 2160 aatcaaactg atgattatgg attgttttat gggtctcagt ctcatgctga agcctctcct 2220 caccctgtca cttaccaaag aagacatcat caaaatgtga ccaccagtat tgccatgcca 2280 agtttgggac ccacaaagaa agggatgatg agccaatggg aggaaggtga tcggagaaaa 2340 ggaatgataa ggtactgtga gcagtgtgag cagcaacagg gatgctcctc tgcctcttcc 2400 attgcatctt cttccttgcc aatgggaaag gggacttggt tggctctggc tacttctaag 2460 gcttccgtgg agcacaaatc taaaaggggt taa 2493 <210> 26 <211> 830 <212> PRT <213> Populus trichocarpa <400> 26 Met Ser Phe Ser Thr Leu Arg Ala Leu Val Ser Asp Gln Asn Lys Glu 1 5 10 15 Phe Ser Asp Tyr Ser Leu Phe Ser Met Leu Asn Asn Glu Asp Pro Ala 20 25 30 Glu His Ile Lys Val Ser Ser Phe Tyr Glu Val Asp His Ser Lys Leu 35 40 45 Pro His Lys Ser Pro Asp Gln Leu Asn Lys Thr Arg Val Val Met Val 50 55 60 Asn Glu Lys Thr Arg Met Arg Val Ser Leu Arg Phe Pro Ser Ile Asn 65 70 75 80 Ser Leu Arg Cys Tyr Phe Asn Glu Ile Glu Ala Ile Asn Tyr Lys Lys 85 90 95 Asp Met Lys Thr Lys Lys Gln Gln Leu Pro Ala Phe Asp Glu Lys Tyr 100 105 110 Ile Ile Gly Ser Glu Val Ala Gly Glu Ala Leu Tyr Arg Arg Ile Ser 115 120 125 Ser Gln Glu Met Ala Asp Lys Ser Tyr Ser Trp Ser Phe Trp Met Val 130 135 140 Lys His Pro Ser Val Ser Pro Arg Lys Val Ser Tyr Pro Pro Thr Ser 145 150 155 160 Thr His Val Asn Lys Phe Val Gly Ala Arg Lys Val Ser Leu Met Ser 165 170 175 Glu Leu Asn Gly Thr Gly Met Val Lys Trp Gly Gln Arg Arg Gln Val 180 185 190 Arg Phe Leu Ala Lys His Val Glu Asp Lys Arg Glu Ile Val Ile Ala 195 200 205 Ser Lys Asp Leu Ile Lys Ser Glu Glu Glu Lys Asp Ser Asp Gly Ser 210 215 220 Asp Asp Asp Thr Asp Asp Glu Asp Glu Glu Glu Val Asp Val Lys Leu 225 230 235 240 Val Val Asn Lys Ser Ser Glu Ala Lys Arg Lys Leu Arg Lys Arg Lys 245 250 255 Cys Gln Gly Gly Ser Gly Ile Ser Lys Leu Ser Pro Lys Lys Lys Arg 260 265 270 Arg Lys Ile Glu Lys Lys Asn Gln Ile Val Val Tyr Arg Gln Lys Lys 275 280 285 Asn Lys Leu Ile Lys Asn Ser Ile Asp Arg Trp Ser Ala Gly Arg Tyr 290 295 300 Lys Leu Ala Glu Glu Asn Met Leu Lys Val Met Lys Glu Gln Asn Ala 305 310 315 320 Val Phe Arg Arg Pro Ile Leu Arg Pro Glu Leu Arg Ala Glu Ala Arg 325 330 335 Lys Leu Ile Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met 340 345 350 Ser Gly Lys Val Ala Pro Gly Gly Glu Glu Arg Phe Arg Arg Arg His 355 360 365 Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu Lys Ala Asp Leu Val 370 375 380 Asp Ile Arg Lys Glu Ala Gly Val Gln Asp Pro Tyr Trp Thr Pro Pro 385 390 395 400 Pro Gly Trp Lys Pro Gly Asp Asn Pro Ser Gln Asp Pro Val Cys Ala 405 410 415 Arg Glu Ile Lys Glu Leu Arg Glu Glu Ile Ala Lys Ile Lys Gly Glu 420 425 430 Met Glu Ala Met Val Ser Lys Lys His Gly Glu Glu Leu Ala Met Val 435 440 445 Ala Ala Pro Asn Tyr Ser Pro Thr Ser Gln Asp Met Glu His Asp Asn 450 455 460 Phe Leu Ile Pro Leu Lys Glu Met Tyr Ile Asp Leu Val Asn Lys Lys 465 470 475 480 Val Lys Met Glu Glu Gln Leu Lys Glu Ile Ser Glu Ser Leu Tyr Gly 485 490 495 Met Lys Glu Glu Met Glu Lys Leu Lys Thr Arg Val Glu Lys Ser Asn 500 505 510 Arg Ala Glu Ser Thr Glu Lys Pro Ala Leu Leu Met Gly Ser Thr Glu 515 520 525 Ser Ile Thr Pro Ala Gly Thr Gly Arg Lys Gly Lys Gly Val Met His 530 535 540 Gln Glu Lys Glu Ala Thr Val Leu Gly Glu Ser Ala Gln Glu Gln Cys 545 550 555 560 Lys Ser Ser Ser Gly Gly Ile Ile Ala Pro Arg Thr Glu Ser Pro Ala 565 570 575 Pro Thr Glu Asp Arg Ala Ala Lys Ile Glu Arg Leu Lys Ser Gly Phe 580 585 590 Arg Ile Cys Lys Pro Gln Gly Ser Phe Leu Trp Pro Asp Met Thr Thr 595 600 605 Leu Thr Pro His Pro Gln Val Val Val Leu Leu Glu Asp Leu Ile Ala 610 615 620 Val Gln Thr Pro Pro Ser Val Ser Ser Thr Thr Pro Lys Gln Ser His 625 630 635 640 Phe Leu Phe Ala Pro Pro Ser Gln Thr His Thr Pro His Arg Thr Phe 645 650 655 Pro Val Lys Pro Leu Ala Glu Arg Arg Pro Val Thr Ile Pro Gln Ser 660 665 670 Thr Ala Ala Thr Thr Pro Thr Ser Cys Pro Pro Leu Asp Gln Met Thr 675 680 685 His Ser Gln Tyr Glu Asn Ser Ser Ile Ser Thr Ser Thr Thr Ile Thr 690 695 700 Thr Thr Thr Lys Thr Pro Leu Ile Asn Leu Asn Glu Pro Leu Asn Thr 705 710 715 720 Asn Gln Thr Asp Asp Tyr Gly Leu Phe Tyr Gly Ser Gln Ser His Ala 725 730 735 Glu Ala Ser Pro His Pro Val Thr Tyr Gln Arg Arg His His Gln Asn 740 745 750 Val Thr Thr Ser Ile Ala Met Pro Ser Leu Gly Pro Thr Lys Lys Gly 755 760 765 Met Met Ser Gln Trp Glu Glu Gly Asp Arg Arg Lys Gly Met Ile Arg 770 775 780 Tyr Cys Glu Gln Cys Glu Gln Gln Gln Gly Cys Ser Ser Ala Ser Ser 785 790 795 800 Ile Ala Ser Ser Ser Leu Pro Met Gly Lys Gly Thr Trp Leu Ala Leu 805 810 815 Ala Thr Ser Lys Ala Ser Val Glu His Lys Ser Lys Arg Gly 820 825 830 <210> 27 <211> 914 <212> DNA <213> Rat <400> 27 ggatcctgaa gctcgaaaaa caaagaaaaa aatcaaaggg attcagcaag ccactgcagg 60 agtctcacaa gacacttcgg aaaatcctaa caaaacaata gttcctgcag cattaccaca 120 gctcacccct accttggtgt cactgctgga ggtgattgaa cccgaggtgt tgtatgcagg 180 atatgatagc tctgttccag attcagcatg gagaattatg accacactca acatgttagg 240 tgggcgtcaa gtgattgcag cagtgaaatg ggcaaaggcg ataccaggct tcagaaactt 300 acacctggat gaccaaatga ccctgctaca gtactcatgg atgtttctca tggcatttgc 360 cctgggttgg agatcataca gacaatcaag tggaaacctg ctctgctttg ctcctgatct 420 gattattaat gagcagagaa tgtctctacc ctgcatgtat gaccaatgta aacacatgct 480 gtttgtctcc tctgaattac aaagattgca ggtatcctat gaagagtatc tctgtatgaa 540 aaccttactg cttctctcct cagttcctaa ggaaggtctg aagagccaag agttatttga 600 tgagattcga atgacttata tcaaagagct aggaaaagcc atcgtcaaaa gggaagggaa 660 ctccagtcag aactggcaac ggttttacca actgacaaag cttctggact ccatgcatga 720 ggtggttgag aatctcctta cctactgctt ccagacattt ttggataaga ccatgagtat 780 tgaattccca gagatgttag ctgaaatcat cactaatcag ataccaaaat attcaaatgg 840 aaatatcaaa aagcttctgt ttcatcaaaa atgactgacc tagttctaga gcggccgcca 900 ccgcggtgga gctc 914 <210> 28 <211> 5807 <212> DNA <213> Arabidopsis thaliana <220> <223> DYAD Genomic sequence used for cloning as a Sal1 fragment <400> 28 gtcgactttt tgtttgacca gtgtatttgg tttgacttca gatttggcaa gtacgaagct 60 tatgcgcttt tgcaatcgaa acaagggaaa aatctgtact ttgttagctg cgtgacttga 120 gctctttggt ccggagacgg tagaagacga caaagcactg acctttcatc tctcggcgat 180 cgaaaaaatc actctctttc ctcatcagac ccgacccgtt atgaaggtat ccagacccgt 240 ttattttgat ccatctcata gtcggatccc caaaaaaatt cagcttagat tggcccattt 300 aggcccgttt acagtttttt acttttttct taattatctt tttaacatct tacattatac 360 atatttgact caacaaaaaa atataactta aatgtattgt tgactgtttt tgataattaa 420 gaaaaaaata tttttaaatt attaaaaata ttgttgactc aacaaaaaaa tataacttaa 480 atgtattggg caaataatca tggtcataag tcctcaagct tattatttgt tttgattggt 540 ttaaatactt tataaaaaaa atatcaatta tatcatgtta ttacgtaaat taagcttttt 600 gattttaaaa aagcttcagc tcaataaaga aaaacagatt cagttatcat tggagtataa 660 aattggtcga tacattagag acattaatcc ttacatcata aacaatttaa tgtgaataaa 720 acatcataaa tcacatatca ttatccgaaa ataatcatat gtaagaataa tcactgtgac 780 aaaaaaaaaa aacaattcct cacgtgtgta gtcggtcccc actctagtag cagtagctta 840 atgatgcctt ctccgcacgt gtaacacgaa atttattcgc tacggccaat tacattaacc 900 ttcaggtctt atcaccgtta aattttcaaa atgacacacg tggcatcaat ccgtaatatc 960 actacgtctg ctttcaatct ttcattgtag atgatttcgt acaccaattt ccgcgaacgt 1020 ttacagttta gatacagttt gagggcaaat ctgtcaatat acgccaactt gctgcgaaag 1080 caatatagtc acgtgccgtg cacacgcata taagactcac acactcacac cactctctct 1140 ctctctctaa cctcatatat aaagccacct cccagattca ttaaatgcga catttcaaaa 1200 cttttctttt tgctgtcttc cccataagct ctctgctgat taaaaagatt ttctggtata 1260 aaacaaaatt cttcaaatat ttctgggttt atgttttctc tctatttctc agaaatgctt 1320 taatttctcc atccgcgtcc atgttttttt ttctccgttg ctgattttga tttttttaat 1380 ccagtgaaaa ggaggaacga agattatcga gagcaaaaat catgagtgta agatctctct 1440 cgctctcaga ttttattttt tttcgctgtg atataaatgg ctcagtcact atcagtctca 1500 tgatgagaaa aataaaactc atcaccgctt gattctgttt ccttagtgtc tcccacgcgc 1560 gtaccagaaa gcgcgtgtgt gtttcttgtt atactcgcag agtcaggttt tttcaaatat 1620 attctctcca ggcagcagca acaacaacaa accgattttt tcattattcc ttataacaat 1680 ttttgattct ccagaaaaaa aatatctctc ttagtttttc tcttgttcta cagagtacga 1740 tgttcgtgaa acggaatccg attagagaaa ccaccgccgg gaaaatctct tcgccgtcgt 1800 caccgacttt gaatggtaaa ctactgaagc tatagtttct tcgtttttgt tgattttctc 1860 gcttctcttc taatttctga atttttggtt tgggtttgtt cttacagttg cagtcgcgca 1920 tataagagct ggatcttatt acgaaatcga tgcttcgatt cttcctcaga gatcgccgga 1980 aaatcttaaa tcgattagag tcgtcatggt attcactcga ttctctgctt ttttcacctt 2040 ttattataga cagatctcgt tttttgttgt tcgtctgggt tttcgagtga ttttttaagg 2100 tttattgatg caggtgagca aaatcacggc gagtgacgtg tctctccggt acccaagcat 2160 gttttcactc cgatcgcatt tcgattacag taggatgaac cggaataaac cgatgaagaa 2220 gaggagtggt ggtggtcttc ttcctgtttt cgacgagagt catgtgatgg cttcggagct 2280 agctggagac ttgctttaca gaagaatcgc acctcatgaa ctttctatga atagaaattc 2340 ctggggtttc tgggtttcta gttcttctcg caggaacaaa tttccaagaa gggaggtggt 2400 ttctcaaccg gcgtacaata ctcgtctctg tcgcgctgct tcaccggagg gaaagtgctc 2460 gtctgagctg aaatcgggag ggatgatcaa gtggggaagg agattgcgtg tgcagtatca 2520 gagtcggcat attgatacta ggaagaataa ggaaggtgag gagagttcta gagtgaagga 2580 tgaagtttac aaagaagaag agatggagaa agaagaggat gatgatgatg ggaatgaaat 2640 aggaggcact aaacaagagg caaaggagat aactaatgga aatcgtaaga gaaagctgat 2700 tgaatcaagt actgagagac tcgctcagaa agctaaggtt tatgatcaga agaaggaaac 2760 tcaaattgtg gtttataaga ggaaatcaga gaggaagttc attgatagat ggtctgttga 2820 gaggtaaaat gcataaaaat taacgaattt tatgatctct gaatttggat tttccttggt 2880 tctattgatt gattgtggtt aattttgaag gtacaaacta gctgagagga acatgttaaa 2940 agtgatgaag gagaagaatg cagtgtttgg caactccata ctcaggccag agttgaggtc 3000 agaagcaagg aagctgattg gtgacacagg tctattggat catctgctta agcacatggc 3060 tggtaaggtg gctcctggag gtcaagatag gtttatgaga aagcacaatg cagatggggc 3120 aatggagtat tggttggaga gttctgattt gattcacata aggaaagaag caggagttaa 3180 agatccttac tggactcctc cacctggttg gaagcttggt gacaaccctt ctcaagatcc 3240 tgtctgcgct ggagaaatcc gtgacatcag agaagaatta gctagcctga aaaggtagaa 3300 aagttattga attggttata cgatcatctc cctttagttg tcttattgca attttaactc 3360 atgtctgtct tggtcttgag aagagaattg aagaaacttg cgtcaaagaa ggaagaggag 3420 gagcttgtta tcatgactac gcctaattct tgtgttacta gtcagaatga taatctgatg 3480 actccagcaa aggtaagagc tcgaaacaat agctgaggcc tctctcttgt gaaaatgttt 3540 tatgctactt tgtgaacatc tctgctgctt tttcttagga aatctacgct gatctgctga 3600 aaaagaaata caaaattgag gaccagctag tgattattgg agaaaccttg cgtaaaatgg 3660 aggtatgtat atccctagat tgagtttcca agtagacaca aacccttact taaaatgtaa 3720 aatcttgatt tagtaactat cacaagtagt cataggaaac tcccttggag gataacagtg 3780 aaccatgtaa aatgggccca tttagcgtat gtgataaatg atttcctctg tctctatgag 3840 agaccacttt gctgatagtc gaataatgat gaaacatttg tgttactata aatgcaaata 3900 ttgcaggaag acatgggatg gcttaagaaa acagtggacg agaactatcc taaaaagcca 3960 gactcaacag agacaccttt gctactagag gattcaccac caatacagac actagaagga 4020 gaagtgaagg tggtgaacaa gggtaaccaa atcacagagt cacctcaaaa cagagaaaaa 4080 ggaaggaagc atgatcaaca agaaagatca ccactttcac taataagcaa cactggtttc 4140 agaatctgca ggcctgtggg gatgttcgca tggccccaat tgcctgctct tgctgctgct 4200 actgatacta atgcttcttc gccaagtcac agacaagcct acccatcccc ttttccagtc 4260 aagccacttg cagctaagcg tcctcttggc ttgacgtttc ccttcaccat catacccgaa 4320 gaagctccca agaatctctt caacgtttga agttgtcact ggaaactgat gcatcagatc 4380 ttactttccc tacaagtaag ctgatgtgaa ctggtaaggt ctcttccatg aaatatataa 4440 taacttacaa gcgagcaggt atttaaaagt accacttata tttatataag gaactatatt 4500 tatgggaata atttggcaac tttttgaaat tattcctctt taatttaggg attttacgtc 4560 tctggttatt aattatatat agagagagat gatttgaaat agagaggctt atcataggaa 4620 tatattcttt tgaaagacag ggatcatcat attctgtatt actgaacaat ttctataatg 4680 atacagttat atatatatat atatacttat tattcaattc ctagcgcttt tgattttaaa 4740 tatattattt tcgtgtagtt gattaatttt gaaaaacttg tattacgcat atgaattatg 4800 tcccgttgat ctataaaaat catattttgc gattaagcac aaactataaa agtatgttta 4860 agttcctgcg ggttgaccag tttcacttta aaatcttggt ctttgggatg agtttgccga 4920 taaattttgt gacttatggt tatctaataa tacgaatgtt atactttcca aaatttgaaa 4980 aaaacaatat gaatacttta ttattatctt tttccttcca tttctcttcc cgcgttttgt 5040 tgttcgaccg atcttgtagt acatgtgttc taatttgaac gtcgagaacc attaaagaag 5100 gaagaaagaa aagaaaaaaa aaaacttttt tctcatttcg agatttccta accatttggt 5160 ggtgcaggtt taagtttcgc tcgctctcct aaaaccaaac gtccaaaccc gttctctaga 5220 ctagttctgc tgcgaaacac gacacacacc aagtcaccaa tattacttga atccacgtca 5280 aataaacaat ggtcattcaa tatggttaat gcaacactcg agtaacttta ttttcaaaga 5340 aatttgcaca aagtcatgtt atgatatggt gtataatatt tgtgtatata tccggccaaa 5400 aaacataaca agttttttat aaaaaaaaaa attaattata tatctaaaat atagaatagc 5460 tagtaataaa actagtgaga aacaaattta aaacaaatta agcaactatg ttatttgcca 5520 aattgacaat tttaaatatt atggcgtatt taaaaaaaat taggagccac ttgtgattta 5580 tttgtatcaa ctagtaaatt ttaaacataa aaatcattta taaatataaa taaatattat 5640 catatttatg tagaaagagt ctcatcagtc tgatagtcaa tcacttgtgc gcaaagaaat 5700 ttgacgaaag gggttacaaa aaaatggcca gcacagcatc atcatgtccc cgaccttata 5760 ttataagatt tgtatatttt atccataaat tgtatataac cgtcgac 5807 <210> 29 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Microsatellite marker primer <400> 29 gacatgattt aacataatgc caatta 26 <210> 30 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Microsatellite marker primer <400> 30 cgaatagaaa ctcatttagg aacct 25 <210> 31 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> SNP KNEF <400> 31 cgtctctaag ttgtttaagg ggtta 25 <210> 32 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> SNP KNER <400> 32 tcacgcaagt taattatgta agatga 26 <210> 33 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> SNP KKF <400> 33 aaagagagta gaactcgctc aatgt 25 <210> 34 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> SNP KKR <400> 34 tatcaacagc tcgttactgg actg 24 <210> 35 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer bdy1 <400> 35 catgaggtgc gattcttctg taaagc 26 <210> 36 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer BDY3 <400> 36 ggaagaggag gagcttgtta tcatgac 27 <210> 37 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer ismr4 <400> 37 tccgcgaacg tttacagttt agatacag 28 <210> 38 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer OCSR <400> 38 gaaccgaaac cggcggtaag g 21 <210> 39 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer Bho5BAM <400> 39 cgggatccga tctgatgcat cagtttcagg tg 32 <210> 40 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer Bho3BAM <400> 40 cgggatccga gcaaaaatca tgagcgtaag at 32 <210> 41 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer 5RF3 <400> 41 agtacgatgc tcgcgaaacg gaatc 25 <210> 42 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer DyPB <400> 42 aaaactgcag ggatccccaa cgttgaagag attcttggga gc 42 <210> 43 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer DyCF <400> 43 ccaaatcaca gagtcacctc aaaacag 27 <210> 44 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer GRrev <400> 44 gtaaaaccgt tgccagttct gactg 25 <210> 45 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer Ds5-2 <400> 45 cgttccgttt tcgtttttta cc 22 <210> 46 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer GLTF <400> 46 aatgcacccg aaagtctatt tgc 23 <210> 47 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Primer PDYBAM <400> 47 acggatccta gaacaagaga aaaactaaga gagatattt 39 <210> 48 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer PG2R4 <400> 48 tctggggctc gtcgactttt tgtt 24 <210> 49 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer KanF <400> 49 gccaacgcta tgtcctgata g 21 <210> 50 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer KanR <400> 50 gattgaacaa gatggattgc ac 22 <210> 51 <211> 803 <212> PRT <213> Oryza <400> 51 Met Asp Ala Glu Met Ala Ala Pro Ala Leu Ala Ala Ala His Leu Leu 1 5 10 15 Asp Ser Pro Met Arg Pro Gln Val Ser Arg Tyr Tyr Ser Lys Lys Arg 20 25 30 Gly Ser Ser His Ser Arg Asn Gly Lys Asp Asp Ala Asn His Asp Glu 35 40 45 Ser Lys Asn Gln Ser Pro Gly Leu Pro Leu Ser Arg Gln Ser Leu Ser 50 55 60 Ser Ser Ala Thr His Thr Tyr His Thr Gly Gly Phe Tyr Glu Ile Asp 65 70 75 80 His Glu Lys Leu Pro Pro Lys Ser Pro Ile His Leu Lys Ser Ile Arg 85 90 95 Val Val Lys Val Ser Gly Tyr Thr Ser Leu Asp Val Thr Val Ser Phe 100 105 110 Pro Ser Leu Leu Ala Leu Arg Ser Phe Phe Ser Ser Ser Pro Arg Ser 115 120 125 Cys Thr Gly Pro Glu Leu Asp Glu Arg Phe Val Met Ser Ser Asn His 130 135 140 Ala Ala Arg Ile Leu Arg Arg Arg Val Ala Glu Glu Glu Leu Ala Gly 145 150 155 160 Asp Val Met His Gln Asp Ser Phe Trp Leu Val Lys Pro Cys Leu Tyr 165 170 175 Asp Phe Ser Ala Ser Ser Pro His Asp Val Leu Thr Pro Ser Pro Pro 180 185 190 Pro Ala Thr Ala Gln Ala Lys Ala Pro Ala Ala Ser Ser Cys Leu Leu 195 200 205 Asp Thr Leu Lys Cys Asp Gly Ala Gly Trp Gly Val Arg Arg Arg Val 210 215 220 Arg Tyr Ile Gly Arg His His Asp Ala Ser Lys Glu Ala Ser Ala Ala 225 230 235 240 Ser Leu Asp Gly Tyr Asn Thr Glu Val Ser Val Gln Glu Glu Gln Gln 245 250 255 Gln Arg Leu Arg Leu Arg Leu Arg Leu Arg Gln Arg Arg Glu Gln Glu 260 265 270 Asp Asn Lys Ser Thr Ser Asn Gly Lys Arg Lys Arg Glu Glu Ala Glu 275 280 285 Ser Ser Met Asp Lys Ser Arg Ala Ala Arg Lys Lys Lys Ala Lys Thr 290 295 300 Tyr Lys Ser Pro Lys Lys Val Glu Lys Arg Arg Val Val Glu Ala Lys 305 310 315 320 Asp Gly Asp Pro Arg Arg Gly Lys Asp Arg Trp Ser Ala Glu Arg Tyr 325 330 335 Ala Ala Ala Glu Arg Ser Leu Leu Asp Ile Met Arg Ser His Gly Ala 340 345 350 Cys Phe Gly Ala Pro Val Met Arg Gln Ala Leu Arg Glu Glu Ala Arg 355 360 365 Lys His Ile Gly Asp Thr Gly Leu Leu Asp His Leu Leu Lys His Met 370 375 380 Ala Gly Arg Val Pro Glu Gly Ser Ala Asp Arg Phe Arg Arg Arg His 385 390 395 400 Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu Pro Ala Glu Leu Ala 405 410 415 Glu Val Arg Arg Leu Ala Gly Val Ser Asp Pro Tyr Trp Val Pro Pro 420 425 430 Pro Gly Trp Lys Pro Gly Asp Asp Val Ser Ala Val Ala Gly Asp Leu 435 440 445 Leu Val Lys Lys Lys Val Glu Glu Leu Ala Glu Glu Val Asp Gly Val 450 455 460 Lys Arg His Ile Glu Gln Leu Ser Ser Asn Leu Val Gln Leu Glu Lys 465 470 475 480 Glu Thr Lys Ser Glu Ala Glu Arg Ser Tyr Ser Ser Arg Lys Glu Lys 485 490 495 Tyr Gln Lys Leu Met Lys Ala Asn Glu Lys Leu Glu Lys Gln Val Leu 500 505 510 Ser Met Lys Asp Met Tyr Glu His Leu Val Gln Lys Lys Gly Lys Leu 515 520 525 Lys Lys Glu Val Leu Ser Leu Lys Asp Lys Tyr Lys Leu Val Leu Glu 530 535 540 Lys Asn Asp Lys Leu Glu Glu Gln Met Ala Ser Leu Ser Ser Ser Phe 545 550 555 560 Leu Ser Leu Lys Glu Gln Leu Leu Leu Pro Arg Asn Gly Asp Asn Leu 565 570 575 Asn Met Glu Arg Glu Arg Val Glu Val Thr Leu Gly Lys Gln Glu Gly 580 585 590 Leu Val Pro Gly Glu Pro Leu Tyr Val Asp Gly Gly Asp Arg Ile Ser 595 600 605 Gln Gln Ala Asp Ala Thr Val Val Gln Val Gly Glu Lys Arg Thr Ala 610 615 620 Arg Lys Ser Ser Phe Arg Ile Cys Lys Pro Gln Gly Thr Phe Met Trp 625 630 635 640 Pro His Met Ala Ser Gly Thr Ser Met Ala Ile Ser Gly Gly Gly Ser 645 650 655 Ser Ser Cys Pro Val Ala Ser Gly Pro Glu Gln Leu Pro Arg Ser Ser 660 665 670 Ser Cys Pro Ser Ile Gly Pro Gly Gly Leu Pro Pro Ser Ser Arg Ala 675 680 685 Pro Ala Glu Val Val Val Ala Ser Pro Leu Asp Glu His Val Ala Phe 690 695 700 Arg Gly Gly Phe Asn Thr Pro Pro Ser Ala Ser Ser Thr Asn Ala Ala 705 710 715 720 Ala Ala Ala Lys Leu Pro Pro Leu Pro Ser Pro Thr Ser Pro Leu Gln 725 730 735 Thr Arg Ala Leu Phe Ala Ala Gly Phe Thr Val Pro Ala Leu His Asn 740 745 750 Phe Ser Gly Leu Thr Leu Arg His Val Asp Ser Ser Ser Pro Ser Ser 755 760 765 Ala Pro Cys Gly Ala Arg Glu Lys Met Val Thr Leu Phe Asp Gly Asp 770 775 780 Cys Arg Gly Ile Ser Val Val Gly Thr Glu Leu Ala Leu Ala Thr Pro 785 790 795 800 Ser Tyr Cys <210> 52 <211> 5335 <212> DNA <213> Z. mays <400> 52 gtagagatgg caatgggtac ccgaaacccg aatacccgac gggttttccc cgatatgaag 60 gcgggtacgg gatgatttct ctacccgcgg gtatgttaat gggtaaaaaa ctctacccgt 120 tgggtagacg ggtacggata tgggttggta cgtctatccg tgggtaaaat atacccgcat 180 caataacact ataaacatct aatagagtcc aacttagcta gaataaaatc cttctctagt 240 tatcatttat ctagatacca agttatgtaa tcatatgatt tgttatatgt gaaattgaag 300 ttgtttttat atgtttattt aatattttga gtgattggta tattggaatt taattctttc 360 cgagcgggta cgggttaccc gatgggtaaa aatacccgcg cggatacggg tatgggtaag 420 attttatacc cgcgagcata tatgggtaac ctgacgggta gatttttttt tgatgggtac 480 gggtatagaa tggtactacc cgacgggtat gtacccgttg ccatccctag acacgagcat 540 gctacggaag gagcggtggg aggtcttagg ctggtgccaa tgggggctag aagggaggcg 600 agaagggccc tctaccgccc cgcgcgaggc gataggcagg cgagagggag agagagggcg 660 acagcactca cgcccggcga gagcgggcga tatcgccccg ctctcgcccg cgttggcgcg 720 cgcgtctggg cgagagggag gcgagaggga ggcgagaggg gggcgacgca ctgacggggc 780 gagagtgagg cgggcgagag tgcggtggcg cgacgtgatt ggtccacgtg tgccacgtgg 840 actagccgtt ttttaccgtt tggagtccaa aaaattcgaa aaaattgcaa aaaatcacaa 900 atttcattcc caatccatct ataaatatcc ctacctgttg gaggtcataa ttagatttat 960 gtaattttct attaattgtt atgtaatttt ttaattgtca tgtacttttc ttttaattat 1020 tatacacttt gtaattttaa attcaataaa aaatattatg ttgtgtgatt tgtaagcgtt 1080 gaaacaaatc tgtgtgaatt atttaatcct gaaatagaaa agctgatgtg gctatgggct 1140 gaggctatag cctgctacag cctgtgcact ggagcagcag aggcgagagt ggaggcgaga 1200 gctgacgtgg caggggcgag agagaggctg tgcactggac tcagcctaac tgcaactgga 1260 cttgcactgc tggagcgaga aggaaggcga cgcaccaacc aaccggtaca gcgctgcgag 1320 aacaagtgaa caaccaaacg caccaggcgg gggtctccgt ctctatagtt gggatttggg 1380 aacagttccg tcactgtgtg ttactgttac cgcagtgaaa gactgatggg ctcttgggtc 1440 ggtggatcct gtacgaaaga ctgatgggct cttgactgcc aagtcagcat atgttgcaca 1500 attttgagga tcttttttgt ccttttaatg catcaaccat ttggagccct catgcggagg 1560 gaaagcagga attcttcact ggctgctcat tcaaaaacaa gattctaaca gctgacaacc 1620 ttacctggag gcattggccc tgcaacccgg tctgcactct atgcaatcag gattgggaag 1680 acagctatac atctatgctt caaatgtcct tttgcctcac atgtttggga ttctttaaga 1740 atctggtcca ataatctcat tcaacatcct agcactagca gcgacgtcca aagcattgtt 1800 gactggtggc tgcgatcttc tatgcataga accaaaagca tccacagaac ggtggcaggg 1860 attaaaatct gagtgaggtc ccagcttaga tctcaatcta tcttgctgtt gtgcggctgc 1920 gccttgtaaa tagctcctgt aaccttccct ctgtacgact caatctcctt tcattcttat 1980 atgaattagc agtgctcctg ctactttttt caaaaaaaaa tcaccagcat caagaacata 2040 cagattgtaa ggggaaatta aatatcacca atatatatat gcccgaaaaa attggtcaca 2100 cttaatatgt agtgcagcag gcatacaaga atgacccggt atattctata acatgactct 2160 atatgcccta tggtgccagc aaaatcgaca catctcaact ccaaatgtgt catgcaccat 2220 ggacagggga gaatgggaga tgaccatacc caactgactt actgaagaga ccaatccaat 2280 gcaacgactt tagcttcaac ctgagaatta actagaaact gacgaacctg agatggctac 2340 ggaagtacga ttatgccaca aagactgctc aagtgagttc atattccctt tttcttatct 2400 tttttctctc tctctttttt tctctctctc tctgtattta cgctacgtgt tgctcctttg 2460 ttacaaagac agaaaattgg agcaccctga ggccaaccat ccaaagcttt gcttgcagat 2520 ggggaagagg cgatgatcct gaagtggaaa ggtaggagta ggtcagcagt aggatggagt 2580 agccagggcc agctcggttc ccaccgcgct gatcccgccg gcgtctgcat cgaacaggac 2640 cctcttcccc tctagcaggc cggaaccgca ggccccggac gatgacgacg aggtgtcctg 2700 cacagcccac gatcagtcga acatgaatca gcttgcacgt ttcttgactg gttatggtta 2760 gctagtagcc tagtactaat gcttgccgac agcaatggaa cagcaggcca gagtccagac 2820 tatagaacca gaggataaag agaaagcaag caaagtggac ttaccacatc gcgtcgagtc 2880 aggccggaga aatgcatcag cttttgggga ctaaacccag aagcagcagc agtaacagtg 2940 tcaaacagct tctgcggctg caggggcgac ctcgggctgg gcagggacag ctgcagcttg 3000 gcagcgtcgt tggtggacga cgccgagggc ggcgtagaga agtgggcgcc aaacatcacg 3060 tgctcgtcca ggccggacgc cgccgccacc acctcaactg ggcctcgcga cgaccgcggg 3120 aggcccggca tactggggaa actggtgctg cgagggatcc ccgggcctgg cgtggcggcg 3180 gccgggcagg tgctgctggc gcccctgccg atggtcatgc cagacgccat gctcggcaac 3240 aggaacttgc cctgtggctt acagacgcgg aagctgctct tcctttccgc cctgtcttgg 3300 ccgccttgga tgacggtgcc ggtcatctgc tcaccggaag caacgaacag tgctgtgcgg 3360 ggaacagctt cacttggagc cagttccagc ttcagagcca ctaccagctg atcctgcacc 3420 actcaattct gtttacttca actcatggaa gatgtcagat gtacatttgc ataggctgag 3480 aaaaatcaat aaaaagagtg cattgccata caaggagcta ccttgaaaga aaggaaggag 3540 ctggagaggt aggtaacctg ctcctctaac ttatcattct tgtcagctat atgctcgtac 3600 ttttcctgaa attaaacagt ggttcactaa ctgtatttgg agttacacgg atctagcagg 3660 caaaatgtgc ataggaatag atgctacaga taaaaaagat cattgtgaat gtcatagctg 3720 tctcctgtct gcatgaatgt accttgaagg atgacacctc cttcttcagc tcaccattca 3780 tctgaaccac attctcacac atgtcctgaa aataaaaggc aatatcattt ctgaaaattc 3840 agcaagcaga cttagcaaag acatagcttt ttattttgca aggatatcga agtcatagct 3900 tccctgtaaa tttaataagt gaagacaaat caataacggg catggtttct cagttctcat 3960 tttgtttgaa attactgaag ccaaattagt aacaggcata gtttctcggt tgtcatttag 4020 tttgaaacta actaccacat ttttcctagc agacaatgtt gctgcatcca tgcgcttacc 4080 ttcaaacaga gcacctgctt ctcaagcttt tcattagccc tcacagcacg ctggtacttc 4140 tcctgacaaa caaattgata agctttcatt agtgcatcca aaatgggcat gccaaatagt 4200 ttctatcagt tagtatagtc aatgtgagaa gtaaaacaga gaaactgtag ttcatgctag 4260 tcagatcatg cacatcagta catcctggat tcagaatttc agagactgga caaggaacta 4320 gctatgttct tacagacagc aagcattatg aaacatcaga gaaactgaac cgggagtcca 4380 ggactggcat tctattctag cacttcaaaa aacctcccgt caacatacga aatgatgtac 4440 atgacttgca caacccaacc caacatacag aaacatggaa aatgctctaa tgcctatgat 4500 tttccaaaat aaagagaggt gcaaatacat atccaagtat acagaaatat ccacatcagt 4560 gccactacca tatcttgctc agtttaatca gaagcagcag ccttcaaaag ttaagggaac 4620 aacgaattgt aacagggtaa aggagctgat cttttgcata ctttcaatga actgtagtct 4680 ctctctgcac cgaagtcccc atcatccttg cacaataact gctccatttg ccttcacaca 4740 ccaccacaag aataacttgg cataaaactc agaagaaacc ccttgtctat gtaagaactt 4800 agcagggtcg tagcactgat ggcttgaatt gccataaaac tatatattat agagtgcaga 4860 cagacaaaag gagtagaaaa agatatacct ttttacgcca ttgacctcct cggtgagctc 4920 ctcaacctgc ctcttgacta gaatgtcgcc ggcgacgagg gacacatcat cacctggttt 4980 ccatcccggc ggtggcaccc agtatggatc agatacaccg gcctgtttcc gtacctcagc 5040 aagctcggct ggctcaagcc agtactccat ggcaccatcc gcattgtgcc ggcgacgaaa 5100 ccggtgaacg ctgccttccg gcacccggcc agccatgtgc ttgagcaggt ggtcaaggag 5160 gccggtgtcg ccgatgtgct tgcgggcttc ctcccgcagc acctgccgca tcaccggtgc 5220 gccgaaccgt gcgtctcggg agcgcatgat gttgagcagg ctcttctctg ctgcggcgta 5280 gcgctcggct gaccaccggt ccttgccgtg cccgagggtc accgtccttg gattc 5335 <210> 53 <211> 4862 <212> DNA <213> Z. mays <400> 53 gcgcgcggcg tggttgctgc tcatgacgaa gcgctcgtct agttccggtc cggtgccggg 60 tgccgggtag gaggagaaga agctgcgcag cgcctgaagg gacgggaatt tcactgtgat 120 gtccaggttc gtgcactcgc tcacctaggt acaggccaga acttgctcaa acatatgcta 180 aacaaacaga ttaagaaatt gagagcagaa attgaatccc agaaagaaaa atctcacctt 240 aaccacccgt atggatttca gatggattgg ggatttaggg ggcaatttat cgtggtcgat 300 ctcgtagaaa gctcctgatg gaaatcgaac caatttacac aagtgtcaga tactcaggtg 360 ggcgtggcat gaataatagt agtgttaccg tgttgcatcg tatatgcccg tgctcaccag 420 cgtggtatgt ggggatggcg tcgaaggtca ggctctgtct gctcaggggc gacctgggtt 480 gaatcgtgga gtcgtggttg acatcatcct taccatttct gctatgacta ctgctcgtct 540 tcttcttgaa gtagtacttc ttcacctgtg gcttcttgtg atttgcaatg gtcacacaaa 600 caacgggtga gaccgagacg tgtatgattc ttggaaacaa aattatacac tgaaatggtc 660 aagttttttt ggagattgag agcgcgtgca tgtgcatggg agaactagtc tcgggaaaga 720 cagacaacag tcaacataat gtaccactgg accaacagaa atgaaaagag acatgcaaag 780 ggaacataca ggtacttttt aacatgaaga ctgccggttc gttaccataa ataatcatca 840 cctatcctaa aatgggttaa caaaaataac gaacggctta acaattaata aatatttatt 900 aagtcattta aggtgaatga tcattatctt gggtaacaaa tagtgttgtc tatatataca 960 cacaaattaa aattgaggtg tatatatata tatatagccc aaagacaaag tcaacttgaa 1020 atgttcaacg ataatggcaa gtggactaca gtatacaaag ggacaaattg tatagctatc 1080 taggaccttt ttaaaaaaat aaataaaaag caagcactat aaccatgcta attatagtgc 1140 gtgggttgat tcaaaacaac ccaacatcac gtcttcgtga aaaaaaaaga ataataacac 1200 tgatccagct agtggcacga atgtctagag ttcaattgca caaagaatcc caaataaaca 1260 aaagagagag agaaaaagat gcattatcca ttgtctgtag aaattagcac ataaaactca 1320 acatgcctag ggtgtttaat tagtttaaca acaatgaacc tgtttggaaa caccatagtt 1380 ttttttaaaa atgttttcta tattcagttt gtagaatgaa actggtttgt aaaaaaaact 1440 aagtgtgcat gtttggaagc cagttttttt aaaaacaatt tctaccattt ctgatacaca 1500 gagtaattga ttatattatc ccctttttat ttgttgccat atataaataa tataggttaa 1560 actcatattt ttaattcaaa attttcaaat aattaaccat tcaaatccga tagagcagac 1620 atcgagatga tcgcatgcat aggtctggag cggtggcaat caccataatt tccacaaaac 1680 caactaagaa cagtacgaaa tttgcgaggc aaaaaaccgg ttttaaatag aaaaggctag 1740 cttcctggtt tattagaagc tgggaatcca gttttttgaa actggagcaa aaaaattggc 1800 atgtttgaaa gcaccctagt ttctataatc tattttttca aagctgggtg tgcttccaaa 1860 cagaccctat taattgttac tccctccgtt tcgttttagt tgtcgctgga tagtacaaaa 1920 ttgaactatc cagcgacaac taaaaagaaa cggatggagt attcttttaa cagccatgtt 1980 ccctcatcag ctaccaatgc acgtataatt aactgaacaa actagtagta cgttgtactg 2040 tcctctagta gagtccatat ataggcaaca ctatagaaag tacactattc caaatcaagc 2100 aacggttcag caattttcaa aatgccgcac ttaatgtgct cagcagattt taacaaggct 2160 cacgttggag aaatgaccat gccttgctgt tttcacacta actatttttg tcaacctata 2220 tatagcattc atgcacttgt attaaaataa gcaagatcag tctaacaagt tgaacccatc 2280 agcggctctt gagtccagat aactaccacg gacaataaac tacttgcgag agcatcaaat 2340 caaaggatat atcgactaca gtacatctca gtaactatac atctcaaatt aaacatcgat 2400 ccagcgaaat atcgaattaa tcacccaaaa agcaactaat aaagcggcgc acaatatcct 2460 atatcattgt aactgaccgc gcgcagccgc agcagtaggt cagtggaaag agaaaccaac 2520 agatcaccac catacccaga tcacagaaag caaaaggtaa taatcgaact ggcaaaagtc 2580 gcagctagcg tctacgacgt gtagcaagac cggactggcc cgacacgtac gtaccggcga 2640 tgcctgcagc tgcagatgag ccgcgagcgc aggacccgcc tgcaccgtct ctacgtccat 2700 ctgcatgcgg gtcctcagag ttttttttgg gtctcctgca aaagcaaacg ggcaaacaaa 2760 cccaccgatc aagacaagta tatatatata gttcaaaaag agttaagcaa gaaggacaga 2820 gacccttcga tgatcgaaat gataacaaat tttcgaaacc catccaaatt gacccgcata 2880 tagatgaact aataataatg cgcactggca ttttccgacc aaactggcga gatttataaa 2940 ttgtaagttc gaagaaaaaa cattcaaaac tctagttccc aaaccaaagc accaaaaggc 3000 aggcaacaaa agtcaccaaa ctgagtctga ggttgaacgc ttcaagggga aaagagagcg 3060 cgcctcatct cgtctcgtct agcagcagcg cgttatgtgg caaaagtcgc ttgtacgaag 3120 aacctgcaag ctgctttctg ctgctagcgg caagccgcaa ccgcacggat cgatcgaagc 3180 aaaagcaagc gaggcccgag gaaacagcga caaggcagca gagatcggaa aggaaaaacg 3240 agctgctttt gcgatcgaag tatagaacca gcgagctttt tggcactgcc gcggaatcgc 3300 gcagcgcggt aggaagtggt ccgcgtgcgc ggcttcctcg tgcccggagc ctctctagca 3360 aaaaacccaa cagcatcaga cacctatagc agcagtgcag tacacccgta caacagttcg 3420 ttttgatcaa gcgggtttta ggtcacgccc ttttcgcatc aaattgagag aagggaacga 3480 accagatgga gaaaaatggc ccggatcaga acgaagaaga atgagagacc ggatgaacac 3540 acactgctac cagcagggcg cggttagaaa tagatcgcag aagaataccc acgacgcata 3600 catatgccag agcaattagg ccactactca cctgtgtggt atttacttgc tgctgctgct 3660 gcttctggga tcggggtggg atcgaatcaa aaagaaaagt agaggcaggc cgaaatgtgg 3720 cgagaaaatt gggtcgctag acaattctag tggagtgctt attctctgat cgatgtacct 3780 ggggacgatc gatcccgaaa ggcgggggga gctttgggga ggcgatcgag ctagttcatg 3840 gtggggagta gtggagtgga ggcaggcgcc gtgggtcggg aggtggggcg ctagggtttt 3900 tgttgttccg tgatcgatcg gcgtcggggg gctggggctc cgcctcttct cccccggctg 3960 cctcacctcg ttgatcaccg tgtccgcctc gtcgtgcggg gagccgggga ctagatagtg 4020 ccgtggagga gaatcctttt tctagagaga ggagtggggt ggcagggtgc agcgcgtgtg 4080 tgatgctgat gccgttgtag agagagaaaa atctaggaca gccaggctcg tcgcagaggg 4140 cagcaagcag caacctcctc acggaacggc ccgcacctgg tctgccgggg gatcgagcct 4200 atgacacgtg ggcccgctct gcccgcggac cagacgtgtc tgcaggcagc ccggcacggc 4260 agacgggtgg gtgttgtgcg ggcgacgacg atatatgcgg tgcccaagta gcggtggcga 4320 agcgcgcgag accttgtgga ccccatctgt cgggcgagag cgcgcggcgc accattacaa 4380 ggacgacgct tgcgaaacga tggcgcgggc gcgccggcac acgcgcatgg gggagtttgg 4440 gttgacattg tggcacttgg gatcggggcg gggtccgccg ggggctgtga tgatgatgag 4500 gcggaggcgg gcggagcaaa gcagagaaga aaccaattgc ttgcagttgc aggcacaggc 4560 cgtactaata aataaatgtg ggtacgctgg caacgctgcc actgttagct actagtagta 4620 gctacagatg cacggcccgg acgcaggcgt gcatgggatg atctctccac acgcgctctt 4680 ggtgcgtgcg tgtgcgagga ttctgtctac ggtttgcttg catgcacgct tgcggaggca 4740 gaggtagtca cgtcgtcaag cgtgaagccg tgaatcgatc cacgcacgca gcaatgcact 4800 ccccgtttct ccttttacgg atctaataat aattataata atacattata aatattattg 4860 tt 4862 <210> 54 <211> 469 <212> PRT <213> Z. maize <400> 54 Glu Ser Lys Asp Gly Asp Pro Arg His Gly Lys Asp Arg Trp Ser Ala 1 5 10 15 Glu Arg Tyr Ala Ala Ala Glu Lys Ser Leu Leu Asn Ile Met Arg Ser 20 25 30 Arg Asp Ala Arg Phe Gly Ala Pro Val Met Arg Gln Val Leu Arg Glu 35 40 45 Glu Ala Arg Lys His Ile Gly Asp Thr Gly Leu Leu Asp His Leu Leu 50 55 60 Lys His Met Ala Gly Arg Val Pro Glu Gly Ser Val His Arg Phe Arg 65 70 75 80 Arg Arg His Asn Ala Asp Gly Ala Met Glu Tyr Trp Leu Glu Pro Ala 85 90 95 Glu Leu Ala Glu Val Arg Lys Gln Ala Gly Val Ser Asp Pro Tyr Trp 100 105 110 Val Pro Pro Pro Gly Trp Lys Pro Gly Asp Asp Val Ser Leu Val Ala 115 120 125 Gly Asp Ile Leu Val Lys Arg Gln Val Glu Glu Leu Thr Glu Glu Val 130 135 140 Asn Gly Val Lys Arg Tyr Ile Glu Gln Leu Leu Cys Lys Asp Asp Gly 145 150 155 160 Asp Phe Gly Ala Glu Arg Asp Tyr Ser Ser Leu Lys Glu Lys Tyr Gln 165 170 175 Arg Ala Val Arg Ala Asn Glu Lys Leu Glu Lys Gln Val Leu Cys Leu 180 185 190 Lys Asp Met Cys Glu Asn Val Val Gln Met Asn Gly Glu Leu Lys Lys 195 200 205 Glu Val Ser Ser Phe Lys Glu Lys Tyr Glu His Ile Ala Asp Lys Asn 210 215 220 Asp Lys Leu Glu Glu Gln Val Thr Tyr Leu Ser Ser Ser Phe Leu Ser 225 230 235 240 Phe Lys Asp Gln Leu Val Val Ala Leu Lys Leu Glu Leu Ala Pro Ser 245 250 255 Glu Ala Val Pro Arg Thr Ala Leu Phe Val Ala Ser Gly Glu Gln Met 260 265 270 Thr Gly Thr Val Ile Gln Gly Gly Gln Asp Arg Ala Glu Arg Lys Ser 275 280 285 Ser Phe Arg Val Cys Lys Pro Gln Gly Lys Phe Leu Leu Pro Ser Met 290 295 300 Ala Ser Gly Met Thr Ile Gly Arg Gly Ala Ser Ser Thr Cys Pro Ala 305 310 315 320 Ala Ala Thr Pro Gly Pro Gly Ile Pro Arg Ser Thr Ser Phe Pro Ser 325 330 335 Met Pro Gly Leu Pro Arg Ser Ser Arg Gly Pro Val Glu Val Val Ala 340 345 350 Ala Ala Ser Gly Leu Asp Glu His Val Met Phe Gly Ala His Phe Ser 355 360 365 Thr Pro Pro Ser Ala Ser Ser Thr Asn Asp Ala Ala Lys Leu Gln Leu 370 375 380 Ser Leu Pro Ser Pro Arg Ser Pro Leu Gln Pro Gln Lys Leu Phe Asp 385 390 395 400 Thr Val Thr Ala Ala Ala Ser Gly Phe Ser Pro Gln Lys Leu Met His 405 410 415 Phe Ser Gly Leu Thr Arg Arg Asp Val Asp Thr Ser Ser Ser Ser Ser 420 425 430 Gly Ala Cys Gly Ser Gly Leu Leu Glu Gly Lys Arg Val Leu Phe Asp 435 440 445 Ala Asp Ala Gly Gly Ile Ser Ala Val Gly Thr Glu Leu Ala Leu Ala 450 455 460 Thr Pro Ser Tyr Cys 465 <210> 55 <211> 132 <212> PRT <213> Z. mays <400> 55 Met Ser Leu Phe Ile Ser Lys Pro Gln Val Lys Lys Tyr Tyr Phe Lys 1 5 10 15 Lys Lys Thr Ser Ser Ser His Ser Arg Asn Gly Lys Asp Asp Val Asn 20 25 30 His Asp Ser Thr Ile Gln Pro Arg Ser Pro Leu Ser Arg Gln Ser Leu 35 40 45 Thr Phe Asp Ala Ile Pro Thr Tyr His Ala Gly Ala Phe Tyr Glu Ile 50 55 60 Asp His Asp Lys Leu Pro Pro Lys Ser Pro Ile His Leu Lys Ser Ile 65 70 75 80 Arg Val Val Lys Val Ser Glu Cys Thr Asn Leu Asp Ile Thr Val Lys 85 90 95 Phe Pro Ser Leu Gln Ala Leu Arg Ser Phe Phe Ser Ser Tyr Pro Ala 100 105 110 Pro Gly Thr Gly Pro Glu Leu Asp Glu Arg Phe Val Met Ser Ser Asn 115 120 125 His Ala Ala Arg 130 1

Claims (35)

  1. dyad 대립형질에 대해 동형접합인 게놈을 포함하고 세포의 핵에서 조건부로 DYAD 단백질을 발현하는 식물.
  2. 제1항에 있어서, 상기 식물은 조건부로 자성 수정능력(female fertile)을 갖게 되는 것인 식물.
  3. 제1항에 있어서, 상기 식물은 상기 식물이 생성하는 종자에서 자성 부모의 이형접합성(female parental heterozygoxsity)의 유지에 대해 조건부가 되는 것인 식물.
  4. 제1항에 있어서, 상기 게놈은 스테로이드 호르몬 수용체 리간드 결합 도메인에 융합된 DYAD 단백질을 코딩하는 폴리뉴클레오티드의 하나 이상의 카피를 포함하는 것인 식물.
  5. 제4항에 있어서, 상기 스테로이드 호르몬 수용체 리간드 결합 도메인은 글루코코르티코이드 수용체 리간드 결합 도메인인 것인 식물.
  6. 제1항에 있어서, 상기 dyad 대립형질은 508번 내지 572번 위치의 아미노산에 서 절단된 DYAD 단백질이 발현되는 대립형질인 것인 식물.
  7. 제6항에 있어서, 상기 dyad 대립형질은 서열번호 1의 뉴클레오티드 서열을 갖는 폴리뉴클레오티드를 포함하거나, 또는 37℃에서 40% 포름아미드, 1M NaCl, 1% SDS의 조건 또는 그와 동등한 조건 하에서 서열번호 1, 서열번호 23, 또는 서열번호 25의 폴리뉴클레오티드의 상보체와 혼성화하는 뉴클레오티드 서열을 갖는 것인 식물.
  8. 제1항에 있어서, 상기 DYAD 단백질은 서열번호 4 또는 서열번호 17 또는 서열번호 23 또는 서열번호 25의 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 또는 37℃에서 40% 포름아미드, 1M NaCl, 1% SDS의 조건 또는 그와 동등한 조건 하에서 서열번호 1, 서열번호 23, 또는 서열번호 25의 상보체와 혼성화하는 폴리뉴클레오티드에 의해 코딩되는 것인 식물.
  9. 제7항에 있어서, 상기 DYAD 단백질은 서열번호 4 또는 서열번호 17 또는 서열번호 23 또는 서열번호 25의 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드 또는 37℃에서 40% 포름아미드, 1M NaCl, 1% SDS의 조건 또는 그와 동등한 조건 하에서 서열번호 1, 서열번호 23, 또는 서열번호 25의 상보체와 혼성화하는 폴리뉴클레오티드에 의해 코딩되는 것인 식물.
  10. i) dyad에 대해 동형접합인 자성 부모 식물을 웅성 부모 식물로부터 유래된 화분으로 수분시키거나, 또는 dyad에 대해 동형접합인 상기 식물을 자가수분시키는 단계; 및
    ii) 상기 수분된 자성 부모 식물로부터 종자를 수득하는 단계를 포함하는, 자성 부모의 이형접합성을 유지하는 종자를 제조하는 방법.
  11. 제10항에 있어서, 상기 종자는 정상적인 크기이거나 또는 축소된 크기인 것인 방법.
  12. 제10항에 있어서, 상기 단계 i)에서 이용된 화분은 조사된(irradiated) 것인 방법.
  13. 제10항에 있어서, 상기 단계 i)에서 이용된 화분은 수정 능력을 가지며 상기 단계 ii)에서 수득된 종자는 삼배체인 것인 방법.
  14. i) dyad 대립형질에 대해 이형접합 또는 동형접합이고 DYAD 단백질을 핵에서 조건부로 발현하는 발현 작제물(expression construct)를 포함하는 제1 식물을 자가수분시키고 dyad 및 상기 발현 작제물에 대해 동형접합인 제2 식물을 수득하기 위해 선택하는 단계,
    ii) 상기 제2 식물의 종자 또는 상기 제2 식물의 자손인 식물의 종자를 수득 하고, 크기가 정상이거나 또는 축소된 종자를 선택하는 단계를 포함하는, dyad 대립형질에 대해 동형접합이고 세포의 핵에서 DYAD 단백질의 발현에 대해 조건부인 식물을 제공하는 배아 게놈을 갖는 종자를 수득하는 방법.
  15. 제14항에 있어서, 상기 제2 식물은 상기 제2 식물에 의해 생성된 종자의 배아에서 자성 부모 이형접합성의 유지에 대해 조건부인 것인 방법.
  16. 제14항에 있어서, 상기 제2 식물은 자성 불임(female sterility)에 대해 조건부인 것인 방법.
  17. i) dyad 대립형질 및 DYAD 단백질을 핵에서 조건부로 발현하는 발현 작제물에 대해 이형접합 또는 동형접합인 제1 식물을 자가수분시키고 dyad 및 상기 발현 작제물에 대해 동형접합인 제2 식물을 선택하는 단계,
    ii) 상기 선택된 제2 식물을 상기 DYAD 단백질이 발현되는 조건에 도입하는 단계를 포함하는, dyad 대립형질에 대해 동형접합이고 세포의 핵에서 DYAD 단백질의 발현에 대해 조건부인 식물을 수득하는 방법.
  18. 제17항에 있어서, 상기 제2 식물은 상기 T2 식물에 의해 생성된 종자의 배아에서 자성 부모 이형접합성의 유지에 대해 조건부인 것인 방법.
  19. 제17항에 있어서, 상기 제2 식물은 자성 불임에 대해 조건부인 것인 방법.
  20. 제1항의 식물의 종자 또는 조직.
  21. 제10항의 방법에 의해 수득된 종자.
  22. 제13항의 방법에 의해 수득된 삼배체 종자.
  23. DYAD 단백질의 발현을 위해 충분한 조건 하에서 제1항의 식물을 증식시키는 단계를 포함하는, dyad에 대해 동형접합인 식물 계통(plant line)을 유지하는 방법.
  24. DYAD 단백질의 발현을 위해 충분한 조건 하에서 제4항의 식물을 증식시키는 단계를 포함하는, dyad에 대해 동형접합인 식물 계통을 유지하는 방법.
  25. 제24항에 있어서, 상기 조건은 스테로이드 호르몬을 상기 식물에 적용하는 단계를 포함하는 것인 방법.
  26. i) 식물의 핵에서 DYAD 단백질을 조건부로 발현하는 발현 작제물을 포함하는 제1 식물을 자가수분시키거나, 또는 제2 식물을 수득하기 위해 두 개의 상기 제1 식물을 교배시키고 단축된 장각과(siliques) 또는 축소된 과일, 또는 감소된 종자 세트(reduced seed set)를 보이는 제2 식물을 선택하는 단계 및
    ii) 상기 선택된 제2 식물을 상기 DYAD 단백질이 발현되는 조건에 도입하는 단계를 포함하는, 핵에서 조건부로 발현되는 1 카피의 DYAD 유전자를 포함하는 식물을 수득하는 방법.
  27. 제26항에 있어서, 상기 제1 식물은 DYAD에 대해 야생형이거나, dyad에 대해 이형접합이거나 또는 dyad에 대해 동형접합인 것인 방법.
  28. 식물의 세포의 핵에서 야생형 DYAD 단백질을 조건부로 발현하는 작제물을 포함하는 벡터로 식물의 세포를 형질전환시키는 단계를 포함하는, 식물의 세포의 핵에서 야생형 DYAD 단백질을 조건부로 발현하는 식물을 수득하는 방법.
  29. 제28항에 있어서, 상기 식물은 dyad에 대해 동형접합인 식물인 것인 방법.
  30. 제28항에 있어서, 상기 식물은 dyad에 대해 이형접합인 식물인 것인 방법.
  31. 식물의 세포의 핵에서 야생형 DYAD 단백질의 조건부 발현을 제공하는 작제물에 대해 동형접합인 식물.
  32. 식물 세포의 핵에서 DYAD 유전자의 조건부 발현을 부여하는 발현 작제물.
  33. 제32항에 있어서, 상기 식물 세포는 거대포자 모세포(megaspore mother cell)인 것인 작제물.
  34. 제32항에 있어서, 상기 DYAD 유전자는 스테로이드 호르몬 수용체 리간드 결합 도메인에 융합된 것인 작제물.
  35. 제34항에 있어서, 상기 스테로이드 호르몬 수용체 리간드 결합 도메인은 글루코코르티코이드 수용체 리간드 결합 도메인인 것인 작제물.
KR1020087016525A 2005-12-09 2006-12-08 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법 KR20080075908A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN3337/DEL/2005 2005-12-09
IN3337DE2005 2005-12-09

Publications (1)

Publication Number Publication Date
KR20080075908A true KR20080075908A (ko) 2008-08-19

Family

ID=38123263

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087016525A KR20080075908A (ko) 2005-12-09 2006-12-08 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법

Country Status (14)

Country Link
US (1) US8878002B2 (ko)
EP (1) EP1963359A2 (ko)
JP (1) JP2009524409A (ko)
KR (1) KR20080075908A (ko)
CN (1) CN101379080B (ko)
AU (1) AU2006322972B9 (ko)
BR (1) BRPI0620572A2 (ko)
CA (1) CA2632723A1 (ko)
EG (1) EG25707A (ko)
IL (1) IL192003A0 (ko)
RU (1) RU2438297C2 (ko)
TR (2) TR200806177T2 (ko)
WO (1) WO2007066214A2 (ko)
ZA (1) ZA200805005B (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2007203378B2 (en) 2000-06-14 2011-12-08 Agriculture Victoria Services Pty Ltd Modification of lignin biosynthesis (2)
US8921653B2 (en) 2001-06-14 2014-12-30 Agriculture Victoria Services Pty Ltd Modification of lignin biosynthesis
WO2011003471A1 (en) * 2009-07-10 2011-01-13 Enza Zaden Beheer B.V. Method for providing mature transgenic recalcitrant plants via induction of bbm during regeneration
FR2952276A1 (fr) * 2009-11-09 2011-05-13 Inst Rech Developpement Ird Induction de l'apomixie chez les plantes cultivees a reproduction sexuee et utilisation pour la reproduction de plantes totalement ou partiellement apomictiques
US9210847B2 (en) * 2011-05-06 2015-12-15 Kenavis Corporation, Llc Soybean varieties and methods for producing said varieties
JP6978152B2 (ja) 2015-09-04 2021-12-08 キージーン ナムローゼ フェンノートシャップ 複相胞子生殖遺伝子
BR112018006573A2 (pt) * 2015-10-02 2018-10-09 método para a produção de plantas haploides e subsequentes haploides duplicadas
WO2018015389A1 (en) * 2016-07-18 2018-01-25 University Of Bremen Method of generating polyploid plants
CA3138988A1 (en) 2019-05-29 2020-12-03 Keygene N.V. Gene for parthenogenesis
WO2022079087A1 (en) 2020-10-13 2022-04-21 Keygene N.V. Modified promoter of a parthenogenesis gene

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633441A (en) * 1989-08-04 1997-05-27 Plant Genetic Systems, N.V. Plants with genetic female sterility
US5478369A (en) * 1990-06-12 1995-12-26 Pioneer Hi-Bred International, Inc. Nucleotide sequences mediating male fertility and method of using same
US6051752A (en) * 1994-01-21 2000-04-18 Petosluis Recherche France Genetic factor responsible for a defective endosperm phenotype in seeds, plants comprising said factor and their use in hybridization processes
US5840567A (en) * 1994-12-21 1998-11-24 The Regents Of The University Of California Simplified hybrid seed production by latent diploid parthenogenesis and parthenote cleavage
WO1996027673A1 (en) * 1995-03-03 1996-09-12 Novartis Ag Control of gene expression in plants by receptor mediated transactivation in the presence of a chemical ligand
US5811636A (en) 1995-09-22 1998-09-22 The United States Of America As Represented By The Secretary Of Agriculture Apomixis for producing true-breeding plant progenies
US5710367A (en) * 1995-09-22 1998-01-20 The United States Of America As Represented By The Secretary Of Agriculture Apomictic maize
US20050155111A1 (en) 2003-10-22 2005-07-14 Carman John G. Methods for increasing the frequency of apomixis expression in angiosperms
US6750376B1 (en) * 1997-02-05 2004-06-15 Utah State University Methods for producing apomictic plants
JP2002510964A (ja) 1997-02-05 2002-04-09 ユタ・ステイト・ユニバーシティ アポミクト植物の作出方法
FR2759708B1 (fr) 1997-02-17 1999-08-27 Orstom Moyens pour identifier, isoler et caracteriser des sequences nucleotidiques impliquees dans l'apomixie
EP0977836A4 (en) * 1997-02-21 2002-10-16 Univ California "COTYLEDON1 HARDWOOD" TYPE GENES AND USES THEREOF
US6028185A (en) * 1998-01-07 2000-02-22 The United States Of America As Represented By The Secretary Of Agriculture Nucleic acid markers for apospory-specific genomic region
US6239327B1 (en) * 1998-04-16 2001-05-29 Cold Spring Harbor Laboratory Seed specific polycomb group gene and methods of use for same
US6229064B1 (en) * 1998-05-01 2001-05-08 The Regents Of The University Of California Nucleic acids that control endosperm development in plants
AU777855B2 (en) 1998-08-05 2004-11-04 Mary Wilkes Eubanks Novel genetic materials for transmission into maize
GB9823098D0 (en) 1998-10-22 1998-12-16 Novartis Ag Organic compounds
US6825397B1 (en) * 1998-11-09 2004-11-30 Pioneer Hi-Bred International, Inc. LEC1 trancriptional activator nucleic acids and methods of use thereof
AU7614700A (en) 1999-09-20 2001-04-24 Cambia Megagametophyte transcriptional control elements and uses thereof
US6146282A (en) * 1999-09-28 2000-11-14 Mccready; Scott K. Water slide system
US7256322B2 (en) 1999-10-01 2007-08-14 Pioneer Hi-Bred International, Inc. Wuschel (WUS) Gene Homologs
WO2001031017A2 (en) 1999-10-25 2001-05-03 Südwestdeutsche Saatzucht Plants with a modified flower and seed development
BR0015276A (pt) 1999-10-29 2002-07-16 Univ Utah State Métodos para estabilizar e controlar apomixia
US6492577B1 (en) * 2000-03-16 2002-12-10 The Regents Of The University Of California Leafy cotyledon2 genes and their uses
CA2441876A1 (en) 2001-04-10 2002-10-24 Syngenta Participations Ag Production of apomictic seed
WO2003000038A2 (en) * 2001-06-22 2003-01-03 The Regents Of The University Of California Compositions and methods for modulating plant development
AU2002318409A1 (en) 2001-06-25 2003-01-08 Cold Spring Harbor Laboratory Maternal effect gametophyte regulatory polynucleotide
US20030082813A1 (en) 2001-10-29 2003-05-01 The Rockefeller University Promotion of somatic embryogenesis in plants by wuschel gene expression

Also Published As

Publication number Publication date
CA2632723A1 (en) 2007-06-14
AU2006322972A1 (en) 2007-06-14
AU2006322972A2 (en) 2008-07-31
US20070136895A1 (en) 2007-06-14
US8878002B2 (en) 2014-11-04
CN101379080A (zh) 2009-03-04
RU2438297C2 (ru) 2012-01-10
CN101379080B (zh) 2013-04-17
WO2007066214A2 (en) 2007-06-14
AU2006322972B9 (en) 2014-06-12
TR200806177T2 (tr) 2008-10-21
AU2006322972B2 (en) 2013-08-01
IL192003A0 (en) 2008-12-29
TR200909478T2 (tr) 2011-01-21
EG25707A (en) 2012-05-27
JP2009524409A (ja) 2009-07-02
ZA200805005B (en) 2012-08-29
BRPI0620572A2 (pt) 2011-12-06
WO2007066214A3 (en) 2007-12-27
EP1963359A2 (en) 2008-09-03
RU2008127881A (ru) 2010-01-20

Similar Documents

Publication Publication Date Title
US20110271405A1 (en) Compositions and methods for increasing seed size and/or yield by expressing a modified transgene encoding a growth and/or development related protein
KR20080075908A (ko) 배아에 모계 게놈의 완전한 이배체 상보체를 갖는 종자를생산하기 위한 핵산 및 방법
WO2013060136A1 (zh) 一种控制水稻籽粒粒长和粒重的半显性基因qGL3的克隆与应用
JP2000505290A (ja) シロイヌナズナgai遺伝子をコードする核酸
US7439416B2 (en) Indeterminate gametophyte 1 (ig1)gene from Zea mays and uses thereof
US11224181B2 (en) Manipulation of self-incompatibility in plants
CN113874388A (zh) 孤雌生殖基因
CN104703998B (zh) 植物中雄性育性的遗传减少
JP2016013057A (ja) 植物に多収性を付与する核酸、収量が増加した形質転換植物を作製する方法、植物の収量を増大させる方法
Horn et al. Gene cloning and characterization
US7220845B2 (en) Nucleic acid molecules associated with plant cell proliferation and growth and uses thereof
US8410337B2 (en) Plant tubby-like proteins
CA2343978A1 (en) Novel method of regulating seed development in plants and genetic sequences therefor
KR101592863B1 (ko) 왜성 표현형을 나타내는 D-h 유전자 및 이의 용도
AU765258B2 (en) Novel method of regulating seed development in plants and genetic sequences therefor
CA3134113A1 (en) A method to improve the agronomic characteristics of plants
CA2369749A1 (en) Gene involved in epigenetic gene silencing
MX2008007458A (en) Nucleic acids and methods for producing seeds having a full diploid complement of the maternal genome in the embryo

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E601 Decision to refuse application