KR20230088741A

KR20230088741A - 단위생식 유전자의 변형된 프로모터

Info

Publication number: KR20230088741A
Application number: KR1020237015218A
Authority: KR
Inventors: 리크 후베르투스 마르티누스 옵 덴 캠프; 피터 요하네스 반 다이크
Original assignee: 키진 엔.브이.
Priority date: 2020-10-13
Filing date: 2021-10-13
Publication date: 2023-06-20
Also published as: WO2022079087A1; JP2023544753A; AU2021363100A1; CN116568131A; CA3195190A1; IL301700A; US20230383308A1; EP4228398A1

Abstract

본 발명은 돌연변이 유전자를 생산하는 방법을 제공하며, 여기서 상기 유전자는 변형된 프로모터를 포함하고, 상기 유전자는 식물에 단위생식 표현형을 유도할 수 있다. 본 발명은 또한 상기 돌연변이 유전자, 이를 포함하는 분리된 핵산 분자, 구조물 또는 벡터를 제공한다. 또한, 본 발명은 상기 돌연변이 유전자를 포함하는 단위생식 식물의 제조 방법 및 이에 따라 얻어진 단위생식 식물을 제공한다.

Description

단위생식 유전자의 변형된 프로모터

본 발명은 생명공학 분야, 특히 식물 육종을 포함하는 식물 생명공학에 관한 것이다. 본 발명은 특히 예를 들어 아포믹시스(apomixis) 및 반수체(haploid) 유도와 관련되고 이에 유용한 유전자의 확인 및 용도에 관한 것이다. 본 발명은 특히 단위생식과 관련된 유전자의 돌연변이 프로모터에 관한 것이다. 본 발명은 추가로 식물 및 농작물에서 단위생식을 유도하는 방법, 특히 아포메이오틱(apomeiotic) 유전자(들)와 조합된 아포믹시스를 위한, 또는 염색체가 배가 반수체(doubled haploids)를 생성하기 위해 배가될 수 있는 반수체 식물의 생산을 위한 상기 유전자 및/또는 상기 프로모터의 용도에 관한 것이다.

아포믹시스(또한 무배우 생식(agamospermy)라고도 함)는 종자를 통한 무성 식물 번식이다. 아포믹시스는 약 400종의 현화 식물(flowering plant) 종에서 보고되었다(Bicknell and Koltunow, 2004). 현화 식물의 아포믹시스는 두 가지 형태로 발생한다.

(1) 배아가 단위생식에 의해 비감소, 미수정 난세포에서 발생하는 배우체 아포믹시스(gametophytic apomixis);

(2) 배아가 포자체 세포에서 체세포로 발생하는 포자체 아포믹시스(sporophytic apomixis).

배우체 아포믹시스의 예는 민들레(타락사컴(Taraxacum) sp.), 조팝나물(히에라시움(Hieracium) sp.), 켄터키 블루 그래스(포아 프라텐시스(Poa pratensis)) 및 이스턴 감마그래스(트리프사컴 닥틸로이데스(Tripsacum dactyloides))이다. 포자체 아포믹시스의 예는 감귤류(시트러스(Citrus) sp.)와 망고스틴(가르시니아 망고스타나(Garcinia mangostana))이다. 배우체 아포믹시스는 두 가지 발달 과정을 포함한다.

(1) 감수분열 재조합 및 감소의 회피(아포메이오시스); 및

(2) 수정 없이 난세포가 배아로 발달함(단위생식).

아포믹트적으로(Apomictically) 생산된 종자는 모체 식물(parental plant)과 유전적으로 동일하다. 아포믹시스가 식물 육종에 매우 유용할 수 있다는 것은 오랫동안 인식되어 왔다(Asker, 1979; Hermsen, 1980; Asker 및 Jerling, 1990; Vielle-Calzada 등, 1995). 작물에 아포믹시스 도입의 가장 분명한 이점은 이종 F1 잡종의 진정한 육종이다. 대부분의 작물에서 F1 잡종은 최고의 성과를 내는 품종이다. 그러나, 유성 작물에서 F1 잡종은 F1 잡종의 자가 수정이 F2 자손 식물의 게놈에서 재조합에 의해 헤테로시스(heterosis)의 손실을 일으키기 때문에, 근친교배 동형접합 부모를 교배하여 각 세대마다 다시 생산되어야 한다. 유성 F1 종자 생산은 반복적이고, 복잡하며, 비용이 많이 드는 과정이다. 대조적으로, 아포미틱 F1 잡종은 영원히 번식할 것이다. 즉, F1 잡종의 유전적 고정과 종자를 통한 균일한 자손 식물체의 생산이 가능해진다.

아포믹시스에 의한 F1 고정은 유전적 복잡성에 관계없이 어느 유전자형이 한 단계에서 참으로 번식할 수 있는 아포믹시스의 일반적인 속성의 특수한 경우이다. 이것은 아포믹시스가 다유전자성(polygenic) 양적 특성의 즉각적인 고정에 사용될 수 있음을 의미한다. 대부분의 수확량 형질은 다유전자성이라는 점에 유의해야 한다. 아포믹시스는 여러 특성(예: 다양한 저항성, 여러 트랜스진 또는 여러 정량적 특성 유전자좌)의 스태킹(또는 피라미딩)에 사용할 수 있다. 아포믹시스가 없으면, 이러한 특성 세트를 고정하기 위해, 각 특성 유전자좌는 개별적으로 동형접합체로 만들어지고 나중에 결합되어야 한다. 형질에 관련된 유전자좌의 수가 증가함에 따라, 교배에 의해 이러한 형질 유전자좌를 동형접합성으로 만드는 것은 시간 소모적이고 논리적으로 도전적이어서 비용이 많이 든다. 더욱이, 대립형질 사이의 특정 상위성 상호작용은 동형접합성에 의해 소실된다. 아포믹시스를 사용하면 이러한 유형의 비가산적 유전 변이를 고정하는 것이 가능하다. 따라서, 아포믹시스, 종자를 통한 클론 번식은 식물 육종, 상업적 종자 생산 및 농업에서 패러다임 전환을 일으킬 가능성이 있다(van Dijk 등 2016).

복잡성에 관계없이 어느 유전자형을 즉시 고정하는 것 외에도 아포믹시스의 중요한 추가 농업 용도가 있다. 성적 종간 잡종과 자가 배수체는 종종 감수분열 문제로 인해 불임을 겪는다. 아포믹시스는 감수분열을 건너뛰기 때문에, 아포믹시스를 사용하면 종간 잡종과 자가 배수체의 이러한 문제를 해결할 수 있다. 아포믹시스는 암컷 교잡을 방지하기 때문에, 웅성 불임과 결합된 아포믹시스는 트랜스제닉 작물의 야생 근연종에서 트랜스유전자 이입을 방지하는 트랜스유전자 억제를 위해 제안되었다(Daniell, 2002). 곤충 수분 작물(예: Brassica)에서 비정형 종자 세트는 수분 매개자 서비스 부족으로 인해 제한되지 않는다. 이는 수분을 공급하는 벌 개체군의 증가하는 건강 문제(바로아 응애 감염, 아프리카 킬러 벌 등)에 비추어 더욱 중요해지고 있다. 감자와 같은 덩이줄기 번식 작물에서, 아포믹시스는 클론적으로 우월한 유전자형을 유지하지만, 현재의 바이러스 전파 위험과 청정 생산, 봉쇄 및 인증 관련 비용을 줄이거나 심지어 제거한다. 또한 아포믹틱(apomictic) 종자의 저장 비용은 덩이줄기 또는 기타 영양 번식 식물 부분보다 훨씬 적다. 관상용에서 아포믹시스는 노동 집약적이고 값비싼 조직 배양 번식을 대체할 수 있다. 일반적으로 아포믹시스는 품종 개발 및 식물 번식 비용을 크게 줄이는 것으로 생각된다.

불행하게도 아포믹시스는 어떤 주요 작물에서도 발생하지 않는다. 유성 작물에 아포믹시스를 도입하려는 수많은 시도가 있었다. 예를 들어, 아포믹시스 유전자의 이입, 유성 모델 종의 돌연변이, 혼성화에 의한 아포믹시스의 드노보(de novo) 발생, 후보 유전자의 클로닝 등이 있다. 넓은 교배를 통해 야생 아포믹틱(apomicts)에서 작물 종으로의 아포믹스 유전자의 도입은 지금까지 성공하지 못했다(예: apomixis from Tripsacum dactyloides into maize - Savidan, Y., 2001; Morgan 등, 1998; WO97/10704). 돌연변이 유성 모델 종 돌연변이를 일으키는 것과 관련하여, WO2007/066214에는 애기장대에서 Dyad로 불리는 세포자멸 돌연변이의 사용이 기술되어 있다. 그러나, Dyad는 침투성이 매우 낮은 열성 돌연변이이다. 작물 종에서 이 돌연변이는 제한적으로 사용된다. 2개의 유성 생태형 사이의 교배에 의한 아포믹시스 드 노보(apomixis de novo)의 생성은 농경학적으로 흥미로운 아포믹틱을 초래하지 않았다(US2004/0168216 A1 및 US2005/0155111 A1). 옥수수(maize)에서 트랜스포존 태깅에 의한 후보 아포믹시스 유전자의 클로닝은 US2004/0148667에 기재되어 있다. 신장 유전자(elongate gene)의 오르토로그가 청구되었으며, 이는 아포믹시스를 유발하는 것으로 추정된다. 그러나, Barrell과 Grossniklaus(2005)에 따르면 신장 유전자는 감수분열 II를 건너뛰므로, 모계 유전자형을 유지하지 못하여, 이는 훨씬 덜 유용하다.

US2006/0179498에는 소위 역 육종(Reverse Breeding)이 아포믹시스에 대한 대안이 될 것이라고 설명되어 있다. 그러나, 이것은 기술적으로 복잡한 시험관 내 실험실 절차인 반면, 아포믹시스는 식물 자체에 의해 수행되는 생체 내 절차이다. 더욱이, 역 육종의 경우, 일단 부모 계열이 재구성되면(이중 배우자 동형접합체) 교배가 여전히 수행되어야 한다.

자연 아포믹틱의 아포믹시스는 일반적으로 유전학적 근거를 갖는다(Ozias-Akins 및 Van Dijk, 2007 검토). 따라서, 대안적인 방법은 자연 아포믹틱 종에서 아포믹시스 유전자를 분리하는 것일 수 있다. 그러나, 이것은 쉬운 일이 아니며, 왜냐하면 자연적인 아포믹틱은 종종 배수체 게놈을 가지고 있고, 배수체에서의 위치 클로닝은 매우 어렵기 때문이다. 다른 복잡한 요인은 아포믹시스 특이적 염색체 영역에서의 재조합 억제, 반복 서열 및 교배에서의 분리 왜곡이다.

본원에 기술된 바와 같이, 현 기술 상태의 제한 중 적어도 일부가 없는 작물에서 아포믹시스를 유도하기 위한 절차가 필요하다. 특히, 아포믹틱 식물 및 아포믹틱 종자의 생산 방법이 필요하다. 또한, 아포믹시스 또는 (이중) 반수체를 작물에 도입하는데 사용하기에 적합하고 아포믹틱 경로를 실질적으로 모방할 수 있는 아포믹시스, 특히 단위생식의 발달 과정에 관여하는 유전자 및 단백질을 제공할 필요가 있다.

본 발명자들은 단위생식 유전자좌 및 유전자, 단위생식 표현형(본원에서 단위생식 대립유전자 또는 Par 대립유전자로 나타냄)과 관련된 대립유전자 및 비-단위생식 표현형(본원에서 단위생식 유전자 또는 par 대립유전자의 성적 대립유전자로 나타냄), 이들의 유전자 서열, 즉 프로모터 서열, 5'UTR, 코딩 서열, 3'UTR 서열 및 코딩된 단백질 서열을 확인하고 분리했다.

본 발명은 상기 par 대립유전자의 프로모터 서열을 변경함으로써, par 대립유전자를 Par 대립유전자로 변형 또는 변경하는 방법을 제공한다. 본 발명은 바람직하게는 무작위 또는 표적 돌연변이유발에 의해, 그리고 선택적으로 형질전환에 의해 내인성 par 대립유전자를 Par 대립유전자로 변형시키는데 특히 유용하다. 생성된 돌연변이 대립유전자는 식물 및/또는 그의 후손을 수정 없이 난세포를 배아로 발달시키는 능력을 갖거나, 증가된 능력을 갖는 식물로 형질전환시킬 수 있다.

도 1. 단위생식 돌연변이와 유성 상추의 Taraxacum CRISPR/Cas9 상실(loss)의 컴플리멘테이션 및 형질전환 실험. a) 타락사컴(Taraxacum) LOP 돌연변이의 컴플리멘테이션을 위해 사용되는 상이한 프로모터-유전자 구조 및 성공적으로 컴플리멘테이션된 계열(line)의 수. 상추(lettuce)의 ToPar 프로모터와 성적 상동체 및 Taraxacum Par 유전자가 있는 Arabidopsis 난세포(EC1.1) 프로모터가 표시된다. b) Arabidopsis 난세포 EC1.1 프로모터에 의해 구동되는 타락사컴(Taraxacum) ToPar 유전자로 상추를 형질전환하는 것과 유사함). c), d), e), pEC1.1::Par 구조물로 형질전환된 상추의 디카피테이티드(decapitated) 꽃차례(inflorescence)의 배아 유사 구조. c) 디카피테이션(decapitation) 75시간 후 대조구 비형질 상추의 배낭. 수정되지 않은 난세포(ec)와 중앙 세포(cc) 핵이 보인다. d) 디카피테이션 75시간 후 배아와 유사한 구조가 발달하는 배낭. e) 여러 개의 배아와 유사한 구조를 가진 배낭. 별표는 개별 배아와 유사한 구조를 보여준다. f) 자가수분 5일 후 대조구 비형질전환 상추로부터 배낭의 유세포 분석. g) 디카피테이션 5일 후 pEC1.1::Par 구조물을 보유하는 트랜스제닉 상추로부터의 배낭의 유동 세포 분석.
도 2. 타락사컴( Taraxacum ) Par/par 프로모터의 다형성. Par 대립유전자 및 3개의 성적 대립유전자: 타락사컴 오피시날레(Taraxacum officinale)(Topar)의 par-1 및 par-2 및 고무 민들레 타락사컴 코크사기즈(Taraxacum koksaghyz)(Tkpar)의 성적 대립유전자의 ATG 시작 코돈(밑줄)의 350 bp 업스트림 영역의 ClustalW 정렬. 1335bp MITE 삽입이 ToPar 프로모터에서 제거되었다. MITE의 삽입 부위인 6 bp 다이렉터 리피트(direct repeat)에 밑줄이 그어져 있다. 13개의 SNP 중 3개는 PAR 프로모터와 성적 프로모터 사이에 있으며(굵은 글씨와 밑줄); 10개는 성적 프로모터들 사이에서 발생한다.

본원에서 사용되는 용어 "유전자좌(locus)"(복수형: 유전자좌들(loci))는 예를 들어 유전자 또는 유전적 마커가 발견되는 염색체 상의 특정 위치(또는 장소)를 의미한다. 예를 들어, "단위생식 유전자좌"는 단위생식 유전자가 위치하는 게놈 내의 위치를 의미한다. 두 가지 기능적 변이가 단위생식 유전자에 대해 확인되었다. 즉, 단위생식 유전자의 단위생식 대립유전자 또는 Par 대립유전자로서 본원에 표시된, 단위생식 표현형에 기여하는 대립유전자, 및/또는 본 명세서에서 단위생식 유전자의 성적 대립유전자 또는 par 대립유전자로서 본원에 표시된 이의 성적 대응물(들).

유전자, 대립유전자, 단백질 또는 핵산이 "단위생식에서 기능적"인 것은 본원에서 단위생식 표현형에 기여하고/하거나 난세포를 배아로 발달시키는 식물 또는 식물 세포에 대한 능력을 증가시키거나 전환시키는 것으로 이해되어야 한다.

"단위생식 유전자"는 단위생식과 연관된 유전자이고, 여기서 "연관된"은 단위생식 또는 비-단위생식(유성) 표현형을 나타내는 것으로 본원에서 이해되어야 한다. 단위생식을 부여하는 (우성) 대립유전자(Par 대립유전자)와 그 2개의 유성 대응물(par 대립유전자 또는 단위생식 유전자의 유성 대립유전자)의 유전자 서열이 3배체 아포믹틱 타락사컴 오피시날레(Taraxacum officinale) 분리물 A68에서 처음으로 확인되었으며, 이는 PCT/EP2020/064991에 기술되어 있으며, 본 명세서에 참고로 포함된다. 바람직하게는, Par 대립유전자는 단위생식을 개시한다. 단위생식을 부여하는 (우성) 대립유전자는 SEQ ID NO: 5의 유전적 서열을 갖고, SEQ ID NO: 2의 서열을 갖는 프로모터, SEQ ID NO: 3의 서열을 갖는 코딩 서열 및 SEQ ID NO: 4의 서열을 갖는 3'UTR을 포함한다. 유성 대립유전자 중 하나는 SEQ ID NO: 10의 유전적 서열을 갖고, SEQ ID NO: 7의 서열을 갖는 프로모터, SEQ ID NO: 8의 서열을 갖는 코딩 서열 및 SEQ ID NO: 9의 서열을 갖는 3'UTR을 포함한다. 다른 유성 대립유전자는 SEQ ID NO: 15의 유전적 서열을 갖고, SEQ ID NO: 12의 서열을 갖는 프로모터, SEQ ID NO: 13의 서열을 갖는 코딩 서열 및 SEQ ID NO: 14의 서열을 갖는 3'UTR을 포함한다. 이들 단위생식 유전자에 의해 암호화된 단백질(PAR 단백질로 표시됨)의 특징적 특징에 기초하여 다른 종에서 이종상동성(Orthologous) 유전자가 확인되었다. 난세포에 PAR 단백질이 존재하면 배아 발생 억제제가 억제되어 수정 없이 세포 분열이 유발될 수 있다. 이들 PAR 단백질은 공통 서열 C.{2}C.{7}[K/R]A.{2}GH.[R/N].H를 갖는 징크 핑거 C2H2-타입 도메인(IPR13087), 바람직하게는 징크 핑거 K2-2-유사 도메인을 포함하는 것을 특징으로 하며, 이는 또한 CXXCXXXXXXX[K/R]AXXGHX[R/N]XH(SEQ ID NO: 37)로 주석이 달릴 수 있으며, 여기서 X는 임의의 자연 발생 아미노일 수 있으며, 여기서 [K/R]은 아미노산이 라이신 또는 아르기닌임을 나타내고, R/N]은 아미노산이 아르기닌 또는 아스파라긴임을 나타낸다(Englbrecht 등, 2004 참조). 징크 핑거 C2H2-유형 도메인, 바람직하게는 본원에 정의된 바와 같은 징크 핑거 K2-2-유사 도메인에 더하여, 상기 단백질은 공통 아미노산 서열 DLNXXP(SEQ ID NO: 58) 또는 DLNXP(SEQ ID NO: 59)를 갖는 EAR(Ethylene-responsive element binding factor-associated Amphiphilic Repression) 모티프를 포함하며, 여기서 X는 임의의 자연 발생 아미노산일 수 있다(Kagale 등, 2010; 및 Yang 등, 2018 참조). 바람직하게는 상기 EAR 모티프는 C-말단에 위치한다. 바람직하게는 징크 핑거 C2H2 유형 도메인은 상기 EAR 모티프의 N-말단에 위치한다. 바람직하게는, PAR 단백질은 최대 400개 아미노산의 길이를 갖고, 여기서 상기 단백질은 본원에 표시된 바와 같은 1개 또는 2개의 EAR 모티프 및 본원에 정의된 바와 같은 징크 핑거 K2-2-유사 도메인을 포함한다. 바람직하게는, 단백질은 최대 400개 아미노산의 길이를 가지며, 여기서 상기 단백질은 본원에 표시된 바와 같은 단지 1개 또는 2개의 EAR 모티프 및 본원에 정의된 바와 같은 단지 하나의 징크 핑거 K2-2-유사 도메인을 포함한다. 즉, 본원에 정의된 바와 같은 추가 EAR 모티프를 포함하지 않으며, 본원에 정의된 바와 같은 추가 징크 핑거 K2-2-유사 도메인을 포함하지 않는다. 400개 아미노산의 최대 크기, 본원에 표시된 단 하나 또는 두 개의 EAR 모티프 및 정의된 단일 징크 핑거 K2-2 유사 도메인의 특징 외에도, PAR 단백질은 C.{2}C.{12}H.{3}H의 징크 핑거 공통 서열(이는 CXXCXXXXXXXXXXXXHXXXH (SEQ ID NO: 38)로도 주석이 달릴 수 있음)을 갖는 단 하나의 추가 징크 핑거 도메인을 포함할 수 있으나, 더 바람직하게는 C.{2}C.{12}H.{3}H (SEQ ID NO: 38)의 징크 핑거 공통 서열을 갖는 추가의 징크 핑거 도메인을 포함하지 않는다. 바람직하게는, PAR 단백질은 최대 500개 아미노산의 길이를 갖는다. PAR 단백질은 약 50~500, 100~300 또는 약 150~200개의 아미노산일 수 있다. PAR 단백질은 약 170개의 아미노산 길이를 가질 수 있다. 이종상동성 단위생식 유전자는 이에 한정하는 것은 아니나, 아나나스 코모서스(Ananas comosus)의 PAR 단백질(예: UniProtKB: A0A199URK4), 아포스타시아 센제니카(Apostasia shenzhenica)의 PAR 단백질(예: UniProtKB: A0A2I0AZW3), 아라비돕시스 탈리아나(Arabidopsis thaliana)의 PAR 단백질(예: UniProtKB: Q8GXP9, A0A178V2S4, O81793, A0A178V1Q3, A0MFC1, O81801), 아라비돕시스 리라타 아종 리라타(Arabidopsis lyrata subsp. Lyrata)의 PAR 단백질(예: UniProtKB: D7MC52 또는 D7MCE8), 아라키스 이파엔시스(Arachis ipaensis)의 PAR 단백질(예: SEQ ID NO: 45 또는 SEQ ID NO: 49), 브라키포듐 디스타치온(Brachypodium distachyon)의 PAR 단백질(예: UniProtKB: I1J0D9), 브라시카 올레라세아 var. 올레라세아(Brassica oleracea var. oleracea)(예: UniProtKB: A0A0D3A1Q6 또는 A0A0D3A1Q3), 브라시카 캄페스트리스(Brassica campestris)의 PAR 단백질(예: UniProtKB: A0A398AHT1), 브라시카 라파(Brassica rapa)의 PAR 단백질(예: SEQ ID NO: 47), 브라시카 라파 아종 페키넨시스(Brassica rapa subsp. Pekinensis)의 PAR 단백질(예: UniProtKB: M4D574 또는 M4D571), 브라시카 올레라세아(Brassica oleracea)의 PAR 단백질(예: UniProtKB: A0A3P6ESB1 또는 A0A3P6F726), 브라시카 캄페스트리스(Brassica campestris)의 PAR 단백질(예: UniProtKB: A0A3P5ZMM3 또는 A0A3P5Z1M1), 카자누스 카잔(Cajanus cajan)의 PAR 단백질(예: 4SE NO: 4SE NO: 46), 캅셀라 루벨라(Capsella rubella)의 PAR 단백질(예: UniProtKB: R0H2J1 또는 R0H0C2), 세팔로터스 폴리큘라리스(Cephalotus follicularis)의 PAR 단백질(예: UniProtKB: A0A1Q3CSK1), 시세르 아리에티넘(Cicer arietinum)의 PAR 단백질(예: UniProtKB: A0A3Q7YBZ1, A0A1S2YZL9, A0A3Q7Y0Z2 또는 A0A1S NO: SEYZ: 55, 56 또는 57), 시코륨 엔디비아(Cichorium endivia)의 PAR 단백질(예: SEQ ID NO: 39), 큐큐미스 사티버스(Cucumis sativus)의 PAR 단백질(예: UniProtKB: A0A0A0KGW4 또는 A0A0A0L0X7), 큐큐미스 멜로(Cucumis melo)의 PAR 단백질(예: UniProtKB: A0A1S3BLF2 또는 A0A1S3B298), 큐큐미스 사티버스(Cucumis sativus)의 PAR 단백질(예: UniProtKB: A0A0A0KAW8), 큐르큐르비타 모스차타(Cucurbita moschata)의 PAR 단백질(예: SEQ ID NO: 43), 큐스큐타 캄페스트리스(Cuscuta campestris)의 PAR 단백질(예: UniProtKB: A0A484MGR1), 덴드로븀 카테나텀(Dendrobium catenatum)의 PAR 단백질(예: UniProtKB: A0A2I0V7N9, A0A2I0X 또는 A0A2I0W0Q8), 도르코세라스 하이그로메트리컴(Dorcoceras hygrometricum)의 PAR 단백질(예: UniProtKB: A0A2Z7D3Y1), 유트레마 살서기네움(Eutrema salsugineum)의 PAR 단백질(예: UniProtKB: V4LSH0; 또는 SEQ ID NO: 44), 파거스 실바티카(Fagus sylvatica)의 PAR 단백질(예: UniProtKB: A0A2N9E5Y5, A0A2N9HAB9 또는 A0A2N9H993), 겐리세아 아우레아(Genlisea aurea)의 PAR 단백질(예: KB: S8E1M6), 글리신 맥스(Glycine max)의 PAR 단백질(예: SEQ ID NO: 51, 52, 53 또는 54), 고시피움 히르서텀(Gossypium hirsutum)의 PAR 단백질(예: UniProtKB: A0A1U8LDU9), 헬리안터스 안누스(Helianthus annuus)의 PAR 단백질(예: SEQ ID NO: 21), 헤베아 브라실리엔시스(Hevea brasiliensis)의 PAR 단백질(예: SEQ ID NO: 42), 히에라시움 아우란티아컴(Hieracium aurantiacum)의 PAR 단백질(예: SEQ ID NO: 40), 주글란스 레기아(Juglans regia)의 PAR 단백질(예: UniProtKB: A0A2I4E6B1), 락투카 사티바(Lactuca sativa)의 PAR 단백질(예: UniProtKB: A0A2J6KZF7); 또는 SEQ ID NO: 22), 라제나리아 시세라리아(Lagenaria siceraria)의 PAR 단백질(예: SEQ ID NO: 48), 메디카고 트런카툴라(Medicago truncatula)의 PAR 단백질(예: UniProtKB: G7K024), 모러스 노타빌리스(Morus notabilis)의 PAR 단백질(예: UniProtKB: W9SMY3 또는 W9SMQ7), 뮤큐나 프루리엔스(Mucuna pruriens)의 PAR 단백질(예: UniProtKB: A0A371ELJ8), 니코티아나 아테누아타(Nicotiana attenuata)의 PAR 단백질(예: UniProtKB: A0A1J6IQI6), 니코티아나 실베스트리스(Nicotiana sylvestris)의 PAR 단백질(예: UniProtKB: A0A1U7VXJ0), 니코티아나 타바쿰(Nicotiana tabacum)의 PAR 단백질(예: UniProtKB: A0A1S4A651 또는 A0A1S3YHQ2), 오리자 사티바 아종 자포니카(Oryza sativa subsp. Japonica)의 PAR 단백질(예: UniProtKB: B9FGH8), 오리자 바르티(Oryza barthii)의 PAR 단백질(예: UniProtKB: A0A0D3FWX3), 파니쿰 밀라세움(Panicum miliaceum)의 PAR 단백질(예: UniProtKB: A0A3L6Q010 또는 A0A3L6T1D6), 파라스포니아 안데르소니(Parasponia andersonii)의 PAR 단백질(예: UniProtKB: A0A2P5BMI5), 포풀러스 알바(Populus alba)의 PAR 단백질(예: UniProtKB: A0A4U5PSY9), 포풀러스 트리코카르파(Populus trichocarpa)의 PAR 단백질(예: UniProtKB: B9H661), 푸니카 그라나텀(Punica granatum)의 PAR 단백질(예: UniProtKB: A0A2I0IBB9, A0A218XB85 또는 A0A218W102), 세네시오 캄브렌시스(Senecio cambrensis)의 PAR 단백질(예: SEQ ID NO: 41), 프루너스 페르시카(Prunus persica)의 PAR 단백질(예: SEQ ID NO: 50), 트레마 오리엔탈레(Trema orientale)의 PAR 단백질(예: UniProtKB: A0A2P5EB04), 트리폴리움 프라텐스(Trifolium pratense)의 PAR 단백질(예: UniProtKB: A0A2K3N851), 트리폴리움 서브테라늄(Trifolium subterraneum)의 PAR 단백질(예: UniProtKB: A0A2Z6MYD3 또는 A0A2Z6MDR7), 트리폴리움 프라텐스(Trifolium pratense)의 PAR 단백질(예: UniProtKB: A0A2K3PR44), 비티스 비니페라(Vitis vinifera)의 PAR 단백질(예: UniProtKB: A0A438C778, A0A438ESC4 또는 A0A438DBR4) 및 지 메이스(Zea mays)의 PAR 단백질(예: UniProtKB: A0A1D6HF46, B6UAC5, A0A3L6F4S1, A0A3L6EMC6, A0A3L6EMC6, K7UHQ6 또는 A0A1D6KHZ4)로 구성된 군으로부터 선택된 PAR 단백질 중 어느 하나를 암호화하는 유전자일 수 있다. 이러한 유전자는 또한 악티니디아 키넨시스(Actinidia chinensis)의 PAR 단백질(예를 들어, UniProtKB: A0A2R6S2S9), 베타 불가리스(Beta vulgaris)의 PAR 단백질(예를 들어, UniProtKB: XP_010690656.1), 솔라눔 투베로섬(Solanum tuberosum)의 PAR 단백질(예를 들어, UniProtKB : XP_015159151.1), 솔라눔 리코페리시컴(Solanum lycopersicum)의 PAR 단백질(예: UniProtKB: A0A3Q7GXB3, Solyc05g055500 또는 Solyc06g060480), 캡시컴 바카텀(Capsicum baccatum)의 PAR 단백질(예: UniProtKB: A0A2G2WJR7), 솔라넘 멜롱게나(Solanum melongena)의 PAR 단백질(예: UniProtKB: AVC18974.1), 글리신 소자(Glycine soja)의 PAR 단백질(예: GeneBank 수탁: XP_028201014.1, XP_006596577.1 또는 UniprotKB: A0A445M3M6), 아라키스 히포가에아(Arachis hypogaea)의 PAR 단백질(예: UniProtKB: A0A444WUX5), 파세올러스 불가리스(Phaseolus vulgaris)의 PAR 단백질(예: UniProtKB: V7CIF6), 다우커스 카로타(Daucus carota)의 PAR 단백질 (예: GeneBank 수탁: XP_017245413.1), 트리티컴 아에스티범(Triticum aestivum)의 PAR 단백질(예: UniProtKB: A0A3B6RP64), 오리자 사티바 아종 인디카(Oryza sativa subsp. indica)의 PAR 단백질(예: UniProtKB: A2YH63), 오리자 사티바 아종 자포니카(Oryza sativa subsp. japonica)의 PAR 단백질(예: UniProtKB: Q5Z7P5) 및 테오브로마 카카오(Theobroma cacao)의 PAR 단백질(예: UniProtKB: A0A061DL63)로 구성된 군으로부터 선택된 PAR 단백질을 암호화할 수 있다. 선택적으로, 이종상동성 유전자(orthologous gene)는 각각, SEQ ID NO: 1, 6 및 11 중 어느 하나와, 및/또는 본원에 제공된 상기 이종상동성 유전자들(orthologues) 중 어느 하나와 바람직하게는 예를 들어, 기본 매개변수가 있고 전체 길이에 걸쳐 비교되는 Needleman 및 Wunsch 알고리즘(전역 서열 정렬)을 사용하여 쌍으로 정렬될 경우, 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% 이상의 동일성을 갖는 아미노산 서열을 포함하거나 또는 이로 구성되는 PAR 단백질을 암호화하는 유전자이다.

본원에서 사용되는 용어 "대립유전자(들)"는 특정 유전자좌에 있는 유전자의 하나 이상의 대안적 형태 중 임의의 것을 의미한다. 유기체의 2배체 및/또는 배수체 세포에서, 주어진 유전자의 대립유전자는 염색체에서의 특정 위치 또는 유전자좌에 위치하며, 여기서 하나의 대립유전자는 상동 염색체 세트의 각 염색체에 존재한다. 2배체 및/또는 배수체 유기체 또는 식물 종은 특정 유전자좌에서 다수의 상이한 대립유전자를 포함할 수 있다.

본원에서 사용되는 용어 "우성 대립유전자"는 하나의 대립유전자(즉, 우성 대립유전자)의 효과가 동일한 유전자좌에서 두 번째 대립유전자(즉, 열성 대립유전자)의 기여를 차폐하는 하나의 유전자의 대립유전자들 사이의 관계를 의미한다. 상염색체(성염색체 이외의 모든 염색체)에 있는 유전자의 경우, 대립유전자 및 관련 형질은 상염색체 우성 또는 상염색체 열성이다. 우성은 멘델의 유전과 고전 유전학의 핵심 개념이다. 선택적으로, 우성 대립유전자는 기능성 단백질을 코딩하는 반면 열성 대립유전자는 그렇지 않다. 선택적으로, 우성 대립유전자 및 열성 대립유전자는 동일하거나 실질적으로 동일한 기능성 단백질을 암호화할 수 있는 반면, 우성 대립유전자만이 열성 대립유전자와 달리 특정 상황 하에서 및/또는 특정 조직에서 특정 양의 상기 기능성 단백질을 발현할 수 있어, 단위생식과 같은 특정 표현형을 변환한다.

본 명세서에서 "암컷 난소"(복수형: "난소")라는 용어는 포자가 형성되는 인클로저를 의미한다. 단일 세포로 구성될 수도 있고 다세포일 수도 있다. 모든 식물, 균류 및 기타 많은 혈통은 수명 주기의 어느 시점에서 난소를 형성한다. 난소는 유사분열 또는 감수분열에 의해 포자를 생산할 수 있다. 일반적으로 각 난소 내에서 거대포자 모세포의 감수분열은 4개의 반수체 거대포자를 생성한다. 겉씨식물과 속씨식물에서는 이 4개의 거대포자 중 하나만이 성숙기에 기능하고, 나머지 3개는 퇴화한다. 이에 속하는 거대포자는 유사분열하여 암컷 배우체(megagametophyte)로 발달하여 결국 하나의 난세포를 생성한다.

본원에 사용된 용어 "암 배우자"는 유성 생식을 하는 유기체에서 수정(수태) 동안 정상적인 (성적) 환경에서 다른 ("수(male)") 세포와 융합하는 세포를 의미한다. 두 가지 형태학적으로 구별되는 유형의 배우자를 생산하고, 각 개체가 한 유형만 생산하는 종에서, 암컷은 더 큰 유형의 배우자(배주(오범(ovum)) 또는 난세포라고 함)를 생산하는 모든 개체이다. 식물에서 암컷 배주는 꽃의 난소에 의해 생성된다. 성숙하면 반수체 배주는 수정 준비가 된 암컷 생식세포를 생성한다. 수컷 세포는 (대부분 반수체) 꽃가루이며 꽃밥에 의해 생성된다.

"유전 마커(genetic marker)" 또는 "다형성 마커(polymorphic marker)"라는 용어는 염색체의 특정 위치를 "마킹"하는 데 사용할 수 있는 게놈 DNA에서의 영역을 의미한다. 유전 마커가 유전자에 밀접하게 연결되어 있거나, 유전자 '상에' 있는 경우, 유전자가 발견된 DNA를 "마킹"하므로, (분자) 마커 분석에서, 예를 들어, 마커 보조 육종/선택(MAS) 방법에서 유전자의 존재를 선택하거나 이에 대해 선택하는 데 사용할 수 있다. 유전 마커의 예는 AFLP(증폭 단편 길이 다형성, EP534858), 미소부수체, RFLP(제한 단편 길이 다형성), STS(서열 태그 부위), SNP(단일 뉴클레오티드 다형성), SFP(단일 특징 다형성; 참조: Borevitz 등, 2003), SCAR(서열 특성화된 증폭 영역), CAPS 마커(절단된 증폭 다형성 서열) 등이다. 마커가 유전자에서 멀리 떨어져 있을수록, 마커와 유전자 사이에서 재조합(교차)이 발생하여 연결 (및 마커와 유전자의 공동 분리)이 손실될 가능성이 높아진다. 유전자좌 사이의 거리는 재조합 빈도로 측정되며, cM 단위로 표시된다(centiMorgans; 1cM은 1%의 두 마커 사이의 감수 분열 재조합 빈도임). 게놈 크기는 종마다 크게 다르기 때문에, 1cM(즉, 두 마커 사이의 킬로베이스, kb)으로 표시되는 실제 물리적 거리도 종마다 크게 다르다.

본원에서 "연결된" 마커를 언급할 때, 이는 유전자 자체 "상(on)"의 마커도 포함하는 것으로 이해된다.

"MAS"는 마커 (및 선택적으로 플랭킹이 결여됨)를 포함하는 DNA 영역을 (엘리트) 육종 계열로의 전이를 촉진하기 위해, 식물이 하나 이상의 유전적 및/또는 표현형 마커의 존재 및/또는 부재에 대해 스크리닝되는 "마커 지원 선택(marker assisted selection)"을 의미한다.

"분자 마커 분석" (또는 테스트)은, 예를 들어, 식물 또는 식물 부분에서 Par 또는 par 대립유전자와 같이, 대립유전자의 존재 또는 부재를 (직접 또는 간접적으로) 나타내는 (DNA 기반) 분석을 의미한다. 바람직하게는 특정 대립유전자가 임의의 개별 식물에서 단위생식 유전자좌에서 동형접합성인지 이형접합성인지를 결정할 수 있게 한다. 예를 들어, 일 구현에서, 단위생식 유전자좌에 연결된 핵산은 PCR 프라이머를 사용하여 증폭되고, 증폭 산물은 효소적으로 분해되며, 증폭 산물의 전기영동 분해 패턴에 기초하여, 어느 대립유전자(들)가 임의의 개별 식물에 존재하는지 그리고 단위생식 유전자좌에서 상기 대립유전자의 접합성(즉, 각 유전자좌에서의 유전자형)을 검출할 수 있다. 예는 SCAR 마커(서열 특성화된 증폭 영역), CAPS 마커(절단된 증폭 다형성 서열) 및 유사한 마커 분석이다.

본원에서 사용되는 바와 같이, "이형접합"이라는 용어는 2개의 상이한 대립유전자가 특정 유전자좌에 존재할 때 존재하는 유전적 조건을 의미하지만, 세포 내의 상응하는 상동 염색체 세트에 개별적으로 위치한다. 역으로, 본원에서 사용되는 용어 "동형접합체"는 2개 (또는 배수성의 경우 그 이상)의 동일한 대립유전자가 특정 유전자좌에 존재하지만, 세포 내 상응하는 상동 염색체 세트에 개별적으로 위치할 때 존재하는 유전적 조건을 의미한다.

"변종"은 본원에서 UPOV 협약에 따라 사용되며 가장 낮은 알려진 등급의 단일 식물 분류군 내의 식물 그룹을 의미하며, 이 그룹은 특성의 발현에 의해 정의될 수 있고, 상기 특성 중 적어도 하나의 발현에 의해 임의의 다른 식물 그룹과 구별될 수 있으며, 변경되지 않은(안정적인) 전파에 대한 적합성과 관련하여 하나의 유닛으로 간주된다.

"단백질" 또는 "폴리펩티드"라는 용어는 상호 교환적으로 사용되며, 특정 작용 방식, 크기, 3차원 구조 또는 기원에 대한 언급 없이 아미노산 사슬로 구성된 분자를 의미한다. 따라서, 단백질의 "단편" 또는 "부분"은 여전히 "단백질"로 지칭될 수 있다.

용어 "유전자"는 적합한 조절 영역(예를 들어, 프로모터)에 작동 가능하게 연결된, 세포 내 RNA 분자(예를 들어, mRNA로 프로세싱되는 프리-mRNA)로 전사되는, 영역(전사 영역)을 포함하는 DNA 서열을 의미한다. 따라서, 유전자는 프로모터, 예를 들어, 번역 개시에 관여하는 서열들을 포함하는 5' 리더 서열, (단백질) 코딩 영역(cDNA 또는 게놈 DNA) 및 예를 들어, 전사 종결 부위를 포함하는 3' 비번역 서열과 같은 여러 작동 가능하게 연결된 서열들을 포함할 수 있다.

"키메라 유전자" (또는 재조합 유전자)는 종에서 자연적으로 일반적으로 발견되지 않는 임의의 유전자, 특히 뉴클레오티드 서열의 하나 이상의 부분이 존재하는 유전자에서 서로 자연적으로 연관되지 않은 유전자를 의미한다. 예를 들어, 프로모터는 전사된 영역의 일부 또는 전부 또는 다른 조절 영역과 자연적으로 연관되지 않는다.

"네이티브 유전자(native gene)"는 자연 발생 유전자에서도 발견될 수 있는 프로모터 서열, 코딩 서열 및 임의로 3'-UTR 서열을 포함하는 임의의 유전자를 지칭한다. 선택적으로, 네이티브 유전자의 뉴클레오티드 서열은 자연에서 발견되는 서열과 동일하다. 본원에서 네이티브 유전자는 트랜스진일 수 있음이 이해된다. 이 구현에서, 네이티브 유전자는 식물 종에 존재하며, 식물 종은 자연적으로 상기 네이티브 유전자를 포함하지 않는다.

"내인성 유전자"는 본원에서 이의 자연 환경, 즉 자연적으로 포함된 식물 종에 존재하는 천연 유전자로 이해된다.

"3'UTR" 또는 "3' 비번역 서열"(종종 3' 비번역 영역 또는 3' 말단이라고도 함)은 예를 들어 전사 종결 부위 및 (전부는 아니지만 대부분의 진핵 mRNA에서) 폴리아데닐화 신호(예를 들어, AAUAAA 또는 이의 변이체)를 포함하는 유전자의 코딩 서열의 다운스트림에서 발견되는 뉴클레오티드 서열을 지칭한다. 전사 종료 후, mRNA 전사물은 폴리아데닐화 신호의 다운스트림에서 절단될 수 있고, 폴리(A) 꼬리가 추가될 수 있으며, 이는 mRNA를 세포질(여기서 번역이 일어나는 곳)로 수송하는데 관여한다.

"5'UTR" 또는 "리더 서열" 또는 "5' 비번역 영역"은 mRNA 전사가 시작되는 +1 위치와 코딩 영역의 번역 시작 코돈 사이의 mRNA 전사 및 해당 DNA의 영역이다( 일반적으로 mRNA의 AUG 또는 DNA의 ATG). 5'UTR은 일반적으로 번역, mRNA 안정성 및/또는 전환 및 기타 조절 요소에 중요한 사이트를 포함한다.

"유전자의 발현"은 적절한 조절 영역, 특히 프로모터에 작동 가능하게 연결된 DNA 영역이 생물학적으로 활성인, 즉, 단백질 또는 펩티드 (또는 활성 펩티드 단편)로 번역될 수 있거나 또는 그 자체로 활성인(예: 전사 후 유전자 침묵 또는 RNAi에서) RNA로 전사되는 과정을 의미한다. 활성 단백질은 이의 기능을 수행할 수 있는 단백질을 의미할 수 있으며, 예를 들어, 특정 유전자의 5'UTR의 조절 요소에 결합하여 특정 유전자의 발현을 억제할 수 있다. 특정 구현에서 활성 단백질은 구성적으로 활성인 단백질을 의미한다. 코딩 서열은 바람직하게는 센스-배향이고, 원하는 생물학적 활성 단백질 또는 펩티드, 또는 활성 펩티드 단편을 코딩한다. 유전자 침묵 접근법에서, DNA 서열은 안티센스 배향으로 또는 센스 및 안티센스 배향으로 표적 유전자의 짧은 서열을 포함하는 안티센스 DNA 또는 역반복 DNA의 형태로 존재하는 것이 바람직하다.

"전사 조절 서열"은 본원에서 전사 조절 서열에 작동 가능하게 연결된 (코딩) 서열의 전사 속도를 조절할 수 있는 뉴클레오티드 서열로 정의된다. 따라서, 본원에서 정의된 바와 같은 전사 조절 서열은, 예를 들어 어테뉴에이터 또는 인핸서를 포함하여, 전사 개시(프로모터 요소), 유지 및 전사 조절에 필요한 모든 서열 요소를 포함할 것이다. 대부분 코딩 서열의 업스트림(5') 전사 조절 서열이 언급되지만, 코딩 서열의 다운스트림(3')에서 발견되는 조절 서열도 이 정의에 포함된다.

본원에서 용어 "프로모터"는 전사 개시 부위의 전사 방향에 대해 업스트림에 위치한 하나 이상의 DNA 영역의 전사를 제어하는 기능을 하는 핵산 단편을 의미하며, DNA-의존성 RNA 폴리머라제에 대한 결합 부위, 전사 개시 부위 및 이에 한정하는 것은 아니나 전사 인자 결합 부위, 억제인자 및 활성인자 단백질 결합 부위를 포함하는 임의의 다른 DNA 서열, 및 상기 프로모터로부터 전사의 양을 조절하기 위해 직접 또는 간접적으로 작용하는 것으로 당업자에게 공지된 임의의 다른 뉴클레오티드 서열에 의해 구조적으로 확인된다. 선택적으로 용어 "프로모터"는 본원에서 또한 5'UTR 영역을 포함한다(예를 들어, 프로모터는 본원에서 유전자의 번역 개시 코돈의 하나 이상의 업스트림(5') 부분을 포함할 수 있으며, 왜냐하면 이 영역은 전사 및/또는 번역을 조절하는 데 역할을 할 수 있기 때문이다).

"구성적(constitutive)" 프로모터는 대부분의 생리학적 및 발달 조건 하에서 대부분의 조직에서 활성인 프로모터이다. "유도성" 프로모터는 생리학적으로(예를 들어, 특정 화합물의 외부 적용에 의해) 발달적으로 조절되는 프로모터이다. "조직 특이적" 프로모터는 특정 유형의 조직 또는 세포에서만 활성적인 것이다. "식물 또는 식물 세포에서 활성인 프로모터"는 식물 또는 식물 세포 내에서 전사를 유도하는 프로모터의 일반적인 능력을 의미한다. 프로모터의 시공간적(spatiotemporal) 활성에 대해서는 아무런 영향을 주지 않는다.

본원에서 사용되는 바와 같이, "작동 가능하게 연결된"이라는 용어는 기능적 관계에서 폴리뉴클레오티드 요소의 연결을 의미한다. 핵산은 다른 뉴클레오티드 서열과 기능적 관계로 배치될 때 "작동 가능하게 연결된" 것이다. 예를 들어, 프로모터, 또는 오히려 전사 조절 서열이 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동 가능하게 연결된다. 작동가능하게 연결된다는 것은 연결되는 DNA 서열이 전형적으로 연속적이며, 필요한 경우 프로모터 서열을 단백질 코딩 서열에 결합시키거나 단백질 코딩 서열을 3'UTR에 결합시키는 것을 의미한다. "핵산 구조물" 또는 "벡터"는 본원에서 재조합 DNA 기술의 사용으로부터 생성되고, 외인성 DNA를 숙주 세포로 전달하는데 사용되는 인공 핵산 분자를 의미하는 것으로 이해된다. 벡터 백본은, 예를 들어, 바이너리 또는 수퍼바이너리 벡터(예를 들어, US 5591616, US 2002138879 및 WO95/06722 참조), 공통합 벡터 또는 T-DNA 벡터일 수 있으며, 이는 당업계에 알려져 있고 본원의 다른 곳에서 설명된 바와 같이, 이 안으로 유전자 또는 키메라 유전자가 통합되거나, 또는 적합한 전사 조절 서열이 이미 존재하는 경우, 원하는 뉴클레오티드 서열(예: 코딩 서열, 안티센스 또는 역반복 서열)만이 전사 조절 서열의 다운스트림에 통합된다. 벡터는 일반적으로 예를 들어 선택 가능한 마커, 다중 복제 사이트 등과 같이 분자 클로닝에서 사용을 용이하게 하기 위해 추가 유전 요소를 포함한다.

"재조합 숙주 세포" 또는 "형질전환된 세포" 또는 "트랜스제닉 세포"는 적어도 하나의 핵산 분자, 특히 원하는 단백질 또는 발현 시 상기 세포에 도입된 본원에 정의된 PAR 단백질과 같은 특정 단백질을 생성하는 뉴클레오티드 서열을 암호화하는 트랜스진 및/또는 키메라 유전자를 코딩하는 것을 포함하는 핵산 분자의 결과로서 발생하는 새로운 개별 세포 (또는 유기체)를 지칭하는 용어이다. "분리된 핵산"은 자연 환경, 예를 들어 시험관 내 또는 재조합 박테리아 또는 식물 숙주 세포에 더 이상 존재하지 않는 핵산을 지칭하는 데 사용된다.

"숙주 세포"는 재조합 숙주 세포가 되기 위해 트랜스진으로 형질전환되는 원래의 세포이다. 숙주 세포는 바람직하게는 식물 세포 또는 박테리아 세포이다. 재조합 숙주 세포는 염색체외(에피솜) 복제 분자로서 핵산 구조물을 함유할 수 있거나, 또는 보다 바람직하게는 숙주 세포의 핵 또는 색소체 게놈에 통합된 유전자 또는 키메라 유전자를 포함한다.

"재조합 식물" 또는 "재조합 식물 부분" 또는 "트랜스제닉 식물"은 유전자가 발현되지 않거나, 또는 모든 세포에서 발현되지 않을 수도 있지만 재조합 유전자 또는 키메라 유전자 또는 트랜스진을 포함하는 식물 또는 식물 부분(예를 들어, 종자 또는 열매 또는 잎)이다.

"엘리트 이벤트"는 식물의 우수한 표현형 및/또는 농경학적 특성을 초래하는 게놈의 위치에 재조합 유전자 또는 트랜스진을 포함하도록 선택된 재조합 식물이다. 통합 부위의 플랭킹 DNA는 통합 부위를 특성화하고, 이벤트를 게놈의 다른 위치에서 동일한 재조합 유전자를 포함하는 다른 트랜스제닉 식물과 구별하기 위해 시퀀싱될 수 있다.

"선택 가능한 마커"라는 용어는 당업자에게 익숙한 용어이며, 발현될 때 선택 가능한 마커를 함유하는 세포 또는 세포들을 선택하기 위해 사용될 수 있는 임의의 유전적 실체를 설명하기 위해 본원에서 사용된다. 선택 가능한 마커 유전자 산물은, 예를 들어 항생제 내성, 또는 더 바람직하게는 제초제 내성 또는 표현형 특성(예: 색소 침착의 변화) 또는 영양 요건과 같은 다른 선택 가능한 특성을 부여한다. "리포터"라는 용어는 주로 녹색 형광 단백질(GFP), eGFP, 루시페라아제, GUS 등과 같은 가시적인 마커를 지칭하는 데 사용된다.

유전자 또는 단백질의 "오르토로그(orthologue)"라는 용어는 본원에서 다른 종에서 발견되는 상동 유전자 또는 단백질을 의미하며, 이는 유전자 또는 단백질과 동일한 기능을 갖지만 (보통) 분기된 유전자(즉, 종분화에 의해 공통 조상에서 진화한 유전자)를 은닉하는 시점부터 서열이 분기된다. 따라서, 탁사라쿰(Taxaracum) 단위생식 유전자의 상동체는 서열 비교(예를 들어, 전체 서열 또는 특정 도메인에 대한 백분율 서열 동일성에 기초함) 및 기능적 분석 모두에 기초하여 다른 식물 종에서 확인될 수 있다.

용어 "상동" 및 "이종"은 핵산 또는 아미노산 서열과 그의 숙주 세포 또는 유기체 사이의 관계, 특히 트랜스제닉 유기체의 맥락에서의 관계를 지칭한다. 따라서, 상동 서열은 숙주 종(예: 상추 유전자로 형질전환된 상추 식물)에서 자연적으로 발견되는 반면, 이종 서열은 숙주 세포(예: 감자 식물로부터의 서열로 형질전환된 상추 식물)에서 자연적으로 발견되지 않는다. 문맥에 따라, 용어 "호모로그" 또는 "상동"은 대안적으로 공통 조상 서열로부터 유래하는 서열을 지칭할 수 있다(예를 들어, 이들은 오르토로그일 수 있음).

"엄격한 혼성화 조건"은 주어진 뉴클레오티드 서열과 실질적으로 동일한 뉴클레오티드 서열을 확인하는 데 사용될 수 있다. 엄격한 조건은 서열에 따라 달라지며 다른 상황에서는 다를 것이다. 일반적으로 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 열 융점(Tm)보다 약 5℃ 낮도록 선택된다. Tm은 표적 서열의 50%가 완벽하게 일치하는 프로브에 혼성화되는 온도(정의된 이온 강도 및 pH 하에서)이다. 전형적으로 염 농도는 pH 7에서 약 0.02몰이고, 온도는 적어도 60℃인 엄격한 조건이 선택될 것이다. 염 농도를 낮추고 그리고/또는 온도를 높이면 엄격도가 높아진다. RNA-DNA 혼성화를 위한 엄격한 조건(예를 들어, 100nt의 프로브를 사용하는 노던 블롯)은 예를 들어 63℃에서 20분 동안 0.2X SSC에서 적어도 1회 세척 또는 동등한 조건을 포함하는 조건이다. DNA-DNA 혼성화를 위한 엄격한 조건(예: 100nt의 프로브를 사용하는 서던 블롯)은 예를 들어 적어도 50℃, 일반적으로 약 55℃의 온도에서, 20분 동안, 0.2X SSC에서 최소 1회 세척(보통 2회), 또는 동등한 조건을 포함하는 조건이다. 또한 [Sambrook 등(1989) 및 Sambrook과 Russell(2001)]을 참조바란다.

"높은 엄격성" 조건은, 예를 들어, 6x SSC(20x SSC는 3.0M NaCl, 0.3M Na-시트레이트 함유, pH 7.0), 5x Denhardt's(100X Denhardt's는 2% 피콜, 2% 폴리비닐 피롤리돈, 2% 소혈청 알부민 함유), 0.5% SDS(sodium dodecyl sulphate) 및 비 특정 경쟁자로서 20 μg/ml 변성 운반체 DNA(단일 가닥 어류 정자 DNA, 평균 길이 120 - 3000 뉴클레오티드를 가짐)를 함유하는 수용액에서 65℃에서 혼성화하여 제공될 수 있다. 혼성화 후, 0.2-0.1x SSC, 0.1% SDS의 혼성화 온도에서 최종 세척(약 30분)과 함께 높은 엄격성 세척이 여러 단계로 수행될 수 있다.

"중간 엄격성"은 약 60-62℃에서 전술한 용액에서의 혼성화와 동등한 조건을 의미한다. 이 경우 최종 세척은 1x SSC, 0.1% SDS의 혼성화 온도에서 수행된다.

"낮은 엄격성"은 약 50-52℃에서 전술한 용액에서의 혼성화와 동등한 조건을 의미한다. 이 경우 최종 세척은 2x SSC, 0.1% SDS의 혼성화 온도에서 수행된다. 또한 [Sambrook 등(1989) 및 Sambrook과 Russell(2001)]을 참조바란다.

"서열 동일성" 및 "서열 유사성"은 2개의 서열의 길이에 따라 글로벌 또는 로컬 정렬 알고리즘을 사용하여 2개의 펩티드 또는 2개의 뉴클레오티드 서열의 정렬에 의해 결정될 수 있다. 유사한 길이의 서열은 바람직하게 전체 길이에 걸쳐 서열을 최적으로 정렬하는 글로벌 정렬 알고리즘(예: Needleman Wunsch)을 사용하여 정렬되는 반면, 실질적으로 다른 길이의 서열은 바람직하게는 로컬 정렬 알고리즘(예: Smith Waterman)을 사용하여 정렬된다. 이어서, 서열이 (예를 들어 기본 매개변수를 사용하는 프로그램 GAP 또는 BESTFIT에 의해 최적으로 정렬될 때) 서열 동일성의 적어도 특정 최소 백분율(본원에 정의됨)을 공유할 때 서열은 "실질적으로 동일" 또는 "본질적으로 유사"하다고 언급될 수 있다. 서열 동일성의 백분율은 바람직하게는 Sequence Analysis Software Package™(Version 10; Genetics Computer Group, Inc., Madison, Wis.)의 "BESTFIT" 또는 "GAP" 프로그램을 사용하여 결정된다. GAP는 Needleman 및 Wunsch 글로벌 정렬 알고리즘(Needleman and Wunsch, Journal of Molecular Biology 48:443-453, 1970)을 사용하여 전체 길이(전장)에 걸쳐 두 개의 서열을 정렬하여, 일치 수를 최대화하고 간격 수를 최소화한다. 글로벌 정렬은 2개의 서열이 유사한 길이를 가질 때 서열 동일성을 결정하기에 사용하는데 적절하다. 일반적으로, 갭 생성 패널티 = 50(뉴클레오티드) / 8(단백질) 및 갭 확장 패널티 = 3(뉴클레오티드) / 2(단백질)와 함께 GAP 기본 매개변수가 사용된다. 뉴클레오티드의 경우, 사용되는 기본 스코어링 매트릭스는 nwsgapdna이고 단백질의 경우, 기본 스코어링 매트릭스는 Blosum62이다(Henikoff & Henikoff, 1992, PNAS 89, 915-919). 백분율 서열 동일성에 대한 서열 정렬 및 점수는 Accelrys Inc.(9685 Scranton Road, San Diego, CA 92121-3752 USA)에서 입수할 수 있는 GCG Wisconsin Package, Version 10.3과 같은 컴퓨터 프로그램을 사용하거나, 또는 상기 GAP와 동일한 매개변수를 사용하거나 동일한 기본 설정을 사용하여 EmbossWIN 버전 2.10.0의 "needle"(글로벌 Needleman Wunsch 알고리즘 사용) 또는 "water"(로컬 Smith Waterman 알고리즘 사용) 프로그램과 같은 공개 소스 소프트웨어를 사용하여 결정할 수 있다('needle' 및 'water' 모두에 대해 그리고 단백질 및 DNA 정렬 모두에 대해, 기본 갭 개방 페널티는 10.0이고, 기본 갭 확장 페널티는 0.5이고, 기본 스코어링 매트릭스는 단백질의 경우 Blossum62이고, DNA의 경우 DNAFull임). "BESTFIT"는 두 서열 사이의 유사도의 최상의 세그먼트의 최적 정렬을 수행하고, 매치 수를 최대화하기 위해 Smith와 Waterman의 로컬 호몰로지 알로리즘(Smith 및 Waterman, Advances in Applied Mathematics, 2:482-489, 2:482-489, 1981, Smith 등, Nucleic Acids Research 11:2205-2220, 1983)을 사용하여 갭을 삽입하였다. 서열의 전체 길이가 실질적으로 다른 경우 Smith Waterman 알고리즘을 사용하는 것과 같은 로컬 정렬이 선호된다.

본원에 사용된 "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오티드 또는 펩티드 서열이 구성요소, 예를 들어 뉴클레오티드 또는 아미노산의 정렬 창 전체에 걸쳐 불변인 정도를 의미한다. 시험 서열 및 참조 서열의 정렬된 세그먼트에 대한 "동일성 부분"은 2개의 정렬된 서열이 공유하는 동일한 성분의 수를 참조 서열 세그먼트 내 성분들의 총 수, 즉 전체 참조 서열 또는 참조 서열의 더 작게 정의된 부분으로 나눈 것이다. "퍼센트 동일성"은 동일성 분수에 100을 곱한 것이다.

서열 동일성을 결정하기 위한 유용한 방법은 또한 Guide to Huge Computers, Martin J. Bishop, ed., Academic Press, San Diego, 1994 및 Carillo, H. 및 Lipton, D., Applied Math (1988) 48:1073에 개시되어 있다. 보다 구체적으로, 서열 동일성을 결정하기 위한 바람직한 컴퓨터 프로그램은 Md. 20894, 베데스다, 국립보건원 소재 국립 의학 도서관의 국립 센터 생명공학 정보(NCBI)로부터 공개적으로 이용가능한 기본 로컬 정렬 검색 도구(BLAST) 프로그램을 포함하며; BLAST Manual, Altschul 등, NCBI, NLM, NIH; Altschul 등, J. Mol. Biol. 215:403-410 (1990) 참조; BLAST 프로그램 버전 2.0 이상에서는 정렬에 갭(삭제 및 삽입)을 도입할 수 있으며; 펩티드 서열의 경우 BLASTX가 서열 동일성을 결정하는 데 사용할 수 있으며; 그리고, 폴리뉴클레오티드 서열의 경우 BLASTN을 사용하여 서열 동일성을 결정할 수 있다.

대안적으로 백분율 유사성 또는 동일성은 FASTA, BLAST 등과 같은 알고리즘을 사용하여 공개 데이터베이스에 대해 검색하여 결정할 수 있다. 따라서, 본 발명의 핵산 및 단백질 서열은 예를 들어, 다른 패밀리 구성원이나 관련 서열을 확인하기 위해 공개 데이터베이스에 대해 검색을 수행하기 위한 "쿼리 서열"로서 추가로 사용될 수 있다. 이러한 검색은 Altschul 등(1990) J. Mol. Biol. 215:403-10의 BLASTn 및 BLASTx 프로그램(버전 2.0)을 사용하여 수행할 수 있다. BLAST 뉴클레오티드 검색은 NBLAST 프로그램, 점수 = 100, 워드길이 = 12로 수행되어 본 발명의 산화환원효소 핵산 분자에 상동인 뉴클레오티드 서열을 얻을 수 있다. BLAST 단백질 검색은 BLASTx 프로그램, 점수 = 50, 워드길이 = 3으로 수행되어 본 발명의 단백질 분자에 상동인 아미노산 서열을 얻을 수 있다. 비교 목적을 위한 갭 정렬을 얻기 위해, Gapped BLAST가 Altschul 등(1997) Nucleic Acids Res. 25(17): 3389-3402에 기술된 바와 같이 사용될 수 있다. BLAST 및 Gapped BLAST 프로그램을 사용할 때, 각 프로그램의 기본 매개변수(예: BLASTx 및 BLASTn)를 사용할 수 있다. 국립생명공학정보센터 홈페이지(http://www.ncbi.nlm.nih.gov/)를 참조바란다.

본원에 사용된 용어 "식물 유성 생식"은 "거대포자 모세포"로 지칭되는 (예를 들어, 2배체) 체세포가 감수분열을 거쳐 4개의 감소된 거대포자를 생성하는 발달 경로를 의미한다. 이 거대포자 중 하나는 유사분열로 분열하여 거대배우체(배낭이라고도 함)를 형성하는데, 여기에는 감소된 난세포(즉, 모체에 비해 감소된 수의 염색체를 갖는 세포)와 2개의 감소된 극성 핵이 포함된다. 꽃가루 알갱이의 한 정자 세포에 의한 난세포의 수정은 (예: 2배체) 배아를 생성하는 반면, 두 번째 정자 세포에 의한 2개의 극성 핵의 수정은 (예: 3배체) 배유를 생성한다(이중 수정이라고 하는 과정).

본원에서 사용되는 용어 "거대포자 모세포" 또는 "거대포자세포"는 감소, 일반적으로 감수분열에 의해 거대포자를 생성하여 암컷 배우체로 발달할 4개의 반수체 거대포자를 생성하는 세포를 지칭한다. 속씨식물(현화식물이라고도 함)에서, 거대포자 모세포는 대포자형성(megasporogenesis)(핵에서 거대포자 또는 거대포자낭 형성) 및 대배우체형성(megagametogenesis)(거대포자에서 자성배우체(megagametophyte)로의 발달)을 포함하는 2개의 구별된 과정을 통해 자성배우체로 발달하는 거대포자를 생성한다.

본원에서 사용되는 "무성 식물 번식"이라는 용어는 수정 및 배우자 융합 없이 식물 번식이 달성되는 과정이다. 무성 생식은 돌연변이나 체세포 재조합이 발생하는 경우를 제외하고 부모 식물과 그리고 서로에 대해 유전적으로 동일한 새로운 개체를 생성한다. 식물은 영양 생식(즉, 원래 식물의 영양 조각의 발아, 분얼 등 포함)과 아포믹시스를 포함하는 두 가지 주요 무성 생식 유형을 가지고 있다.

본원에서 사용되는 용어 "아포믹시스"는 무성 과정에 의한 종자의 형성을 의미한다. 아포믹시스의 한 형태는 1) 난소에서 감소되지 않은 배낭의 형성을 의미하는 아포메이오시스(apomeiosis) 및 2) 감소되지 않은 배주가 배아로 발달하는 것을 의미하는 단위생식(parthenogenesis)을 특징으로 한다. 수백 종의 야생 식물 종은 무성 생식을 특징으로 하며 무성 번식한다. 아포메이오시스는 모 식물의 체세포 조직과 동일한 염색체 번호와 동일하거나 매우 유사한 유전자형을 가진 감소되지 않은 난세포의 생산으로 이어지는 과정이다. 감소되지 않은 난세포는 감소되지 않은 거대포자(megaspore)(디플로스포리(diplospory)) 또는 체세포 초기 세포(apospory)에서 유래할 수 있다. 디플로스포리의 경우, 거대포자형성은 유사분열 또는 변형된 감수분열로 대체된다. 변형된 감수분열은 바람직하게는 재조합이 없는 1차 분열 복원 유형이다. 대안적으로 변형된 감수분열은 2차 분열 복원 유형일 수 있다. 바람직한 구현예에서, 무형성증은 제1 감수분열에 영향을 미치는 디플로스포러스 유형이다. 아포믹시스는 배우체 아모믹시스(gametophytic apomixis) 및 포자체 아모믹시스(sporophytic apomixis)(곁배(adventive embryony)라고도 함)로 알려진 적어도 두 가지 형태를 포함하여 다양한 형태로 발생하는 것으로 알려져 있다. 배우체 아모믹시스가 발생하는 식물의 예로는 민들레(Taraxacum sp.), 조팝나물(Hieracium sp.), 켄터키블루그래스(Poa pratensis), 이스턴 감마스래스(Tripsacum dactyloides) 등이 포함된다. 포자체 아모믹시스가 발생하는 식물의 예로는 감귤류(Citrus sp.) 망고스틴(Garcinia mangostana) 등이 포함된다.

본원에서 사용되는 용어 "디플로스포리"는 감소되지 않은 배낭이 유사분열에 의해 직접적으로 또는 중단된 감수분열 이벤트에 의해 거대포자 모세포로부터 유도되는 상황을 지칭한다. 세 가지 주요 유형의 디플로스포리류가 보고되었으며, 발생하는 식물의 이름을 따서 명명되었으며, Taraxacum, Ixeris 및 Antennaria 유형이다. Taraxacum 유형에서는, 감수분열 전기가 시작되지만, 그 다음 그 과정이 중단되어 2개의 감소되지 않은 다이애드(dyads)가 생성되며, 그 중 하나는 유사분열에 의해 배낭이 된다. Ixeris 유형에서, 8개 핵의 배낭을 발생시키는 핵의 2개의 추가 유사분열은 등식 분열이 후속하고, 이후에 감수분열 전기가 후속한다. Taraxacum 및 Ixeris 유형은 감수분열의 변형을 수반하기 때문에 감수분열 디플로스포리로 알려져 있다. 이에 반해, 유사분열 디플로스포리라고 불리는 Antennaria 유형에서는 거대포자 모세포가 감수분열을 시작하지 않고, 직접 3회 분열하여 감소되지 않은 배낭을 생성한다. 디플로스포리에 의한 배우체 아모믹시스에서, 감소되지 않은 배우체는 감소되지 않은 거대 포자로부터 생성된다. 이 감소되지 않은 거대포자는 유사분열-유사 분열(유사분열 디스플로리(mitotic displory)) 또는 변형된 감수분열(meiotic displory)로 인해 발생한다. 무포자(apospory)에 의한 배우체 아모믹시스와 디스플로리에 의한 배우체 아모믹시스 모두에서, 감소되지 않은 난세포는 단위 발생적으로 배아로 발달한다. Taraxacum의 아포믹시스는 디플로스포리형으로, 첫 번째 암컷 감수분열(감수분열 I)을 건너뛰어, 모식물과 동일한 유전자형을 가진 2개의 감소되지 않은 거대포자를 형성한다. 이 거대포자 중 하나는 퇴화하고, 다른 살아남은 감소되지 않은 거대포자는 감소되지 않은 난세포를 함유하는 감소되지 않은 거대배우체 (또는 배낭)를 생성한다. 이 감소되지 않은 난세포는 수정 없이 모 식물과 동일한 유전자형을 가진 배아로 발달한다. 배우체 아모믹시스 과정에서 발생하는 종자를 아포믹틱 종자라고 한다.

용어 "디플로스포리 기능"은 식물, 바람직하게는 암컷 난소, 바람직하게는 거대포자 모세포 및/또는 암컷 배우자에서 디플로스포리를 유도하는 능력을 의미한다. 따라서, 디플로스포리 기능이 도입된 식물은 디플로스포리 과정을 수행이 가능한, 즉 감수분열 I 복원을 통해 감소되지 않은 배우자를 생산하는 것이 가능하다.

본원에서 사용되는 용어 "아포믹틱 종자"는 무포자성 식물 종으로부터, 또는 아포믹시스, 특히 디플로스포리를 통해 배우체 아포믹시스를 겪도록 유도된 식물 또는 작물에 의해 얻어지는 종자를 의미한다. 아포믹틱 종자는 진정한 번식이 가능한 부모 식물 및 발아 식물과 복제 및 유전적으로 동일하다는 점에서 특징이 있다. 본 발명에서 "아포믹틱 종자"는 "클론 아포믹틱 종자"를 의미하기도 한다.

본원에서 사용되는 용어 "아포믹틱 식물(들)"은 수정 없이 그 자체로 무성 생식하는 식물을 의미한다. 아포믹틱 식물은 아포믹틱이 되도록 변형된 유성 식물일 수 있으며, 예를 들어, 이는 예를 들어 아포믹틱 식물을 얻기 위해 본원에 교시된 바와 같은 하나 이상의 단위생식 유전자로 유전적으로 변형된 유성 식물, 또는 아포믹틱 식물의 자손인 식물이다. 이 경우, 아포믹트적으로 생산된 자손은 부모 식물과 유전적으로 동일한다.

세포, 식물, 식물 부분 또는 종자의 "클론"은 이들이 유래된 부모 식물뿐만 아니라 이들의 형제와 유전적으로 동일하다는 점에서 특징이 있다. 개별 클론의 게놈 DNA 서열은 거의 동일하지만 돌연변이로 인해 약간의 차이가 발생할 수 있다.

본원에서 사용되는 용어 "진정한 육종" 또는 "진정한 육종 유기체"(순수-육종된 유기체로도 알려짐)는 항상 특정 표현형 형질을 변경되지 않거나 거의 변경되지 않은 상태로 후손에게 물려주는 유기체를 의미한다. 유기체는 이것이 적용되는 각 특성에 대해 진정한 육종이라고 하며, "진정한 육종"이라는 용어는 개별 유전적 특성을 설명하는 데에도 사용된다.

본원에서 사용되는 용어 "F1 잡종"(또는 혈통 1 잡종)은 분명히 다른 부모 유형의 자손의 1세대 자손을 의미한다. 부모 유형은 근친교배일 수도 있고 아닐 수도 있다. F1 잡종은 유전학 및 선택적 육종에 사용되며, F1 크로스브리드(crossbreed)로 나타날 수 있다. 분명히 다른 부모 유형의 자손은 부모로부터의 특성이 조합된 새롭고 균일한 표현형을 생성한다. F1 잡종은 이종증(heterosis)과 같은 뚜렷한 이점과 연관되어 있으며, 따라서 농업 관행에서 매우 바람직한다. 본 발명의 일 구현에서, 본원에 교시된 방법, 유전자, 단백질, 변이체 또는 그의 단편은 그의 유전적 복잡성에 관계없이 F1 잡종의 유전자형을 고정하는데 사용될 수 있고, 한 단계에서 진정 육종할 수 있는 유기체의 생산을 가능하게 한다.

본원에서 사용되는 "수분" 또는 "폴리네이팅"이라는 용어는 꽃가루가 식물의 꽃밥(수컷 부분)에서 암술머리(암컷 부분)로 옮겨져 수정 및 번식을 가능하게 하는 과정을 의미한다. 꽃을 피우는 식물인 속씨식물에 독특하다. 각각의 꽃가루 알갱이는 수컷 반수체 배우체이며, 암컷 배우체로 운반되는 데 적합하며, 여기서 이는 이중 수정 과정에서 수컷 배우자(또는 배우자들)를 생산하여 수정에 영향을 줄 수 있다. 수컷 배우자를 포함하는 성공적인 속씨식물 꽃가루 알갱이(배우체)는 암술머리로 옮겨져, 여기서 이는 발아하고 꽃가루관이 암술대에서 난소까지 자란다. 이의 2개의 배우자는 암배우자를 포함하는 배우체(들)가 심피(carpel) 내에서 유지되는 튜브 아래로 이동한다. 한 핵은 극체와 융합하여 배젖 조직을 생성하고, 다른 핵은 배주와 융합하여 배아를 생성한다.

본원에서 사용되는 용어 "단위생식"은 수정 없이 배아의 성장 및 발달이 일어나는 무성 생식의 형태를 의미한다. 본 발명의 유전자 및 단백질은 바람직하게는 디플로스포리 인자, 예를 들어 유전자 또는 화학적 인자와 조합하여 아포믹틱 자손을 생산할 수 있다.

본원에서 사용되는 용어 "단성생식 표현형"은 식물 및/또는 그의 자손이 수정 없이 난세포로부터 배아를 성장 및 발달시키는 능력을 의미한다.

본원에 사용된 용어 "유전자 피라미드화 또는 스태킹"은 다른 부모 계열로부터 관련되거나 관련되지 않은 유전자들을 한 식물로 조합하는 프로세스를 칭하며, 이는 바람직하거나 유리한 형질(예를 들어, 질병 저항성 형질, 색상, 가뭄 저항성, 해충 저항성 등.)의 기저를 이룬다. 유전자 피라미드화 또는 스태킹은 전통적인 육종 방법을 사용하여 수행하거나, 분자 마커를 사용하여, 원하는 대립 유전자 조합을 포함하는 식물을 식별 및 유지하고, 원하는 대립 유전자 조합이 없는 식물을 폐기함으로써 촉진될 수 있다. 본 발명의 일 구현에서, 본원에 교시된 단위생식 유전자는 아포믹틱 식물을 생산하거나 유성 작물에 아포믹시스를 도입하기 위한 유전자 피라미딩 또는 스태킹 프로그램에 유리하게 사용될 수 있다.

본 문헌 및 그 청구범위에서, "구성하다"라는 동사 및 그 활용형은 비제한적 의미로 단어 뒤에 오는 항목이 포함되지만 구체적으로 언급되지 않은 항목은 제외되지 않는다는 의미로 사용된다. 또한, 부정관사 "a" 또는 "an"에 의한 요소에 대한 언급은 문맥상 요소 중 오직 하나만 존재함을 명백히 요구하지 않는 한, 하나 이상의 요소가 존재할 가능성을 배제하지 않습니다. 따라서 부정관사 "a" 또는 "an"은 일반적으로 "적어도 하나"를 의미한다. 또한, 본원에서 "서열"을 언급할 때 일반적으로 특정 서브유닛(예: 아미노산) 시퀀스를 갖는 실제 물리적 분자를 언급하는 것으로 이해된다.

본원에서 사용되는 바와 같이, 용어 "식물"은 식물 세포, 식물 조직 또는 기관, 식물 원형질체, 식물이 재생될 수 있는 식물 세포 조직 배양물, 식물 캘리(plant calli), 식물 세포 덩어리, 및 배아, 꽃가루, 씨주머니, 과일, 꽃, 잎(예: 수확한 상추 작물), 종자, 뿌리, 뿌리 끝 등과 같이 식물 또는 식물의 부분에서 온전한 식물 세포를 포함한다.

발명의 상세한 설명

본 발명은 돌연변이 유전자가 단위생식에서 기능하는 돌연변이 유전자의 제조 방법을 제공한다. 바람직하게는, 상기 방법은 코딩된 PAR 단백질의 발현을 증가시키기 위해 본원에서 par 대립유전자로서 표시된 단위생식 유전자의 유성 변이체의 프로모터 서열을 돌연변이시키는 단계를 포함한다. 생성된 돌연변이 유전자는 식물에 단위생식 표현형을 유도할 수 있기 때문에 Par 대립유전자로 간주될 수 있다. par 대립유전자가 우성 Par 대립유전자가 결여된 식물 또는 식물 세포의 내인성 대립유전자인 경우, 본 발명의 방법은 단위생식을 나타내지 않는 식물 또는 식물 세포를 상기 par 대립유전자의 프로모터의 변형에 의해 단위생식을 나타내는 식물 또는 식물 세포로 형질전환시킨다. 본 발명은 par 대립유전자의 프로모터 서열을 변형시켜 유성 par 대립유전자를 단위생식 Par 대립유전자로 전환시키는 방법을 제공한다. 본 발명은 하기 단계들을 포함하는, 단위생식에서 기능적인 돌연변이 유전자를 생산하는 방법을 제공한다:

(a) 프로모터에 작동 가능하게 연결된 PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계; 및

(b) PAR 단백질을 인코딩하는 서열의 업스트림의 서열을 변형하여 인코딩된 PAR 단백질의 발현을 증가시키도록, 바람직하게는 성숙 암컷 배우체에서, 상기 프로모터를 변형시키는 단계.

보다 구체적으로, 본 발명은 하기 단계들을 포함하는, 단위생식에서 기능적인 돌연변이 유전자를 생산하는 방법을 제공한다:

(a) 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에 작동 가능하게 연결된 PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계; 및

(b) 하나 이상의 전사 인자 MYB 결합 부위의 업스트림의 서열을 변형하여 인코딩된 PAR 단백질의 발현을 증가시키도록, 바람직하게는 성숙 암컷 배우체에서, 상기 프로모터를 변형시키는 단계.

PAR 단백질을 인코딩하는 서열의 업스트림의 서열, 바람직하게는 하나 이상의 전사 인자 MYB 결합 부위의 업스트림은 PAR 단백질의 발현을 향상시키는 인핸서 서열을 도입하고/하거나 PAR 단백질의 발현을 억제하는 리프레서 서열을 제거함으로써 변형될 수 있다. 바람직하게는 인핸서 서열이 삽입되며, 바람직하게는 암컷 배우체 특이적 인핸서 서열이 삽입된다. 상기 삽입체는 본원에 정의된 바와 같은 MITE 서열일 수 있다. 대안적으로 또는 추가로, PAR 단백질을 인코딩하는 서열의 업스트림의 프로모터 서열, 바람직하게는 하나 이상의 MYB 결합 부위의 업스트림은 하나 이상의 뉴클레오티드 치환, 삽입 및/또는 결실을 초래하는 (무작위) 돌연변이 유발에 의해 변경되어 하나 이상의 인핸서 서열을 도입하거나 그리고/또는 인코딩된 PAR 단백질의 발현을 증가시킨다.

추가로 또는 대안적으로, 본 발명은 하기 단계들을 포함하는, 단위생식에서 기능적인 돌연변이 유전자를 생산하는 방법을 제공한다:

(b) 하나 이상의 전사 인자 MYB 결합 부위 중 적어도 하나를 변형시킴으로써 인코딩된 PAR 단백질의 발현을 증가시키도록 상기 프로모터를 변형시키는 단계.

바람직하게는, 본 발명의 돌연변이 유전자의 변형된 프로모터는 식물에 존재할 때, 변형되지 않은 대응물, 즉 본 발명의 프로모터가 본원에 정의된 바와 같이 수득된 (내인성 또는 천연) 프로모터로에 비해, 상기 프로모터에 작동 가능하게 연결된 코딩 서열에 의해 인코딩된 PAR 단백질의 증가된 발현을 일으킨다. 바람직하게는, 상기 증가된 발현은 적어도 본 발명의 변형된 프로모터 및/또는 돌연변이 유전자를 포함하는 식물의 난세포에서 존재한다. 바람직하게는, 발현의 증가는 원래의 비-돌연변이 유전자(즉, 본 발명의 방법의 단계 (a)의 유전자)에 비해 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90 또는 100%의 증가이다.

일 구현에서, 단계 a)에서 PAR 단백질을 인코딩하는 유전자는 아라비돕시스 탈리아나(Arabidopsis thaliana)에서 기원한 유전자가 아니다. 일 구현에서, 본 발명의 돌연변이 유전자는 MYB 결합 부위 중 하나 이상에서 돌연변이를 갖는 아라비돕시스 탈리아나(Arabidopsis thaliana) DAZ3에서 유래된 돌연변이 프로모터를 포함하지 않는다.

단계 (a)에서 제공되는 유전자는 단위생식 유전자, 바람직하게는 유전자의 유성 변이체, 즉 par 대립유전자이다. 생성된 변이 유전자는 단위생식에 기능적이므로, 본 발명의 방법은 단위생식 유전자의 유성 대립유전자(par allele)를 단위생식에 기능하는 대립유전자(Par allele)로 전환시키는 방법으로도 볼 수 있다.

전사 인자 MYB 결합 부위(또한 본원에서 "MYB 결합 부위"로 표시됨)는 전사 인자 MYB에 의해 인식되고 결합되는 프로모터 내의 서열이다. MYB 단백질은 MYB 결합 부위에서 DNA에 결합하여 전사를 조절하는 능력을 부여하는 다양한 수의 MYB 도메인 반복을 포함하는 DNA 결합 단백질 계열이다.

본 발명자들은 par 대립유전자의 시작 코돈의 업스트림의 약 50-150bps 영역에서 하나 이상의 MYB 결합 부위를 확인하였다. MYB 결합 부위는 본원에서 바람직하게는 NACCNNN, 바람직하게는 AACCNNN, 더 바람직하게는 AACCGNN, 더욱 더 바람직하게는 AACCG[C/T]N, 더욱 더 바람직하게는 AACCG[C/T]C의 뉴클레오티드 서열을 갖는 바람직하게는 7개 뉴클레오티드의 서열로 정의되며, AACCGCC, AACCGTC 또는 [T/A]AACCGCC일 수 있다(Borg 등 2011). 바람직하게는 하나 이상의 MYB 결합 부위는 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림의 약 60-140bps, 70-130bps, 80-120bps 또는 90-110bps, 바람직하게는 시작 코돈의 업스트림의 최대 약 200, 190, 180, 170, 160 또는 150, 140, 130, 120 또는 110개 뉴클레오티드 사이에 위치하며, 훨씬 더 바람직하게는 하나 이상, 바람직하게는 2개의 MYB 결합 부위의 3' 말단은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림의 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109 또는 110개 뉴클레오티드에 위치한다. 일부 경우에는 두 개의 MYB 결합 부위가 상기 영역에 위치한다. 예를 들어, 상추(락투카 사티바(Lactuca sativa))에서, 첫 번째 MYB 결합 부위는 ATG 시작 코돈의 업스트림의 117-110개 뉴클레오티드 위치에 위치하고, 두 번째 MYB 결합 부위는 ATG 시작 코돈의 업스트림의 104-98개 뉴클레오티드 위치에 위치한다.

MYB 결합 부위는 바람직하게는 전사 인자 MYB의 결합 부위로서 작용하며, 여기서 MYB 전사 인자는 R2R3 전사 인자 또는 R2R3-MYB 전사 인자이고, 여기서 상기 전사 인자 MYB는 DUO1(UniProtKB 어세션 A0A178VEK7)이거나, 또는 이의 변이체, 상동체 또는 오르토로그일 수 있다. 전사 인자는 바람직하게는 SEQ ID NO: 62와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다.

추가로 또는 대안적으로, 본 발명은 또한 식물에 단위생식 표현형을 유도할 수 있는 돌연변이 유전자를 생산하는 방법으로서 간주될 수 있으며, 상기 방법은 하기 단계를 포함한다:

(a) PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계로서, 상기 서열은 프로모터에 작동 가능하게 연결되며, 상기 프로모터는 선택적으로 하나 이상의 전사 인자 MYB 결합 부위를 포함하는, 단계; 및

(b) 인코딩된 PAR 단백질의 발현을 증가시키기 위해 바람직하게는 하기 중 적어도 하나에 의해 프로모터를 변형시키는 단계:

i) 본원에 정의된 바와 같은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림, 훨씬 더 바람직하게는 본원에 정의된 하나 이상의 MYB 결합 부위의 업스트림 또는 바로(directly) 업스트림의 프로모터 서열에 삽입체를 도입하여, 바람직하게는 인핸서 서열을 도입하거나 리프레서 서열을 제거함으로써, 인코딩된 PAR 단백질의 발현을 증가시키는 단계;

ii) 본원에 정의된 바와 같은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림, 훨씬 더 바람직하게는 본원에 정의된 하나 이상의 MYB 결합 부위의 업스트림 또는 바로 업스트림의 프로모터 서열에서 치환 및/또는 결실을 도입하는 단계로서, 여기서 치환 및/또는 결실은 바람직하게는 인핸서 서열을 도입하거나 리프레서 서열을 제거함으로써 인코딩된 PAR 단백질의 발현을 증가시키는, 단계; 및

(iii) (i)와 (ii)의 조합.

본 발명의 방법에서 프로모터를 변형시키는 것은 당업계에 공지된 임의의 통상적인 방법을 사용하여 수행될 수 있으며, 이에 한정하는 것은 아니나, 예를 들어 본원에 정의된 바와 같은 하나 이상의 MYB 결합 부위 바로 업스트림에서 프로모터에 삽입체 또는 결실을 바람직하게는 임의로 상동 재조합을 통한 무작위 또는 표적 돌연변이유발에 의해 도입하는 것일 수 있다.

선택적으로, 프로모터의 삽입, 치환 또는 결실은 본원에 정의된 하나 이상의 MYB 결합 부위를 변형 또는 제거할 수 있다.

따라서, 본 발명은 또한 식물에 단위생식 표현형을 유도할 수 있는 돌연변이 유전자를 생산하는 방법으로 간주될 수 있으며, 상기 방법은 다음 단계를 포함한다:

(a) PAR 단백질을 인코딩하는 서열을 포함하는 유전자를 제공하는 단계로서, 상기 서열은 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에 작동 가능하게 연결된, 단계; 및

(b) 본원에 정의된 바와 같은 프로모터에 하나 이상의 MYB 결합 부위의 바로 업스트림에 삽입 또는 결실을 도입함으로써 인코딩된 PAR 단백질의 발현을 증가시키기 위해 하나 이상의 전사 인자 MYB 결합 부위의 업스트림의 서열을 변형시킴으로써 프로모터를 변형시키는 단계.

추가로, 또는 대안적으로, 본 발명의 방법은 본원에 정의된 바와 같은 하나 이상의 MYB 결합 부위를 유도, 변형 또는 제거함으로써 프로모터를 변형시키는 것을 포함할 수 있다.

프로모터가 본원에 정의된 바와 같은 하나 이상, 바람직하게는 2개의 MYB 결합 부위를 포함하는 경우, 선택적으로 이들 하나 이상, 바람직하게는 2개의 MYB 결합 부위는 변형되거나 제거되어, 전사 인자 MYB의 결합을 감소시키며, 그리고/또는 삽입 또는 결실이 이들 하나 이상의 MYB 결합 부위의 업스트림에 도입된다. 본 발명의 방법에서 MYB 결합 부위의 변형은 1, 2, 3, 4, 5, 6 또는 7개의 뉴클레오티드, 바람직하게는 1, 2 또는 3개의 뉴클레오티드, 훨씬 더 바람직하게는 1개의 뉴클레오티드의 변형일 수 있어, 상기 서열은 더 이상 MYB 결합 부위가 아니다. 바람직하게는 상기 변형은 상기 나타낸 바와 같이 7개의 뉴클레오티드 길이 MYB 결합 모티프의 첫 번째, 두 번째, 세 번째, 네 번째 또는 다섯 번째 위치에 위치한 적어도 하나의 돌연변이(뉴클레오티드 교환, 삽입 또는 결실), 즉 모티프 AACCGNN의 A, A, C, C 및 G 중 적어도 하나의 변형이다. 바람직하게는, 상기 변형은 상기 표시된 바와 같이 7개의 뉴클레오티드 길이 MYB 결합 모티프의 첫 번째, 두 번째, 세 번째 또는 네 번째 위치에 위치한 적어도 하나의 돌연변이(뉴클레오티드 교환, 삽입 또는 결실), 즉 모티프 AACCGNN의 A, A, C 및 C 중 적어도 하나의 변형, 선택적으로 이들 위치에서 뉴클레오티드 2개, 3개 또는 4개 모두의 변형이다.

바람직하게는, 변형은 MYB 결합 부위에 대한 전사 인자 MYB의 결합을 감소시키거나 없애는 결과를 가져온다. 바람직하게는, 결합 친화도는 예를 들어 Kelemen 등(상기 참조)에 기술된 바와 같은, 적합한 실험 조건 하에서 시험될 때 적어도 약 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 또는 100% 감소된다. 임의로, MYB 결합 부위의 변형은 상기 MYB 결합 부위의 결실일 수 있다. 상기 변형은 무작위 돌연변이유발(예를 들어, 화학적 또는 방사선 돌연변이유발) 또는 표적 돌연변이유발(예를 들어, CRISPR-엔도뉴클레아제 매개 돌연변이유발)에 의해 수행될 수 있다. 임의로, 유전자에 존재하는 다중(2개, 3개 또는 그 이상) MYB 결합 부위는 본 발명의 방법에서 본원에 정의된 바와 같이 변형된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa)의 변형된 프로모터를 포함하고, 여기서 상기 프로모터는 SEQ ID NO: 17의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa) PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 상기 프로모터를 포함하며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 33의 서열을 포함하거나 이로 구성된다. 선택적으로, 돌연변이 유전자는 SEQ ID NO: 35의 서열을 포함하거나 이로 구성된다. 본 발명은 또한 돌연변이 유전자 및/또는 구축물을 포함하는, 식물 또는 식물 세포, 바람직하게는 락투카 사티바(Lactuca sativa) 식물 또는 식물 세포를 포함한다.

일 구현으로, 유성 유전자, 바람직하게는 par 유전자의 프로모터는 하나 이상의 MYB 결합 부위의 업스트림에 삽입체를 도입함으로써 변형될 수 있다. 삽입체는 하나 이상의 MYB 결합 부위 바로 옆에 또는 근접하게 도입될 수 있다. 삽입체와 MYB 결합 부위 사이의 거리, 또는 다중 MYB 결합 부위의 경우, 코딩 서열로부터 가장 업스트림에 위치한 MYB 결합 부위는 바람직하게는 최대 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 또는 0개의 뉴클레오티드이다. 바람직하게는, 삽입체는 하나 이상의 MYB 결합 부위의 바로 업스트림에 도입된다. 본 발명의 방법에서 유전자의 프로모터에 도입될 수 있는 삽입체는 바람직하게는 핵산 삽입물, 바람직하게는 이중 가닥 DNA 삽입물을 포함하고, 여기서 상기 삽입물은 50 내지 2000bp, 100 내지 1900bp, 200 내지 1800bp, 300 내지 1700bp, 400 내지 1600bp, 500 내지 1500bp, 600 내지 1400 bp, 1000 내지 1400, 1200 내지 1400, 또는 1300 내지 1400bp의 길이를 갖는다. 보다 바람직하게, 상기 삽입체는 약 1300bp의 길이를 갖는다. 대안적으로 또는 추가로, 삽입체는 약 1-50bp, 약 5-30bp 또는 약 10-20bp이다. 바람직하게, 상기 삽입체는 본원에 정의된 바와 같은 MYB 결합 부위의 업스트림(5')에 프로모터 내에 도입되며, 바람직하게 MYB 결합 부위와 삽입체, 바람직하게 삽입체의 3'-말단 사이의 거리는 0-200bps, 바람직하게는 최대 0, 10, 20, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 또는 200bps가 되도록 한다. 바람직하게는, 상기 삽입체는 삽입체의 3' 말단 뉴클레오티드가 SEQ ID NO: 2의 뉴클레오티드 1798 및/또는 SEQ ID NO: 5의 뉴클레오티드 1798의 위치에 상동인 위치에 있도록 국소화된다. 바람직하게는, 상기 삽입체에는 오픈리딩프레임이 없다.

상기 삽입체는 비자율적 전이 요소, 바람직하게는 hAT-유래 비자율 트랜스포존 요소일 수 있다. 삽입물은 인핸서 요소, 바람직하게는 암컷 배우체-특이적 인핸서 요소를 포함할 수 있다. 훨씬 더 바람직하게는, 상기 삽입체는 MITE(Miniature Inverted-Repeat Transposable Elements) 또는 MITE-유사 서열이고, 상기 MITE 또는 MITE-유사 서열은 터미널 역 반복(terminal inverted repeats)(TIRs)에 측면에 있으며(flanked by), 이는 차례로 소 직접 반복(small direct repeats(표적 부위 듀플리케이션, TSDs)에 측면에 있는, 오픈리딩프레임이 없는 내부 서열을 함유하는 것을 특징으로 하는, 비-자율적 요소, 바람직하게는 비-자율적 전이 요소이다. TIR은 서열 CAGGGCCGG 및/또는 CCGGCCCTG를 가질 수 있다. TSD는 서열 ACTGCTAC를 가질 수 있다. MITE, TIR 및 서열에 대한 추가 설명은 Guo et al, Scientific Reports. 2017 Jun 1;7(1):2634를 참조바라며, 이는 본원에 참조로 포함된다. 상기 삽입체, 바람직하게는 상기 MITE 또는 MITE-유사 서열은 SEQ ID NO: 60과 적어도 약 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% 이상의 동일성을 가질 수 있다. 삽입체는 재조합 및/또는 표적 게놈 편집에 의해 합성적으로 도입될 수 있다.

임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa)의 변형된 프로모터를 포함하고, 여기서 상기 프로모터는 서열번호 18의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa) PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 상기 프로모터를 포함하며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 33의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 SEQ ID NO: 36의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa)의 변형된 프로모터를 포함하며, 여기서 상기 프로모터는 SEQ ID NO: 18의 서열을 포함하거나 이로 구성되고, 상기 프로모터는 타락사컴 오피시날레(Taraxacum officinale) PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결되며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 3의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 SEQ ID NO: 64의 서열을 포함하거나 이로 구성된다. 본 발명은 또한 돌연변이 유전자 및/또는 구조물을 포함하는 식물 또는 식물 세포, 바람직하게 락투카 사티바(Lactuca sativa) 식물 또는 식물 세포를 포함한다.

선택적으로 돌연변이 유전자는 타락사컴 오피시날레(Taraxacum officinale)의 Par 프로모터를 포함하며, 여기서 상기 프로모터는 SEQ ID NO: 2의 서열을 포함하거나 이로 구성된다. 선택적으로, 돌연변이 유전자는 PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 상기 프로모터를 포함하며, 여기서 상기 PAR 단백질은 (네이티브) 타락사컴 오피시날레(Taraxacum officinale) PAR 단백질이 아니다. 임의로, 돌연변이 유전자는 본원에서 상기 정의된 바와 같은 오르토로그 PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 상기 프로모터를 포함한다. 임의로, 돌연변이 유전자는 타락사컴 오피시날레(Taraxacum officinale)의 Par 프로모터를 포함하고, 여기서 상기 프로모터는 SEQ ID NO: 2의 서열을 포함하거나 이로 구성되고, 여기서 상기 프로모터는 락투카 사티바(Lactuca sativa) PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결되며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 33의 서열을 포함하거나 이로 구성된다. 선택적으로, 돌연변이 유전자는 SEQ ID NO: 65의 서열을 포함하거나 이로 구성된다.

또 다른 구현에서, 유성 유전자, 바람직하게는 par 유전자의 프로모터는 하나 이상의 MYB 결합 부위의 업스트림에 결실을 도입함으로써 변형될 수 있다. 결실은 하나 이상의 MYB 결합 부위에 가까운 부근 또는 바로 옆에 도입될 수 있다. 결실과 MYB 결합 부위 사이의 거리, 또는 다중 MYB 결합 부위의 경우, 코딩 서열로부터 가장 업스트림에 위치한 MYB 결합 부위는 바람직하게는 최대 200, 150, 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1개의 뉴클레오티드이다. 바람직하게는, 결실은 하나 이상의 MYB 결합 부위의 바로 업스트림에 도입된다. 본 발명의 방법에서 유전자의 프로모터에 도입될 수 있는 결실은 바람직하게는 핵산 결실, 바람직하게는 이중 가닥 DNA 결실을 포함하며, 여기서 상기 결실은 10 내지 1000bp, 50 내지 900bp, 100 내지 800bp, 200 내지 700bp, 350 내지 600bp, 바람직하게는 약 400bp의 길이를 갖는다. 바람직하게는, 상기 결실은 오픈리딩프레임이 없다. 결실은 재조합 및/또는 표적화 또는 무작위 게놈 편집에 의해 도입될 수 있다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa)의 변형된 프로모터를 포함하고, 여기서 상기 프로모터는 SEQ ID NO: 20의 서열을 포함하거나 이로 구성된다. 임의로, 돌연변이 유전자는 락투카 사티바(Lactuca sativa) PAR 단백질을 인코딩하는 서열에 작동가능하게 연결된 상기 프로모터를 포함하며, 바람직하게는 상기 코딩 서열은 SEQ ID NO: 33의 서열을 포함하거나 이로 구성된다. 선택적으로, 돌연변이 유전자는 SEQ ID NO: 61의 서열을 포함하거나 이로 구성된다. 본 발명은 또한 상기 돌연변이 유전자 및/또는 구축물을 포함하는 식물 또는 식물 세포, 바람직하게 락투카 사티바(Lactuca sativa) 식물 또는 식물 세포를 포함한다.

바람직하게는, 본 발명의 방법의 단계 a)의 유전자 및 본 발명의 방법에 의해 얻을 수 있는 돌연변이 유전자는 핵산 분자, 바람직하게는 DNA 분자, 보다 더 바람직하게는 게놈 DNA 분자이거나 그의 일부이다. 임의로, 상기 게놈 DNA 분자는 식물 세포, 바람직하게는 식물 원형질체에 있다. 본 발명의 방법에 의한 그리고 식물 세포에 위치할 때, 유성 유전자의 프로모터의 변형은 대조구 식물과 비교하여 상기 식물 세포로부터 유래된 식물의 단위생식 표현형의 현저한 증가를 초래할 수 있으며, 여기서 바람직하게는 대조구 식물은 단위생식 표현형을 나타내지 않는 반면, 본 발명의 돌연변이 유전자를 포함하는 식물은 단위생식 표현형을 나타낸다. 대조구 식물은 바람직하게는 par 대립유전자의 프로모터가 본원에 정의된 바와 같이 변형되지 않는다는 점에서 상기 식물 세포로부터 유래된 식물과만 상이하다. 바람직하게는, 대조구 식물 또는 대조구 식물 세포는 대조구 식물 또는 대조구 식물 세포가 본원에 정의된 바와 같은 유전적 변형을 포함하지 않는다는 점에서 각각 본 발명의 식물 세포 또는 식물과 상이할 뿐이다.

바람직하게는, 단계 (a)의 유전자는 par 대립유전자이며, 본원에 정의된 바와 같은 par 대립유전자의 프로모터의 변형 및 단위생식을 할 수 없는 식물 세포에 위치할 때, 단위생식 표현형을 나타내는 식물을 초래한다. 본 발명의 방법에 의해 얻을 수 있는 돌연변이 유전자는 단위생식에 기능적이므로, 돌연변이 유전자는 Par 대립유전자로 간주될 수 있으며, 본 발명의 방법은 또한 par 대립유전자를 Par 대립유전자로 전환시키는 방법으로 간주될 수 있다.

임의로, 본 발명의 방법에 의한 프로모터의 변형은 프로모터에 대한 전사 인자 MYB의 결합에 영향을 미쳐 프로모터를 포함하는 유전자에 의해 인코딩되는 PAR 단백질의 발현을 증가시킨다. 임의로, 변형은 전사 인자 MYB의 결합을 감소시키거나 폐지시킨다. 프로모터에 대한 전사 인자 MYB의 결합은 이에 한정하는 것은 아니나, 생체내 이스트 원-하이브리드 시스템(참조 예: Kelemen 등, PLoS One. 2015;10(10): e0141044)와 같이 당해 기술분야의 숙련자에게 알려진 적절한 어느 어세이에 의해 평가될 수 있다.

무작위 돌연변이 유발은 화학적 돌연변이 유발, 감마 방사선, X선 또는 고속 중성자 방사선일 수 있지만 이에 제한되지 않는다. 화학적 돌연변이 유발의 비제한적 예에는 EMS(에틸 메탄술포네이트), MMS(메틸 메탄술포네이트), NaN3(아지드화나트륨) D), ENU(N-에틸-N-니트로소우레아), AzaC(아자시티딘) 및 NQO(4-니트로퀴놀린 1-옥사이드)가 포함되지만 이에 국한되지 않는다. 선택적으로 TILLING(Targeting Induced Local Lesions IN Genomics; McCallum 등, 2000, Nat Biotech 18:455, 및 McCallum 등, 2000, Plant Physiol. 123, 439-442, 둘 다 참조로 본 명세서에 포함됨)과 같은 돌연변이 유발 시스템 본원에 정의된 바와 같은 변형된 유전자를 갖는 식물 계열을 생성하는데 사용될 수 있다. TILLING은 전통적인 화학적 돌연변이 유발(예: EMS 돌연변이 유발)을 사용하며, 이는 돌연변이에 대한 고처리량 스크리닝이 후속된다. 따라서, 원하는 돌연변이 중 하나 이상을 갖는 유전자를 포함하는 식물, 종자 및 조직은 TILLING을 사용하여 얻을 수 있다. 표적 돌연변이 유발은 특정 뉴클레오티드 또는 핵산 서열을 변경하도록 설계될 수 있는 돌연변이 유발이다. 표적 돌연변이 유발은 올리고-다이렉티드 돌연변이 유발, RNA-가이디드 엔도뉴클레아제(예: CRISPR 기술), TALEN 또는 징크 핑거 기술 및 이들의 조합으로부터 선택된 기술로부터 선택될 수 있지만, 이에 제한되지 않는다.

선택적으로, 본 발명의 방법의 단계 (a)의 유전자는 천연 서열이다. 본 발명의 방법의 단계 (a)의 유전자는 바람직하게는 임의로 3'UTR 서열이 뒤따르는 PAR 단백질을 인코딩하는 서열에 작동 가능하게 연결된 프로모터를 포함하거나 이로 구성된다. 단계 (a)에서 제공되는 유전자는 식물 세포, 바람직하게는 단위생식 유전자의 단위생식 대립유전자를 포함하지 않는 식물 원형질체의 일부일 수 있다. 바람직하게는 상기 식물 세포 또는 원형질체는 비-단위발생적이며, 즉 상기 세포 또는 원형질체로부터 재생된 식물은 단위발생 표현형을 나타내지 않는다. 달리 말하면, 단계 (a)에서 제공되는 유전자는 바람직하게는 식물 세포, 바람직하게는 식물 원형질체 내에 포함되며, 여기에서 본원에 정의된 돌연변이는 식물 세포의 단위 생식을 유도하거나 증가시킨다. 즉 상기 돌연변이된 세포 또는 원형질체로부터 재생된 식물은 단위생식 표현형을 나타낸다.

본 발명의 방법의 단계 (a)에서 제공되는 유전자는 바람직하게는 식물 세포에 자연적으로 존재하는 네이티브 유전자일 수 있다. 네이티브 서열은 자연에서 발견되는 서열이며 또한 본원에서 "야생형" 또는 "천연"으로 표시된다. 따라서, 이 구현에서, 프로모터, 코딩 서열 및 선택적 3'UTR은 단일 식물 종으로부터 유래한다.

대안적으로, 본 발명의 방법의 단계 (a)에서 제공된 유전자는 본원에서 키메라 유전자로도 명명된 비-천연 및/또는 합성 유전자이다. 임의로, 상기 키메라 유전자에서, 프로모터는 PAR 단백질 및/또는 3'UTR을 인코딩하는 코딩 서열에 작동 가능하게 연결되며, 여기서 상기 코딩 서열 및/또는 3'UTR은 프로모터에 대해 이종성이다. 비제한적 예로서, 프로모터는 코딩 서열 및/또는 3'UTR로서 다른 식물 종일 수 있다. 선택적으로, 프로모터 및 3'UTR은 단일 식물 종에서 유래하고 코딩 서열은 다른 식물 종에서 유래한다.

바람직하게는, 본 발명의 방법의 단계 (a)에서 제공된 유전자는 식물 세포 또는 원형질체에 존재한다. 따라서, 본 발명의 방법은 유전자의 프로모터를 변형시키는 단계 이전에 단계 (a)의 유전자를 포함하는 원형질체 또는 식물 세포를 제공하는 단계를 포함할 수 있다. 바람직하게는, 유전자는 원형질체 또는 식물 세포의 게놈에 존재하는 내인성 유전자이다. 바람직하게는 상기 원형질체 또는 식물 세포는 식물, 바람직하게는 비-단위생식 식물로부터 분리된다. 바람직하게는 상기 식물은 그의 게놈에 Par 대립유전자를 갖지 않는다. 바람직하게는, 원형질체 또는 식물 세포 내에 있는 단계 (a)에서 제공된 유전자의 프로모터는 표적화된 또는 무작위 돌연변이 유발, 바람직하게는 표적 돌연변이 유발에 의해 본원에서 정의된 바와 같이 변형된다.

본 발명의 방법의 특정 구현에서, 단계 (a)의 유전자를 포함하는 식물 세포는 식물 종자에 위치할 수 있다. 바람직하게는 상기 종자는 그의 게놈에 Par 대립유전자를 갖지 않는다. 바람직하게는, 상기 종자 내에 있는 유전자의 프로모터는 표적 또는 무작위 돌연변이유발, 바람직하게는 무작위 돌연변이유발에 의해 본 발명의 방법에서 변형된다.

유전자의 프로모터를 변형시키는 단계 후에, 본 발명의 방법은 상기 원형질체로부터 식물을 재생시키는 단계 또는 상기 종자로부터 식물을 성장시키는 단계를 포함할 수 있다.

또한, 본 발명의 방법은 스크리닝 및/또는 유전자형 분석 단계를 포함할 수 있다. 유전자형 분석은 변형 단계 후 프로모터의 적어도 일부를 시퀀싱(임의로 게놈 DNA 및/또는 관심 프로모터를 포함하는 표적 서열의 PCR 증폭이 선행됨)하거나 임의의 게놈 변이 분석 방법 또는 이에 한정하는 것은 아니나 SBG(Sequence Based Genotyping) 또는 KeyGene® SNPSelect 분석과 같은 당해 기술분야에 공지된 분자 마커 검정에 의해 수행될 수 있다. 또한 PCR 프라이머가 변형 측면에 있는 식물 DNA를 기반으로 하는 "이벤트 특이적" PCR 진단 방법이 개발될 수 있다(US6563026 참조). 유사하게, 이벤트 특이적 AFLP 핑거프린트 또는 RFLP 핑거프린트는 트랜스제닉 식물 또는 그로부터 유래된 어느 식물, 종자, 조직 또는 세포를 식별하기 위해 개발될 수 있다. 유전자형 분석은 변형 단계 직후 또는 원형질체 또는 종자로부터 캘러스, 조직 또는 식물을 성장시킨 후에 수행할 수 있다.

단위생식의 기능성에 대한 스크리닝은 본 발명의 방법에 의해 수득된 돌연변이 유전자를 포함하는 식물(본원에서 시험 식물로 나타냄)이 수정되지 않은 난세포로부터 배아를 성장시키고 발달시키는 능력을 비교함으로써 직접적으로 평가될 수 있다. 바람직하게는, 이러한 능력은 바람직하게는 본 발명의 방법에 의해 수득된 돌연변이 유전자를 포함하지 않는 시험 식물과 단지 상이한 대조구 식물의 능력과 비교된다. 바람직하게는, 상기 대조구 식물은 Par 대립유전자를 포함하지 않는 식물이다.

대안적으로 또는 추가로, 본 발명의 방법에 의해 수득된 돌연변이 유전자의 단위생식에서의 기능성은 본 발명의 돌연변이 유전자를 포함하는 구축물로 아포믹시스의 소실 식물을 갖는 식물을 보완함으로써 평가될 수 있다. 이러한 아포믹시스의 소실 식물은 기능적 Par 대립유전자를 변형(예를 들어, 결실 또는 녹아웃에 의해)함으로써 아포믹틱 표현형을 상실하도록 변형된 타락사컴 오피시날레(Taraxacum officinale) 분리주 A68일 수 있다. 이러한 아포믹시스의 소실 식물은 본원에 정의된 바와 같은 SEQ ID NO: 23(SEQ ID NO: 32의 PAR 단백질을 인코딩함)이 SEQ ID NO: 24 - 27 중 어느 하나로 변형되었으며, 이는 각각 SEQ ID NO: 28 - 31의 단백질을 인코딩한다(표 1 참조). 타락사컴 오피시날레(Taraxacum officinale) 분리주 A68의 아포믹시스 식물의 이러한 손실은 CRISPR-Cas9/가이드 RNA 복합체를 사용하여 표적화된 게놈 편집에 의해 얻을 수 있으며, 여기서 상기 가이드 RNA(본원에서는 gRNA로도 표시됨)는 본원에 예시된 바와 같은 SEQ ID NO: 19의 표적 특이적 서열을 포함한다. 타락사컴 오피시날레(Taraxacum officinale) 분리주 A68의 Par 대립유전자의 결실은 단위생식의 소실을 초래하고 따라서 아포믹시스의 소실을 초래한다. 본 발명의 방법에 의해 수득된 돌연변이 유전자는 단위생식을 유도하는 능력을 가지며, 상기 돌연변이 유전자를 포함하는 구축물 또는 벡터의 도입 또는 형질감염시 아포믹틱 표현형이 회복(또는 구출)될 것이다. 타락사컴 오피시날레(Taraxacum officinale) 분리주 A68의 경우, 타가 수분(cross pollination) 없이 높은 종자 고정은 아포믹시스에 대한 분명한 징후이다. 불균형한 삼배체 수컷 및 암컷 감수 분열로 인해 성적으로 생산된 난세포 및 꽃가루 알갱이가 매우 낮은 생식력을 갖기 때문에, 이 분리주에서 자가 증식은 대체 설명으로 제외될 수 있다. 바람직하게는, 상기 기술된 보완 검정에서, 본 발명의 돌연변이 유전자는 원래의 비-돌연변이 유전자와 반대로 기능 상실 식물에서 아포믹시스를 회복시킬 수 있다. 바람직하게는, 상기 능력은 아포믹시스가 적어도 200개 중 1개, 100개 중 1개, 100개 중 10개, 100개 중 20개, 100개 중 30개, 100개 중 40개, 100개 중 50개, 100개 중 70개, 100개 중 80개, 100개 중 90개가 회복되거나 또는 돌연변이 유전자로 형질전환된 모든 기능 상실 식물은, 바람직하게는 원래의 비-돌연변이 유전자(즉, 본 발명의 방법의 단계 a)에서 제공된 유전자)로 형질전환된 500개 중 1개 미만, 600개 중 1개, 00개 중 1개, 800개 중 1개, 900개 중 1개 또는 1000개 중 1개 식물에 비해 아포믹시스를 나타낸다.

본 발명은 또한 본 발명의 방법에 의해 얻어지거나 얻을 수 있는 돌연변이 유전자를 제공한다. 바람직하게는, 돌연변이 유전자는 (단지) 그것이 본원에 정의된 바와 같은 프로모터에서 삽입 또는 결실 및/또는 하나 이상의 변형 또는 제거된 MYB 결합 부위를 포함한다는 점에서 내인성 또는 네이티브 유전자와 상이하다. 바람직하게는, 본원에 정의된 바와 같은 변형된 프로모터를 포함하는 본 발명의 돌연변이 유전자는 식물에 단위생식 표현형을 유도할 수 있다. 즉, 바람직하게는 본 발명의 변형된 프로모터를 포함하는 돌연변이 유전자는 단위생식에서 기능적이다.

임의로, 본 발명의 방법의 단계 (a)의 유전자 및/또는 본 발명의 방법에 의해 수득된 돌연변이 유전자는 분리된 핵산 분자 또는 핵산 구조물 또는 (발현) 벡터이거나 그의 일부이다. 본 발명은 또한 상기 돌연변이 유전자를 포함하는 분리된 핵산 분자, 구조물 또는 (발현) 벡터를 제공하며, 여기서 상기 구조물 또는 벡터는 상기 벡터의 구조물로 상기 식물을 형질감염시 돌연변이 유전자를 식물로 전환시킬 수 있다. 상기 핵산 분자는 DNA일 수 있지만 이에 제한되지 않으며, 게놈 DNA일 수 있거나 이로부터 유래될 수 있다. 본 발명은 또한 본 발명의 돌연변이 유전자 및/또는 상기 돌연변이 유전자를 포함하는 분리된 핵산, 구조물 또는 벡터를 원형질체, 식물 세포 또는 식물에 단위생식 표현형을 증가시키거나 유도하기 위해 사용하기 위한 용도를 제공한다.

본 발명의 돌연변이 유전자는 본원에 정의된 바와 같은 키메라 유전자일 수 있으며, 이는 선택적으로 유전자 구조물 또는 핵산 벡터의 일부이다. 본 발명의 돌연변이 유전자는 임의로 분리된 핵산, 구조물 또는 벡터에 포함된다. 본 발명의 일 구현에서, 본 발명의 돌연변이 유전자를 포함하거나 이로 구성된 핵산은 핵산을 숙주 세포로 전달하고 숙주 세포에서 상기 핵산에 의해 인코딩되는 기능적(바람직하게는 단위생식을 유도할 수 있는) 단백질을 생산하기 위해 이러한 핵산을 포함하는 구조물, 및/또는 벡터를 제조하기 위해 사용될 수 있다.

식물 세포에서 본 발명의 돌연변이 유전자의 도입에 적합한 벡터는 본원에서 즉 "발현 벡터"로 지칭된다. 숙주 세포는 바람직하게는 식물 세포이다. 임의로 일시적이지만 바람직하게는 안정한 돌연변이 유전자 서열을 숙주 세포의 게놈으로 도입하기 위한 돌연변이 유전자, 구조물 및/또는 벡터의 구축은 일반적으로 당업계에 공지되어 있다.

본 발명은 또한 본 발명의 방법에 의해 얻어지거나 얻을 수 있는 돌연변이 유전자를 포함하고/하거나 핵산 분자 또는 벡터를 포함하는 식물 세포, 식물 원형질체, 식물 조직, 종자 또는 식물을 제공한다.

본 발명은 또한 본원에 정의된 바와 같은 돌연변이 유전자를 포함하는 돌연변이 유전자, 핵산 분자, 구조물 또는 벡터를 포함하는 식물 세포, 식물 원형질체, 식물 조직, 종자 또는 식물을 제공한다. 임의로, 상기 식물 세포, 식물 원형질체, 식물 조직, 종자 또는 식물은 아포메이오시스, 바람직하게는 아포믹시스를 일으킬 수 있다.

바람직하게는, 본 발명의 핵산은 분리된 핵산이다. 일 구현에서, 본 발명의 핵산은 타락사컴(Taraxacum) 계열(예를 들어, 타락사컴 오피시날레 센수 라토(Tharaxacum officinale sensu lato) 또는 다른 식물 종으로부터 기원할 수 있다. 일 구현에서, 본 발명의 핵산은 타락사컴(Taraxacum) 또는 타락사컴 오피시날레 센수 라토(Tharaxacum officinale sensu lato)와는 다른 기원에서 유래한다.

선택적으로, 본 발명의 방법에 의해 얻어지거나 얻을 수 있는 돌연변이 유전자를 포함하거나 이로 구성된 본 발명의 핵산 또는 핵산 구조물은 단일 식물 세포의 핵 게놈에 안정적으로 삽입될 수 있으며, 이렇게 형질전환된 식물 세포는 변경된 표현형, 즉 단위생식 표현형을 갖는 형질전환된 식물을 생산하기 위해 사용될 수 있다. 비제한적 예에서, 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)에서 본원에 교시된 돌연변이 유전자를 포함하는 T-DNA 벡터는 식물 세포를 형질전환하기 위해 사용될 수 있으며, 그 후 형질전환된 식물은 예를 들어 EP0116718, EP0270822, PCT 공개 WO84/02913 및 공개된 유럽 특허 출원 EP0242246 및 Gould 등(1991)에 기재된 절차를 사용하여 형질전환된 식물 세포로부터 재생될 수 있다. 아그로박테리움 매개 식물 형질전환을 위한 T-DNA 벡터의 구축은 당업계에 잘 알려져 있다. T-DNA 벡터는 EP0120561 및 EP0120515에 기술된 바와 같은 바이너리 벡터이거나 EP0116718에 기술된 바와 같이 동종 재조합에 의해 아그로박테리움 Ti-플라스미드로 통합될 수 있는 공동-통합 벡터일 수 있다. 상추 형질전환 프로토콜은 예를 들어 Michelmore 등(1987) 및 Chupeau 등(1989)에 기재되어 있다.

경계 서열(Border sequences)은 Gielen 등(1984)에 기재되어 있다. 물론, 직접적인 유전자 전달(예를 들어, EP0223247에 기재된 바와 같음), 꽃가루 매개 형질전환(예를 들어, EP0270356 및 WO85/01856에 기재된 바와 같음), 예를 들어, US4,684,611에 기재된 바와 같은 원형질체 형질전환, 식물 RNA 바이러스 매개 형질전환(예를 들어, EP0067553 및 US4,407,956에 기재된 바와 같음), 리포좀 매개 형질전환(예를 들어, US4,536,475에 기재된 바와 같음)과 같은 절차, 및 다른 방법을 사용하여 식물 세포를 형질전환하기 위해 다른 유형의 벡터가 사용될 수 있다.

추가의 구현에서, 본 발명의 돌연변이 유전자는 체세포 혼성화에 의해 도입될 수 있다. 체세포 혼성화는 원형질체 융합에 의해 수행될 수 있다(예: Holmes, 2018 참조).

본 발명의 돌연변이 유전자는 또한 예를 들어 게놈의 적절한 위치에 이중 가닥 파손을 도입하기 위한 하나 이상의 특정 엔도뉴클레아제(예: CRISPR-엔도뉴클레아제/가이드 RNA 복합체) 및 상기 게놈 내 통합을 위한 본 발명의 돌연변이 유전자를 포함하는 공여체 구조물을 사용하여 게놈에 통합될 수 있다. 당업자는 이중 가닥 파손을 도입하기 위한 이러한 CRISPR-엔도뉴클레아제/가이드 RNA 복합체 및 통합에 적합한 공여체 구조물을 설계하는 방법을 알고 있다(리뷰를 위해 Bortesi and Fischer, 2015 참조).

마찬가지로, 형질전환된 세포로부터 형질전환된 식물의 선택 및 재생은 당업계에 잘 알려져 있다. 명백히, 상이한 종 및 심지어 단일 종의 상이한 품종 또는 재배종에 대해서도, 프로토콜은 높은 빈도로 형질전환체를 재생시키기 위해 특별히 조정된다. 본 발명은 또한 단위생식을 나타내고 본 발명의 돌연변이 유전자를 포함하는 형질전환된 식물의 자손을 포함한다.

핵 게놈의 형질전환 외에, 색소체 게놈, 바람직하게는 엽록체 게놈의 형질전환도 본 발명에 포함된다. 색소체 게놈 형질전환의 한 가지 장점은 트랜스진(들)의 확산 위험이 감소될 수 있다는 것이다. 색소체 게놈 형질전환은 당업계에 공지된 바와 같이 수행될 수 있다. 참조 예: Sidorovet 등(1999) 또는 Lutz 등(2004).

생성된 형질전환된 식물은 돌연변이 유전자를 함유하는 더 많은 형질전환된 식물을 생산하기 위해 통상적인 식물 육종 계획에 사용될 수 있다. 예를 들어, 서던 블롯 분석 또는 PCR 기반 방법 또는 Invader® Technology 분석(Third Wave Technologies, Inc.)을 사용하여 단일 카피 변형체를 선택할 수 있다. 형질전환된 세포 및 식물은 본원에 정의된 바와 같은 변형된 프로모터를 포함하는 것을 특징으로 하는 본 발명의 돌연변이 유전자의 존재에 의해 형질전환되지 않은 세포 및 식물과 쉽게 구별될 수 있다. 돌연변이 유전자의 삽입 부위 옆에 있는 식물 DNA의 서열도 시퀀싱할 수 있으며, 일상적인 사용을 위해 "이벤트 특이적" 검출 방법을 개발할 수 있다. 예를 들어, 통합 서열 및 플랭킹(게놈) 서열에 기초한 엘리트 이벤트 검출 키트(예를 들어 PCR 검출 키트)를 설명하는 WO0141558을 참조바란다.

일 구현에서, 본 발명은 본질적으로 비-단위생식(및 비-아포믹틱)인 식물로부터 기원하는 par 대립유전자로부터 유래되고, 본 발명의 방법에 의해 변형된 돌연변이 유전자를 포함한다. 이러한 식물은 야생 또는 재배 식물일 수 있다. 상기 돌연변이 유전자는 바람직하게는 본 발명의 방법에 의한 프로모터의 변형에 의해 얻어지며, 이는 프로모터에 삽입 또는 결실 및/또는 본원에 정의된 바와 같은 프로모터에 하나 이상의 변형 또는 제거된 MYB 결합 부위를 포함하는 것을 특징으로 한다.

일 구현에서, 본 발명의 돌연변이 유전자, 또는 상기 돌연변이 유전자를 포함하는 핵산, 벡터 또는 구조물은 (유전적으로) 우성 기능을 가지며, 바람직하게는 아미노산 서열 SEQ ID NO: 1, 또는 다른 식물(즉, 타락사컴(Taraxacum) 또는 타락사컴 오피시날레 센수 라토(Tharaxacum officinale sensu lato) 이외의 것)에서 발견되는 이의 오르토로그 또는 단편과 같은 이의 변이체 또는 기능적 단편을 갖는 기능적 단백질을 (과)발현함으로써 제공된다.

바람직하게는, 본 발명의 돌연변이 유전자, 또는 상기 돌연변이 유전자를 포함하는 핵산, 벡터 또는 구조물은 식물에서 생산될 때 기능적이며 단위생식을 유도 및/또는 향상시키는 단백질 또는 이의 기능적 단편(들)을 인코딩한다.

바람직하게는, 변형된 프로모터, 돌연변이 유전자, 핵산, 벡터 및/또는 구조물은 자연 발생하지 않는다, 즉 자연적으로 발생하지 않는다.

본 발명의 방법의 단계 (a)에서 제공되는 유전자는 식물 세포 또는 원형질체의 게놈에 존재하는 내인성 유전자일 수 있다. 바람직하게는, 상기 식물 세포 또는 원형질체는 단위생식 표현형을 갖지 않는 식물(본원에서 기원 식물로 표시됨)로부터 분리되거나 또는 이의 일부이다. 본 발명의 방법에 의해 수득된 돌연변이 유전자를 포함하는 식물 세포 또는 원형질체는 단위생식 표현형을 갖거나 원래 식물과 비교하여 단위생식 표현형의 현저한 증가를 나타내는 식물의 일부이거나 식물로 재생될 수 있다. 따라서, 본 발명은 또한 단위생식 표현형을 식물로 전환시키는 방법 또는 단위생식 표현형을 식물에 증가시키는 방법을 제공한다. 즉, 본 발명의 방법은 단위생식 식물을 생산하기 위해 제공된다.

따라서, 본 발명은 하기 단계를 포함하는 단위생식 식물을 생산하는 방법을 제공한다:

(A) 본원에 정의된 바와 같은 돌연변이 유전자를 생산하는 방법에 의해 얻을 수 있는 돌연변이 유전자를 포함하는 식물 세포 또는 원형질체로부터 식물 조직 또는 식물을 재생 및/또는 성장시키는 단계; 및

(B) 선택적으로, 단계 (A)에서 얻은 식물 조직 또는 식물을 스크리닝 및/또는 유전자형 분석을 하는 단계.

따라서, 본 발명은 또한 단위생식 식물을 생산하는 방법을 제공하며, 상기 방법은 하기 단계를 포함한다:

a) 프로모터에 작동 가능하게 연결된 PAR 단백질을 인코딩하는 유전자를 포함하는 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자를 제공하는 단계로서, 여기서 프로모터는 바람직하게는 하나 이상의 전사 인자 MYB 결합 부위를 포함하는, 단계;

b) 하나 이상의 전사 인자 MYB 결합 부위 및/또는 하나 이상의 전사 인자 MYB 결합 부위의 업스트림의 서열 중 적어도 하나를 변형시킴으로써 프로모터를 변형시켜 인코딩된 PAR 단백질의 발현을 증가시키는 단계;

c) 선택적으로, 단계 b)에서 얻은 변형된 식물 원형질체, 식물 세포, 식물 조직 또는 종자로부터 하나 이상의 식물을 성장시키는 단계; 및

d) 선택적으로, 단계 b)에서 얻은 식물 원형질체, 식물 세포, 식물 조직 또는 종자 또는 단계 b) 또는 c)에서 얻은 식물을 스크리닝 및/또는 유전자형 분석하는 단계.

대안적으로 또는 추가로, 본 발명은 하기 단계를 포함하는 단위생식 식물의 생산 방법을 제공한다:

a) 프로모터에, 선택적으로 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에, 작동가능하게 연결된 PAR 단백질을 인코딩하는 유전자를 포함하는 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자를 제공하는 단계;

(b) 인코딩된 PAR 단백질의 발현을 증가시키도록 상기 프로모터를 변형시키는 단계로서, 바람직하게는 하기 중 적어도 하나에 의해 상기 프로모터를 변형시키는 단계:

i) 본원에 정의된 바와 같은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림, 바람직하게는 하나 이상의 전사 인자 MYB 결합 부위의 업스트림 또는 바로 업스트림의 상기 프로모터 서열에 삽입(insert)을 도입하는 단계로서, 상기 삽입은 바람직하게는 인핸서 서열을 도입하거나, 리프레서 서열을 제거하는, 단계;

ii) 본원에 정의된 바와 같은 PAR 단백질을 인코딩하는 서열의 시작 코돈의 업스트림, 바람직하게는 하나 이상의 전사 인자 MYB 결합 부위의 업스트림 또는 바로 업스트림에 상기 프로모터 서열의 치환 및/또는 결실을 도입하는 단계로서, 여기서 치환 및/또는 결실은 바람직하게는 인핸서 서열을 도입하거나 리프레서 서열을 제거하는, 단계; 및

(iii) (i)와 (ii)의 조합.

본 발명의 방법에 의해 생산된 단위생식 식물은 정상적인 감수분열 기능을 갖는 식물, 즉 아포메이오시스를 나타내지 않는, 바람직하게는 디플로스포러스(diplosporous)가 아니고/거나 디플로스포리(diplospory)를 나타내지 않는 식물일 수 있다. 바람직하게는 상기 식물의 배우체는 이의 체세포와 비교하여 감소된 배수성을 가질 수 있다. 2배체 식물(즉, 2배체 체세포를 가짐)의 경우, 상기 감소된 배수성은 단일 반수체일 수 있다. 본 발명의 방법을 통해 식물에 단위생식을 유도하면, 상기 식물의 배우체는 배수성이 감소된 식물, 바람직하게는 반수체 식물에서 발달할 수 있다. 따라서, 본 발명의 방법은 감소된 배수체를 갖는 식물을 생산하는 방법, 바람직하게는 반수체 식물을 생산하는 방법일 수 있다. 이 방법은 바람직하게는 상기 정의된 바와 같은 방법에 의해 얻을 수 있는 단위생식 식물을 제공하는 단계, 및 상기 식물이 수정 없이 종자를 생산하도록 하는 후속 단계를 포함하여, 상기 종자 중 하나 이상이 발아하여 배수성이 감소된 식물, 바람직하게는 반수체 식물로 재생되도록 한다. 상기 방법은 본원에 정의된 단위생식을 유도한 다음, 상기 식물이 수정 없이 종자를 생산하게 하고, 상기 종자 중 하나 이상이 발아하여 배수성이 감소된 식물, 바람직하게는 반수체 식물(반수체 체세포를 가진 식물)로 재생시키는 단계를 포함할 수 있다.

감소된 배수체를 갖는 게놈, 바람직하게는 반수체 게놈은 자발적으로 배가되거나 바람직하게는 화학적 처리에 의해 유도될 수 있다. 바람직한 화학적 처리는 예를 들어 Touchell DH et al, Front Plant Sci. 2020 Jun 3;11:722(본원에 참조로 포함됨)에 기재되어 있다. 화학적 처리는 콜히친, 오리잘린, 트리플루랄린 및 아산화질소 중 적어도 하나를 사용한 처리일 수 있다. 식물의 화학적 처리는 바람직하게는 배가 반수체 게놈을 갖는 식물을 생성한다.

배가 단일 반수체 식물은 모든 유전자좌에서 동형접합성을 달성하고, 바람직하게는 본원에 기재된 방법을 사용하여, 단일 반수체 게놈의 전체 게놈 복제에 의해 수득될 수 있는 식물이다. 이러한 완전 동형접합 식물은 특히 F1 잡종 종자의 생산에서 부모 식물로 사용하기에 상업적으로 중요하다. 따라서, 본 발명은 또한 본원에 정의된 단위생식 식물을 생산하는 단계를 포함하는 배가 단일 반수체 식물을 생산하는 방법을 제공하며, 임의로 게놈 복제를 화학적으로 유도하는 단계, 배가 단일 반수체 종자를 선택하는 단계, 및 임의로 상기 종자를 배가 반수체 식물로 발아하고 재생하도록 하는 단계를 포함한다.

본 발명의 방법은 배가 단일 반수체 식물의 생산에 제한되지 않는다. 본원에 기재된 바와 같은 방법은 이에 한정하는 것은 아니나 배가 이반수체(di-haploid), 배가 삼중 반수체, 배가 4-반수체, 배가 오반수체 및 배가 육반수체 식물과 같은 다른 배가 반수체 식물의 생산에 동등하게 적합하다.

비제한적인 예로서, 배수체 작물(예를 들어, 4배체 솔라넘 터버로섬(Solanum tuberosum))에서, 본 발명의 방법은 이반수체 자손의 생산에 사용될 수 있다. 이러한 이반수체의 이형 접합 정도는 배수체 부모의 것보다 훨씬 낮을 것이다. 따라서, 2배체 수준에서의 선택은 4배체 수준에서보다 훨씬 더 효율적일 것이다. 본 발명의 방법은 완전히 동형접합성인 이들 이반수체로부터 단일 반수체를 생성하기 위해 추가로 사용될 수 있다. 이반수체는 유전자 지도의 구축을 용이하게 하고, 단계적 전체 게놈 서열의 어셈블리를 가능하게 할 수 있다. 야생 2배체 종의 가치 있는 관심 형질은 본 발명의 방법에 의해 생산된 재배종으로부터 이반수체의 사용을 통해 유전자 이입될 수 있다. 유익한 유전자 이입된 형질을 갖는 수득된 이반수체는 예를 들어 본원에 상기 기재된 바와 같은 화학적 처리를 사용함으로써 배가 이반수체가 만들어질 수 있으며, 이에 의해 관심 형질의 4배체 재배종으로의 이입을 가능하게 한다. 당업자는 유사한 방법이 야생 종의 관심 형질이 유전자이입된 2배체, 3배체, 5배체, 6배체, 7배체, 7배체 등 재배종의 생산에 사용될 수 있음을 쉽게 이해한다.

바람직하게는, 단계 a)에서 PAR 단백질을 인코딩하는 유전자는 par 대립유전자이다. 바람직하게는, 유전자의 프로모터는 본원에 정의된 바와 같이 단계 b)에서 변형되어 par 대립유전자를 Par 대립유전자로 전환시킨다. Par 대립유전자가 우성일 수 있으므로, 단일 par 대립유전자를 식물 또는 식물 세포의 Par 대립유전자로 변경하거나, 예를 들어 상기 식물 또는 식물 세포를 상기 돌연변이 유전자를 포함하는 벡터로 형질감염하여 식물 또는 식물 세포에 본 발명의 돌연변이 유전자를 도입하는 것은 식물을 유성 표현형에서 단위생식 표현형으로 전환시키는데 충분할 수 있으며, 즉 수정 없이 난세포로부터 배아를 성장 및 발달시킬 수 있는 식물 및/또는 이의 자손을 생성할 수 있다. 따라서, 바람직하게는 식물 세포에 존재하는 단일 유성 유전자, 바람직하게는 내인성 유전자가 본 발명의 방법에 의해 변형된다. 임의로, 식물 세포에 존재하는 다수의 유전자, 바람직하게는 내인성 유전자가 본 발명의 방법에 의해 변형된다.

변형된 프로모터가 식물 세포 또는 원형질체에 존재하는 경우, 상기 식물 세포 또는 원형질체는 비-단위생식 표현형을 갖는 것으로부터 단위생식 표현형을 갖는 식물로 전환되는 식물의 일부이거나 식물로 재생될 수 있다. 따라서, 본 발명은 또한 par 대립유전자의 프로모터를 변형시켜 단위생식 표현형을 나타내지 않는 식물에 단위생식 표현형을 부여하는 방법을 제공한다. 즉, 본 발명의 방법은 단위생식을 나타내지 않는 식물을 단위생식을 나타내는 식물로 형질전환시키는 방법이다. 바람직하게는, 단계 a)의 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자는 Par 대립유전자가 결여되고 및/또는 단위생식 표현형을 나타내지 않는다. 유사하게, 본 발명의 방법은 제한된 단위생식을 나타내는 식물을 증가된 단위생식을 갖는 식물로 형질전환시키는 방법이다. 단위생식의 증가 또는 유도는 바람직하게는 적어도 200개 중 1개, 100개 중 1개, 100개 중 10개, 100개 중 20개, 100개 중 30개, 100개 중 40개, 100개 중 50개, 100개 중 60개, 100개 중 70개, 100개 중 80개, 100개 중 90개 또는 본 발명의 돌연변이 유전자로 형질전환된 모든 식물이 단위생식을 나타내는 것을 의미하며, 바람직하게는 원래의 비-돌연변이 유전자(즉, 본 발명의 방법의 단계 a)에서 제공된 유전자)로 형질전환된 식물 500개 중 1개 미만, 600개 중 1개 미만, 700개 중 1개 미만, 800개 중 1개 미만, 900개 중 1개 미만 또는 1000개 중 1개 미만에 비교한 것을 의미한다.

바람직하게는, 본 발명의 방법의 단계 a)의 유전자는 네이티브 유전자이다. 임의로, 본 발명의 방법에 의해 변형될 유전자는 타락사컴 오피시날레(Tharaxacum officinale)의 par 대립유전자이거나 또는 본원에 정의된 임의의 이종상동 단위생식 유전자 중 어느 하나이다. 바람직하게는 상기 par 대립유전자는 Par 대립유전자가 결여되어 단위생식 표현형을 갖지 않는 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자에 존재한다. 상기 par 대립유전자를 Par 대립유전자로 부여함으로써, 본 발명의 방법은 바람직하게는 단위생식 표현형을 갖지 않는 식물을 단위생식 표현형을 갖는 식물로 형질전환시킨다.

임의로 다수의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자가 단계 a)에서 제공되고, 단계 b) 후에 본 발명의 변형, 즉, 하나 이상의 MYB 결합 부위의 삽입 또는 결실 및/또는 변형 또는 제거된 하나 이상의 MYB 결합 부위, 바람직하게는 본원에 정의된 바와 같은 유전자형 분석 및/또는 스크리닝에 의해 결정되는, 변형을 포함하는 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자가 선택된다 따라서, 단계 B)에서의 스크리닝은 단위생식 표현형에 대한 스크리닝일 수 있다.

식물 세포(식물 조직, 식물 종자 또는 전체 식물의 일부일 수 있음) 또는 식물 원형질체에서 자연적으로 발생하는 par 대립유전자를 유전적으로 변형하여 상기 par 대립유전자를 Par 대립유전자에 부여하고, 상기 세포 또는 원형질체를 단위생식 식물로 성장 및/또는 발달시키는 것 외에, 단위생식 식물은 식물 또는 식물 세포를 본 발명의 돌연변이 유전자를 포함하는, 즉, 본원에 정의된 PAR 단백질을 인코딩하는 코딩 서열, 선택적으로 3'UTR 서열에 연결된 본원에 정의된 PAR 단백질을 인코딩하는 코딩 서열에 작동 가능하게 연결된 변형된 프로모터를 포함하는, 핵산, 구조물 또는 벡터로 형질전환시켜 얻을 수도 있다.

본 발명의 방법에 의해 수득된 돌연변이 유전자는 형질전환, 유전자이입, 체세포 혼성화 및/또는 원형질체 융합에 의해 하나 이상의 식물 세포에 도입될 수 있다. 그러한 돌연변이 유전자는 외인성 핵산, 즉 상기 식물 세포에서 자연적으로 발생하지 않는 핵산에 위치할 수 있다.

a. 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자를 제공하는 단계;

b. 하나 이상의 식물, 식물 원형질체, 식물 세포, 식물 조직 또는 식물 종자를 본 발명의 돌연변이 유전자를 포함하는 핵산 구조물로 형질전환시키는 단계;

c. 선택적으로, 단계 b)에서 형질전환된 식물 원형질체, 식물 세포, 식물 조직 또는 종자로부터 하나 이상의 식물을 성장시키는 단계; 및

d. 선택적으로, 단계 b)에서 얻은 식물 원형질체, 식물 세포, 식물 조직 또는 종자 또는 단계 b) 또는 c)에서 얻은 식물을 스크리닝 및/또는 유전형 분석하는 단계.

바람직하게는, 단계 a의 하나 이상의 식물은 Par 대립유전자가 없거나 단위생식 표현형을 나타내지 않는다.

추가 견지에서, 본 발명은 상기 정의된 어느 방법에 의해 수득된 식물(예를 들어, 식물 세포, 기관, 종자 및 식물 부분 포함)에 관한 것이다. 바람직하게는, 이들은 단위생식 식물이거나 또는 네이티브 또는 변형되지 않은 식물과 비교하여 증가된 단위생식을 나타낸다. 바람직하게는, 본 발명의 식물은 기술적 수단, 바람직하게는 본원에 기술된 방법에 의해 얻어진다. 이러한 기술적 수단은 당업자에게 잘 알려져 있으며, 예를 들어 무작위 돌연변이유발, 표적 돌연변이유발 및 핵산 삽입 또는 결실 중 적어도 하나와 같은 유전적 변형을 포함한다.

바람직하게는, 본 발명의 식물은 본질적으로 생물학적 프로세스에 의해 얻어지지 않는다. 바람직하게는, 본 발명의 식물은 본질적으로 생물학적 프로세스에 의해서 얻어지는 것이 배제되지 않는다. 바람직하게는, 본 발명의 식물은 식물에 단위생식을 도입하는 어느 본질적으로 생물학적 프로세스에 의해 얻어지지 않으며, 바람직하게는 직접적으로 이에 의해 얻어지지 않는다. 바람직하게는, 본 발명의 식물은 식물에 단위생식을 도입하는 어느 본질적으로 생물학적인 프로세스에 의해서 얻어지는 것이 배제되지 않는다. 바람직하게는, 본 발명의 식물은 자연 발생 식물이 아닌 것으로, 즉 자연에서 발생하는 식물이 아니다.

일 구현에서, 본 발명의 방법의 유전자의 프로모터는 업스트림 전사 조절 영역, 예를 들어 유전자의 번역 시작 코돈 및/또는 전사 시작 부위의 업스트림의 약 2000 bp 내에 있으며, TAIL-PCR (Liu 등, 1995; Liu 등, 2005), Linker-PCR, 또는 인버스 PCR (IPCR)과 같이 공지된 방법을 사용하여 아포믹틱 식물 및/또는 다른 식물로부터 분리될 수 있다. 본원에 정의된 바와 같은 키메라 유전자는 바람직하게는 SEQ ID NO: 1의 아미노산 서열 또는 이의 기능적 변이체 및/또는 단편을 갖는 본원에 교시된 바와 같은 코딩 서열에 프로모터를 연결함으로써 생성될 수 있으며, 이는 임의로 후속적으로 적합한 3' 말단 비번역 영역("3' 말단" 또는 3'UTR)의 업스트림(즉, 5')에 연결된다. 적합한 3' 말단은 CaMV 35S 유전자("3' 35S"), 노팔린 신타제 유전자("3' nos")(Depicker 등, 1982), 옥토파인 신타제 유전자("3'ocs")(Gielen 등, 1984) 및 T-DNA 유전자 7("3' 유전자 7")(Velten and Schell, 1985)의 3' 말단을 포함하며, 이는 형질전환된 식물 세포 등에서 3'-비번역 DNA 서열로 작용한다. 일 구현에서, 네이티브 단위생식 유전자의 3'UTR 또는 그로부터 유래된 3'UTR이 사용된다. 예를 들어, SEQ ID NO: 4로부터 유래된 임의의 3'UTR, 또는 이의 변이체 또는 단편이 사용될 수 있다. 3'UTR은 SEQ ID NO: 4의 뉴클레오티드 서열을 가질 수 있다.

아그로박테리움으로의 T-DNA 벡터의 도입은 전기천공 또는 트리패렌털(triparental) 교배와 같은 공지된 방법을 사용하여 수행될 수 있다.

본원에 교시된 바와 같은 돌연변이 유전자는 선택적으로 예를 들어 카나마이신 저항성을 인코딩하는 neo(또는 nptII) 유전자(EP0242236)와 같은 선택가능하거나 스코어링가능하여 그 핵산을 포함하는 식물이 쉽게 검출될 수 있도록 마커를 인코딩하는 유전자에 인프래임으로 연결된 하이브리드 유전자 서열로서 식물 게놈에 삽입될 수 있다.

임의로, 본 발명의 돌연변이 유전자는 가능한 (추가적인) 전사 인자 결합 부위를 변형시키도록, 바람직하게는 유전자 전사를 억제하는 전사 인자에 대한 결합 부위를 변형시키도록 변경될 수 있다.

일 구현에서, 본원에 교시된 바와 같은 본 발명의 핵산에 의해 인코딩된 PAR 단백질은 단일 숙주에서, 선택적으로 상이한 프로모터의 조절 하에, 단위생식, 아포메이오시스 또는 아포믹시스를 조절, 바람직하게는 향상 또는 유도하는 다른 단백질과 공동-발현된다. 그러한 다른 유전자는 예를 들어, 본원에 참조로 포함된 WO2017/039452 A1에 기재된 디플로스포리(diplospory)와 같은 아포메이오시스를 부여하는 유전자일 수 있다.

다른 구현에서, 본 발명의 돌연변이 유전자는 바람직하게는 다른 관심 유전자, 예를 들어, 아포메이오시스를 부여하는 유전자(예를 들어, 디플로스포리에 대한 유전자)를 포함하는 생식질에 유전자이입된다. 교배 및 선택을 통해 잡종이 생성되며 관심 있는 여러 유전자가 쌓일 수 있다.

임의로, 본 발명의 방법에 의해 돌연변이되거나 형질전환된 식물은 자멸사할 수 있는 식물이다. 바람직하게는 아포메이오시스가 가능한 식물은 본원에 정의된 단위생식에서 기능하는 돌연변이 유전자를 포함하도록 변형된다. 그러한 돌연변이 또는 변형은 이후에 아포믹틱 식물 또는 식물 세포를 야기할 것이다. 이 경우, 본원에서 정의된 단위생식 식물의 생산 방법 중 단계 B)에서의 스크리닝은 아포믹틱 표현형에 대한 것일 수 있다. 아포메이오시스가 가능한 식물 세포는 아포메이오시스를 부여할 수 있는 핵산을 도입함으로써 얻을 수 있다. 임의로 상기 핵산은 본 발명의 돌연변이 유전자의 도입 전, 함께 또는 후에 식물 세포에 도입된다.

본 발명은 또한

(1) 유성 번식 제1 식물을 제2 식물의 꽃가루와 교차 수정시켜 F1 잡종 종자를 생산하는 단계; 및

(2) 선택적으로 상기 F1 종자로부터 아포믹틱 표현형을 포함하는 종자를 선택하는 단계

포함하는 아포믹틱 잡종 종자를 생산하는 방법을 제공하며,

여기서 상기 제1 및/또는 제2 식물은 아포메이오시스가 가능하며, 상기 제2 식물은 본 발명의 방법에 의해 얻어지거나 얻을 수 있는 단위생식 식물이고, 그리고 여기서 바람직하게는 상기 선택은 유전형 분석에 의해 수행된다. 선택적으로, 상기 방법은 아포믹틱 표현형을 포함하는 종자를 선택하는, 바람직하게는 유전자형 분석에 의해, 아포믹틱 표현형을 포함하는 종자를 선택하는 단계, 및 선택적으로 상기 F1 잡종 종자로부터 적어도 하나의 F1 식물을 성장시키는 단계를 추가로 포함한다

바람직하게는, 선택 목적 및 잡초 제어 옵션을 위해, 본 발명의 트랜스제닉 식물은 또한 활성 성분으로서 글루포시네이트 암모늄(예: Liberty® 또는 BASTA; 저항성은 PAT 또는 bar 유전자에 의해 부여됨; EP 0 242 236 및 EP 0 242 246 참조) 또는 글리포세이트(예: RoundUp®; 저항성은 EPSPS 유전자에 의해 부여됨, 예: EP0 508 909 및 EP 0 507 698 참조)를 기반으로 하는 제초제와 같은 광역 제초제와 같은 제초제에 대한 저항성을 부여하는 단백질을 인코딩하는 DNA로 형질전환된다. 제초제 저항성 유전자(또는 원하는 표현형을 부여하는 다른 유전자)를 선택 가능한 마커로 사용하면 항생제 저항성 유전자의 도입을 피할 수 있다는 장점이 있다.

대안적으로 또는 추가로, 항생제 저항성 유전자와 같은 다른 선택가능한 마커 유전자가 사용될 수 있다. 일반적으로 형질전환된 숙주 식물에서 항생제 저항성 유전자를 유지하는 것이 허용되지 않기 때문에, 이러한 유전자는 형질전환체 선택 후 다시 제거할 수 있다. 트랜스진 제거를 위한 다양한 기술이 존재한다. 제거를 달성하기 위한 한 가지 방법은 트랜스진의 측면에 lox 부위를 배치하고, 선택 후 형질전환된 식물을 CRE 재조합효소-발현 식물과 교배시키는 것이다(참조 예: EP506763B1). 부위 특이적 재조합으로 마커 유전자가 절단된다. 또 다른 부위 특이적 재조합 시스템은 EP686191 및 US5527695에 기재된 FLP/FRT 시스템이다. CRE/LOX 및 FLP/FRT와 같은 부위 특이적 재조합 시스템도 유전자 스태킹 목적으로 사용될 수 있다. 또한, 1-성분 절제 시스템이 기재되어 있다(참조 예: WO9737012 또는 WO9500555).

바람직하게는, 본 발명의 돌연변이 유전자는 향상된 단위생식 표현형을 갖는 트랜스제닉 식물 세포, 식물, 식물 종자 등 및 이의 임의의 유도체/자손을 생성하는데 사용된다. 바람직하게는, 본 발명의 트랜스제닉 식물은 변형되지 않은 대조구 식물과 비교하여 향상된 단위생식을 포함한다. 따라서, 예를 들어 향상된 단위생식을 포함하는 트랜스제닉 상추 식물이 제공된다. 따라서, 본 발명의 돌연변이 유전자를 포함하는 식물은 상기 돌연변이 유전자를 포함하지 않는 동일한 식물과 비교하여 단위생식에서 현저한 증가를 나타낸다. 향상된 단위생식 표현형은 단위생식을 유도할 수 있는 본 발명의 돌연변이 유전자에 의해 인코딩되는 단백질의 적당한 양을 적합한 시간 및/또는 위치에서 발현시킴으로써 미세-조정될 수 있다. 이러한 미세 조정은 가장 적절한 프로모터 변형을 결정하고/하거나 원하는 발현 수준을 나타내는 트랜스제닉 "이벤트"를 선택함으로써 수행될 수 있다.

본 발명의 돌연변이 유전자에 의해 인코딩되는 단백질의 원하는 수준을 발현하는 형질전환체, 잡종 또는 근교계는 예를 들어, 카피 수 분석(서던 블롯 분석), mRNA 전사 수준(예: 본 발명의 돌연변이 유전자에 의해 인코딩되는 단백질을 증폭할 수 있는 프라이머 쌍 또는 플랭킹 프라이머를 사용하는 RT-PCR) 또는 다양한 조직에서 단위생식 단백질의 존재 및 수준을 분석함으로써(예: SDS-PAGE, ELISA 분석 등) 선택된다. 단일 카피 형질전환체는 예를 들어 규제상의 이유로 선택될 수 있고, 돌연변이 유전자의 삽입 부위 측면에 있는 서열이 분석되고, 바람직하게는 "이벤트"를 특성화하기 위해 시퀀싱된다. 본 발명의 돌연변이 유전자에 의해 인코딩된 단백질의 높거나 중간 정도의 발현을 초래하는 트랜스제닉 이벤트는 안정한 트랜스진을 갖는 고성능 엘리트 이벤트가 얻어질 때까지 추가 개발을 위해 선택된다.

본 발명의 돌연변이 유전자를 포함하는 형질전환체는 또한 질병 저항성을 부여하거나 다른 생물적 및/또는 비생물적 스트레스에 대한 저항성을 부여하거나 디플로스포리(diplospory)를 부여하는 유전자와 같은 (다른) 트랜스진을 포함할 수 있다. "스태킹된(stacked)" 트랜스진을 갖는 이러한 식물을 얻기 위해, 다른 트랜스진이 상기 형질전환체에 도입될 수 있거나, 상기 형질전환체가 후속적으로 하나 이상의 다른 유전자로 형질전환될 수 있거나, 대안적으로 여러 키메라 유전자를 사용하여 식물 계열 또는 품종을 형질전환시킬 수 있다. 예를 들어, 여러 트랜스진이 단일 벡터에 존재할 수 있거나 공동 형질전환되는 다른 벡터에 존재할 수 있다.

일 구현에서 하기 유전자들이 본 발명의 돌연변이 유전자와 조합된다: 공지된 질병 저항성 유전자, 특히 괴사성 병원균에 대한 향상된 저항성을 부여하는 유전자, 바이러스 저항성 유전자, 곤충 저항성 유전자, 비생물적 스트레스 저항성 유전자(예를 들어, 가뭄 내성, 염 내성, 내열성 또는 내한성 등), 제초제 저항성 유전자 등. 따라서, 스태킹된 형질전환체는 병원체 저항성, 곤충 저항성, 선충 저항성, 염분, 저온 스트레스, 열 스트레스, 물 스트레스 등에 대한 훨씬 더 넓은 생물적 및/또는 비생물적 스트레스 내성을 가질 수 있다.

전체 식물, 식물 부분(예: 종자, 세포, 조직), 식물 산물(예: 과일) 및 본원에 기술된 임의의 식물의 자손이 본원에 포함되며, 예를 들어 전체 게놈 DNA를 주형으로 사용하고 본 발명의 돌연변이 유전자에 특이적인 PCR 프라이머 쌍을 사용하여 PCR 분석에 의해 및/또는 SBG(Sequence Based Genotyping) 또는 KeyGene® SNPSelect 분석(이에 제한되지 않음)과 같은 게놈 변이 분석을 사용하여 돌연변이 유전자의 존재에 의해 확인될 수 있다. 또한 "이벤트 특이적" PCR 진단 방법이 개발될 수 있는데, 여기서 PCR 프라이머는 삽입된 변형 또는 트랜스진 측면에 있는 식물 DNA를 기반으로 한다(US6563026 참조). 유사하게, 이벤트 특이적 AFLP 핑거프린트 또는 RFLP 핑거프린트는 본 발명의 트랜스제닉 또는 돌연변이 식물, 또는 그로부터 유래된 임의의 식물, 종자, 조직 또는 세포를 식별하는 개발될 수 있다.

본 발명에 따른 트랜스제닉 또는 돌연변이 식물은 바람직하지 않은 표현형, 예를 들어 수확량 감소, 질병에 대한 증가된 감수성(특히 괴사균) 또는 바람직하지 않은 구조적 변화(왜소화, 기형) 등을 나타내지 않는 것으로 이해되며, 그러한 표현형이 1차 형질전환체에서 보이면, 이들은 통상적인 방법으로 제거될 수 있다. 본원에 기재된 임의의 트랜스제닉 또는 돌연변이 식물은 돌연변이 유전자에 대해 이형접합, 동형접합 또는 반접합일 수 있다.

본 발명은 또한 본원에 상세히 기재된 방법에 의해 얻어지거나 얻어질 수 있는 식물, 종자, 식물 부분(예, 식물 세포) 및 식물 산물, 바람직하게는 본 발명의 돌연변이 유전자, 본 발명의 핵산 및/또는 발명의 구조물을 포함하는, 본원에 상세히 기재된 방법에 의해 얻어지거나 얻어질 수 있는 식물, 종자, 식물 부분(예, 식물 세포) 및 식물 산물에 관한 것이다. 바람직하게는 상기 돌연변이 유전자, 핵산 및/또는 구조물은 본원에 기재된 바와 같이 단위생식을 유도할 수 있고 및/또는 단위생식에서 기능적이다. 본 발명의 식물은 바람직하게는 적합한 숙주 식물로서 본원에 열거된 종이다. 본 발명의 식물을 얻기 위한 그러한 방법은 무작위 또는 표적 돌연변이유발, 식물로부터 자손으로 본 발명의 돌연변이 유전자의 유전자이입, 및/또는 본 발명의 돌연변이 유전자에 의한 식물 세포의 형질전환, 및 상기 식물 세포로부터 식물의 후속 재생을 포함하지만 이에 제한되지 않는다.

바람직하게는 식물, 식물 부분 및/또는 식물 산물은 본 발명의 돌연변이 유전자를 포함하는 타락사컴 오피시날레 센수 라토(Tharaxacum officinale sensu lato) 종이 아니다. 바람직하게는, 식물, 식물 부분 및/또는 식물 산물은 쌍떡잎식물이다. 상기 식물 또는 식물 세포는 바람직하게는 본원에 적합한 숙주 식물로서 열거된 종, 바람직하게는 십자화과(Brassicaceae), 박과(Cucurbitaceae), 콩과(Fabaceae), 벼과(Gramineae), 가지과(Solanaceae) 및 국화과(Asteraceae)(Compositae)로 이루어진 군으로부터 선택된 과로부터의 것이다.

바람직하게는 본 발명의 돌연변이 유전자를 포함하는 식물, 식물 부분 및/또는 식물 산물은 유전적 변형 또는 유전자 이입에 의해 얻어지며, 바람직하게는 상기 돌연변이 유전자는 그의 게놈에 위치한다. 바람직하게는 상기 식물, 식물 부분 및/또는 식물 산물은 단위생식이 가능하고/하거나 단위생식을 나타낸다. 훨씬 더 바람직하게는 상기 식물, 식물 부분 및/또는 식물 산물은 추가로 아포메이오시스를 일으킬 수 있다. 본 발명은 본 발명의 식물 또는 식물 세포의 종자, 식물 부분 또는 식물 산물을 제공한다.

본 발명은 또한 본 발명의 식물로부터 유래된 식물 부분 및 식물 산물에 관한 것이며, 여기서 식물 부분 및/또는 식물 산물은 본원에 정의된 바와 같은 본 발명의 돌연변이 유전자, 본원에 정의된 바와 같은 본 발명의 핵산 및/또는 본원에 정의된 바와 같은 본 발명의 구조물을 포함하며, 이는 식물 산물의 식물 부분이 유래된 식물에서 그러한 단백질, 돌연변이 유전자, 핵산 또는 구조물의 존재를 평가할 수 있게 하는 본원에 정의된 바와 같은 단편일 수 있다. 그러한 부분 및/또는 산물은 종자 또는 과일 및/또는 그로부터 파생된 산물(예: 당 또는 단백질)일 수 있다. 이러한 부분, 산물 및/또는 그로부터 파생된 산물은 번식되지 않는 재료일 수 있다.

임의의 식물이 적합한 숙주일 수 있지만, 가장 바람직하게는 숙주 식물 종은 향상된 단위생식으로부터 이익을 얻을 수 있는 식물 종이어야 한다. 적합한 숙주는 임의의 식물 종을 포함한다. 특히, 농경학적 특성이 우수한 품종 또는 육종 계열이 바람직하다. 당업자는 본원에 교시된 바와 같은 돌연변이 유전자 및/또는 이의 변이체 또는 단편이 트랜스제닉 식물을 생성하고 단위생식을 평가함으로써 적합한 대조구 식물과 함께 숙주 식물에 필요한 단위생식의 증가 또는 감소를 부여할 수 있는지 여부를 시험하는 방법을 알고 있다.

적합한 숙주 식물은 예를 들어 십자화과(Brassicaceae), 박과(Cucurbitaceae), 콩과(Fabaceae), 벼과(Gramineae), 가지과(Solanaceae), 국화과(Asteraceae)(Compositae), 장미과(Rosaceae) 또는 포아풀과(Poaceae)에 속하는 숙주를 포함한다.

바람직한 구현에서, 숙주 식물은 타락사컴(Taraxacum), 락투카(Lactuca), 피섬(Pisum), 캡시컴(Capsicum), 솔라넘(Solanum), 큐큐미스(Cucumis), 제아(Zea), 고시피움(Gossypium), 글리신(Glycine), 트리티컴(Tryticum), 오리자(Oryza) 및 소르검(Sorghum)으로 구성된 그룹에서 선택되는 식물 종일 수 있다.

바람직한 구현에서, 본원에 교시된 바와 같은 식물, 식물 부분, 식물 세포 또는 종자는 타락사컴(Taraxacum), 락투카(Lactuca), 피섬(Pisum), 캡시컴(Capsicum), 솔라넘(Solanum), 큐큐미스(Cucumis), 제아(Zea), 고시피움(Gossypium), 글리신(Glycine), 트리티컴(Tryticum), 오리자(Oryza), 알리움(Allium), 브라시카(Brassica), 헬리안터스(Helianthus), 베타(Beta), 시코리움(Cichorium), 크리산테멈(Chrysanthemum), 페니세텀(Pennisetum), 세칼레(Secale), 호르데움(Hordeum), 메디카고(Medicago), 파세올러스(Phaseolus), 로사(Rosa), 릴리움(Lilium), 코페아(Coffea), 리넘(Linum), 카나비스(Canabis), 카사바(Cassava), 다우커스(Daucus), 큐르큐르비타(Cucurbita), 시트룰러스(Citrullus) 및 소르검(Sorghum)로 구성되는 그룹으로부터 선택된 종의 것이다.

적합한 숙주 식물은 예를 들어 옥수수(maize)/콘(corn)(Zea 종), 밀(Triticum 종), 보리(예: Hordeum vulgare), 귀리(예: Avena sativa), 수수(Sorghum bicolor), 호밀(Secale graine), 대두(Glycine spp. 예를 들어 G. max), 목화(Gossypium 종, 예를 들어 G. hirsutum, G. barbadense), 브라시카종(예: B. napus, B. juncea, B. oleracea, B. rapa 등), 해바라기(Helianthus annus), 잇꽃, 참마, 카사바, 알팔파(Medicago sativa), 벼(Oryza 종, 예: O. sativa indica 품종 - 그룹 또는 japonica 품종 그룹), 목초, 기장(Pennisetum spp. 예: P. glaucum), 수종(소나무, 포플러, 전나무, 질경이 등), 차, 커피, 오일팜, 코코넛, 채소 종, 예를 들어 완두콩, 애호박, 콩(예: Phaseolus 종), 고추, 오이, 아티초크, 아스파라거스, 가지, 브로콜리, 마늘, 리크, 상추, 양파, 무, 순무, 토마토, 감자, 브뤼셀 콩나물, 당근, 콜리플라워, 치커리, 셀러리, 시금치, 꽃상추, 회향, 비트, 다육질 열매 맺는 식물(포도, 복숭아, 자두류, 딸기, 망고, 사과, 자두, 체리, 살구, 바나나, 블랙베리, 블루베리, 감귤류, 키위, 무화과, 레몬, 라임, 천도 복숭아, 라즈베리, 수박, 오렌지, 자몽 등), 관상용 수종(예: 장미, 페튜니아, 국화, 백합, 거베라 종), 허브(민트, 파슬리, 바질, 백리향 등), 수목(예: 포퓰러스(Populus), 살릭스(Salix), 퀘르커스(Quercus), 유칼립튜스(Eucalyptus)의 종), 섬유종, 예, 아마(Linum usitatissimum) 및 대마(Cannabis sativa)를 포함한다.

본 발명의 방법에 의해 수득되거나 수득가능한 돌연변이 유전자 또는 상기 돌연변이 유전자를 포함하는 본 발명의 핵산은 단위생식을 부여하기 위해, 아포믹시스를 부여하기 위해, 배수성(ploidy)을 증가시키기 위해, 및/또는 이중 반수체를 생산하기 위해 사용될 수 있다. 바람직하게는 상기 용도는 식물 생명공학 및/또는 육종, 즉 식물 또는 식물 세포 내/상에서이다.

단위생식은 아포믹시스의 요소이고, 단위생식 유전자는 아포믹시스를 생성하기 위해, 바람직하게는 본원에 나열된 적용을 위해 이를 사용하기 위해 아포메이오시스(예를 들어, 디플로스포리(diplospory)) 유전자와 조합하여 사용될 수 있다. 이들 유전자는 형질전환, 유전자이입에 의해 또는 내인성의 적합한 유전자의 변형에 의해 유성 작물에 도입되어 이들을 아포메이오틱(또는 디플로스포러스) 유전자로 전환시킬 수 있다. 아포믹시스 유전자의 구조와 기능에 대한 지식은 또한 아포믹시스 유전자가 되는 방식으로 내인성 유성 생식 유전자를 변형하는 데 사용될 수 있다. 선호되는 용도는 유성 생식이 새로운 유전자형을 생성할 때 아포믹시스가 스위치 오프되고, 엘리트 유전자형을 전파하기 위해 아포믹시스가 필요할 때 스위치 온될 수 있도록 유도성 프로모터 하에 아포믹시스 유전자를 가져오는 것이다.

본 발명의 돌연변이 유전자는 아포믹시스의 성분으로 사용될 수 있다. 기능적 배우체 아포믹시스에는 아포메이오시스와 단위생식이 모두 필요하다. 아포메이오시스는 감수 분열에 영향을 미치는 돌연변이의 조합에 의해 달성될 수 있으며(Crismani 등, 2013), 거대포자에서 염색체 비감소의 결과, 즉 감수 분열보다는 유사 분열이 발생한다. 후생유전학적 변화를 통해 배우체의 운명을 가정하는 체세포(Grimanelli, 2012)는 또한 잠재적으로 비감소 배우자(난세포)를 생성할 수 있는 비감소 포자 유사 세포를 생성한다. 또 다른 구현에서, 아포메이오시스는 자연적 아포메이오시스 유전자의 트랜스제닉 또는 비-트랜스제닉 발현에 의해 달성된다. 감소되지 않은 난세포가 형성되는 어떤 수단에 의해서든, 본 발명의 돌연변이 유전자로부터의 적절한 시간적 및 공간적 발현은 난세포가 수정 없이 접합자로서 행동하고 분열하도록 유도할 수 있다.

본 발명의 돌연변이 유전자는 완전히 새로운 방식으로 사용될 수 있다. 예를 들어 아포믹시스에서 도구로서 직접적이지 않게 사용될 수 있다. 예를 들어 아포믹시스에서 단위생식과 아포메이오시스 모두가 단일 식물에서 결합되는 반면, 한 세대에서 아포메이오시스를 사용하고 다음 세대에서 단위생식을 사용하면, 아포메이오시스에 의해 배수성 수준이 올라가고 단위생식에 의해 배수성 수준이 내려감으로써, 작물의 성적 유전자 풀을 2배체와 배수체 수준에서 연결한다. 이것은 배수체 집단이 더 많은 돌연변이를 견딜 수 있어 돌연변이 유도에 더 좋을 수 있기 때문에 매우 유용한다. 배수체 식물은 또한 더 활발할 수 있다. 그러나, 2배체 개체군은 선택에 더 좋고, 2배체 교배는 유전자 지도 작성, BAC 라이브러리 구성 등에 더 좋다. 배수체의 단위생식은 2배체와 교배될 수 있는 반수체를 생성할 수 있다. 2배체의 이배포자는 배수체 자손을 생산하기 위해 배수체로부터의 꽃가루에 의해 수정될 수 있는 감소되지 않은 2n 난세포를 생성한다. 따라서, 다른 육종 세대에서 아포메이오시스와 단위생식의 교대는 2배체와 배수체 유전자 풀을 연결한다.

아포메이오시스가 없는 본 발명의 돌연변이 유전자의 또 다른 용도는 반수체 생산을 위해 그리고 배가 반수체(DH)의 게놈 배가(예: 자발적 게놈 배가, 콜히친, 나트륨 아지드 또는 기타 화학)에 의해 사용될 수 있는 반수체 자손의 생산이다. 배가 반수체는 유성 F1 잡종을 생산하기 위해 부모로 사용될 수 있다. 배가 반수체는 식물을 동형 접합체로 만드는 가장 빠른 방법이다. 배가 반수체로 식물을 동형접합체로 만들 수 있는 반면, 두 번째로 빠른 방법인 자가생식으로 2배체 식물에서 충분히 높은 수준의 동형접합체에 도달하는 데 5-7세대가 걸린다. 배가 반수체를 생산하는 방법에는 여러 가지가 있다. 일부 식물 종에서 반수체는 미세포자 배양에 의해 생성될 수 있다. 다른 방법은 조사된 꽃가루(멜론)를 사용한 수분 또는 특정 수분 매개자 스톡(옥수수, 감자)을 사용한 수분에 의한 반수체 배아의 생산(자성 발생(gynogenesis)이다. 이러한 방법은 비용, 유전형의 완고함(recalcitrance), 노동 강도 등과 같은 한계가 있다. 일부 작물에는 반수체 생산 방법이 없다(예: 토마토). 단위생식 유전자의 우성 대립유전자로 인해 자성 발생의 빈도가 상당히 증가하여, 반수체 생산 비용이 감소할 수 있다.

다음의 비제한적 실시예는 본 발명의 상이한 구현들을 설명한다. 실시예에서 달리 언급하지 않는 한, 모든 재조합 DNA 기술은 Sambrook 등(1989), Sambrook 및 Russell(2001); 및 Ausubel 등(1994)에 기재된 표준 프로토콜에 따라 수행된다. 식물 분자 작업을 위한 표준 재료 및 방법은 BIOS Scientific Publications Ltd(영국) 및 Blackwell Scientific Publications, UK에서 공동 출판된 R.D.D.Croy의 Plant Molecular Biology Labfax(1993)에 설명되어 있다.

표 1. 본원에 사용된 SEQ ID NOs의 개요

실시예

실시예 1

Par 프로모터에 의한 단위생식 유도

타락사컴(Taraxacum) Par 프로모터가 단위생식의 유전적 조절에 역할을 하는지 테스트하기 위해, 단위생식을 유도하기 위해 유성 종의 Par 코딩 서열 상동체와 결합할 수 있는지 여부를 테스트했다. 타락사컴(Taraxacum) Par 프로모터는 상추, 관련 국화과(Asteraceae) 종 및 중요한 채소 작물 식물에서 상동 유전자(Lspar)의 발현을 구동하는 데 사용되었다. 이 구조물은 A68 계열에서 유래된 3x PAR CRISPR 돌연변이와 2배체 식물 FCH72의 꽃가루 사이의 교배에서 유래된 자가 비호환성, 4배체 타락사컴(Taraxacum) CRISPR/Cas9 단위생식 손실(LOP) 돌연변이로 변형되었으며, 생존 가능한 종자를 생산할 수 없다. Par 대립유전자가 우성이므로, 1차 형질전환 식물체(T0)에 대해 시험을 수행하였다. 놀랍게도 Par::Lspar 구조물은 4개의 독립적인 형질전환체에서 종자 형성 및 4배체(우성 디플로스포리 유전자의 존재로 인해) 자손을 유도했다(표 2). 이것은 타락사컴(Taraxacum) Par 프로모터가 단위생식을 유도하기 위해 상추 유전자를 적용할 수 있음을 입증한다. ToPar 코딩 서열에 특이적인 유전적 다형성(성 대립 유전자 par1 및 par2와 비교할 때)은 상추 유전자에서 발견되지 않았으며, 코딩 서열 다형성이 단위생식의 원인이 되는 것으로 배제되었다. Par ATG 시작 사이트에서 업스트림으로 이동하면, MITE 삽입은 민들레의 세 가지 성적 대립 유전자(par1, par2 및 par ^TKS ; 도 2)와 비교할 때 아포믹틱 대립 유전자에 고유한 최초의 유전적 다형성을 나타낸다. ATG의 350 bp 업스트림(MITE가 PAR 대립유전자에서 절제된 경우)에 있는 4개의 타락사컴(Taraxacum) 프로모터 사이에서 13개의 SNP만이 발견되며, 그 중 3개만이 Par-대립유전자 특이적이다. 종합하면 Par 유전자의 민들레 대립유전자 사이의 기능적 차이가 코딩 서열이 아닌 프로모터에 의해 발생한다는 강력한 증거를 제공한다. 이전에 입증된 바와 같이, Par 유전자가 난세포 특이적 Arabidopsis EC1(pEC1::Par) 프로모터 하에서 발현되는 다른 구조는 또한 CRISPR/Cas9 LOP 돌연변이의 컴플리멘테이션으로 이어질 수 있으며, 이는 PAR의 난세포 발현이 단위생식을 유발할 수 있다는 가설(PCT/EP2020/064991의 실시예 2 및 표 3 참조)과 일치한다.

이 실험은 유성 상추 유전자의 발현을 유도하는 타락사컴(Taraxacum) Par 프로모터가 단위생식 상실의 타락사컴(Taraxacum) 식물에서 단위생식 표현형을 구조한다는 것을 증명한다. 즉, 유성 상추 유전자의 발현을 유도하는 타락사컴(Taraxacum) Par 프로모터는 단위생식을 유도할 수 있다.

표 2. 상추 Lspar 유전자와 융합된 ToPar 프로모터를 사용한 티. 오피시날레( T. officinale ) 4x CRISPR/Cas9 PAR 결실 돌연변이의 아포믹시스 컴플리멘테이션.

1차 형질전환체를 온실에서 성장시키고, 종자를 수집하고 최대 3개의 종자-머리(SH; 종자-머리당 30개의 종자)의 발아 시험을 수행하였다. 시험된 모든 자손 식물은 재조합 및 감소가 암컷 감수분열에서 발생하지 않았음을 나타내는 우성 DIP 유전자에 대한 PCR 마커를 함유하였다. 자손의 배수체 수준은 유동 세포측정법(FCM)으로 측정되었다. 단위생식에 의해 생산된 묘목(seedling)은 4배체이며; 6배체(6x) 묘목은 자가 수정(감소된 2배체 꽃가루 알갱이로 수정된 4배체 디플로스포러스 난세포)의 결과이다. 8개 계열 중 4개가 단위생식 4배체 자손을 생산했다. 티. 오피시날레(T. officinale)는 자체 비호환성이지만, SI 시스템이 누출될 수 있는 것으로 알려져 있다(Morita 등, 1990; 및 Tas와 Van Dijk, 1999). 때때로 6배체 자손이 35S::GUS 구조물로 형질전환된 대조구 식물에서 관찰되었으며, 이는 자가 수정이 이 유전적 배경에서 (드물게) 발생할 수 있음을 나타낸다. 이것은 논-컴플리멘팅 계열 옐로우 12b의 단일 6배체 자손을 설명할 수 있다.

표 3. 아라비돕시스 EC1.1 프로모터 하에서 ToPAR 유전자에 의한 티. 오피시날레( T. officinale ) 4x CRISPR/Cas9 PAR 결실 돌연변이의 아포믹시스 컴플리멘테이션. 설명은 표 2를 참조바람.

컴플리멘테이션 구조물로 형질전환된 식물 중 하나의 식물은 자생으로 인해 4개의 6x 묘목을 생산했다.

실시예 2

식물 재료

본 실험을 위해 야생형 상추: 아이스버그 타입, 레가시, 타키(일본)(Iceberg type, Legacy, Takii Japan) 및 레드 로메인 타입, 베이커 크릭 헤어룸 종자(Red Romaine type, Baker Creek Heirloom Seeds)를 사용하였다.

DNA 구조물

바이너리 벡터는 다음의 연속적인 요소로 구성된 SEQ ID NO: 34로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축된다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 16)는 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33)의 발현을 유도하며, 그 다음 타락사컴 오피시날렌(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기)가 후속되며, 그 다음 35S 종결자 및 네오마이신 포스포트랜스퍼라제 선택을 위한 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 포함하는 트랜스제닉 계열은 코드 pKG20001로 번호가 매겨진다.

두 번째 바이너리 벡터는 다음 연속 요소들로 구성된 SEQ ID NO: 35로 표시되는 구성을 포함하는 T-DNA 영역으로 구축된다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33) 발현을 구동하는 서열 AACCGCCA 및 AACCGTC(SEQ ID NO: 17)를 갖는 두 개의 MYB 결합 부위를 제거하기 위해 수정된 락투카 사티바의 LSAT_8X112340 프로모터, 그 다음 타락사컴 오피시날렌(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개의 염기(SEQ ID NO: 4의 처음 1000개의 염기)가 후속되며, 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 포함하는 트랜스제닉 계열은 코드 pKG20002로 번호가 매겨진다.

세 번째 바이너리 벡터는 다음 연속 요소로 구성된 SEQ ID NO: 36으로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축된다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33) 발현을 구동하는 타락사컴 오피시날렌(Taraxacum officinale) MITE 프로모터 요소의 Par 대립 유전자가 삽입된 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 18), 그 다음 타락사컴 오피시날렌(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 포함하는 트랜스제닉 계열은 코드 pKG20003으로 번호가 매겨진다.

네 번째 바이너리 벡터는 다음 연속 요소로 구성된 SEQ ID NO: 61로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축된다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33) 발현을 구동하는 2개의 MYB 결합 부위의 업스트림의 결실을 갖는 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 20), 그 다음 타락사컴 오피시날렌(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 포함하는 트랜스제닉 계열은 코드 pKG20003으로 번호가 매겨진다.

식물 형질전환 방법

아그로박테리움 형질전환은 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens)를 이용한 상추의 유전자형 독립적 형질전환에 의해 수행된다. 이러한 방법은 당업계에 잘 알려져 있으며, 예를 들어 Curtis 등(1994)에 교시되어 있다. 예를 들어, Michelmore 등(1987) 또는 Chupeau 등(1989)에 기재된 바와 같이, 상추의 유전적 형질전환에 적합한 어느 다른 방법을 사용하여 원하는 T-DNA를 보유하는 식물을 생산할 수 있다.

결과

상기 "DNA 구조물" 섹션에서 기술된 바와 같이 트랜스진의 존재에 대해 양성으로 시험된 식물은 단위생식의 발생에 대해 평가된다. 형질이 우성이므로 1차 형질전환된 식물(T0)에 대해 시험을 수행한다. 교배 또는 자가 수정이 없으면, 단위생식 난세포가 배아로 발달한다. 트랜스진을 보유하는 식물의 어떠한 수정을 방지하기 위해, 식물을 온실에서 재배하고 현미경 관찰 전에 모든 꽃을 수동으로 거세한다. 거세(Emasculation)는 화관이 자라기 전에 총포를 잘라서 수행된다. 비아포믹틱 식물에서 클리어링된 배주의 DIC(Nomarski Differential Interference Microscopy)에 의해 단위생식이 현미경으로 검출된다. 여기서는 클로랄 수화물(chloral hydrate)을 이용한 클리어링 방법을 적용하며; 이 방법은 현미경 이미징을 위해 식물의 배주를 제거하는 데 일반적으로 사용되는 방법이다(참조 예: Franks RG, 2016 참조). 거세 후 75시간에 꽃봉오리를 수확하고 배주를 클로랄 수화물로 제거한다. pKG20002 및 pKG20003의 트랜스제닉 계열에서 이러한 제거된 배주에서 다중 배아가 관찰될 수 있다. 배낭의 풀에 대한 유동 세포 계측법은 이러한 배아가 반수체임을 보여줄 수 있다. 형질전환되지 않은 대조구 식물과 pKG20001의 평가된 트랜스제닉 계열에서 동일한 방식으로 거세되고 영상화되었으며, 배아는 전혀 관찰되지 않았다.

이들 결과는 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자로부터 MITE 프로모터 요소를 삽입하거나 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터로부터 MYB 결합 부위를 제거하는 것이 LSAT_8X112340 유전자가 상추에서 반수체 배아 형성을 유도할 수 있도록 발현을 변형시키기에 충분하다는 것을 입증한다.

실시예 3

식물 재료

본 실험에서는 야생형 상추: 레드 로메인 타입, 베이커 크릭 헤어룸 종자(Red Romaine type, Baker Creek Heirloom Seeds)를 사용하였다.

DNA 구조물

다음 연속 요소로 구성된 SEQ ID NO: 63으로 표시되는 구조물을 포함하는 T-DNA 영역으로 바이너리 벡터를 구축했다: 타락사컴 오피시날레(Taraxacum officinale)의 Par CDS 서열(SEQ ID NO: 3)의 발현을 유도하는 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 16), 그 다음 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 보유하는 트랜스제닉 계열은 코드 pKG20004로 번호가 매겨진다.

두 번째 바이너리 벡터는 다음 연속 요소로 구성된 SEQ ID NO: 64로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축되었다: 타락사컴 오피시날레(Taraxacum officinale)의 Par CDS 서열(SEQ ID NO: 3)의 발현을 유도하는 타락사컴 오피시날레(Taraxacum officinale) MITE 프로모터 요소의 Par 대립 유전자가 삽입된 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 프로모터(SEQ ID NO: 18), 그 다음 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 보유하는 트랜스제닉 계열은 코드 pKG20006으로 번호가 매겨진다.

세 번째 벡터는 다음 연속 요소로 구성된 SEQ ID NO: 65로 표시되는 구조물을 포함하는 T-DNA 영역으로 구축되었다: 락투카 사티바(Lactuca sativa)의 LSAT_8X112340 CDS 서열(SEQ ID NO: 33)의 발현을 구동하는 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자 프로모터(SEQ ID NO: 2), 그 다음 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자의 3'UTR의 처음 1000개 염기(SEQ ID NO: 4의 처음 1000개 염기), 그 다음 35S 종결자 및 선택을 위한 네오마이신 포스포트랜스퍼라제 유전자(nptII)가 후속된다. 이러한 바이너리 벡터를 생성하는 데 적합한 기술은 Gateway®, Golden Gate 또는 Gibson Assembly®이다(예를 들어 Ma 등, 2015 참조). 이 T-DNA를 보유하는 트랜스제닉 계열은 코드 pKG20008로 번호가 매겨진다.

식물 형질전환 방법

결과

상기 "DNA 구조물" 섹션에서 기술된 바와 같이 트랜스진의 존재에 대해 양성으로 시험된 식물들을 단위생식의 발생에 대해 평가하였다. 형질이 우성이므로 1차 형질전환 식물(T0)에 대해 시험을 수행하였다. 교배 또는 자가 수정의 부재 하에 단위생식 난세포가 배아로 발달한다. 트랜스진을 보유하는 식물의 어떠한 수정을 방지하기 위해 식물을 온실에서 재배하고, 현미경 관찰 전에 모든 꽃을 손으로 거세했다. 화관이 자라기 전에 총포를 잘라내어 거세술을 수행했다. 비아포믹틱 식물에서 클리어링된 배주의 DIC(Nomarski Differential Interference Microscopy)에 의해 단위생식이 현미경으로 검출된다. 여기서는 클로랄 수화물을 이용한 클리어링 방법을 적용하며; 이 방법은 현미경 이미징을 위해 식물의 배주를 제거하는 데 일반적으로 사용되는 방법이다(참조 예: Franks RG, 2016 참조). 거세 후 75시간에 꽃봉오리를 수확하고 배주를 클로랄 수화물로 제거한다. pKG20005, pKG20006, pKG20007 및 pKG20008의 트랜스제닉 계열에서 이러한 제거된 배주에서 다중 배아가 관찰되었다(표 3 참조). 배낭의 풀에 대한 유동 세포 계측법은 이러한 배아가 반수체임을 보여준다. 표준 GUS 구조물 형질전환 대조구 식물 및 pKG20004의 평가된 트랜스제닉 계열에서 동일한 방식으로 거세되고 영상화되었으며, 배아는 전혀 관찰되지 않았다.

이러한 결과는 타락사컴 오피시날레(Taraxacum officinale)의 Par 대립 유전자로부터의 MITE 프로모터 요소가 LSAT_8X112340 유전자가 상추에서 반수체 배아 형성을 유도할 수 있도록 발현을 변형시키기에 충분하다는 것을 입증했다. 이것은 교배 또는 자가 수정의 부재에서 난세포가 배아로 발달했으므로 상추 LSAT_8X112340 유전자의 프로모터 변형에 의해 상추에서 단위생식을 유도하는 명확한 실시예이다.

표 3: 상추 트랜스제닉 계열의 거세 후 75시간에 꽃봉오리에서 배아 관찰. "유" 표시는 모든 버드(bud)에 적어도 하나의 배아가 있음을 의미한다.

참고문헌

- An et al. (1996) Plant J. 10, 107

- Asker, S. (1979) Progress in apomixis research. Hereditas 91(2): 231-240.

- Asker, S.E. and Jerling, L. (1990) Apomixis in Plants. CRC Press, Boca Raton.

- Ausubel et al. (1994) Current Protocols in Molecular Biology, Volumes 1 and 2, Current Protocols, USA

- Barrell and Grossniklaus (2005) Confocal microscopy of whole ovules for analysis of reproductive development: the elongate1 mutant affects meiosis II. Plant Journal 34: 309 - 320.

- Bicknell and Koltunow 2004 Understanding apomixis: recent advances and remaining conundrums. The Plant Cell 16: S228-S245.

- Borevitz, J.O., Liang, D., Plouffe, D., Chang, H.-S., Zhu, T., Weigel, D., Berry, C.C., Winzeler, E. and Chory, J. (2003) Large-scale identification of single-feature polymorphisms in Arabidopsis. Genome Res. 13: 513-523.

- Bortesi, L. and Fischer, R. (2015) The CRISPR/Cas9 system for plant genome editing and beyond. Biotechnology Advanced 33(1): 41-52.

- Borg et al. (2011) The R2R3 MYB Transcription Factor DUO1 Activates a Male Germline-Specific Regulon Essential for Sperm Cell Differentiation in Arabidopsis. The Plant Cell 23 (2): 534-549

- Chupeau et al. (1989) Transgenic plants of lettuce (Lactuca sativa) obtained through electroporation of protoplasts. Bio/Technology 7, 503-508.

- Crismani W. et al. (2013) J. Exp. Bot. 64:55-65.

- Curtis IS et al. (1994) J. Exp. Bot. 45.10: 1441-1449.

- Daniell, H. (2002) Molecular strategies for gene containment in transgenic crops. Nature biotechnology 20: 581-586.

- Depicker A. and Van Montagu M. (1997) Post-transcriptional gene silencing in plants. Current Opinion in Cell Biology 9: 373-382.

- Depicker et al. (1982) J. Mol. Appl. Genetics 1, 561-573.

- Englbrecht et al. (2004) BMC Genomics, 5 (1): 39

- Franks RG (2016) Methods Mol Biol. 2016;1457:1-7

- Gielen et al. (1984) EMBO J 3, 835-845.

- Guo et al, Scientific reports. 2017 Jun 1;7(1):2634.

- Gould et al. (1991) Plant Physiol. 95,426-434.

- Grimanelli D.(2012) Curr. Opin. Plant Biol. 15:57-62.

- Hashimshony, T., Senderovich, N., Avital, G. et al. CEL-Seq2: sensitive highly-multiplexed single-cell RNA-Seq. Genome Biol 17, 77 (2016).

- Hashimshony T, Wagner F, Sher N, Yanai I. CEL-Seq: single-cell RNA-Seq by multiplexed linear amplification. Cell Rep. 2012;2(3):666-673.

- Henikoff and Henikoff (1992) PNAS 89, 915-919.

- Hermsen, J. G. Th. (1980) Breeding for apomixis in potato: Pursuing a utopian scheme. Euphytica 29:595-607.

- Holmes, M (2018) Historical Studies in the Natural Sciences, 48 (1).pp. 1-23.ISSN 1939-1811

- Hull and Howell (1987) Virology 86,482-493.

- Kagale et al., (2010) Plant Physiology, 152: 1009-1134.

- Liu et al. (1995) Genomics 25(3):674-81.

- Liu et al. (2005) Methods Mol. Biol. 286:341-8.

- Lutz KA et al. (2004) Plant J. 37(6):906-13.

- Ma, Xingliang, et al. "A robust CRISPR/Cas9 system for convenient, high-efficiency multiplex genome editing in monocot and dicot plants." Molecular plant 8.8 (2015): 1274-1284.

- McPherson at al. (2000) PCR-Basics: From Background to Bench, First Edition, Springer Verlag, Germany.

- Michelmore, R.W., Marsh, E., Seely, S. and Landry, B. (1987) Transformation of lettuce (Lactuca sativa) mediated by Agrobacterium tumefaciens. Plant Cell Rep. 6: 439-442.

- Michelmore, R.W., Paran, I. and Kesseli, R.V. (1991) Identification of markers linked to disease resistance genes by bulked segregant analysis: a rapid method to detect markers in specific genomic regions using segregating populations. Proc. Natl. Acad. Sci. 88:9828-9832.

- Morgan, R., Ozias-Akins, P., and Hanna, W.W. (1998) Seed set in an apomictic BC3 pearl millet. Int. J. Plant Sci. 159, 89-97.

- Morita, T. Menken, S.G.J. and Sterk, A.A. (1990) Hybridization between European and Asian dandelions (Taraxacum section Ruderalia and section Mongolica): 1. Crossability and breakdown of self-incompatibility. New Phytol. 114, 519-529.

- Ozias-Akins, P. and P.J. van Dijk. (2007) Mendelian genetics of apomixis in plants. Annu. Rev. Genet. 41:509-537.

- Park et al. (1997) J.Biol. Chem. 272, 6876-6881.

- Plant Molecular Biology Labfax (1993) by R.D.D. Croy, jointly published by BIOS Scientific Publications Ltd (UK) and Blackwell Scientific Publications, UK.

- Sambrook and Russell (2001) Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Laboratory Press, NY.

- Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press.

- Savidan Y. (2001) Transfer of apomixis through wide crosses. In: Savidan Y, Carman J, Dresselhaus T, editors. The flowering of apomixis: From mechanisms to genetic engineering. Mexico: CIMMYT, IRD; pp. 153-167.

- Sidorov VA et al. (1999) Plant J.19: 209-216.

- Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7.

- Tas I.C.Q. and Van Dijk, P.J. (1999) Heredity (Edinb). 83, 707-714

- Vaeck et al. (1987) Nature 328, 33-37.

- Van Baarlen, De Jong, J.H., and Van Dijk, P.J. (2002) Comparative cyto-embryological investigations of sexual and apomictic dandelions (Taraxacum) and their apomictic hybrids. Sex Plant Reprod 15: 31-38.

- Van Dijk, P.J., Rigola, D. and Schauer, S.E. "Plant breeding: surprisingly, less sex is better." Current Biology 26.3 (2016): R122-R124.

- Velten and Schell (1985) Nucleic Acids Research 13, 6981-6998.

- Vielle-Calzada, J-Ph., B.L. Burson, E.C Bashaw, and M. A. Hussey 1995. Early fertilization events in the sexual an aposporous egg apparatus of Pennisetum ciliare (L.) Link, The Plant Journal 8(2):309-316.

- Yang, J. et al. (2018) PlantEAR: Functional Analysis Platform for Plant EAR Motif-Containing Proteins. Front. Genet. 9.

SEQUENCE LISTING <110> Keygene N.V. <120> Modified Promoter of a Parthenogenesis Gene <130> P6097374pct <150> EP 20201578.0 <151> 2020-10-13 <160> 65 <170> PatentIn version 3.5 <210> 1 <211> 170 <212> PRT <213> Taraxacum officinale <400> 1 Met Ala Asp Asn Gly Asn Thr Gly Arg Gln Lys Asp Asp Asp Gly Gly 1 5 10 15 His Asp Gly Pro Arg Gln Asn Pro Thr Thr Pro Pro Ser Pro Ser Arg 20 25 30 Thr Pro Arg Arg Pro Arg Arg Asn Thr Ser Pro Pro Lys His Ser Pro 35 40 45 Gly Ala Ser Ser Ser Thr Met Pro Ala Pro Pro Thr Pro Pro Ala Pro 50 55 60 Thr Gly Ile Thr Gly Ala Ser Ser Ser Ser Val Gly Thr Asn Ile Ile 65 70 75 80 Ser Phe Ile Pro Pro Lys Thr Lys Arg Thr Lys Ser Val Ile Cys Pro 85 90 95 Ile Cys Asn Lys Asp Met Cys His Glu Lys Ala Leu Cys Gly His Ile 100 105 110 Arg Trp His Thr Gln Glu Glu Arg Leu Ala Ala Ser Ile Ala Ile Ala 115 120 125 Arg Ala Leu Ser Ser Asn Val Val Val Ser Gly Asn Gly Asp Glu Asp 130 135 140 Glu Gly Pro Ser Lys Lys Tyr Lys Leu Pro Asp Leu Asn Lys Ser Pro 145 150 155 160 Pro Pro Glu Glu Glu Asp Glu Asp Ala Ala 165 170 <210> 2 <211> 1900 <212> DNA <213> Taraxacum officinale <400> 2 taaggccata acaaggttat ttgaacattc gcctaaaccc taaaccaact atatctattc 60 ggatttgtta cgagttttag agtttctaga aaatcagtta tatatcgatt aggcttggtt 120 ctaggttata agaaaaaatg attctctatc cggtatgaca tagagacaaa ccggtctact 180 tttataagaa aatcatattt gaaacaatgt ctagttaata attaattaat atgtgcatgt 240 ttaaatttag aatatcctga atttatattt agtgcgcaac cctatgtaag atcgaactaa 300 ttttaaaccg taaccagaca tgcatgtttg atcagtaata aaaaggctat tatcgtcgaa 360 aatattaaaa caaaatataa tatcttattt ggcgccattt catgtcaacg gttgaaagca 420 agttaccaac gcctccaacc gatcatttct ccggtaacaa ccaactgcta ccagggccgg 480 ccagaaggct gtgcggcttg ggctgtggca caggggcagc agatttagtc catttattat 540 ggtctgctat ttatttgggt ccaataagat cagggcacta aaactcaaat acatcaattc 600 aagtcggcgg caaaagaata aaaagcgcca atttttagaa gacaaggaga cagcacaata 660 atcatgcttt tccaatggcc aattaatttt agcctttgtg aggtataaat atgaatcact 720 ttttctccaa atatcattat tgtaaactag taaagagcgt aaattgtttt atcgctaatc 780 ttcttctttt tcaaatataa ttgtttgatt ctttgtagta ggtacgttaa gttttatatc 840 attcgtcctg gaaacctttt cttatgcccc ttcaatttat gaatttgtgt tttgtattgt 900 cttgctatta atccaatgca aactaattct gccgcatcga tctcacagag ttggagcagc 960 ttaaaaggag ttttggggca acttaaaatg agggtagctt ttttgttgtt gttggtctac 1020 tatttacttt ggtccttatc gttttagttt tgtgttcatt gaggatttga atgactttga 1080 acacaagttt ataaaactaa gtttttgtga ttctaaattt ttgatgtgtg caaccgacta 1140 aatgaatata aaattctgat ttgtgtattt ctgatttctg atttaccggt tattcattat 1200 gtttttctgg atctcatatg aatttagtat ataaaaatct caggttcttc ttactcagtc 1260 tagtatattt tggcattggg gatcagggtt aaaatcatca tttttctaag cactaacaag 1320 ctttaaaacc atcaattaaa agttagttct ccatacctgg aattgtttat tgctttagta 1380 ttcatttcat agtgtcaata ccttacaact gtttattgtt ttcaaatgtt tactgttttg 1440 cactttagtt gtttttagca tgtttcaact ttcaaagtta attgacgata gtgtcatata 1500 cgaaatatca tcactcatac aaaattaaac tggatagaat tttttccgat gaaatctatt 1560 tttaaatagt tacgaatata ataggagact taatatgttt gtttcaaaat tacacaaaaa 1620 caccatggaa atgggcatta gtttgtataa gcatcctttt aaatataaag ctttgttaca 1680 ttgatgcctt ctaaatatat aatattgtaa tgatttgtag taaacaccat ggaaatgggc 1740 attattaaga tgtttcgccc agggcatgaa aaactatcgg accggccctg actgctacta 1800 ataaccgcca ccgcaaaaac ctataaatac aacttccatc acaattctgt cccctactcc 1860 catttcaatc caaaaaaagg ctacacagac atatacagcg 1900 <210> 3 <211> 513 <212> DNA <213> Taraxacum officinale <400> 3 atggcagata atggcaacac cggccgtcaa aaggatgacg acggtggcca tgatggacca 60 cgccaaaacc caactactcc accctcccct tcccgcaccc ctcgaagacc aaggcggaac 120 acatcaccgc ccaaacattc tccgggggcg tcttcaagca ccatgccagc gccgcctact 180 ccccctgcgc cgacgggaat caccggtgct tctagttctt ctgtgggtac taatataatt 240 tcatttattc cacccaaaac caaaagaacg aagtcggtga tctgcccgat ctgcaacaaa 300 gatatgtgcc atgagaaggc gctgtgtggc cacatccggt ggcatacaca ggaggaaaga 360 ttggcggcca gcatcgctat agcaagagcg ctatcttcta acgttgttgt ttctggcaat 420 ggcgatgaag atgaaggtcc atctaaaaag tataaactcc cggacctgaa caaatctcca 480 ccgccggagg aggaggacga ggacgctgcc tga 513 <210> 4 <211> 5356 <212> DNA <213> Taraxacum officinale <400> 4 ttttcttgcg ggagaggcat gcatgtatgt gtggcctttt tgcaataata ctatgcatgg 60 gagatgcata aagtttatct ttattttttt tagtttaata atgtgtggca aactttatat 120 catttatgat ttcggccatg tactgctaca tcgttctagg atggttattc cctagaattt 180 gctttatgta tttgttttct ttgttaattc ttctcttcct taaacgttat ttcatgtgaa 240 ttgcgatgtc atgatattgc aggaatgtaa cttagaactc aacgataaaa agtgtgttga 300 gatcgtggaa gttgatcatt tatcttgaat tcataagata agcaacatga gataggataa 360 ttaattactg tggggatttc tttttatatt catattattc gttgtaatgc aaatttttaa 420 gtagaataac gaatgtgtct tattatttac ggttaaatgc aaaagatcat taacatatct 480 ccattgattt gtttactgat gtattctcat gtgttctgtt gctaaattct attttgaaaa 540 gtatattcaa ttaaagcaat gcattttaga tataaagcaa ctccataact tataattgtg 600 tagattttta ccaattcaat gtcttaaaag aaaaataaaa attgaaagtt taattaattg 660 ccatagtgat cccgttcccg tcaattatgt gatcaatttt taccagagca aaaccccaca 720 tttcttgtag tgaacaatct gtggatgata accgatcgaa gacttttgtg gggatttcac 780 taaccaacta tttggctctc attaattact attagttata taaggccatc ccaagtattt 840 tggcaatatt caaaacgagt aaactataaa attacacttt tggttcttgt atttctaact 900 tttagaatta tgtatttggt tcttatagtt ttttatttgt atgaattaca ttacttttgg 960 tccacaatat tttttatttt ctataattcc atttttagtc attgtagttt taatttgcaa 1020 taaaaaatta atttatattt ttaatccata tatatagttg gcaatattct atattttagg 1080 ttcagattgt atcttttata aaaaagagtc ttaaaagact aaaccttttg gatccttata 1140 gttttcacaa tcacttgtga tttttttaat gaacatatca tatttcttaa attacatcag 1200 taatctacgt ataacattta atataatttt atttaatcag aaatatagga ttcgtataat 1260 aactttgctg aacttaggct tcatttttaa caaaggataa tgcatcatgc atgacataaa 1320 aatttgtaat atttctaatg tgcatgcact acaagaacct gacccttcat atacattaat 1380 gaatgattct cttttcttat ttaatcttag caagcggttt ggataattgt ctgcacaata 1440 ttaagaattg cactagctag ctaggggagt ccatgacgta ataagcaaat taactagagg 1500 acttgtagga ggcttgatca cttcattgta tatctaatgg cactatcgat atatgattgg 1560 cttgtgtgta tctatggaat ttaacactat taaaaaatat atctttaatg acaatcaaca 1620 acacacagta atttatgact tacaaaatca tgtgtgatta aaaaaaatgt catgtttttt 1680 aaaattatag aggatttacg acttacataa ttatgtgtca taattatatg tcatcttgtg 1740 taatatttat gacttacaaa aatgtatgtc atgttttatc atcataaaat ctataaaaaa 1800 aaatagaaac acgaggatac tttcagtgta tgttatctgt aaaaaaaaat aaaaactcgg 1860 aggacactaa aagtgtagaa acttgacagc ataaacgaat ttatttacct tcatcaaaac 1920 ttattttact tcaatctctg aaccagctcc cttcattaat ctcttcgaga tgtaggttga 1980 ttttaatgct aaatgaactt ttcaaatgta taaataaaac ttttctgtgc cagatttgac 2040 attgatggag atgaagatac acaagtgaat tcacctttca atgatcatac tgacatacca 2100 agtactccta tcccctctcc acctccacaa aacgaacctc aatttcaaaa acgtaactat 2160 catttaaata tttaatcatt tttcaattgg attcatgcgg taatagaagt tactggactt 2220 taaacttttt gtagctgatg agattcatga gcaacagtcc atggacattt tccaaatcaa 2280 caagtttctg atgaggacaa cgtaaaaaaa gtttttcaat tattaaacat atgattttgg 2340 tttttaaaag ataattaatt atggaaaatc ttcagaaaag tctcaatact ttgggtttat 2400 taatgaaaaa gtctcaaaaa aaaatttgaa taaaaaagtc cataaaattg gataaattat 2460 tcgatttagc ccaatttgcc aagtaaatct ggtaaaatta ggctaaatcg aataatttag 2520 ccagtttggt gggccttttt gcgcaaaaac attattttgg gacttaatcg ttaattttcc 2580 ccaaatttca gtttatttac agtcttggag taaaaccgaa cctagtgcgc taattttggc 2640 ttttggtgtt tggaattatt tgggtttatt gggctcggtt tctgaacgag tttgattttt 2700 ggtttcttga ttcaattttt tggttttggg gttgaaccca tggattttcg atttggtttc 2760 ggctttgata atatttttgt gcaatcgttc aaaatatccg agttagattg ggtttaaatg 2820 ttatcaaaac cgaaaccgag ggtagaaccc caaaactgaa cccaatcgaa aatccatagg 2880 ttgaacccca gaaccgaacc caataaactc taaaaaccaa aagccaaaat taaccgataa 2940 aaaacttaaa atacatgttt gttaaatcta gtaaggtgtt tttgacactt tatgtaaatt 3000 atagaaaaaa atggattaac tgtttgctta ttaagataaa aacgacgtaa aaatagaatt 3060 ggattagaaa tgaaccattt ttttacatcg tttactttat ttactaggtt ataacccgtg 3120 tattacacgg gttgacgata aaaaattgta taaaaaaaca acatataatg gtaagtttgt 3180 aatcgtacat gggttgcttc aattttaatt taaaaattgt aattccaaat gaaatatatg 3240 taggatgata taacatactt gtaaatgtaa atgagagttt gttggcattt catacattta 3300 gcccatcaaa tcaaacgcaa aaaatctttt taatcctata atacatgtgg cacaaatata 3360 cgattagcat ttcgctgaga gagaggcttt aagtgaggat gtgaaaaaga aggaacatag 3420 caacttggaa tttaaagatc aaaaaacctt gaaaggcttt tggaatgtaa aaatatagaa 3480 atgaataaat gtggcttctt gtatgtatca agagtaggac ctgtattaga aacataaaaa 3540 atttgtgtct aataaaaatc aacaaaaaca gaacgtaaac gaaagaagtt attggtaaaa 3600 aaagatttca aaaatagttt ttttttgaac cggttcaaaa atagttattt tacttattta 3660 tccatttaat ccaaactttt ttttgtcaaa tatctcatgg aattagttgg ctgcgtcact 3720 cttgtcactg ggcgttataa cttttgcctt gtggtttgca acaccacctt aaataacata 3780 gacaaataac attaaatatc atgataatac ataataactc acaaaagatg cattctatag 3840 aacggtataa ttgattagaa caaaataatc taaatagttt atgaggatta ccttgataat 3900 tcccttggag tgaatactat ccacgatgtc atcttccaaa ggtattcaat ggcttttatt 3960 agaacccaat ttcagaatta cattgatgcc acagttacat tcactaaata tcttcctctt 4020 aggcttttag tttgactata ttttaaccat tttcacatca cactttaacc accccctttg 4080 gttattaatg tcaaaaggaa caaaactcac aaatcaaatg cgtggtgttt atactattgg 4140 tacaatgttt ataaatttct taaaaatgag cacaatttca aaaaacttaa acaaatgtca 4200 atggtcacca tgtggtatta atattataaa gttctaaaaa taccattcca ccccaacatg 4260 gtactaacca gttagaaaat caagaaacag aaacatactc tttaatctaa aacaatataa 4320 tatagggatg tgttatgagt ttagtttcat ctaaccatga attcatatag gattgtacgt 4380 ttctcctcga aattgcaaag aattttgttc gactaagcaa tctacatatt aatggatttg 4440 tatggtttct cggtttgtag gtaagttaag agctaccagg aaagagaaaa tttgcaccat 4500 aggtactaaa cacattctac aatggtggct ttaacgtgag agagaataga gaggtcgaaa 4560 catatttccg ttaaataagc aaacataagt ttctatttgg gatcaataag tttcttccta 4620 tagtggtaaa tggatctgta cttgttaagc tcttaaacat atttgttgtc actgttcact 4680 tcctattttg cagtgctctt ctattactta cattcttctt atgacattct tttaataagg 4740 aaaaataacc acttattcta gtattctatt gttttgttag agtcaatatc agataagaac 4800 ctaaaaaggt gggacaaatt gataacttaa tcaatatatc aaactgtcat atgtctcaag 4860 tctcaaccca aattgatatg tttaagaaaa attcagaaaa gatatgtcca tgggacatgt 4920 gcatgtatat gtataagtgt acattcctaa aaaaagtagg ctcatatgac atgagcatgt 4980 atgtgcttat tgttataaag attacaaatt ttcttaaaaa tgaacacaat ttcaaaatac 5040 ctataccaaa gcccatgatc aacatagcat ctgatattaa tattataaag ctctaaacaa 5100 atctaccccg acatcaagtg gtacttacaa gttggaaaat caagatacaa aaacatagct 5160 tttaatctaa gtaaaaacac aataatatag ggatatgacc tatatgcatg tttaaaatct 5220 taagtctgta aagattgata ggattggaaa actcttctat tcaacacaag aaaagaatta 5280 cagtaggagg agggactctc acactcaact actacaaaaa aaccaaccct cacttactaa 5340 cactctcaca ctagtg 5356 <210> 5 <211> 7769 <212> DNA <213> Taraxacum officinale <400> 5 taaggccata acaaggttat ttgaacattc gcctaaaccc taaaccaact atatctattc 60 ggatttgtta cgagttttag agtttctaga aaatcagtta tatatcgatt aggcttggtt 120 ctaggttata agaaaaaatg attctctatc cggtatgaca tagagacaaa ccggtctact 180 tttataagaa aatcatattt gaaacaatgt ctagttaata attaattaat atgtgcatgt 240 ttaaatttag aatatcctga atttatattt agtgcgcaac cctatgtaag atcgaactaa 300 ttttaaaccg taaccagaca tgcatgtttg atcagtaata aaaaggctat tatcgtcgaa 360 aatattaaaa caaaatataa tatcttattt ggcgccattt catgtcaacg gttgaaagca 420 agttaccaac gcctccaacc gatcatttct ccggtaacaa ccaactgcta ccagggccgg 480 ccagaaggct gtgcggcttg ggctgtggca caggggcagc agatttagtc catttattat 540 ggtctgctat ttatttgggt ccaataagat cagggcacta aaactcaaat acatcaattc 600 aagtcggcgg caaaagaata aaaagcgcca atttttagaa gacaaggaga cagcacaata 660 atcatgcttt tccaatggcc aattaatttt agcctttgtg aggtataaat atgaatcact 720 ttttctccaa atatcattat tgtaaactag taaagagcgt aaattgtttt atcgctaatc 780 ttcttctttt tcaaatataa ttgtttgatt ctttgtagta ggtacgttaa gttttatatc 840 attcgtcctg gaaacctttt cttatgcccc ttcaatttat gaatttgtgt tttgtattgt 900 cttgctatta atccaatgca aactaattct gccgcatcga tctcacagag ttggagcagc 960 ttaaaaggag ttttggggca acttaaaatg agggtagctt ttttgttgtt gttggtctac 1020 tatttacttt ggtccttatc gttttagttt tgtgttcatt gaggatttga atgactttga 1080 acacaagttt ataaaactaa gtttttgtga ttctaaattt ttgatgtgtg caaccgacta 1140 aatgaatata aaattctgat ttgtgtattt ctgatttctg atttaccggt tattcattat 1200 gtttttctgg atctcatatg aatttagtat ataaaaatct caggttcttc ttactcagtc 1260 tagtatattt tggcattggg gatcagggtt aaaatcatca tttttctaag cactaacaag 1320 ctttaaaacc atcaattaaa agttagttct ccatacctgg aattgtttat tgctttagta 1380 ttcatttcat agtgtcaata ccttacaact gtttattgtt ttcaaatgtt tactgttttg 1440 cactttagtt gtttttagca tgtttcaact ttcaaagtta attgacgata gtgtcatata 1500 cgaaatatca tcactcatac aaaattaaac tggatagaat tttttccgat gaaatctatt 1560 tttaaatagt tacgaatata ataggagact taatatgttt gtttcaaaat tacacaaaaa 1620 caccatggaa atgggcatta gtttgtataa gcatcctttt aaatataaag ctttgttaca 1680 ttgatgcctt ctaaatatat aatattgtaa tgatttgtag taaacaccat ggaaatgggc 1740 attattaaga tgtttcgccc agggcatgaa aaactatcgg accggccctg actgctacta 1800 ataaccgcca ccgcaaaaac ctataaatac aacttccatc acaattctgt cccctactcc 1860 catttcaatc caaaaaaagg ctacacagac atatacagcg atggcagata atggcaacac 1920 cggccgtcaa aaggatgacg acggtggcca tgatggacca cgccaaaacc caactactcc 1980 accctcccct tcccgcaccc ctcgaagacc aaggcggaac acatcaccgc ccaaacattc 2040 tccgggggcg tcttcaagca ccatgccagc gccgcctact ccccctgcgc cgacgggaat 2100 caccggtgct tctagttctt ctgtgggtac taatataatt tcatttattc cacccaaaac 2160 caaaagaacg aagtcggtga tctgcccgat ctgcaacaaa gatatgtgcc atgagaaggc 2220 gctgtgtggc cacatccggt ggcatacaca ggaggaaaga ttggcggcca gcatcgctat 2280 agcaagagcg ctatcttcta acgttgttgt ttctggcaat ggcgatgaag atgaaggtcc 2340 atctaaaaag tataaactcc cggacctgaa caaatctcca ccgccggagg aggaggacga 2400 ggacgctgcc tgattttctt gcgggagagg catgcatgta tgtgtggcct ttttgcaata 2460 atactatgca tgggagatgc ataaagttta tctttatttt ttttagttta ataatgtgtg 2520 gcaaacttta tatcatttat gatttcggcc atgtactgct acatcgttct aggatggtta 2580 ttccctagaa tttgctttat gtatttgttt tctttgttaa ttcttctctt ccttaaacgt 2640 tatttcatgt gaattgcgat gtcatgatat tgcaggaatg taacttagaa ctcaacgata 2700 aaaagtgtgt tgagatcgtg gaagttgatc atttatcttg aattcataag ataagcaaca 2760 tgagatagga taattaatta ctgtggggat ttctttttat attcatatta ttcgttgtaa 2820 tgcaaatttt taagtagaat aacgaatgtg tcttattatt tacggttaaa tgcaaaagat 2880 cattaacata tctccattga tttgtttact gatgtattct catgtgttct gttgctaaat 2940 tctattttga aaagtatatt caattaaagc aatgcatttt agatataaag caactccata 3000 acttataatt gtgtagattt ttaccaattc aatgtcttaa aagaaaaata aaaattgaaa 3060 gtttaattaa ttgccatagt gatcccgttc ccgtcaatta tgtgatcaat ttttaccaga 3120 gcaaaacccc acatttcttg tagtgaacaa tctgtggatg ataaccgatc gaagactttt 3180 gtggggattt cactaaccaa ctatttggct ctcattaatt actattagtt atataaggcc 3240 atcccaagta ttttggcaat attcaaaacg agtaaactat aaaattacac ttttggttct 3300 tgtatttcta acttttagaa ttatgtattt ggttcttata gttttttatt tgtatgaatt 3360 acattacttt tggtccacaa tattttttat tttctataat tccattttta gtcattgtag 3420 ttttaatttg caataaaaaa ttaatttata tttttaatcc atatatatag ttggcaatat 3480 tctatatttt aggttcagat tgtatctttt ataaaaaaga gtcttaaaag actaaacctt 3540 ttggatcctt atagttttca caatcacttg tgattttttt aatgaacata tcatatttct 3600 taaattacat cagtaatcta cgtataacat ttaatataat tttatttaat cagaaatata 3660 ggattcgtat aataactttg ctgaacttag gcttcatttt taacaaagga taatgcatca 3720 tgcatgacat aaaaatttgt aatatttcta atgtgcatgc actacaagaa cctgaccctt 3780 catatacatt aatgaatgat tctcttttct tatttaatct tagcaagcgg tttggataat 3840 tgtctgcaca atattaagaa ttgcactagc tagctagggg agtccatgac gtaataagca 3900 aattaactag aggacttgta ggaggcttga tcacttcatt gtatatctaa tggcactatc 3960 gatatatgat tggcttgtgt gtatctatgg aatttaacac tattaaaaaa tatatcttta 4020 atgacaatca acaacacaca gtaatttatg acttacaaaa tcatgtgtga ttaaaaaaaa 4080 tgtcatgttt tttaaaatta tagaggattt acgacttaca taattatgtg tcataattat 4140 atgtcatctt gtgtaatatt tatgacttac aaaaatgtat gtcatgtttt atcatcataa 4200 aatctataaa aaaaaataga aacacgagga tactttcagt gtatgttatc tgtaaaaaaa 4260 aataaaaact cggaggacac taaaagtgta gaaacttgac agcataaacg aatttattta 4320 ccttcatcaa aacttatttt acttcaatct ctgaaccagc tcccttcatt aatctcttcg 4380 agatgtaggt tgattttaat gctaaatgaa cttttcaaat gtataaataa aacttttctg 4440 tgccagattt gacattgatg gagatgaaga tacacaagtg aattcacctt tcaatgatca 4500 tactgacata ccaagtactc ctatcccctc tccacctcca caaaacgaac ctcaatttca 4560 aaaacgtaac tatcatttaa atatttaatc atttttcaat tggattcatg cggtaataga 4620 agttactgga ctttaaactt tttgtagctg atgagattca tgagcaacag tccatggaca 4680 ttttccaaat caacaagttt ctgatgagga caacgtaaaa aaagtttttc aattattaaa 4740 catatgattt tggtttttaa aagataatta attatggaaa atcttcagaa aagtctcaat 4800 actttgggtt tattaatgaa aaagtctcaa aaaaaaattt gaataaaaaa gtccataaaa 4860 ttggataaat tattcgattt agcccaattt gccaagtaaa tctggtaaaa ttaggctaaa 4920 tcgaataatt tagccagttt ggtgggcctt tttgcgcaaa aacattattt tgggacttaa 4980 tcgttaattt tccccaaatt tcagtttatt tacagtcttg gagtaaaacc gaacctagtg 5040 cgctaatttt ggcttttggt gtttggaatt atttgggttt attgggctcg gtttctgaac 5100 gagtttgatt tttggtttct tgattcaatt ttttggtttt ggggttgaac ccatggattt 5160 tcgatttggt ttcggctttg ataatatttt tgtgcaatcg ttcaaaatat ccgagttaga 5220 ttgggtttaa atgttatcaa aaccgaaacc gagggtagaa ccccaaaact gaacccaatc 5280 gaaaatccat aggttgaacc ccagaaccga acccaataaa ctctaaaaac caaaagccaa 5340 aattaaccga taaaaaactt aaaatacatg tttgttaaat ctagtaaggt gtttttgaca 5400 ctttatgtaa attatagaaa aaaatggatt aactgtttgc ttattaagat aaaaacgacg 5460 taaaaataga attggattag aaatgaacca tttttttaca tcgtttactt tatttactag 5520 gttataaccc gtgtattaca cgggttgacg ataaaaaatt gtataaaaaa acaacatata 5580 atggtaagtt tgtaatcgta catgggttgc ttcaatttta atttaaaaat tgtaattcca 5640 aatgaaatat atgtaggatg atataacata cttgtaaatg taaatgagag tttgttggca 5700 tttcatacat ttagcccatc aaatcaaacg caaaaaatct ttttaatcct ataatacatg 5760 tggcacaaat atacgattag catttcgctg agagagaggc tttaagtgag gatgtgaaaa 5820 agaaggaaca tagcaacttg gaatttaaag atcaaaaaac cttgaaaggc ttttggaatg 5880 taaaaatata gaaatgaata aatgtggctt cttgtatgta tcaagagtag gacctgtatt 5940 agaaacataa aaaatttgtg tctaataaaa atcaacaaaa acagaacgta aacgaaagaa 6000 gttattggta aaaaaagatt tcaaaaatag tttttttttg aaccggttca aaaatagtta 6060 ttttacttat ttatccattt aatccaaact tttttttgtc aaatatctca tggaattagt 6120 tggctgcgtc actcttgtca ctgggcgtta taacttttgc cttgtggttt gcaacaccac 6180 cttaaataac atagacaaat aacattaaat atcatgataa tacataataa ctcacaaaag 6240 atgcattcta tagaacggta taattgatta gaacaaaata atctaaatag tttatgagga 6300 ttaccttgat aattcccttg gagtgaatac tatccacgat gtcatcttcc aaaggtattc 6360 aatggctttt attagaaccc aatttcagaa ttacattgat gccacagtta cattcactaa 6420 atatcttcct cttaggcttt tagtttgact atattttaac cattttcaca tcacacttta 6480 accaccccct ttggttatta atgtcaaaag gaacaaaact cacaaatcaa atgcgtggtg 6540 tttatactat tggtacaatg tttataaatt tcttaaaaat gagcacaatt tcaaaaaact 6600 taaacaaatg tcaatggtca ccatgtggta ttaatattat aaagttctaa aaataccatt 6660 ccaccccaac atggtactaa ccagttagaa aatcaagaaa cagaaacata ctctttaatc 6720 taaaacaata taatataggg atgtgttatg agtttagttt catctaacca tgaattcata 6780 taggattgta cgtttctcct cgaaattgca aagaattttg ttcgactaag caatctacat 6840 attaatggat ttgtatggtt tctcggtttg taggtaagtt aagagctacc aggaaagaga 6900 aaatttgcac cataggtact aaacacattc tacaatggtg gctttaacgt gagagagaat 6960 agagaggtcg aaacatattt ccgttaaata agcaaacata agtttctatt tgggatcaat 7020 aagtttcttc ctatagtggt aaatggatct gtacttgtta agctcttaaa catatttgtt 7080 gtcactgttc acttcctatt ttgcagtgct cttctattac ttacattctt cttatgacat 7140 tcttttaata aggaaaaata accacttatt ctagtattct attgttttgt tagagtcaat 7200 atcagataag aacctaaaaa ggtgggacaa attgataact taatcaatat atcaaactgt 7260 catatgtctc aagtctcaac ccaaattgat atgtttaaga aaaattcaga aaagatatgt 7320 ccatgggaca tgtgcatgta tatgtataag tgtacattcc taaaaaaagt aggctcatat 7380 gacatgagca tgtatgtgct tattgttata aagattacaa attttcttaa aaatgaacac 7440 aatttcaaaa tacctatacc aaagcccatg atcaacatag catctgatat taatattata 7500 aagctctaaa caaatctacc ccgacatcaa gtggtactta caagttggaa aatcaagata 7560 caaaaacata gcttttaatc taagtaaaaa cacaataata tagggatatg acctatatgc 7620 atgtttaaaa tcttaagtct gtaaagattg ataggattgg aaaactcttc tattcaacac 7680 aagaaaagaa ttacagtagg aggagggact ctcacactca actactacaa aaaaaccaac 7740 cctcacttac taacactctc acactagtg 7769 <210> 6 <211> 227 <212> PRT <213> Taraxacum officinale <400> 6 Met Ser Thr Val Lys Ser Lys Leu Ser Thr Pro Pro Thr Asp His Phe 1 5 10 15 Ser Gly Asn His Gln Leu Leu Leu Ile Thr Ala Thr Ala Lys Thr Tyr 20 25 30 Ile Tyr Asn Phe His His Asn Ser Val Pro Tyr Ser His Phe Asn Pro 35 40 45 Lys Lys Ala Thr Gln Thr Tyr Thr Ala Met Ala Asp Asn Gly Asn Thr 50 55 60 Gly Arg Gln Lys Asp Asp Asp Gly Gly His Asp Gly Gly Arg Pro Asn 65 70 75 80 Pro Thr Thr Pro Pro Ser Pro Ser Arg Thr Pro Arg Arg Pro Arg Arg 85 90 95 Thr Thr Ser Pro Pro Lys His Ser Pro Gly Ala Ser Ser Ser Thr Met 100 105 110 Pro Ala Pro Pro Thr Pro Pro Ala Pro Thr Gly Ile Thr Gly Ala Ser 115 120 125 Ser Ser Ser Val Gly Thr Asn Ile Ile Ser Phe Thr Pro Pro Lys Thr 130 135 140 Lys Arg Thr Lys Ser Val Ile Cys Pro Ile Cys Lys Lys Asp Met Cys 145 150 155 160 His Glu Lys Ala Leu Cys Gly His Ile Arg Trp His Thr Gln Glu Glu 165 170 175 Arg Leu Ala Ala Ser Ile Ala Ile Ala Arg Ala Leu Ser Ser Asn Val 180 185 190 Val Val Ser Gly Asn Gly Asp Glu Asp Glu Gly Pro Ser Lys Lys Tyr 195 200 205 Lys Leu Pro Asp Leu Asn Lys Ser Pro Pro Pro Glu Glu Glu Asp Glu 210 215 220 Asp Ala Ala 225 <210> 7 <211> 14519 <212> DNA <213> Taraxacum officinale <400> 7 ctgacttggc caacattttt tgttcttccg atcccttcgt aacaatcagt ttaagcacaa 60 ttgaattata tggagataaa taggtgaaat ttggaagacg aggatgggag agtgcgaaga 120 gccaaagaag agaaatgtgg gatagcggcc ggccggttgt taatagaagt gcttagatct 180 tggagacctt ctaatgctta tggaggaacc agatgcttca atttgtaaat ctgcgctgcc 240 cacgtagaat attgaaaaag aaaatcaaat cgatcaataa tgcgaccata tactttagga 300 tttcccactt gtataattct cttattcatt ttcaaatctt tatctaaatt aaggatatcg 360 gcaaaaatat aatcctaatt gtttttcaaa atgataagga ttataaggta acttaattct 420 tgttttattc atatttaatt attattgttt tttatcaatg ttttaaaacc cgggttttga 480 gtcaacccgg tcttgtgaaa aatcccgggt cagccggtca gctgatctac cggttcaata 540 tatttaaata aaatataaat tttcatatag aatttgagtt ttaggctaag aaaatcgggt 600 tttgggctaa ggaaaatcgg gtttaagttt tgggctaatg gattttcggg tcaataacgt 660 ttttttccgt tttttagatc ggttcgaccg cgttttgtgt gaaacccggc cgggttgatc 720 cgagtcaata attggcaaca acccggtata tgttgacccg ctcttgtccc cgggtcccgg 780 ttcaaccggt tggatcggcc gggttgaccc tggttttaaa acactgtttt ttatacaata 840 tatttgtttt tgtttttagt tttgtttttg tttttgattt tgtagatata tttttaattt 900 tatttttatt ttgtataaat atagtcatta caaccgatta tttgtaagtt gagtcggtca 960 aaacgaactt tctgataatt cttatacatt tttcggcgaa acatgaatat tttgatcaac 1020 caatatgctt ttttctaggt tttttaaata aaccgcacgt tcaattgcat attcgcaaac 1080 aatagaactc gaaaacccta atcgagcttg ttttatagaa atctgggttg agtgcataca 1140 taataattaa taactgtgaa aaagtttgtt ttaacatgct aaacctatcg atagtcggtt 1200 ataataatta tatgtaaaca aaatcagaaa caataatgat atatgtcacc caaaaaaata 1260 gttactaaat atatacaaaa tcaaaaacaa cagtaatttc ttttacaaaa aaaagagaac 1320 aatagtgact aactttagaa agaaaaaaaa agaactaaat tactcttata aatcattatc 1380 ttttatataa attggtaaat tggtcatgta atctagaatg tgaattgcgg aatgctttag 1440 tcacattttg aacaaactgg taattattaa tttcgataaa agttcttcaa gaatagtttg 1500 gtcacatttt ggacgacaat ggtgtgtttt ccatagtaag caatacgtaa tgagttcgct 1560 taataggaaa atagatctaa agcttaatga aatcatatgt ataagtaaca tatatttttc 1620 acacgttaca ttgtttgtaa cgtcctcaat ttttttaata tatataacta ggtacactct 1680 aaggtcgtgc taagcacgac ccacgaatgg taatttaggt aatttttcat ccttgactaa 1740 aatacattat gctaataaca aagaattaag aatacaatgc tataatgcat aagtaaataa 1800 aagtacatga tatttctcac atttagtctt tatacataga aaacttacac tggccatttg 1860 caaaaaaaca ttaaatctcc ctaaaaagta gagtttacaa aatgaaagct tgtttttata 1920 gcaaacaata atcaatatgt gaagctatag tatagtaacc tactcatttc aacttttagg 1980 cagtgcagta attacttact catgttaatg gtgaaatgca ttaagataaa cttcattcaa 2040 cggattaaat ctgggttcat tataaatgta ctcttagtta ctcctccatg taactgcatt 2100 tagcgaacaa caaaagctct aataaataat atgaaacaca tgctaattta taaatgacat 2160 catgggtata gatgctgtaa catcctaaac ttttaaaata aataataaat catatttggg 2220 atttaaagta atattttaag ataattgata aataagagaa tgaaatacaa agaggcattt 2280 tatttttagc ctttgattta taaaaaagaa aaaaccttga aattggatgt attttgaaat 2340 gggtaagtat tttaaaagat gtgtaagtta agggggataa atggaaatta aggagataag 2400 catttgacca aagtcaaaat agaaggaaca ataagtcggt cgattgtttt cctgtgtgca 2460 tcttcggacg acagagagac agaaaagaac gagcgagaga cagagaggaa tcgagacaga 2520 gagattatcg agagagagac agcgaagtcg ggagagggag accgagaacg accgagacag 2580 gaggaaaacc gagagacaag gggaggacga ggcagcagca gcctaggctg ctgcgttttt 2640 ggcgacagaa aaccaccgcc agcggcggtg gtggtgagcg acggtggtgg tggagccgag 2700 aaggggttgt ggtggtgtta gaagtgatgg ttcatctcaa tttcttgata atttgccctt 2760 ttggaacaat aaattgaagg taactttcaa agctttagat gattatctct tgaaagtaga 2820 aagcaagggt aatttagtct tcaattatgt tatggagaag ggtaataaca cccaaatgct 2880 aacaaaatca tatagattaa tgtgatttga agttatatag ttcatgaatg tgaaggttga 2940 ctttctgcaa tggtcaaaca tggacatgga catgattata gcatattagc aatgtaatag 3000 gaatggaatc accaattcca ttgttgaaaa tagaaaattt gatgtgtgca gaattttgta 3060 aaatttccca aaacaccaac tttaaggctg cataagtcat gcatgaagaa tgcaaatcag 3120 tccattcttt cgcctaacat caagtccttg caacatagat tacacaggaa aaagaaacag 3180 ccaaatccga gttcgtatga ggattgtatg actgttcaac gtttgtcaaa agttgctgtc 3240 atgctgtcaa accagaattt ttctaagtct gggaaatatg cagaaaatgg gtttgaccag 3300 tttttggagc ttcataactt gatttataca tatccaaatc agttgattct tgagcctaaa 3360 ctgtagagaa agatgaggag aaggcatagg aaaaagaatc aacacatttg gatatcgtat 3420 acaacctgtg caaagggttg aagtaggctc aaaacccatt tttgacataa ttgtcaatta 3480 tatgaattgt gggtaacttt tgccgtaatg aaatgttttg acatataagt gtttatattg 3540 acttataaac atgttaagac tataaacttg ataaagtaac atgtcaaaac ccgaaaatgc 3600 ctatttaggc aaagtatgat gcttaattga gaaatcggtc aaatagcata aaaactaaaa 3660 gtgttctaaa tggtccaaga agactttata cataacttac acatcattag cacatgatgt 3720 gtagtacatg tgaggtttga acacttttat acttggaaaa ttgtcaagta gtcaaaaatg 3780 ggacaaaagg gtaaaattgt ccaaaatgag tatatggcta attaaagcaa gttgagctac 3840 tgaaatgaac ttagataagt attataagga ctataaaagt ataatacttg gttaactatg 3900 agttttgaag gtaatgtcaa tttaaagtaa gttaaccaaa agaaagtaag ttgctaattt 3960 tgggatatat gacccaaatg agttatgcat tggtttttag gttgtgtaat acctataatg 4020 agatatgaat tgattatgag acatgtattg atgataatac aaatgatgta atgaaatagg 4080 ttcgttgcct atcgtggagc aaggagcatg cggattagtg tagctagtct tacctagcta 4140 ctaaggtgag tacgtgtgga ttgttttccc attttcgggt acatggaaaa ataatatttt 4200 tataatgaag tgcctaatgt tttgaaagaa agaatgaatg aaaatacttg atgcttttga 4260 aagaatgttt taaaagaaag taatgttttg aaagaaaaag gtttgatgct ttacgtttga 4320 aaatgaatat gtcttgatat taatgaatgg aatgggtaaa gcatgaatga tataatatgt 4380 aataataaga tgctaaggat ggttatgttt atgatgttca cgtgaatata agaatgttgc 4440 tcgatctaag atgtcccggg tagggattca gaggagccta tcggggtggt acctcccctt 4500 cgcgagatag gttacctaat gtaaatgatg tcaatgtaat ctgatttgtt ctttttgcat 4560 tggtacagac ttggggtata tcagacccaa gtataatatg atatggccat atgataagat 4620 gattaaaaga gtatgtgaaa tgttaaaggt tatgtaaaat gttatatgaa attattcaaa 4680 gagatcttta tggttattat gtctatgaaa aggaagcata taatgttata gatattttat 4740 gtctaaaccc acgtagctca ccagactagt tgtctgacgt atttattttt atgccatgta 4800 tttcaggtta tacacgagga tagactgatg atcgatagaa gctagatgtt acgacggata 4860 gacggagtgg agctttcaag ttctattgta atgatcttac cgtaaattct tatttgcttt 4920 gctatggttg ctgtttgata tataattggt aacacccgag aattgtttta tatatattca 4980 aaaagttttt atttgggacg gtttttgtaa acatgaccaa gtgtcatgaa atatttttaa 5040 aaccatagcg tttttaaaac gataaaatga ggggtgttac agatgcgata atatatctta 5100 ggattatgtc aaatatttat gccaattata catgagagag caagtttata agagttttag 5160 ttattctatc attggatcaa tatagatacg tattaatagt agacagagat gcatgaatat 5220 tatagcagag aactttttgc aaaacctaac ctcactgcat gttgcattca tcaaccccac 5280 ttgtagttgt aacaccatga atatgccaat taagaaatat catgaggtat attgtactgg 5340 aaatgacaaa aagtactaat ttacaataga acgcagtcaa acttggttat tttgtaaatt 5400 ttaagaagca atttacaaaa aataaaacat aataaagaaa aacataacag taaatcacag 5460 acattgctca tggaagagtg actgatcaaa ctgaccgttt attttcttgt ttcttgtaca 5520 actaccaaac gttcctgtat aaccaccaaa tagtcccaga ctttagaaaa tagaacagaa 5580 aaccacagat atacatacat acagccatac attataattt ttaattgaaa aaaatgcata 5640 gaaaaccagt ctcaaataaa gaaccaaata aagaagatac aaatgaaacc tggttatcga 5700 ataaaagagt tagagataat gatttcagca tttgcactca tgtaaacgat atgccattgg 5760 gatccgttgg aaagggtatc gtgaagtgat taaggagaag cggggtgtta gggttttttt 5820 tgcagtttat tgaacaggtt gatcaaattt tgcgccggta gggttaattc cttttcgaac 5880 gggtttctat ctgggtcttt catcaaaatc actcatgttt gtgtctctaa cctttagttg 5940 cagatggata tcagatcaac ggtttcaggc taaatggggg aacaaataac aagaagaaag 6000 cggtgacatc tgtgttcgta ttcgtatggt ggaaggggaa gagtggcgta tgaattggtc 6060 aatgtaaaac atctggaaac aacttctccc aacatgtaaa aggatccgga aaatatgaaa 6120 atgacgatta gagatttcgt tcggatattg ggaatatggt cgcgtctgat tgccctacgg 6180 tgcccaccgt ttgggtttct tgatttgtcg tttagataga tgtcggaggt ctaaattcac 6240 aatcctgttc ttccgcggta attgaaattg ggtaaggcta attgtttaga tcaaatggca 6300 gaggacgatg tgaagttgcg ttgccctata attggctctc gtgaaattga attgcaaatt 6360 tcacaacgat gttagcaaca ataatcgtcg ctctcgcatc ccataccgtc gcaacgtatg 6420 atggtgatcg agattgagag atttagggct agatgtggcg ttggcggaca taggttgtgg 6480 ttgacggaat gaggagaaga cgtgagcgtc gattgaggta gcaacaggcg gagggttaac 6540 ggtgtcatca tggtgaaagg tcgcgcgtcg ttttatggtc gatagatcat ggacgttgtg 6600 agtgaatgcc ggcgcaaaca cggtggagga aagtctatgc tttagttgac ggggcggttt 6660 tctctcggag acggaaagag gacgtcgaaa gaaaggccgg ttggagaaaa tatattaaac 6720 gcgccgacac acgctatcag agaagaccgg ttttcttata taataatgac taggtacgtg 6780 caagggtcgt gctaagcacg acccatggag gcttcttgag aaaattgtaa acacatatca 6840 gataatagcg acgaacttta ctgttattga tatataaagt gattaagcat ggttggccct 6900 aagttaaaac tcaaactact gtaagtatgt aatggtaata atttatcctt ttcagctatc 6960 gatcttagat tgctctgtag tgttgtgtct tagtgctttt cacggttctt ttatatgcat 7020 atagtcacat aaaatcagac acacacatag aataacccac agacaatcac ataaaaatca 7080 gtctgatgag gtattaattt aagcaataag gattgatatt caagcaatta gaggagaata 7140 atatattaat ttcacgtact cctattgtag ttattgtgac aaaacccaac tgtttaattg 7200 tgccattgca aaaagtccac ctgtttaatt tctttatcaa catgtcgttg catcctttta 7260 catgcaaata tttcagaaca tcttcctata atgacccttg agatgaactt tttagaaata 7320 ttgttgctgg ttacattatc agaaaaaaca gagcttatga aaaaagacca aacatagtaa 7380 ctcgtacttc atgtctggta gttcttttga atatttccgt cttttgttcg aaacaatttg 7440 gttgaactgt agtagatctt tcaaactgta tacaacttca caatatgttt tgtaagttca 7500 ttacttctag atcctttcaa aagaagaggt caaactcaaa atttgcataa accagattta 7560 ttgaaggcta attagattag tgttgtaggg ctttttggat ataaataaaa atgaaacata 7620 ggtgctgcaa caggtgcgaa agaatttggt tggacagtag taggtctttc aaactgtata 7680 caactttaca atatgttttg taagttcatt atttctagat cctttcaaaa aaaaggaggt 7740 caaactaaaa aaatttctaa accagattta ttgaaggctg attagattaa cattgcaggg 7800 ctttttggga ataaatataa atgaaagata ggtccaacag aaacgaagga ggtgtgaatt 7860 atgcaacaaa tggaaacaca caattatcgt agtacacatg taattaacag ggatcaattt 7920 ccatttattg ttccatcaat tgccaaattt aaaagataac aaatgcatcc tttttgaatg 7980 gaaaagtatg atacataaaa ccagagagag gtatacattt agtccagaaa cggtggaaat 8040 tactttacct agagttgcgt gaatcaaatg gaaaatcaga ggaagagacc ctaaatcgca 8100 atccatcttc tattccctat agaatcaaat ggaaatttct tacttccgac ctttttcatt 8160 tccacaagtt tgtaatcgat aagatcataa aagaaaaccg atttacatta gcaaatcttt 8220 aaggcacttg tttgtagttc tcaagtatgc gttacgtatg aaattctaga cagaaaaggg 8280 acgacaggga aaataatggt ggaataaata aacaatcaag aatcaaaaga taataatcct 8340 taaaactaac aaaaattcta tcaataagcc ctacaaatga gaaatatgac ggtggagact 8400 cacctgattg cagtggcgga agctcttggg ggctttggta ggccatggcc ccctgttttt 8460 tggaaaattt tcaaaaaaaa aaaaattata tatattatat cattgaataa gtctagactc 8520 aggaaactat gaaagattag aaatagatca agttatctaa atcaaatctc gaaaaatatg 8580 gaaggaatca aaacacaata tttatctcat tgtgaaatca aaaaccctat aaaaaacaca 8640 aatctaacct acaatttaaa tcaaaaacac cataaaaatc aacctaccgt cggattcagc 8700 cgtcgtcgtc ttcttcaccg gaccaccatc caccgccatt gcttcaatcg tgctttctcg 8760 tcaatagctt agtggcttgt tcagctttct tgctctacca atgattttta tacactttcc 8820 agcaccaccg atttgttgaa cggtaatatt atgctccttt atatttttga aatctttgaa 8880 agttcatctg gttttctgtc tctgtaaact gtaaagaaac ttttatgttt tgttaagaaa 8940 atagagagat agagaagaaa gagtattgac gtgcttttcc catatgtctc gaatgccaca 9000 ttaggaaaag acaaaaagaa aacaattagt acattacgct agtgtgatag tactgtatga 9060 ctattagtat gatttacagc tttaataggg attcatagaa aagaacaaaa taaactactt 9120 ataaattaaa aatcgagctt tatttttaat tagtttaaat aaatatttag ctataacata 9180 atatattata tgttttgtat ttataatcaa atataattat ttgtattaca gattagtttg 9240 tataatcaaa tataatgatt catgtttcga aaagattgtt taaatatttt tatatgccat 9300 gttttttaac tgaattatat ttttttgtat gattttcttt acaatttagt ttttctttac 9360 aatttagttt tggcccccct tgtttttttg tttgtgttcc gcccctgcct gattgatgcg 9420 agaaaaggaa agccgccgac atttgtgctt cttcccgcgt taagaaaaat cgcagatgac 9480 attacgattc tttttctaca gaggaatagg ggggttgcga ctttgcgtga tttgttgtta 9540 atgagtgatg cgtcgtccgt tttgatcggt agcccgtgga gactgattta tttgacagat 9600 agatgtcgtt ctcgttgatg atgcaggtgt aattggcggc gttggtgaag cgaagatggc 9660 atagggaatg gctttgcaga ggagaaaagg agtttcacaa atatggatta ttgaatcgtc 9720 gtttcagagt cgcgatggtt agtaatcgat ggatttgggt ttgcacctgt tcaaggggtg 9780 gtgacgtgtc ttactgtaag aaagagtcgc gatggttagt aatcgacgat ggatttgggt 9840 ttgcaacatc gttgacggaa acgacgcggc gatggagaga ggcggtagag ggaatgaaac 9900 gggagattta ccttcaaccg caaacatgtc ttcgttcctc gaaaatcata tgcgcccttt 9960 atgaaaattc cttcacgcgc cgtacacgcg ctcagaaaaa acatagggtt ttcttatata 10020 ataatgacta ggaacgttta tgcgccgtga taatcacggc ccatgagtgg tacaaatgtt 10080 gtaaaactta gaaaatggga aagttgaatg tacaatgtta tgatttattt tattcttcat 10140 agcacaatac ttttgcttta gtgaaagcag ttaaaaagtg gatgtgtcgt tagcaactat 10200 aaacttttaa caaaatatta catacagaac atagaaataa gataaacact aaaaaaatac 10260 aaaatagccg tgttcaacac ggcccacaga atgcaatttg gatatttcta aggaggtgta 10320 aaaaatattg ctattatggg agctaattct aggtatattt tgttactcac atgacatgaa 10380 tattgagtaa ttttgtaaaa ttggtaattt agcttagatt ttcccacaaa gatgagtgtt 10440 aaaactatca aggaggatat atggtacttc ctcaacaaag atgattttga aatatctata 10500 ttttaaatgt aagaactact atcacatgag acaaatattg atattactgg ttaggattac 10560 aacattgata tgtaaaatat tttggtaatg taaattttct aaaaaagctt ggaagtagaa 10620 tgcaacaaca atatatgcta gtattacatg ttgggtgatt ttatgaatgt acttacgtgt 10680 tgatccttat ttaccgtact tgaataattt tatctgatca atgctttacc tatatggcta 10740 tatctagcaa tgtgcattat tcacaaatta tggagtgtaa attcatatag acgtatatga 10800 cagtggatga aaaggaaaac aagtaatttg attgaatcac tgagaaaaaa gcaaaagata 10860 catgcatata aaatgttaca tcaaaataca gaagataaat gaaagaaaga taataatgtg 10920 gagcattcaa aataagtaag aatgtaagtc cttgatagct cgaaattctt ttaagtcttc 10980 cgtgatagcc taatgtttat aatagaagag acattcaaaa tgaataagaa ttatatcacc 11040 taacagtatt taatcctact ctacttggcc attgagcata ttgctattgt taaaaattat 11100 gtccaaatcg catttaactg ttagatgcaa ttctcattgc cgattacact tatatgtatg 11160 tagtaaatta taattaactc tttgtcctgg tcatttgatg tgtcatggat gtttgtaagg 11220 tacaaataat agattacaat aacttaaata taaaattgag ttaatattcc agaattcaca 11280 aaatgtgtaa taacacttat ttataatttc cacgtaatta atgattaact acttagaatc 11340 ctacaagttt ttgtttatca cctttcatat gatcgtataa atgcaacaac ccttaatgca 11400 tttatagttg ttggtctgcc acgaacacct ttttctgttg attatttgtc attattatgt 11460 taaaaaatgt ttgaaaaatg ttaaatggga ttttgttatg gcaaagagat gaacttctcc 11520 aatattgtag ttgcataaat attgccagtt ccatcataca gaataatacc tcttatattg 11580 ggcaatagaa ttatagaaac aataagggtt aaccgactta catgtattga tctctgattc 11640 ttctttacac actggacaaa ttagtctatc atgtcttgca caaccctgtt aaagaaaaca 11700 gtgaaaattg accacgaagg tgtatcctct agtaccaaca ttacatctat cattttaaaa 11760 gggaaatgta tacttatcat atatatctaa tggacgttgc ctttcctcca attgtcactc 11820 ttacatctaa tggaaattat gatcacaatt tacttttaac agcatagata cattcatttg 11880 ttggtaagac acttttggcg gattcattgt attaatcttt catgtaaaaa ttctcattca 11940 agatattagg tttttgttag aacccttgtt atttgaacat gcaacctgaa ttctgattgt 12000 tcccaacacc aacattaata atacctcttc cactagacca tcattccacc ttcaggccct 12060 tgtgttcatt attataagca ctattcggtt tagttctttt atgagtccta tatttacatc 12120 cttaaccatt ttaacaagtc catcatattg ggaattttaa tataaatacc caatgttatt 12180 catttttgtc gcttcagtag atattgacca tactaaagat gagtatttaa tactcataca 12240 acatgaaaga aaaaaatgaa aaactaacag tcacttatgt agccccaatc tccatacaaa 12300 tagcgcttta agaataaacc aatttcaggt gaaattgtag aaaggacata aatctgtaca 12360 tgaaaaaaca ttaacagtta cacataaatt atttgcacag agataaaaag cacaatatgt 12420 gatgagaaga tttaaaagta ggaaagtgaa caaaaataac catcaaaatc caatgttagt 12480 aataaagaaa atgtacgagc gattcataac attcatccaa aacccatatg cgatgttgaa 12540 tgcatatctg gataaaagaa tttaataaac aataagcgcc tgtaaaatca ataaacaaaa 12600 tcaataaaaa tagacctaaa aatgcaaccg acttattgtt tctatacacc aataaatgat 12660 tttcacgaat tttatccaaa gaaagataaa aagtcataaa attgaacggg cttaccgatt 12720 tgaatcgtgg tctgtatctg ccacgcagat cagataacaa tcataatcta catcaaagat 12780 ttcagaaaaa tatgaaactt ccgccattac taatttgata tgaatttctc agagcctaaa 12840 acaaacctaa attactaaaa atcaaacaca ggtttttgac gtttaccttg atttgtgaaa 12900 ataggcattt gggttttttc gtaggatttt ctatgaaaga agccatcaag tttatgacat 12960 tgtaaattaa agcaaagtat gaatatatga aggataggaa aagagatcgg attgtgatga 13020 tccggagaga aaaatacaca aaccagagag aagcgatgtt gtgattgtgg tgtattaatc 13080 tgtttttaaa cctctaacca cttcttgtaa gtccgtaatc agacgaaatg cgcttgaata 13140 ataagtcttt cacgccagtg tcgaggatta atgccgtcaa gggtggtggg gaggtattta 13200 taggaagaaa tgcggtggag gtgaatggag gcgtcgatca aacccaagag gaaacggttt 13260 gtcgaaatag atgcgttggt cattcgccat aagtttgtga aacggtgagt gtatccttgg 13320 cgtcgtttga aagtttgtga aacggtggcg atgctccgtt aaaggaccgg caacggatcg 13380 agcgatatgt aaatgggagg gcagaaatat tgcatacgcg ccggacacgc gcttatggaa 13440 gtgatagtat ggaagtgata ggattttctt atataataat gatataactt aattttaaat 13500 aacatcgtac tatacgtttc aaaataaatt agagttttaa taaaattacg gaatgattaa 13560 accaattaca aacaaatata agtgtcggtg atataaaatt tgtaacaacg aaaacatttc 13620 aaaaaatctg aatgcggaaa tccataacat gagaatacga ttcgtttgca gtcacgccgg 13680 tttcttcacc ttctgagggt cctgaaaaag gttaataaac aatgggtaag ctaaagttta 13740 gtgatcatac acattacttg tctattatat gagttagata cattcacata tcacatacat 13800 acaagcatac acatattaca aaaaatcctc acacatattg ttggtaccaa ctactattta 13860 gtggaccagg ttattcttgg gggtcaattg tggttaacca taaatgtttg gagtttaggt 13920 tccccttggg ggccgaccat aaacacccat atcatatctc tgtctaggtt ctctttgggg 13980 actgactata gacaactttg ctcagattct ccttggagga taaccatcct cgacgagatt 14040 aacaacggac caccactgtt ttcagcttgt aacctgcaac atcaatagtt gcgatcttcg 14100 gcgacaatga tgaaccaaca tcaacacaac agtagtgccg gtatgttagt cgttggataa 14160 tagaggcatc atctgaccct tttagcggtg acttttgttg cctatgaagg tcttatcagt 14220 tatatatcga ttaggcttgg ttctaggtta taagaaaaaa tgattctcta tccggtatga 14280 catagagaca aaccggtcta cttttataag aaaatcatat ttgaaacaat gtcgtgttaa 14340 taattaatat gtgtatgttt aaatttagaa tatcctgaac ttatatttag ttcgcaaccc 14400 tatgtaagat cgaactaatt ttaaaccgta accagacgtg catgtttgat cagtaataaa 14460 aaggctatca tcgtcgaaaa tattaaaaca aaatataata tcttatttgg cgccatttc 14519 <210> 8 <211> 684 <212> DNA <213> Taraxacum officinale <400> 8 atgtcaacgg ttaaaagcaa gttatcaacg cctccaaccg atcatttctc cggtaaccac 60 caactgctac taataaccgc caccgcaaaa acctatatat acaacttcca tcacaattct 120 gtcccctact cccatttcaa tccaaaaaag gctacacaga catatacagc gatggcagat 180 aatggcaaca ccggccgtca aaaggatgac gacggtggcc atgatggggg acgcccaaat 240 ccgaccaccc caccctcccc ttcccgcacc ccgcgaagac ccaggcggac cacatcgccg 300 cctaaacatt ctccgggggc gtcttcaagc accatgccag cgccgcctac tccccctgcg 360 ccgacgggaa tcaccggtgc gtctagttct tctgtgggta ctaatataat ttcatttact 420 ccacccaaaa ccaaaagaac gaagtcggtg atttgtccga tctgtaagaa agatatgtgc 480 catgagaagg cgctgtgtgg ccacatccgg tggcatactc aggaagaaag attggcggcc 540 agcattgcta tagcaagagc gctatcttct aacgttgttg tttctggcaa tggcgatgaa 600 gatgaaggtc catctaaaaa gtataaactc ccggacctga acaagtcacc accgccggag 660 gaggaggacg aggacgctgc ctga 684 <210> 9 <211> 4521 <212> DNA <213> Taraxacum officinale <400> 9 ttttcttgcg ggagaggcat gtatgtgtgg cctttttgca ataatactat gcatgggaga 60 tgcataaagt ttatctttat tttgttttag tttaataatg tgtggcaaac tttatatcat 120 ttatgatttc ggccatgtac tgctacatcg ttctaggatg gttattccct agaatttgct 180 tttatatatt ttttttcttc gttaattctt ctcttccttt aacgttattt catgtgaatt 240 tgcgatatca tgatattgca ggaacgtaac ttagaactca acgataaaaa gtgtgttgag 300 atcgtggaag ttgatcgttt atcttgaatt cacaagataa gcaacatgag atagaataat 360 taattactgc ggagatttct ttttagattc atcttattcg ttgtaaattg caatgcaaat 420 ttttaagtag aataacgaaa gcgtgttgtt atttacggtt aaatgcaaaa aatcattaac 480 atatctccat aattgatttg tttagtatgc attctcatgt gttctattgc aaaattctat 540 tttgaaattc aattaaagca atgcatttta gatataaagc aattccatca cttaattata 600 ttgggtagat ttttaccaaa tcactgtcct aaaagaaaaa taaaaaatga aagttcaatg 660 ccatagtgat cccgtcaatt atgtgatcaa tttttaccag agcaaaaccc caaaagttaa 720 agagtataat tgcagaacga caacaatctg aggatgatac taactccggt ataaaccgaa 780 tgcttttgtg gggatttcac taatcaacta tttggctctc atcacaaggc cgtgttaatg 840 gattactatt agttataagg ccatcccaag ttgtttggct atattattac cttttaaaaa 900 ccaaaatgtg taaactgtaa aattacactt ttggttcttg tattttctaa tttttagaat 960 tatgtatttg gttcttgtag tttttttatt tgtatgaatc atattagttt tggtccacga 1020 taacttttat tttctataat tacacttttg gtcattgtag ttttaatttg caagaaaaaa 1080 ataatctatc tttttagtcc atatatatag tttgcaatat tctatatttt aggttcaggt 1140 tatatatctt ttacaaaaat actacttatg attttttaat gaatatatca tatttcgtaa 1200 attacataaa cattttatat aattttattt agtcagaact ataggattcg catgataact 1260 ttgctgaact taattgggct tcatttttaa caaaggataa tgcatcatgc atgacataaa 1320 aatttgtaat gtttctaatg tgcatgcact acaagaacct gacccttcat atacattaat 1380 gaatgattct cttttcttat tatatcttag caaacggttt ggataagagt ctgaacaata 1440 ttaagaattg cactagctag ctagtccatg cagcaagcaa attaattaga ggacttttta 1500 agaggcttga tcacttcatt gtatatctaa tggcactgtg gatatatgat tggattgtgt 1560 gtatgtatgg aatttaatat tactaaaaaa tattaatgac aaacaataac acactaattt 1620 ataacttaca aaagcgtgtg tcattaaaga aaatgtcatg tttcttaaaa tatggagaat 1680 ttactactta cataattatg tgtcataaat ttatgtcatc ttgtgtgata tttatgactt 1740 acaaaaatgt atgttatgtt tatcgtcata aaatctgtaa aaaaaaatag aaacatggag 1800 gatactttca aggtgtagaa acttgacagc ataaacgggt ttattacctt catcaaaact 1860 tatcttactt caatctcttg gagatgcagg ttgattttaa tgctaaatga acttttcaaa 1920 tgtataaata tatatctttt gacggatttg acattgatgg agatgaagat acaccagtga 1980 attcaccttt caatgatcat actgacatac caagtactct tatcccctct ccacctccac 2040 agaacgaacc tcaatttcaa aaacgtaact gccgctgttc taaaaacaga aaattttcaa 2100 aaacgtaact atcatttaaa tatttaatca tttttcaatt ggattcatgc tgtaatagaa 2160 gttactggac tttaaacttc ttgtagctga tgagattcat gaacaacagt ccaaggagat 2220 tttccaaatc aacaagtttc tgatgagaac aaggtaaaaa aaataagttt ttcatttaaa 2280 catatgattt tggttttcaa aagataatta attataggaa ctcttctgaa aagtcccaaa 2340 gtttacccgt aaaattgatt ttggtttttt tttaaattga ataaaaaagt ccataaaatt 2400 ggataaatta ttcgatttag cccaatttac ctagtatatc tggtaaaaat tggttaaatc 2460 gaataattta ggcagtttgt tgggcttttt tgcgcaaaaa cattattttg ggacttaatc 2520 gttaattttc cccaagtttc agtttattta cagtattgga ataaaaccga acctagtgcg 2580 ctaattttgt cttttggtgt ttagaattat ttgggtttat tggtctcggt ttctaaacga 2640 gttcggtttt tggtttcttg attcgatttt tggcttttgg gttcaaccca tggattttcg 2700 atttggtttt ggttttgata atattttttg tgcaatcgtt caaaaaatcc gagttagatt 2760 gggtttaaat gttatcaaaa ccaaaaccga tggtagaacc ccaaaactga acccaatcga 2820 aaatccatgg gttgaacctc aaaaacgaac ccaataaatt ctaaaaacca aaatccaaaa 2880 ttagcggata aaaattttaa aatacatatc tactggtaag gtgtttttga caatttatgt 2940 aaattataga aaaaaatgta ttaagtgttt gctatttaag ataaaaatgg cgttaaaaat 3000 agaattggtt agaaatgaac cattttttta tattttttac ttcatttatt aagtaaatag 3060 tagaggtgaa ttagagatga tctaagatat tttttttctt tcaaaaagag cttcgaaaac 3120 acttttccga cagaaacaag acacaaacct ttttactcgt agaccgacga tttttttaaa 3180 gatcaaagac ctaagaagat ttgtctccca tcttcttaaa acatatgtga gatagacact 3240 tctagcctct tctatgctaa aaaaaagagc tcgcctttag tttggttaat ttgagacaat 3300 ggtctccaca aaaacatagg tagttaggta ctcacgcgcc aagttactaa tctcaaatca 3360 aacataactg tatgatcgtc aacacatttt acaagttaac aaaagagcat tgctttagac 3420 ttaaaaattg ctttgagaaa aaacaaacac ctaagaattt ctaaaagcga tgatttcaac 3480 tctctttaaa atgtatatat atgttacatt ttggtcttta aacttttcaa gaaagtacaa 3540 ttcaactcct attttcaaaa tgttcttaca tgagcgatat gattttaccg tttaaaatgt 3600 aaaccatgat aactatttct aaattccaat ttttgtttcg ttgatcaatc tcattatcat 3660 tcaatgcata caaaacacaa tacaatctgt tttgtcatct tcttcaaggc cgaaagacaa 3720 ctaaacatat gaagactgaa gaggacaatc tagcaaactc aaacttcact ataaatttgc 3780 aattgctatt ggtagccatg aagtaacatt tttgaggagg ttaacaaaat tttaacagta 3840 aattcaataa tccatcacca cgatatgtaa tcatctacac aaacacagat gatgatagtc 3900 atatatgttc gtaatcacac aagcaagaaa tcgcaatgta ctttacaccg tcttctctga 3960 cttgaacacg ggaattggtt gtctaagaag tagattgttt cccacggatt taccaagtac 4020 atttaaatcc ttcacccttt gtatctctct tcctgttttt tgttttgcaa tcaacaaaaa 4080 aaaaagtaaa aatcccatct taaattcacg caaaaaaaca cattgaatca accatcacta 4140 tagtagtttc aagaaaaatc tgcacttcca taatttcttt ctattacacc attatactag 4200 gaaaacttca tagcaatatt atctaaatac aaagcaattt ttactagtaa tattcgtaga 4260 tttgtcaata tatagtgtcc taataaagaa aaaataacgg aactataatg ctctaatagg 4320 tagatttttt ttagtataat gtcctaataa gagaaaaaac aaatgtacaa ttatgtaata 4380 ataagaaaag aaagtaatat gcttaataga caaataaatg aaaccatgtt gctatttctt 4440 gcatctagtc cttatttgaa taatatgtag catattaact acttatgaat tttatatata 4500 aatgataaaa aattccgtga g 4521 <210> 10 <211> 19724 <212> DNA <213> Taraxacum officinale <400> 10 ctgacttggc caacattttt tgttcttccg atcccttcgt aacaatcagt ttaagcacaa 60 ttgaattata tggagataaa taggtgaaat ttggaagacg aggatgggag agtgcgaaga 120 gccaaagaag agaaatgtgg gatagcggcc ggccggttgt taatagaagt gcttagatct 180 tggagacctt ctaatgctta tggaggaacc agatgcttca atttgtaaat ctgcgctgcc 240 cacgtagaat attgaaaaag aaaatcaaat cgatcaataa tgcgaccata tactttagga 300 tttcccactt gtataattct cttattcatt ttcaaatctt tatctaaatt aaggatatcg 360 gcaaaaatat aatcctaatt gtttttcaaa atgataagga ttataaggta acttaattct 420 tgttttattc atatttaatt attattgttt tttatcaatg ttttaaaacc cgggttttga 480 gtcaacccgg tcttgtgaaa aatcccgggt cagccggtca gctgatctac cggttcaata 540 tatttaaata aaatataaat tttcatatag aatttgagtt ttaggctaag aaaatcgggt 600 tttgggctaa ggaaaatcgg gtttaagttt tgggctaatg gattttcggg tcaataacgt 660 ttttttccgt tttttagatc ggttcgaccg cgttttgtgt gaaacccggc cgggttgatc 720 cgagtcaata attggcaaca acccggtata tgttgacccg ctcttgtccc cgggtcccgg 780 ttcaaccggt tggatcggcc gggttgaccc tggttttaaa acactgtttt ttatacaata 840 tatttgtttt tgtttttagt tttgtttttg tttttgattt tgtagatata tttttaattt 900 tatttttatt ttgtataaat atagtcatta caaccgatta tttgtaagtt gagtcggtca 960 aaacgaactt tctgataatt cttatacatt tttcggcgaa acatgaatat tttgatcaac 1020 caatatgctt ttttctaggt tttttaaata aaccgcacgt tcaattgcat attcgcaaac 1080 aatagaactc gaaaacccta atcgagcttg ttttatagaa atctgggttg agtgcataca 1140 taataattaa taactgtgaa aaagtttgtt ttaacatgct aaacctatcg atagtcggtt 1200 ataataatta tatgtaaaca aaatcagaaa caataatgat atatgtcacc caaaaaaata 1260 gttactaaat atatacaaaa tcaaaaacaa cagtaatttc ttttacaaaa aaaagagaac 1320 aatagtgact aactttagaa agaaaaaaaa agaactaaat tactcttata aatcattatc 1380 ttttatataa attggtaaat tggtcatgta atctagaatg tgaattgcgg aatgctttag 1440 tcacattttg aacaaactgg taattattaa tttcgataaa agttcttcaa gaatagtttg 1500 gtcacatttt ggacgacaat ggtgtgtttt ccatagtaag caatacgtaa tgagttcgct 1560 taataggaaa atagatctaa agcttaatga aatcatatgt ataagtaaca tatatttttc 1620 acacgttaca ttgtttgtaa cgtcctcaat ttttttaata tatataacta ggtacactct 1680 aaggtcgtgc taagcacgac ccacgaatgg taatttaggt aatttttcat ccttgactaa 1740 aatacattat gctaataaca aagaattaag aatacaatgc tataatgcat aagtaaataa 1800 aagtacatga tatttctcac atttagtctt tatacataga aaacttacac tggccatttg 1860 caaaaaaaca ttaaatctcc ctaaaaagta gagtttacaa aatgaaagct tgtttttata 1920 gcaaacaata atcaatatgt gaagctatag tatagtaacc tactcatttc aacttttagg 1980 cagtgcagta attacttact catgttaatg gtgaaatgca ttaagataaa cttcattcaa 2040 cggattaaat ctgggttcat tataaatgta ctcttagtta ctcctccatg taactgcatt 2100 tagcgaacaa caaaagctct aataaataat atgaaacaca tgctaattta taaatgacat 2160 catgggtata gatgctgtaa catcctaaac ttttaaaata aataataaat catatttggg 2220 atttaaagta atattttaag ataattgata aataagagaa tgaaatacaa agaggcattt 2280 tatttttagc ctttgattta taaaaaagaa aaaaccttga aattggatgt attttgaaat 2340 gggtaagtat tttaaaagat gtgtaagtta agggggataa atggaaatta aggagataag 2400 catttgacca aagtcaaaat agaaggaaca ataagtcggt cgattgtttt cctgtgtgca 2460 tcttcggacg acagagagac agaaaagaac gagcgagaga cagagaggaa tcgagacaga 2520 gagattatcg agagagagac agcgaagtcg ggagagggag accgagaacg accgagacag 2580 gaggaaaacc gagagacaag gggaggacga ggcagcagca gcctaggctg ctgcgttttt 2640 ggcgacagaa aaccaccgcc agcggcggtg gtggtgagcg acggtggtgg tggagccgag 2700 aaggggttgt ggtggtgtta gaagtgatgg ttcatctcaa tttcttgata atttgccctt 2760 ttggaacaat aaattgaagg taactttcaa agctttagat gattatctct tgaaagtaga 2820 aagcaagggt aatttagtct tcaattatgt tatggagaag ggtaataaca cccaaatgct 2880 aacaaaatca tatagattaa tgtgatttga agttatatag ttcatgaatg tgaaggttga 2940 ctttctgcaa tggtcaaaca tggacatgga catgattata gcatattagc aatgtaatag 3000 gaatggaatc accaattcca ttgttgaaaa tagaaaattt gatgtgtgca gaattttgta 3060 aaatttccca aaacaccaac tttaaggctg cataagtcat gcatgaagaa tgcaaatcag 3120 tccattcttt cgcctaacat caagtccttg caacatagat tacacaggaa aaagaaacag 3180 ccaaatccga gttcgtatga ggattgtatg actgttcaac gtttgtcaaa agttgctgtc 3240 atgctgtcaa accagaattt ttctaagtct gggaaatatg cagaaaatgg gtttgaccag 3300 tttttggagc ttcataactt gatttataca tatccaaatc agttgattct tgagcctaaa 3360 ctgtagagaa agatgaggag aaggcatagg aaaaagaatc aacacatttg gatatcgtat 3420 acaacctgtg caaagggttg aagtaggctc aaaacccatt tttgacataa ttgtcaatta 3480 tatgaattgt gggtaacttt tgccgtaatg aaatgttttg acatataagt gtttatattg 3540 acttataaac atgttaagac tataaacttg ataaagtaac atgtcaaaac ccgaaaatgc 3600 ctatttaggc aaagtatgat gcttaattga gaaatcggtc aaatagcata aaaactaaaa 3660 gtgttctaaa tggtccaaga agactttata cataacttac acatcattag cacatgatgt 3720 gtagtacatg tgaggtttga acacttttat acttggaaaa ttgtcaagta gtcaaaaatg 3780 ggacaaaagg gtaaaattgt ccaaaatgag tatatggcta attaaagcaa gttgagctac 3840 tgaaatgaac ttagataagt attataagga ctataaaagt ataatacttg gttaactatg 3900 agttttgaag gtaatgtcaa tttaaagtaa gttaaccaaa agaaagtaag ttgctaattt 3960 tgggatatat gacccaaatg agttatgcat tggtttttag gttgtgtaat acctataatg 4020 agatatgaat tgattatgag acatgtattg atgataatac aaatgatgta atgaaatagg 4080 ttcgttgcct atcgtggagc aaggagcatg cggattagtg tagctagtct tacctagcta 4140 ctaaggtgag tacgtgtgga ttgttttccc attttcgggt acatggaaaa ataatatttt 4200 tataatgaag tgcctaatgt tttgaaagaa agaatgaatg aaaatacttg atgcttttga 4260 aagaatgttt taaaagaaag taatgttttg aaagaaaaag gtttgatgct ttacgtttga 4320 aaatgaatat gtcttgatat taatgaatgg aatgggtaaa gcatgaatga tataatatgt 4380 aataataaga tgctaaggat ggttatgttt atgatgttca cgtgaatata agaatgttgc 4440 tcgatctaag atgtcccggg tagggattca gaggagccta tcggggtggt acctcccctt 4500 cgcgagatag gttacctaat gtaaatgatg tcaatgtaat ctgatttgtt ctttttgcat 4560 tggtacagac ttggggtata tcagacccaa gtataatatg atatggccat atgataagat 4620 gattaaaaga gtatgtgaaa tgttaaaggt tatgtaaaat gttatatgaa attattcaaa 4680 gagatcttta tggttattat gtctatgaaa aggaagcata taatgttata gatattttat 4740 gtctaaaccc acgtagctca ccagactagt tgtctgacgt atttattttt atgccatgta 4800 tttcaggtta tacacgagga tagactgatg atcgatagaa gctagatgtt acgacggata 4860 gacggagtgg agctttcaag ttctattgta atgatcttac cgtaaattct tatttgcttt 4920 gctatggttg ctgtttgata tataattggt aacacccgag aattgtttta tatatattca 4980 aaaagttttt atttgggacg gtttttgtaa acatgaccaa gtgtcatgaa atatttttaa 5040 aaccatagcg tttttaaaac gataaaatga ggggtgttac agatgcgata atatatctta 5100 ggattatgtc aaatatttat gccaattata catgagagag caagtttata agagttttag 5160 ttattctatc attggatcaa tatagatacg tattaatagt agacagagat gcatgaatat 5220 tatagcagag aactttttgc aaaacctaac ctcactgcat gttgcattca tcaaccccac 5280 ttgtagttgt aacaccatga atatgccaat taagaaatat catgaggtat attgtactgg 5340 aaatgacaaa aagtactaat ttacaataga acgcagtcaa acttggttat tttgtaaatt 5400 ttaagaagca atttacaaaa aataaaacat aataaagaaa aacataacag taaatcacag 5460 acattgctca tggaagagtg actgatcaaa ctgaccgttt attttcttgt ttcttgtaca 5520 actaccaaac gttcctgtat aaccaccaaa tagtcccaga ctttagaaaa tagaacagaa 5580 aaccacagat atacatacat acagccatac attataattt ttaattgaaa aaaatgcata 5640 gaaaaccagt ctcaaataaa gaaccaaata aagaagatac aaatgaaacc tggttatcga 5700 ataaaagagt tagagataat gatttcagca tttgcactca tgtaaacgat atgccattgg 5760 gatccgttgg aaagggtatc gtgaagtgat taaggagaag cggggtgtta gggttttttt 5820 tgcagtttat tgaacaggtt gatcaaattt tgcgccggta gggttaattc cttttcgaac 5880 gggtttctat ctgggtcttt catcaaaatc actcatgttt gtgtctctaa cctttagttg 5940 cagatggata tcagatcaac ggtttcaggc taaatggggg aacaaataac aagaagaaag 6000 cggtgacatc tgtgttcgta ttcgtatggt ggaaggggaa gagtggcgta tgaattggtc 6060 aatgtaaaac atctggaaac aacttctccc aacatgtaaa aggatccgga aaatatgaaa 6120 atgacgatta gagatttcgt tcggatattg ggaatatggt cgcgtctgat tgccctacgg 6180 tgcccaccgt ttgggtttct tgatttgtcg tttagataga tgtcggaggt ctaaattcac 6240 aatcctgttc ttccgcggta attgaaattg ggtaaggcta attgtttaga tcaaatggca 6300 gaggacgatg tgaagttgcg ttgccctata attggctctc gtgaaattga attgcaaatt 6360 tcacaacgat gttagcaaca ataatcgtcg ctctcgcatc ccataccgtc gcaacgtatg 6420 atggtgatcg agattgagag atttagggct agatgtggcg ttggcggaca taggttgtgg 6480 ttgacggaat gaggagaaga cgtgagcgtc gattgaggta gcaacaggcg gagggttaac 6540 ggtgtcatca tggtgaaagg tcgcgcgtcg ttttatggtc gatagatcat ggacgttgtg 6600 agtgaatgcc ggcgcaaaca cggtggagga aagtctatgc tttagttgac ggggcggttt 6660 tctctcggag acggaaagag gacgtcgaaa gaaaggccgg ttggagaaaa tatattaaac 6720 gcgccgacac acgctatcag agaagaccgg ttttcttata taataatgac taggtacgtg 6780 caagggtcgt gctaagcacg acccatggag gcttcttgag aaaattgtaa acacatatca 6840 gataatagcg acgaacttta ctgttattga tatataaagt gattaagcat ggttggccct 6900 aagttaaaac tcaaactact gtaagtatgt aatggtaata atttatcctt ttcagctatc 6960 gatcttagat tgctctgtag tgttgtgtct tagtgctttt cacggttctt ttatatgcat 7020 atagtcacat aaaatcagac acacacatag aataacccac agacaatcac ataaaaatca 7080 gtctgatgag gtattaattt aagcaataag gattgatatt caagcaatta gaggagaata 7140 atatattaat ttcacgtact cctattgtag ttattgtgac aaaacccaac tgtttaattg 7200 tgccattgca aaaagtccac ctgtttaatt tctttatcaa catgtcgttg catcctttta 7260 catgcaaata tttcagaaca tcttcctata atgacccttg agatgaactt tttagaaata 7320 ttgttgctgg ttacattatc agaaaaaaca gagcttatga aaaaagacca aacatagtaa 7380 ctcgtacttc atgtctggta gttcttttga atatttccgt cttttgttcg aaacaatttg 7440 gttgaactgt agtagatctt tcaaactgta tacaacttca caatatgttt tgtaagttca 7500 ttacttctag atcctttcaa aagaagaggt caaactcaaa atttgcataa accagattta 7560 ttgaaggcta attagattag tgttgtaggg ctttttggat ataaataaaa atgaaacata 7620 ggtgctgcaa caggtgcgaa agaatttggt tggacagtag taggtctttc aaactgtata 7680 caactttaca atatgttttg taagttcatt atttctagat cctttcaaaa aaaaggaggt 7740 caaactaaaa aaatttctaa accagattta ttgaaggctg attagattaa cattgcaggg 7800 ctttttggga ataaatataa atgaaagata ggtccaacag aaacgaagga ggtgtgaatt 7860 atgcaacaaa tggaaacaca caattatcgt agtacacatg taattaacag ggatcaattt 7920 ccatttattg ttccatcaat tgccaaattt aaaagataac aaatgcatcc tttttgaatg 7980 gaaaagtatg atacataaaa ccagagagag gtatacattt agtccagaaa cggtggaaat 8040 tactttacct agagttgcgt gaatcaaatg gaaaatcaga ggaagagacc ctaaatcgca 8100 atccatcttc tattccctat agaatcaaat ggaaatttct tacttccgac ctttttcatt 8160 tccacaagtt tgtaatcgat aagatcataa aagaaaaccg atttacatta gcaaatcttt 8220 aaggcacttg tttgtagttc tcaagtatgc gttacgtatg aaattctaga cagaaaaggg 8280 acgacaggga aaataatggt ggaataaata aacaatcaag aatcaaaaga taataatcct 8340 taaaactaac aaaaattcta tcaataagcc ctacaaatga gaaatatgac ggtggagact 8400 cacctgattg cagtggcgga agctcttggg ggctttggta ggccatggcc ccctgttttt 8460 tggaaaattt tcaaaaaaaa aaaaattata tatattatat cattgaataa gtctagactc 8520 aggaaactat gaaagattag aaatagatca agttatctaa atcaaatctc gaaaaatatg 8580 gaaggaatca aaacacaata tttatctcat tgtgaaatca aaaaccctat aaaaaacaca 8640 aatctaacct acaatttaaa tcaaaaacac cataaaaatc aacctaccgt cggattcagc 8700 cgtcgtcgtc ttcttcaccg gaccaccatc caccgccatt gcttcaatcg tgctttctcg 8760 tcaatagctt agtggcttgt tcagctttct tgctctacca atgattttta tacactttcc 8820 agcaccaccg atttgttgaa cggtaatatt atgctccttt atatttttga aatctttgaa 8880 agttcatctg gttttctgtc tctgtaaact gtaaagaaac ttttatgttt tgttaagaaa 8940 atagagagat agagaagaaa gagtattgac gtgcttttcc catatgtctc gaatgccaca 9000 ttaggaaaag acaaaaagaa aacaattagt acattacgct agtgtgatag tactgtatga 9060 ctattagtat gatttacagc tttaataggg attcatagaa aagaacaaaa taaactactt 9120 ataaattaaa aatcgagctt tatttttaat tagtttaaat aaatatttag ctataacata 9180 atatattata tgttttgtat ttataatcaa atataattat ttgtattaca gattagtttg 9240 tataatcaaa tataatgatt catgtttcga aaagattgtt taaatatttt tatatgccat 9300 gttttttaac tgaattatat ttttttgtat gattttcttt acaatttagt ttttctttac 9360 aatttagttt tggcccccct tgtttttttg tttgtgttcc gcccctgcct gattgatgcg 9420 agaaaaggaa agccgccgac atttgtgctt cttcccgcgt taagaaaaat cgcagatgac 9480 attacgattc tttttctaca gaggaatagg ggggttgcga ctttgcgtga tttgttgtta 9540 atgagtgatg cgtcgtccgt tttgatcggt agcccgtgga gactgattta tttgacagat 9600 agatgtcgtt ctcgttgatg atgcaggtgt aattggcggc gttggtgaag cgaagatggc 9660 atagggaatg gctttgcaga ggagaaaagg agtttcacaa atatggatta ttgaatcgtc 9720 gtttcagagt cgcgatggtt agtaatcgat ggatttgggt ttgcacctgt tcaaggggtg 9780 gtgacgtgtc ttactgtaag aaagagtcgc gatggttagt aatcgacgat ggatttgggt 9840 ttgcaacatc gttgacggaa acgacgcggc gatggagaga ggcggtagag ggaatgaaac 9900 gggagattta ccttcaaccg caaacatgtc ttcgttcctc gaaaatcata tgcgcccttt 9960 atgaaaattc cttcacgcgc cgtacacgcg ctcagaaaaa acatagggtt ttcttatata 10020 ataatgacta ggaacgttta tgcgccgtga taatcacggc ccatgagtgg tacaaatgtt 10080 gtaaaactta gaaaatggga aagttgaatg tacaatgtta tgatttattt tattcttcat 10140 agcacaatac ttttgcttta gtgaaagcag ttaaaaagtg gatgtgtcgt tagcaactat 10200 aaacttttaa caaaatatta catacagaac atagaaataa gataaacact aaaaaaatac 10260 aaaatagccg tgttcaacac ggcccacaga atgcaatttg gatatttcta aggaggtgta 10320 aaaaatattg ctattatggg agctaattct aggtatattt tgttactcac atgacatgaa 10380 tattgagtaa ttttgtaaaa ttggtaattt agcttagatt ttcccacaaa gatgagtgtt 10440 aaaactatca aggaggatat atggtacttc ctcaacaaag atgattttga aatatctata 10500 ttttaaatgt aagaactact atcacatgag acaaatattg atattactgg ttaggattac 10560 aacattgata tgtaaaatat tttggtaatg taaattttct aaaaaagctt ggaagtagaa 10620 tgcaacaaca atatatgcta gtattacatg ttgggtgatt ttatgaatgt acttacgtgt 10680 tgatccttat ttaccgtact tgaataattt tatctgatca atgctttacc tatatggcta 10740 tatctagcaa tgtgcattat tcacaaatta tggagtgtaa attcatatag acgtatatga 10800 cagtggatga aaaggaaaac aagtaatttg attgaatcac tgagaaaaaa gcaaaagata 10860 catgcatata aaatgttaca tcaaaataca gaagataaat gaaagaaaga taataatgtg 10920 gagcattcaa aataagtaag aatgtaagtc cttgatagct cgaaattctt ttaagtcttc 10980 cgtgatagcc taatgtttat aatagaagag acattcaaaa tgaataagaa ttatatcacc 11040 taacagtatt taatcctact ctacttggcc attgagcata ttgctattgt taaaaattat 11100 gtccaaatcg catttaactg ttagatgcaa ttctcattgc cgattacact tatatgtatg 11160 tagtaaatta taattaactc tttgtcctgg tcatttgatg tgtcatggat gtttgtaagg 11220 tacaaataat agattacaat aacttaaata taaaattgag ttaatattcc agaattcaca 11280 aaatgtgtaa taacacttat ttataatttc cacgtaatta atgattaact acttagaatc 11340 ctacaagttt ttgtttatca cctttcatat gatcgtataa atgcaacaac ccttaatgca 11400 tttatagttg ttggtctgcc acgaacacct ttttctgttg attatttgtc attattatgt 11460 taaaaaatgt ttgaaaaatg ttaaatggga ttttgttatg gcaaagagat gaacttctcc 11520 aatattgtag ttgcataaat attgccagtt ccatcataca gaataatacc tcttatattg 11580 ggcaatagaa ttatagaaac aataagggtt aaccgactta catgtattga tctctgattc 11640 ttctttacac actggacaaa ttagtctatc atgtcttgca caaccctgtt aaagaaaaca 11700 gtgaaaattg accacgaagg tgtatcctct agtaccaaca ttacatctat cattttaaaa 11760 gggaaatgta tacttatcat atatatctaa tggacgttgc ctttcctcca attgtcactc 11820 ttacatctaa tggaaattat gatcacaatt tacttttaac agcatagata cattcatttg 11880 ttggtaagac acttttggcg gattcattgt attaatcttt catgtaaaaa ttctcattca 11940 agatattagg tttttgttag aacccttgtt atttgaacat gcaacctgaa ttctgattgt 12000 tcccaacacc aacattaata atacctcttc cactagacca tcattccacc ttcaggccct 12060 tgtgttcatt attataagca ctattcggtt tagttctttt atgagtccta tatttacatc 12120 cttaaccatt ttaacaagtc catcatattg ggaattttaa tataaatacc caatgttatt 12180 catttttgtc gcttcagtag atattgacca tactaaagat gagtatttaa tactcataca 12240 acatgaaaga aaaaaatgaa aaactaacag tcacttatgt agccccaatc tccatacaaa 12300 tagcgcttta agaataaacc aatttcaggt gaaattgtag aaaggacata aatctgtaca 12360 tgaaaaaaca ttaacagtta cacataaatt atttgcacag agataaaaag cacaatatgt 12420 gatgagaaga tttaaaagta ggaaagtgaa caaaaataac catcaaaatc caatgttagt 12480 aataaagaaa atgtacgagc gattcataac attcatccaa aacccatatg cgatgttgaa 12540 tgcatatctg gataaaagaa tttaataaac aataagcgcc tgtaaaatca ataaacaaaa 12600 tcaataaaaa tagacctaaa aatgcaaccg acttattgtt tctatacacc aataaatgat 12660 tttcacgaat tttatccaaa gaaagataaa aagtcataaa attgaacggg cttaccgatt 12720 tgaatcgtgg tctgtatctg ccacgcagat cagataacaa tcataatcta catcaaagat 12780 ttcagaaaaa tatgaaactt ccgccattac taatttgata tgaatttctc agagcctaaa 12840 acaaacctaa attactaaaa atcaaacaca ggtttttgac gtttaccttg atttgtgaaa 12900 ataggcattt gggttttttc gtaggatttt ctatgaaaga agccatcaag tttatgacat 12960 tgtaaattaa agcaaagtat gaatatatga aggataggaa aagagatcgg attgtgatga 13020 tccggagaga aaaatacaca aaccagagag aagcgatgtt gtgattgtgg tgtattaatc 13080 tgtttttaaa cctctaacca cttcttgtaa gtccgtaatc agacgaaatg cgcttgaata 13140 ataagtcttt cacgccagtg tcgaggatta atgccgtcaa gggtggtggg gaggtattta 13200 taggaagaaa tgcggtggag gtgaatggag gcgtcgatca aacccaagag gaaacggttt 13260 gtcgaaatag atgcgttggt cattcgccat aagtttgtga aacggtgagt gtatccttgg 13320 cgtcgtttga aagtttgtga aacggtggcg atgctccgtt aaaggaccgg caacggatcg 13380 agcgatatgt aaatgggagg gcagaaatat tgcatacgcg ccggacacgc gcttatggaa 13440 gtgatagtat ggaagtgata ggattttctt atataataat gatataactt aattttaaat 13500 aacatcgtac tatacgtttc aaaataaatt agagttttaa taaaattacg gaatgattaa 13560 accaattaca aacaaatata agtgtcggtg atataaaatt tgtaacaacg aaaacatttc 13620 aaaaaatctg aatgcggaaa tccataacat gagaatacga ttcgtttgca gtcacgccgg 13680 tttcttcacc ttctgagggt cctgaaaaag gttaataaac aatgggtaag ctaaagttta 13740 gtgatcatac acattacttg tctattatat gagttagata cattcacata tcacatacat 13800 acaagcatac acatattaca aaaaatcctc acacatattg ttggtaccaa ctactattta 13860 gtggaccagg ttattcttgg gggtcaattg tggttaacca taaatgtttg gagtttaggt 13920 tccccttggg ggccgaccat aaacacccat atcatatctc tgtctaggtt ctctttgggg 13980 actgactata gacaactttg ctcagattct ccttggagga taaccatcct cgacgagatt 14040 aacaacggac caccactgtt ttcagcttgt aacctgcaac atcaatagtt gcgatcttcg 14100 gcgacaatga tgaaccaaca tcaacacaac agtagtgccg gtatgttagt cgttggataa 14160 tagaggcatc atctgaccct tttagcggtg acttttgttg cctatgaagg tcttatcagt 14220 tatatatcga ttaggcttgg ttctaggtta taagaaaaaa tgattctcta tccggtatga 14280 catagagaca aaccggtcta cttttataag aaaatcatat ttgaaacaat gtcgtgttaa 14340 taattaatat gtgtatgttt aaatttagaa tatcctgaac ttatatttag ttcgcaaccc 14400 tatgtaagat cgaactaatt ttaaaccgta accagacgtg catgtttgat cagtaataaa 14460 aaggctatca tcgtcgaaaa tattaaaaca aaatataata tcttatttgg cgccatttca 14520 tgtcaacggt taaaagcaag ttatcaacgc ctccaaccga tcatttctcc ggtaaccacc 14580 aactgctact aataaccgcc accgcaaaaa cctatatata caacttccat cacaattctg 14640 tcccctactc ccatttcaat ccaaaaaagg ctacacagac atatacagcg atggcagata 14700 atggcaacac cggccgtcaa aaggatgacg acggtggcca tgatggggga cgcccaaatc 14760 cgaccacccc accctcccct tcccgcaccc cgcgaagacc caggcggacc acatcgccgc 14820 ctaaacattc tccgggggcg tcttcaagca ccatgccagc gccgcctact ccccctgcgc 14880 cgacgggaat caccggtgcg tctagttctt ctgtgggtac taatataatt tcatttactc 14940 cacccaaaac caaaagaacg aagtcggtga tttgtccgat ctgtaagaaa gatatgtgcc 15000 atgagaaggc gctgtgtggc cacatccggt ggcatactca ggaagaaaga ttggcggcca 15060 gcattgctat agcaagagcg ctatcttcta acgttgttgt ttctggcaat ggcgatgaag 15120 atgaaggtcc atctaaaaag tataaactcc cggacctgaa caagtcacca ccgccggagg 15180 aggaggacga ggacgctgcc tgattttctt gcgggagagg catgtatgtg tggccttttt 15240 gcaataatac tatgcatggg agatgcataa agtttatctt tattttgttt tagtttaata 15300 atgtgtggca aactttatat catttatgat ttcggccatg tactgctaca tcgttctagg 15360 atggttattc cctagaattt gcttttatat attttttttc ttcgttaatt cttctcttcc 15420 tttaacgtta tttcatgtga atttgcgata tcatgatatt gcaggaacgt aacttagaac 15480 tcaacgataa aaagtgtgtt gagatcgtgg aagttgatcg tttatcttga attcacaaga 15540 taagcaacat gagatagaat aattaattac tgcggagatt tctttttaga ttcatcttat 15600 tcgttgtaaa ttgcaatgca aatttttaag tagaataacg aaagcgtgtt gttatttacg 15660 gttaaatgca aaaaatcatt aacatatctc cataattgat ttgtttagta tgcattctca 15720 tgtgttctat tgcaaaattc tattttgaaa ttcaattaaa gcaatgcatt ttagatataa 15780 agcaattcca tcacttaatt atattgggta gatttttacc aaatcactgt cctaaaagaa 15840 aaataaaaaa tgaaagttca atgccatagt gatcccgtca attatgtgat caatttttac 15900 cagagcaaaa ccccaaaagt taaagagtat aattgcagaa cgacaacaat ctgaggatga 15960 tactaactcc ggtataaacc gaatgctttt gtggggattt cactaatcaa ctatttggct 16020 ctcatcacaa ggccgtgtta atggattact attagttata aggccatccc aagttgtttg 16080 gctatattat taccttttaa aaaccaaaat gtgtaaactg taaaattaca cttttggttc 16140 ttgtattttc taatttttag aattatgtat ttggttcttg tagttttttt atttgtatga 16200 atcatattag ttttggtcca cgataacttt tattttctat aattacactt ttggtcattg 16260 tagttttaat ttgcaagaaa aaaataatct atctttttag tccatatata tagtttgcaa 16320 tattctatat tttaggttca ggttatatat cttttacaaa aatactactt atgatttttt 16380 aatgaatata tcatatttcg taaattacat aaacatttta tataatttta tttagtcaga 16440 actataggat tcgcatgata actttgctga acttaattgg gcttcatttt taacaaagga 16500 taatgcatca tgcatgacat aaaaatttgt aatgtttcta atgtgcatgc actacaagaa 16560 cctgaccctt catatacatt aatgaatgat tctcttttct tattatatct tagcaaacgg 16620 tttggataag agtctgaaca atattaagaa ttgcactagc tagctagtcc atgcagcaag 16680 caaattaatt agaggacttt ttaagaggct tgatcacttc attgtatatc taatggcact 16740 gtggatatat gattggattg tgtgtatgta tggaatttaa tattactaaa aaatattaat 16800 gacaaacaat aacacactaa tttataactt acaaaagcgt gtgtcattaa agaaaatgtc 16860 atgtttctta aaatatggag aatttactac ttacataatt atgtgtcata aatttatgtc 16920 atcttgtgtg atatttatga cttacaaaaa tgtatgttat gtttatcgtc ataaaatctg 16980 taaaaaaaaa tagaaacatg gaggatactt tcaaggtgta gaaacttgac agcataaacg 17040 ggtttattac cttcatcaaa acttatctta cttcaatctc ttggagatgc aggttgattt 17100 taatgctaaa tgaacttttc aaatgtataa atatatatct tttgacggat ttgacattga 17160 tggagatgaa gatacaccag tgaattcacc tttcaatgat catactgaca taccaagtac 17220 tcttatcccc tctccacctc cacagaacga acctcaattt caaaaacgta actgccgctg 17280 ttctaaaaac agaaaatttt caaaaacgta actatcattt aaatatttaa tcatttttca 17340 attggattca tgctgtaata gaagttactg gactttaaac ttcttgtagc tgatgagatt 17400 catgaacaac agtccaagga gattttccaa atcaacaagt ttctgatgag aacaaggtaa 17460 aaaaaataag tttttcattt aaacatatga ttttggtttt caaaagataa ttaattatag 17520 gaactcttct gaaaagtccc aaagtttacc cgtaaaattg attttggttt ttttttaaat 17580 tgaataaaaa agtccataaa attggataaa ttattcgatt tagcccaatt tacctagtat 17640 atctggtaaa aattggttaa atcgaataat ttaggcagtt tgttgggctt ttttgcgcaa 17700 aaacattatt ttgggactta atcgttaatt ttccccaagt ttcagtttat ttacagtatt 17760 ggaataaaac cgaacctagt gcgctaattt tgtcttttgg tgtttagaat tatttgggtt 17820 tattggtctc ggtttctaaa cgagttcggt ttttggtttc ttgattcgat ttttggcttt 17880 tgggttcaac ccatggattt tcgatttggt tttggttttg ataatatttt ttgtgcaatc 17940 gttcaaaaaa tccgagttag attgggttta aatgttatca aaaccaaaac cgatggtaga 18000 accccaaaac tgaacccaat cgaaaatcca tgggttgaac ctcaaaaacg aacccaataa 18060 attctaaaaa ccaaaatcca aaattagcgg ataaaaattt taaaatacat atctactggt 18120 aaggtgtttt tgacaattta tgtaaattat agaaaaaaat gtattaagtg tttgctattt 18180 aagataaaaa tggcgttaaa aatagaattg gttagaaatg aaccattttt ttatattttt 18240 tacttcattt attaagtaaa tagtagaggt gaattagaga tgatctaaga tatttttttt 18300 ctttcaaaaa gagcttcgaa aacacttttc cgacagaaac aagacacaaa cctttttact 18360 cgtagaccga cgattttttt aaagatcaaa gacctaagaa gatttgtctc ccatcttctt 18420 aaaacatatg tgagatagac acttctagcc tcttctatgc taaaaaaaag agctcgcctt 18480 tagtttggtt aatttgagac aatggtctcc acaaaaacat aggtagttag gtactcacgc 18540 gccaagttac taatctcaaa tcaaacataa ctgtatgatc gtcaacacat tttacaagtt 18600 aacaaaagag cattgcttta gacttaaaaa ttgctttgag aaaaaacaaa cacctaagaa 18660 tttctaaaag cgatgatttc aactctcttt aaaatgtata tatatgttac attttggtct 18720 ttaaactttt caagaaagta caattcaact cctattttca aaatgttctt acatgagcga 18780 tatgatttta ccgtttaaaa tgtaaaccat gataactatt tctaaattcc aatttttgtt 18840 tcgttgatca atctcattat cattcaatgc atacaaaaca caatacaatc tgttttgtca 18900 tcttcttcaa ggccgaaaga caactaaaca tatgaagact gaagaggaca atctagcaaa 18960 ctcaaacttc actataaatt tgcaattgct attggtagcc atgaagtaac atttttgagg 19020 aggttaacaa aattttaaca gtaaattcaa taatccatca ccacgatatg taatcatcta 19080 cacaaacaca gatgatgata gtcatatatg ttcgtaatca cacaagcaag aaatcgcaat 19140 gtactttaca ccgtcttctc tgacttgaac acgggaattg gttgtctaag aagtagattg 19200 tttcccacgg atttaccaag tacatttaaa tccttcaccc tttgtatctc tcttcctgtt 19260 ttttgttttg caatcaacaa aaaaaaaagt aaaaatccca tcttaaattc acgcaaaaaa 19320 acacattgaa tcaaccatca ctatagtagt ttcaagaaaa atctgcactt ccataatttc 19380 tttctattac accattatac taggaaaact tcatagcaat attatctaaa tacaaagcaa 19440 tttttactag taatattcgt agatttgtca atatatagtg tcctaataaa gaaaaaataa 19500 cggaactata atgctctaat aggtagattt tttttagtat aatgtcctaa taagagaaaa 19560 aacaaatgta caattatgta ataataagaa aagaaagtaa tatgcttaat agacaaataa 19620 atgaaaccat gttgctattt cttgcatcta gtccttattt gaataatatg tagcatatta 19680 actacttatg aattttatat ataaatgata aaaaattccg tgag 19724 <210> 11 <211> 227 <212> PRT <213> Taraxacum officinale <400> 11 Met Ser Thr Val Lys Ser Lys Leu Ser Thr Pro Pro Thr Asp His Phe 1 5 10 15 Ser Gly Asn His Gln Leu Leu Leu Ile Thr Ala Thr Ala Lys Thr Tyr 20 25 30 Ile Tyr Asn Phe His His Asn Ser Val Pro Tyr Ser His Phe Asn Pro 35 40 45 Lys Lys Ala Thr Gln Thr Tyr Thr Ala Met Ala Asp Asn Gly Asn Thr 50 55 60 Gly Arg Gln Lys Asp Asp Asp Gly Gly His Asp Gly Gly Arg Pro Asn 65 70 75 80 Pro Thr Thr Pro Pro Ser Pro Ser Arg Thr Pro Arg Arg Pro Arg Arg 85 90 95 Thr Thr Ser Pro Pro Lys His Ser Pro Gly Ala Ser Ser Ser Thr Met 100 105 110 Pro Ala Pro Pro Thr Pro Pro Ala Pro Thr Gly Ile Thr Gly Ala Ser 115 120 125 Ser Ser Ser Leu Gly Thr Asn Ile Ile Ser Phe Thr Pro Pro Lys Thr 130 135 140 Lys Arg Thr Lys Ser Val Ile Cys Pro Ile Cys Lys Lys Asp Met Cys 145 150 155 160 His Glu Lys Ala Leu Cys Gly His Ile Arg Trp His Thr Gln Glu Glu 165 170 175 Arg Leu Ala Ala Ser Ile Ala Ile Ala Arg Ala Leu Ser Ser Asn Val 180 185 190 Val Val Ser Gly Asn Gly Asp Glu Asp Glu Gly Pro Ser Lys Lys Tyr 195 200 205 Lys Leu Pro Asp Leu Asn Lys Ser Pro Pro Pro Glu Glu Glu Asp Glu 210 215 220 Asp Ala Ala 225 <210> 12 <211> 3217 <212> DNA <213> Taraxacum officinale <400> 12 gttgaaagga aggatcggca gagaacaaga ttgagagagt tttatcgaag agaagagatg 60 gttgtgttga ttgacggcag agttcagcaa tggcagatat gcgtgtttaa agcgcagttt 120 gtggacagtt tgtccaaagg ccttcaagtg ggagattgtt gagatgaaga cccttttgac 180 caagtactta aatgtgattg gttgcatggg aaagagcttt acacttcatt ggttgaaaat 240 gaagcatgtt atttaatagt acgtctccac ttgttcttta tgaaggatga agacagccac 300 caagtcttta tgaatgtttc aaggagaaga caatgattag atgctgcctg ctcccttact 360 tcttcactat aaataggtgc ttaaggcacc tctcttctta caccaaacaa cacacaagtc 420 acagattaca aagattgaga gagttttcat tttctctcta gagtttgttt tgtcaaaagt 480 tttgtgtgca gattaattag ttgagagaca ctcctaatta atataaccac ttacacttgt 540 cattgattag cattctagtg tcagagagtt ctgagtgatt gtaacctttg tgtgatttat 600 atataaatct ctctcttgtt cgccagtgga cgtagctgat tatcctgatc agtgaaccac 660 ttaaaatatc gtgttgatat tatttatctg cagattattt taccagatag ttttattccg 720 caccgcaaag cataccgtcc attatttgtc agacgtacct actctcagct catcccagca 780 ggagttagac ctgcaggcag ccagccgtat ttcacaacag tgaattatgc aacaaatgga 840 aacacacaat tatcgtagta cacatgtaat taacagggat caatttccat ttattgttcc 900 atcaattgcc aaatttaaaa gataacaaat gcatcctttt tgaatggaaa agtatgatac 960 ataaaaccag agagaggtat acatttagtc cagaaacggt ggaaattact ttacctagag 1020 ttgcgtgaat caaatggaaa atcagaggaa gagaccctaa atcgcaatcc atcttctatt 1080 ccctatagaa tcaaatggaa atttcttact tccgaccttt ttcatttcca caagtttgta 1140 atcgataaga tcataaaaga aaaccgattt acattagcaa atctttaagg cagtttgtag 1200 ttctcaagta tgcgttacgt atgaaattct agacagaaaa gggacgacag ggaaaataat 1260 ggtggaataa ataaacaatc aagaatcaaa agataataat ccttaaaact aacaaaaatt 1320 ctatcaataa gccctacaaa tgagaaatat gacggtggag actcacctga ttgatgcgag 1380 aaaaggaaag ccgccgacat ttgtgcttct tcccgcgtta agaaaaatcg cagatgacat 1440 tacgattctt tttctacaga ggaatagggg ggttgcgact ttgcgtgatt tgttgttaat 1500 gagtgatgcg tcgtccgttt tgatcggtag cccatggaga ctgatttatt tgacagatag 1560 atgtcgttct cgttgatgat gcaggtgtaa ttggcggcgt tggtgaagcg aagatggcat 1620 agggaatgga tttgcagagg agaaaaggag tttcacaaat atggattatt gaattgtcgt 1680 ttcagagtcg cgatggttag taatcgatgg atttgggttt gcacctgttc aaggggtggt 1740 gacgtgtctt actgtaagaa agagtcgcga tggttagtaa tcgacgatgg atttgggttt 1800 gcaacatcgt tgacggaaac gacgcggcga tggagagagg cggtagaggg aatgaaacgg 1860 gagatttacc ttcaaccgca aacatgtctt cgttcctcga aaatcatatg cgccctttat 1920 gaaaattcct tcacgcgccg tacacgcgct cagaaaaagc atagggtttt cttatataat 1980 aatgatataa cttaatttta aataacatcg tactatacgt ttcaaaataa attagagttt 2040 taataaaatt acggaatgat taaacctatt acaaacaaat ataagtgtcg gtaatataaa 2100 atttgtaaca acgaaaacat ttcaaaaaat ctgaatgcgg aaatccataa catgagaata 2160 cgattcgttt gcagtcacgc cggtttcttc accttctgag ggtcctgaaa aaggttaata 2220 aacaatgggt aagctaaagt ttagggatca tacacattac ttgtctatta tatgagttag 2280 atacattcac atatcacata catacaagca tacacatatt acaaaaaatc ctaacacata 2340 tggttggtac caactactat ttagtggacc aggttattct tgggggtcaa ttgtggttaa 2400 ccataaatgt ttggagttta ggttctcttt gggggccgac cataaacacc catatcatat 2460 ctctgtctag gttctctttg gggactgact atagacaact ttgctcagat tctccttgga 2520 ggataaccat cctcgacgag attaacaacg gaccaccact gttttcagct tgtaacctgc 2580 aacatcaata gttgcgatct tcggcgacaa tgatgaacca acatcaacac aacagtagtg 2640 ccggtatgtt agtcgttgga taatagaggc atcatctgac ccttttagcg gtgacttttg 2700 ttgcctatga aggtcttatc agttatatat cgattaggct tggttctagg ttataagaaa 2760 aaatgattct ctatccggta tgacatagag acaaaccggt ctacttttat aagaaaatca 2820 tactcgtatt tgaaacgaaa atcatatttg aaacaatgtc gtgttaataa ttaatatgtg 2880 tatgtttaaa tttagaatat cctgaactta tatttagttc gcaaccctat gtaagatcga 2940 actaatttta aaccgtaacc agacatgcat gtttgatcag taataaaaag gctatcatcg 3000 tcgaaaatat taaaacaaaa tataatttct tatttggcgc catttcatgt caacggttaa 3060 aagcaagtta tcaacgcctc caaccgatca tttctccggt aaccaccaac tgctactaat 3120 aaccgccacc gcaaaaacct atatatacaa cttccatcac aattctgtcc cctactccca 3180 tttcaatcca aaaaaggcta cacagacata tacagcg 3217 <210> 13 <211> 684 <212> DNA <213> Taraxacum officinale <400> 13 atgtcaacgg ttaaaagcaa gttatcaacg cctccaaccg atcatttctc cggtaaccac 60 caactgctac taataaccgc caccgcaaaa acctatatat acaacttcca tcacaattct 120 gtcccctact cccatttcaa tccaaaaaag gctacacaga catatacagc gatggcagat 180 aatggcaaca ccggccgtca aaaggatgac gacggtggcc atgatggggg acgcccaaat 240 ccgaccaccc caccctcccc ttcccgcacc ccgcgaagac ccaggcggac cacatcgccg 300 cctaaacatt ctccgggggc gtcttcaagc accatgccag cgccgcctac tccccctgcg 360 ccgacgggaa tcaccggtgc gtctagttct tctctgggta ctaatataat ttcatttact 420 ccacccaaaa ccaaaagaac gaagtcggtg atttgtccga tctgtaagaa agatatgtgc 480 catgagaagg cgctgtgtgg ccacatccgg tggcatactc aggaagaaag attggcggcc 540 agcattgcta tagcaagagc gctatcttct aacgttgttg tttctggcaa tggcgatgaa 600 gatgaaggtc catctaaaaa gtataaactc ccggacctga acaagtcacc accgccggag 660 gaggaggacg aggacgctgc ctga 684 <210> 14 <211> 3925 <212> DNA <213> Taraxacum officinale <400> 14 ttttcttgcg ggagaggcat gtatgtgtgg cctttttgca ataatactat gcatgggaga 60 tgcataaagt ttatctttat tttgttttag tttaataatg tgtggcaaac tttatatcat 120 ttatgatttc ggccatgtac tgctacatcg ttctaggatg gttattccct agaatttgct 180 tttatatatt ttttttcttc gttaattctt ctcttccttt aacgttattt catgtgaatt 240 tgcgatatca tgatattgca ggaacgtaac ttagaactca acgataaaaa gtgtgttgag 300 atcgtggaag ttgatcgttt atcttgaatt cacaagataa gcaacatgag atagaataat 360 taattactgc ggagatttct ttttagattc atcttattcg ttgtaaattg caatgcaaat 420 ttttaagtag aataacgaaa gcgtgttgtt atttacggtt aaatgcaaaa aatcaataac 480 atatctccat aattgatttg tttagtatgc attctcatgt gttctattgc aaaattctat 540 tttgaaattc aattaaagca atgcatttta gatataaagc aattccatca cttaattata 600 ttgggtagat ttttaccaaa tcactgtcct aaaagaaaaa taaaaaatga aagttcaatg 660 ccatagtgat cccgtcaatt atgtgatcaa tttttaccag agcaaaaccc caaaagttaa 720 agagtataat tgcagaacga caacaatctg aggatgatac taactccggt ataaaccgaa 780 tgcttttgtg gggatttcac taatcaacta tttggctctc atcacaaggc cgtgttaatg 840 gattactatt agttataagg ccatcccaag ttgtttggct atattattac cttttaaaaa 900 ccaaaatgtg taaactgtaa aattacactt ttggttcttg tattttctaa tttttagaat 960 tatgtatttg gttcttgtag tttttttatt tgtatgaatc atattagttt tggtccacga 1020 taacttttat tttctataat tacacttttg gtcattgtag ttttaatttg caagaaaaaa 1080 ataatctatc tttttagtcc atatatatag tttgcaatat tctatatttt aggttcaggt 1140 tatatatctt ttacaaaaat actacttatg attttttaat gaatatatca tatttcgtaa 1200 attacataaa cattttatat aattttattt agtcagaact ataggattcg catgataact 1260 ttgctgaact taattgggct tcatttttaa caaaggataa tgcatcatgc atgacataaa 1320 aatttgtaat gtttctaatg tgcatgcact acaagaacct gacccttcat atacattaat 1380 gaatgattct cttttcttat tatatcttag caaacggttt ggataagagt ctgaacaata 1440 ttaagaattg cactagctag ctaggggagt ccatgcagca agcaaattaa ttagaggact 1500 ttttaagagg cttgatcact tcattgtata tctaatggca ctgtggatat atgattggat 1560 tgtgtgtatg tatggaattt aatattacta aaaaatatac atttaatgac aaacaataac 1620 acactaattt ataacttaca aaagcgtgta tcattaaaga aaatttcatg tttcttaaaa 1680 tatggagaat ttactactta cataattatg tgtcataaat ttatgtcatc ttgtgtgata 1740 tttatgactt acaaaaatgt atgtgatatt tatgacttac aaaaatgtat gttatgttta 1800 tcgtcataaa atctgtaaaa aaaaatagaa acatggagga tactttcaat gtgtagaaac 1860 ttgacagcat aaacaggttt attaccttca tcaaaactta tcttacttca atctcttgga 1920 gatgcaggtt gattttaatg ctaaatgaac ttttcaaatg tataaatata tatcttttga 1980 cggatttgac attgatggag atgaagatac accagtgaat tcacctttca atgatcatac 2040 tgacatacca agtactctta tcccctctcc acctccacag aacgaacctc aatttcaaaa 2100 acgtaactgc cgctgttcta aaaacagaaa attttcaaaa acgtaactat catttaaata 2160 tttaatcatt tttcaattgg attcatgctg taatagaagt tactggactt taaacttctt 2220 gtagctgatg agattcatga acaacagtcc aaggagattt tccaaatcaa caagtttctg 2280 atgagaacaa ggtaaaaaaa ataagttttt catttaaaca tatgattttg gttttcaaaa 2340 gataattaat tataggaact cttctgaaaa gtcccaaagt ttacccgtaa aattgatttt 2400 ggtttttttt ttttaaattg aataaaaaag tccataaaat tggataaatt attcgattta 2460 gcccaattta cctagtatat ctggtaaaaa tgggttaaat cgaataattt aggcagtttg 2520 ttgggctttt ttgcgcaaaa acattatttt gggacttaat cgttaatttt ccccaagttt 2580 cagtttattt acagtattgg aataaaaccg aacctagtgc gctaattttg tcttttggtg 2640 tttagaatta tttgggttta ttggtctcgg tttctaaacg agttcggttt ttggtttctt 2700 gattcgattt ttggcttttg ggttcaaccc atggattttc gatttggttt tggttttgat 2760 aatatttttt gtgcaatcgt tcaaaaaatc cgagttagat tgggtttaaa tgttatcaaa 2820 accaaaaccg atggtagaac cccaaaactg aacccaatcg aaaatccatg ggttgaacct 2880 caaaaacgaa cccaataaat tctaaaaacc aaaatccaaa attagcggat aaaaatttta 2940 aaatacatat ctactggtaa ggtgtttttg acaatttatg taaattatag aaaaaaatgt 3000 attaagtgtt tgctatttaa gataaaaatg gcgttaaaaa tacaattggt tagaaatgaa 3060 ccattttttt gttgtaaatg agtggtgcat caacgatggt ggatgccatc ttttccttcc 3120 accatataca tctttgtcaa acaccataca cacaaattct catatgtcaa agatattaat 3180 tatcatgtcc actgagtttg taatataaat agatgatcaa ttacaacgag aaatatacac 3240 tgaattctca tttctaaatt gaagaatctc tctctctctc tctcatctct cagttttcaa 3300 agttttataa gttactagtt tatagtgttt ctaattactt catatttata acacgttatc 3360 agcacgagag ctctaagcaa gatatgcaat tacttaataa agtttataaa aataaacaaa 3420 tcataataaa caacatagat ataaaattaa ttattaccat ggacatgatg gactactaac 3480 attttatttc ttatactaac atttatttat gttaactaac atttatttat gtttctaaca 3540 tttatttatg catactaaca tttatttatg ttaactaaca tttatttatg tttctaacat 3600 ttatttatgc atactaacat ttatttatgt tactaacttt tatttatgta tactaatgtt 3660 tatttatcaa atttatttaa catttactat tttttgatta tattttttaa ttagccgata 3720 gaatttattt atttaattat tctatttatt aaacttattt ttataaatat atatatatat 3780 ataaccgtta tatatataac ggctatatat ataacgtcta tatatatata acggctatat 3840 ttttacacta taaataaaca catcattctc catttttata ccacaacaaa taatttctct 3900 catcttccaa atcatcaaga gaaaa 3925 <210> 15 <211> 7826 <212> DNA <213> Taraxacum officinale <400> 15 gttgaaagga aggatcggca gagaacaaga ttgagagagt tttatcgaag agaagagatg 60 gttgtgttga ttgacggcag agttcagcaa tggcagatat gcgtgtttaa agcgcagttt 120 gtggacagtt tgtccaaagg ccttcaagtg ggagattgtt gagatgaaga cccttttgac 180 caagtactta aatgtgattg gttgcatggg aaagagcttt acacttcatt ggttgaaaat 240 gaagcatgtt atttaatagt acgtctccac ttgttcttta tgaaggatga agacagccac 300 caagtcttta tgaatgtttc aaggagaaga caatgattag atgctgcctg ctcccttact 360 tcttcactat aaataggtgc ttaaggcacc tctcttctta caccaaacaa cacacaagtc 420 acagattaca aagattgaga gagttttcat tttctctcta gagtttgttt tgtcaaaagt 480 tttgtgtgca gattaattag ttgagagaca ctcctaatta atataaccac ttacacttgt 540 cattgattag cattctagtg tcagagagtt ctgagtgatt gtaacctttg tgtgatttat 600 atataaatct ctctcttgtt cgccagtgga cgtagctgat tatcctgatc agtgaaccac 660 ttaaaatatc gtgttgatat tatttatctg cagattattt taccagatag ttttattccg 720 caccgcaaag cataccgtcc attatttgtc agacgtacct actctcagct catcccagca 780 ggagttagac ctgcaggcag ccagccgtat ttcacaacag tgaattatgc aacaaatgga 840 aacacacaat tatcgtagta cacatgtaat taacagggat caatttccat ttattgttcc 900 atcaattgcc aaatttaaaa gataacaaat gcatcctttt tgaatggaaa agtatgatac 960 ataaaaccag agagaggtat acatttagtc cagaaacggt ggaaattact ttacctagag 1020 ttgcgtgaat caaatggaaa atcagaggaa gagaccctaa atcgcaatcc atcttctatt 1080 ccctatagaa tcaaatggaa atttcttact tccgaccttt ttcatttcca caagtttgta 1140 atcgataaga tcataaaaga aaaccgattt acattagcaa atctttaagg cagtttgtag 1200 ttctcaagta tgcgttacgt atgaaattct agacagaaaa gggacgacag ggaaaataat 1260 ggtggaataa ataaacaatc aagaatcaaa agataataat ccttaaaact aacaaaaatt 1320 ctatcaataa gccctacaaa tgagaaatat gacggtggag actcacctga ttgatgcgag 1380 aaaaggaaag ccgccgacat ttgtgcttct tcccgcgtta agaaaaatcg cagatgacat 1440 tacgattctt tttctacaga ggaatagggg ggttgcgact ttgcgtgatt tgttgttaat 1500 gagtgatgcg tcgtccgttt tgatcggtag cccatggaga ctgatttatt tgacagatag 1560 atgtcgttct cgttgatgat gcaggtgtaa ttggcggcgt tggtgaagcg aagatggcat 1620 agggaatgga tttgcagagg agaaaaggag tttcacaaat atggattatt gaattgtcgt 1680 ttcagagtcg cgatggttag taatcgatgg atttgggttt gcacctgttc aaggggtggt 1740 gacgtgtctt actgtaagaa agagtcgcga tggttagtaa tcgacgatgg atttgggttt 1800 gcaacatcgt tgacggaaac gacgcggcga tggagagagg cggtagaggg aatgaaacgg 1860 gagatttacc ttcaaccgca aacatgtctt cgttcctcga aaatcatatg cgccctttat 1920 gaaaattcct tcacgcgccg tacacgcgct cagaaaaagc atagggtttt cttatataat 1980 aatgatataa cttaatttta aataacatcg tactatacgt ttcaaaataa attagagttt 2040 taataaaatt acggaatgat taaacctatt acaaacaaat ataagtgtcg gtaatataaa 2100 atttgtaaca acgaaaacat ttcaaaaaat ctgaatgcgg aaatccataa catgagaata 2160 cgattcgttt gcagtcacgc cggtttcttc accttctgag ggtcctgaaa aaggttaata 2220 aacaatgggt aagctaaagt ttagggatca tacacattac ttgtctatta tatgagttag 2280 atacattcac atatcacata catacaagca tacacatatt acaaaaaatc ctaacacata 2340 tggttggtac caactactat ttagtggacc aggttattct tgggggtcaa ttgtggttaa 2400 ccataaatgt ttggagttta ggttctcttt gggggccgac cataaacacc catatcatat 2460 ctctgtctag gttctctttg gggactgact atagacaact ttgctcagat tctccttgga 2520 ggataaccat cctcgacgag attaacaacg gaccaccact gttttcagct tgtaacctgc 2580 aacatcaata gttgcgatct tcggcgacaa tgatgaacca acatcaacac aacagtagtg 2640 ccggtatgtt agtcgttgga taatagaggc atcatctgac ccttttagcg gtgacttttg 2700 ttgcctatga aggtcttatc agttatatat cgattaggct tggttctagg ttataagaaa 2760 aaatgattct ctatccggta tgacatagag acaaaccggt ctacttttat aagaaaatca 2820 tactcgtatt tgaaacgaaa atcatatttg aaacaatgtc gtgttaataa ttaatatgtg 2880 tatgtttaaa tttagaatat cctgaactta tatttagttc gcaaccctat gtaagatcga 2940 actaatttta aaccgtaacc agacatgcat gtttgatcag taataaaaag gctatcatcg 3000 tcgaaaatat taaaacaaaa tataatttct tatttggcgc catttcatgt caacggttaa 3060 aagcaagtta tcaacgcctc caaccgatca tttctccggt aaccaccaac tgctactaat 3120 aaccgccacc gcaaaaacct atatatacaa cttccatcac aattctgtcc cctactccca 3180 tttcaatcca aaaaaggcta cacagacata tacagcgatg tcaacggtta aaagcaagtt 3240 atcaacgcct ccaaccgatc atttctccgg taaccaccaa ctgctactaa taaccgccac 3300 cgcaaaaacc tatatataca acttccatca caattctgtc ccctactccc atttcaatcc 3360 aaaaaaggct acacagacat atacagcgat ggcagataat ggcaacaccg gccgtcaaaa 3420 ggatgacgac ggtggccatg atgggggacg cccaaatccg accaccccac cctccccttc 3480 ccgcaccccg cgaagaccca ggcggaccac atcgccgcct aaacattctc cgggggcgtc 3540 ttcaagcacc atgccagcgc cgcctactcc ccctgcgccg acgggaatca ccggtgcgtc 3600 tagttcttct ctgggtacta atataatttc atttactcca cccaaaacca aaagaacgaa 3660 gtcggtgatt tgtccgatct gtaagaaaga tatgtgccat gagaaggcgc tgtgtggcca 3720 catccggtgg catactcagg aagaaagatt ggcggccagc attgctatag caagagcgct 3780 atcttctaac gttgttgttt ctggcaatgg cgatgaagat gaaggtccat ctaaaaagta 3840 taaactcccg gacctgaaca agtcaccacc gccggaggag gaggacgagg acgctgcctg 3900 attttcttgc gggagaggca tgtatgtgtg gcctttttgc aataatacta tgcatgggag 3960 atgcataaag tttatcttta ttttgtttta gtttaataat gtgtggcaaa ctttatatca 4020 tttatgattt cggccatgta ctgctacatc gttctaggat ggttattccc tagaatttgc 4080 ttttatatat tttttttctt cgttaattct tctcttcctt taacgttatt tcatgtgaat 4140 ttgcgatatc atgatattgc aggaacgtaa cttagaactc aacgataaaa agtgtgttga 4200 gatcgtggaa gttgatcgtt tatcttgaat tcacaagata agcaacatga gatagaataa 4260 ttaattactg cggagatttc tttttagatt catcttattc gttgtaaatt gcaatgcaaa 4320 tttttaagta gaataacgaa agcgtgttgt tatttacggt taaatgcaaa aaatcaataa 4380 catatctcca taattgattt gtttagtatg cattctcatg tgttctattg caaaattcta 4440 ttttgaaatt caattaaagc aatgcatttt agatataaag caattccatc acttaattat 4500 attgggtaga tttttaccaa atcactgtcc taaaagaaaa ataaaaaatg aaagttcaat 4560 gccatagtga tcccgtcaat tatgtgatca atttttacca gagcaaaacc ccaaaagtta 4620 aagagtataa ttgcagaacg acaacaatct gaggatgata ctaactccgg tataaaccga 4680 atgcttttgt ggggatttca ctaatcaact atttggctct catcacaagg ccgtgttaat 4740 ggattactat tagttataag gccatcccaa gttgtttggc tatattatta ccttttaaaa 4800 accaaaatgt gtaaactgta aaattacact tttggttctt gtattttcta atttttagaa 4860 ttatgtattt ggttcttgta gtttttttat ttgtatgaat catattagtt ttggtccacg 4920 ataactttta ttttctataa ttacactttt ggtcattgta gttttaattt gcaagaaaaa 4980 aataatctat ctttttagtc catatatata gtttgcaata ttctatattt taggttcagg 5040 ttatatatct tttacaaaaa tactacttat gattttttaa tgaatatatc atatttcgta 5100 aattacataa acattttata taattttatt tagtcagaac tataggattc gcatgataac 5160 tttgctgaac ttaattgggc ttcattttta acaaaggata atgcatcatg catgacataa 5220 aaatttgtaa tgtttctaat gtgcatgcac tacaagaacc tgacccttca tatacattaa 5280 tgaatgattc tcttttctta ttatatctta gcaaacggtt tggataagag tctgaacaat 5340 attaagaatt gcactagcta gctaggggag tccatgcagc aagcaaatta attagaggac 5400 tttttaagag gcttgatcac ttcattgtat atctaatggc actgtggata tatgattgga 5460 ttgtgtgtat gtatggaatt taatattact aaaaaatata catttaatga caaacaataa 5520 cacactaatt tataacttac aaaagcgtgt atcattaaag aaaatttcat gtttcttaaa 5580 atatggagaa tttactactt acataattat gtgtcataaa tttatgtcat cttgtgtgat 5640 atttatgact tacaaaaatg tatgtgatat ttatgactta caaaaatgta tgttatgttt 5700 atcgtcataa aatctgtaaa aaaaaataga aacatggagg atactttcaa tgtgtagaaa 5760 cttgacagca taaacaggtt tattaccttc atcaaaactt atcttacttc aatctcttgg 5820 agatgcaggt tgattttaat gctaaatgaa cttttcaaat gtataaatat atatcttttg 5880 acggatttga cattgatgga gatgaagata caccagtgaa ttcacctttc aatgatcata 5940 ctgacatacc aagtactctt atcccctctc cacctccaca gaacgaacct caatttcaaa 6000 aacgtaactg ccgctgttct aaaaacagaa aattttcaaa aacgtaacta tcatttaaat 6060 atttaatcat ttttcaattg gattcatgct gtaatagaag ttactggact ttaaacttct 6120 tgtagctgat gagattcatg aacaacagtc caaggagatt ttccaaatca acaagtttct 6180 gatgagaaca aggtaaaaaa aataagtttt tcatttaaac atatgatttt ggttttcaaa 6240 agataattaa ttataggaac tcttctgaaa agtcccaaag tttacccgta aaattgattt 6300 tggttttttt tttttaaatt gaataaaaaa gtccataaaa ttggataaat tattcgattt 6360 agcccaattt acctagtata tctggtaaaa atgggttaaa tcgaataatt taggcagttt 6420 gttgggcttt tttgcgcaaa aacattattt tgggacttaa tcgttaattt tccccaagtt 6480 tcagtttatt tacagtattg gaataaaacc gaacctagtg cgctaatttt gtcttttggt 6540 gtttagaatt atttgggttt attggtctcg gtttctaaac gagttcggtt tttggtttct 6600 tgattcgatt tttggctttt gggttcaacc catggatttt cgatttggtt ttggttttga 6660 taatattttt tgtgcaatcg ttcaaaaaat ccgagttaga ttgggtttaa atgttatcaa 6720 aaccaaaacc gatggtagaa ccccaaaact gaacccaatc gaaaatccat gggttgaacc 6780 tcaaaaacga acccaataaa ttctaaaaac caaaatccaa aattagcgga taaaaatttt 6840 aaaatacata tctactggta aggtgttttt gacaatttat gtaaattata gaaaaaaatg 6900 tattaagtgt ttgctattta agataaaaat ggcgttaaaa atacaattgg ttagaaatga 6960 accatttttt tgttgtaaat gagtggtgca tcaacgatgg tggatgccat cttttccttc 7020 caccatatac atctttgtca aacaccatac acacaaattc tcatatgtca aagatattaa 7080 ttatcatgtc cactgagttt gtaatataaa tagatgatca attacaacga gaaatataca 7140 ctgaattctc atttctaaat tgaagaatct ctctctctct ctctcatctc tcagttttca 7200 aagttttata agttactagt ttatagtgtt tctaattact tcatatttat aacacgttat 7260 cagcacgaga gctctaagca agatatgcaa ttacttaata aagtttataa aaataaacaa 7320 atcataataa acaacataga tataaaatta attattacca tggacatgat ggactactaa 7380 cattttattt cttatactaa catttattta tgttaactaa catttattta tgtttctaac 7440 atttatttat gcatactaac atttatttat gttaactaac atttatttat gtttctaaca 7500 tttatttatg catactaaca tttatttatg ttactaactt ttatttatgt atactaatgt 7560 ttatttatca aatttattta acatttacta ttttttgatt atatttttta attagccgat 7620 agaatttatt tatttaatta ttctatttat taaacttatt tttataaata tatatatata 7680 tataaccgtt atatatataa cggctatata tataacgtct atatatatat aacggctata 7740 tttttacact ataaataaac acatcattct ccatttttat accacaacaa ataatttctc 7800 tcatcttcca aatcatcaag agaaaa 7826 <210> 16 <211> 1547 <212> DNA <213> Lactuca sativa <400> 16 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080 ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140 tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200 attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260 ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320 aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380 cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc aaccgccaca 1440 aataaccgtc accggaatac ctataaatac aacttccatt tcaatcgtct ctctctgcac 1500 tcccattctt tgaatccaaa aaaggctaca cacacacaca gacaaca 1547 <210> 17 <211> 1532 <212> DNA <213> Artificial Sequence <220> <223> Lactuca sativa LSAT_8X112340 promoter without 2 MYB binding sites <400> 17 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080 ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140 tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200 attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260 ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320 aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380 cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc caaataccgg 1440 aatacctata aatacaactt ccatttcaat cgtctctctc tgcactccca ttctttgaat 1500 ccaaaaaagg ctacacacac acacagacaa ca 1532 <210> 18 <211> 2882 <212> DNA <213> Artificial Sequence <220> <223> Lactuca sativa LSAT_8X112340 promoter with Taraxacum officinale Par allele MITE insertion <400> 18 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080 ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140 tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200 attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260 ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320 aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380 cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc actgctacca 1440 gggccggcca gaaggctgtg cggcttgggc tgtggcacag gggcagcaga tttagtccat 1500 ttattatggt ctgctattta tttgggtcca ataagatcag ggcactaaaa ctcaaataca 1560 tcaattcaag tcggcggcaa aagaataaaa agcgccaatt tttagaagac aaggagacag 1620 cacaataatc atgcttttcc aatggccaat taattttagc ctttgtgagg tataaatatg 1680 aatcactttt tctccaaata tcattattgt aaactagtaa agagcgtaaa ttgttttatc 1740 gctaatcttc ttctttttca aatataattg tttgattctt tgtagtaggt acgttaagtt 1800 ttatatcatt cgtcctggaa accttttctt atgccccttc aatttatgaa tttgtgtttt 1860 gtattgtctt gctattaatc caatgcaaac taattctgcc gcatcgatct cacagagttg 1920 gagcagctta aaaggagttt tggggcaact taaaatgagg gtagcttttt tgttgttgtt 1980 ggtctactat ttactttggt ccttatcgtt ttagttttgt gttcattgag gatttgaatg 2040 actttgaaca caagtttata aaactaagtt tttgtgattc taaatttttg atgtgtgcaa 2100 ccgactaaat gaatataaaa ttctgatttg tgtatttctg atttctgatt taccggttat 2160 tcattatgtt tttctggatc tcatatgaat ttagtatata aaaatctcag gttcttctta 2220 ctcagtctag tatattttgg cattggggat cagggttaaa atcatcattt ttctaagcac 2280 taacaagctt taaaaccatc aattaaaagt tagttctcca tacctggaat tgtttattgc 2340 tttagtattc atttcatagt gtcaatacct tacaactgtt tattgttttc aaatgtttac 2400 tgttttgcac tttagttgtt tttagcatgt ttcaactttc aaagttaatt gacgatagtg 2460 tcatatacga aatatcatca ctcatacaaa attaaactgg atagaatttt ttccgatgaa 2520 atctattttt aaatagttac gaatataata ggagacttaa tatgtttgtt tcaaaattac 2580 acaaaaacac catggaaatg ggcattagtt tgtataagca tccttttaaa tataaagctt 2640 tgttacattg atgccttcta aatatataat attgtaatga tttgtagtaa acaccatgga 2700 aatgggcatt attaagatgt ttcgcccagg gcatgaaaaa ctatcggacc ggccctgact 2760 gctacaaccg ccacaaataa ccgtcaccgg aatacctata aatacaactt ccatttcaat 2820 cgtctctctc tgcactccca ttctttgaat ccaaaaaagg ctacacacac acacagacaa 2880 ca 2882 <210> 19 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> target specific sequence of RNA-1 <400> 19 catccggtgg catacacagg 20 <210> 20 <211> 1148 <212> DNA <213> Artificial Sequence <220> <223> Lactuca sativa LSAT_8X112340 promoter with deletion <400> 20 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaccgccac aaataaccgt caccggaata cctataaata caacttccat 1080 ttcaatcgtc tctctctgca ctcccattct ttgaatccaa aaaaggctac acacacacac 1140 agacaaca 1148 <210> 21 <211> 89 <212> PRT <213> Helianthus annuus <400> 21 Met Ser Ser Pro Ser Lys Asn Lys Ser Lys Ser Ser Ile Cys Pro Val 1 5 10 15 Cys Lys Arg Asp Leu Cys His Glu Lys Ala Leu Asn Gly His Ile Arg 20 25 30 Trp His Thr Gln Gln Glu Arg Glu Ala Ala Gly Ile Gly Asn Ala Lys 35 40 45 Ala Val Ala Ser Ala Ser Val Val Ile Arg Asp Ala Asn Val Arg Arg 50 55 60 Pro Glu Thr Ser Lys Pro Val Lys Leu Pro Asp Leu Asn Lys Ser Pro 65 70 75 80 Pro Arg Glu Glu Asp Lys Asp Ala Ala 85 <210> 22 <211> 157 <212> PRT <213> Lactuca sativa <400> 22 Met Ala Asp Asp Gly Asn Thr Ala Arg Gln Gln Ala Asp Ala Gly Gly 1 5 10 15 His Gly Asn Ala Arg Pro Asn Ser Ser Thr Pro Pro Ser Ser Pro Ser 20 25 30 Gln Pro Pro Arg Arg Pro Arg Arg Ala Gly Ala Thr Thr Pro Ser Lys 35 40 45 Leu Ser Gln Ala Ala Ser Ser Ser Thr Asn Leu Pro Pro Pro Pro Thr 50 55 60 Pro Thr Pro Thr Pro Pro Thr Pro Ser Ala Asp Gly Ile Leu Leu Gly 65 70 75 80 Thr Ala Arg Arg Pro Val Ile Cys Pro Ile Cys Lys Lys Asp Met Tyr 85 90 95 His Glu Lys Ala Leu Cys Gly His Ile Arg Trp His Thr Gln Glu Glu 100 105 110 Arg Leu Ala Ala Ser Arg Asp Ile Ala Arg Ala Leu Ser Ala Asn Val 115 120 125 Val Ser Gly Gln Arg Gly Asp Gly Glu Gln Gly Pro Ser Lys Arg Phe 130 135 140 Lys Leu Pro Asp Leu Asn Glu Pro Pro Pro Ser Glu Asp 145 150 155 <210> 23 <211> 36 <212> DNA <213> Taraxacum officinale <400> 23 tgtggccaca tccggtggca tacacaggag gaaaga 36 <210> 24 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> pKG10821-1 <400> 24 tgtggccaca tccggtggca tacaccagga ggaaaga 37 <210> 25 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> pKG10821-4 <400> 25 tgtggccaca tccggtggca tacacaagga ggaaaga 37 <210> 26 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> pKG10821-5 <400> 26 tgtggccaca tccggtggca tacaaggagg aaaga 35 <210> 27 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> pKG10821-6 <400> 27 tgtggccaca tccggtggca taaggaggaa aga 33 <210> 28 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> pKG10821-1 <400> 28 Cys Gly His Ile Arg Trp His Thr Pro Gly Gly Lys 1 5 10 <210> 29 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> pKG108121-4 <400> 29 Cys Gly His Ile Arg Trp His Thr Gln Gly Gly Lys 1 5 10 <210> 30 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> pKG10821-5 <400> 30 Cys Gly His Ile Arg Trp His Thr Arg Arg Lys 1 5 10 <210> 31 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> pKG10821-6 <400> 31 Cys Gly His Ile Arg Trp His Lys Glu Glu Arg 1 5 10 <210> 32 <211> 12 <212> PRT <213> Taraxacum officinale <400> 32 Cys Gly His Ile Arg Trp His Thr Gln Glu Glu Arg 1 5 10 <210> 33 <211> 474 <212> DNA <213> Artificial Sequence <220> <223> Lactuca sativa LSAT_8X112340 coding sequence <400> 33 atggcagatg atggcaacac cgcccgtcaa caggctgacg ccggtggcca tggaaacgca 60 cgtccaaact catccacccc cccttcgtca ccctcccaac ctccaagaag accacgccgt 120 gccggagcca ctacaccgtc aaagctttcc caggcggcat cttcgtcaac aaatcttcca 180 ccgccgccaa cgccaacacc aactccgccc accccttctg ccgacgggat attactaggt 240 actgcaagaa ggccggtaat atgcccgatt tgcaaaaagg atatgtatca tgaaaaggcg 300 ctgtgtggcc acatccggtg gcacacgcag gaggagagac tggcggcaag cagggatatt 360 gcccgggcgc tttctgccaa cgttgtttct gggcaaagag gcgatggaga acaagggccg 420 tctaaacggt tcaaactgcc ggatcttaac gagccaccac cgtcggagga ctga 474 <210> 34 <211> 3021 <212> DNA <213> Artificial Sequence <220> <223> LsPromtoter_LsCoding sequence_To3'UTR <400> 34 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080 ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140 tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200 attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260 ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320 aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380 cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc aaccgccaca 1440 aataaccgtc accggaatac ctataaatac aacttccatt tcaatcgtct ctctctgcac 1500 tcccattctt tgaatccaaa aaaggctaca cacacacaca gacaacaatg gcagatgatg 1560 gcaacaccgc ccgtcaacag gctgacgccg gtggccatgg aaacgcacgt ccaaactcat 1620 ccaccccccc ttcgtcaccc tcccaacctc caagaagacc acgccgtgcc ggagccacta 1680 caccgtcaaa gctttcccag gcggcatctt cgtcaacaaa tcttccaccg ccgccaacgc 1740 caacaccaac tccgcccacc ccttctgccg acgggatatt actaggtact gcaagaaggc 1800 cggtaatatg cccgatttgc aaaaaggata tgtatcatga aaaggcgctg tgtggccaca 1860 tccggtggca cacgcaggag gagagactgg cggcaagcag ggatattgcc cgggcgcttt 1920 ctgccaacgt tgtttctggg caaagaggcg atggagaaca agggccgtct aaacggttca 1980 aactgccgga tcttaacgag ccaccaccgt cggaggactg attttcttgc gggagaggca 2040 tgcatgtatg tgtggccttt ttgcaataat actatgcatg ggagatgcat aaagtttatc 2100 tttatttttt ttagtttaat aatgtgtggc aaactttata tcatttatga tttcggccat 2160 gtactgctac atcgttctag gatggttatt ccctagaatt tgctttatgt atttgttttc 2220 tttgttaatt cttctcttcc ttaaacgtta tttcatgtga attgcgatgt catgatattg 2280 caggaatgta acttagaact caacgataaa aagtgtgttg agatcgtgga agttgatcat 2340 ttatcttgaa ttcataagat aagcaacatg agataggata attaattact gtggggattt 2400 ctttttatat tcatattatt cgttgtaatg caaattttta agtagaataa cgaatgtgtc 2460 ttattattta cggttaaatg caaaagatca ttaacatatc tccattgatt tgtttactga 2520 tgtattctca tgtgttctgt tgctaaattc tattttgaaa agtatattca attaaagcaa 2580 tgcattttag atataaagca actccataac ttataattgt gtagattttt accaattcaa 2640 tgtcttaaaa gaaaaataaa aattgaaagt ttaattaatt gccatagtga tcccgttccc 2700 gtcaattatg tgatcaattt ttaccagagc aaaaccccac atttcttgta gtgaacaatc 2760 tgtggatgat aaccgatcga agacttttgt ggggatttca ctaaccaact atttggctct 2820 cattaattac tattagttat ataaggccat cccaagtatt ttggcaatat tcaaaacgag 2880 taaactataa aattacactt ttggttcttg tatttctaac ttttagaatt atgtatttgg 2940 ttcttatagt tttttatttg tatgaattac attacttttg gtccacaata ttttttattt 3000 tctataattc catttttagt c 3021 <210> 35 <211> 3006 <212> DNA <213> Artificial Sequence <220> <223> LsPromoter-without-MYB-sites_LsCoding sequence_To3'UTR <400> 35 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080 ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140 tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200 attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260 ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320 aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380 cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc caaataccgg 1440 aatacctata aatacaactt ccatttcaat cgtctctctc tgcactccca ttctttgaat 1500 ccaaaaaagg ctacacacac acacagacaa caatggcaga tgatggcaac accgcccgtc 1560 aacaggctga cgccggtggc catggaaacg cacgtccaaa ctcatccacc cccccttcgt 1620 caccctccca acctccaaga agaccacgcc gtgccggagc cactacaccg tcaaagcttt 1680 cccaggcggc atcttcgtca acaaatcttc caccgccgcc aacgccaaca ccaactccgc 1740 ccaccccttc tgccgacggg atattactag gtactgcaag aaggccggta atatgcccga 1800 tttgcaaaaa ggatatgtat catgaaaagg cgctgtgtgg ccacatccgg tggcacacgc 1860 aggaggagag actggcggca agcagggata ttgcccgggc gctttctgcc aacgttgttt 1920 ctgggcaaag aggcgatgga gaacaagggc cgtctaaacg gttcaaactg ccggatctta 1980 acgagccacc accgtcggag gactgatttt cttgcgggag aggcatgcat gtatgtgtgg 2040 cctttttgca ataatactat gcatgggaga tgcataaagt ttatctttat tttttttagt 2100 ttaataatgt gtggcaaact ttatatcatt tatgatttcg gccatgtact gctacatcgt 2160 tctaggatgg ttattcccta gaatttgctt tatgtatttg ttttctttgt taattcttct 2220 cttccttaaa cgttatttca tgtgaattgc gatgtcatga tattgcagga atgtaactta 2280 gaactcaacg ataaaaagtg tgttgagatc gtggaagttg atcatttatc ttgaattcat 2340 aagataagca acatgagata ggataattaa ttactgtggg gatttctttt tatattcata 2400 ttattcgttg taatgcaaat ttttaagtag aataacgaat gtgtcttatt atttacggtt 2460 aaatgcaaaa gatcattaac atatctccat tgatttgttt actgatgtat tctcatgtgt 2520 tctgttgcta aattctattt tgaaaagtat attcaattaa agcaatgcat tttagatata 2580 aagcaactcc ataacttata attgtgtaga tttttaccaa ttcaatgtct taaaagaaaa 2640 ataaaaattg aaagtttaat taattgccat agtgatcccg ttcccgtcaa ttatgtgatc 2700 aatttttacc agagcaaaac cccacatttc ttgtagtgaa caatctgtgg atgataaccg 2760 atcgaagact tttgtgggga tttcactaac caactatttg gctctcatta attactatta 2820 gttatataag gccatcccaa gtattttggc aatattcaaa acgagtaaac tataaaatta 2880 cacttttggt tcttgtattt ctaactttta gaattatgta tttggttctt atagtttttt 2940 atttgtatga attacattac ttttggtcca caatattttt tattttctat aattccattt 3000 ttagtc 3006 <210> 36 <211> 4356 <212> DNA <213> Artificial Sequence <220> <223> LsPromoter-with-MITE-insert_LsCoding sequence_To3'UTR <400> 36 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080 ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140 tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200 attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260 ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320 aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380 cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc actgctacca 1440 gggccggcca gaaggctgtg cggcttgggc tgtggcacag gggcagcaga tttagtccat 1500 ttattatggt ctgctattta tttgggtcca ataagatcag ggcactaaaa ctcaaataca 1560 tcaattcaag tcggcggcaa aagaataaaa agcgccaatt tttagaagac aaggagacag 1620 cacaataatc atgcttttcc aatggccaat taattttagc ctttgtgagg tataaatatg 1680 aatcactttt tctccaaata tcattattgt aaactagtaa agagcgtaaa ttgttttatc 1740 gctaatcttc ttctttttca aatataattg tttgattctt tgtagtaggt acgttaagtt 1800 ttatatcatt cgtcctggaa accttttctt atgccccttc aatttatgaa tttgtgtttt 1860 gtattgtctt gctattaatc caatgcaaac taattctgcc gcatcgatct cacagagttg 1920 gagcagctta aaaggagttt tggggcaact taaaatgagg gtagcttttt tgttgttgtt 1980 ggtctactat ttactttggt ccttatcgtt ttagttttgt gttcattgag gatttgaatg 2040 actttgaaca caagtttata aaactaagtt tttgtgattc taaatttttg atgtgtgcaa 2100 ccgactaaat gaatataaaa ttctgatttg tgtatttctg atttctgatt taccggttat 2160 tcattatgtt tttctggatc tcatatgaat ttagtatata aaaatctcag gttcttctta 2220 ctcagtctag tatattttgg cattggggat cagggttaaa atcatcattt ttctaagcac 2280 taacaagctt taaaaccatc aattaaaagt tagttctcca tacctggaat tgtttattgc 2340 tttagtattc atttcatagt gtcaatacct tacaactgtt tattgttttc aaatgtttac 2400 tgttttgcac tttagttgtt tttagcatgt ttcaactttc aaagttaatt gacgatagtg 2460 tcatatacga aatatcatca ctcatacaaa attaaactgg atagaatttt ttccgatgaa 2520 atctattttt aaatagttac gaatataata ggagacttaa tatgtttgtt tcaaaattac 2580 acaaaaacac catggaaatg ggcattagtt tgtataagca tccttttaaa tataaagctt 2640 tgttacattg atgccttcta aatatataat attgtaatga tttgtagtaa acaccatgga 2700 aatgggcatt attaagatgt ttcgcccagg gcatgaaaaa ctatcggacc ggccctgact 2760 gctacaaccg ccacaaataa ccgtcaccgg aatacctata aatacaactt ccatttcaat 2820 cgtctctctc tgcactccca ttctttgaat ccaaaaaagg ctacacacac acacagacaa 2880 caatggcaga tgatggcaac accgcccgtc aacaggctga cgccggtggc catggaaacg 2940 cacgtccaaa ctcatccacc cccccttcgt caccctccca acctccaaga agaccacgcc 3000 gtgccggagc cactacaccg tcaaagcttt cccaggcggc atcttcgtca acaaatcttc 3060 caccgccgcc aacgccaaca ccaactccgc ccaccccttc tgccgacggg atattactag 3120 gtactgcaag aaggccggta atatgcccga tttgcaaaaa ggatatgtat catgaaaagg 3180 cgctgtgtgg ccacatccgg tggcacacgc aggaggagag actggcggca agcagggata 3240 ttgcccgggc gctttctgcc aacgttgttt ctgggcaaag aggcgatgga gaacaagggc 3300 cgtctaaacg gttcaaactg ccggatctta acgagccacc accgtcggag gactgatttt 3360 cttgcgggag aggcatgcat gtatgtgtgg cctttttgca ataatactat gcatgggaga 3420 tgcataaagt ttatctttat tttttttagt ttaataatgt gtggcaaact ttatatcatt 3480 tatgatttcg gccatgtact gctacatcgt tctaggatgg ttattcccta gaatttgctt 3540 tatgtatttg ttttctttgt taattcttct cttccttaaa cgttatttca tgtgaattgc 3600 gatgtcatga tattgcagga atgtaactta gaactcaacg ataaaaagtg tgttgagatc 3660 gtggaagttg atcatttatc ttgaattcat aagataagca acatgagata ggataattaa 3720 ttactgtggg gatttctttt tatattcata ttattcgttg taatgcaaat ttttaagtag 3780 aataacgaat gtgtcttatt atttacggtt aaatgcaaaa gatcattaac atatctccat 3840 tgatttgttt actgatgtat tctcatgtgt tctgttgcta aattctattt tgaaaagtat 3900 attcaattaa agcaatgcat tttagatata aagcaactcc ataacttata attgtgtaga 3960 tttttaccaa ttcaatgtct taaaagaaaa ataaaaattg aaagtttaat taattgccat 4020 agtgatcccg ttcccgtcaa ttatgtgatc aatttttacc agagcaaaac cccacatttc 4080 ttgtagtgaa caatctgtgg atgataaccg atcgaagact tttgtgggga tttcactaac 4140 caactatttg gctctcatta attactatta gttatataag gccatcccaa gtattttggc 4200 aatattcaaa acgagtaaac tataaaatta cacttttggt tcttgtattt ctaactttta 4260 gaattatgta tttggttctt atagtttttt atttgtatga attacattac ttttggtcca 4320 caatattttt tattttctat aattccattt ttagtc 4356 <210> 37 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> K2-2 like zinc finger domain <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(11) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (12)..(12) <223> Xaa can be K or R <220> <221> misc_feature <222> (14)..(15) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (18)..(18) <223> Xaa can be any naturally occurring amino acid <220> <221> MISC_FEATURE <222> (19)..(19) <223> Xaa can be R or N <220> <221> misc_feature <222> (20)..(20) <223> Xaa can be any naturally occurring amino acid <400> 37 Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa Xaa Gly 1 5 10 15 His Xaa Xaa Xaa His 20 <210> 38 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> consensus zinc finger domain <220> <221> misc_feature <222> (2)..(3) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (5)..(16) <223> Xaa can be any naturally occurring amino acid <220> <221> misc_feature <222> (18)..(20) <223> Xaa can be any naturally occurring amino acid <400> 38 Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 His Xaa Xaa Xaa His 20 <210> 39 <211> 163 <212> PRT <213> cichorium endivia <400> 39 Met Val Asp Asp Gly Thr Thr Ala Arg Gln Gln Val Asp Asp Gly Gly 1 5 10 15 His Gly Asn Pro Arg Pro Asn Pro Thr Thr Pro Pro Pro Ser Pro Ser 20 25 30 Arg Thr Pro Arg Arg Thr Arg Arg Ala Gly Ala Thr Thr Pro Ser Lys 35 40 45 Leu Ser Pro Ala Val Ser Ser Thr Thr Leu Pro Pro Pro Pro Thr Pro 50 55 60 Pro Thr Pro Pro Ala Asp Arg Leu Val Thr Gly Thr Ser Ser Ser Leu 65 70 75 80 Gly Thr Gln Arg Val Arg Arg Ser Lys Ser Val Ile Cys Pro Ile Cys 85 90 95 Lys Lys Asp Met Cys His Glu Lys Ala Leu Cys Gly His Ile Arg Trp 100 105 110 His Thr His Glu Glu Arg Gln Ala Ala Ser Ser Asp Ile Ala Arg Ala 115 120 125 Leu Ser Ser Asn Phe Ser Ser Gly His Gly Gly Glu Glu Gln Gly Pro 130 135 140 Ser Lys Arg Phe Lys Val Pro Asp Leu Asn Lys Pro Pro Pro Pro Glu 145 150 155 160 Glu Asp Asp <210> 40 <211> 161 <212> PRT <213> Hieracium aurantiacum <400> 40 Met Val Asp Asp Gly Thr Ala Ala Arg Gln Gln Val Asp Asp Gly Gly 1 5 10 15 His Gly Glu Arg Arg Pro Thr Pro Thr Thr Pro Pro Pro Ser Pro Ser 20 25 30 Arg Thr Pro Arg Arg Ser His Arg Pro Gly Thr Thr Pro Pro Ser Lys 35 40 45 Leu Ser Pro Ala Ala Ser Ser Thr Ala Leu Pro Pro Pro Pro Thr Pro 50 55 60 Pro Thr Pro Thr Val Val Ala Gly Ser Ser Ser Ser Leu Thr Thr Pro 65 70 75 80 Arg Ile Lys Arg Ser Lys Ser Val Ile Cys Pro Ile Cys Lys Lys Asp 85 90 95 Met Cys His Glu Lys Ala Leu Cys Gly His Ile Arg Trp His Thr Gln 100 105 110 Glu Glu Arg Leu Ala Ala Ser Gly Asp Ile Ala Arg Ala Leu Ser Ala 115 120 125 Asn Phe Val Ser Gly Gly Asn Gly Asp Glu Glu Gln Gly Ser Ser Lys 130 135 140 Arg Phe Lys Val Pro Asp Leu Asn Lys Pro Pro Pro Pro Glu Glu Asp 145 150 155 160 Asp <210> 41 <211> 166 <212> PRT <213> Senecio cambrensis <400> 41 Met Val Asn Ser Gly Asp Ala Ser Arg Ser Asp Asp Asn Pro Asn Thr 1 5 10 15 Pro Asn Arg Arg Ala Gly Lys Ala His Ala Ala Pro Ser Thr Ser Pro 20 25 30 Ser Ser Pro Pro Pro Pro Ile Gly Arg Leu Ser Ala Thr Thr Pro Leu 35 40 45 Ser Gly Ser Lys Arg Pro His Ser Pro Thr Lys Lys Ser Asn Phe Ile 50 55 60 Cys Pro Ile Cys Gly Lys Asp Leu Tyr His Ser Lys Ala Leu Asn Gly 65 70 75 80 His Ile Arg Trp His Ser Gln Met Glu Arg Glu Leu Lys Lys Lys Ala 85 90 95 Leu Arg Asp Ile Arg Glu Arg Asp Val Ala Val Val Ala Ala Ala Asp 100 105 110 Ala Val Gln Val Ala Pro Val Pro Ala Thr Val Pro Val Pro Val Pro 115 120 125 Thr Ile Val Arg Thr Arg Leu Phe His Glu Gln Pro Gln Pro Gln Pro 130 135 140 Gln Glu Glu Val Pro Tyr Asn Tyr Ala Tyr Leu Leu Pro Asp Leu Asn 145 150 155 160 Ala Ser Ala Asp Glu Glu 165 <210> 42 <211> 203 <212> PRT <213> Hevea brasiliensis <400> 42 Met Val Asn Ser Ser Pro Ser Ser Ser Ser Ser Ser Ser Ser Pro Thr 1 5 10 15 Pro Pro Pro Glu Val Gln Val Gly Pro Gly Gly Ser Ser Val Gly Gly 20 25 30 Glu Ser Glu Glu Gly Cys Ser Ser Arg Lys Lys Lys Ala Gly Ser Asn 35 40 45 Asp Gln Gln Gly Asp Glu Glu Gly Val Gln Lys Arg Leu Lys Arg Gly 50 55 60 Glu Met Asp Ser Pro Ile Ser Glu Pro Val Cys Cys Ile Cys Asn Lys 65 70 75 80 Lys Phe Gly Ser Trp Lys Gly Val Phe Gly His Met Arg Ala His Pro 85 90 95 Glu Arg Glu Trp Arg Gly Ala Phe Pro Pro Pro Lys Glu Lys Ala Gly 100 105 110 Ala Ile Asn Ile Asn His Gln Gln Ile Leu Gln Gln Gln Leu Ala Pro 115 120 125 Thr Leu Leu Ser Leu Gly Arg Glu Ala Leu Ala Arg Met Thr Asn His 130 135 140 His Gly Ser Gly Ala Ala Asn Ala Ala Ala Pro Ser Arg Arg Ala Gly 145 150 155 160 Asp Thr Glu Leu Asn Arg Glu Gln Gln Glu Leu Ala Gly Pro Ser Thr 165 170 175 Ile Ile His Pro Ser Leu Arg Gly Phe Asp Leu Asn Leu Pro Pro Pro 180 185 190 Pro Glu Glu Ala Asn Glu Asp Asp Arg Asn Asn 195 200 <210> 43 <211> 230 <212> PRT <213> Cucurbita moschata <400> 43 Met Glu Lys Asn Ala Asn Thr Asn Val Pro Ser Glu Thr Ser Ser Asp 1 5 10 15 Gln Arg His Gly Gly Glu Arg Ser Pro Thr Gly Pro Thr Ser Pro Pro 20 25 30 Pro Thr His Asn Arg Asp Asn Asn Pro Asn Pro Thr Thr Glu His Ser 35 40 45 Ser Tyr Ser Asp Thr Leu Arg Val Pro Pro Ala Ala Glu Thr Ser Arg 50 55 60 Arg Asp Ala Leu Leu Asp Val Gly Thr Ser Tyr Gln Asn Ile Val Gly 65 70 75 80 Ser Ser Glu Gly Glu Pro Gly Lys Lys Arg Gly Arg Gly Asp Gly Glu 85 90 95 Glu Glu Glu Glu Gln Gln Gln Pro Pro Gln Gln Gln Val Lys Ala Ala 100 105 110 Lys Lys Lys Gly Glu Leu Thr Glu Val Pro Lys Gly Glu Pro Arg Cys 115 120 125 Ala Thr Cys Asn Lys Val Phe Lys Ser Trp Lys Ala Leu Phe Gly His 130 135 140 Leu Arg Ser His Pro Glu Arg Thr Tyr Arg Gly Ala Leu Pro Pro Pro 145 150 155 160 Thr Ala Ala Glu Leu Asp Ile Arg Arg Cys Gln Gln Gln Leu Ala Ser 165 170 175 Thr Leu Leu Thr Val Ala Gln Glu Val Ala Ala Ser Arg Arg Gly Leu 180 185 190 Asp Ile Asp Leu Asn Gln Pro Ser Thr Ala Asp Asp Gly Asp Ser Pro 195 200 205 Glu Lys Thr Gly Gly Val Gly Phe Asp Leu Asn Ala Asp Pro Pro Pro 210 215 220 Glu Ser Asp Asp Glu Asp 225 230 <210> 44 <211> 242 <212> PRT <213> Eutrema salsugineum <400> 44 Met Val Thr Glu Glu Glu Ile Asn Glu Ile Ser Glu Asp Ser Gly Tyr 1 5 10 15 Leu Ser Ser Gly Glu Glu Gly Glu Ile Arg Glu Leu Val Cys Ala Leu 20 25 30 Pro Ala Leu Asn Val Thr Glu Arg Leu Asn Met Glu Glu Ala Gly Leu 35 40 45 His Asn Ala Val Val Ala Ala Glu Phe Val Met Val Ala Ser Glu Glu 50 55 60 Ala Pro Val Ser Lys Glu Asn Met Gln Thr Val Asp Ala Ile Asp Asp 65 70 75 80 Asp Ala Lys Asn Thr Ala Leu Gly Arg Arg Pro Arg Ile Asp Glu Leu 85 90 95 Asp Asp Ala Ala Gly Ala Ser Gly Ser Thr Ala Ile Gly Ser Gly Gly 100 105 110 Glu Asp Glu Pro Val Lys Lys Ala Lys Lys Lys Gly Ser Ser Gln Leu 115 120 125 His Ala Pro Pro Gln Gly Pro Pro Gln Cys Asn Ile Cys Gly Arg Asn 130 135 140 Phe Thr Ser Trp Lys Ala Val Phe Gly His Leu Arg Ala His Lys Asp 145 150 155 160 Arg Gly Tyr Gln Gly Phe Leu Pro Pro Pro Thr Phe Asn Ala Thr Glu 165 170 175 Glu Gly Phe Ser Ala Val Val Leu Ala Ser Asp Ser Ser Arg Gly Gly 180 185 190 Val Leu Gly Phe Gly Ser Ser Gly Ile Asp Leu Asn Leu Asp Pro Met 195 200 205 Glu Glu Glu Glu Glu Ala Val Ser Gly Phe Ile Pro Lys Phe Asp Leu 210 215 220 Asn Arg Ser Pro Pro Gln Glu Gly Gln Glu Glu Glu Glu Glu Asp Lys 225 230 235 240 Ala Lys <210> 45 <211> 244 <212> PRT <213> Arachis ipaensis <400> 45 Met Glu Lys Asn His Ser Thr Ser Ala Ser Thr Thr Ser Leu Pro Ser 1 5 10 15 Leu Ser Leu Ser Thr Pro Val Thr Glu Pro Pro Ser Ser Pro Leu Val 20 25 30 Asp Gln Pro Asn Leu Ser Gly Glu Glu Glu Lys Leu Asn Ile Leu Lys 35 40 45 Thr Pro Glu Lys Ile Leu Thr Asp Leu Thr Thr Asn Asn Asp Ala Asn 50 55 60 Gly Gly Ser Ala Leu Pro Pro Ser Ser Pro Pro Pro Ser Pro Pro Gln 65 70 75 80 Met Met Val Ser Gly Ala Ile Ala Thr Ala Val Gly Gly Gly Ala Val 85 90 95 Val Leu Gly Gly Asn Asn Ile Ile Gly Pro Ile Lys Arg Arg Lys Ala 100 105 110 Ser Glu Ile Met Asp Pro Pro Ser Gly Thr Pro Thr Cys Pro Ile Cys 115 120 125 Ser Lys Thr Phe Ser Ser Trp Lys Gly Ala Phe Gly His Met Arg Lys 130 135 140 His Pro Asp Arg Gln Tyr Arg Gly Phe Phe Lys Pro Pro Thr Phe Ala 145 150 155 160 Pro Ser Ser Ser Lys Ala Ala Thr Asn Ala Ser Gly Asn Arg His Glu 165 170 175 Ala Ala Gly Glu Glu Gly Ser Ser Ala Ala Ser Gly Glu Val Gly Glu 180 185 190 Gly Gly Ala Ser Pro Ala Val Arg Asn Leu Leu Phe Asp Leu Asn His 195 200 205 Pro Val Glu Gly Val Lys Asp Glu Glu Glu Gly Lys Ile Ile Leu Gly 210 215 220 Phe Asp Leu Asn Glu Pro Ala Val Glu Glu Glu Glu Glu Glu Lys Glu 225 230 235 240 Asp Lys Pro Phe <210> 46 <211> 202 <212> PRT <213> Cajanus cajan <400> 46 Met Gln Glu Gln Asn Pro Ser Glu Asn Ser Pro Ser Asn Asp Asp Ala 1 5 10 15 Pro Asn Pro Gln Gly Gly Glu Gly Glu Ile Met Lys Thr Pro Trp Gln 20 25 30 Val Leu Glu Glu Leu Cys Gly Gly Ser Ser Thr Pro Val Ala Val Ala 35 40 45 Pro Val Ser Glu Gly Val Leu Gln Pro Lys Lys Arg Lys Thr Ser Glu 50 55 60 Val Arg Asp Pro Pro Arg Gly Lys Pro Ile Cys Pro Val Cys Asn Lys 65 70 75 80 Glu Phe Thr Ser Trp Lys Ala Ala Phe Gly His Met Arg Ala His Pro 85 90 95 Asn Arg Asp Tyr Arg Gly Phe Tyr Lys Pro Pro Ala Phe Pro Ser Ser 100 105 110 Ser Ser Ser Lys Asp Gln Pro Pro Pro Ser Ala Asn Asn Asn Lys Gly 115 120 125 Gly Gly Ala Lys Lys Thr Asn Ala Ala Ser Asp Gly Thr Asp Glu Val 130 135 140 Asp Ser Gly Gly Gly Lys Glu Val Thr Pro Ser Pro Asn Gln Leu Phe 145 150 155 160 Gly Phe Asp Leu Asn Glu Pro Val Glu Gly Leu Gly Ser Ser His Ala 165 170 175 Val Glu Glu Gly Val Gln Glu Glu Lys Asp Leu Gly Phe Asp Leu Asn 180 185 190 Glu Met Pro Pro Ala Glu Asp His Glu Gly 195 200 <210> 47 <211> 265 <212> PRT <213> Brassica rapa <400> 47 Met Thr Asn Pro Glu Lys Met Lys Val Asp Gly Asp Thr Glu Lys Glu 1 5 10 15 Lys Glu Asp Ser Ser Asp Glu Gln Trp Ser Asp Glu Glu Ser Ala Met 20 25 30 Arg Glu Ile Val Leu Gly Leu Pro Ala Leu Ser Ile Ser Ser Ala Thr 35 40 45 Phe Gly Val Ser Ile Ala Val Asp Glu Glu Glu Glu Ala Arg Leu Asn 50 55 60 Glu Gln Ala Val Val Ala Ala Glu Leu Val Ile Ala Ala Ala Glu Glu 65 70 75 80 Ala Val Met Lys Glu Lys Ser Asp Gly Lys Lys Lys Lys Val Arg Arg 85 90 95 Gln Arg Lys Thr Met Lys Leu Asn Asn Asp Asp Glu Ala Gly Gly Ser 100 105 110 Ser Lys Gly Gly Glu Ala Ala Lys Lys Pro Arg Lys Lys Thr Ser Glu 115 120 125 Phe Thr Asn Leu Pro Arg Gly Pro Pro Val Cys Asn Val Cys Gly Arg 130 135 140 Ala Phe His Ser Trp Lys Ala Val Phe Gly His Leu Arg Ser His Lys 145 150 155 160 Asp Arg Ser Tyr Arg Gly Phe Leu Pro Pro Pro Arg Phe Ser Ala Pro 165 170 175 Ile Arg Gly Val Met Ile Pro Gly Pro Asn Ser Ala Phe Val Arg Val 180 185 190 Val Ala Arg Gly Gly Ser Ser Gly Val Val Val Ala Ser Gly Gly Gly 195 200 205 Gly Gly Gly Gly Ala Ser Gly Gly Glu Gly Gly Arg Gly Val Gly Ile 210 215 220 Val Met Asp Val Asp Arg Val Glu Lys Glu Lys Gln Glu Val Thr Glu 225 230 235 240 Ser Gly Thr Ala Ala Lys Phe Asp Leu Asn Lys Ser Pro Pro Lys Asp 245 250 255 Asp Asp Glu Glu Glu Asp Lys Thr Lys 260 265 <210> 48 <211> 237 <212> PRT <213> Lagenaria siceraria <400> 48 Met Glu Lys Asn Thr Asn Ala Asn Ala Asn Asp Asn Thr Val Ser Glu 1 5 10 15 Thr Ser Pro Asp Gln Arg His Gly Gly Glu Arg Ser Pro Met Ala Ser 20 25 30 Ser Pro Pro Pro Ser Ala Arg Asn Asp Asp Val Asn Asn Pro Thr Pro 35 40 45 Asn Val Val Ile Glu Leu Ser Ser Ser Val Val Val Ala Ala Pro Glu 50 55 60 Ser Thr Thr Thr Gly Asp Val Arg Arg Arg Gln Thr Val Asp Ala Thr 65 70 75 80 Leu Leu Asp Val Gly Thr Ser Ser His Asp His Val Gly Gly Ser Ser 85 90 95 Asp Ile Glu Gln Gly Lys Lys Arg Gly Arg Gly Asp Gly Gly Glu Gln 100 105 110 Gln Gln Gln Val Lys Ala Ala Lys Lys Lys Gly Glu Leu Thr Glu Val 115 120 125 Pro Lys Gly Glu Pro Arg Cys Ala Thr Cys Asn Lys Val Phe Lys Ser 130 135 140 Trp Lys Ala Leu Phe Gly His Leu Arg Ser His Pro Glu Arg Thr Tyr 145 150 155 160 Arg Gly Ala Leu Pro Pro Pro Thr Ala Ala Glu Leu Asp Ile Arg Arg 165 170 175 Cys Gln Gln Gln Leu Ala Ser Thr Leu Leu Thr Val Ala Gln Gln Val 180 185 190 Ala Thr Ser Arg Arg Gly Leu Asn Ile Asp Leu Asn Gln Pro Ser Ala 195 200 205 Ala Asp Asp Gly Asp Ser Pro Glu Lys Thr Gly Ser Val Gly Phe Asp 210 215 220 Leu Asn Val Glu Pro Pro Pro Glu Ser Asp Asp Glu Lys 225 230 235 <210> 49 <211> 243 <212> PRT <213> Arachis ipaensis <400> 49 Met Asp Lys Asn Ala Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 1 5 10 15 Ser Ser Pro Ser Thr Ser Thr Thr Glu Gln Pro Pro Pro Pro Ser Pro 20 25 30 Gln Asp Val Pro Val Glu Glu Pro Pro Val Ile Leu Lys Thr Pro Glu 35 40 45 Glu Val Leu Ala Glu Leu Thr Glu Ser Gly Glu Ser Pro Pro Pro Pro 50 55 60 Pro Pro Ser Ala Ala Glu Glu Gly Gly Ile Gly Gly Ser Ala Met Ala 65 70 75 80 Ile Ala Val Gly Val Gly Gly Glu Gly Val Val Leu Gly Glu Ala Gly 85 90 95 Ser Gly Gly Ser Gly Ala Val Gly Ala Ser Arg Lys Arg Lys Ala Ser 100 105 110 Glu Val Lys Asp Pro Pro Thr Gly Thr Pro Thr Cys Pro Val Cys Asn 115 120 125 Lys Thr Phe Ala Ser Trp Lys Gly Ala Phe Gly His Met Arg Lys His 130 135 140 Pro Asp Arg Gln Tyr Arg Gly Phe Phe Lys Pro Pro Thr Phe Thr Ser 145 150 155 160 Ser Val Ala Ala Ala Ala Thr Ser Gly Ala Thr Thr Gln Gly Phe Val 165 170 175 Glu Gly Gly Ser Ser Ala Ala Ser Gly Glu Gly Gly Ser Val Gly Ala 180 185 190 Ala Gly Gln Val Gly Glu Gly Gly Ser Phe Asp Leu Asn Gln Pro Val 195 200 205 Met Glu Arg Gly Gly Ala Gly Asp Gly Asp Glu Gly Arg Asn Gly Asp 210 215 220 Glu Gly Lys Asp Leu Gly Phe Asp Leu Asn Lys Pro Ala Asp Glu Glu 225 230 235 240 Asp Lys Ala <210> 50 <211> 271 <212> PRT <213> Prunus persica <400> 50 Met Ala Asn Gln Gln Asn Thr Thr Thr Asn Asn Thr Asn Arg Leu Ala 1 5 10 15 Ser Ser Ala Glu Gly Gln Gln Gln Pro Gly Asn Asp Asn Val Asn Val 20 25 30 Asn Val Thr Gly Val Ala Ala Thr Gly Thr Pro Ser Phe Pro Asn Pro 35 40 45 Pro Pro Pro Ser Thr Val Gln Leu Asn Val Ala Arg Gly Ser Ser Val 50 55 60 Ser Pro Pro Gly Leu Asn Arg Gly Pro Ser Gly Arg Gly Ser Ser Asn 65 70 75 80 Pro Arg Arg Val Ser Pro Ser Gly Arg Lys Ser Pro Pro Gly Gly Arg 85 90 95 Gly Ser Pro Ser Ser Gly Arg Gly Ser Ser Ser Phe Ala Ser Ser Pro 100 105 110 Gly Ala Gly Gln Ile Thr Gln Ile Gly Gly Arg Asn Phe Thr Pro Leu 115 120 125 Ser Val Glu Ile Thr Ile Gly Gly Gly Ser Gly Thr Ala Gly Gly Ser 130 135 140 Met Ile Pro Gly Ser Ser Ser Gly Ser Pro Pro Arg Ala Lys Arg Lys 145 150 155 160 Ala Glu Ile Thr Ala Pro Glu Gly Val Ser Pro Val Cys Ser Val Cys 165 170 175 Lys Arg Ser Asn Phe Ser Ser Trp Lys Ala Leu Phe Gly His Met Arg 180 185 190 Cys His Pro Glu Arg Gln Trp Arg Gly Cys Phe Pro Pro Pro Gly Phe 195 200 205 Glu Glu Ala Gln Arg Ala Leu Gln Gln Gly Glu Arg Leu Gly Ala Leu 210 215 220 Arg Gly Phe Asp Leu Asn Glu Ala Ser Asp Pro Glu Glu Glu Asn Glu 225 230 235 240 Gly Gly Gly Gly Gly Gly Phe Asp Leu Asn Met Leu Pro Pro Asp Glu 245 250 255 Asp Lys Asp Gly Gly Gly Ser Ser Gly Gly Ala Ala Lys Thr Gly 260 265 270 <210> 51 <211> 321 <212> PRT <213> Glycine max <400> 51 Met Gln Asn Gln Asn Pro Ser Glu Asp Asp Ser Thr Asn Lys Ala Pro 1 5 10 15 Ser Asp Asp Thr Pro His Pro Thr Asn Asn Asp Asn Asn Asn Pro Pro 20 25 30 Gly Glu Ser Leu Ile Met Lys Thr Val Arg Gln Val Leu Glu Glu Leu 35 40 45 Gly Gly Ser Arg Asp Asp Asn Asp Gly Gly Val Gly Asp Gly Thr Pro 50 55 60 Val Ala Val Ala Leu Glu Val Gly Gly Gly Gly Asp Gly Ser Gly Gly 65 70 75 80 Asp Gly Gly Gly Val Gly Gly Gly Pro Pro Val Ala Met Glu Ala Ser 85 90 95 Asp Gly Gly Asp Glu Asp Asn Asp Asn Glu His Ser Asp Ser Ile Gly 100 105 110 Asp Ser Val Pro Val Ala Val Ala Val Lys Val Gly Gly Arg Gly Gly 115 120 125 Asp Asn Ser Gly Gly Gly Ala Thr Val Thr Val Ser Val Ala Leu Ser 130 135 140 Asp Gly Asp Tyr Gly Gly Ser Asn Gly Ser Gly Gly Ser Pro Val Ala 145 150 155 160 Val Ala Val Ala Val Gly Gly Gly Ser Thr Val Met Glu Ser Val Val 165 170 175 Val Gly Thr Glu Gly Val Gln Gly Arg Lys Arg Lys Thr Pro Leu Val 180 185 190 Arg Asp Pro Pro Thr Gly Arg Pro Thr Cys Pro Leu Cys Gln Lys Glu 195 200 205 Phe Gln Thr Trp Lys Gly Ala Phe Gly His Met Arg Ala His Pro Asp 210 215 220 Arg Asp Tyr Arg Gly Phe Phe Lys Pro Pro Val Phe Gly Ser Pro Ser 225 230 235 240 Ser Thr Gln Asp Gln Pro Pro Ser Asp Gly Lys Gly Asp Asp Ser Ala 245 250 255 Lys Lys Ser Thr Gly Glu Asp Asn Thr Ala Glu Lys Gly Ser Ala Ser 260 265 270 Leu Pro Val Arg Val Pro Met Phe Asp Leu Asn Glu Leu Ile Glu Glu 275 280 285 Asp Gly Ser Ser His Ala Ala Glu Pro Ala Glu Asp Met Ser Thr Gly 290 295 300 Glu Gly Lys Gly Ser Gly Phe Asp Leu Asn Glu Met Pro Pro Ala Glu 305 310 315 320 Asp <210> 52 <211> 355 <212> PRT <213> Glycine max <400> 52 Met Asn His His Lys Tyr Ser Ser His Arg His Asn Leu Phe Asn Ser 1 5 10 15 Phe Leu Thr Leu Ala Ile Phe Ile Ile Leu Gly Phe Ser Phe Ser Ala 20 25 30 Thr Gly Met Gln Asn Gln Asn Pro Ser Glu Asp Asp Ser Thr Asn Lys 35 40 45 Ala Pro Ser Asp Asp Thr Pro His Pro Thr Asn Asn Asp Asn Asn Asn 50 55 60 Pro Pro Gly Glu Ser Leu Ile Met Lys Thr Val Arg Gln Val Leu Glu 65 70 75 80 Glu Leu Gly Gly Ser Arg Asp Asp Asn Asp Gly Gly Val Gly Asp Gly 85 90 95 Thr Pro Val Ala Val Ala Leu Glu Val Gly Gly Gly Gly Asp Gly Ser 100 105 110 Gly Gly Asp Gly Gly Gly Val Gly Gly Gly Pro Pro Val Ala Met Glu 115 120 125 Ala Ser Asp Gly Gly Asp Glu Asp Asn Asp Asn Glu His Ser Asp Ser 130 135 140 Ile Gly Asp Ser Val Pro Val Ala Val Ala Val Lys Val Gly Gly Arg 145 150 155 160 Gly Gly Asp Asn Ser Gly Gly Gly Ala Thr Val Thr Val Ser Val Ala 165 170 175 Leu Ser Asp Gly Asp Tyr Gly Gly Ser Asn Gly Ser Gly Gly Ser Pro 180 185 190 Val Ala Val Ala Val Ala Val Gly Gly Gly Ser Thr Val Met Glu Ser 195 200 205 Val Val Val Gly Thr Glu Gly Val Gln Gly Arg Lys Arg Lys Thr Pro 210 215 220 Leu Val Arg Asp Pro Pro Thr Gly Arg Pro Thr Cys Pro Leu Cys Gln 225 230 235 240 Lys Glu Phe Gln Thr Trp Lys Gly Ala Phe Gly His Met Arg Ala His 245 250 255 Pro Asp Arg Asp Tyr Arg Gly Phe Phe Lys Pro Pro Val Phe Gly Ser 260 265 270 Pro Ser Ser Thr Gln Asp Gln Pro Pro Ser Asp Gly Lys Gly Asp Asp 275 280 285 Ser Ala Lys Lys Ser Thr Gly Glu Asp Asn Thr Ala Glu Lys Gly Ser 290 295 300 Ala Ser Leu Pro Val Arg Val Pro Met Phe Asp Leu Asn Glu Leu Ile 305 310 315 320 Glu Glu Asp Gly Ser Ser His Ala Ala Glu Pro Ala Glu Asp Met Ser 325 330 335 Thr Gly Glu Gly Lys Gly Ser Gly Phe Asp Leu Asn Glu Met Pro Pro 340 345 350 Ala Glu Asp 355 <210> 53 <211> 357 <212> PRT <213> Glycine max <400> 53 Met Asn His His Lys Tyr Ser Ser His Arg His Asn Leu Phe Asn Ser 1 5 10 15 Phe Leu Thr Leu Ala Ile Phe Ile Ile Leu Gly Phe Ser Phe Ser Ala 20 25 30 Thr Gly Met Gln Asn Gln Asn Pro Ser Glu Asp Asp Ser Thr Asn Lys 35 40 45 Ala Pro Ser Asp Asp Thr Pro His Pro Thr Asn Asn Asp Asn Asn Asn 50 55 60 Pro Pro Gly Glu Ser Leu Ile Met Lys Thr Val Arg Gln Val Leu Glu 65 70 75 80 Glu Leu Gly Gly Ser Arg Asp Asp Asn Asp Gly Gly Val Gly Asp Gly 85 90 95 Thr Pro Val Ala Val Ala Leu Glu Val Gly Gly Gly Gly Asp Gly Ser 100 105 110 Gly Gly Asp Gly Gly Gly Val Gly Gly Gly Pro Pro Val Ala Met Glu 115 120 125 Ala Ser Asp Gly Gly Asp Glu Asp Asn Asp Asn Glu His Ser Asp Ser 130 135 140 Ile Gly Asp Ser Val Pro Val Ala Val Ala Val Lys Val Gly Gly Arg 145 150 155 160 Gly Gly Asp Asn Ser Gly Gly Gly Ala Thr Val Thr Val Ser Val Ala 165 170 175 Leu Ser Asp Gly Asp Tyr Gly Gly Ser Asn Gly Ser Gly Gly Ser Pro 180 185 190 Val Ala Val Ala Val Ala Val Gly Gly Gly Ser Thr Val Met Glu Ser 195 200 205 Val Val Val Gly Thr Glu Gly Val Gln Gly Arg Lys Arg Lys Thr Pro 210 215 220 Leu Val Arg Asp Pro Pro Thr Gly Arg Pro Thr Cys Pro Leu Cys Gln 225 230 235 240 Lys Glu Phe Gln Thr Trp Lys Gly Ala Phe Gly His Met Arg Ala His 245 250 255 Pro Asp Arg Asp Tyr Arg Gly Phe Phe Lys Pro Pro Val Phe Gly Ser 260 265 270 Pro Ser Ser Thr Gln Asp Gln Pro Pro Ser Asp Gly Lys Val Ala Gly 275 280 285 Asp Asp Ser Ala Lys Lys Ser Thr Gly Glu Asp Asn Thr Ala Glu Lys 290 295 300 Gly Ser Ala Ser Leu Pro Val Arg Val Pro Met Phe Asp Leu Asn Glu 305 310 315 320 Leu Ile Glu Glu Asp Gly Ser Ser His Ala Ala Glu Pro Ala Glu Asp 325 330 335 Met Ser Thr Gly Glu Gly Lys Gly Ser Gly Phe Asp Leu Asn Glu Met 340 345 350 Pro Pro Ala Glu Asp 355 <210> 54 <211> 324 <212> PRT <213> Glycine max <400> 54 Met Gln Asn Gln Asn Pro Ser Glu Asp Asp Ser Thr Lys Lys Ser Pro 1 5 10 15 Ser Ser Pro Ser Asp Asp Thr Ser His Pro Thr Asn Asn Asn Asn Asn 20 25 30 Pro Gln Gly Glu Ser Leu Val Met Lys Thr Val Trp Gln Val Leu Glu 35 40 45 Glu Leu Gly Gly Ser Gly Asp Asp Ser Asp Gly Asp Ser Gly Phe Gly 50 55 60 Asp Gly Ala Pro Val Ala Val Ala Val Gly Gly Gly Gly Asp Asp Asn 65 70 75 80 Gly Asp Gly Asp Gly Ser Val Gly Gly Gly Ala Thr Val Ala Met Glu 85 90 95 Lys Ser Asp Asp Asp Ser Asp Asn Asn Gly Asp Asn Ser Gly Ser Asn 100 105 110 Leu Ala Val Ala Val Val Val Gly Gly Gly Asp Gly Ser Gly Ser Ser 115 120 125 Gly Val Gly Ala Thr Val Thr Val Ser Val Ala Val Ser Gly Gly Gly 130 135 140 Gly Asn His Gly Gly Gly Ser Ser Gly Gly Gly Gly Gly Gly Pro Val 145 150 155 160 Ala Val Ser Val Ala Val Gly Gly Gly Ser Thr Val Val Glu Ser Val 165 170 175 Val Val Ser Thr Glu Gly Val Gln Gly Arg Lys Arg Lys Thr Ser Ile 180 185 190 Val Arg Asp Pro Pro Thr Gly Arg Pro Thr Cys Pro Leu Cys Gln Lys 195 200 205 Glu Phe Pro Thr Trp Lys Gly Ala Phe Gly His Met Arg Ala His Pro 210 215 220 Asp Arg Asp Tyr Arg Gly Phe Phe Lys Pro Pro Val Phe Gly Ser Pro 225 230 235 240 Ser Ser Thr Gln Asp Gln Pro Pro Arg Asp Asp Lys Val Ala Gly Asp 245 250 255 Asp Ser Ala Lys Lys Ser Ser Gly Glu Val Asn Asn Gly Glu Lys Gly 260 265 270 Ser Ala Ser Ser His Val Arg Val Pro Met Phe Asp Leu Asn Glu Pro 275 280 285 Ile Glu Glu Glu Gly Ser Ser His Ala Ala Glu Pro Ala Glu Asp Met 290 295 300 Ser Ser Glu Glu Gly Lys Gly Phe Gly Phe Asp Leu Asn Glu Met Pro 305 310 315 320 Pro Ala Glu Asp <210> 55 <211> 280 <212> PRT <213> Cicer arietinum <400> 55 Met Lys Arg Phe Cys His Ser Phe His Lys Thr Glu Lys His Asp Asp 1 5 10 15 Tyr Val Trp Pro Leu Leu Ala His Glu Met Lys Lys Asn Gly Ser Arg 20 25 30 Ile Phe Ile Cys Asp Leu Cys Asp Lys Ser Phe Ser Ser Gly Asn Ala 35 40 45 Leu Gly Gly His Lys Ala Ser His Asn Arg Ser Asp Leu Leu Gln Pro 50 55 60 Pro Ile Lys Lys His Lys Leu Thr Ile Asp Ser Cys Ser Leu Ser Ser 65 70 75 80 Pro Asn Asp His Asp Asp Val Lys His Lys His Ala Cys Val Leu Cys 85 90 95 His Lys Val Phe Pro Ser Asn Lys Ala Leu Tyr Gly His Met Arg Ser 100 105 110 His Ser Gln Lys Asp Ser Lys Ala Ile Gln Pro Pro Leu Ile Thr Thr 115 120 125 Thr Ser Arg Asp Ser Lys Ile Gln Ser Asn Asn Thr Asp Asp Gln Pro 130 135 140 Ile Leu Pro Ala Ile Asp Leu Glu Lys Tyr Phe Pro Pro Arg Ser His 145 150 155 160 Gln Thr Lys Lys Arg Cys Ser Lys Ser Thr Ile Asp Tyr Glu Leu Ile 165 170 175 Asn Val Ala Gln Ile Leu Cys Asp Met Ser Arg Ser Asp Pro Thr Lys 180 185 190 Phe Thr Thr Asn Ile Asp Asn Gln Arg Asn Lys Glu His Val Thr Ile 195 200 205 Val Lys Asn Asn Asn Asn Pro Lys Lys Leu Val Val Thr Phe Lys Ile 210 215 220 Pro Lys Asp Lys Thr Phe Lys Ile Pro Lys Asp Lys Glu Glu Lys Asn 225 230 235 240 Lys Glu Ala Glu Met Glu Lys Glu Ser Ser His Gln Leu Gly Ser Arg 245 250 255 Ala Val Ala Lys Asp Phe Asp Leu Asn Glu Ile Pro Val Asp Leu Asp 260 265 270 Leu Val Ala Asp Glu Gln Ala Pro 275 280 <210> 56 <211> 290 <212> PRT <213> Cicer arietinum <400> 56 Met Asp Val Asp Glu Leu Gln Ala Ala Glu Arg Glu Asp Arg Arg Ser 1 5 10 15 Ile Ile Ile Met Lys Arg Ser Cys Gln Ser Phe Asp Lys Pro Met Lys 20 25 30 Asn Asp Asp Phe Val Trp Pro Leu Leu Ala Asn Glu Met Lys Lys Asn 35 40 45 Gly Ser Arg Ile Phe Ile Cys Asp Leu Cys Gly Lys Ser Phe Ser Ser 50 55 60 Gly Asn Ala Leu Gly Gly His Lys Ala Ser His Asn Arg Ser Asn Leu 65 70 75 80 Leu Gln Pro Pro Ile Lys Lys His Lys Leu Thr Ile Asp Ser Cys Ser 85 90 95 Leu Ser Ser Pro His Asp His Asp Asp Val Lys His Lys His Ala Cys 100 105 110 Val Leu Cys His Lys Val Phe Pro Ser Asn Lys Val Leu Tyr Gly His 115 120 125 Met Arg Ser His Ser Gln Lys Asp Ser Lys Ala Ile Gln Pro Pro Pro 130 135 140 Ile Thr Thr Thr Ser Pro Asp Ser Lys Lys Gln Ser Asn Asn Thr His 145 150 155 160 Asp Gln Pro Ile Leu Pro Thr Ile Asp Leu Glu Lys Tyr Phe Pro Pro 165 170 175 Arg Ser His Gln Thr Lys Lys Arg Arg Ser Lys Ser Ile Ile Asp Tyr 180 185 190 Glu Leu Ile Asn Val Ala Gln Ile Leu Cys Asp Met Ser Arg Ser Asp 195 200 205 Pro Lys Arg Leu Lys Leu Ser Thr Asn Ile Asp Asn Gln Lys Asn Lys 210 215 220 Glu His Val Thr Ile Val Lys Asn Asn Asn Asn Glu Lys Lys Leu Val 225 230 235 240 Val Arg Phe Lys Ile Pro Lys Asp Lys Glu Val Lys Asn Asn Glu Gly 245 250 255 Glu Thr Lys Lys Glu Ser Ser His Gln Leu Gly Ser Arg Gly Val Val 260 265 270 Lys Asp Phe Asp Leu Asn Glu Ile Pro Val Asp Val Ala Asp Glu Gln 275 280 285 Ala Asn 290 <210> 57 <211> 246 <212> PRT <213> Cicer arietinum <400> 57 Met Lys Lys Asn Gly Ser Arg Ile Phe Ile Cys Asp Leu Cys Gly Lys 1 5 10 15 Ser Phe Ser Ser Gly Asn Ala Leu Gly Gly His Lys Ala Ser His Asn 20 25 30 Arg Ser Asn Leu Leu Gln Pro Pro Ile Lys Lys His Lys Leu Thr Ile 35 40 45 Asp Ser Cys Ser Leu Ser Ser Pro His Asp His Asp Asp Val Lys His 50 55 60 Lys His Ala Cys Val Leu Cys His Lys Val Phe Pro Ser Asn Lys Val 65 70 75 80 Leu Tyr Gly His Met Arg Ser His Ser Gln Lys Asp Ser Lys Ala Ile 85 90 95 Gln Pro Pro Pro Ile Thr Thr Thr Ser Pro Asp Ser Lys Lys Gln Ser 100 105 110 Asn Asn Thr Asp Asp Gln Pro Ile Leu Pro Thr Ile Asp Leu Glu Lys 115 120 125 Tyr Phe Pro Pro Arg Ser His Gln Thr Lys Lys Arg Arg Ser Lys Ser 130 135 140 Ile Ile Asp Tyr Glu Leu Ile Asn Val Ala Gln Ile Leu Cys Asp Met 145 150 155 160 Ser Arg Ser Asp Pro Lys Arg Leu Lys Leu Ser Thr Asn Ile Asp Asn 165 170 175 Gln Lys Asn Lys Glu His Val Thr Ile Val Lys Asn Asn Asn Asn Glu 180 185 190 Lys Lys Leu Val Val Arg Phe Lys Ile Pro Lys Asp Lys Glu Val Lys 195 200 205 Asn Asn Glu Gly Glu Thr Lys Lys Glu Ser Ser His Gln Leu Gly Ser 210 215 220 Arg Gly Val Val Lys Asp Phe Asp Leu Asn Glu Ile Pro Val Asp Val 225 230 235 240 Ala Asp Glu Gln Ala Asn 245 <210> 58 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> EAR motif <220> <221> misc_feature <222> (4)..(5) <223> Xaa can be any naturally occurring amino acid <400> 58 Asp Leu Asn Xaa Xaa Pro 1 5 <210> 59 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> EAR motif <220> <221> misc_feature <222> (4)..(4) <223> Xaa can be any naturally occurring amino acid <400> 59 Asp Leu Asn Xaa Pro 1 5 <210> 60 <211> 1335 <212> DNA <213> Artificial Sequence <220> <223> Tar-MITE insert <400> 60 actgctacca gggccggcca gaaggctgtg cggcttgggc tgtggcacag gggcagcaga 60 tttagtccat ttattatggt ctgctattta tttgggtcca ataagatcag ggcactaaaa 120 ctcaaataca tcaattcaag tcggcggcaa aagaataaaa agcgccaatt tttagaagac 180 aaggagacag cacaataatc atgcttttcc aatggccaat taattttagc ctttgtgagg 240 tataaatatg aatcactttt tctccaaata tcattattgt aaactagtaa agagcgtaaa 300 ttgttttatc gctaatcttc ttctttttca aatataattg tttgattctt tgtagtaggt 360 acgttaagtt ttatatcatt cgtcctggaa accttttctt atgccccttc aatttatgaa 420 tttgtgtttt gtattgtctt gctattaatc caatgcaaac taattctgcc gcatcgatct 480 cacagagttg gagcagctta aaaggagttt tggggcaact taaaatgagg gtagcttttt 540 tgttgttgtt ggtctactat ttactttggt ccttatcgtt ttagttttgt gttcattgag 600 gatttgaatg actttgaaca caagtttata aaactaagtt tttgtgattc taaatttttg 660 atgtgtgcaa ccgactaaat gaatataaaa ttctgatttg tgtatttctg atttctgatt 720 taccggttat tcattatgtt tttctggatc tcatatgaat ttagtatata aaaatctcag 780 gttcttctta ctcagtctag tatattttgg cattggggat cagggttaaa atcatcattt 840 ttctaagcac taacaagctt taaaaccatc aattaaaagt tagttctcca tacctggaat 900 tgtttattgc tttagtattc atttcatagt gtcaatacct tacaactgtt tattgttttc 960 aaatgtttac tgttttgcac tttagttgtt tttagcatgt ttcaactttc aaagttaatt 1020 gacgatagtg tcatatacga aatatcatca ctcatacaaa attaaactgg atagaatttt 1080 ttccgatgaa atctattttt aaatagttac gaatataata ggagacttaa tatgtttgtt 1140 tcaaaattac acaaaaacac catggaaatg ggcattagtt tgtataagca tccttttaaa 1200 tataaagctt tgttacattg atgccttcta aatatataat attgtaatga tttgtagtaa 1260 acaccatgga aatgggcatt attaagatgt ttcgcccagg gcatgaaaaa ctatcggacc 1320 ggccctgact gctac 1335 <210> 61 <211> 2622 <212> DNA <213> Artificial Sequence <220> <223> LsPromoter-with-deletion_LsCoding sequence_To3'UTR <400> 61 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaccgccac aaataaccgt caccggaata cctataaata caacttccat 1080 ttcaatcgtc tctctctgca ctcccattct ttgaatccaa aaaaggctac acacacacac 1140 agacaacaat ggcagatgat ggcaacaccg cccgtcaaca ggctgacgcc ggtggccatg 1200 gaaacgcacg tccaaactca tccacccccc cttcgtcacc ctcccaacct ccaagaagac 1260 cacgccgtgc cggagccact acaccgtcaa agctttccca ggcggcatct tcgtcaacaa 1320 atcttccacc gccgccaacg ccaacaccaa ctccgcccac cccttctgcc gacgggatat 1380 tactaggtac tgcaagaagg ccggtaatat gcccgatttg caaaaaggat atgtatcatg 1440 aaaaggcgct gtgtggccac atccggtggc acacgcagga ggagagactg gcggcaagca 1500 gggatattgc ccgggcgctt tctgccaacg ttgtttctgg gcaaagaggc gatggagaac 1560 aagggccgtc taaacggttc aaactgccgg atcttaacga gccaccaccg tcggaggact 1620 gattttcttg cgggagaggc atgcatgtat gtgtggcctt tttgcaataa tactatgcat 1680 gggagatgca taaagtttat ctttattttt tttagtttaa taatgtgtgg caaactttat 1740 atcatttatg atttcggcca tgtactgcta catcgttcta ggatggttat tccctagaat 1800 ttgctttatg tatttgtttt ctttgttaat tcttctcttc cttaaacgtt atttcatgtg 1860 aattgcgatg tcatgatatt gcaggaatgt aacttagaac tcaacgataa aaagtgtgtt 1920 gagatcgtgg aagttgatca tttatcttga attcataaga taagcaacat gagataggat 1980 aattaattac tgtggggatt tctttttata ttcatattat tcgttgtaat gcaaattttt 2040 aagtagaata acgaatgtgt cttattattt acggttaaat gcaaaagatc attaacatat 2100 ctccattgat ttgtttactg atgtattctc atgtgttctg ttgctaaatt ctattttgaa 2160 aagtatattc aattaaagca atgcatttta gatataaagc aactccataa cttataattg 2220 tgtagatttt taccaattca atgtcttaaa agaaaaataa aaattgaaag tttaattaat 2280 tgccatagtg atcccgttcc cgtcaattat gtgatcaatt tttaccagag caaaacccca 2340 catttcttgt agtgaacaat ctgtggatga taaccgatcg aagacttttg tggggatttc 2400 actaaccaac tatttggctc tcattaatta ctattagtta tataaggcca tcccaagtat 2460 tttggcaata ttcaaaacga gtaaactata aaattacact tttggttctt gtatttctaa 2520 cttttagaat tatgtatttg gttcttatag ttttttattt gtatgaatta cattactttt 2580 ggtccacaat attttttatt ttctataatt ccatttttag tc 2622 <210> 62 <211> 300 <212> PRT <213> Arabidopsis thaliana <400> 62 Met Arg Lys Met Glu Ala Lys Lys Glu Glu Ile Lys Lys Gly Pro Trp 1 5 10 15 Lys Ala Glu Glu Asp Glu Val Leu Ile Asn His Val Lys Arg Tyr Gly 20 25 30 Pro Arg Asp Trp Ser Ser Ile Arg Ser Lys Gly Leu Leu Gln Arg Thr 35 40 45 Gly Lys Ser Cys Arg Leu Arg Trp Val Asn Lys Leu Arg Pro Asn Leu 50 55 60 Lys Asn Gly Cys Lys Phe Ser Ala Asp Glu Glu Arg Thr Val Ile Glu 65 70 75 80 Leu Gln Ser Glu Phe Gly Asn Lys Trp Ala Arg Ile Ala Thr Tyr Leu 85 90 95 Pro Gly Arg Thr Asp Asn Asp Val Lys Asn Phe Trp Ser Ser Arg Gln 100 105 110 Lys Arg Leu Ala Arg Ile Leu His Asn Ser Ser Asp Ala Ser Ser Ser 115 120 125 Ser Phe Asn Pro Lys Ser Ser Ser Ser His Arg Leu Lys Gly Lys Asn 130 135 140 Val Lys Pro Ile Arg Gln Ser Ser Gln Gly Phe Gly Leu Val Glu Glu 145 150 155 160 Glu Val Thr Val Ser Ser Ser Cys Ser Gln Met Val Pro Tyr Ser Ser 165 170 175 Asp Gln Val Gly Asp Glu Val Leu Arg Leu Pro Asp Leu Gly Val Lys 180 185 190 Leu Glu His Gln Pro Phe Ala Phe Gly Thr Asp Leu Val Leu Ala Glu 195 200 205 Tyr Ser Asp Ser Gln Asn Asp Ala Asn Gln Gln Ala Ile Ser Pro Phe 210 215 220 Ser Pro Glu Ser Arg Glu Leu Leu Ala Arg Leu Asp Asp Pro Phe Tyr 225 230 235 240 Tyr Asp Ile Leu Gly Pro Ala Asp Ser Ser Glu Pro Leu Phe Ala Leu 245 250 255 Pro Gln Pro Phe Phe Glu Pro Ser Pro Val Pro Arg Arg Cys Arg His 260 265 270 Val Ser Lys Asp Glu Glu Ala Asp Val Phe Leu Asp Asp Phe Pro Ala 275 280 285 Asp Met Phe Asp Gln Val Asp Pro Ile Pro Ser Pro 290 295 300 <210> 63 <211> 2338 <212> DNA <213> artificial sequence <220> <223> LSpromoter - To coding sequence <400> 63 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080 ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140 tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200 attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260 ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320 aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380 cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc aaccgccaca 1440 aataaccgtc accggaatac ctataaatac aacttccatt tcaatcgtct ctctctgcac 1500 tcccattctt tgaatccaaa aaaggctaca cacacacaca gacaacacca agtttgtaca 1560 aaaaagcagg ctatggcaga taatggcaac accggccgtc aaaaggatga cgacggtggc 1620 catgatggac cacgccaaaa cccaactact ccaccctccc cttcccgcac ccctcgaaga 1680 ccaaggcgga acacatcacc gcccaaacat tctccggggg cgtcttcaag caccatgcca 1740 gcgccgccta ctccccctgc gccgacggga atcaccggtg cttctagttc ttctgtgggt 1800 actaatataa tttcatttat tccacccaaa accaaaagaa cgaagtcggt gatctgcccg 1860 atctgcaaca aagatatgtg ccatgagaag gcgctgtgtg gccacatccg gtggcataca 1920 caggaggaaa gattggcggc cagcatcgct atagcaagag cgctatcttc taacgttgtt 1980 gtttctggca atggcgatga agatgaaggt ccatctaaaa agtataaact cccggacctg 2040 aacaaatctc caccgccgga ggaggaggac gaggacgctg cctgattttc ttgcgggaga 2100 ggcatgcatg tatgtgtggc ctttttgcaa taatactatg catgggagat gcataaagtt 2160 tatctttatt ttttttagtt taataatgtg tggcaaactt tatatcattt atgatttcgg 2220 ccatgtactg ctacatcgtt ctaggatggt tattccctag aatttgcttt atgtatttgt 2280 tttctttgtt aattcttctc ttccttaaac gttatttcat gtgaattgcg atgtcacc 2338 <210> 64 <211> 3673 <212> DNA <213> artificial sequence <220> <223> LsPromoter-with-MITE_To Coding sequence <400> 64 tcaatttcga tcttgactac catgaatgtc atatttatat gacatactta taagaaatta 60 taatacaaat ttgattttaa aataaaataa aaactatttt cataacggat attttgtttc 120 gtataaaaag aataccgtaa gattaaatta aaataaacaa tccgttaaac tgacataata 180 taatattgga aaataaaaaa atatatatgt tttcataaaa aaaaaaactt caagtttgga 240 tcagatttag gaaaagtaaa accttatatt tagttgatga ccgttttacc ataaacaatt 300 atcagtttgt gctgggttaa ttgttaataa aaataatatt aaaatttaat tgaatataac 360 atgaatatat aatttttttt tggaaaaact tcttttaaaa tgttacataa attacgatta 420 aatattttta ataccaaatt atatagtatc tggattaaag aggtcaaaaa gtaaacttta 480 aaaaataaaa aaaataaata atagattaat ataagttaga ggacttcaat tatttttcat 540 gtggaccctt ctaaaagaac ctatttttac aaatagattt aaaaccaatc tatttttgga 600 aatggtctcc taaatcaatc aaattttata aaaaaactcc aacactatca aatatataac 660 aattttattc gatcggttaa atagttagaa ttataacaaa ataaaaaaca agataatttt 720 ttcaaaataa tttgaaataa aaaataaggt gtcaaaaatg aacttttatg taaacttaac 780 atcatttgtc atttttgtta caaaacatga ttaatattat tactttgtaa gtgtccactt 840 ttcttcaaac tccttgctta gttaaaaaaa tctataatat atgaaattaa ttttagtttt 900 cttaaactac atatataatt attttttatc aaacttgaat taaaagccta tgacaataac 960 caaaatgaaa tagtatgact tatacatttg ccgttgacta ataaaccaaa aaatcgaatt 1020 gacatcagac caaaaccagc tctgtatata ttggttatgt tatgggttat atagagttgt 1080 ttaaaaggca gttatcgatt acgttctcag ttctagagtt ttcacaaaaa tcaattctcc 1140 tgtatcacat cgaaagcaaa ccggtctatt tataaaagag atacatattt gaaacaacat 1200 attttttaat tatatttatg tgttgtttat aaatctagaa acccgtaaat ttatatttag 1260 ttcagtatcc aatataggat ctgaaactac tttataaccg ttaccagaca aataccggtc 1320 aagtttatat tggtgtagtt ttcgattcct ttgattttat atctttttgg cgccatttca 1380 cgtcaacggt ttaaaaacaa gttatcgttt ctccggtaca gttaaccacc actgctacca 1440 gggccggcca gaaggctgtg cggcttgggc tgtggcacag gggcagcaga tttagtccat 1500 ttattatggt ctgctattta tttgggtcca ataagatcag ggcactaaaa ctcaaataca 1560 tcaattcaag tcggcggcaa aagaataaaa agcgccaatt tttagaagac aaggagacag 1620 cacaataatc atgcttttcc aatggccaat taattttagc ctttgtgagg tataaatatg 1680 aatcactttt tctccaaata tcattattgt aaactagtaa agagcgtaaa ttgttttatc 1740 gctaatcttc ttctttttca aatataattg tttgattctt tgtagtaggt acgttaagtt 1800 ttatatcatt cgtcctggaa accttttctt atgccccttc aatttatgaa tttgtgtttt 1860 gtattgtctt gctattaatc caatgcaaac taattctgcc gcatcgatct cacagagttg 1920 gagcagctta aaaggagttt tggggcaact taaaatgagg gtagcttttt tgttgttgtt 1980 ggtctactat ttactttggt ccttatcgtt ttagttttgt gttcattgag gatttgaatg 2040 actttgaaca caagtttata aaactaagtt tttgtgattc taaatttttg atgtgtgcaa 2100 ccgactaaat gaatataaaa ttctgatttg tgtatttctg atttctgatt taccggttat 2160 tcattatgtt tttctggatc tcatatgaat ttagtatata aaaatctcag gttcttctta 2220 ctcagtctag tatattttgg cattggggat cagggttaaa atcatcattt ttctaagcac 2280 taacaagctt taaaaccatc aattaaaagt tagttctcca tacctggaat tgtttattgc 2340 tttagtattc atttcatagt gtcaatacct tacaactgtt tattgttttc aaatgtttac 2400 tgttttgcac tttagttgtt tttagcatgt ttcaactttc aaagttaatt gacgatagtg 2460 tcatatacga aatatcatca ctcatacaaa attaaactgg atagaatttt ttccgatgaa 2520 atctattttt aaatagttac gaatataata ggagacttaa tatgtttgtt tcaaaattac 2580 acaaaaacac catggaaatg ggcattagtt tgtataagca tccttttaaa tataaagctt 2640 tgttacattg atgccttcta aatatataat attgtaatga tttgtagtaa acaccatgga 2700 aatgggcatt attaagatgt ttcgcccagg gcatgaaaaa ctatcggacc ggccctgact 2760 gctacaaccg ccacaaataa ccgtcaccgg aatacctata aatacaactt ccatttcaat 2820 cgtctctctc tgcactccca ttctttgaat ccaaaaaagg ctacacacac acacagacaa 2880 caccaagttt gtacaaaaaa gcaggctatg gcagataatg gcaacaccgg ccgtcaaaag 2940 gatgacgacg gtggccatga tggaccacgc caaaacccaa ctactccacc ctccccttcc 3000 cgcacccctc gaagaccaag gcggaacaca tcaccgccca aacattctcc gggggcgtct 3060 tcaagcacca tgccagcgcc gcctactccc cctgcgccga cgggaatcac cggtgcttct 3120 agttcttctg tgggtactaa tataatttca tttattccac ccaaaaccaa aagaacgaag 3180 tcggtgatct gcccgatctg caacaaagat atgtgccatg agaaggcgct gtgtggccac 3240 atccggtggc atacacagga ggaaagattg gcggccagca tcgctatagc aagagcgcta 3300 tcttctaacg ttgttgtttc tggcaatggc gatgaagatg aaggtccatc taaaaagtat 3360 aaactcccgg acctgaacaa atctccaccg ccggaggagg aggacgagga cgctgcctga 3420 ttttcttgcg ggagaggcat gcatgtatgt gtggcctttt tgcaataata ctatgcatgg 3480 gagatgcata aagtttatct ttattttttt tagtttaata atgtgtggca aactttatat 3540 catttatgat ttcggccatg tactgctaca tcgttctagg atggttattc cctagaattt 3600 gctttatgta tttgttttct ttgttaattc ttctcttcct taaacgttat ttcatgtgaa 3660 ttgcgatgtc acc 3673 <210> 65 <211> 3405 <212> DNA <213> artificial sequence <220> <223> ToPromoter_LsCoding sequence <400> 65 taaggccata acaaggttat ttgaacattc gcctaaaccc taaaccaact atatctattc 60 ggatttgtta cgagttttag agtttctaga aaatcagtta tatatcgatt aggcttggtt 120 ctaggttata agaaaaaatg attctctatc cggtatgaca tagagacaaa ccggtctact 180 tttataagaa aatcatattt gaaacaatgt ctagttaata attaattaat atgtgcatgt 240 ttaaatttag aatatcctga atttatattt agtgcgcaac cctatgtaag atcgaactaa 300 ttttaaaccg taaccagaca tgcatgtttg atcagtaata aaaaggctat tatcgtcgaa 360 aatattaaaa caaaatataa tatcttattt ggcgccattt catgtcaacg gttgaaagca 420 agttaccaac gcctccaacc gatcatttct ccggtaacaa ccaactgcta ccagggccgg 480 ccagaaggct gtgcggcttg ggctgtggca caggggcagc agatttagtc catttattat 540 ggtctgctat ttatttgggt ccaataagat cagggcacta aaactcaaat acatcaattc 600 aagtcggcgg caaaagaata aaaagcgcca atttttagaa gacaaggaga cagcacaata 660 atcatgcttt tccaatggcc aattaatttt agcctttgtg aggtataaat atgaatcact 720 ttttctccaa atatcattat tgtaaactag taaagagcgt aaattgtttt atcgctaatc 780 ttcttctttt tcaaatataa ttgtttgatt ctttgtagta ggtacgttaa gttttatatc 840 attcgtcctg gaaacctttt cttatgcccc ttcaatttat gaatttgtgt tttgtattgt 900 cttgctatta atccaatgca aactaattct gccgcatcga tctcacagag ttggagcagc 960 ttaaaaggag ttttggggca acttaaaatg agggtagctt ttttgttgtt gttggtctac 1020 tatttacttt ggtccttatc gttttagttt tgtgttcatt gaggatttga atgactttga 1080 acacaagttt ataaaactaa gtttttgtga ttctaaattt ttgatgtgtg caaccgacta 1140 aatgaatata aaattctgat ttgtgtattt ctgatttctg atttaccggt tattcattat 1200 gtttttctgg atctcatatg aatttagtat ataaaaatct caggttcttc ttactcagtc 1260 tagtatattt tggcattggg gatcagggtt aaaatcatca tttttctaag cactaacaag 1320 ctttaaaacc atcaattaaa agttagttct ccatacctgg aattgtttat tgctttagta 1380 ttcatttcat agtgtcaata ccttacaact gtttattgtt ttcaaatgtt tactgttttg 1440 cactttagtt gtttttagca tgtttcaact ttcaaagtta attgacgata gtgtcatata 1500 cgaaatatca tcactcatac aaaattaaac tggatagaat tttttccgat gaaatctatt 1560 tttaaatagt tacgaatata ataggagact taatatgttt gtttcaaaat tacacaaaaa 1620 caccatggaa atgggcatta gtttgtataa gcatcctttt aaatataaag ctttgttaca 1680 ttgatgcctt ctaaatatat aatattgtaa tgatttgtag taaacaccat ggaaatgggc 1740 attattaaga tgtttcgccc agggcatgaa aaactatcgg accggccctg actgctacta 1800 ataaccgcca ccgcaaaaac ctataaatac aacttccatc acaattctgt cccctactcc 1860 catttcaatc caaaaaaagg ctacacagac atatacagcg ccaagtttgt acaaaaaagc 1920 aggcttcatg gcagatgatg gcaacaccgc ccgtcaacag gctgacgccg gtggccatgg 1980 aaacgcacgt ccaaactcat ccaccccccc ttcgtcaccc tcccaacctc caagaagacc 2040 acgccgtgcc ggagccacta caccgtcaaa gctttcccag gcggcatctt cgtcaacaaa 2100 tcttccaccg ccgccaacgc caacaccaac tccgcccacc ccttctgccg acgggatatt 2160 actaggtact gcaagaaggc cggtaatatg cccgatttgc aaaaaggata tgtatcatga 2220 aaaggcgctg tgtggccata tacgttggca cacgcaagag gagagactgg cggcaagcag 2280 ggatattgcc cgggcgcttt ctgccaacgt tgtttctggg caaagaggcg atggagaaca 2340 agggccgtct aaacggttca aactgccgga tcttaacgag ccaccaccgt cggaggactg 2400 attttcttgc gggagaggca tgcatgtatg tgtggccttt ttgcaataat actatgcatg 2460 ggagatgcat aaagtttatc tttatttttt ttagtttaat aatgtgtggc aaactttata 2520 tcatttatga tttcggccat gtactgctac atcgttctag gatggttatt ccctagaatt 2580 tgctttatgt atttgttttc tttgttaatt cttctcttcc ttaaacgtta tttcatgtga 2640 attgcgatgt catgatattg caggaatgta acttagaact caacgataaa aagtgtgttg 2700 agatcgtgga agttgatcat ttatcttgaa ttcataagat aagcaacatg agataggata 2760 attaattact gtggggattt ctttttatat tcatattatt cgttgtaatg caaattttta 2820 agtagaataa cgaatgtgtc ttattattta cggttaaatg caaaagatca ttaacatatc 2880 tccattgatt tgtttactga tgtattctca tgtgttctgt tgctaaattc tattttgaaa 2940 agtatattca attaaagcaa tgcattttag atataaagca actccataac ttataattgt 3000 gtagattttt accaattcaa tgtcttaaaa gaaaaataaa aattgaaagt ttaattaatt 3060 gccatagtga tcccgttccc gtcaattatg tgatcaattt ttaccagagc aaaaccccac 3120 atttcttgta gtgaacaatc tgtggatgat aaccgatcga agacttttgt ggggatttca 3180 ctaaccaact atttggctct cattaattac tattagttat ataaggccat cccaagtatt 3240 ttggcaatat tcaaaacgag taaactataa aattacactt ttggttcttg tatttctaac 3300 ttttagaatt atgtatttgg ttcttatagt tttttatttg tatgaattac attacttttg 3360 gtccacaata ttttttattt tctataattc catttttagt cgacc 3405

Claims

하기 단계를 포함하는 단위생식 표현형을 유도할 수 있는 돌연변이 유전자의 제조 방법:
(a) 하나 이상의 전사 인자 MYB 결합 부위를 포함하는 프로모터에 작동 가능하게 연결된 SEQ ID NO: 1, 6 또는 11의 PAR 단백질 또는 이의 어느 오르토로그(orthologue)를 인코딩하는 서열을 포함하는 유전자를 제공하는 단계; 및
(b) 상기 하나 이상의 MYB 결합 부위의 업스트림의 서열을 변형함으로써 상기 프로모터를 변형시켜 인코딩된 PAR 단백질의 전사를 증가시키는 단계.
제1항에 있어서,
상기 프로모터는 상기 하나 이상의 MYB 결합 부위의 바로 업스트림에 있는 상기 프로모터에 삽입 또는 결실을 도입함으로써 변형되는, 방법.
제1항 또는 제2항에 있어서,
상기 프로모터가 무작위 또는 표적 돌연변이유발에 의해 변형되는, 방법.
제1항 내지 제3항 중 어느 한 항에 있어서,
단계 (a)에서 제공되는 유전자는 식물 세포, 바람직하게는 식물 원형질체 내에 포함되고, 여기서 바람직하게 돌연변이 유전자는 식물 세포에서 단위생식을 유도하거나 증가시키는, 방법.
제4항에 있어서,
단계 (a)에서 제공되는 유전자는 내인성 유전자인, 방법.
제4항에 있어서,
단계 (a)에서 제공되는 유전자는 선택적으로 네이티브 또는 키메라 유전자인 트랜스진인, 방법.
SEQ ID NO: 1, 6 또는 11의 PAR 단백질 또는 이의 어느 오르토로그를 인코딩하는 서열을 포함하는 단위생식 표현형을 유도할 수 있는 돌연변이 유전자로서, 상기 돌연변이 유전자가 제1항 내지 제6항 중 어느 한 항에 정의된 변형을 포함하는, 돌연변이 유전자.
제7항의 돌연변이 유전자를 포함하는 핵산 분자, 구조물 또는 벡터.
제7항의 돌연변이 유전자 및/또는 제8항의 핵산 분자, 구조물 또는 벡터를 포함하는, 식물 세포, 바람직하게는 식물 세포 원형질체.
제7항의 돌연변이 유전자 및/또는 제8항의 핵산 분자, 구조물 또는 벡터를 포함하는 식물로서, 상기 식물은 단위생식 식물이고, 상기 식물은 바람직하게는 제1항 내지 제6항 중 어느 한 항에 정의된 돌연변이 유전자를 생산함으로써 얻을 수 있는 식물.
제10항에 있어서,
상기 식물이 추가로 아포메이오시스(apomeiosis)를 할 수 있고, 바람직하게는 상기 식물이 아포믹틱(apomictic)인 식물.
하기의 단계를 포함하는 단위생식 식물의 생산 방법:
(a) 제9항의 식물 세포로부터 식물 조직 또는 식물을 재생 및/또는 성장시키는 단계; 및
(b) 선택적으로, 단계 (A)에서 얻은 식물 조직 또는 식물을 스크리닝 및/또는 유전자형 분석하는 단계.
제12항의 단계들을 포함하며, 여기서 단계 a)의 유전자는 아포메이오시스가 가능한 식물 세포, 바람직하게는 식물 원형질체에 포함되는 아포믹틱 식물의 생산 방법.
하기 단계를 포함하는 아포믹틱 F1 잡종 종자의 생산 방법:
(I) 유성 번식 제1 식물을 제2 식물의 꽃가루와 교배 수정시켜 F1 잡종 종자를 생산하는 단계로서, 여기서 상기 제2 식물은 제7항의 돌연변이 유전자 및/또는 제8항의 핵산 분자, 구조물 또는 벡터를 포함하며, 그리고 여기서 상기 제1 식물 및/또는 제2 식물은 아포메이오시스가 가능한, 단계; 및
(II) 선택적으로 상기 F1 잡종 종자로부터, 아포믹틱 표현형을 포함하는 종자를 선택하는, 바람직하게는 유전자형 분석에 의해, 아포믹틱 표현형을 포함하는 종자를 선택하는, 단계.
원형질체, 식물 세포 또는 식물에 단위생식 표현형을 유도하기 위한 제8항의 돌연변이 유전자, 핵산, 구조물 또는 벡터의 용도.