KR20110049769A - 생합성과 관련된 신규의 유전자들 - Google Patents

생합성과 관련된 신규의 유전자들 Download PDF

Info

Publication number
KR20110049769A
KR20110049769A KR1020117000232A KR20117000232A KR20110049769A KR 20110049769 A KR20110049769 A KR 20110049769A KR 1020117000232 A KR1020117000232 A KR 1020117000232A KR 20117000232 A KR20117000232 A KR 20117000232A KR 20110049769 A KR20110049769 A KR 20110049769A
Authority
KR
South Korea
Prior art keywords
plant
sequence
nucleic acid
asn
leu
Prior art date
Application number
KR1020117000232A
Other languages
English (en)
Inventor
케리 루스 핸콕
마가렛 그리그
Original Assignee
그래스란즈 테크놀로지 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 그래스란즈 테크놀로지 리미티드 filed Critical 그래스란즈 테크놀로지 리미티드
Publication of KR20110049769A publication Critical patent/KR20110049769A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Nutrition Science (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 식물에서 플라보노이드, 특히 축합형 탄닌의 제조를 조작하기에 유용한, 출원인에 의한 신규의 MYB 분류 전사 인자 유전자(핵산 서열, 단백질 서열, 및 이의 변이체 및 이의 단편들), 즉 도안된 MYB14를 제공하며, 본 발명은 서열번호 14 및 46 내지 54의 MYB14 폴리펩티드 서열 중 어느 하나와 70 % 이상의 동일성을 갖는 단백질을 암호화하는 분리된 핵산 분자를 제공하고, 또한 본 발명은 폴리뉴클레오티드를 함유하도록 유전적으로 변형된 구조체, 벡터, 숙주 세포, 식물 세포 및 식물을 제공하며, 또한 본 발명은 본 발명의 MYB14 핵산 분자를 사용하여 변경된 플라보노이드, 특히 축합형 탄닌 제조의 식물 제조 방법을 제공한다.

Description

생합성과 관련된 신규의 유전자들{NOVEL GENES INVOLVED IN BIOSYNTHESIS}
본 발명은 생합성과 관련된 신규의 유전자(들)에 관한 것이다. 특히, 본 발명은 식물에서 축합형 탄닌(condensed tannins)이 포함된 플라보노이드 제조와 관련된 주요 유전자들의 발현을 제어하는 조절 인자를 암호화하는 유전자(들)에 관한 것이다.
분자 페닐프로파노이드 경로
페닐프로파노이드 경로(도 1에 도시되어 있음)는 플라본, 안토시아닌, 플라보노이드, 축합형 탄닌 및 이소플라보노이드를 포함하는 2차 대사산물의 집합체를 제조한다(Dixon et al., 1996; 2005). 특히, 상기 축합형 탄닌(CT)의 생합성 경로는 프로안토시아니딘 생합성으로의 분기 이전에 안토시아닌 경로와 이의 초기 단계를 공유한다.
안토시아니딘은 CTs를 위한 중요한 빌딩 블록(building blocks)인 플라반-3-올(flavan-3-ols)[예를 들어 (-)-에피카테킨]의 전구체이다. 이러한 시스-플라반-3-올은 에이. 탈리아나(A. thaliana) 및 엠. 트룬카툴라(M. truncatula)를 포함하는 많은 종들로부터 클로닝되는 안토시아니딘 환원효소(ANR)에 의해서 안토시아니딘으로부터 형성된다(Xie et al., 2003; 2004). 에이. 탈리아나에서 (-)-에피카테킨은 유일한 CT 단량체(Abrahams et al., 2002)이나, 콩과 식물을 포함하는 많은 다른 종들에서는 (+)- 및 (-)-플라반-3-올 둘 다가 CTs로 중합된다. 이러한 대안의 (+)-플라반-3-올(카테킨)의 생합성은 류코안토시아니딘 환원효소(LAR)에 의해 촉매된다. 상기 효소는 CT가 풍부한 콩과 식물 나무 데스모디움 운치나툼(Desmodium uncinatum)(Tanner et al., 2003)를 포함하는 콩과 식물 뿐만 아니라 포도와 사과와 같은 다른 종들(Pfeiffer et al., 2006)로부터 클로닝되고 특성화된다. 상기 효소는 류코펠라고니딘(leucopelargonidin), 류코시아니딘(leucocyanidin) 및 류코델피니딘(leucodelphinidin)의 아프젤레친(afzelechin), 카테킨 및 갈로카테킨으로의 환원을 각각 촉매한다. 상기 식물에서의 (-)-에피카테킨 유도 CT 빌딩 블록의 독점적인 존재에 따라 LAR의 동족체는 에이. 탈리아나에서 발견되지 않는다.
아라비돕시스 씨앗(Arabidopsis seeds)에서 상기 경로의 TF 조절에 대한 정보는 잘 규정되어 있는 반면에 트리폴리애(Trifolieae) 류 내의 잎 CT 생합성을 제어하는 TFs는 아직 규명되지 않았다. TF 단백질의 중요한 과인 MYB 과는 식물에서 안토시아닌 및 CT 경로와 같은 2차 대사산물의 조절을 포함하는 다양한 범위의 기능을 제어한다. 상기 MYB TF AtTT2의 발현은 아라비돕시스 탈리아나에서 후반 구조 유전자를 대등하게 턴온 또는 턴오프하여 궁극적으로 상기 CT 경로의 발현을 제어한다.
아라비돕시스 탈리아나 투명 테스타(TT) 돌연변이들(Winkel-Shirley, 2002; Debeaujon et al., 2001) 및 탄닌 부족 씨앗(TDS) 돌연변이들(Abrahams et al. 2002; 2003)의 집합체는 종피 내 CT 축적이 모두 부족하게 제조된다. 이러한 돌연변이들의 분자 유전적 연구로 에이. 탈리아나내 안토시아닌과 CT 합성 양쪽의 조직 특이성 및 발현을 조절하는 다수의 전사 유전자(TFs) 및 다수의 구조적 유전자들이 확인되었다(Walker et al., 1999; Nesi et al., 2000; 2002).
비록 상기 CT 경로 내에서의 대부분의 구조적인 유전자들이 콩과 식물 범위에서 확인되었지만, 이런 각각의 유전자들의 발현을 엔지니어링함으로써 잎에서의 CT 생합성의 조작 시도는 지금까지 실패했다. 상기에 대한 주요한 이유는 하나(또는 약간)의 효소(들)가 율속 효소가 아니기 때문이지만, 경로에서 거의 모든 효소의 활성은 축합형 탄닌과 같은 특이적 말단-제조물로 전체 증가된 유동이 획득되도록 하기 위해서 증가되어야 한다.
전사 인자(TFs)는 대사 경로의 억제물질 또는 활성제로서의 활성을 갖는 조절 단백질이다. 따라서 TFs는 식물 내에서 전체적인 대사 경로의 조작을 위한 강력한 도구로써 사용될 수 있다. 많은 MYB TFs는 상기 안토시아닌 및 축합형 탄닌 생합성 둘 다를 포함하는 페닐프로파노이드 경로에서의 중요한 조절제이다(Debaujon et al;, 2003; Davies and Schwinn, 2003). 예를 들면, 상기 에이. 탈리아나 TT2(AtTT2) 유전자는 축합형 탄닌 생합성이 발생할 때 배아발생 초기 단계 중에 종피에서 단독으로 발현되는 R2R3-MYB TF 인자를 암호화한다(Nesi et al., 2001). TT2는 플라보노이드 후반 생합성의 구조적 유전자 TT3(DFR), TT18, TT12(MATE 단백질) 및 ANR의 발현을 CTs의 생합성 및 저장 중에 조절하는 것으로 알려져 있다. AtTT2는 두개의 다른 TFs[주로 TT8(bHLH 단백질) 및 TTG1(WD-40 반복 단백질; Baudry et al., 2004]와 결합하여 유전자의 강제 공간 및 일시적인 발현을 부분적으로 결정한다.
비티스 비니페라(Vitis vinifera)에서의 다른 MYB TFs[CT 생합성의 조절과 관련이 있는 포도(VvMYBPA1) 버드풋 트레포일(Birdsfoot trefoil) 및 브라시카 나푸스(Brassica napus)(BnTT2)]가 최근에 보고되었다(Wei et al., 2007; Bogs et al., 2007; Yoshida et al., 2008).
상기 AtTT2 유전자는 안토시아닌 생합성을 제어하는 것으로 알려진 유전자들, 즉 쌀(Oryza sativa) OsMYB3, 옥수수(Zea mays) ZmC1, 안티리히넘 마주스(Antirrhinum majus)로부터의 AmMYBROSEA 및 페튜니아 하이브리다(Petunia hybrida)로부터의 PhMYBAN2와의 동일성 정도를 공유하는 것으로도 또한 알려져 있다(Stracke et al., 2001; Mehrtens et al., 2005).
축합형 탄닌
프로안토시아니딘(PAs)이라고도 하는 축합형 탄닌(CTs)은 무색의 폴리머이고, 몇몇 2차 식물 대사산물 중 하나이다. CTs는 가수분해로 분해되는 영향을 쉽게 받지 않는 탄소-탄소 결합으로 연결된 2 내지 50(또는 그 이상)의 플라보노이드 단위 (하기 화학식 1 참조)의 폴리머이다. 염기 플라보노이드 구조는 하기와 같다:
Figure pct00001
축합형 탄닌은 예를 들면 나뭇잎, 줄기, 꽃, 뿌리, 목재 제조물, 나무껍질, 꽃눈인 식물 일부의 범위 내에 위치한다. CTs는 식물의 표면 표피 상 또는 액포에서 발견되는 것이 일반적이다.
사료 식물에서의 축합형 탄닌
사료 콩과 식물 같은 사료 식물은 동물 사료의 질 또는 섭취 모두를 향상시키므로 목초지-기반 축산 시스템에 유리하다. 또한, 목초지의 질소(N) 경제성 및 반추동물 생산에 대한 이들의 가치가 크다(Caradus et al., 2000). 그러나 방목 반추동물 사료의 비용-효율적인 원천을 생산하면서 반추 미생물(rumen microflora) 및 동물 자체 둘 다의 영양학적인 요구사항을 충족시키려고 하는 경우에는 흔히 목초가 충분하지 않다. 따라서 고기, 털 또는 유제품 생산을 위한 방목 반추 동물의 유전적인 잠재력은 사료 음식물로는 거의 수득하지 못한다.
뉴질랜드 목초지는 20 %까지의 화이트 클로버를 포함하며 목초지에서 화이트 클로버의 레벨 증가로 상기 부족분은 해결되지만, 고창증의 발병 또한 더욱 악화된다. 화이트 클로버(Trifolium repens), 레드 클로버(Trifolium pratense) 및 루선(lucerne)(Medicago sativa)은 상기 종들에서 CT와 같은 식물 폴리페놀 화합물의 부족으로 고창증이 발생한다는 것이 잘 알려져 있다. 따라서 식물 조직에서 더 높은 레벨의 탄닌을 제조하는 사료 재배종의 개발은 농장 산업에서 고창증의 발병을 줄이기 위한 중요한 개발일 수 있다(Burggraaf et al., 2006).
특히, 축합형 탄닌은 만약 충분한 양이 존재한다면 고창증의 제거에 도움을 줄 뿐만 아니라 사료 콩과 식물의 질, 기호성 및 영양학적 가치에 크게 영향을 주므로 동물의 능력 개선에 도움을 줄 수 있다. 증가된 레벨의 CTs로부터 보고되는 이러한 동물의 건강 및 생산력의 이점으로는 양에서의 증가된 배란율, 증가된 생체중, 증가된 털 성장율 및 증가된 우유 생산, 변화된 우유 조성물 및 위장관 선충류에 미치는 개선된 구중 효과를 포함한다(Rumbaugh, 1985; Marten et al., 1987; Niezen et al., 1993; 1995; Tanner et al., 1994; McKenna, 1994; Douglas et al., 1995; Waghorn et al., 1998; Aerts et al., 1999; McMahon et al., 2000; Molan et al., 2001; Sykes and Coop, 2001).
더 높은 레벨의 축합형 탄닌은 또한 반추 동물을 방목함으로써 환경으로 방출되는 온실 가스(메탄, 아산화질소)를 줄이기 위한 실행가능한 해결방안이다(Kingston-Smith and Thomas, 2003). 반추동물 가축은 뉴질랜드의 총 메탄 방출량의 88 % 이상을 생산하며, 온실가스 방출량의 주요한 원인제공자이다(Clark, 2001). 가축 메탄의 근본적인 원천은 반추동물의 소화관 내 장용 발효이다. 총 에너지 섭취량(Blaxter 및 Clapperton, 1965)의 약 3 내지 9 %의 반추동물에서의 에너지 손실에 해당하는 메탄 생산은 사료 품질의 향상으로 5 % 정도까지는 줄일 수 있다. CT가 높은 사료에서는 가축을 방목하여 나오는 메탄 방출량이 줄어드는 것을 보여준다(Woodward, et al 2001; Puchala, et al., 2005). 따라서 목초 식물의 CT 함유량을 증가시키면 가축에서 방출되는 메탄 방출량의 레벨을 줄이는데 직접적으로 기여할 수 있다.
따라서, 화이트 클로버를 포함하는 목초 식물 내 적당한 양의 축합형 탄닌의 축적을 촉발시켜 유도될 수 있는 환경 및 농업경제적인 이점은 반추동물의 보호 및 영양에서 상당히 중요한 것이다(Damiani et al., 1999).
콩과 식물
본 발명자들은 상기 경로와 조절 전사 인자(TFs)의 상호작용과 관련이 있는 트리폴리움(Trifolium) 콩과 식물에서의 CT 잎-특이적 경로의 제어는 아직 알려지지 않은 것으로 알고 있다. CT 양에 영향을 줄 수 있는 상기 경로의 변경 또는 조작은 분석되었지만, 과정이 간단하지 않기 때문에 이러한 경로의 이해에 대한 확고한 성공은 거의 없다.
상기 클로버 속인 트리폴리움은 예를 들면 ca. 255 종과 레구미노스애(D Fabaceae) 과에서 가장 큰 속 중의 하나이다(Ellison et al., 2006). 단지 두 개의 트리폴리움 종들; 티. 아피네(T. affine)[또한 트리폴리움 프레스리아눔 보이스(Trifolium preslianum Boiss). Is라고도 알려져 있음] 및 티. 아르벤스(T. arvense)[또한 헤어-풋 클로버(hare-foot clover)로도 알려져 있음]가 높은 레벨의 잎 CTs를 축적하는 것으로 알려져 있다(Fay and Dale, 1993). 비록 현저한 양의 CTs가 화이트 클로버 꽃머리에 존재하지만(Jones et al., 1976), 단지 미량만이 잎 모용에서 검출될 수 있다(Woodfield et al., 1998). 유전자 풀 스크리닝 및 랜덤 돌연변이 유발을 포함하는 몇몇 접근법은 증가된 레벨의 잎 CTs를 갖는 화이트 또는 레드 클로버 식물들을 제공하는 것에 실패했다(Woodfield et al., 1998).
축합형 탄닌의 유전적 조작
US2006/012508에 관하여 본 발명자들은 TT2 MYB 조절 유전자를 사용하여 유전자도입 알파파 식물을 제조하고, 놀랍게도 뿌리 조직 도처에서 성분을 이루도록 CTs를 제조할 수 있었다. 그러나, 중요한 것은 본 발명자들은 상기 사료 콩과 식물의 잎에서 CT의 축적을 획득할 수는 없었다. 알파파 사료에서 프로안토시아니딘(CTs)을 유도할 수 있는 상황에 대해 알려진 바가 없다는 것이 이전에 보고되었다(Ray et al., 2003). 상기 논문의 저자들은 다른 것들 중에서 옥수수에서의 LC myc-유사 조절 유전자(TF) 또는 옥수수에서의 C1 myb 조절 유전자(TF)가 알파파 사료 및 종피에서 플라보노이드 경로를 자극시킬 수 있는지 없는지를 평가했다. 상기 논문의 저자들은 C1이 아닌 LC 유전자 만이 알파파 사료에서 프로안토시아니딘 생합성 및 안토시아닌 생합성을 자극할 수 있는 것을 발견했지만, 자극은 알려지지 않은 스트레스-반응성 알파파 인자의 존재에서만 발생했다.
옥수수 bHLH 조절 유전자(TF)를 사용하는 로터스(Lotus) 식물에서 축합형 탄닌 제조를 평가하는 연구로 로터스 식물 내에서 상기 TF의 현질전환으로 잎에서의 축합형 탄닌의 수준이 CT내에서 단지 아주 작게(1 %) 증가한 것을 확인하였다(Robbins et al., 2003).
화이트 클로버 내에서 농업적으로 중요한 화합물을 변경 및 높이기 위한 이전의 시도들은 페닐프로파노이드 경로로부터의 안토시아닌 생합성-유도를 변경시키는 단계를 포함하고 있다. 몇몇의 이종유래 myc 및 MYB TFs를 사용하는 이러한 경로를 활성화시키려는 시도에도 불구하고, 옥수수 myc TF B-Peru를 사용하는 단지 하나의 성공만이 보고되었다(de Majnik et al., 2000). 다른 모든 TFs는 불량하거나 또는 재생력이 없고, 이들의 과 발현으로부터의 해로운 영향을 내포하는 것으로 조사되었다.
보다 최근에는 고-CT 콩과 식물인 로터스 자포니쿠스(Lotus japonicus)에서 유래한 TT2 동족체가 보고되었다(Yoshida et al., 2008). 에이. 탈리아나 잎 세포로의 상기 유전자들의 충격(Bombardment)으로 DMACA에 의해 검출되는 제한된 CT 축적 및 ANR의 검출가능한 발현이 야기되는 일시적인 발현이 나타났다. 그러나 이러한 유잔자들은 임의의 콩과 식물 종들에서 형질전환 및 분석되지 않는다.
옥수수 Lc 유전자의 발현으로 식물이 비생물적 스트레스 하에 있는 경우에서만 알파파에서 PA-유사 화합물이 축적된다(Ray et al., 2003). 아라비돕시스 내 세 가지의 전사 인자들, 즉 TT2, PAP1 및 Lc의 공동 발현은 PAs의 세포-타입-특이적 발현을 극복하기 위해서 필요하지만, PAs의 이러한 구성적 축적은 식물의 죽음을 동반한다(Sharma and Dixon, 2005).
안토시아니딘의 (에피)-플라반-3-올로의 전환을 위해 MYB 과 전사 인자 및 안토시아니딘 환원효소의 결합된 발현에 의해서 PAs의 식물로의 도입이 Xie 등에 의해 시도되었다(2006).
PAP1(MYB TF) 및 ANR을 공동으로 발현시킴으로써 토바코의 잎에서 프로안토시아니딘(PAs)의 레벨을 증가시키기 위한 이러한 시도는 토바코에서 PAs의 레벨을 갖음으로써 알파파로 번역된다면 잠재적으로 고창증을 예방할 수 있다고 보고되었다(Xie et al., 2006). MtANR을 본질적으로 발현시키는 유전자도입 엠. 트룬카튤라의 안토시아닌-함유 잎들은 개발의 동일한 단계에서 야생형 식물들 보다 PAs가 3배까지 함유되어있으며, 이러한 화합물들은 PA 올리고머의 특이적 서브셋이다. 또한, 엠. 트룬카툴라에서 제조되는 PA의 이러한 레벨은 개선된 작물학적 이점을 위한 필요에 크게 미달된다. 상기 저자들은 부가적인 생합성적 및 비-생합성적 유전자들이 화합물이 자연스럽게 축적되는 임의의 특이적 식물 조직에서 PAs의 엔지니어링을 위해 필요할 것임이 불분명하게 남아있다고 기술하였다.
잎 중의 CTs 또는 PAs 발현에서의 유사한 어려움들이 TT2 및/또는 BAN 유전자가 알파파로 형질전환될 때 또한 나타났다(US 2004/0093632 및 US 2006/0123508 참조).
자연 건강 식품에 유용한 축합형 탄닌
음식물 첨가제, 조성물 또는 의약제를 형성하기 위한 프로안토시아니딘을 포함하는 임의의 플라보노이드의 사용이 또한 널리 알려져 있다. 예를 들면 하기와같다:
Figure pct00002
미국 특허 출원 번호 2003/0180406에서는 인지 기능을 향상시키기 위해서 코코아로부터 특이적으로 유도된 폴리페놀 조성물의 사용 방법이 기재되어 있다.
Figure pct00003
특허 공보 WO 2005/044291에서는 뇌출혈, 대뇌 뇌진탕, 헌팅턴씨 병, CJD, 알쯔하이머, 파킨슨씨병 및 노인성 치매를 포함하는 퇴행성 뇌 질환을 예방하기 위한 포도씨(Vitus 속)의 용도를 기재하고 있다.
Figure pct00004
특허 공보 WO 2005/067915에서는 치매, 알츠하이머, 뇌혈관 질병, 연령과 관계된 인지 손상 및 우울증과 같은 질환 상태와 연관된 신경퇴화를 줄이기 위한 플라본, 플라보노이드, 프로안토시아니딘 및 안토시아니딘(합성 또는 나무껍질 추출물로부터)과 결합한 플라보노이드 및 히드록시스틸벤(합성 또는 녹차로부터)의 상승적 결합을 기재하고 있다.
Figure pct00005
US 5,719,178에서는 ADHD를 치료하기 위한 프로안토시아니딘 추출액의 용도를 기재하고 있다.
Figure pct00006
PCT 공보 번호 06/126895에서는 인간 인지 능력을 향상시키거나 또는 인간 인지 능력의 감퇴를 예방하거나 인간의 신경 장애를 개선시키거나 또는 인간의 신경 장애 증상을 예방하기 위한 핀어스(Pinus) 속으로부터의 나무껍질 추출물을 함유하는 조성물을 기재하고 있다.
상기 고려 사항에서는 CT의 원료 원천으로서 콩과 식물을 사용하는 것은 기재되어 있지 않다.
따라서 플라보노이드 및/또는 축합형 탄닌 생합성과 관련된 대사 경로를 연구하는데 유용한 핵산 분자 및 폴리펩티드를 제공할 수 있다면 유리할 것이다.
식물 또는 이의 일부에서 플라보노이드 및/또는 축합형 탄닌의 레벨을 변경할 수 있는 폴리펩티드 및 핵산 분자를 제공할 수 있다면 유리할 것이다.
특히, 처음부터 식물 또는 이의 일부에서 플라보노이드 및/또는 축합형 탄닌을 제조하기 위해 사용할 수 있는 핵산 분자를 제공할 수 있다면 유리할 것이다.
따라서 본 발명의 하나의 목적은 사료 콩과 식물 종의 잎에서 CT 레벨을 증가시키는 방법을 제공하는 것이다. 유전자 규명은 또한 잎이나 씨앗에서 불리하게 높은 레벨의 CT를 제조하는 콩과 식물 종에서 CT 축적을 예방하는 방법을 제공한다.
또한 플라보노이드 및/또는 축합형 탄닌의 강화된 레벨을 갖는 식물, 특히 사료 및 콩과 식물을 제조하기 위해 단독으로 또는 다른 핵산 분자와 함께 사용될 수 있는 핵산 분자를 제공할 수 있다면 유리할 것이다.
본 발명의 하나의 목적은 전술한 문제점들을 해결하거나 또는 적어도 유용한 선택을 대중에게 제공하기 위한 것이다.
발명의 요약
본 발명은 축합형 탄닌을 포함하는 플라보노이드 화합물의 제조와 관련되는 것으로 나타나 있으며, 출원인들에 의해서 분리된 본 발명자들에 의해서 용어가 정해진 'MYB 14'인 관련된 폴리펩티드 및 신규의 MYB 유전자의 규명 및 용도에 관한 것이다.
본 명세서를 통해 본 발명의 핵산 분자 및 폴리펩티드는 기술어 MYB 14로 지명될 수 있다.
본 발명은 식물 내 플라보노이드/축합형 탄닌 생합성 경로를 조작하기 위한 MYB14의 독립적인 용도 또는 다른 핵산 분자와 함께의 용도를 고려한다.
폴리펩티드를 암호화하는 폴리뉴클레오티드
하나의 측면에서, 본 발명은 여기서 규정하는 MYB14 폴리펩티드 또는 이의 기능적 변이체(functional variant) 또는 이의 단편을 암호화하는 분리된 핵산 분자를 제공한다.
하나의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 15의 서열을 포함한다.
하나의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 17의 서열을 포함한다.
하나의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 15 및 17의 서열은 포함하지만 서열번호 16의 서열은 없다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 14 및 46 내지 54 중 임의의 하나와 70 % 이상의 동일성을 갖는 서열을 포함한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 14와 70 % 이상의 동일성을 갖는 서열을 포함한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 14 및 46 내지 54 중 임의의 하나의 서열을 포함한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 14의 서열을 포함한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 식물 내 플라보노이드의 제조를 조절한다.
추가의 실시양태에서, 상기 플라보노이드는 축합형 탄닌이다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 식물 내 플라보노이드 생합성 경로에서 하나 이상의 유전자를 조절한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 식물 내 축합형 탄닌 생합성 경로에서 하나 이상의 유전자를 조절한다.
추가의 실시양태에서, 상기 기능적 단편은 상기 MYB14 폴리펩티드와 실질적으로 동일한 활성을 갖는다.
추가의 실시양태에서, 상기 기능적 단편은 서열번호 17과 70 % 이상의 동일성을 갖는 아미노산 서열을 포함한다.
추가의 실시양태에서, 상기 기능적 단편은 서열번호 17의 아미노산 서열을 포함한다.
추가의 측면에서, 본 발명은 서열번호 17에 실질적으로 나타나 있는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산 분자를 제공한다.
추가의 측면에서, 본 발명은 서열번호 17에 실질적으로 나타나 있는 아미노산 서열을 갖는 폴리펩티드를 암호화하는 핵산 분자를 제공한다.
추가의 측면에서, 본 발명은 서열번호 14에 실질적으로 나타나 있는 아미노산 서열을 포함하는 폴리펩티드를 암호화하는 핵산 분자를 제공한다.
추가의 측면에서, 본 발명은 서열번호 14에 실질적으로 나타나 있는 아미노산 서열을 갖는 폴리펩티드를 암호화하는 핵산 분자를 제공한다.
추가의 측면에서, 본 발명은 서열번호 17에서 기재하는 3' 아미노산 서열 모티프를 포함하는 폴리펩티드를 암호화하는 분리된 핵산 분자를 제공한다.
폴리뉴클레오티드
추가의 측면에서 본 발명은 하기로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 갖는 분리된 핵산 분자를 제공한다:
a) 서열번호 1 내지 13 및 55 내지 64 중 하나 이상, 또는 이의 결합물;
b) 상기 a)의 서열(들)의 상보체;
c) 상기 a) 또는 b)의 서열(들)의 기능적 단편 또는 변이체;
d) 상기 a), b) 또는 c)의 서열(들)의 동족체 또는 상동체; 및
e) 상기 a), b), c) 또는 d)의 서열로부터 수득된 RNA 서열에 대한 안티센스 서열.
하나의 실시양태에서, 변이체는 특정 서열의 코딩 서열과 70 % 이상의 동일성을 갖는다.
추가의 실시양태에서, 변이체는 특정 서열과 70 % 이상의 동일성을 갖는다.
추가의 실시양태에서, 단편은 특정 서열의 코딩 서열을 포함한다.
추가의 측면에서 본 발명은 하기로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 갖는 분리된 핵산 분자를 제공한다:
a) 서열번호 1, 2 또는 55;
b) 상기 a)의 서열(들)의 상보체;
c) 상기 a) 또는 b)의 서열(들)의 기능적 단편 또는 변이체;
d) 상기 a), b) 또는 c)의 서열(들)의 동족체 또는 상동체; 및
e) 상기 a), b), c) 또는 d)의 서열로부터 수득된 RNA 서열에 대한 안티센스 서열.
하나의 실시양태에서, 변이체는 특정 서열의 코딩 서열과 70 % 이상의 동일성을 갖는다.
추가의 실시양태에서, 변이체는 특정 서열과 70 % 이상의 동일성을 갖는다.
추가의 실시양태에서, 단편은 특정 서열의 코딩 서열을 포함한다.
추가의 실시양태에서, 분리된 핵산 분자는 서열번호 2의 서열을 포함한다.
추가의 실시양태에서, 분리된 핵산 분자는 서열번호 1의 서열을 포함한다.
추가의 실시양태에서, 분리된 핵산 분자는 서열번호 55의 서열을 포함한다.
프로브
추가 측면에서, 본 발명은 본 발명의 핵산과 결합할 수 있는 프로브를 제공한다.
본 발명의 또 다른 측면에 따르면, 프로브는 실질적으로 상기에서 기재하는 것과 같이 MYB14 핵산 분자의 3' 도메인과 결합할 수 있다.
하나의 실시양태에서, 상기 프로브는 서열번호 17의 아미노산 서열을 암호화하는 핵산 분자 또는 상기 핵산 분자의 상보체와 결합할 수 있다.
하나의 실시양태에서, 상기 프로브는 강제 혼성화 조건(stringent hybridisation condition)하에서 핵산 분자 또는 이의 상보체에 결합할 수 있다.
본 발명의 추가의 측면에 따르면, 프로브는 서열번호 17로 기재한 것과 같은 모티프를 암호화하는 3' 서열로 제공된다.
프라이머
추가의 측면에서, 본 발명은 본 발명의 핵산과 결합할 수 있는 프라이머를 제공한다.
본 발명의 또 다른 측면에 따르면, 프라이머는 상기에서 기재하고 있는 것과 같이 실질적으로 MYB14 핵산 분자의 3' 도메인에 결합할 수 있다.
하나의 실시양태에서, 상기 프로브는 서열번호 15의 아미노산 서열을 암호화하는 핵산 분자 또는 상기 핵산 분자의 상보체와 결합할 수 있다.
하나의 실시양태에서, 상기 프로브는 PCR 조건하에서 핵산 분자 또는 이의 상보체와 결합할 수 있다.
본 발명의 추가의 측면에 따르면, 프라이머는 서열번호 17로 기재한 것과 같은 모티프를 암호화하는 3' 서열을 암호화하는 핵산으로 제공된다.
폴리펩티드
하나의 측면에서, 본 발명은 여기서 규정된 MYB14 폴리펩티드 또는 이의 기능적 단편을 제공한다.
하나의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 15 및 서열번호 17의 서열은 포함하지만 서열번호 16의 서열은 없다.
추가의 실시양태에서, 본 발명은 하기로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 분리된 폴리펩티드를 제공한다:
a) 서열번호 14 및 46 내지 54 중 임의의 하나; 및
b) 상기 a)에 나열된 서열의 기능적 단편 또는 변이체.
추가의 실시양태에서, 상기 변이체는 서열번호 14 및 46 내지 54 중 임의의 하나와 적어도 70 % 유사한 서열을 포함한다.
추가의 실시양태에서, 상기 변이체는 서열번호 14와 70 % 이상의 동일성을 갖는 서열을 포함한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 14 및 46 내지 54 중 임의의 하나의 서열을 포함한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 서열번호 14의 서열을 포함한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 식물에서 플라보노이드 제조를 조절한다.
추가의 실시양태에서, 상기 플라보노이드는 축합형 탄닌이다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 식물의 플라보노이드 생합성 경로에서 하나 이상의 유전자를 조절한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 식물에서 상기 축합형 탄닌의 생합성 경로를 조절한다.
추가의 실시양태에서, 상기 MYB14 폴리펩티드는 식물의 상기 축합형 탄닌 생합성 경로에서 하나 이상의 유전자를 조절한다.
추가의 실시양태에서, 상기 기능적 단편은 실질적으로 상기 MYB14 폴리펩티드와 동일한 활성을 갖는다.
본 발명의 또 다른 측면에 따르면, 하기로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 분리된 폴리펩티드가 제공된다:
a) 서열번호 14; 및
b) 상기 a)에 나열된 서열의 기능적 단편 또는 변이체.
본 발명의 또 다른 측면에 따르면, 서열번호 17로 기재된 것과 같은 3' 아미노산 서열 모티프를 포함하는 분리된 폴리펩티드가 제공된다.
본 발명의 또 다른 측면에 따르면, 서열번호 17로 기재된 것과 같은 3' 아미노산 서열 모티프를 갖는 분리된 폴리펩티드가 제공된다.
본 발명의 추가의 측면에 따르면, 분리된 MYB14 폴리펩티드 또는 이의 기능적 단편이 제공되며, 상기 MYB14 폴리펩티드는 서열번호 16으로 나타낸 것과 같은 서브그룹 6의 아미노산 서열 모티프는 없지만 서열번호 17로 나타낸 것과 같은 아미노산 서열 3' 모티프 뿐만 아니라 서열번호 15로 나타낸 것과 같은 서브그룹 5의 아미노산 서열 모티프를 포함한다.
본 발명의 또 다른 측면에 따르면, 서열번호 1 내지 13 및 55 내지 64 중 임의의 하나로 기재된 것으로부터 선택된 뉴클레오티드 서열을 갖는 핵산 분자에 의해 암호화되는 분리된 폴리펩티드가 제공된다.
본 발명의 또 다른 측면에 따르면, 서열번호 1, 2 또는 55로 기재되는 것과 같은 뉴클레오티드 서열을 갖는 핵산 분자에 의해 암호화되는 분리된 폴리펩티드가 제공된다.
추가의 측면에서, 본 발명은 본 발명의 폴리펩티드를 암호화하는 서열을 포함하는 핵산 분자를 제공한다.
구성체(constructs)
본 발명의 추가의 측면에 따르면, 상기에서 기재한 것과 같이 실질적으로 뉴클레오티드 서열을 포함하는 구조체가 제공된다.
본 발명의 추가의 측면에 따르면, 하기를 포함하는 구조체가 제공되며, 하기 프로모터는 작동가능하게 핵산 분자와 연결되어 핵산 분자의 발현을 제어한다:
- 하나 이상의 프로모터; 및
- 실질적으로 상기에서 기재한 것과 같은 핵산 분자.
바람직하게, 상기 구조체는 하나 이상의 다른 원하는 핵산 분자 및/또는 하나 이상의 추가 조절 서열, 예컨대 그 중에서도 종결부위 서열(terminator sequences)을 포함할 수 있다.
가장 바람직하게, 구조체의 핵산 분자는 서열번호 1, 2 또는 55로부터 선택되는 뉴클레오티드 서열을 가질 수 있다.
숙주 세포
본 발명의 추가의 측면에 따르면, 실질적으로 상기에서 기재한 것과 같은 핵산 분자를 포함하도록 야생형으로부터 변경된 숙주 세포가 제공된다.
하나의 실시양태에서, 핵산은 본 발명의 유전적 구조체 중 일부이다.
하나의 실시양태에서, 상기 숙주 세포는 인간의 일부를 형성하지 않는다.
추가의 실시양태에서, 상기 숙주 세포는 식물 세포이다.
식물 세포 및 식물
본 발명의 추가의 측면에 따르면, 실질적으로 상기에서 기재한 것과 같은 구조체로 형질전환된 식물 또는 식물 세포가 제공된다.
본 발명의 추가의 측면에 따르면, 실질적으로 상기에서 기재한 것과 같은 구조체로 형질전환된 식물이 제공된다.
본 발명의 추가의 측면에 따르면, 실질적으로 상기에서 기재한 것과 같은 핵산 분자를 포함하도록 야생형으로부터 변경된 식물 또는 이의 일부가 제공된다.
본 발명의 추가의 측면에 따르면, 상응하는 야생형 식물 또는 이의 일부 보다 증가하거나 또는 감소한 수준의 플라보노이드 및/또는 축합형 탄닌을 갖도록 MYB14 유전자의 변경된 발현을 통해서 조작되는 식물 세포, 식물 또는 이의 일부가 제공된다.
본 발명의 추가의 측면에 따르면, 상응하는 야생형 식물 세포 보다 증가하거나 또는 감소한 수준의 플라보노이드 및/또는 축합형 탄닌을 갖도록 MYB14 유전자의 변경된 발현을 통해서 조작되는 식물 세포가 제공된다.
본 발명의 추가의 측면에 따르면, 상응하는 야생형 식물 또는 이의 일부 보다 증가된 수준의 플라보노이드 및/또는 축합형 탄닌을 갖도록 MYB14 유전자의 변경된 발현을 통해 조작되는 식물의 잎이 제공된다.
본 발명의 추가의 측면에 따르면, 상응하는 야생형 식물 세포 또는 식물 보다 플라보노이드 및/또는 축합형 탄닌의 수준이 증가하거나 또는 감소하도록 MYB14 유전자 발현을 변경하는 것을 통해서 상기에서 기재한 것과 실질적으로 같은 식물 세포 또는 식물의 자손이 제공된다.
본 발명의 추가의 측면에 따르면, 실질적으로 상기에서 기재한 것과 같은 유전자도입의 씨앗이 제공된다.
조성물
본 발명의 추가의 측면에 따르면, 식물 및/또는 이의 일부이거나 또는 식물 및/또는 이의 일부로부터 수득된 성분을 포함하는 조성물이 제공되며, 상기 식물 또는 이의 일부는 상응하는 야생형 식물 또는 이의 일부의 것들과 비교해서 플라보노이드 및/또는 축합형 탄닌의 수준을 증가 또는 감소시키도록 MYB14 유전자 발현을 변경시켜 조작된다.
폴리뉴클레오티드를 사용하는 방법
본 발명의 추가의 측면에 따르면, 식물 또는 식물 세포를 변경하기 위한 실질적으로 상기에서 기재한 것과 같은 핵산 분자의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 실질적으로 상기에서 기재한 것과 같은 핵산 분자를 사용하여 변경된 식물 또는 식물 세포를 제조하는 방법이 제공된다.
하나의 실시양태에서, 식물 또는 식물 세포는 플라보노이드 또는 플라보노이드 제조의 중간체의 제조에서 변경된다.
추가의 실시양태에서, 상기 플라보노이드는 하나 이상의 축합형 탄닌을 포함한다.
추가의 실시양태에서, 상기 축합형 탄닌은 카테킨, 에피카테킨, 에피갈로카테킨 및 갈로카테킨으로부터 선택된다.
바람직한 실시양태에서, 변경은 증가이다.
추가의 실시양태에서, 식물 또는 식물 세포는 플라보노이드 생합성 경로에서 하나 이상의 효소의 발현으로 변경된다.
하나의 실시양태에서, 플라보노이드 생합성 경로는 축합형 탄닌 생합성 경로이다.
바람직한 실시양태에서, 변경된 발현은 증가된 발현이다.
추가의 실시양태에서, 효소는 LAR 또는 ANR이다.
추가의 실시양태에서, 식물은 LAR 및 ANR 둘 다의 발현으로 변경된다.
상기 식물은 임의의 식물일 수 있으며, 상기 식물 세포는 임의의 식물로부터 나올 수 있다.
하나의 실시양태에서, 식물은 사료 작물 식물이다.
추가의 실시양태에서, 식물은 콩과 식물(legumionous plant)이다.
하나의 실시양태에서, 상기에서 기재한 변경된 제조 또는 발현은 실질적으로 식물의 모든 조직에서 일어난다.
하나의 실시양태에서, 상기에서 기재한 변경된 제조 또는 발현은 식물의 잎 조직에서 일어난다.
하나의 실시양태에서, 상기에서 기재한 변경된 제조 또는 발현은 식물의 생장 부분(vegetative portions)에서 일어난다.
하나의 실시양태에서, 상기에서 기재한 변경된 제조 또는 발현은 식물의 표피 조직에서 일어난다.
본 상세한 설명의 목적에 있어서, 표피 조직은 유관속 식물의 어린 조직, 및 잎, 줄기 및 뿌리를 포함하는 세포의 외부 단층 군을 나타낸다.
하나의 실시양태에서, 상기에서 기재한 플라보노이드의 변경된 제조는 상기 플라보노이드가 실질적으로 거의 없는 식물의 조직 중에서 일어난다.
하나의 실시양태에서, 상기에서 기재한 축합형 탄닌의 변경된 제조는 축합형 탄닌이 실질적으로 거의 없는 식물의 조직 중에서 일어난다.
따라서 본 발명의 몇몇 실시양태에서, 플라보노이드 또는 축합형 탄닌의 제조는 새로운 제조이다.
하나의 실시양태에서, 핵산은 여기서 규정하는 MYB14 단백질을 암호화한다.
추가의 실시양태에서, 핵산은 서열번호 1 내지 13 및 55 내지 64 중 임의의 하나로 기재되는 아미노산 서열, 또는 이의 단편 또는 변이체를 포함하는 단백질을 암호화한다.
추가의 실시양태에서, 핵산은 실질적으로 서열번호 1 내지 13 및 55 내지 64 중 임의의 하나로 기재되는 서열, 또는 이의 단편 또는 변이체를 포함한다.
추가의 실시양태에서, 핵산은 실질적으로 서열번호 1, 2 또는 55로 기재되는 서열, 또는 이의 단편 또는 변이체를 포함한다.
추가의 실시양태에서, 핵산은 실질적으로 상기에서 기재한 구조체의 일부이다.
하나의 실시양태에서, 식물은 핵산 또는 구조체로 식물을 형질전화시킴으로써 변경된다.
추가의 실시양태에서, 식물은 식물의 게놈을 조작함으로써 변경되어 상응하는 야생형 식물 또는 이의 일부로 제조되는 것과 비교하여 식물에서 핵산, 또는 이의 단편 또는 변이체의 수준을 증가 또는 감소 발현시킨다.
본 발명의 추가의 측면에 따르면, 다른 관련된 플라보노이드 및/또는 축합형 탄닌 조절 유전자/폴리펩티드를 규명하기 위한 본 발명의 핵산 분자 또는 폴리펩티드의 용도를 제공한다.
본 발명의 추가의 측면에 따르면, 식물이 사료 작물이거나 또는 식물 세포가 사료 작물로부터 수득되는 상기 식물 또는 식물 세포를 변경하기 위한 실질적으로 상기에서 기재한 것과 같은 핵산 분자의 용도를 제공한다.
하나의 실시양태에서, 식물은 축합형 탄닌의 제조에서 변경된다.
하나의 실시양태에서, 식물은 축합형 탄닌의 증가된 제조를 갖는다.
바람직하게, 상기 사료 작물은 사료 콩과 식물일 수 있다.
본 발명의 추가의 측면에 따르면, 콩과 식물 또는 콩과 식물 세포에서 축합형 탄닌 또는 플라보노이드 수준을 변경하기 위한 실질적으로 상기에서 기재한 핵산 분자의 용도를 제공한다.
바람직하게, 축합형 탄닌의 수준이 변경된다.
바람직하게, 축합형 탄닌의 수준은 잎 조직에서 변경된다.
본 발명의 추가의 측면에 따르면, 인 플란타(in planta)에서 플라보노이드 또는 축합형 생합성 경로를 변경하기 위한 실질적으로 서열번호 1 내지 13 및 55 내지 64 중 임의의 하나로 기재되는 핵산 서열 정보의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 인 플라타에서 플라보노이드 또는 축합형 탄닌 생합성 경로를 변경하기 위한 실질적으로 서열번호 1, 2 및 55 중 임의의 하나로 기재되는 핵산 서열 정보의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 콩과 식물 또는 식물 세포의 생장 부분에서 플라보노이드 및/또는 축합형 탄닌의 수준을 변경하기 위한 콩과 식물 또는 식물 세포를 형질전환시키기 위한 실질적으로 상기에서 기재한 구조체의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 상응하는 야생형 식물 또는 이의 일부에서 제조되는 것과 비교해서 식물에서 콩과 식물 MYB14 유전자, 또는 이의 단편 또는 변이체의 수준을 감소 또는 증가시켜 발현시키기 위해 식물의 게놈을 조작하는 단계를 포함하며, 콩과 식물 또는 이의 일부 내에서 플라보노이드 및/또는 축합형 탄닌 제조를 변경하는 방법이 제공된다.
본 발명의 추가의 측면에 따르면, 상응하는 야생형 식물 또는 이의 일부에서 제조되는 것과 비교해서 식물에서 콩과 식물 MYB14 유전자, 이의 단편 또는 변이체의 수준을 감소 또는 증가시켜 발현시키기 위해 식물의 게놈을 조작하는 단계를 포함하는, 콩과 식물 또는 이의 일부내에서 플라보노이드 및/또는 축합형 탄닌 제조를 변경하는 방법이 제공된다.
본 발명의 추가의 측면에 따르면, 새로운 콩과 식물 또는 이의 일부내의 인 플라타로 플라보노이드 또는 축합형 탄닌을 제조하기 위한 핵산 분자의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 인 플라타에서 플라보노이드 및/또는 축합형 탄닌 생합성 경로를 콩과 식물 또는 이의 일부에서 조작하기 위한 실질적으로 상기에서 기재한 핵산 분자의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 인 플라타에서 플라보노이드 및/또는 축합형 탄닌 생합성 경로를 조작하기 위한 실질적으로 상기에서 기재한 구조체의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 인 플라타에서 생합성 경로를 조작하기 위한 본 발명의 핵산 분자에 실질적으로 상응하는 핵산 서열을 갖는 MYB14 유전자의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 플라보노이드 및/또는 축합형 탄닌 생합성 경로와 관련된 플라보노이드 및/또는 축합형 탄닌, 효소, 중간체 또는 다른 화학적 화합물을 제조하기 위한 실질적으로 상기에서 기재한 핵산 분자의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 비-기능적 폴리펩티드를 암호화하는 유전자를 생성하기 위한 실질적으로 상기에서 기재한 핵산을 변경하는 단계에 의해서 특징화되는 플라보노이드 및/또는 축합형 탄닌 생합성 경로를 조작하는 방법이 제공된다.
또 다른 측면에 따르면, 콩과 식물 또는 식물 세포내에서 LAR 및/또는 ANR 수준을 조작하기 위한 인 플라타에서의 본 발명의 분리된 핵산 분자의 용도가 제공된다.
또 다른 측면에 따르면, 콩과 식물 또는 식물 세포내에서 카테킨 및/또는 에피카테킨 또는 다른 탄닌 단량체(에피갈로카테킨 또는 갈로카테킨)의 수준을 조작하기 위한 인 플라타에서의 본 발명의 분리된 핵산 분자의 용도가 제공된다.
본 발명의 추가의 측면에 따르면, 다른 관련 플라보노이드 및/또는 축합형 탄닌 조절 유전자/폴리펩티드를 규명하기 위한 핵산 분자 또는 폴리펩티드의 용도가 제공된다.
하나의 실시양태에서, 전체 식물 조직을 조작할 수 있다. 대안적인 실시양태에서, 식물의 표피 조직을 조작할 수 있다. 본 명세서의 목적에 있어서, 표피 조직은 유관속 식물의 어린 조직, 및 세포, 잎, 줄기 및 뿌리의 외부 단층 군을 나타낸다.
보다 바람직하게, 본 발명에 의해 변경된 플라보노이드 및/또는 축합형 탄닌의 수준은 변경된 수준의 플라보노이드 및/또는 축합형 탄닌을 갖는 식물을 대상이 소비하는 것에 치료적 또는 작물적으로 이점을 제공하기에 충분하다.
상기 방법을 통해 제조된 식물
추가의 실시양태에서, 본 발명은 본 발명의 방법으로 제조되는 식물을 제공한다.
추가의 실시양태에서, 본 발명은 본 발명의 임의의 식물의 일부, 씨앗, 과실, 수확물질, 번식체 또는 자손을 제공한다.
추가의 실시양태에서, 식물의 일부, 씨앗, 과실, 수확물질, 번식체 또는 자손은 유전적으로 본 발명의 하나 이상의 핵산 또는 본 발명의 구조체를 포함하도록 변형된다.
본 발명의 단백질 및 핵산의 공급원
본 발명의 단백질과 핵산은 하기에서 기재한 것과 같이 임의의 식물로부터 유래될 수 있거나 또는 합성적으로 또는 재조합적으로 제조될 수 있다.
식물
본 발명의 식물 세포 및 식물, 또는 본 발명의 용도 및 방법으로 형질전환 또는 조작된 것들은 임의의 종으로부터 유래될 수 있다.
하나의 실시양태에서, 식물 세포 또는 식물은 겉씨 식물 종으로부터 유래된다.
추가의 실시양태에서, 식물 세포 또는 식물은 속씨 식물 종으로부터 유래된다.
추가의 실시양태에서, 식물 세포 또는 식물은 쌍떡잎 식물 종으로부터 유래된다.
추가의 실시양태에서, 식물 세포 또는 식물은 외떡잎 식물 종으로부터 유래된다.
바람직하게, 식물은 쌍떡잎 종으로부터 유래한다.
다른 바람직한 식물은 하기를 포함하는 군으로부터의 사료 식물 종이며, 하기 속에 제한되는 것은 아니다: 롤리움(Lolium), 페스투카(Festuca), 닥틸리스(Dactylis), 브로무스(Bromus), 티노피룸(Thinopyrum), 트리폴리움(Trifolium), 메디카고(Medicago), 펠레움(Pheleum), 팔라리스(Phalaris), 홀커스(Holcus), 로터스(Lotus), 플란타고(Plantago) 치초리움(Cichorium).
다른 바람직한 식물은 콩과 식물이다. 콩과 식물 또는 이의 일부는 식물 과 레구미노스애(Leguminosae) 또는 파바세애(Fabaceae)에서의 임의의 식물을 포함할 수 있다. 예를 들면 상기 식물들은 알파파, 클로버를 포함하는 두과사료작물; 루카에나; 콩, 편두, 루핀, 완두콩, 땅콩, 대두를 포함하는 곡물 콩과 식물; 루핀, 약물학적 또는 산업적 콩과 식물을 포함하는 블룸 콩과 식물; 및 휴한 또는 녹비 콩과 식물 종으로 이루어진 군으로부터 선택될 수 있다.
특히 바람직한 속은 트리폴리움(Trifolium)이다.
바람직한 트리폴리움 종에는 트리폴리움 레펜스(Trifolium repens); 트리폴리움 아르벤스(Trifolium arvense); 트리폴리움 아피네(Trifolium affine); 트리폴리움 옥시덴탈(Trifolium occidentale)를 포함한다.
특히 바람직한 트리폴리움 종은 트리폴리움 레펜스이다.
또 다른 바람직한 속은 메디카고(Medicago)이다.
바람직한 메디카고 종에는 메디카고 사티바(Medicago sativa)메디카고 트런카튤라(Medicago truncatula)를 포함한다.
특히 바람직한 메디카고 종은 메티카고 사티바이며, 통상적으로는 알파파로 알려져 있다.
또 다른 바람직한 속은 글리신(Glycine)이다.
바람직한 글리신 종은 글리신 맥스(Glycine max)글리신 위그히티(Glycine wightii)[또한 네오노토니아 위그히티(Neonotonia wightii)라고도 알려져 있음]를 포함한다.
특히 바람직한 글리신 종은 대두라고도 알려져 있는 글리신 맥스이다.
특히 바람직한 글리신 종은 통상적으로 다년생 대두(perennial soybean)라고도 알려져 있는 글리신 위그히티이다.
또 다른 바람직한 속은 비그나(Vigna)이다.
바람직한 비그나 종은 비그나 운구이쿨라타(Vigna unguiculata)를 포함한다.
특히 바람직한 비그나 종은 통상적으로 동부콩(cowpea)이라고 알려져 있는 비그나 운구이쿨라타이다.
또 다른 바람직한 속은 뮤카나(Mucana)이다.
바람직한 뮤카나 종은 뮤카나 프루니엔스(Mucana pruniens)를 포함한다.
특히 바람직한 뮤카나 종은 통상적으로 벨벳빈(velvetbean)으로 알려져 있는 뮤카나 프루니엔스이다.
또 다른 바람직한 속은 아라치스(Arachis)이다.
바람직한 뮤카나 종은 아라치스 글라브라타(Arachis glabrata)를 포함한다.
특히 바람직한 아라치스 종은 통상적으로 다년생 땅콩으로 알려져 있는 아라치스 글라브라타이다.
또 다른 바람직한 속은 피썸(Pisum)이다.
바람직한 피썸 종은 피썸 사티범(Pisum sativum)이다.
특히 바람직한 피썸 종은 통상적으로 완두콩으로 알려져 있는 피썸 사티범이다.
또 다른 바람직한 속은 로터스(Lotus)이다.
바람직한 로터스 종은 로터스 코르니쿨라투스(Lotus corniculatus), 로터스 페드운쿨라투스(Lotus pedunculatus), 로터스 글라바(Lotus glabar), 로터스 테누이스(Lotus tenuis) 로터스 울리그이노스어스(Lotus uliginosus)를 포함한다.
특히 바람직한 로터스 종은 통상적으로 버드풋 트레포일(Birdsfoot Trefoil)로 알려져 있는 로터스 코르니쿨라투스이다.
특히 바람직한 로터스 종은 통상적으로 나로-리프 버드풋 트레포일(Narrow-leaf Birdsfoot Trefoil)로 알려져 있는 로터스 글라바르이다.
특히 바람직한 로터스 종은 통상적으로 빅 트레포일(Big Trefoil)로 알려져 있는 로터스 페드운쿨라투스이다.
특히 바람직한 로터스 종은 통상적으로 슬렌더 트레포일(Slender Trefoil)로 알려져 있는 로터스 테누이스이다.
또 다른 바람직한 속은 브라시카(Brassica)이다.
바람직한 브라시카 종은 브라시카 올레아세아(Brassica oleracea)를 포함한다.
특히 바람직한 브라시카 종은 통상적으로 사료 케일 및 양배추로 알려져 있는 브라시카 올레아세아이다.
여기서 사용하는 '식물'이라는 용어는 이의 전문에서 식물를 나타내며, 이의 임의의 일부는 이에 제한하지는 않지만 하기를 포함할 수 있다: 식물 생활 주기 중에 식물의 선택된 부분, 예컨대 식물 씨앗, 어린싹, 잎, 나무껍질, 꼬투리, 뿌리, 꽃, 과실, 줄기 등. 바람직하게 '이의 일부'는 잎이다.
특허 명세서들, 다른 외부 서류들 또는 다른 정보 공급 문헌들을 참고로 구성된 본 명세서에서, 상기는 본 발명의 특성들을 논의하기 위한 내용을 제공하는 것이 일반적인 목적이다. 특별히 다르게 언급하지 않는 한 이러한 외부 문헌들의 참고는 임의의 관할권에서 상기 문헌들 또는 상기 정보 공급 문헌들은 종래 문헌이거나 또는 당업에 통상적이며 일반적인 지식의 일부를 구성하는 것을 인정하는 것으로서 구성되지 않는다.
본 명세서 및 청구범위에서 사용되는 "포함하는(comprising)"이라는 용어는 "적어도 일부분을 구성하는(consisting at least in part of)"을 의미하며; 즉 "포함하는(comprising)"을 포함하는 본 명세서 및 청구범위에서의 설명을 해석하는 경우에 각 설명에서 상기 용어에 의한 서문으로 기재된 특성들이 모두 존재할 필요가 있으면 또한 다른 특성도 존재할 수 있다는 것을 말한다. 관련된 용어들, 예컨대 "포함하다(comprise)" 및 "포함된(comprised)"도 동일한 방식으로 해석된다. 그러나 바람직한 실시양태에서 "포함하는(comprising)"은 "구성하는(consisting)"으로 대체될 수 있다.
"MYB14 폴리펩티드"라는 용어는 R2R3 클래스 MYB 전사 인자를 나타낸다.
바람직하게 상기 MYB14 폴리펩티드는 서열번호 14 및 46 내지 54 중 임의의 하나와 70 % 이상의 동일성을 갖는 서열을 포함한다.
바람직하게 상기 MYB14 폴리펩티드는 서열번호 15의 서열 모티프를 포함한다.
바람직하게 상기 MYB14 폴리펩티드는 서열번호 17의 서열 모티프를 포함한다.
보다 바람직하게 상기 MYB14 폴리펩티드는 서열번호 15 및 서열번호 17의 서열은 포함하지만 서열번호 16의 서열은 없다.
바람직하게 MYB14 폴리펩티드는 서열번호 14와 70 % 이상의 동일성을 갖는 서열을 포함한다.
"MYB14 유전자"는 MYB14 폴리펩티드를 암호화하는 유전자의 표준 정의에 의한 유전자이다.
"MYB 전사 인자(MYB transcription factor)"라는 용어는 단일 또는 복수의 불완전한 반복으로 구성되는 구조적으로 보존된 DNA 결합 도메인이 특징인 전사 인자 클래스를 나타내는 것으로 당업에 통상의 지식을 가진 자들에게 잘 알려진 용어이다.
"R2R3 전사 인자" 또는 "R2R3 DNA 결합 도메인에 의한 MYB 전사"라는 용어는 두개의 반복 클래스의 MYB 전사 인자를 나타내는 것으로 당업에 통상의 지식을 가진 자들에게 잘 알려진 용어이다.
"프로안토시아니딘" 및 "축합형 탄닌"이라는 용어는 본 명세서의 전반에 걸쳐 서로 교환가능하게 사용될 수 있다.
여기서 사용하는 "서열 모티프(sequence motif)"라는 용어는 아미노산 또는 뉴클레오티드의 스트레치를 의미한다. 바람직하게 아미노산 또는 뉴클레오티드의 스트레치는 인접해 있다.
"변경된 제조(altered production)" 또는 "변경된 발현(altered expression)"의 식물에 대해서 "변경된(altered)"이라는 용어는 비-형질전환 상태에서 동일한 형태의 식물 또는 동일한 식물과 관련해서 변경된 것을 의미한다.
"변경된"이라는 용어는 증가 또는 감소된 것을 의미할 수 있다. 바람직하게 변경된 것은 증가한 것이다.
폴리뉴클레오티드 및 단편들
여기서 사용하는 "폴리뉴클레오티드(들)"이라는 용어는 임의의 길이의 단일 또는 이중가닥의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 폴리머를 의미하며, 바람직하게는 15 이상의 뉴크레오티드를 말하며, 유전자, 센스 및 안티센스 서열 상보체들, 엑손, 인트론, 게놈 DNA, cDNA, 프리-mRNA, mRNA, rRNA, siRNA, miRNA, tRNA, 리보자임, 재조합 폴리펩티드, 분리 및 정제된 천연 발생 DNA 또는 RNA 서열, 합성 RNA 및 DNA 서열, 핵산 프로브, 프라이머 및 단편들의 코딩화 및 비-코딩화 서열로서 이에 제한되지 않는 것들을 포함한다.
"폴리뉴클레오티드"라는 용어는 "핵산 분자"와 서로 대체가능하게 사용할 수 있다.
여기서 제공되는 폴리뉴클레오티드의 "단편(fragment)"은 바람직하게는 길이가 15 이상의 뉴클레오티드인 연속 뉴클레오티드의 서브서열이다. 본 발명의 단편은 본 발명의 폴리뉴클레오티드의 바람직하게는 20 이상의 뉴클레오티드, 보다 바람직하게는 30 이상의 뉴클레오티드, 보다 바람직하게는 40 이상의 뉴클레오티드, 보다 바람직하게는 50 이상의 뉴클레오티드, 가장 바람직하게는 60 이상의 연속 뉴클레오티드를 포함한다. 폴리뉴클레오티드 서열의 단편은 안티센스, 유전자 사일런싱(gene silencing), 삼중 나선 또는 리보자임 기술에 사용될 수 있으며, 또는 마이크로어레이에 포함되거나 또는 폴리뉴클레오티드계 선택 방법에 사용되는 프라이머 및 프로브로서 사용될 수 있다.
본 발명의 폴리뉴클레오티드 서열의 바람직한 단편은 특정 폴리뉴클레오티드의 25 이상, 보다 바람직하게는 50 이상, 보다 바람직하게는 75 이상, 보다 바람직하게는 100 이상, 보다 바람직하게는 150 이상, 보다 바람직하게는 200 이상, 보다 바람직하게는 300 이상, 보다 바람직하게는 400 이상, 보다 바람직하게는 500 이상, 보다 바람직하게는 600 이상, 보다 바람직하게는 700 이상, 보다 바람직하게는 800 이상, 보다 바람직하게는 900 이상, 보다 바람직하게는 1000 이상의 연속 뉴클레오티드를 포함한다.
"프라이머"라는 용어는 템플릿에 혼성화되며, 템플릿에 상보적인 폴리뉴클레오티드의 중합의 프라이밍에 사용되는 유리 3'OH 기를 갖는 것이 일반적인 짧은 폴리뉴클레오티드를 나타낸다. 상기 프라이머는 길이가 바람직하게는 5 이상, 보다 바람직하게는 6 이상, 보다 바람직하게는 7 이상, 보다 바람직하게는 9 이상, 보다 바람직하게는 10 이상, 보다 바람직하게는 11 이상, 보다 바람직하게는 12 이상, 보다 바람직하게는 13 이상, 보다 바람직하게는 14 이상, 보다 바람직하게는 15 이상, 보다 바람직하게는 16 이상, 보다 바람직하게는 17 이상, 보다 바람직하게는 18 이상, 보다 바람직하게는 19 이상, 보다 바람직하게는 20 이상의 뉴클레오티드이다.
"프로브"라는 용어는 혼성화 기본 분석에서 프로브에 상보적인 폴리뉴클레오티드 서열을 검출하기 위해 사용되는 짧은 폴리뉴클레오티드를 나타낸다. 상기 프로브는 여기서 규정하는 것과 같이 폴리뉴클레오티드의 "단편"으로 이루어질 수 있다. 바람직하게 상기 프로브는 길이가 5 이상, 보다 바람직하게는 10 이상, 보다 바람직하게는 20 이상, 보다 바람직하게는 30 이상, 보다 바람직하게는 40 이상, 보다 바람직하게는 50 이상, 보다 바람직하게는 100 이상, 보다 바람직하게는 200 이상, 보다 바람직하게는 300 이상, 보다 바람직하게는 400 이상 및 가장 바람직하게는 500 이상의 뉴클레오티드이다.
폴리펩티드 및 단편들
여기서 사용하는 "폴리펩티드"라는 용어는 아미노산 잔기가 공유 펩티드 결합으로 연결되어 있는, 완전한 길이의 단백질을 포함하는 5 이상의 아미노산이 바람직한 임의의 길이의 아미노산 사슬을 포함한다. 상기 폴리펩티드는 정제된 천연 생성물일 수 있으며, 또는 재조합 또는 합성 기술을 사용하여 부분적으로 또는 전부 제조될 수 있다. 상기 용어는 폴리펩티드, 폴리펩티드의 집합체, 예컨대 이량체 또는 다른 다량체, 융합 폴피펩티드, 폴리펩티드 단편, 폴리펩티드 변이체 또는 이들의 유도체를 나타낼 수 있다.
폴리펩티드의 "단편"은 생물학적 활성을 위해 필요한 기능을 실행하고, 및/또는 폴리펩티드의 3차원 구조를 제공하는 폴리펩티드의 서브서열이다. 상기 용어는 폴리펩티드, 폴리펩티드의 집합체, 예컨대 이량체 또는 다른 다량체, 융합 폴리펩티드, 폴리펩티드 단편, 폴리펩티드 변이체 또는 상기 활성을 실행할 수 있는 이의 유도체를 나타낼 수 있다.
여기서 기재하는 폴리뉴클레오티드 또는 폴리펩티드 서열에 적용되는 것과 같은 "분리된(isolated)"이라는 용어는 이들의 천연 세포 환경에서 제거되는 서열을 나타낼 때 사용된다. 분리된 분자는 생화학적, 재조합 및 합성 기술을 포함하는 임의의 방법 또는 방법들의 결합 방법에 의해서 수득될 수 있다.
특정 속들 또는 종들로부터 유래하는 폴리뉴클레오티드 또는 폴리펩티드 서열에 대해서 "로부터 유도되는(derived from)"이라는 용어는 속들 또는 종들에서 자연적으로 발견되는 폴리뉴클레오티드 또는 폴리펩티드와 동일한 서열을 갖는 서열을 의미한다. 따라서 특정 속들 또는 종들로부터 유래하는 서열은 합성적으로 또는 재조합적으로 제조될 수 있다.
변이체
여기서 사용되는 "변이체(variant)"라는 용어는 특이적으로 규정한 서열과는 상이한 폴리뉴클레오티드 또는 폴리펩티드 서열을 나타내며, 하나 이상의 뉴클레오티드 또는 아미노산 잔기가 결실, 치환 또는 삽입된 것이다. 변이체는 자연적으로 발생하는 대립형질 변이체 또는 비-자연적으로 발생하는 변이체일 수 있다. 변이체는 동일하거나 또는 다른 종들로부터 유도될 수 있으며, 동족체, 파라로고스 및 상동체를 포함할 수 있다. 특정 실시양태에서, 본 발명의 폴리뉴클레오티드 및 폴리펩티드의 변이체는 본 발명의 폴리뉴클레오티드 또는 폴리펩티드의 것과 동일하거나 또는 유사한 생물학적 활성들을 가진다. 폴리뉴클레오티드 및 폴리펩티드에 관한 "변이체"라는 용어는 여기서 규정하는 모든 형태의 폴리뉴클레오티드 및 폴리펩티드를 포함한다.
폴리뉴클레오티드 변이체
변이체 폴리뉴클레오티드 서열은 바람직하게는 특정 폴리뉴클레오티드 서열과 50 % 이상, 보다 바람직하게는 51 % 이상, 보다 바람직하게는 52 % 이상, 보다 바람직하게는 53 % 이상, 보다 바람직하게는 54 % 이상, 보다 바람직하게는 55 % 이상, 보다 바람직하게는 56 % 이상, 보다 바람직하게는 57 % 이상, 보다 바람직하게는 58 % 이상, 보다 바람직하게는 59 % 이상, 보다 바람직하게는 60 % 이상, 보다 바람직하게는 61 % 이상, 보다 바람직하게는 62 % 이상, 보다 바람직하게는 63 % 이상, 보다 바람직하게는 64 % 이상, 보다 바람직하게는 65 % 이상, 보다 바람직하게는 66 % 이상, 보다 바람직하게는 67 % 이상, 보다 바람직하게는 68 % 이상, 보다 바람직하게는 69 % 이상, 보다 바람직하게는 70 % 이상, 보다 바람직하게는 71 % 이상, 보다 바람직하게는 72 % 이상, 보다 바람직하게는 73 % 이상, 보다 바람직하게는 74 % 이상, 보다 바람직하게는 75 % 이상, 보다 바람직하게는 76 % 이상, 보다 바람직하게는 77 % 이상, 보다 바람직하게는 78 % 이상, 보다 바람직하게는 79 % 이상, 보다 바람직하게는 80 % 이상, 보다 바람직하게는 81 % 이상, 보다 바람직하게는 82 % 이상, 보다 바람직하게는 83 % 이상, 보다 바람직하게는 84 % 이상, 보다 바람직하게는 85 % 이상, 보다 바람직하게는 86 % 이상, 보다 바람직하게는 87 % 이상, 보다 바람직하게는 88 % 이상, 보다 바람직하게는 89 % 이상, 보다 바람직하게는 90 % 이상, 보다 바람직하게는 91 % 이상, 보다 바람직하게는 92 % 이상, 보다 바람직하게는 93 % 이상, 보다 바람직하게는 94 % 이상, 보다 바람직하게는 95 % 이상, 보다 바람직하게는 96 % 이상, 보다 바람직하게는 97 % 이상, 보다 바람직하게는 98 % 이상 및 가장 바람직하게는 99 % 이상의 동일성을 나타낸다. 동일성은 20 이상의 뉴클레오티드 위치들, 보다 바람직하게는 50 이상의 뉴클레오티드 위치들, 보다 바람직하게는 100 이상의 뉴클레오티드 위치들, 보다 바람직하게는 200 이상의 뉴클레오티드 위치들, 보다 바람직하게는 300 이상의 뉴클레오티드 위치들, 보다 바람직하게는 400 이상의 뉴클레오티드 위치들, 보다 바람직하게는 500 이상의 뉴클레오티드 위치들, 보다 바람직하게는 600 이상의 뉴클레오티드 위치들, 보다 바람직하게는 700 이상의 뉴클레오티드 위치들, 보다 바람직하게는 800 이상의 뉴클레오티드 위치들, 보다 바람직하게는 900 이상의 뉴클레오티드 위치들, 보다 바람직하게는 1000 이상의 뉴클레오티드 위치들 및 가장 바람직하게는 특정의 폴리뉴클레오티드 서열의 전체 길이에 걸쳐서 비교 윈도우 상에서 확인된다.
폴리뉴클레오티드 서열 동일성은 하기 방식으로 결정할 수 있다. 대상 폴리뉴클레오티드 서열은 NCBI (ftp://ftp.ncbi.nih.gov/blast/)에서 공개적으로 이용가능한 bl2seq(Tatiana A. Tatusova, Thomas L. Madden (1999), "Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol Lett. 174:247-250)에서 BLASTN(from the BLAST suite of programs, version 2.2.5. [Nov 2002])를 사용하여 후보 폴리뉴클레오티드 서열과 비교한다. bl2seq의 디폴트 파라메터는 낮은 복잡성 부분의 필터링을 턴오프해야 하는 것을 제외하고 이용된다.
폴리뉴클레오티드 서열의 동일성은 하기 유닛스 커맨드 라인 파라메터를 이용하여 시험할 수 있다:
bl2seq-i nucleotideseq1-j nucleotideseq2-F F -p blastn
파라메터 -F F는 낮은 복잡성 섹션의 필터링을 턴오프한다. 파라메터 -p는 서열 쌍을 위한 적당한 알고리즘을 선택한다. bl2seq 프로그램은 라인 "Identities="에서 동일한 뉴클레오티드의 수와 퍼센트 둘 다의 서열 동일성을 보고한다.
폴리뉴클레오티드 서열 동일성은 또한 글로벌 서열 정렬 프로그램(예를 들면 Needleman, S. B. 및 Wunsch, C. D. (1970) J. Mol. Biol. 48, 443-453)을 사용하여 후보 및 대상 폴리뉴클레오티드 서열 사이의 오버랩의 전체 길이 상에서 계산될 수도 있다. 상기 Needleman-Wunsch 글로벌 정렬 알고리즘의 완전한 구현은 http://www.hgmp.mrc.ac.uk/Software/EMBOSS/에서 수득될 수 있는 EMBOSS 패키지(Rice, P. Longden, I. 및 Bleasby, A. EMBOSS: The European Molecular Biology Open Software Suite, Trends in Genetics June 2000, vol 16, No 6. pp. 276-277)의 니들 프로그램에서 확인된다. European Bioinformatics Institute 서버도 또한 http:/www.ebi.ac.uk/emboss/align/에서 라인 상의 두개 서열 사이의 EMBOSS-니들 글로벌 정렬을 실행시키기 위한 기능을 제공한다.
대안적으로 터미널 갭에 대한 처벌없이 두개의 서열의 최적 글로벌 정렬을 산출하는 GAP 프로그램을 사용하여 서열 동일성을 계산할 수 있다. GAP는 하기 문헌에 기재되어 있다: Huang, X (1994) On Global Sequence Alignment. Computer Applications in the Biosciences 10, 227-235.
서열 동일성은 Clustal W 알고리즘(Thompson et al., 1994, Nucleic Acids Research 24, 4876-4882)을 사용하는 벡터 NTI 버젼 9.0을 사용하여 비교하기 위한 서열을 정렬하고, 다음에 벡터 NTI 버젼 9.0(Sept 12, 2003 ⓒ1994-2003 InforMax, licenced to Invitrogen)을 사용하여 정렬된 서열 사이의 서열 동일성의 퍼센트를 계산하여 산출할 수도 있다.
본 발명의 폴리뉴클레오티드 변이체는 또한 램덤한 기회로 발생할 것을 합리적으로 예상할 수 없으며, 이러한 서열의 기능적 등가를 보존할 것 같은 특이적으로 규명된 서열 중 하나 이상과 동일성을 나타내는 것들을 포함한다. 폴리뉴클레오티드에 관한 상기 서열 동일성은 NCBI(ftp://ftp.ncbi.nih.gov/blast/)로부터 프로그램의 BLAST 스위트(버젼 2.2.5.[Nov 2002])로부터 공개적으로 이용가능한 bl2seq 프로그램을 사용하여 결정할 수 있다.
폴리뉴클레오티드 서열의 동일성은 하기 유닉스 커맨드 라인 파라메터를 사용하여 시험할 수 있다:
bl2seq -i nucleotideseq1 -j nucleotideseq2 -F F -p tblastx
상기 파라메터 -F F는 낮은 복잡성 섹션의 필터링을 턴오프한다. 상기 파라메터 -p는 서열 쌍에 대한 적당한 알고리즘을 선택한다. 상기 프로그램은 서열 사이의 동일성 구역을 찾고, 이러한 각 구역에 있어서 예상되는 횟수인 "E 값"은 램덤 서열을 포함하는 고정된 참고 크기의 데어터베이스에서 우연한 매치를 보여줄 것으로 기대할 할 수 있다. 상기 데이터베이스 크기는 bl2seq 프로그램에서의 디폴트에 의해서 설정된다. 1 보다 많이 작은 E 값에 있어서 E 값은 대략 상기 램덤 매치의 가능성이다.
변이체 폴리뉴클레오티드 서열은 특이적으로 확인된 서열 중 임의의 하나와 비교하는 경우에 바람직하게는 1 x 10-10 이하, 보다 바람직하게는 1 x 10-20 이하, 보다 바람직하게는 1 x 10-30 이하, 보다 바람직하게는 1 x 10-40 이하, 보다 바람직하게는 1 x 10-50 이하, 보다 바람직하게는 1 x 10-60 이하, 보다 바람직하게는 1 x 10-70 이하, 보다 바람직하게는 1 x 10-80 이하, 보다 바람직하게는 1 x 10-90 이하 및 가장 바람직하게는 1 x 10-100 이하의 E 값을 나타낸다.
대안적으로 본 발명의 변이체 폴리뉴클레오티드는 강제 조건하에서 특이적 폴리뉴클레오티드 서열 또는 이의 상보체에 혼성화된다.
"강제 조건하에서의 혼성화(hybridize under stringent conditions)"이라는 용어 및 이의 문법적으로 상응하는 것은 온도 및 염 농도의 규정된 조건하에서 목적하는 폴리뉴클레오티드 분자(예컨대 DNA 또는 RNA 블럿, 예컨대 서던 블럿 또는 노던 블럿 상에서의 고정된 목적 폴리뉴클레오티드 분자)에 혼성화되는 폴리뉴클레오티드 분자의 능력을 나타낸다. 강제 혼성화 조건하에서의 혼성화 능력은 초기에 덜 강제적인 조건하에서 혼성화된 후에 다음에 목적하는 강제 정도로 강제 정도를 증가시킴으로써 결정될 수 있다.
길이가 약 100 염기 보다 큰 폴리뉴클레오티드 분자에 관해서는 통상적인 강제 혼성화 조건은 네이티브 듀플렉스(native duplex)의 용융 온도(Tm) 이하의 25 내지 30 ℃보다 크지 않다(예를 들면 10 ℃)(일반적으로 Sambrook et al., Eds, 1987, Molecular Cloning, A Laboratory Manual, 2nd Ed. Cold Spring Harbor Press: Ausubel et al., 1987, Current Protocols in Molecular Biology, Greene Publishing 참조). 약 100 염기 보다 큰 폴리뉴클레오티드 분자의 Tm은 Tm = 81.5 + 0.41%(G + C-log (Na+)식에 의해 계산될 수 있다(Sambrook et al., Eds, 1987, Molecular Cloning, A Laboratory Manual, 2nd Ed. Cold Spring Harbor Press; Bolton and McCarthy, 1962, PNAS 84:1390). 길이가 100 염기보다 큰 폴리뉴클레오티드의 통상적인 강제 조건은 혼성화 조건, 예컨대 6X SSC, 0.2 % SDS 용액에서의 전세척; 65 ℃, 6X SSC, 0.2 % SDS에서 밤새 혼성화; 65 ℃에서 1X SSC, 0.1 % SDS에서 각각 30분씩 두번 세척 및 65 ℃에서 0.2X SSC, 0.1 % SDS에서 각 30분씩 두번 세척.
100 염기 이하 길이를 갖는 폴리뉴클레오티드 분자에 대해서 대표적인 강제 혼성화 조건은 Tm 이하의 5 내지 10 ℃이다. 대체로 100 bp 이하 길이의 폴리뉴클레오티드 분자의 Tm은 대략 (500/올리고뉴클레오티드 길이) ℃로 감소된다.
펩티드 핵산(PNAs)으로 알려진 DNA 미믹스(mimics)(Nielsen et al., Science. 1991 Dec 6;254(5037):1497-500)에 대해서, Tm 값은 DNA-DNA 또는 DNA-RNA 하이브리드에 있어서의 것 보다 더 크며, Giesen et al., Nucleic Acids Res. 1998 Nov 1;26(21):5004-6에 기재된 식을 사용하여 계산할 수 있다. 100 염기 이하의 길이를 갖는 DNA-PNA 하이브리드의 대표적인 강제 혼성화 조건은 Tm 이하의 5 내지 10 ℃이다.
변이체 폴리뉴클레오티드, 예컨대 발현될 단백질을 암호화하는 본 발명의 구조체 중의 것들은 또한 특이적 서열과는 상이하지만 유전적 코드의 퇴화의 결과로서 본 발명의 폴리뉴클레오티드에 의해 암호화되는 폴리펩티드와 유사한 활성을 갖는 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함한다. 폴리펩티드의 아미노산 서열을 변화시키지 않는 서열 변경은 "사일런트 변이(silent variation)"이다. ATG(메티오닌) 및 TGG(트립토판)을 제외하고 동일한 아미노산의 다른 코돈은 예를 들어 특정 숙주 기관에서 코돈 발현을 최적화하기 위해서 당업에 공지된 기술에 의해서 변경할 수 있다.
이의 생물학적 활성을 현저하게 변경시키지 않으면서 암호화된 폴리펩티드 서열에서 하나 또는 수개의 아미노산의 보존적 치환을 야기하는 폴리뉴클레오티드 서열 변경도 또한 고려된다. 당업에 통상의 지식을 가진 자는 표현형 사일런스 아미노산 치환을 만드는 방법을 알고 있을 것이다(예를 들어 Bowie et al., 1990, Science 247, 1306 참조).
암호화 폴리펩티드 서열에서의 보존 치환 및 사일런트 변이에 의한 변이체 폴리뉴클레오티드는 이전에 기재한 tblastx 알고리즘을 경유하는 NCBI(ftp://ftp.ncbi.nih.gov/blast/)로부터의 (버전 2.2.5[Nov 2002]) 프로그램의 BLAST 스위트로부터 공개적으로 이용가능한 bl2seq 프로그램을 사용하여 결정할 수 있다.
폴리펩티드 변이체
폴리펩티드에 대한 "변이체(variant)"라는 용어는 자연스럽게 발생되는 재조합적 및 합성적으로 제조된 폴리펩티드를 포함한다. 변이체 폴리펩티드 서열은 바람직하게 본 발명의 서열과 50 % 이상, 보다 바람직하게는 51 % 이상, 보다 바람직하게는 52 % 이상, 보다 바람직하게는 53 % 이상, 보다 바람직하게는 54 % 이상, 보다 바람직하게는 55 % 이상, 보다 바람직하게는 56 % 이상, 보다 바람직하게는 57 % 이상, 보다 바람직하게는 58 % 이상, 보다 바람직하게는 59 % 이상, 보다 바람직하게는 60 % 이상, 보다 바람직하게는 61 % 이상, 보다 바람직하게는 62 % 이상, 보다 바람직하게는 63 % 이상, 보다 바람직하게는 64 % 이상, 보다 바람직하게는 65 % 이상, 보다 바람직하게는 66 % 이상, 보다 바람직하게는 67 % 이상, 보다 바람직하게는 68 % 이상, 보다 바람직하게는 69 % 이상, 보다 바람직하게는 70 % 이상, 보다 바람직하게는 71 % 이상, 보다 바람직하게는 72 % 이상, 보다 바람직하게는 73 % 이상, 보다 바람직하게는 74 % 이상, 보다 바람직하게는 75 % 이상, 보다 바람직하게는 76 % 이상, 보다 바람직하게는 77 % 이상, 보다 바람직하게는 78 % 이상, 보다 바람직하게는 79 % 이상, 보다 바람직하게는 80 % 이상, 보다 바람직하게는 81 % 이상, 보다 바람직하게는 82 % 이상, 보다 바람직하게는 83 % 이상, 보다 바람직하게는 84 % 이상, 보다 바람직하게는 85 % 이상, 보다 바람직하게는 86 % 이상, 보다 바람직하게는 87 % 이상, 보다 바람직하게는 88 % 이상, 보다 바람직하게는 89 % 이상, 보다 바람직하게는 90 % 이상, 보다 바람직하게는 91 % 이상, 보다 바람직하게는 92 % 이상, 보다 바람직하게는 93 % 이상, 보다 바람직하게는 94 % 이상, 보다 바람직하게는 95 % 이상, 보다 바람직하게는 96 % 이상, 보다 바람직하게는 97 % 이상, 보다 바람직하게는 98 % 이상 및 가장 바람직하게는 99 % 이상의 동일성을 나타낸다. 동일성은 20 이상의 아미노산 위치들, 보다 바람직하게는 50 이상의 아미노산 위치들, 보다 바람직하게는 100 이상의 아미노산 위치들 및 가장 바람직하게는 본 발명의 폴리펩티드의 전체 길이 상에서의 비교 윈도우 상에서 확인된다.
폴리펩티드 서열 동일성은 하기 방식으로 결정할 수 있다. 대상 폴리펩티드 서열은 NCBI (ftp://ftp.ncbi.nih.gov/blast/)에서 공개적으로 이용가능한 bl2seq에서 BLASTP(from the BLAST suite of programs, version 2.2.5. [Nov 2002])를 사용하여 후보 폴리펩티드 서열과 비교한다. bl2seq의 디폴트 파라메터는 낮은 복잡성 부분의 필터링을 턴오프해야 하는 것을 제외하고 이용한다.
폴리펩티드 서열 동일성은 또한 글로벌 서열 정렬 프로그램을 사용하여 후보 및 대상 폴리뉴클레오티드 서열 사이의 오버랩의 전체 길이 상에서 계산될 수도 있다. 상기에서 언급한 것과 같이 EMBOSS-니들(http:/www.ebi.ac.uk/emboss/align/에서 이용가능함) 및 GAP(Huang, X. (1994) On Global Sequence Alignment. Compouter Applications in the Biosciences 10, 227-235)는 또한 폴리펩티드 서열 동일성을 계산하는 적당한 글로벌 서열 정렬 프로그램이다.
서열 동일성은 Clustal W 알고리즘(Thompson et al., 1994, Nucleic Acids Research 24, 4876-4882)을 사용하는 벡터 NTI 버젼 9.0을 사용하여 비교하기 위해 서열을 정렬하고, 다음에 벡터 NTI 버젼 9.0(Sept 12, 2003 ⓒ1994-2003 InforMax, licenced to Invitrogen)을 사용하는 정렬된 폴리펩티드 사이의 서열 동일성의 퍼센트를 계산하여 산출할 수도 있다.
본 발명의 폴리펩티드 변이체는 또한 램덤하게 우연히 발생할 것을 합리적으로 예상할 수 없으며, 이러한 서열의 기능적 등가를 보존할 것 같은 특이적 규명 서열 중 하나 이상과의 동일성을 나타내는 것들을 포함한다. 폴리펩티드에 관한 상기 서열 동일성은 NCBI(ftp://ftp.ncbi.nih.gov/blast/)로부터 프로그램의 BLAST 스위트(버젼 2.2.5.[Nov 2002])로부터 공개적으로 이용가능한 bl2seq 프로그램을 사용하여 결정할 수 있다. 폴리펩티드 서열의 동일성은 하기 유닛스 커맨드 라인 파라메터를 이용하여 시험할 수 있다:
bl2seq-i peptideseq1-j peptideseq2 -F F -p blastp
변이체 폴리펩티드 서열은 특이적으로 확인된 서열 중 임의의 하나와 비교하는 경우에 바람직하게는 1 x 10-6 이하, 보다 바람직하게는 1 x 10-9 이하, 보다 바람직하게는 1 x 10-12 이하, 보다 바람직하게는 1 x 10-15 이하, 보다 바람직하게는 1 x 10-18 이하, 보다 바람직하게는 1 x 10-21 이하, 보다 바람직하게는 1 x 10-30 이하, 보다 바람직하게는 1 x 10-40 이하, 보다 바람직하게는 1 x 10-50 이하, 보다 바람직하게는 1 x 10-60 이하, 보다 바람직하게는 1 x 10-70 이하, 보다 바람직하게는 1 x 10-80 이하, 보다 바람직하게는 1 x 10-90 이하 및 가장 바람직하게는 1 x 10-100 이하의 E 값을 나타낸다.
상기 파라메터 -F F는 낮은 복잡성 섹션의 필터링을 턴오프한다. 상기 파라메터 -p는 서열 쌍에 대한 적당한 알고리즘을 선택한다. 상기 프로그램은 서열 사이의 동일성 구역을 찾고, 이러한 각 구역에 있어서 예상되는 횟수인 "E 값"은 램덤 서열을 포함하는 고정된 참고 크기의 데어터베이스에서 우연히 이러한 매치를 보여줄 것으로 기대할 할 수 있다. 1 보다 많이 작은 E 값에 있어서 E 값은 대략 상기 램덤 매치의 가능성이다.
이의 생물학적 활성을 현저하게 변경시키지 않으면서 기재된 폴리펩티드 서열에서 하나 또는 수개의 아미노산의 보존적 치환도 또한 본 발명에 포함된다. 당업에 통상의 지식을 가진 자는 표현형 사일런싱 아미노산 치환을 만드는 방법을 알고 있을 것이다(예를 들어 Bowie et al., 1990, Science 247, 1306 참조).
구조체들, 벡터들 및 이의 성분들
"유전적 구조체(genetic construct)"라는 용어는 또 다른 폴리뉴클레오티드 분자, 예컨데 이에 제한되지는 않지만 cDNA 분자에 삽입될 수 있는 폴리뉴클레오티드 분자(삽입 폴리뉴클레오티드 분자), 일반적으로 이중 가닥 DNA를 나타낸다. 유전적 구조체는 삽입 폴리뉴클레오티드 분자를 전사하고, 선택적으로 전사물을 폴리펩티드로 번역하는 필수적인 요소를 포함하는 프로모터 폴리뉴클레오티드를 함유할 수 있다. 삽입 폴리뉴클레오티드 분자는 숙주 세포로부터 유래될 수 있거나 또는 상이한 세포 또는 기관으로부터 유래될 수 있으며, 및/또는 합성 또는 재조합 폴리뉴클레오티드일 수 있다. 숙주 세포안에 들어가게 되면 유전적 구조체는 숙주 염색체 DNA로 통합될 수 있다. 유전적 구조체는 벡터에 연결될 수 있다.
"벡터(vector)"라는 용어는 숙주 세포에 유전적 구조체를 운반하기 위해 사용되는 폴리뉴클레오티드 분자, 일반적으로 이중 가닥 DNA를 나타낸다. 상기 벡터는 하나 이상의 부가적인 숙주 시스템, 예컨대 E. coli에서 클로닝될 수 있다.
"발현 구조체(expression construct)"라는 용어는 삽입 폴리뉴클레오티드 분자를 전사시키고, 선택적으로 전사물을 폴리펩티드로 번역하는 필수적인 요소를 포함하는 유전적 구조체를 나타낸다.
발현 구조체는 5' 내지 3' 방향으로 하기를 포함하는 것이 일반적이다:
a) 구조체가 형질전환될 숙주 세포에서의 기능적인 프로모터;
b) 발현될 폴리뉴클레오티드; 및
c) 구조체가 형질전환될 숙주 세포에서의 기능적인 종결인자.
"코딩 영역(coding region)" 또는 "오픈 리딩 프레임(open reading frame, ORF)"라는 용어는 적당한 조절 서열의 제어하에 전사 생성물 및/또는 폴리펩티드를 생성할 수 있는 cDNA 서열 또는 게놈 DNA 서열의 센스 가닥을 나타낸다. 코딩 서열은 5' 번역 개시 코돈 및 3' 번역 정지 코돈의 존재로 확인된다. 유전적 구조체로 삽입되는 경우에 "코딩 서열(coding sequence)"은 프로모터 및 종결인자 서열에 작동가능하게 연결되는 경우에 발현될 수 있다.
"작동가능하게 연결된(operably-linked)"라는 용어는 발현될 서열이 프로모터, 조직-특이적 조절 요소, 임시 조절 요소, 증강인자, 억제인자 및 종결인자를 포함하는 조절 요소의 제어하에 있는 것을 의미한다.
"비코딩 영역(noncoding region)"이라는 용어는 번역 개시 부위의 업스트림 및 번역 정지 부위의 다운스트림인 비번역된 서열에 포함된다. 이러한 서열들은 또한 각각 5'UTR 및 3'UTR로서 나타낸다. 이러한 서열들은 전사 개시 및 종결 및 번역 효율성의 제어를 위해 필요한 요소들을 포함할 수 있다.
종결인자는 전사를 종결시키는 서열이며, 번역된 서열의 다운스트림 유전자의 3' 비번역 말단에서 확인된다. 종결인자는 mRNA 안정성의 중요한 결정인자이며, 몇몇 경우에는 공간 조절 기능을 갖는 것으로 확인된다.
"프로모터(promoter)"라는 용어는 프로모터가 세포에서 작동가능하게 연결되거나 또는 세포 유리 전사 시스템에서 작동가능하게 연결되는 폴리뉴클레오티드 서열의 발현을 작동시키거나 또는 조절할 수 있는 폴리뉴클레오티드 서열을 나타낸다. 프로모터는 전사 개시 부위 및 보존 박스, 예컨대 TATA 박스, 및 전사 인자에 의해 연결되는 모티프들을 규정하는 시스-개시제 요소를 포함할 수 있다.
폴리뉴클레오티드의 분리 또는 생성 방법
본 발명의 폴리뉴클레오티드 분자는 당업에 통상의 지식을 가진 자들에게 알려져 있는 다양한 기술을 사용하여 분리할 수 있다. 한 예로서 상기 폴리뉴클레오티드는 Mullis et al., Eds. 1994에서 기재하고 있는 중합효소 연쇄 반응(PCR)을 사용하여 분리할 수 있다. 상기 중합효소 연쇄 반응(Birkhauser)은 참고문헌으로서 여기에 기재되어 있다. 본 발명의 폴리뉴클레오티드는 본 발명의 폴리뉴클레오티드 서열에서 유도되는 여기서 기재하는 프라이머를 사용하여 증폭시킬 수 있다.
본 발명의 폴리뉴클레오티드를 분리하고, 본 발명의 방법에 유용한 추가의 방법들은 혼성화 프로브와 같이 여기서 기재하고 있는 폴리뉴클레오티드의 전부 또는 일부를 사용하는 것을 포함한다. 표지화 폴리뉴클레오티드 프로브를 고체 지지체, 예컨대 니트로셀룰로스 필터 또는 나일론 막 상에 고정시킨 폴리뉴클레오티드에 혼성화하는 기술은 게놈을 스크리닝하기 위해 사용할 수 있다. 대표적인 혼성화 및 세척 조건은 하기와 같다: 5.0 X SSC, 0.5 % 소듐 도데실 설페이트, 1 X 덴하드트스 용액(Denhardt's solution) 중 65 ℃에서 20 시간 동안 혼성화; 1.0 X SSC, 1 % (w/v) 소듐 도데실 설페이트에서 세척(55 ℃에서 각 20 분씩 3회 세척), 및 선택적으로 60 ℃에서 0.5 X SSC, 1 % (w/v) 소듐 도데실 설페이트에서 1회 세척(20 분 동안). 선택적인 추가 세척(20 분 동안)은 60 ℃에서 0.1 X SSC, 1 % (w/v) 소듐 도데실 설페이트의 조건하에서 실행할 수 있다.
본 발명의 폴리뉴클레오티드 단편은 당업에 잘 알려져 있는 기술들, 예컨대 제한 효소 처리(restriction endonuclease digestion), 올리고뉴클레오티드 합성 및 PCR 증폭으로 제조할 수 있다.
부분적 폴리뉴클레오티드 서열은 당업에 잘 공지되어 있는 방법으로 상응하는 완전한 길이의 폴리뉴클레오티드 서열 및/또는 전체 유전자 및/또는 프로모터를 규명하기 위해서 사용될 수 있다. 이러한 방법으로는 PCR 기본 방법들, 5' RACE(Frohman MA, 1993, Methods Enzymol. 218:340-56) 및 혼성화 기본 방법, 컴퓨터/데이터베이스 기본 방법들을 포함한다. 추가로 한 예로서, 알려진 영역을 기본으로하는 프라이머로 개시하고, 여기서 기재하고 있는 폴리뉴클레오티드 서열로 플랭킹하면서 역 PCR로 알려지지 않는 서열을 습득한다(Triglia et al., 1998, Nucleic Acids Res 16, 8186 참고문헌으로서 여기서 인용함). 상기 방법은 폴리뉴클레오티드의 알려진 영역에서 적당한 단편을 발생시키기 위해서 몇개의 제한 효소를 사용한다. 다음에 상기 단편은 분자내 라이게이션에 의해 원형으로 만들고 PCR 템플레이트로서 사용한다. 분지 프라이머(divergent primers)는 알려진 영역으로부터 도안한다. 프로모터 및 플랭킹 서열은 또한 제조업체 지시서에 따라서 GenomeWalkerTM 키트(Clontech, Mountain View, California)를 사용하여 PCR 게놈 워킹으로 분리할 수도 있다. 완전한 길이의 클론을 물리적으로 조립하기 위해서 표준 분자 생물학적 접근법을 이용할 수 있다(Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed. Cold Spring Harbor Press, 1987).
특정 종들로부터 유전자도입 식물을 제조하는 경우에 상기 종들로부터 유도된 서열 또는 서열들로 상기 식물을 형질전환시키는 것이 유리할 수 있다. 이러한 이점은 유전자도입 기관을 발생시키는데 이종간 형질전환(cross-species transformation)에 관한 공개적인 관심을 경감시킬 수 있다는 것일 수 있다. 또한 유전자의 다운-레귤레이션이 목적하는 결과인 경우에 감소된 발현을 목적하는 식물에서의 서열과 동일한 서열(또는 적어도 동일성이 높은 서열)을 이용할 필요가 있을 수 있다. 다른 것 중에서도 이러한 이유로 여러 개의 상이한 식물 종에서 특정 유전자의 상동체를 분리 및 규명할 수 있는 것이 바람직하다. (상동체를 포함하는) 변이체는 기재된 방법에 의해서 규명할 수 있다.
변이체를 규명하는 방법
물리적 방법
변이체 폴리뉴클레오티드는 PCR 기본 방법을 사용하여 규명할 수 있다(Mullis et al., Eds. 1994 The polymerase Chain Reaction, Birkhauser).
당업에 통상의 지식을 가진 자들에게 잘 알려진 대안적인 라이브러리 스크리닝 방법을 이용할 수 있다(Sambrook et al., Molecular Cloning: A Laboratory Manual 2nd Ed. Cold Spring Harbor Press, 1987). 프로브 서열의 변이체를 규명하는 경우에 혼성화 및/또는 세척 강제성이 실제의 서열 매치를 추구하는 경우와 비교해서 감소하는 것이 통상적이다.
컴퓨터 기본 방법
폴리뉴클레오티드 및 폴리펩티드 변이체는 또한 서열 데이터베이스를 찾기 위해서 서열 동일성 찾기 툴 및 공개된 도메인 서열 정렬 알고리즘을 사용하여 당업에 통상의 지식을 가진 자들에게 잘 알려져 있는 컴퓨터 기본 방법으로 규명될 수도 있다(공개된 도메인 데이터베이스는 Genbank, EMBL, Swiss-Prot, PIR 등을 포함함). 예를 들어 온라인 원천의 예에 있어서는 Nucleic Acids Res. 26: 1-10 및 11-16, 2001 참조. 동일성 찾기는 분석될 서열(즉 질의 서열)과 비교해서 타겟 서열들을 회수 및 정렬시킨다. 서열 비교 알고리즘은 측정 행렬(scoring matrices)를 사용하여 정렬 각각의 전체적인 점수를 배정한다.
서열 데이터베이스에서 변이체를 규명하기에 유용한 프로그램의 대표적인 페밀리는 (ftp://ftp.ncbi.nih.gov/blast/) 또는 미국 20894 MD Bethesda Room 8N805 38A 빌딩 국제 의학 도서관의 미국 국립 생물 공학 정보 센터(NCBI)로 부터 공개적으로 이용가능한 BLASTN, BLASTP, BLASTX, tBLASTN 및 tBLASTX를 포함하는 프로그램의 BLAST 스위트(버젼 2.2.5[Nov 2002])이다. 상기 NCBI 서버는 또한 공개적으로 이용가능한 서열 데이터베이스의 수를 스크리닝하기 위한 프로그램을 사용하는 기능을 제공한다. BLASTN은 뉴클레오티드 서열 데어터베이스에 대한 뉴클레오티드 질의 서열을 비교한다. BLASTP는 단백질 서열 데이터베이스에 대한 아미노산 질의 서열을 비교한다. BLASTX는 단백질 서열 데이터베이스에 대한 모든 판독 프레임에서 번역된 뉴클레오티드 질의 서열을 비교한다. tBLASTN은 모든 판독 프레임에서 동적으로 번역된 뉴클레오티드 서열 데이터베이스에 대한 단백질 질의 서열을 비교한다. tBLASTX는 뉴클레오티드 서열 데이터베이스의 6-프레임 번역에 대한 뉴클레오티드 질의 서열의 6-프레임 번역을 비교한다. 상기 BLAST 프로그램은 디폴트 파라메터와 함께 사용할 수 있거나 또는 상기 파라메터는 스크린을 개선하기 위해서 요구되는 것과 같이 변경될 수 있다.
BLASTN, BLASTP 및 BLASTX를 포함하는 알고리즘의 BLAST 과의 사용은 Altschul et al., Nucleic Acids Res. 25: 3389-3402, 1997의 공개문에 기재되어 있다.
BLASTN, BLASTP, BLASTX, tBLASTN, tBLASTX 또는 유사한 알고리즘에 의해 생성된 질의 서열에 의한 하나 이상의 데이터베이스 서열에 "히트(hits)"는 서열의 유사한 부분을 정렬하고 규정한다. 상기 히트는 서열 오버랩의 길이와 동일성 정도에 따라 배열된다. 데이터베이스 서열에 대한 히트는 통상적으로 질의 서열의 서열 길이의 부분에서만 오버랩을 나타내는 것이 통상적이다.
상기 BLASTN, BLASTP, BLASTX, tBLASTN 및 tBLASTX 알고리즘은 또한 정렬에 있어서 "예외(except)" 값을 생성한다. 상기 예외 값(E)은 램덤 연속 서열을 함유하는 동일한 크기의 데이터베이스를 찾는 경우에 우연히 보이는 것을 "예외"로 할 수 있는 히트의 수를 나타낸다. 상기 예외 값은 데이터베이스에 대한 히트가 진정한 동일성을 나타내는지의 여부를 결정하기 위한 유의적 임계수준으로서 사용된다. 예를 들면 폴리뉴클레오티드 히트에 배정된 0.1의 E 값은 스크리닝된 데이터베이스의 크기의 데이터베이스에 우연하게 간단한 유사 점수로 서열의 정렬 부분 상에 0.1 매치를 보이는 것을 예외시키는 것을 의미하는 것으로 해석된다. 정렬 및 매치된 부분에서 0.01 이하의 E 값을 갖는 서열에 있어서, 데이터베이스에서 우연한 매치를 찾을 가능성은 BLASTN, BLASTP, BLASTX, tBLASTN 또는 tBLASTX 알고리즘을 사용하면 1 % 이하이다.
관련된 서열 군의 다수 서열 정렬은 CLUSTALW(Thompson, J. D., Higgins, D. G. 및 Gibson, T.J. (1994) CLUSTALW: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, positions-specific gap penalties and weight matrix choice. Nucleic Acids Research, 22:4673-4680, http://www-igbmc.u-strasbg.fr/Biolnfo/ClustalW/Top.html) 또는 T-COFFEE (Cedric Notredame, Desmond G. Higgins, Jaap Heringa, T-Coffee: A novel method for fast and accurate multiple sequence alignment, J. MoI. Biol. (2000) 302: 205-217)) 또는 점진적인 쌍정렬을 사용하는 PILEUP(Feng 및 Doolittle, 1987, J. MoI. Evol. 25, 351)로 실행시킬 수 있다. 패턴 인식 소프트웨어 응용은 특징 서열 또는 모티프를 찾기 위해서 이용할 수 있다. 예를 들면 MEME(Multiple Em for Motif Elicitation)는 서열 세트에서 모티프 및 특징 서열을 찾으며, MAST(Motif Alignment and Search Tool)는 이러한 모티프를 이용하여 질의 서열에서 동일한 모티프 또는 유사한 모티프를 규명한다. 상기 MAST 결과는 찾은 모티프의 적당한 통계 데이터 및 시각적 개요와 함께 일련의 정렬로서 제공된다. MEME 및 MAST는 샌디에고 캘리포니아 대학에서 개발하였다.
PROSITE(Bairoch and Bucher, 1994, Nucleic Acids Res. 22, 3583; Hofmann et al., 1999, Nucleic Acids Res. 27, 215)는 게놈 또는 cDNA 서열로부터 번역된 비특징화된 단백질의 기능을 규명하는 방법이다. 상기 PROSITE 데이터베이스(www.expasy.org/prosite)는 생물학적으로 중요한 패턴 및 프로파일을 함유하며, 도안되어 알려진 도메인(들)이 서열에 존재하는 지의 여부를 결정하거나 또는 알려진 단백질 과에 새로운 서열의 배정을 위한 적당한 컴퓨터 툴과 함께 사용될 수 있다(Falquet et al., 2002, Nucleic Acids Res. 30, 235). 프로서치는 주어진 서열의 패턴 또는 특징을 갖는 SWISS-PROT 및 EMBL 데이터베이스를 찾을 수 있는 툴이다.
변이체의 기능
본 발명의 폴리뉴클레오티드/폴리펩티드의 기능은 여기서 제공하는 방법을 사용하여 시험할 수 있다. 특히 실시예 7을 참조할 수 있다.
구조체 및 벡터의 제조 방법
본 발명의 유전적 구조체는 본 발명의 하나 이상의 폴리뉴클레오티드 서열 및 기재된 폴리펩티드를 암호화하는 폴리뉴클레오티드를 포함하며, 예를 들면 박테리아, 곰팡이, 곤충, 포유류 또는 특정 식물 조직을 형질전환시키기에 유용할 수 있다. 본 발명의 유전적 구조체는 여기서 기재하는 발현 구조체를 포함한다.
유전적 구조체 및 벡터를 사용하고 제조하는 방법은 당업에 잘 공지되어 있으며, 일반적으로 하기에 기재되어 있다: Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed. Cold Spring Harbor Press, 1987; Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing, 1987.
구조체 및 벡터를 포함하는 숙주 세포의 제조 방법
본 발명은 본 발명의 유전적 구조체 또는 벡터를 포함하는 숙주 세포를 제공한다. 숙주 세포는 예를 들면 박테리아, 곰팡이, 곤충, 포유류 또는 식물 조직으로부터 유도될 수 있다.
본 발명의 유전적 구조체, 예컨대 발현 구조체를 포함하는 숙주 세포는 폴리펩티드의 재조합 제조에 있어서 당업에 잘 알려진 방법(예를 들면 Sambrook et al., Molecular Cloning : A Laboratory Manual, 2nd Ed. Cold Spring Harbor Press, 1987 ; Ausubel et al., Current Protocols in Molecular Biology, Greene Publishing, 1987)에 유용하다. 상기 방법은 본 발명의 폴리펩티드의 발현 유도 또는 발현에 적당한 조건으로 적당한 배지에서 숙주 세포를 배양하는 것을 포함한다. 다음에 배지로 선택적으로 분비될 수 있는 발현된 재조합 폴리펩티드를 당업에 잘 알려진 방법(예를 들면 Deutscher, Ed, 1990, Methods in Enzymology, Vo1 182, Guide to Protein Purification)에 의해 배지, 숙주 세포 또는 배양 배지로부터 분리시킬 수 있다.
구조체 및 벡터를 포함하는 식물 세포 및 식물의 제조 방법
또한 본 발명은 폴리뉴클레오티드 또는 폴리펩티드의 발현을 변경하도록 변형된 식물 세포 및 본 발명의 유전적 구조체를 포함하는 식물 세포를 제공한다. 상기 세포를 포함하는 식물도 또한 본 발명의 하나의 측면을 형성한다.
폴리뉴클레오티드로 식물 세포, 식물 및 이의 일부를 형질전환시키는 방법은 Draper et al., 1988, Plant Genetic Transformation and Gene Expression. A Laboratory Manual Blackwell Sci. Pub. Oxford, p. 365; Potrykus and Spangenburg, 1995, Gene Transfer to Plants. Springer-Verlag, Berlin.; and Gelvin et al., 1993, Plant Molecular Biol. Manual. Kluwer Acad. Pub. Dordrecht에 기재되어 있다. 형질전환 기술을 포함하는 유전자도입 식물의 검토는 Galun and Breiman, 1997, Transgenic Plants. Imperial College Press, London에서 제공된다.
하기는 하기의 식물 종을 유전적으로 형질전환시키는데 사용할 수 있는 유전적 형질전환 프로토콜을 개시하고 있는 대표적인 문헌들이다: Rice (Alam et al., 1999, Plant Cell Rep. 18, 572); apple (Yao et al., 1995, Plant Cell Reports 14, 407-412); maize (US Patent Serial Nos. 5, 177, 010 and 5, 981 , 840); wheat (Ortiz et al., 1996, Plant Cell Rep. 15, 1996, 877); tomato (US Patent Serial No. 5, 159, 135); potato (Kumar et al., 1996 Plant J. 9, : 821); cassava (Li et al., 1996 Nat. Biotechnology 14, 736); lettuce (Michelmore et al, 1987, Plant Cell Rep. 6, 439); tobacco (Horsch et al., 1985, Science 227, 1229); cotton (US Patent Serial Nos. 5, 846, 797 and 5, 004, 863); perennial ryegrass (Bajaj et al., 2006, Plant Cell Rep. 25, 651); grasses (US Patent Nos. 5, 187, 073, 6. 020, 539); peppermint (Niu et al., 1998, Plant Cell Rep. 17, 165); citrus plants (Pena et al., 1995, Plant Sci.104, 183); caraway (Krens et al., 1997, Plant Cell Rep, 17, 39); banana (US Patent Serial No. 5, 792, 935); soybean (US Patent Nos. 5, 416, 011 ; 5, 569, 834 ; 5, 824, 877 ; 5, 563, 04455 and 5, 968, 830); pineapple (US Patent Serial No. 5, 952, 543); poplar (US Patent No. 4, 795, 855); monocots in general (US Patent Nos. 5, 591 , 616 and 6, 037, 522); brassica (US Patent Nos. 5, 188, 958 ; 5, 463, 174 and 5, 750, 871); and cereals (US Patent No. 6, 074, 877); pear (Matsuda et al., 2005, Plant Cell Rep. 24(1 ):45- 51); Prunus (Ramesh et al., 2006, Plant Cell Rep. 25(8):821-8; Song and Sink 2005, Plant Cell Rep. 2006; 25(2):117-23; Gonzalez Padilla et al., 2003, Plant Cell Rep. 22(1):38-45); strawberry (Oosumi et al., 2006, Planta.; 223(6): 1219-30; Folta et al., 2006, Planta. 2006 Apr 14; PMID: 16614818), rose (Li et al., 2003, Planta. 218(2):226-32), Rubus (Graham et al., 1995, Methods Mol Biol. 1995;44: 129-33). Clover (Voisey et al., 1994, Plant Cell Reports 13: 309-314, and Medicago (Bingham, 1991, Crop Science 31 : 1098). 다른 종들의 형질 전환도 또한 본 발명에서 고려한다. 다른 종들의 형질전환을 위한 적당한 방법 및 프로토콜을 과학적 문헌에서 이용할 수 있다.
식물의 유전적 조작 방법
식물을 유전적으로 조작하는 다수의 전략들을 이용할 수 있다(예를 들면 Birch, 1997, Ann Rev Plant Phys Plant Mol Biol, 48, 297). 예를 들어 전략들은 세포, 조직, 기관 및/또는 통상적으로 발현되지 않는 특정의 개발 단계에서의 폴리뉴클레오티드/폴리펩티드를 이소성으로 발현시키거나 또는 식물 세포, 조직 및/또는 통상적으로 발현되는 특정의 개발 단계에서의 폴리뉴클레오티드/폴리펩티드의 별현을 증가시키도록 도안할 수 있다. 또한 전략들은 외부 자극들, 예컨대 환경적 자극들에 반응하여 폴리뉴클레오티드/폴리펩티드의 발현을 증가시키도록 도안할 수도 있다. 환경적 자극들은 환경적 스트레스들, 예컨대 기계적(예컨대 초식동물의 활성), 탈수, 염분 및 온도 스트레스들을 포함할 수 있다. 발현된 폴리뉴클레오티드/폴리펩티드는 형질전환되기 위해 식물 종들로부터 유도될 수 있거나 또는 상이한 식물 종들로부터 유도될 수 있다.
형질전환 전략들은 외부 자극들에 반응하여 폴리뉴클레오티드/폴리펩티드의 발현을 감소시키거나 또는 식물 세포, 조직, 기간 또는 정상적으로 발현되는 특정의 개발 단계에서 폴리뉴클레오티드/폴리펩티드의 발현을 감소시키도록 도안될 수 있다. 이러한 전략들은 유전자 사일런싱 전략으로도 알려져 있다.
유전자도입 식물에서 유전자 발현을 위한 유전적 구조체들은 형질전환 식물에서 유전적 구조체의 존재를 검출하기 위한 하나 이상의 클론된 폴리뉴클레오티드, 종결인자 및 선택가능한 마커 서열의 발현을 유도하기 위해서 프로모터들, 예컨대 본 발명의 프로모터 폴리뉴클레오티드를 통상적으로 포함한다.
식물 형질전환 유전적 구조체에 통상적으로 사용되는 대표적인 종결인자들은 예를 들면 콜리플라워 모자이크 바이러스(CaMV) 35S 종결인자, 아그로박테리움 투메페이션스 노팔린 합성 효소 또는 옥토파인 합성 효소 종결인자들, 지아 메이스 진 유전자(Zea mays zin gene) 종결인자, 오리자 사티바 ADP-글루코스 피로포스포릴라아제(Oryza sativa ADP-glucose pyrophosphorylase) 종결인자 및 솔라눔 투버로섬 PI-II(Solanum tuberosum PI-II) 종결인자를 포함한다.
식물 형질전환에 통상적으로 사용되는 선택가능한 마커는 카나마이신 저항성을 부여하는 네오마이신 포포트란스퍼라아제 II 유전자(NPT II), 스펙티노마이신 및 스트렙토마이신 저항성을 부여하는 aadA 유전자, Ignite(AgrEvo) 및 Basta(Hoechst) 저항성의 포스피노트리신 아세틸 트란스퍼라아제(bar 유전자) 및 하이그로마이신 저항성의 하이그로마이신 포스포트란스퍼라아제 유전자(hpt)을 포함한다.
식물 및 식물 조직에서 프로모터 발현 분석을 위해 사용될 수 있는 리포터 유전자[효소적 활성 및/또는 가시적 신호(예를 들면 루시퍼라아제, GUS, GFP)가 일반적으로 숙주에 외래성인 활성을 발현하는 코딩 서열]를 포함하는 유전적 구조체의 용도도 또한 고려한다. 상기 리포터 유전자 문헌은 Herrera-Estrella et al., 1993, Nature 303, 209, and Schrott, 1995, In: Gene Transfer to Plants (Potrykus, T., Spangenberg. Eds) Springer Verlag. Berline, pp. 325-336에 기재되어 있다.
유전자 사일런싱 전략들은 암호화 폴리펩티드의 발현에 효과적인 조절 인자 또는 유전자 자체에 촛점을 맞출 수 있다. "조절 인자(regulatory elements)"는 가능한 광범위한 센스로 여기에서 사용되며, 원하는 유전자와 상호작용하는 다른 유전자들을 포함한다.
폴리뉴클레오티드/폴리펩티드의 발현을 감소 또는 사일런싱시키도록 도안된 유전적 구조체는 폴리뉴클레오티드의 안티센스 카피를 포함할 수 있다. 이러한 구조체에서 폴리뉴클레오티드는 프로모터 및 종결인자에 대해서 안티센스 방향에 놓여있다.
"안티센스(antisense)" 폴리뉴클레오티드는 폴리뉴클레오티드 또는 폴리뉴클레오티드의 세그먼트를 인버팅하여 수득되어 제조된 전사물은 유전자, 예를 들면 하기와 같은 유전자의 mRNA 전사물에 상보적이 될 것이다:
5'GATCTA 3' (코딩 가닥) 3'CTAGAT 5' (안티센스 가닥)
3'CUAGAU 5' mRNA 5'GAUCUCG 3' 안티센스 RNA
유전자 사일런싱을 위해 도안된 유전적 구조체들은 또한 역반복 구조(Inverted repeat)를 포함할 수도 있다. '역반복 구조(inverted repeat)'는 반복의 두번째 반이 예를 들면 하기와 같은 상보적인 가닥내에 있는 반복되는 서열이다:
5'-GATCTA........ TAGATC-3'
3'-CTAGAT........ ATCTAG-5'
형성된 전사물은 상보적인 염기 쌍을 겪어 헤어핀 구조를 형성한다. 통상적으로 반복된 구역 사이에 적어도 3-5 bp의 스페이서는 헤어핀 구조를 형성하기 위해서 필요하다.
또 다른 사일런싱 접근법은 miRNA에 전사 균등물에 표적인 작은 안티센스 RNA의 사용 단계를 포함한다(Llave et al., 2002, Science 297, 2053). 본 발명의 폴리뉴클레오티드에 상응하는 상기 작은 안티센스 RNA의 사용을 분명하게 고려한다.
여기서 사용하는 유전적 구조체라는 용어는 또한 유전자 사일런싱에 효과적으로 유용한 다른 폴리뉴클레이티드 및 작은 안티센스 RNA들을 포함한다.
여기서 규정하는 발현 구조체에 의한 형질전환은 또한 센스 억제로서 알려진 공정을 통해서 유전자 사일런싱을 야기할 수 있다(예를 들면 Napoli et al., 1990, Plant Cell 2, 279; de Carvalho Niebel et al., 1995, Plant Cell, 7, 347). 몇몇 경우에서 센스 억제는 전체 또는 부분적 코딩 서열의 과발현과 관련이 있을 수 있으며, 또한 인토론 또는 5' 또는 3' 비번역 구역(UTR)과 같은 유전자의 비-코딩 영역의 발현과 관련이 있을 수 있다. 키메라 부분적 센스 구조체는 대등하게 사일런트 다수 유전자를 사일런싱시키는데 사용할 수 있다(Abbott et al., 2002, Plant Physiol. 128(3): 844-53; Jones et al., 1998, Planta 204: 499-505). 본 발명의 프로모터와 작동가능하게 연결된 서열의 발현을 사일런싱시키기 위한 상기 센스 억제 전략의 이용 또한 고려한다.
유전자 사일런싱을 위해 도안된 유전적 구조체에서 폴리뉴클레오티드 삽입은 코딩 서열 및/또는 비-코딩 서열, 예컨대 프로모터 및/또는 인트론 및/또는 5' 또는 3' UTR 서열 또는 상응하는 유전자에 상응할 수 있다.
다른 유전자 사일런싱 전략들은 리보자임 구조체의 사용 및 우세한 음성 접근법을 포함한다(Mclntyre, 1996, Transgenic Res, 5, 257).
예비-전사 사일런싱(pre-transcriptional silencing)은 유전자 자체 또는 이의 조절 인자의 돌연변이를 통해서 야기될 수 있다. 이러한 돌연변이는 점 돌연변이, 프레임시프트, 삽입, 결실 및 치환을 포함할 수 있다.
식물
"식물(plant)"이라는 용어는 전체 식물, 식물의 임의의 일부, 번식체 및 식물의 자손을 포함한다.
여기서 사용하는 '자손(progeny)'이라는 용어는 본 발명의 세포 또는 유전자도입 식물로부터 수득 또는 유도되는 임의의 세포, 식물 또는 이의 일부를 나타낸다. 따라서 자손이라는 용어는 이에 제한하지는 않지만 씨앗, 씨앗으로부터 수득된 식물들, 식물들 또는 이의 일부들, 또는 식물 조직 배양, 또는 클로닝, 기술로부터 유도된 것들을 포함한다.
'번식체(propagule)'라는 용어는 씨앗 및 컷팅을 포함하는 성적 또는 무성적 재생산 또는 번식에 사용될 수 있는 식물의 임의의 일부를 의미한다.
"유전자도입(transgenic)" 또는 "형질전환(transformed)" 식물은 유전적 조작 또는 형질전환의 결과로서 신규의 유전적 물질을 함유하는 식물을 나타낸다. 신규의 유전적 재료는 상이한 종들로부터 또는 수득된 유전자도입 또는 형질전환된 식물로서 동일한 종들의 식물로부터 유도될 수 있다. 형질전환된 식물은 신규의 유전적 재료로 안정하게 또는 일시적으로 형질전환된 식물을 포함한다.
본 발명의 식물은 그자체로서 또는 상이한 식물 스트레인으로 교잡되어 클 수 있으며, 목적하는 표현형 특성을 갖는 수득된 하이브리드를 규명할 수 있다. 2 세대 이상이 클 수 있다. 이러한 표준 번식 접근법으로부터 수득되는 식물은 또한 본 발명의 일부를 형성한다.
본 발명의 부가의 측면은 첨부된 도면을 참고하여 예로서 제공된 하기의 설명으로부터 명백하게 될 것이다:
도 1은 일반적인 축합형 탄닌 경로를 나타낸다.
도 2a는 성숙한 티. 아르벤스(T. arvense) 잎 조직으로부터 클로닝된 TaMYB14의 전체 길이 cDNA 서열을 나타내는 cDNA 서열을 나타낸다.
도 2b는 TaMYB14의 아미노산 번역을 나타낸다.
도 3은 동일한 온실조건에서 성장한 재배종(cultivars) 및 트리폴리움종(Trifolium species)으로부터의 다양한 조직에서 TaMYB14의 전사 수준(transcript levels)을 나타낸다. 레인 1, (사다리형); 레인 2, 티. 레펜스(T. repens) 성숙한 잎 cDNA 라이브러리 (Cultivar Huia); 레인 3, 티. 레펜스 성숙한 뿌리 cDNA 라이브러리 (Cultivar Huia); 레인 4, 티. 레펜스 성숙한 포복경(stolon) cDNA 라이브러리 (Cultivar Huia); 레인 5, 티. 레펜스 성숙한 꽃 cDNA 라이브러리 (Cultivar DC111); 레인 6, 티. 레펜스 신엽(emerging leaf) cDNA (Cultivar Huia); 레인 7, 티. 레펜스 성숙한 잎 cDNA (높은 안토시아닌 Cultivar Isabelle); 레인 8, 티. 아르벤스(T. arvense) 미성숙한 잎 cDNA (Cultivar AZ2925); 레인 9, 티. 아르벤스 성숙한 잎 cDNA (Cultivar AZ2925); 레인 10, 티. 레펜스 분열조직(meristem) 꽃 cDNA (Cultivar Huia); 레인 11, 티. 레펜스 분열조직 잎 cDNA (Cultivar Huia); 레인 12, 티. 레펜스 분열조직 모상체(meristem trichome) 유일 cDNA (Cultivar Huia); 레인 13, 티. 옥시덴탈(T. occidentale) 성숙한 식물 (잎, 뿌리 및 포복경) cDNA 라이브러리 (Cultivar Huia); 레인 14, 티. 레펜스 성숙한 결절점(nodal) cDNA 라이브러리 (Cultivar Huia); 레인 15, TOPO에서 클로닝된 티. 아르벤스 MYB14cDNA 클론; 레인 16, TOPO에서 클로닝된 티. 아르벤스 MYB14 게놈성 클론; 레인 17, 티. 옥시덴탈 게놈성 DNA; 레인 17, 티. 레펜스 게놈성 DNA; 레인 17, 티. 아르벤스 게놈성 DNA; 레인 20, (사다리형).
도 4는 동일한 온실 조건에서 성장한 재배종(cultivars) 및 트리폴리움종(Trifolium species)으로부터의 다양한 조직에서 BANYULS (A) 및 LAR (B)의 전사 수준을 나타낸다. 레인 1, (사다리형); 레인 2, 티. 레펜스 성숙한 잎 cDNA 라이브러리 (Cultivar Huia); 레인 3, 티. 레펜스 성숙한 뿌리 cDNA 라이브러리 (Cultivar Huia); 레인 4, 티. 레펜스 성숙한 포복경 cDNA 라이브러리 (Cultivar Huia); 레인 5, 티. 레펜스 성숙한 꽃 cDNA 라이브러리 (Cultivar DC111); 레인 6, 티. 레펜스 신엽 cDNA (Cultivar Huia); 레인 7, 티. 레펜스 성숙한 잎 cDNA (높은 안토시아닌 Cultivar Isabelle); 레인 8, 티. 아르벤스 미성숙한 잎 cDNA (Cultivar AZ2925); 레인 9, 티. 아르벤스 성숙한 잎 cDNA (Cultivar AZ2925); 레인 10, 티. 레펜스 분열조직 꽃 cDNA (Cultivar Huia); 레인 11, 티. 레펜스 분열조직 잎 cDNA (Cultivar Huia); 레인 12, 티. 레펜스 분열조직 모상체 유일 cDNA (Cultivar Huia); 레인 13, 티. 옥시덴탈 성숙한 식물 (잎, 뿌리 및 포복경) cDNA 라이브러리 (Cultivar Huia); 레인 14, 티. 레펜스 성숙한 결절점 cDNA 라이브러리 (Cultivar Huia); 레인 15, TOPO에서 클로닝된 티. 아르벤스 cDNA BAN 또는 LAR 클론; 레인 16, TOPO에서 클로닝된 티. 아르벤스 BAN 또는 LAR 게놈성 클론; 레인 17, 티. 옥시덴탈 게놈성 DNA; 레인 17, 티. 레펜스 게놈성 DNA; 레인 17, 티. 아르벤스 게놈성 DNA; 레인 20, (사다리형).
도 5는 형질전환된 화이트 클로버의 성숙한 잎 조직의 DMACA 염색의 결과를 나타낸다. 성숙한 화이트 클로버 잎 조직의 DMACA 염색(연회색/암회색)은 (A) 야생형 및 (B) TaMYB14 유전자로 형질전환된 형태에서 축합형 탄닌을 확인하였다.
도 6은 식물 형질전환에 사용된 플라즈미드 벡터 M14ApHZBarP를 나타낸다. E1, E2 및 E3은 게놈성 대립유전자(genomic allele) TaMYB14-1의 3개의 엑손(exon)을 나타낸다.
도 7은 연회색으로 강조된 동일성을 갖는 트리폴리움(Trifolium) MYB14, 탑 BLASTN 히트(hits) 및 AtTT2의 전체-길이의 cDNA 서열의 정렬을 나타낸다.
도 8은 연회색으로 강조된 동일성과 박스로 둘러쌓인 모티프(motifs)를 갖는 트리폴리움 아르벤스(Trifolium arvense) TaMYB14, 탑 BLASTN 히트 및 AtTT2의 해독된 오픈 리딩 프레임(open reading frames)의 정렬을 나타낸다.
도 9는 암회색 영역/백색 영역으로 강조된 차이점 및 박스로 강조된 결실/삽입 영역을 갖는 TaMYB14 (발현된 TaMYB14FTa 및 사일런트 TaMYB14-2S), ToMYB14 대립유전자 및 TrMYB14 대립유전자의 전체-길이 단백질 서열의 정렬을 나타낸다.
도 10은 강조된 엑손(연회색) 및 인트론(암회색)의 차이점을 갖는, 트리폴리움 아르벤스 TaMYB14 대립유전자(TaM3, TaM4)로 배열된 트리폴리움 레펜스(Trifolium repens) TrMYB14 대립유전자(TRM*)의 전체-길이 게놈성 DNA 서열의 정렬을 나타낸다.
도 11은 강조된 엑손(연회색) 및 인트론(암회색)의 차이점을 갖는, 트리폴리움 아르벤스 TaMYB14 대립유전자(TaM3, TaM4)로 배열된 트리폴리움 옥시덴탈(Trifolium occidentale) ToMYB14 대립유전자(To1, To6)의 전체-길이 게놈성 DNA 서열의 정렬을 나타낸다.
도 12는 차이점을 나타내는 엑손(연회색) 및 인트론(암회색)의 트리폴리움 아르벤스 TaMYB14 대립유전자(Ta*) 및 트리폴리움 아피네(Trifolium affine) TafMYB14 대립유전자(Taf*)의 전체-길이 게놈성 DNA 서열의 정렬을 나타낸다.
도 13은 pdk 인트론을 플랜킹하는 센스(SMYB14F) 및 안티센스(SMYB14R) 배향으로 티. 아르벤스로부터 TaMYB14 cDNA의 세그먼트를 포함하는, MYB14pHANNIBAL로부터 NotI 단편을 포함하는 구조체 pHZbarSMYB의 벡터 NTI 지도를 나타낸다.
도 14는 추정상 형질전환된 화이트 클로버로부터 분리된 게놈성 DNA로부터 M14ApHZBAR의 존재에 대한 PCR 반응을 나타낸다. 레인; A1, B1 사다리형(Ladder); A2-18 및 B2-B15 형질전환된 클로버, B16 형질전환되지 않은 화이트 클로버, B17 플라즈미드 대조군, B18 물 대조군. 프라이머는 1,244 bp 단편으로 증폭되는 35S(프로모터) 및 PMYBR(유전자의 3' 말단으로)이다.
도 15는 야생형(A) 및 TaMYB14 구조체로 형질전환된 유전자도입 (B 내지 D) 티. 레펜스 잎의 DMACA 스크리닝(screening) 결과를 나타낸다.
도 16은 TaMyb14A 유전자를 발현하는 DMACA 염색된 유전자도입 어린 잎(leaflets)의 모상체(trichomes)(E-G), 표피 세포(H) 및 엽육 세포(mesophyll cell)(I-K)의 오일형 현미경 사진(oil microscopy)을 나타낸다.
도 17은 포도씨 추출물 단량체를 나타낸다 - 포도씨 추출물에서 단량체의 SRM 크로마토그램이 하기에 도시되었다. 트레이스(trace) A는 291.3 m/z의 SRM의 생성물 이온 123 m/z, 139 m/z 및 165 m/z의 합이다[카테킨(C) 및 에피카테킨(EC)]. 트레이스 B는 307.3 m/z의 SRM의 생성물 이온 139 m/z 및 151 m/z의 합이다[갈로카테킨(GC) 및 에피갈로카테킨(EGC)].
도 18은 포도씨 추출물 이량체 및 삼량체를 나타낸다. 포도씨 추출물에서 이량체 및 삼량체의 SRM 크로마토그램이 하기에 도시되었다. 트레이스 A는 579.3 m/z의 SRM의 생성물 이온 291 m/z, 409 m/z 및 427 m/z의 합이다(PC:PC 이량체). 트레이스 B는 595.3 m/z의 SRM의 생성물 이온 291 m/z, 307 m/z, 427 m/z 및 443 m/z의 합이다(PC:PD 이량체). 트레이스 C는 867.3 m/z의 SRM의 생성물 이온 291 m/z, 577 m/z 및 579 m/z의 합이다(3PC 삼량체). PC:PC 이량체, PC:PD 이량체 및 2개의 3PC 삼량체의 MS2 스펙트럼이 상기 대사산물의 동정(同定)의 증거로서 제공된다.
도 19는 하기와 같이 나타내는 MYB14를 발현하는 유전자도입(화이트 클로버 +ve) 식물 및 대조군(화이트 클로버 -ve)에 대한 단량체의 SRM 크로마토그램을 나타낸다. 트레이스 A는 291.3 m/z의 SRM의 생성물 이온 123 m/z, 139 m/z 및 165 m/z의 합이다(PC:카테킨 및 에피카테킨). 트레이스 B는 307.3 m/z의 SRM의 생성물 이온 139 m/z 및 151 m/z의 합이다(PD; 갈로카테킨 및 에피갈로카테킨). 크로마토그램 스케일은 변형된 식물에서 단량체의 출현을 나타내기 위해서 고정된다. 대조군 식물에서 단량체는 검출되지 않았다. 에피카테킨(EC) 및 에피갈로카테킨(EGC)의 MS2 스펙트럼이 상기 대사산물의 동정의 증거로서 변형된 식물로부터 제공된다.
도 20은 하기와 같이 나타내는 MYB14를 발현하는 유전자도입(화이트 클로버 +ve) 식물 및 대조군(화이트 클로버 -ve)에 대한 이량체의 SRM 크로마토그램을 나타낸다. 트레이스 A는 579.3 m/z의 SRM의 생성물 이온 291 m/z, 409 m/z 및 427 m/z의 합이다(PC:PC 이량체). 트레이스 B는 595.3 m/z의 SRM의 생성물 이온 291 m/z, 307 m/z, 427 m/z 및 443 m/z의 합이다(PC:PD 이량체). 트레이스 C는 611.3 m/z의 SRM의 생성물 이온 307 m/z 및 443 m/z의 합이다(PD:PD 이량체). 크로마토그램 스케일은 변형된 식물에서 이량체의 출현을 나타내기 위해서 고정된다. 대조군 식물에서 이량체는 검출되지 않았다. 3개의 PD:PD 이량체(1-3) 및 한개의 PC:PD 혼합 이량체(4)의 MS2 스펙트럼이 상기 대사산물의 동정의 증거로서 변형된 식물로부터 제공된다.
도 21은 하기와 같이 나타내는 MYB14를 발현하는 유전자도입(화이트 클로버 +ve) 식물 및 대조군(화이트 클로버 -ve)에 대한 삼량체의 SRM 크로마토그램을 나타낸다. 트레이스 A는 867.3 m/z의 SRM의 생성물 이온 291 m/z, 577 m/z 및 579 m/z의 합이다(3PC 삼량체). 트레이스 B는 883.3 m/z의 SRM의 생성물 이온 291 m/z, 307 m/z, 427 m/z, 443 m/z, 577 m/z, 579 m/z, 593 m/z, 595 m/z 및 757 m/z의 합이다(PC:PD 이량체). 트레이스 C는 899.3 m/z의 SRM의 생성물 이온 291 m/z, 307 m/z, 443 m/z, 593 m/z, 595 m/z, 611 m/z, 731 m/z, 757 m/z 및 773 m/z의 합이다(1PC:2PD 삼량체). 트레이스 D는 915.3 m/z의 SRM의 생성물 이온 307 m/z, 443 m/z, 609 m/z, 611 m/z, 747 m/z, 773 m/z 및 789 m/z의 합이다(3PD 삼량체). 크로마토그램 스케일은 변형된 식물에서 삼량체의 출현을 나타내기 위해서 고정된다. 대조군 식물에서 삼량체는 검출되지 않았다. 3PD 삼량체 및 1PC:2PD 혼합 삼량체의 MS2 스펙트럼이 상기 대사산물의 동정의 증거로서 변형된 식물로부터 제공된다.
도 22는 추정상 형질전환된 토바코 묘목으로부터 분리된 게놈성 DNA로부터 M14ApHZBAR의 존재에 대한 PCR 반응을 나타낸다. 레인; A1, 사다리형; A2-10 형질전환된 토바코, A13, 14, 토바코 대조군, A15 플라즈미드 대조군. 프라이머는 1,244 bp 단편을 증폭시키는 35S(프로모터) 및 PMYBR (유전자의 3' 말단으로)이다.
도 23은 M14ApHZBAR 구조체로 형질전환된 유전자도입(A 내지 G) 토바코[니코티아나 타바쿰(Nicotiana tabacum)] 잎의 DMACA 스크리닝 결과를 나타낸다.
도 24는 하기와 같이 나타내는 MYB14를 발현하는 변형된(유전자도입) 식물 및 대조군(야생형)에 대한 SRM 크로마토그램을 나타낸다. 트레이스 A는 291.3 m/z의 SRM의 생성물 이온 123 m/z, 139 m/z 및 165 m/z의 합이다(PC; 카테킨 및 에피카테킨). 트레이스 B는 307.3 m/z의 SRM의 생성물 이온 139 m/z 및 151 m/z의 합이다(PD; 갈로카테킨 및 에피갈로카테킨). 트레이스 C는 579.3 m/z의 SRM의 생성물 이온 291 m/z, 409 m/z 및 427 m/z의 합이다(PC:PC 이량체). 트레이스 D는 867.3 m/z의 SRM의 생성물 이온 291 m/z, 577 m/z 및 579 m/z의 합이다(PC:PC:PC 삼량체). 크로마토그램 스케일은 변형된 식물에서 단량체, 이량체 및 삼량체의 출현을 나타내기 위해서 고정된다. 주목할 것은 혼합 PC:PD 또는 100% PD 이량체 또는 삼량체가 검출되지 않았다는 것이다.
도 25는 대사산물의 동정의 증거로서 MYB14를 발현하는 변형된 (유전자도입) 식물로부터 제공되는 에피카테킨(EC), 갈로카테킨(GC), 에피갈로카테킨(EGC), PC:PC 이량체 1, PC:PC 이량체 2 및 PC:PC:PC 삼량체의 MS2 스펙트럼을 나타낸다.
도 26은 추정상 형질전환된 티. 아르벤스로부터 분리된 게놈성 DNA에서 M14pHANNIBAL의 존재에 대한 PCR 반응을 나타낸다. 레인; A1 pHANNIBAL 음성 대조군 벡터, A2 1,244 bp 단편을 증폭시키는 35S 및 게놈성 유전자 구조체-대조군을 포함하는 M14ApHZBAR; A3 hpRNA 구조체를 포함하는 M14pHANNIBAL 양성 플라즈미드 대조군, A4 ocs 종결인자의 안티센스 방향 업스트림에서 MYB 단편을 포함하는 pHANNIBAL(음성 대조군), A5 pHZBARSMYB 양성 플라즈미드 대조군, A6 사다리형, A7-18 형질전환된 티. 아르벤스, A19 게놈성 DNA 야생형 티. 아르벤스, A20 물 대조군.
B: B1 사다리형, B2-B11 형질전환된 티. 아르벤스, B12 M14pHANNIBAL 양성 플라즈미드 대조군. 프라이머는 393 bp 단편을 증폭시키는 35S (프로모터) 및 PHMYBR (유전자의 3' 말단으로)이다.
도 27은 조직 배양 배지에서 재생된 야생형 티. 아르벤스 캘러스(A) 및 묘목(B 내지 D)의 DMACA 스크리닝의 결과를 나타낸다. DMACA 염색은 조직 배양 배지에서 재생된 유전자도입(E 내지 L) 티.아르벤스 묘목의 DMACA 스크리닝 및 캘러스에서 발생하지 않는다. 염색은 야생형 식물과 비교하여 크게 감소되었다.
도 28은 티. 아르벤스 대조군 및 넉아웃 식물에 대한 4개의 단량체 SRM 크로마토그램을 나타낸다: 트레이스 A는 대조군 식물에 대한 291.3 m/z의 SRM의 생성물 이온 123 m/z, 139 m/z 및 165 m/z의 합이다(PC; 카테킨 및 에피카테킨). 트레이스 B는 넉아웃 식물에 대한 291.3 m/z의 SRM의 생성물 이온 123 m/z, 139 m/z 및 165 m/z의 합이다(PC; 카테킨 및 에피카테킨). 트레이스 C는 대조군 식물에 대한 307.3 m/z의 SRM의 생성물 이온 139 m/z 및 151 m/z의 합이다(PD; 갈로카테킨 및 에피갈로카테킨). 트레이스 D는 넉아웃 식물에 대한 307.3 m/z의 SRM의 생성물 이온 139 m/z 및 151 m/z의 합이다(PD; 갈로카테킨 및 에피갈로카테킨). MS2 스펙트럼은 대조군 식물에서 카테킨 및 갈로카테킨의 증거로서 대조군 식물로부터 제공된다. 트레이스 A, B, C 및 D에 대한 크로마토그램 스케일은 넉아웃 식물에서 카테킨 및 갈로카테킨의 비출현을 보여주기 위해서 고정되었다.
도 29는 대조군 및 넉아웃 티. 아르벤스 식물에 대한 이량체 SRM 크로마토그램을 나타낸다. 트레이스 A는 579.3 m/z의 SRM의 생성물 이온 291 m/z 및 427 m/z의 합이다(PC:PC 이량체). 트레이스 B는 595.3 m/z의 SRM의 생성물 이온 307 m/z, 427 m/z 및 443 m/z의 합이다(PC:PD 이량체). 트레이스 C는 611.3 m/z의 SRM의 생성물 이온 307 m/z 및 443 m/z의 합이다(PD:PD 이량체). 크로마토그램 스케일은 넉아웃 식물에서 이량체의 비출현을 나타내기 위해서 고정된다. MS2 스펙트럼은 대조군에서 모두 3개 타입 이량체의 증거로서 대조군 식물로부터 제공된다.
도 30은 추정상 형질전환된 알파파로부터 분리된 게놈성 DNA로부터 pTaMyb14A의 존재에 대한 PCR 분석을 나타낸다. 레인 L; 사다리형; 1-3, 형질전환되지 않음, 4-10 형질전환됨, 11 야생형, 12 물 대조군, 13 플라즈미드 대조군. 프라이머는 35S 및 PMYBR (유전자의 3' 말단으로)이다.
도 31은 추정상 형질전환된 브라시카(brassica) 묘목으로부터 분리된 게놈성 DNA로부터 M14ApHZBAR의 존재에 대한 PCR 분석을 나타낸다. 레인 8; 브라시카 대조군; 레인 18 사다리형; 레인 1-7 및 9-17 형질전환된 브라시카. 프라이머는 1,244 bp 단편을 증폭시키는 35S(프로모터) 및 PMYBR (유전자의 3' 말단으로)이다.
도 32는 M14ApHZBARP 구조체로 형질전환된 유전자도입(B 내지 D) 잎 및 야생형 브라시카[브라시카 올레라세아(Brassica oleracea)](A)의 DMACA 스크리닝의 결과를 나타낸다.
도 33은 2개의 대조군 및 MYB14를 발현하는 유전자도입 브라시카에서 291.3 m/z의 SRM의 생성물 이온 123 m/z, 139 m/z 및 165 m/z의 SRM 크로마토그램[카테킨(C) 및 에피카테킨(EC)]을 나타낸다. 유전자도입 +ve 샘플 및 그린색 대조군에서 검출된 에피카테킨의 MS2 스펙트럼은 상기 대사산물의 동정의 증거로서 제공된다. 레드색 대조군 샘플에서는 에피카테킨이 검출되지 않는다.
도 34는 출원인에 의해서 확인된 모든 트리폴리움 MYB14 단백질 서열의 정렬을 나타낸다.
도 35는 도 34에 배열된 서열들 사이의 동일성 비율(percent identity)을 나타낸다.
서열목록의 간단한 설명
Figure pct00007

Figure pct00008

Figure pct00009


본 발명은 하기 비(非)제한적인 실시예를 참고로 설명될 것이다.
실시예 1: 본 발명의 MYB14 유전자/핵산/단백질의 동정 및 발현 프로파일의 분석
도입
콩과 식물 종의 MYB 도메인으로 도안된 프라이머를 사용하여, 출원인은 트리폴리움종의 범위로부터 분리된 게놈성 DNA(gDNA) 및 cDNA의 PCR에 의해서 신규한 MYB 전사인자(TFs)를 코딩하는 증폭된 서열을 증폭시켰다. 상기 종들은 성숙한 잎 조직에서 CTs를 축적하는 능력에 차이가 있다. 화이트 클로버는 잎 조직에서 CT 유전자를 발현하지 않기 때문에 출원인은 잎의 수명을 통해서 잎 조직의 모든 세포에서 CTs를 축적하는 밀접하게 관련된 트리폴리움종(티.아르벤스; 티. 아피네)으로부터 발현된 MYB TF를 분리시키는 다른 전략을 사용하였다. 이는 하기와 같은 다양한 트리폴리움 잎 타입에서 MYB TFs의 상이한 발현 패턴을 조사함으로써 달성된다: 즉, (a) 잎이 나오기 전 분열조직 발생(meristematic development) 중에 잎 모상체로 CT 유전자 발현이 제한되는, 화이트 클로버(티. 레펜스) 잎 조직내; (b) 전체 수명 기간 중에 대부분의 잎 세포(모상체 헤어 제외)안에서 CT 유전자 발현이 발견되는, 밀접하게 관련된 종들(티. 아르벤스)내; (c) CT 생합성이 이미 멈취진 화이트 클로버 성숙한 잎 조직내. 상기의 특정한 일시적 공간적 발현은 CT 브랜치 경로에 특이적인 상이한 MYB TFs에 의한 상이한 조절을 요구한다. 각 잎 타입으로부터의 MYB TFs의 비교는 CT 생합성에서와 다른 기능을 갖는 공통의 MYB 인자들을 제거했다. 남아 있는 분리된 MYB TFs의 분석으로 CT 축적 조직 특유의 상기를 동정했다.
PCR 생성물의 시퀀싱(sequencing)으로 다수의 트리폴리움종으로부터 이전에 동정되지 않은 MYB TFs를 동정했다. 상기 MYB 유전자의 전체 길이의 시퀀싱으로 상이한 트리폴리움종으로부터 유전자에서 염기의 수개의 결실 및 삽입이 존재한다는 것을 포함하여 공개된 AtTT2 서열(NP_198405)과 비교할때 매우 다른 단백질 코드가 밝혀졌다(도 7 및 도 8). cDNA 서열의 번역으로 상기 MYB TF에 의해 코딩되는 단백질이 상당수의 아미노산 결실, 삽입 및 교환이 있는 것도 또한 밝혀졌다(도 9). 본 출원인은 상기 유전자 TaMYB14를 표시하였다. 2개의 상이한 트리폴리움종으로부터 전체-길이의 gDNA 서열의 분석으로 모든 TaMYB14 이소형(isoforms)/대립유전자(alleles)에서 다양한 길이의 3개의 엑손 및 2개의 인트론의 존재를 밝혀냈다(도 10-12).
각각 4개의 트리폴리움종으로부터 다양한 유전자형을 나타내는 다수의 취득물(accessions)로부터의 씨앗(seed)을 온실에서 재배하여 CTs의 존재 또는 부재를 DMACA 염색을 이용하여 잎에서 확인하였다. TaMYB14에 대해서 특이성을 갖는 프라이머를 도안하고 다양한 조직에서의 전사 수준을 PCR로 확인하였다. TaMYB14의 발현은 잎 조직에서의 CT 축적과 연관이 있었다. 이의 발현은 CT가 없는 조직에서는 검출되지 않았다. TaMyb14는 CT가 활성적으로 축적된 조직에서는 매우 높게 발현되었으며, CT 생합성과 특이적으로 관련된 2개의 효소, 즉 ANR 및 LAR의 검출가능한 발현과 일치했다.
화이트 클로버에서 TaMYB14의 형질전환 및 과발현(실시예 2 참조)으로 통상 CT가 없는 조직에서 CT의 수준이 증가했다. 상기는 TaMYB14의 발현이 CTs의 축적에 있어서 중요하다는 것을 나타낸다. 그러므로 유전자도입(transgenesis)에 의한 티. 레펜스에서의 TaMYB14의 과발현으로 다양한 식물종의 잎조직에 유효한 수준의 CT를 축적시킴으로써 가축용 목초지의 품질을 향상시키기 위한 수단을 제공할 것이다.
재료 및 방법
식물 재료 및 축합형 탄닌 수준의 분석
잎 CT 수준이 상이한 4개의 콩과 식물 종의 수개의 재배 품종으로부터의 씨앗을 온실에서 재배하였다. 트리폴리움 레펜스(Trifolium repens)(Ηuia); 티. 아르벤스(T. arvense) (AZ2925; AZ4755; AZ1353); 티. 아피네(T. affine) (AZ925) 및 티. 옥시덴탈(T. occidentale) (AZ4270). 다양한 연령 및 타입의 식물 재료를 수확하고, 상기 재료를 액체 질소에서 즉시 동결시킨 후 분쇄하여 DNA 또는 RNA 분리에 사용하였다.
식물 재료의 DMACA 염색
CTs는 Li 등(1996)에 의해서 기술된 바와 같이 본질적으로 산성화 DMACA(4-디메틸아미노신남알데히드) 방법을 사용하여 조직화학적으로 분석하였다. 상기 방법은 신속한 조직화학적 염색으로서 DMACA(p-디메틸아미노신남알데히드) 시약을 사용하여 매우 낮은 CT 축적에 대한 식물 재료를 특이적으로 스크리닝하였다. DMACA-HCI 프로토콜은 프로안토시아니딘에 대해 매우 특이적이다. 상기 방법은 안토시아닌이 바닐린 분석(vanillin assay)을 크게 방해한다는 점에서 바닐린 테스트에 우선적으로 사용하였다.
MYB R2R3 후보물질의 선택 방법
MYB R2R3 DNA-결합 도메인: 히든 마르코프 모델(hidden Markov models, HMMs) 및 프로파일을 포함하는 콩과 식물 서열을 동정하는데 2가지 방법을 사용하였다. 두가지 방법은 공지된 MYB R2R3 DNA-결합 도메인 단백질 서열로부터 도메인의 "모델(model)"을 형성하는 것에 의해 우선 결정되며, 그후 검색의 근거로서 사용된다. HMM 및 프로파일 모델은 하기 표 1에 개시된 바와 같이 공지된 식물 MYB R2R3 도메인을 사용하여 형성하였다. 상기는 Miyake 등(2003)의 도 2 및 Nesi 등(2001 ; the human MYB sequence in this figure was excluded)의 도 4c로부터 확인되었다. 상기 서열의 종 분포는 하기와 같이 모델을 제조하는데 사용된다:
[표 1]
Figure pct00011

검색된 콩과 식물 서열 세트가 하기 표 2에 기술되었다. 검색 이전에, 모든 EST 및 EST 콘티그 세트(contig sets)가 6개의 프레임에서 번역되어 HMM/프로파일 분석에 적당한 단백질 서열을 생성하였다. 엠. 트런카튤라(M. truncatula) 단백질 서열이 그대로 사용되었다(TIGR로부터 수득된 FGENESH 유전자 예측이 있음).
HMMER 프로그램 hmmbuild가 모델 DNA-결합 도메인으로부터 HMM을 형성하는데 사용되며, 상기는 HMMER 프로그램 hmmsearch(E-값 절단(cut-off) = 0.01)를 사용하는 콩과 식물 서열 세트에 대해 검색하였다. EMBOSS 프로그램 예고(program prophecy)를 사용하여 동일한 도메인으로부터 프로파일을 형성하고, 상기가 또한 EMBOSS 프로그램 프로핏(program profit)을 사용하여 콩과 식물 서열에 대해서 검색하였다[절단점수(score cut-off)=50]. 각 서열 세트에서 각 방법에 의해서 동정된 히트(hits)의 수는 하기 표 2에 나열하였다:
[표 2]
Figure pct00012

HMM 방법은 프로파일 방법보다 더 민감한 것으로 보이며, 다수의 부가의 히트(hits) 뿐만 아니라 모든 프로파일 히트를 확인하였다. 상기 이유에 있어서, HMM 방법을 선택 방법으로서 선택하였으며- HMM 히트 단백질을 정렬하기 위해서 사용하였으며, 계통발생학적 분석(phylogenetic analysis)을 통과시켰다. 프로파일 히트가 아직 꽤 유용하며: 프로파일 방법은 더 엄격하므로 프로파일 후보물질이 실제의 히트를 나타낼 가능성이 더 높다.
정렬의 형성
DNA-결합 도메인 서열을 상기에서 동정된 166개의 콩과 식물 MYB R2R3 후보물질로부터 추출하였다. 단백질 도메인은 원래의 HMM 모델에서의 정보를 사용하여 도메인을 배열하였고, HMMER 정렬 프로그램 hmmalign을 사용하여 정렬하였다. 뉴클레오티드 정렬을 단백질 정렬 위에 상응하는 뉴클레오티드 서열을 오버레이시킴으로써 생성하여 단백질 수준에서 정렬의 구조를 보존하였다. 상기는 도메인 구조를 더 잘 나타내는 보다 정확한 정렬을 수득하기위해서 실시하였다.
계통발생적 분석(Phylogenetic Analysis)
계통발생학적 분석은 수득된 트리 노드(tree node)가 TT2 전사 인자와 관련된 MYB R2R3 서브타입을 동정하기위해서 사용될 수 있는지 여부를 확인하기 위해서 식물 MYB R2R3 DNA-결합 도메인에서 실시하였다. 109개의 전체-길이의 DNA-결합 도메인을 상기 연구에서 동정된 166개의 콩과 식물 MYB R2R3 후보물질로부터 추출하였으며, 상기는 전체 130개의 DNA-결합 도메인을 제공하는 Nesi 등(2001) 및 Miyake 등(2003)으로부터 공지된 MYB R2R3 유전자와 결합하였다. 이러한 130개 도메인의 단백질 정렬을 hmmalign를 사용하여 생성하였으며, 상응하는 뉴클레오티드 도메인 서열이 상기에 근거하여 정렬되었다. 상기 뉴클레오티드 정렬로 일치성 트리(consensus tree)를 생성하기 위한 Phylip 프로프램 일치(program consensus) 및 프로그램 fastDNAml을 사용하여 100개의 부트스트랩 레플리케이트(bootstrap replicates)에 근거하는 계통발생수(phylogenetic tree)를 생성하기 위한 최대의 가능성 분석을 실시하였다. 상기 정보가 콩과 식물 MYBR2R3 도메인으로 3개의 프라이머를 도안하는데 이용되었다.
DNA 및 RNA의 분리, 및 cDNA 합성
게놈성 DNA를 신선하거나 또는 동결된 식물 조직(100 mg)으로부터 DNeasy® Plant Mini 키트(Qiagen)를 사용하여 제조자의 지시에 따라 분리하였다. DNA 제조물은 샘플로부터 RNA를 제거하기위해서 RNAse H(Sigma)로 처리하였다. 총 RNA는 신선하거나 또는 동결된 조직으로부터 RNeasy® Plant Mini 키트(Qiagen)를 사용하여 분리하였다. 분리된 총 RNA(100 μg)는 제조자의 지시에 따라 RNAse가 없는 DNAse I로 처리하여 분리하는 동안 샘플로부터 DNA를 제거하였다. DNA 및 RNA 샘플의 농도 및 순도는 NanoDrop ND-100 분광계(spectrophotometer)를 사용하여 260 nm 및 280 nm의 흡광도에서의 비율을 측정함으로써 평가하였다. 총 RNA(1 μg)는 제조자의 지시에 따라서 SMART™ CDS 프라이머 IIA 및 SMART II™ A 올리고뉴클레오티드를 사용하여 SMART™ cDNA 합성 키트(Clontech)를 사용하여 cDNA로 역전사시켰다(reverse-transcribed).
중합효소 연쇄 반응(PCR) 및 PCR 생성물의 TOPO 클로닝
표준 PCR 반응은 Thermal Cycler(Applied Biosystems)로 실시하였으며, 대략 5 ng DNA 또는 1 μl cDNA의 양을 템플레이트로서 사용하였다. 열 사이클 조건(thermal cycle conditions)은 하기와 같다: 초기 반응 94 ℃에서 30초; 94 ℃에서 30초, 50-64 ℃에서 30초(프라이머의 Tm에 따라 다름) 및 72 ℃에서 1-2분(1 분/ kb) 각각을 35 사이클; 및 최종 반응 72 ℃에서 10분.
PCR 생성물은 아가로스 겔 전기영동으로 분리하고 에티디움 브로마이드(ethidium bromide) 염색에 의해서 가시화하였다. 원하는 밴드를 절단한 후 겔 슬라이스에서 QIAquick 겔 추출 키트(Gel Extraction Kit)(Qiagen)를 사용하여 제조자의 지시에 따라서 추출하였다. 추출된 PCR 생성물은 제조자의 지시에 따라서 TOPO 2.1 벡터(Invitrogen)로 클로닝하고 화학적 형질전환으로 OneShot® 에스케리치아 콜리(Escherichia coli) 세포로 형질전환시켰다. 이후 박테리아를 50 μg ml-1 카나마이신 및 40 μl의 40 mg ml-1 X-gal (5-브로모-4-클로로-3-인돌일-X-D-갈락토피라노사이드; Invitrogen)을 포함하는 예열된 루리아-베르타니(Luria-Bertani, LB; Invitrogen) 아가 플레이트(1% 트립톤, 0.5% 효모추출물, 1.0% NaCl 및 1.5% 아가)상에 도말하고, 37 ℃에서 밤새 배양하였다. 양성 콜로니를 항생제 선별과 결합하여 화이트-블루 선별을 이용하여 선택하였다. 콜로니를 찍어, 50 μg ml-1 카나마이신을 포함하는 6 ml의 LB 브로스(1 %의 트립톤, 0.5%의 효모추출물, 1.0% NaCl)에 접종하여 200 rpm의 37 ℃ 진탕 배양기(shaking incubator)에서 배양하였다.
박테리아 배양액을 제조자의 지시에 따라서 추출하고 제조자의 지시에 따라서 Qiagen Prep Plasmid Miniprep 키트(Qiagen)를 사용하여 LB 브로스 배양액으로부터 정제하였다.
DNA 시퀀싱
분리된 플라즈미드 DNA는 Big-Dye(버전 3.1) 화학(Applied Biosystems)을 사용하여 디데옥시뉴클레이티드 사슬 말단 방법(dideoxynucleotide chain termination method)(Sanger et al., 1977)을 사용하여 시퀀싱하였다. M13 포워드 및 리버스 프라이머, 또는 특이적 유전자 프라이머를 사용하였다. 상기 생성물을 ABI Prism 3100 유전적 분석기(Genetic Analyser)(Applied Biosystems) 상에서 분리하고, 서열 데이터는 AlignX (Invitrogen)를 사용하여 GenBank(NCBI)에 공개된 서열 정보와 비교하였다.
결과
TaMYB14의 동정 및 시퀀싱
총 RNA 및 게놈성 DNA (gDNA)는 성장하고 성숙한 티. 아르벤스 잎조직으로부터 분리하였고, 총 RNA는 cDNA로 역전사시켰다. 초기에, 프라이머를 코딩 서열의 유전적 MYB 영역으로 도안하였고, PCR을 실해하였. PCR 생성물은 아가로스 겔 상에서 분리하였고 에티디움 브로마이드 염색으로 가시화하였다. 일정 범위의 밴드를 절단하여 DNA를 추출 및 정제하고, TOPO 벡터로 클로닝하여 E. Coli 세포로 형질전환하였다. 클로닝의 경우로부터 200개의 형질전환체를 임의로 선택히여, 플라즈미드 DNA를 분리한 후 시퀀싱하였다. 추가 프라이머를 요구되는 N-말단 영역을 시퀀싱하기 위해서 도안하였다(표 4).
일부 MYBs의 집합체를 분리된 cDNA의 시퀀싱에 의해서 동정하였다; >50%가 알려져 있지 않고, 공지된 MYB 단백질에 대한 실질적 히트가 수득되지 않았다. 남아 있는 것은 수분 상실(water deprivation), 광자극, 염 스트레스, 에틸렌 자극, 옥신 자극, 아브시스산(abscisic acid) 자극, 지베렐린산 자극, 살리실산 자극, 자스몬산 자극, 카드뮴, 광, 기공 운동(stomatal movement) 및 제어, 조절, 믹스타-유사형(mixta-like)(표피 세포 성장), 카페산 O-메틸 트랜스퍼라제의 다운-조절(down-regulation) 및 분열 조직(meristem) 제어에 대해 반응하는, 비생물학적 스트레스 반응 중에 발현된 MYBs에 대한 상동체(orthologues)로서 확인하였다.
이의 멤버가 안토시아닌 또는 CT 생합성을 활성화하는 것으로 알려진 것을 포함하는 정확한 MYB 클레이드(NO8 및 NO9)안에 포함되는 단백질에 대해서 2개의 일부 MYB cDNAs가 코딩된다. 프라이머는 남아 있는 5' 말단을 분리하기 위한 유전자의 3' 말단으로 도안되므로, 전체 cDNA가 클론된다. 전체-길이의 TaMYB14는 314개의 아미노산 단백질에 대해 코딩하는 942 bp 코딩 영역을 포함한다. 비교를 위해서, AtTT2는 258개의 아미노산 단백질에 대해서 코딩한다.
TaMYB14에 대한 블라스트 결과(blast results)
티. 아르벤스 유전자형 AZ2925로부터 TaMYB14의 cDNA 서열은 공개된 데이터베이스에 대해서 블라스트하였다. BlastN은 하기의 상위 5개의 히트를 리턴하였다:
AB300033.1 "R2R3-MYB 전사 인자에 대한 로터스 자포니쿠스(Lotus japonicus) LjTT2-1 mRNA", (e-값 3e-69)
AB300035.1 "R2R3-MYB 전사 인자에 대한 로터스 자포니쿠스 LjTT2-3 mRNA", (e-값 4e-62)
AB300034.1 "R2R3-MYB 전사 인자에 대한 로터스 자포니쿠스 LjTT2-2 mRNA", (e-값 4e-59)
AF336284.1 고시피움 히르서텀(Gossypium hirsutum) GhMYB36 mRNA, (e-값 1e-40)
AB298506.1 전사 인자에 대한 다우쿠스 카로타(Daucus carota) DcMYB3-1 mRNA, (e-값 7e-39)
반면에 티. 아르벤스 유전자형 AZ2925로부터 TaMYB14의 번역된 서열의 BlastX가 하기의 5개의 상위 히트를 리턴하였다:
BAG12893.1 "로터스 자포니쿠스 R2R3-MYB 전사 인자 LjTT2-1", (e-값 2e-81)
AAK19615.1AF336282_1 "고시피움 히르서텀 GhMYB1O", (e-값 3e-76);
BAG12895.1 "로터스 자포니쿠스 R2R3-MYB 전사 인자 LjTT2-3", (e-값 8e-74);
BAG12894.1 "로터스 자포니쿠스 R2R3-MYB 전사 인자 LjTT2-2", (e-값 2e-72);
AAZ20431.1 "MYB11 " [Malus x domestica], ( e-값 2e-66)
AtTT2 및 다른 BLAST 히트에 대한 TaMYB14 cDNA의 정렬은 옐로우로 나타나는 최대 동일성을 갖는 것으로 도 7에 나타나 있다. 또한 오픈 리딩 프레임의 번역은 에이. 탈리아나(A. thaliana) TT2에 52% 동일성을 나타내는 아미노산 조성물에서 실질적인 차이점을 나타낸다(도 8). 더우기, TaMYB14는 공지된 CT MYB 활성인자(N09)에 일반적인 모티프(motifs)를 공유한다.
AtTT2 및 다른 BLAST 히트에 대한 TaMYB14 cDNA의 정렬은 옐로우 및 블루로 강조된 동일성을 갖는 것으로 도 7에 나타나 있다. 또한 오픈 리딩 프레임의 번역은 본질적으로 MYB 도메인 영역내에서 에이. 탈리아나(A. thaliana) TT2에 52% 동일성을 나타내는 아미노산 조성물에서 실질적인 차이점을 나타낸다(도 8).
TaMYB14는 이전에 공지된 CT MYB 활성인자에 일반적인 Stracke 등(2001)에 따른 서브그룹 5(DExWRLxxT)의 모티프와 유사한 모티프를 포함한다.
TaMYB14는 이전에 공지된 안토시아닌 MYB 활성인자에 일반적인 Stracke 등(2001)에 따른 서브그룹 6(KPRPR[S/T, 서열번호 16으로 나타냄)의 모티프가 없다.
더우기, 상기 정렬로 신규한 MYB 모티프(VI/VRTKAxR/KxSK)를 확인하였다. 상기 신규한 모티프(도 8에서 강조된 부분)는 CT 경로를 조절하는 다수의 신규한 MYB14 TFs와 관련된 것으로 나타난다.
TaMYB14 전사 수준
CT 축적은 티. 아르벤스 및 티. 아피네종에서 나타나며; 이들은 작은 입꼭지(petiolule) 영역을 제외하고, 배축(abaxial) 및 향축(adaxial) 표피층 및 잎꼭지내 전체 잎 라미나(leaf lamina)에서 검출가능하였다. CTs는 배축 표피면 상의 잎 모상체에서 티. 레펜스 및 티. 옥시덴탈에서만 검출가능하였다. TaMYB14에 특이적인 프라이머를 사용하는 전사 분석으로 상기 유전자가 CTs를 능동적으로 축적하는 조직에서만 발현된 것이 밝혀졌다. TaMYB14는 티. 아르벤스 성숙 및 미성숙 잎 조직에서 발현되지만, 유합조직(callus)에서는 발현되지 않았다(CT를 합성하지 않음). TaMYB14로 도안된 프라이머는 또한 CTs가 능동적으로 축적되며, 분열조직 잎 및 초기 분열조직 모상체에서 발현되는 티. 레펜스에서 MYB14를 증폭시키지만, 성숙하거나 또는 새로 나온 잎 조직, 포복지, 마디사이(internode), 뿌리 및 잎자루(petioles)에서는 검출되지 않았다. MYB14는 CTs가 잎 모상체에서만 존재하는 성숙한 티. 옥시덴탈 조직에서는 검출되지 않았다. 분석 결과는 하기 표 3에 나타냈다:
[표 3]
Figure pct00013

도 3 및 도 4는 또한 트리폴리움종에서의 다양한 조직에서 전사물 수준의 비교를 나타냈다; 도 3은 동일한 온실 조건에서 재배한 트리폴리움종 및 배양체로부터의 다양한 조직에서 TaMYB14의 전사물 수준을 나타낸다: 레인 1, (사다리형); 레인 2, 티. 레펜스 성숙한 잎 cDNA 라이브러리 (Cultivar Huia); 레인 3, 티. 레펜스 성숙한 뿌리 cDNA 라이브러리 (Cultivar Huia); 레인 4, 티. 레펜스 성숙한 포복지 cDNA 라이브러리(Cultivar Huia); 레인 5, 티. 레펜스 성숙한 꽃 cDNA 라이브러리(Cultivar DC111); 레인 6, 티. 레펜스 발아 잎 cDNA (Cultivar Huia); 레인 7, 티. 레펜스 성숙한 잎 cDNA (High anthocyanin Cultivar Isabelle); 레인 8, 티. 아르벤스 미성숙 잎 cDNA (Cultivar AZ2925); 레인 9, 티. 아르벤스 성숙한 잎 cDNA (Cultivar AZ2925); 레인 10, 티. 레펜스 분열조직 꽃 cDNA (Cultivar Huia); 레인 11 , 티. 레펜스 분열조직 잎 cDNA (Cultivar Huia); 레인 12, 티. 레펜스 분열조직 모상체 유일 cDNA (Cultivar Huia); 레인 13, 티. 옥시덴탈 성숙한 식물[잎, 뿌리 및 포복지 cDNA 라이브러리 (Cultivar Huia)]; 레인 14, 티. 레펜스 성숙한 마디 cDNA 라이브러리(Cultivar Huia); 레인 15, TOPO로 클로닝된 티. 아르벤스 MYB14cDNA 클론, 레인 16, TOPO로 클로닝된 티. 아르벤스 MYB14 게놈성 클론, 레인 17, 티. 옥시덴탈 게놈성 DNA; 레인 17, 티.레펜스 게놈성 DNA; 레인 17, 티. 아르벤스 게놈성 DNA; 레인 20, (사다리형).
반면에 도 4는 동일한 온실 조건에서 재배한 트리폴리움종 및 배양체로부터의 다양한 조직에서 BANYULS(A) 및 LAR(B)의 전사물 수준을 나타낸다. 레인 1, (사다리형); 레인 2, 티. 레펜스 성숙한 잎 cDNA 라이브러리(Cultivar Huia); 레인 3, 티. 레펜스 성숙한 뿌리 cDNA 라이브러리(Cultivar Huia); 레인 4, 티. 레펜스 성숙한 포복지 cDNA 라이브러리(Cultivar Huia); 레인 5, 티. 레펜스 성숙한 꽃 cDNA 라이브러리(Cultivar DC111); 레인 6, 티. 레펜스 발아잎 cDNA (Cultivar Huia); 레인 7, 티. 레펜스 성숙한 잎 cDNA (High anthocyanin Cultivar Isabelle); 레인 8, 티. 아르벤스 미성숙 잎 cDNA (Cultivar AZ2925); 레인 9, 티. 아르벤스 성숙 잎 cDNA (Cultivar AZ2925); 레인 10, 티. 레펜스 분열조직 꽃 cDNA (Cultivar Huia); 레인 11, 티. 레펜스 분열조직 잎 cDNA (Cultivar Huia); 레인 12, 티. 레펜스 분열조직 모상체 유일 cDNA (Cultivar Huia); 레인 13, 티. 옥시덴탈 성숙한 식물[잎, 뿌리 및 포복지 cDNA 라이브러리 (Cultivar Huia)]; 레인 14, 티. 레펜스 성숙한 마디 cDNA 라이브러리(Cultivar Huia); 레인 15, TOPO로 클로닝된 티. 아르벤스 cDNA BAN 또는 LAR 클론, 레인 16, TOPO로 클로닝된 티. 아르벤스 BAN 또는 LAR 게놈성 클론, 레인 17, 티. 옥시덴탈 게놈성 DNA; 레인 17, 티. 레펜스 게놈성 DNA; 레인 17, 티. 아르벤스 게놈성 DNA; 레인 20, (사다리형).
티. 아르벤스, 티. 아피네, 티. 옥시덴탈 및 티. 레펜스의 gDNA로부터의 MYB14의 동정 및 시퀀싱
TaMYB14(표 4 참조)의 개시 영역 및 정지 영역으로 도안된 프라이머를 사용하여, 본 발명자들은 수개의 트리폴리움종 범위, 즉 티. 아르벤스, 티 아피네, 티. 레펜스 및 티. 옥시덴탈로부터 분리된 cDNA 및 gDNA의 PCR에 의해서 TaMYB14의 동종체를 증폭시켰다. 게놈성 DNA 서열의 분리 및 클로닝된 PCR 생성물의 전체-길이의 시퀀싱으로 티. 아르벤스가 상기 유전자의 2개의 이소형태 또는 대립유전자를 가지며, 이중 하나는 발현된 cDNA 서열에 해당하며, 다른 것은 이전에 동정되지 않은 TaMYB14의 이소형태/대립 변형체에 해당하는 것으로 나타났다.
상기 이소형태 또는 대립 변형체의 정렬로 TaMYB14의 cDNA 서열과 비교하여 수개의 염기 결실 및 삽입의 존재가 밝혀졌다(도 10 참조). 추정되는 cDNA 서열의 번역으로 상기 이소형태 또는 대립 변형체에 의해서 암호화되는 단백질이 또한 아미노산 결실, 삽입 및 교환을 갖는 것이 밝혀졌다(도 9 참조). 본 발명자들은 TaMYB14-2로서 대립 변형체를 도안하였다.
상기 유전자에 대한 해당하는 전체-길이의 gDNA 서열은 또한 3개의 다른 트리폴리움종; 티. 아피네, 티. 레펜스 및 티. 옥시덴탈로부터 분리하였다. 모든 MYB14 대립 유전자는 다양한 크기를 갖는 3개의 엑손 및 2개의 인트론을 갖는다(도 10-12 참조). 티. 아피네 및 티. 옥시덴탈 둘 다는 하나의 대립유전자를 가지며, 반면에 티. 레펜스는 2개의 대립유전자를 갖는다. 다양한 종으로부터의 MYB14의 번역된 서열은 아미노산 조성물의 변경으로 TaMYB14와 95%의 상동성을 갖는다. 대부분의 아미노산 차이는 MYB 도메인의 3' 독특한 영역의 다운스트림에 위치한다.
[표 4]
Figure pct00014

Figure pct00015

Figure pct00016

표 4: 다양한 트리폴리움종(티. 아르벤스; 티. 레펜스; 티. 옥시덴탈)로부터 MYB14의 PCR, 클로닝 및 시퀀싱에 대한 프라이머 서열
요약하면, 본 출원인은 또한 나열된 서열에서 각 서열과 관련된 서열번호를 나타내는 하기 표 5에 요약한 바와 같은 10개의 신규한 MYB14 단백질/유전자를 확인 및 분리하였다:
[표 5]
Figure pct00017

상기 모든 MYB14 서열의 정렬을 도 34에 나타냈다. 본 출원인은 모든 MYB14 단백질 서열에 일반적인 2개의 서열 모티프를 확인하였다.
제1 모티프는 DDEILKN (서열번호 15)이다.
제2 모티프는 X1VVRTX2AX3KCSK (서열번호 17)이며, 여기서 X1 = N, Y 또는 H, X2 = K 또는 R 및 X3 = T 또는 I이다.
상기 모티프 중 하나 또는 둘 다의 존재는 특히 서열번호 16이 없는 것과 관련될 때 MYB14 단백질에 대해 진단되는 것으로 나타난다.
도 35는 도 34에 배열된 각각의 MYB14 단백질들 사이에서의 동일성(%)을 나타낸다.
본 출원인은 TaMYB14의 공간적 및 일시적 발현 패턴이 생체내 식물에서의 CT의 제조와 밀접하게 관련이 있는 것도 또한 확인했다.
실시예 2: 화이트 클로버(트리폴리움 레펜스)에서 축합형 탄닌을 제조하기 위해 사용되는 본 발명의 MYB14 핵산 서열의 용도
재료 및 방법
형질전환 프로토콜에 사용된 유전적 구조체
식물 형질전환 벡터, pHZBar는 pART27로부터 유래된다(Gleave 1992). pnos-nptII-nos3' 선택 카세트(selection cassette)는 CaMV 35S 프로모터로부터 발현된 바아 유전자(bar gene)[제초제 암모늄 걸포시네이트(herbicide ammonium glufosinate)에 대한 저항성을 부여함]를 갖는 CaMV35S-BAR-OCS3' 선택 카세트로 대체된다. 상기 이중 벡터로의 발현 카세트의 클로닝은 β-갈락토시다제에 대한 블루/화이트 스크리닝에 의한 제조합체의 선택 및 독특한 NotI 제한 위치에 의해서 촉진된다. 화이트 클로버는 트리폴리움 아르벤스로부터 발현된 대립유전자를 포함하는 M14ApHZBarP를 사용하여 형질전환시킨다. M14ApHZBarP에 대한 과-발현 카세트는 먼저 pART7로 클로닝된다. 그후 상기 구조체는 NotI 단편으로서 pHZBar로 오간다. 클로닝된 유전자의 방향을 나타내는 유전적 구조체의 T-DNAs는 도 6에서 도식적으로 나타냈다.
pHZBar에서 유전적 구조체는 동결-해동 형질전환 방법을 사용하여 플라즈미드 DNA로서 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 균주 GV3101로 전달하였다(Ditta et al 1980). 아그로박테리움에 유지된 구조체의 구조는 박테리아 배양액으로부터 제조된 플라즈미드 DNA의 제한 분해(digest)에 의해서 확인하였다. 아그로박테리움 배양액은 글리세롤에서 제조하고, 장기 보관을 위해서 -80 ℃로 옮겼다. 아그로박테리움 균주 GV3101에 유지된 유전자 구조체는 100 mg/L의 농도로 스펙티노마이신(spectinomycin)을 포함하는 25 mL의 MGL 브로스(broth)에 접종하였다. 배양물은 28 ℃의 회전 진탕기(200 rpm)에서 밤새 배양하였다(16 시간). 박테리아 배양물을 원심분리기로 수집하였다(3000xg, 10분). 상등액을 제거하고 세포는 5mL의 1OmM MgSO4 용액에 재현탁시켰다.
자엽 이식편(cotyledonary explants)의 형질전환
클로버를 Voisey 등(1994)의 변형 방법을 사용하여 형질전환시켰다. 씨앗을 절단(dissection)(0.06gm=100개 씨앗) 용으로 대략 400-500 자엽(cotyledons)(예컨대, 200-250개의 씨앗)을 제공하기 위해 칭량하였다. 원심분리 튜브에서, 씨앗을 1분동안 70% 에탄올로 세척하였다. 씨앗은 15분동안 원형 혼합기에서 쉐이킹으로 표백제(5% 이용가능한 염소)로 표면 살균하고 멸균수(sterile water)로 4번 세척하였. 씨앗을 4 ℃에서 밤새 불린다. 자엽은 해부 현미경을 사용하여 씨앗으로부터 절단하였다. 우선 종피(seed coat) 및 배젖(endosperm)을 제거한다. 자엽들 사이에 블레이드를 놓고 남아 있는 줄기를 슬라이싱함으로써 스칼펠(scalpel)로 뿌리(radical)로부터 자엽을 분리한다. 자엽 이식편은 CR7 배지 상의 멸균 필터 디스크로 채취한다.
형질전환을 위해서, 3 ul의 아그로박테리움 현탁액 분취량을 각각의 절단된 자엽에 분배한다. 플레이트를 밀봉하고 16시간 광주기하에 25 ℃에서 배양한다. 72시간동안 공동-배양(co-cultivation)하고, 형질전환된 자엽을 암모늄 글루포시네이트(2.5 mg/L) 및 티멘틴(300 mg/L)이 보충된 CR7 배지를 포함하는 플레이트로 옮기고 배양실에 넣는다. 새싹(shoots)의 재생 이후에, 이식편을 암모늄 글루포시네이트(2.5 mg/L) 및 티멘틴(300 mg/L)이 보충된 CR5 배지로 옮긴다. 새싹의 재생을 위해 선택물을 포함하는 새로운 CR5 배지로 일주일에 3번 서브배양(subsulture)한다. 뿌리가 형성되었을 때, 모종을 암모늄 글루포시네이트 선택물을 포함하는 CR0 배지를 포함하는 통(tub)으로 옮긴다. 큰 덩어리의 재생제를 상기 단계에서 개별의 묘목으로 나눈다. 그후 선택물하에서 재배된 뿌리가 난 식물을 멸균된 피트 플러그(peat plug)로 옮긴다.
HPLC 분석을 위한 LCMSMS 방법
HPLC 분석을 위한 플라보노이드를 추출하기위해서, 잎 조직[0.5g의 생체중(fresh weight)]을 액체 N2에서 동결하여, 미세 분말로 분쇄하고, 아세트산:메탄올(80:20 v/v)로 30분동안 4 ℃에서 추출했다. 식물 잔해를 13K rpm의 미세원심분리기에서 10분동안 펠렛화하였다. 상등액을 제거하고, -20 ℃에서 30분동안 방치했다. 분취량은 HPLC 분석을 위해서 사용하였다. 분취량은 Thermo LTQ 이온 트랩 질량분광계 시스템(Ion Trap Mass Spectrometer System)에서 UV-PDA 및 MS/MS 검출 둘 다를 사용하여 HPLC에 의해서 분석하였다. 상기 추출물은 이동상 시스템으로서 0.1% 포름산과 물 및 아세토니트릴에 의한 준위 용리(gradient elution)에 의해서 Phenomonex Luna C18 역상 컬럼(reversed phase column)에서 분석하였다. 안토시아닌이 550 nm에서 UV 흡수에 의해서 검출되었고, 다른 대사물질은 질량 분광계에 의해서 MS1 또는 MS2 검출에 의해서 측정하였다.
사용된 기기는 서모 광 다이오드 어레이(Thermo photo diode array, PDA) 검출기를 구비한 Thermo Finnigan Surveyor HPLC 시스템에 결합된 선형 이온 트랩 질량 분광계(linear ion trap mass spectrometer, Thermo LTQ)(둘 다 미국 캘리포니아주 새너제이)이다. Thermo Finnigan Xcalibur 소프트웨어(버전 2.0)를 데이터 취득 및 프로세싱을 위해서 사용하였다.
샘플 중 5 μL 분취량을 일정 25 ℃에서 유지된 150x2.1 mm Luna C18(2) 컬럼(Phenomenex, Torrance, CA)상에 주입하였다. 사용된 HPLC 용매는 하기와 같다: 용매 A = H2O내 0.1 % 포름산; 용매 B = 아세토니트릴내 0.1% 포름산. 유속은 200 μL 분-1이고, 사용된 용매 준위는 하기 표 6에 나타내었다. PDA 데이터는 전체 크로마토그램에 대해서 220 nm 내지 600 nm의 범위에서 수집하였다.
[표 6]
Figure pct00018

질량 분광계는 양성 모드에서 전기분무 이온화(electrospray ionisation) 용으로 설정하였다. 분무 전압은 4.5 kV이고, 모세관 온도(capillary temperature)는 275 ℃이고, 시스 기체(sheath gas), 보조 기체(auxiliary gas) 및 이송 기체(sweep gas)의 유속은 각각 20, 10 및 5로 설정하였다(임의 단위/분). HPLC로부터 처음 4분 및 마지막 11분은 폐기하였다. MS는 150-2000 m/z로부터 스캔되도록 프로그램화하고(MS1 스캔), 그후 가장 강한 MS1 이온에 대한 데이터 의존성 MS3 을 실시하였다. 데이터 의존성 MS3 방법에 대한 분리창(isolation windows)은 2 mu(nominal mass units)이고, MS1 스펙트럼으로부터의 가장 강한 이온의 단편화[fragmentation, 35% CE (상대 충돌 에너지)]하고 MS2 스펙트럼으로부터 가장 강한 이온의 분리(2 mu) 및 단편화(35% CE)를 실시한다. 그후 질량 분광계는 연이어 하기 표 7의 질량에 있어서의 선택된 반응 모니터링(selected reaction monitoring, SRM)을 실시하며, 각각 2.5 mu의 SRM 및 35%의 단편화 CE에 대한 분리창을 갖는다. 기술된 질량은 삼량체까지의 프로시아니딘(카테킨 및/또는 에피카테킨) 및 프로델피니딘(갈로카테킨 또는 에피갈로카테킨) 질량의 상이한 조합을 포함한다.
[표 7]
Figure pct00019

결과
티. 아르벤스의 gDNA로부터 MYB14를 갖는 화이트 클로버의 DMACA 분석
화이트 클로버 자엽을 CaMV 35S 프로모터의 조절하에 발현된 cDNA 서열에 해당하는 티. 아르벤스 대립유전자로 형질전환시키고, 방법에 기술된 바와 같이 재생시킨다. 모든 재생된 모종으로부터의 잎은 실시예 1에 기술된 바와 같이 DMACA 염색에 의해서 CT 제조 용으로 스크리닝하였다. 상기 다수의 형질전환된 식물은 CT 제조 용으로 양성이므로, DMACA로 염색했을 때 블루색으로 염색된다. 이러한 염색은 잎 모상체의 6개의 중간 세포를 포함하여 잎 조직의 대부분의 표피 세포에서 발생하였다. 비교를 위해서, 형질전환되지 않은 야생형 화이트 클로버 식물은 배축 잎 측면에서 모상체와 별개로 CT에 대해서 음성이었다(도 5). CTs는 일부 뿌리 및 일부 식물의 잎자루 세포내에 존재하였다. 이는 TaMYB14의 구조성 발현이 화이트 클로버 식물에서 CT 축적의 일시적 및 공간적 패턴을 변경시키는 것을 나타낸다.
유전자도입 화이트 클로버의 분자 분석, DMACA 스크린 및 생화학
화이트 클로버 분자 분석
유전자도입 화이트 클로버 식물로부터의 추출된 DNA를 M14ApHZBAR 벡터의 통합(integration)을 위해 시험하였다. PCR 반응은 35S 프로모터 일부 및 대부분의 TaMYB14 유전자를 포함하는 생성물을 증폭하기위해서 도안된 프라이머 세트를 사용하여 실시하였다. 상기 분석의 결과는 화이트 클로버 게놈으로의 TaMyb14A 유전자를 포함하는 이중 벡터의 통합을 나타낸다(도 14).
화이트 클로버 DMACA 분석
화이트 클로버 잎 조직의 DMACA 염색으로부터 수득된 결과를 개시하였다(도 15). CT 특이적 염색, DMACA는 야생형 화이트 클로버 잎(A, E, F)과 비교하여 유전자도입 클로버 잎(B, C, D, G, H)의 잎자루 및 엽신(leaf blade)을 강하게 염색시킨다.
또한(도 16), 모상체 계층 세포(tier cells) 및 정단 세포(apical cells)는 야생형 잎(E)에서 통상 관찰되는 것보다 더 강하게 염색되었다(F, G). 기공(stomata)의 공변 세포(guard cells)도 또한 강하게 염색되었다(H). 줄기 모상체 세포에서 처럼 표피 세포의 핵에서 뚜렷하게 염색되었다. 표피 세포는 강하게 염색되는 로제트(rosette)(G)의 기저 세포 및 정상 세포보다 더 균일하게 염색되었다. 어떤 특이적 세포가 DMACA 염색을 갖는지를 밝히기 위해 잎을 찢었다(I 내지 K). 이러한 경우 하부 표피 세포(외부 최상부 표면)가 잎살 층으로부터 분리된다. 표피 세포(기공 및 모상체와 같은 특정 세포는 제외)는 잎살 세포 층과 비교하여 거의 활성을 갖지 않는다. 잎살 세포는 뚜렷한 서브 위치결정(definite sub localization)으로 세포 전체를 통해서 특이적 액포형 세포 기관으로 뚜렷하게 강한 염색을 보이며, 이는 세포당 명백하게 다수이다. 그러므로, 이것은 잎살 세포내에 DMACA 염색의 구역화(compartmentalization)이다.
화이트 클로버 HPLC/LCMS 분석
M14ApHZBAR로 형질전환된 유전자도입 조직의 출원인의 생화학적 분석으로 TaMYB14의 과발현으로 화이트 클로버 및 토바코의 잎 조직에서 축합형 탄닌 단량체, 이량체 및 삼량체가 축적된다는 명백한 증거를 제공한다. 더 긴 사슬의 탄닌이 존재하는 것도 또한 가능하지만 이는 본 발명의 기기의 범위를 넘어서는 것으로 해석된다.
정제된 포도씨 추출물이 이의 탄닌 프로파일의 특징이 잘 밝혀져 있으므로 모든 LCMSMS HPLC 측정에서 기준으로 사용되며, 이는 도 17 및 도 18에 개시되어 있다. 상기 추출물로 카테킨(C), 에피카테킨(EC), 갈로카테킨(GC) 및 에피갈로카테킨(EGC)의 명확한 동정 뿐만 아니라 PC:PC 이량체, PC:PD 이량체 및 2개의 3PC 삼량체를 검출하였다.
4개의 모든 단량체의 MS2 스펙트럼이 상기 대사물질의 동정의 증거로서 제공된다.
플라보노이드를 유전자도입 및 야생형 대조군 화이트 클로버 식물로부터 추출하고, HPLC/LCMS로 진행시켰다. 상기 분석의 결과로 유전자도입 클로버 샘플로부터의 잎 추출물에서 CT의 존재를 확인하였다. 검출된 대부분의 단량체는 에피카테킨 및 에피갈로카테킨과 미량의 갈로카테킨이다. 이는 클로버 탄닌이 델피니딘에서 유래되는 것과 일치한다. 단량체가 야생형 화이트 클로버 잎 조직에서 검출되지 않았다(도 19). 이량체 및 삼량체가 또한 검출되었다(도 20, 도 21).
실시예 3: 토바코[니코티아나 타바쿰( Nicotiana tabacum )]에서 축합형 탄닌을 제조하는데 사용되는 본 발명의 MYB14 핵산 서열의 용도
재료 및 방법
형질전환 프로토콜에서 사용되는 유전적 구조체
플라즈미드 M14ApHZBAR로부터의 NotI 단편(도 6)을 분리하고 토바코의 형질전환을 위해서 pART27 (Gleave, 1992)로 클로닝하였다. 이러한 이중 벡터는 CaMV 35S 프로모터의 조절하에 카나마이신 저항성에 대한 nptII 선택 유전자를 포함한다.
토바코 형질전환
토바코는 잎 디스크 형질전환-재생 방법(Horsch 등, 1985)에 의해 형질전환시켰다. 멸균된 야생형 W38 토바코 식물로부터의 잎 디스크는 이중 벡터를 포함하는 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 균주로 접종하고 3일동안 배양하였다. 그후 잎 디스크를 100 mg/L의 카나마이신 및 300 mg/L의 세포탁심을 포함하는 MS 선택적 배지로 옮긴다. 한달에 걸쳐서 발아(shoot) 재생이 일어나고, 잎 이식편은 뿌리 형성을 위해서 카나마이신을 포함하는 호르몬이 없는 배지에 놓았다.
결과
유전자도입 토바코의 분자 분석, DMACA 스크린 및 생화학
토바코 분자 분석
유전자도입 토바코 식물로부터 추출된 DNA는 M14ApHZBAR 이중 벡터의 통합을 위해서 시험하였다. PCR 반응은 35S 프로모터 일부 및 대부분의 유전자를 증폭하기위해서 도안된 프라이머 세트를 사용하여 실시하였다. 상기 분석의 결과는 화이트 클로버 게놈으로 TaMyb14A 유전자를 포함하는 이중 벡터의 통합을 나타낸다(도 22).
토바코 DMACA 분석
DMACA 분석은 실시예 1에서 클로버에 대해서 기술한 바와 같이 토바코 식물에서 실시하였다. TaMYB14A를 발현하는 유전자도입 토바코 모종(콜리플라워 모자이크 바이러스 35S 프로모터의 대조군하에)은 성장에 있어서 야생형 식물과 비교하여 상당한 차이를 보이지 않는다. 더우기, 생장 조직에서 CT가 축적되지 않는 야생형의 형질전환되지 않은 토바코와 비교하여 야생형 또는 유전자도입 토바코(이미 안토시아닌이 축적됨)의 세포로부터 유래된 유전자도입 토바코 모종의 잎 조직에서 CT를 검출하였다. 이는 티. 아르벤스 MYB14 유전자가 토바코 자체에서 CT 경로의 모든 유전자를 활성화시킬 수 있는 것을 나타낸다. 유전자도입 토바코 잎의 DMACA 염색의 예를 나타내었다(도 23). CT 특이적 염색, DMACA는 항상 CT가 존재하지 않는 야생형 잎과 비교하여, 유전자도입 토바코 잎(A 내지 G)의 엽신을 강하게 염색시킨다.
토바코 HPLC/LCMS 분석
HPLC/LCMS 분석을 실시예 2에서 클로버에 대해서 기술된 바와 같이 토바코에 대해서 실시하였다. 플라보노이드는 유전자도입 및 야생형 대조군 토바코 식물로부터 추출하였고, HPLC를 진행하였다. 상기 분석의 결과로 유전자도입 토바코 샘플로부터의 잎 추출물에서 CT의 존재를 확인하였다. 토바코 대조군 샘플은 CT 유닛이 존재하지 않았다. 검출된 대부분의 단량체는 에피카테킨이며, 에피갈로카테킨 및 갈로카테킨 단량체는 소량이었다(도 24). 이량체 및 삼량체가 또한 검출되었다(도 25).
실시예 4: 트리폴리움 아르벤스 에서 축합형 탄닌의 생성을 감소시키는데 사용하는 본 발명의 MYB14 핵산 서열의 용도
재료 및 방법
사일런싱 프로토콜에 사용되는 유전적 구조체
pHANNIBAL(Helliwell 및 Waterhouse, 2003), 헤어핀 RNAi 식물 벡터를 TaMYB14의 cDNA의 일부와 상동인 서열의 자기-상보성 부분(self-complementary portions)을 발현하는 구조체를 갖는 티. 아르벤스 자엽을 형질전환하는데 사용되었다. MYB14에 대한 전체 cDNA를 하기 유전자의 3' 말단으로부터 cDNA의 299 bp 길이의 단편을 증폭하는데 사용하였다:(caatgctggttgatggtgtggctagtgattcaatgagtaacaacgaaatggaacacggttatggatttttgtcattttgcgatgaagagaaagaactatccgcagatttgctagaagattttaacatcgcggatgatatttgcttatctgaacttttgaactctgatttctcaaatgcgtgcaatttcgattacaatgatctattgtcaccttgttcggaccaaactcaaatgttctctgatgatgagattctcaagaattggacacaatgtaactttgctgatgagacaaatgtgtcc - 서열번호 65). 프라이머를 사일런싱 벡터 pHANNIBAL로 단편이 클로닝되도록 도안하였다(표 5). 상기 단편을 pdk 인트론의 앞에서 센스 방향으로 Xhol 부위 또는 안티센스 방향에서 pdk 인트론 이후에 Xbal 부위로 클로닝하였다. 클로닝의 방향은 상기 단편이 올바른 방향으로 있는지를 확인하기위해서 PCR에 의해서 확인하였다. hpRNA 카세트를 포함하는 MYB14pHANNIBAL로부터의 NotI 단편을 pHZBar(pHZBARSMYB로 도안됨)로 서브클로닝하고(도 13) 형질전환 실험에 사용하였다.
[표 8]
Figure pct00020

티. 아르벤스 형질전환:
티. 아르벤스의 재배종은 약간의 변형을 포함하여 본질적으로 티. 레펜스에 대해서 기술된 바와 같이 pHZbarSMYB 사일런싱 이중 벡터로 형질전환시켰다(Voisey 등, 1994). 암모늄 글루포시네이트 수준을 1.25 mg/L로 감소시켰으며; 식물은 뿌리 재생을 위해서 CR0 배지상에 놓기 전에 2주일간 CR5 배지에 놓았다.
결과
유전자도입 트리폴리움 아르벤스의 분자 분석, DMACA 스크린 및 생화학
티. 아르벤스 분자 분석
유전자도입 티. 아르벤스로부터 추출된 DNA를 M14pHANNIBAL 이중 벡터의 통합을 위해서 시험하였다. PCR 반응은 cDNA 유전자 단편의 3' 말단 및 35S 프로모터의 일부를 증폭시키도록 도안된 프라이머 세트를 사용하여 실시하였다. 상기 분석의 결과는 게놈으로 hpRNA 유전자 구조체를 포함하는 이중 벡터의 통합을 나타낸다(도 26).
티. 아르벤스 DMACA 분석
대조군 티. 아르벤스 및 몇몇 형질전환된 모종으로부터의 식물 재료를 실시예 1에 기술된 바와 같이 DMACA(도 27)를 사용하여 염색하였다. 조직 배양이 씨앗으로부터 유래된 천연의 흙에서 재배한 식물과 비교하여 탄닌 생성의 시점과 잎 재생에 영향을 주는 동안에 형질전환된 식물을 조직 배양을 통해서 재생된 야생형 성숙한 잎과 비교하였다. 야생형 티. 아르벤스는 탄닌을 생성하지는 않지만(A), 세포는 잎을 닯은 조직에 탄닌을 축적하기 시작한다(B 내지 D-퍼플색). 유전자도입 식물은 캘러스에서 탄닌을 생성하지 않지만, 잎 조직은 단지 밝은 블루 염색(E-L)으로 나타내는 DMACA로 유사하게 염색되며, CT의 수준은 사일런싱 구조체를 발현하는 식물에서 크게 감소하는 것으로 나타났다.
티. 아르벤스 HPLC/LCMS 분석
플라보노이드는 유전자도입 및 야생형 대조군 티. 아르벤스 식물로부터 추출하였고, 실시예 2에 기술된 바와 같이 HPLC/LCMS를 진행하였다. 야생형(형질전환되지 않은) 티.아르벤스 모종은 CT 단량체의 검출가능한 높은 수준을 갖는다. 대부분의 상기 단량체는 카테킨이며, 갈로카테킨 단량체는 소량이었다(도 28). 이량체가 또한 검출되었다(도 29). 대조적으로, 상기 화합물의 소량 만이 형질전환된 모종에서 검출되었다. 그러므로, 사일런싱된 티. 아르벤스 모종의 HPLC 분석으로 CT 축적이 상당히 감소된 것을 확인하였다. 상기 결과로 유전자도입 티. 아르벤스 식물로부터의 잎 추출물에서 CT의 부재가 TaMYB14의 사일런스 발현으로 도안된 벡터의 존재와 관련이 있는 것을 확인하였다.
실시예 5: 알파파[메디카고 사티바( Medicago sativa )]에서 축합형 탄닌을 생성하는데 사용되는 본 발명의 MYB14 핵산 서열의 용도
재료 및 방법
미세사출법(microprojectile bombardment)에 의한 알파파 형질전환
재배종 Regen-SY를 모든 형질전환 실험에 사용하였다(Bingham 1991). 형질전환 프로토콜은 Samac 등(1995)에서 채택하였다. 유합조직 배양(callus cultures)은 잎자루 이식편에서 시작하여 2,4-디클로로페녹시아세트산 및 키네틴(Kinetin)(SHDK)이 보충된 쉬렌크와 힐데브란트 배지(Schenk 및 Hildebrandt media)에서 암주기에서 성장시켰다(Schenk and Hildebrandt, 1972). 배양을 계속하기 위해서 일주일에 4번 간격으로 새로운 배지로 규칙적인 서브배양에 의해서 계대배양하였다. 8주에서 12주의 Regen Sy 유합조직은 Bio-Rad PDS1OOO/He Biolistic® 입자 송달 시스템 장치(Particle Delivery System apparatus)에서 미세사출법에 의해 형질전환시켰다. 유합조직 배양은 세포 원형질분리(cell plasmolysis)를 유도하기 위해서 소르비톨과 만니톨의 0.7M 농도를 보충한 SHDK 배지에서 최소 4시간동안 배양하였다. p35STaMyb14A(M14ApHZBAR로부터의 NotI 단편을 포함함) 및 pCW122(항생제 카나마이신에 대한 저항성을 나타내는 nptII 유전자를 포함함; Walter et al, 1998)의 플라스미드 DNA(1 μg/μl)를 제조자에 의해서 기술된 바와 같이 텅스텐 입자(M17, Bio-Rad)로 침전시켰다. 표준 파라미터(27"Hg vacuum, 11OO psi rupture, 및 100 mm 표적 거리)를 지시 매뉴얼에 따라 형질전환을 위해서 사용사였다. 형질전환된 조직은 SHDK 배지로 옮기기 전에 한밤 그냥 방치하였다. 2일 후에, 배양액을 형질전환된 세포의 선택에 대한 항생제 선택성(카나마이신 50mg/L)을 포함하는 SHDK 배지로 옮긴다. 상기 물질을 호르몬을 함유하지 않는 SH 배지 또는 Blaydes 배지(Blaydes, 1966)로 옮기기 전에 일주일에 3번 간격으로 서브-배양하고, 재생을 위해서 광주기에 두었다. 발아하는 체세포 씨눈(somatic embryos)을 유합 조직으로부터 자르고, 뿌리와 새싹 성장을 위해서 half-strength Murashige and Skoog 배지(Murashige and Skoog, 1962)로 옮긴다.
목적
알파파로 CaMV35S 프로모터의 조절하에 TaMyb14 유전자를 포함하는 플라즈미드를 도입하기위해서 형질전환 실험을 실시하였다. 본 목적은 TaMyb14를 발현하는 식물을 생성하고 잎 조직에서 축합형 탄닌의 축적을 스크리닝하는데 있다.
결과
유전자도입 알파파의 분자 분석, DMACA 스크린 및 생화학
알파파 분자 분석
유전자도입 알파파로부터 추출된 DNA를 p35STaMyb14A 벡터의 통합을 위해 시험하였다. nptII 유전자 또는 TaMyb14 유전자로부터의 생성물을 증폭시키도록 도안된 프라이머 세트를 사용하였다. 상기 분석의 결과는 두개의 플라즈미드 구조체들을 알파파 게놈으로 통합시키는 것을 나타낸다(도 30).
알파파 DMACA 분석
축합형-탄닌의 축적에 대해 시험하기위해서, DMACA 분석을 실시예 1에서 클로버에 대해서 기술된 바와 같이 알파파 식물에 대해서 실시할 수 있다.
알파파 HPLC/LCMS 분석
실시예 2에서 클로버에 대해서 기술된 바와 같이 HPLC/LCMS 분석을 사용하여 유전자도입 알파파에서 탄닌 단량체, 이량체 및 삼량체의 존재를 검출할 수 있다. 분석을 실시하기위해서, 플라보노이드를 클로버에 대해서 기술된 바와 같이 유전자도입 및 야생형 대조군 알파파 식물로부터 추출하였다. (종피에서의) 야생형 알파파는 주로 시아니딘 유래 탄닌 및 소량의 델피니딘 유래 탄닌을 축적한다(Pang 등, 2007). TaMYB14를 발현하는 유전자도입 메디카고 라인의 잎을 에피카테킨, 카테킨 및 에피갈로카테킨, 및 상기 염기 유닛의 갈로카테킨 단량체 뿐만 아니라 이량체 및 삼량체 조합물의 제조를 위해 시험할 수 있다.
실시예 6: 브라시카[브라시카 올레라세아( Brassica oleracea )]에서 축합형 탄닌을 생성하기위해 사용되는 본 발명의 MYB14 핵산 서열의 용도
재료 및 방법
브라시카 라인의 형질전환
브라시카 올레라세아 var. 아세팔라 cv. 콜레오르(Brassica oleracea var. acephala cv. Coleor) [레드 사료 케일(red forage kale)] 및 그루너(Gruner) [그린 사료 케일(green forage kale)]를 Christey 등(1997, 2006)에서 기술된 바와 같이 시험관내에서 발아시켰다. 파종하고 4-5일후에 배축(Hypocotyl) 및 자엽(cotyledonary) 잎자루 이식편을 항생제를 함유하지 않는 최소배지(7.6 mM (NH4)2SO4, 1.7 mM 소듐 시트레이트, 78.7 mM K2HPO4, 0.33 M KH2PO4, 1 mM MgSO4, 0.2% 수크로스)에서 1:10으로 희석하기 전에 항생제를 포함하는 LB 배지에서 한밤동안 성장된 아그로박테리움 투메파시엔스(Agrobacterium tumefaciens) 배양액으로 간단하게 공동-배양하고 추가 4시간동안 성장시킨다. 이식편을 B5 비타민 및 2.5 mg/L BA를 포함하는 Murashige-Skoog(MS, Murashige and Skoog, 1962)계 배지에서 배양하고, 10 gm/L Danisco 표준 아가로 응고시킨다. 공동-배양 3일 후에, 이식편을 300 mg/L 티멘틴(SmithKline Beecham) 및 15/L 카나마이신이 부가된 동일한 배지로 옮긴다. 이식편을 3-4주 마다 새로운 선택 배지로 옮긴다. 그린 새싹이 나타나면 50 mg/L 카나마이신을 포함하는 호르몬을 포함하지 않는 Linsmaier-Skoog계 배지(LS, Linsmaier and Skoog, 1965)로 옮기고 10 gm/L Danisco 표준 아가로 응고시킨다. 이식편을 Micropore (3M) 외과용 테이프(surgical tape)로 밀봉한 높은 페트리 디시(9 cm 직경, 2 cm 높이)에서 배양하였다. 새싹을 투명한 플라스틱 통(98 mm, 250 ml, Vertex)에서 배양하였다. 모든 식물 배양 조작은 Cool White 형광, 20 uE/m2/s에 의해서 제공된 16 h/일 광주기로 25 ℃에서 실시하였다.
결과
유전자도입 브라시카의 분자 분석, DMACA 스크린 및 생화학
브라시카 분자 분석
유전자도입 브라시카 식물로부터 추출된 DNA는 M14ApHZBAR 이중 벡터의 통합에 대해서 시험하였다. PCR 반응은 유전자의 대부분과 35S 프로모터의 일부를 증폭하기위해 도안된 프라이머 세트를 사용하여 실시하였다. 상기 분석 결과는 브라시카 게놈으로 TaMyb14A 유전자를 포함하는 이중 벡터의 통합을 나타낸다(도 31 참조).
브라시카 DMACA 분석
DMACA 분석은 실시예 1에서 클로버에 대해서 기술된 바와 같이 브라시카 식물에서 실시하였다. TaMYB14A를 발현하는 유전자도입 브라시카 모종(콜리플라워 모자이크 바이러스 35S 프로모터의 조절하에)은 야생형 식물과 구별되지 않았다. 생장 조직에서 자연적으로 CT가 축적되지 않는, 야생형의 형질전환되지 않은 재배종 양배추가 염색되지 않고 남아 있었다. 그러나, 양성 DMACA 염색에 의해서 입증된 바와 같이 축적된 안토시아닌 재배종으로부터 유래된 유전자도입 브라시카 모종의 잎 조직에서 CT가 검출되었다. 염색은 토바코 및 클로버에서 알려진 것 만큼 강하지 않았다. 대조적으로, 야생형 그린 재배종으로부터 유래된 유전자도입 모종은 DMACA로 염색되지 않았다.
이는 티. 아르벤스 MYB14 유전자가 브라시카에서 CT 경로의 유전자의 일부를 활성화시킬 수 있지만 CT 생성에 있어서 활성 안토시아닌 경로를 요구할 수 있는 것을 나타낸다. 유전자도입 브라시카 잎의 DMACA 염색의 예가 하기 도에 개시되었다(도 32). CT 특이적 염색, DMACA은 항상 CT를 포함하지 않는 야생형 잎(A)과 비교하여 유전자도입 브라시카(B 내지 D)의 엽신을 염색하였다.
브라시카 HPLC/LCMS 분석
실시예 2에서 클로버에 대해서 기술한 바와 같이 플라보노이드를 유전자도입 및 야생형 대조군 브라시카 식물로부터 추출하고 HPLC로 진행하였다. 상기 분석 결과로 하나의 유전자도입 브라시카 샘플로부터의 잎 추출물에서 CT의 존재를 확인하였다. 브라시카 형질전환은 통상 그린색 브라시카 뿐만 아니라 안토시아닌이 축적되는 브라시카 라인으로 실시하였다. HPLC 분석은 그린색 브라시카에서 에피카테킨을 검출하였지만 안토시아닌 축적 라인에서 탄닌 단량체는 검출되지 않았다. 잎에 CT를 축적하는 TaMYB14를 과발현하는 유전자도입 브라시카는 안토시아닌 축적 라인으로부터 유래되었다. 단지 에피카테킨 단량체가 도 33에 개시된 바와 같이 유전자도입 라인에서 검출되었다.
실시예 6: MYB14 변이체에 의한 축합형 탄닌 폴루에이션(tannin poluation) 변형의 입증
본원에 기술된 방법에 의해서 동정될 수 있는 변이체 MYB 서열은 실시예 2 내지 실시예 5에 기술된 방법을 사용하여 식물에서 축합형 탄닌을 변경할 수 있는 역량을 시험할 수 있다.
간단하게 변이체 서열의 코딩 서열(가령, 서열번호 56-64에 한정되지 않음)이 적당한 발현 일치(예컨대, 실시예 2에 기술된 바와 같은 pHZBar)로 클로닝되고, 식물 세포 또는 식물로 형질전환될 수 있다. 특별히 편리하고 상대적으로 간단한 접근법은 실시예 3에 기술된 바와 같인 시험 식물로서 토바코를 사용하는 것이다. DMACA 분석은 실시예 1에 기술된 바와 같이 축합형 탄닌 생성에서 변경을 위한 빠르고 편리한 시험으로서 사용될 수 있다.
상기 방법으로, 축합형 탄닌 생성을 조절하는 MYB14 변이체의 기능이 빠르게 확인되었다.
축합형 탄닌의 더 상세한 분석은 실시예 2에 기술된 바와 같은 HPLC/LCMS 분석을 사용하여 실시할 수 있다.
실시예의 요약
상기 실시예들은 본 발명의 MYB14 유전자가 토바코(니코티아나 타바쿰; Solanaceae Family), 레굼 화이트 클로버(트리폴리움 레펜스; Fabaceae Family) 및 브라시카(브라시카 올레라세아, Brassicaceae Family)를 포함하는 다양한 식물종에서 플라보노이트의 생성, 특히 축합형 탄닌의 생성을 조작하는데 유용하다는 것을 명확하게 보여준다.
본 출원인은 본 발명의 방법 및 폴리뉴클레오티드를 사용하여 축합형 탄닌의 생성이 증가하고 감소하는 것을 입증하였다.
본 발명은 상술된 실시예로 본 발명의 범위가 한정되는 것은 아니다. 당분야의 통상의 지식을 가진 사람들이 이해할 수 있는 바와 같이 많은 변형이 본 발명의 범위를 벗어나지 않고 가능하다.
참고문헌
Figure pct00021

Figure pct00022

Figure pct00023

Figure pct00024

Figure pct00025

Figure pct00026

Figure pct00027

Figure pct00028
SEQUENCE LISTING <110> GRASSLANZ TECHNOLOGY LIMITED <120> NOVEL GENES INVOLVED IN BIOSYNTHESIS <130> 609676 HCF <160> 69 <170> PatentIn version 3.3 <210> 1 <211> 1243 <212> DNA <213> Trifolium arvense <400> 1 gaattcgccc ttaagcagtg gtatcaacgc agagtacgcg ggggaagtta tttaatttta 60 tctacatcaa acacttcaag aggttggaat acaagacaga ctaattaaga ataacatcaa 120 tggggagaag cccttgttgt gcaaaggaag gcttgaatag aggtgcttgg acaactcaag 180 aagacaaaat cctcactgaa tacattaagc tccatggtga aggaaaatgg agaaaccttc 240 caaaaagagc agatttaaaa agatgtggaa aaagttgtag acttagatgg ttgaattatc 300 taagaccaga tattaagcga ggtaatatat ccccggatga agaagaactt attatccgac 360 ttcacaaact actcggaaac agatggtctc taatagccgg aagacttcca gggcgaacag 420 acaatgaaat aaagaactac tggaacacaa atttaggaaa aaaggttaag gatcttaatc 480 aacaaaacac caacaattct tctcctacta aactttctgc tcaaccaaaa aatgcaaaga 540 tcaaacagaa acagatcaat cctaagccaa tgaagccaaa ctcaaatgtt gtccgtacaa 600 aagctaccaa gtgttctaag gtattgttca taaactcact ccccaactca ccaatgcatg 660 atttgcagaa caaagctgag gcagagacaa caacaaagcc atcaatgctg gttgatggtg 720 tggctagtga ttcaatgagt aacaacgaaa tggaacacgg ttatggattt ttgtcatttt 780 gcgatgaaga gaaagaacta tccgcagatt tgctagaaga ttttaacatc gcggatgata 840 tttgcttatc tgaacttttg aactctgatt tctcaaatgc gtgcaatttc gattacaatg 900 atctattgtc accttgttcg gaccaaactc aaatgttctc tgatgatgag attctcaaga 960 attggacaca atgtaacttt gctgatgaga caaatgtgtc caacaacctt cattcttttg 1020 cttcctttct tgaatccagt gaggaagtac taggagaatg ataataaaaa ttcattttcc 1080 aataaaatta actactctag gttttttttt ttttttttta atttcaattt catgttaggg 1140 tggtttaata aataaatata ttctatggtt taatattgca aaaaaaaaaa aaaaaaaaaa 1200 aaaaagtact ctgcgttgat accactgctt aagggcgaat tcc 1243 <210> 2 <211> 1290 <212> DNA <213> Trifolium arvense <400> 2 gaattcgccc ttaggttgga atacaagaca gactaattaa gaataacatc aatggggaga 60 agcccttgtt gtgcaaagga aggcttgaat agaggtgctt ggacaactca agaagacaaa 120 atcctcactg aatacattaa gctccatggt gaaggaaaat ggagaaacct tccaaaaaga 180 gcaggttcat tcattctagt atcttgcaat tatagatcaa tcactttcat acttttgttt 240 gcttataaat tttcttgcat tttttcttca attttccatg tgaaatgcaa attactagta 300 cattattatg gatatgtttt tgcaaatatg tgtatgccat gcaggtttaa aaagatgcgg 360 aaaaagttgt agacttagat ggttgaatta tctaagacca gatattaagc gaggtaatat 420 atcctcggat gaagaagaac ttatcatcag acttcacaaa ctactcggaa acaggtaaaa 480 gtaccgacat aatcactaac ttattaacat ttatctataa tttgtttttt ttgacaatta 540 gtactactaa tttaatttta taatgtgtgc taatttgctt tgcctttaat ttgtggtaga 600 tggtctctaa tagccggaag acttccagga cgaacagaca atgaaataaa gaactactgg 660 aacacaaatt taggaaaaaa ggttaaggat cttaatcaac aaaacaccaa caattcttct 720 cctactaaac tctctgctca accaaaaaat gcaaagatca aacagaaaca gatcaatcct 780 aagccaatga agccaaactc aaatgttgtc cgtacaaaag ctaccaagtg ttctaaggta 840 ttgttcataa actcactccc caactcacca atgcatgatt tgcagaacaa agctgaggca 900 gagacaacaa caaagccatc aatgctggtt gatggtgtgg ctagtgattc aatgagtaac 960 aacgaaatgg aacacggtta tggatttttg tcattttgcg atgaagagaa agaactatcc 1020 gcagatttgc tagaagattt taacatcgcg gatgatattt gcttatctga acttttgaac 1080 tctgatttct caaatgcgtg caatttcgat tacaatgatc tattgtcacc ttgttcggac 1140 caaactcaaa tgttctctga tgatgagatt ctcaagaatt ggacacaatg taactttgct 1200 gatgagacaa atgtgtccaa caaccttcat tcttttgctt cctttcttga atccagtgag 1260 gaagtactag gagaatgaaa gggcgaattc 1290 <210> 3 <211> 1296 <212> DNA <213> Trifolium arvense <400> 3 gaattcgccc ttaggttgga atacaagaca gactaattaa gaataacatc aatggggaga 60 agcccttgtt gtgcaaagga aggcttgaat agaggtgctt ggacaactca agaagacaaa 120 atcctcactg aatacattaa gctccatggt gaaggaaaat ggagaaacct tccaaaaaga 180 gcaggttcat tcattctgta tcttacaatt atagattaac cactttcata cttttgtttg 240 cttataaatt ttcttgtatt ttttcttcca tttttcatga gaaatgcaaa ttactagtac 300 attattatgg acatgttttg gcaaatatgt ttatgccatg cagatttaaa aagatgtgga 360 aaaagttgta gacttagatg gttgaattat ctaagaccag atattaagcg aggtaatata 420 tccccggatg aagaagaact tattatccga cttcacaaac tactcggaaa caggtaaagt 480 cctaacataa tcactaactt attaacgttt gtctataatt tgtttttttt gaccattagt 540 actactaatt taattttaca atgtgtgcta atttgcttgt ctttaatttg tggtagatgg 600 tctctaatag ccggaagact tccagggcga acagacaatg aaataaagaa ctactggaac 660 acaaatttag gaaaaaaggt taaggatctt gatcaacaaa acaccaacaa ttcttctcct 720 actaaactct ctgctcaacc aaaaaatgca gagatcaaac agaaacagat caatcctaag 780 ccaaactcat atgttgtccg tacaaaagct accaagtgtt ctaaggtatt gttcataaac 840 tcacccccca actcaccacc aatgcatgat ttgcagagca aagctgaggc agagacaaca 900 acaacaacaa agccatcaat gccatcaatg ctggttgatg gtgtggctag tgattcaatg 960 agtaacaacg aaatggaatg cggtaatgga tttttgtcat tttgcgatga agagaaagaa 1020 ctatccgcag atttgctaga agattttaac atcgcggatg atatttgctt atctgaattt 1080 ctaaacttcg atttctcaaa tgcgtgcgat atcgattaca atgatctatt gtcgccttgt 1140 tcggaccaaa ctcaaatgtt ccctgatgat gagattctaa agaattggac acaatgtaac 1200 tttgctgatg agacaaatgt gtccaacaac cttcagtctt ctgcttcctt tcttgaatcc 1260 agtgaggaag tactaggaga atgaaagggc gaattc 1296 <210> 4 <211> 1239 <212> DNA <213> Trifolium affine <400> 4 gaattcgccc ttatggggag aagcccttgt tgtgcgaagg aaggcttgaa tagaggtgct 60 tggacaactc aagaagacaa aatcctcact gaatacatta agctccatgg tgaaggaaaa 120 tggagaaacc ttccaaaaag agcaggttca ttcattctgt atcttacaat tatagattaa 180 ccactttcat acttttgttt gcttataaat tttcttgtat tttttcttcc atttttcatg 240 agaaatgcaa attactagta cattattatg gacatgtttt tgcaaatatg tttatgccat 300 gcaggtttaa aaagatgtgg aaaaagttgt agacttagat ggttgaatta tctaagacta 360 gatattaagc gaggtaatat atcctcggat gaagaagaac ttatcatccg acttcacaaa 420 ttactcggaa acaggtaaag tcctaacata atcactaact tattaacgtt tgtctataac 480 ttgttttttt gacaattagt actactaatt taattttata atgtgtgcta atttgcttgt 540 ctttaatttg tggtagatgg tctctaatag ccggaagact tccaggacga acagacaatg 600 aaataaagaa ctactggaac acaaatttag gaaaaaaggt taaggatctt aatcaagaaa 660 acaccaacaa ttcttctcct actaaacttt ctgctcaact aaaaaatgca aagatcaaac 720 agaaacagat caatcctaag ccaatggagc caaactcaaa tgttgtccgt acaaaagcta 780 ccaagtgttc taaggcattg ttcataaact caccccccaa ctcaccacca atgcatgatt 840 tgcagaacaa agctgaggca gagacaacaa caaagtcatc aatgccatca atgctggttg 900 atggcgtggc tagtgattca atgagtaaca acgaaatgga atacggtgat ggatttgttt 960 cattttgcga tgacgataaa gaactatccg cagatttgct agaagatttt aacatctcgg 1020 atgatatttg cttatccgaa tttctaaact tcgatttctc aaatgcgtgc aatttcgatt 1080 acaacgatct attgtcgcct tgttcggacc aaacacaaat gttctctgat gatgagattc 1140 tcaagaattc gacaccatgt aactttgctg ctgagacaaa ttatgtgtcc aacaaccaat 1200 ccagtgagga agtactagga gaatgaaagg gcgaattct 1239 <210> 5 <211> 933 <212> DNA <213> Trifolium affine <400> 5 atggggagaa gcccttgttg tgcgaaggaa ggcttgaata gaggtgcttg gacaactcaa 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gacttagatg gttgaattat 180 ctaagactag atattaagcg aggtaatata tcctcggatg aagaagaact tatcatccga 240 cttcacaaat tactcggaaa cagatggtct ctaatagccg gaagacttcc aggacgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaggttaa ggatcttaat 360 caagaaaaca ccaacaattc ttctcctact aaactttctg ctcaactaaa aaatgcaaag 420 atcaaacaga aacagatcaa tcctaagcca atggagccaa actcaaatgt tgtccgtaca 480 aaagctacca agtgttctaa ggcattgttc ataaactcac cccccaactc accaccaatg 540 catgatttgc agaacaaagc tgaggcagag acaacaacaa agtcatcaat gccatcaatg 600 ctggttgatg gcgtggctag tgattcaatg agtaacaacg aaatggaata cggtgatgga 660 tttgtttcat tttgcgatga cgataaagaa ctatccgcag atttgctaga agattttaac 720 atctcggatg atatttgctt atccgaattt ctaaacttcg atttctcaaa tgcgtgcaat 780 ttcgattaca acgatctatt gtcgccttgt tcggaccaaa cacaaatgtt ctctgatgat 840 gagattctca agaattcgac accatgtaac tttgctgctg agacaaatta tgtgtccaac 900 aaccaatcca gtgaggaagt actaggagaa tga 933 <210> 6 <211> 1238 <212> DNA <213> Trifolium affine <400> 6 gaattcgccc ttatggggag aagcccttgt tgtgcaaagg aaggcttgaa tagaggtgct 60 tggacaactc aagaagacaa aatcctcact gaatacatta agctccatgg tgaaggaaaa 120 tggagaaacc ttccaaaaag agcaggttca ttcattctgt atcttacaat tatagattaa 180 ccactttcat acttttgttt tcttataaat tttcttgtat tttttcttcc atttttcatg 240 agaaatgcaa attactagta cattattatg gacatgtttt tgcaaatatg tttatgccat 300 gcaggtttaa aaagatgtgg aaaaagttgt agacttagat ggttgaatta tctaagacca 360 gatattaagc gaggtaatat atcctcggat gaagaagaac ttatcatccg acttcacaaa 420 ctactcggaa acaggtaaag tcataacata atcattaatt tattaacggt tatctataat 480 ttgttttttt gacaattatc actacaaatt taattttata atgtgcgcta atttgcttgt 540 ctttaatttg tggtagatgg tctctaatag ccggaagact tccagggcga acagacaatg 600 aaataaagaa ctactggaac acaaatttag gaaaaaaggt taaggatctt aatcaagaaa 660 acaccaacaa ttcttctcct actaaacttt ctgctcaact aaaaaatgca aagatcaaac 720 agaaacagat caatcctaag ccaatggagc caaactcaaa tgttgtccgt acaaaagcta 780 ccaagtgttc taaggcattg ttcataaact caccccccaa ctcaccacca atgcatgatt 840 tgcagaacaa agctgaggca gagacaacaa caaagtcatc aatgccatca atgctggttg 900 atggcgtggc tagtgattca atgagtaaca acgaaatgga atacggtgat ggatttgttt 960 cattttgcga tgacgataaa gaactatccg cagatttgct agaagatttt aacatctcgg 1020 atgatatttg cttatccgaa tttctaaact tcgatttctc aaatgcgtgc aatttcgatt 1080 acaacgatct attgtcgcct tgttcggacc aaacacaaat gttctctggt gatgagattc 1140 tcaagaattc gacacaatgt aactttgctg ctgagacaaa ttatgtgtcc aacaaccaat 1200 ccagtgagga agtactagga gaatgaaagg gcgaattc 1238 <210> 7 <211> 1252 <212> DNA <213> Trifolium occidentale <400> 7 gaattcgccc ttatggggag aagcccttgt tgtgcaaagg aaggcttgaa tagaggtgct 60 tggacaactc aagaagacaa aatcctcact gaatacatta agctccatgg tgaaggaaaa 120 tggagaaacc ttccaaaaag agcaggttca ttcattctag tatcttgcaa ttatagatca 180 atcactttca tacttttgtt tgcttataaa ttttcttgca ttttttcttc aattttccat 240 gtgaaatgca aattactagt acattattat ggatatgttt ttgcaaatat gtgtatgcca 300 tgcgaggttt aaaaagatgc ggaaaaagtt gtagacttag atggttgaat tatctaagac 360 cagatattaa gcgaggtaat atatcctcgg atgaagaaga acttatcatc agacttcaca 420 aactactcgg aaacaggtaa aagtaccgac ataatcacta acttattaac atttatctat 480 aatttgtttt ttttgacaat tagtactact aatttaattt tataatgtgt gctaatttgc 540 tttgccttta atttgtggta gatggtctct aatagccgga agacttccag gacgaacaga 600 caatgaaata aagaactact ggaacacaaa tttaggaaaa aaggttaagg atcttaatca 660 acaaaacacc aacaagtctt ctcctactaa actctctgct caaccaaaaa atgcaaagat 720 caaacagaaa cagatcaatc ctaagccaat gaagccaaac tcaaatgttg tccgtacaag 780 agctaccaag tgttctaagg tattgttcat aaactcactc cccaactcac caatgcatga 840 tttgcagaac aaagctgagg cagagacaac aacaaagcca tcaatgctgg ttgatggtgt 900 ggctagtgat tcaatgagta acaacgaaat ggaacacggt tatggatttt tgtcattttg 960 cgatgaagag aaagaactat ccgcagattt gctagaagat tttaacatcg cggatgatat 1020 ttgcttatct gaacttttga actctgattt ctcaaatgcg tgcaatttcg attacaatga 1080 tctattgtcm ccttgttcgg accaaactca aatgttctct gatgatgaga ttctcaagaa 1140 ttggacacaa tgtaactttg ctgatgagac aaatgtgtcc aacaaccttc attcttttgc 1200 ttcctttctt gaatccagtg aggaagtact aggagaatga aagggcgaat tc 1252 <210> 8 <211> 1164 <212> DNA <213> Trifolium occidentale <400> 8 gaattcgccc ttatggggag aagcccttgt tgtgcaaagg aaggtttgaa tagaggtgct 60 tggacagctc atgaagacaa aatcctcact gaatacatta agctccatgg tgaaggaaaa 120 tggagaaacc ttccaaaaag agcaggttca ttcattctgt atcttactat ttatagatca 180 ataatcactt tcatgtattt tttttccttc cattttccat tagaaatgca aattaatagt 240 acattattat ggacatgttt ttccaggttt aaaaagatgt ggaaaaagtt gtagacttag 300 atggttgaat tatcttagac cagatattaa gagaggtaat atatcgtccg atgaagaaga 360 acttatcatt agacttcaca aactacttgg aaaccggtaa agtatcgaca taatcactaa 420 cttactaaca tttgtttata atgtgtacta attgcgattc ctttgatttg tggtagatgg 480 tctctaatag ccggaagact tccagggcga acagacaatg aaataaaaaa ttactggaac 540 acgaatttag gaaaaaaggt taaggatctt aatcaacaaa acaccaacaa ttcttctcct 600 actaaacctt ctgctcaacc aaaaaatgca aagatcaaac agaaacaaca gatcaataat 660 cctaagccaa tgaagccaaa ctcgaatgtt gtccgtacaa aagctaccaa atgttctaag 720 gtattgttca taaactcacc accaatgcat aatttgcaga acaaagctga ggcagagaca 780 aaaacaaaga catcaatgtt ggttaatggt gtagctagtg attcaatgag taacaacgaa 840 atggaacgag gtaatggatt tttgtcattt cgcgatgaag agaaagaact atccgctgat 900 ttgctagatg attttaacat cgcggatgac atttgcttat ccgaatttct aaactccgat 960 ttctcaaatg cgtgcaattt cgattacaat gatctattgt caccttgttc ggatcaaact 1020 caaatgttct ctgatgatga gattctcaag aattggacac aatgtaactt tgctgatgag 1080 acaaatgtgt ccaacaacct tcattctttt gcttcctttc tcgaatccag tgaggaagta 1140 ctaggagaat gaaagggcga attc 1164 <210> 9 <211> 1205 <212> DNA <213> Trifolium repens <400> 9 gaattcgccc ttatggggag aagcccttgt tgtgcaaaag aaggcttgaa tagaggtgct 60 tggacagctc atgaagacaa aatcctcact gaatacatta agctccatgg tgaaggaaaa 120 tggagaaacc ttccaaaaag agcaggttca ttcattctgt atcttactat tatagatcaa 180 taatcacttt cacacttttt tttttactta taaattttca tgtatttttt cttccatttt 240 ccattagaaa tgcaaattaa tagtacatta ttatggacat gttttttcaa aaatgtgtat 300 tccatgcagg tttaaaaaga tgtggaaaaa gttgtagact aaggtggttg aattatctta 360 gaccggatat taagagaggt aatatatcgt cggatgaaga agaacttatc attagacttc 420 acaaactact cggaaaccgg taaagtatcg acataatcac tgacttacta acatttgttt 480 ataatgtgtg ctaattgctc ttcctttgat ttgtggtaga tggtctctaa tagccggaag 540 acttccaggg cgaacagaca atgaaataaa gaactactgg aacacaaatt taggaaaaaa 600 agttaaggat cttaatcaac aaaacaccaa caattcttct cctactaaac cttctgctca 660 accaaaaaat gcaaatatca aacagaaaca acagatcaat cctaagccaa tgaagccaaa 720 ctcgaatgtt gtccgtacaa aagctaccaa atgttctaag gtattgttca taaactcacc 780 accaatgcat aatttgcaga acaaagctga ggcagagaca aaaacaaagc cattaatgct 840 ggttaatggt gtagctagtg attcaatgag taacaacgaa atggaacgcg gtaatggatt 900 tttgtcattt tgcgacgaag agaaagaact atccgcagat ttgctagatg attttaacat 960 cgcggatgat atttgcttat ctgaatttct aaactccgat ttctcaaatg cgtgcaattt 1020 cgattacaat gatctattgt cgccttgttc ggatcaaact caaatgttct ctgatgatga 1080 gattctcaag aattggacac aatgtaactt tgctgatgag acaaatgtgt ccaacaacct 1140 taattctttt gcttcttttc tcgaatccag tgaggaagta ctaggagaat gaaagggcga 1200 attct 1205 <210> 10 <211> 1202 <212> DNA <213> Trifolium repens <400> 10 gaattcgccc ttatggggag aagcccttgt tgtgcaaaag aaggcttgaa tagaggtgct 60 tggacagctc atgaagacaa aatcctcact gaatacatta agctccatgg tgaaggaaaa 120 tggagaaacc ttccaaaaag agcaggttca ttcattctgt atcttactat tatagatcaa 180 taatcacttt cacacttttt tttacttata aattttcatg tattttttct tccattttcc 240 attagaaatg caaattaata gtacattatt atggacatgt tttttcaaaa atgtgtattc 300 catgcaggtt taaaaagatg tggaaaaagt tgtagactaa ggtggttgaa ttatcttaga 360 ccggatatta agagaggtaa tatatcgtcg gatgaagaag aacttatcat tagacttcac 420 aaactactcg gaaaccggta aagtatcgac ataatcacta acttactaac atttgtttat 480 aatgtgtgct aattgctctt cctttgattt gtggtagatg gtctctaata gccggaagac 540 ttccagggcg aacagacaat gaaataaaga actactggaa cacaaattta ggaaaaaaag 600 ttaaggatct taatcaacaa aacaccaaca attcttctcc tactaaacct tctgctcaac 660 caaaaaatgc aaatatcaaa cagaaacaac agatcaatcc taagccaatg aagccaaact 720 cgaatgttgt ccgtacaaaa gctaccaaat gttctaaggt attgttcata aactcaccac 780 caatgcataa tttgcagaac aaagctgagg cagagacaaa aacaaagcca ttaatgctgg 840 ttaatggtgt agctagtgat tcaatgagta acaacgaaat ggaacgcggt aatggatttt 900 tgtcattttg cgacgaagag aaagaactat ccgcagattt gctagatgat tttaacatcg 960 cggatgatat ttgcttacct gaatttctaa actccgattt ctcaaatgcg tgcaatttcg 1020 attacaatga tctattgtcg ccttgttcgg atcaaactca aatgttctct gatgatgaga 1080 ttctcaagaa ttggacacaa tgtaactttg ctgatgagac aaatgtgtcc aacaacctta 1140 attcttttgc ttcttttctc gaatccagtg aggaagtact aggagaatga aagggcgaat 1200 tc 1202 <210> 11 <211> 1203 <212> DNA <213> Trifolium repens <400> 11 gaattcgccc ttatggggag aagcccttgt tgtgcaaaag aaggcttgaa tagaggtgct 60 tggacagctc atgaagacaa aatcctcact gaatacatta agctccatgg tgaaggaaaa 120 tggagaaacc ttccaaaaag agcaggttca ttcattctgt atcttactat tatagatcaa 180 tagtcacttt cacacttttt ttttacttat aaattttcat gtattttttc ttccattttc 240 cattagaaat gcaaattaat agtacattat tatggacatg ttttttcaaa aatgtgtatt 300 ccatgcaggt ttaaaaagat gtggaaaaag ttgtagacta aggtggttga attatcttag 360 accggatatt aagagaggta atatatcgtc ggatgaagaa gaacttatca ttagacttca 420 caaactactc ggaaaccggt aaagtatcga cataatcact aacttactaa catttgttta 480 taatgtgtgc taattgctct tcctttgatt tgtggtagat ggtctctaat agccggaaga 540 cttccagggc gaacagacaa tgaaataaag aactactgga acacaaattt aggaaaaaaa 600 gttaaggatc ttaatcaaca aaacaccaac aattcttctc ctactaaacc ttctgctcaa 660 ccaaaaaatg caaatatcaa acagaaacaa cagatcaatc ctaagccaat gaagccaaac 720 tcgaatgttg tccgtacaaa agctaccaaa tgttctaagg tattgttcat aaactcacca 780 ccaatgcata atttgcagaa caaagctgag gcagagacaa agacaaagcc attaatgctg 840 gttaatggtg tagctagtga ttcaatgagt aacaacgaaa tggaacgcgg taatggattt 900 ttgtcatttt gcgacgaaga gaaagaacta tccgcagatt tgctagatga ttttaacatc 960 gcggatgata tttgcttatc tgaatttcta aactccgatt tctcaaatgc gtgcaatttc 1020 gattacaatg atctattgtc gccttgttcg gatcaaactc aaatgttctc tgatgatgag 1080 attctcaaga attggacaca atgtaacttt gctgatgaga caaatgtgtc caacaacctt 1140 cattcttttg cttcctttct cgaatccagt gaggaagtac taggagaatg aaagggcgaa 1200 ttc 1203 <210> 12 <211> 1206 <212> DNA <213> Trifolium repens <400> 12 gaattcgccc ttatggggag aagcccttgt tgtgcaaaag aaggcttgaa tagaggtgct 60 tggacagctc atgaggacaa aatcctcact gaatacatta agctccatgg tgaaggaaaa 120 tggagaaacc ttccaaaaag agcaggttca ttcattctgt atcttactat tatagatcaa 180 taatcacttt cacacttttt tttttttact tataaatttt catgtatttt ttcttccatt 240 ttccattaga aatgcaaatt aatagtacat tattatggac atgttttttc aaaaatgtgt 300 attccatgca ggtttaaaaa gatgtggaaa aagttgtaga ctaaggtggt tgaattatct 360 tagaccggat attaagagag gtaatatatc gtcggatgaa gaagaactta tcattagact 420 tcacaaacta ctcggaaacc ggtaaagtat cgacataatc actaacttac taacatttgt 480 ttataatgtg tgctaattgc tcttcctttg atttgtggta gatggtctct aatagccgga 540 agacttccag ggcgaacaga caatgaaata aagaactact ggaacacaaa tttaggaaaa 600 aaagttaagg atcttaatca acaaaacacc aacaattctt ctcctactaa accttctgct 660 caaccaaaaa atgcaaatat caaacagaaa caacagatca atcctaagcc aatgaagcca 720 aactcgaatg ttgtccgtac aaaagctacc aaatgttcta aggtattgtt cataaactca 780 ccaccaatgc ataatttgca gaacaaagct gaggcagaga caaaaacaaa gccattaatg 840 ctggttaatg gtgtagctag tgattcaatg agtaacaacg aaatggaacg cggtaatgga 900 tttttgtcat tttgcgacga agagaaagaa ctatccgcag atttgctaga tgattttaac 960 atcgcggatg atatttgctt atctgaattt ctaaactccg atttctcaaa tgcgtgcaat 1020 ttcgattaca atgatctatt gtcgccttgt tcggatcaaa ctcaaatgtt ctctgatgat 1080 gagattctca agaattggac acaatgtaac tttgctgatg agacaaatgt gtccaacaac 1140 cttaattctt ttgcttcttt tctcgaatcc agtgaggaag tactaggaga atgaaagggc 1200 gaattc 1206 <210> 13 <211> 1243 <212> DNA <213> Trifolium arvense <400> 13 gaattcgccc ttaagcagtg gtatcaacgc agagtacgcg ggggaagtta tttaatttta 60 tctacatcaa acacttcaag aggttggaat acaagacaga ctaattaaga ataacatcaa 120 tggggagaag cccttgttgt gcaaaggaag gcttgaatag aggtgcttgg acaactcaag 180 aagacaaaat cctcactgaa tacattaagc tccatggtga aggaaaatgg agaaaccttc 240 caaaaagagc agatttaaaa agatgtggaa aaagttgtag acttagatgg ttgaattatc 300 taagaccaga tattaagcga ggtaatatat ccccggatga agaagaactt attatccgac 360 ttcacaaact actcggaaac agatggtctc taatagccgg aagacttcca gggcgaacag 420 acaatgaaat aaagaactac tggaacacaa atttaggaaa aaaggttaag gatcttaatc 480 aacaaaacac caacaattct tctcctacta aactttctgc tcaaccaaaa aatgcaaaga 540 tcaaacagaa acagatcaat cctaagccaa tgaagccaaa ctcaaatgtt gtccgtacaa 600 aagctaccaa gtgttctaag gtattgttca taaactcact ccccaactca ccaatgcatg 660 atttgcagaa caaagctgag gcagagacaa caacaaagcc atcaatgctg gttgatggtg 720 tggctagtga ttcaatgagt aacaacgaaa tggaacacgg ttatggattt ttgtcatttt 780 gcgatgaaga gaaagaacta tccgcagatt tgctagaaga ttttaacatc gcggatgata 840 tttgcttatc tgaacttttg aactctgatt tctcaaatgc gtgcaatttc gattacaatg 900 atctattgtc accttgttcg gaccaaactc aaatgttctc tgatgatgag attctcaaga 960 attggacaca atgtaacttt gctgatgaga caaatgtgtc caacaacctt cattcttttg 1020 cttcctttct tgaatccagt gaggaagtac taggagaatg ataataaaaa ttcattttcc 1080 aataaaatta actactctag gttttttttt ttttttttta atttcaattt catgttaggg 1140 tggtttaata aataaatata ttctatggtt taatattgca aaaaaaaaaa aaaaaaaaaa 1200 aaaaagtact ctgcgttgat accactgctt aagggcgaat tcc 1243 <210> 14 <211> 313 <212> PRT <213> Trifolium arvense <400> 14 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Thr Gln Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Gln Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Leu Ser Ala Gln Pro Lys Asn Ala Lys Ile Lys Gln Lys 130 135 140 Gln Ile Asn Pro Lys Pro Met Lys Pro Asn Ser Asn Val Val Arg Thr 145 150 155 160 Lys Ala Thr Lys Cys Ser Lys Val Leu Phe Ile Asn Ser Leu Pro Asn 165 170 175 Ser Pro Met His Asp Leu Gln Asn Lys Ala Glu Ala Glu Thr Thr Thr 180 185 190 Lys Pro Ser Met Leu Val Asp Gly Val Ala Ser Asp Ser Met Ser Asn 195 200 205 Asn Glu Met Glu His Gly Tyr Gly Phe Leu Ser Phe Cys Asp Glu Glu 210 215 220 Lys Glu Leu Ser Ala Asp Leu Leu Glu Asp Phe Asn Ile Ala Asp Asp 225 230 235 240 Ile Cys Leu Ser Glu Leu Leu Asn Ser Asp Phe Ser Asn Ala Cys Asn 245 250 255 Phe Asp Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp Gln Thr Gln Met 260 265 270 Phe Ser Asp Asp Glu Ile Leu Lys Asn Trp Thr Gln Cys Asn Phe Ala 275 280 285 Asp Glu Thr Asn Val Ser Asn Asn Leu His Ser Phe Ala Ser Phe Leu 290 295 300 Glu Ser Ser Glu Glu Val Leu Gly Glu 305 310 <210> 15 <211> 7 <212> PRT <213> Artificial <220> <223> Motif <400> 15 Asp Asp Glu Ile Leu Lys Asn 1 5 <210> 16 <211> 7 <212> PRT <213> Artificial <220> <223> Motif <400> 16 Lys Pro Arg Pro Arg Ser Thr 1 5 <210> 17 <211> 12 <212> PRT <213> Artificial <220> <223> Motif <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa can be Asn, Tyr or His <220> <221> MISC_FEATURE <222> (6)..(6) <223> Xaa can be Lys or Arg <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa can be Ile or Thr <400> 17 Xaa Val Val Arg Thr Xaa Ala Xaa Lys Cys Ser Lys 1 5 10 <210> 18 <211> 24 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 18 gacaatgaga taaagaatta cttg 24 <210> 19 <211> 21 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 19 aagagttgta gacttagmtg g 21 <210> 20 <211> 17 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 20 ytkggsaaca ggttgtc 17 <210> 21 <211> 23 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 21 atggggagaa gcccttgttg tgc 23 <210> 22 <211> 26 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 22 tcattctcct agtacttcct cactgg 26 <210> 23 <211> 21 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 23 ctctttttgg aaggtttctc c 21 <210> 24 <211> 23 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 24 ttctccattt tccttcacca tgg 23 <210> 25 <211> 22 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 25 tccaagcacc tctattcaag cc 22 <210> 26 <211> 31 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 26 ctcgagatgc aatgctggtt gatggtgtgg c 31 <210> 27 <211> 23 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 27 cattgcctgt agattctgta gcc 23 <210> 28 <211> 22 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 28 tgaagattgt tggacacatt gg 22 <210> 29 <211> 21 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 29 aggttggaat acaagacaga c 21 <210> 30 <211> 22 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 30 tctcctagta cttcctcact gg 22 <210> 31 <211> 23 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 31 ataatcatac taattaacat cac 23 <210> 32 <211> 20 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 32 tgatagatca tgtcattgtg 20 <210> 33 <211> 23 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 33 gccttccttt gcacaacaag ggc 23 <210> 34 <211> 21 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 34 gcacaacaag ggcttctccc c 21 <210> 35 <211> 23 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 35 atggggagaa gcccttgttg tgc 23 <210> 36 <211> 22 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 36 tctcctagta cttcctcact gg 22 <210> 37 <211> 28 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 37 ctcgagcaat gctggttgat ggtgtggc 28 <210> 38 <211> 27 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 38 tctagaggac acatttgtct catcagc 27 <210> 39 <211> 27 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 39 tctagattga gtttggtccg aacaagg 27 <210> 40 <211> 27 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 40 tctagaaatc ttctagcaaa tctgcgg 27 <210> 41 <211> 16 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 41 gtaaaacgac ggccag 16 <210> 42 <211> 17 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 42 caggaaacag ctatgac 17 <210> 43 <211> 30 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 43 aagcagtggt atcaacgcag agtacgcggg 30 <210> 44 <211> 28 <212> DNA <213> Artificial <220> <223> Primer sequence <220> <221> misc_feature <222> (28)..(28) <223> n is a, c, g, or t <400> 44 aagcagtggt atcaacgcag agtactvn 28 <210> 45 <211> 23 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 45 aagcagtggt atcaacgcag agt 23 <210> 46 <211> 316 <212> PRT <213> Trifolium arvense <400> 46 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Thr Gln Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Pro Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asp Gln Gln Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Leu Ser Ala Gln Pro Lys Asn Ala Glu Ile Lys Gln Lys 130 135 140 Gln Ile Asn Pro Lys Pro Asn Ser Tyr Val Val Arg Thr Lys Ala Thr 145 150 155 160 Lys Cys Ser Lys Val Leu Phe Ile Asn Ser Pro Pro Asn Ser Pro Pro 165 170 175 Met His Asp Leu Gln Ser Lys Ala Glu Ala Glu Thr Thr Thr Thr Thr 180 185 190 Lys Pro Ser Met Pro Ser Met Leu Val Asp Gly Val Ala Ser Asp Ser 195 200 205 Met Ser Asn Asn Glu Met Glu Cys Gly Asn Gly Phe Leu Ser Phe Cys 210 215 220 Asp Glu Glu Lys Glu Leu Ser Ala Asp Leu Leu Glu Asp Phe Asn Ile 225 230 235 240 Ala Asp Asp Ile Cys Leu Ser Glu Phe Leu Asn Phe Asp Phe Ser Asn 245 250 255 Ala Cys Asp Ile Asp Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp Gln 260 265 270 Thr Gln Met Phe Pro Asp Asp Glu Ile Leu Lys Asn Trp Thr Gln Cys 275 280 285 Asn Phe Ala Asp Glu Thr Asn Val Ser Asn Asn Leu Gln Ser Ser Ala 290 295 300 Ser Phe Leu Glu Ser Ser Glu Glu Val Leu Gly Glu 305 310 315 <210> 47 <211> 310 <212> PRT <213> Trifolium affine <400> 47 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Thr Gln Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Leu Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Glu Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Leu Ser Ala Gln Leu Lys Asn Ala Lys Ile Lys Gln Lys 130 135 140 Gln Ile Asn Pro Lys Pro Met Glu Pro Asn Ser Asn Val Val Arg Thr 145 150 155 160 Lys Ala Thr Lys Cys Ser Lys Ala Leu Phe Ile Asn Ser Pro Pro Asn 165 170 175 Ser Pro Pro Met His Asp Leu Gln Asn Lys Ala Glu Ala Glu Thr Thr 180 185 190 Thr Lys Ser Ser Met Pro Ser Met Leu Val Asp Gly Val Ala Ser Asp 195 200 205 Ser Met Ser Asn Asn Glu Met Glu Tyr Gly Asp Gly Phe Val Ser Phe 210 215 220 Cys Asp Asp Asp Lys Glu Leu Ser Ala Asp Leu Leu Glu Asp Phe Asn 225 230 235 240 Ile Ser Asp Asp Ile Cys Leu Ser Glu Phe Leu Asn Phe Asp Phe Ser 245 250 255 Asn Ala Cys Asn Phe Asp Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp 260 265 270 Gln Thr Gln Met Phe Ser Asp Asp Glu Ile Leu Lys Asn Ser Thr Pro 275 280 285 Cys Asn Phe Ala Ala Glu Thr Asn Tyr Val Ser Asn Asn Gln Ser Ser 290 295 300 Glu Glu Val Leu Gly Glu 305 310 <210> 48 <211> 296 <212> PRT <213> Trifolium affine <400> 48 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Thr Gln Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Glu Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Leu Ser Ala Gln Leu Lys Asn Ala Lys Ile Lys Gln Lys 130 135 140 Gln Ile Asn Pro Lys Pro Met Glu Pro Asn Ser Asn Val Val Arg Thr 145 150 155 160 Lys Ala Thr Lys Cys Ser Lys Ala Leu Phe Ile Asn Ser Pro Pro Asn 165 170 175 Ser Pro Pro Met His Asp Leu Gln Asn Lys Ala Glu Ala Glu Thr Thr 180 185 190 Thr Lys Ser Ser Met Pro Ser Met Leu Val Asp Gly Val Ala Ser Asp 195 200 205 Ser Met Ser Asn Asn Glu Met Glu Tyr Gly Asp Gly Phe Val Ser Phe 210 215 220 Cys Asp Asp Asp Lys Glu Leu Ser Ala Asp Leu Leu Glu Asp Phe Asn 225 230 235 240 Ile Ser Asp Asp Ile Cys Leu Ser Glu Phe Leu Asn Phe Asp Phe Ser 245 250 255 Asn Ala Cys Asn Phe Asp Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp 260 265 270 Gln Thr Gln Met Phe Ser Asp Asp Glu Ile Leu Lys Asn Ser Thr Gln 275 280 285 Cys Asn Phe Ala Ala Glu Thr Asn 290 295 <210> 49 <211> 313 <212> PRT <213> Trifolium occidentale <400> 49 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Thr Gln Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Gln Asn Thr Asn Lys Ser Ser 115 120 125 Pro Thr Lys Leu Ser Ala Gln Pro Lys Asn Ala Lys Ile Lys Gln Lys 130 135 140 Gln Ile Asn Pro Lys Pro Met Lys Pro Asn Ser Asn Val Val Arg Thr 145 150 155 160 Arg Ala Thr Lys Cys Ser Lys Val Leu Phe Ile Asn Ser Leu Pro Asn 165 170 175 Ser Pro Met His Asp Leu Gln Asn Lys Ala Glu Ala Glu Thr Thr Thr 180 185 190 Lys Pro Ser Met Leu Val Asp Gly Val Ala Ser Asp Ser Met Ser Asn 195 200 205 Asn Glu Met Glu His Gly Tyr Gly Phe Leu Ser Phe Cys Asp Glu Glu 210 215 220 Lys Glu Leu Ser Ala Asp Leu Leu Glu Asp Phe Asn Ile Ala Asp Asp 225 230 235 240 Ile Cys Leu Ser Glu Leu Leu Asn Ser Asp Phe Ser Asn Ala Cys Asn 245 250 255 Phe Asp Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp Gln Thr Gln Met 260 265 270 Phe Ser Asp Asp Glu Ile Leu Lys Asn Trp Thr Gln Cys Asn Phe Ala 275 280 285 Asp Glu Thr Asn Val Ser Asn Asn Leu His Ser Phe Ala Ser Phe Leu 290 295 300 Glu Ser Ser Glu Glu Val Leu Gly Glu 305 310 <210> 50 <211> 312 <212> PRT <213> Trifolium occidentale <400> 50 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Ala His Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Gln Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Pro Ser Ala Gln Pro Lys Asn Ala Lys Ile Lys Gln Lys 130 135 140 Gln Gln Ile Asn Asn Pro Lys Pro Met Lys Pro Asn Ser Asn Val Val 145 150 155 160 Arg Thr Lys Ala Thr Lys Cys Ser Lys Val Leu Phe Ile Asn Ser Pro 165 170 175 Pro Met His Asn Leu Gln Asn Lys Ala Glu Ala Glu Thr Lys Thr Lys 180 185 190 Thr Ser Met Leu Val Asn Gly Val Ala Ser Asp Ser Met Ser Asn Asn 195 200 205 Glu Met Glu Arg Gly Asn Gly Phe Leu Ser Phe Arg Asp Glu Glu Lys 210 215 220 Glu Leu Ser Ala Asp Leu Leu Asp Asp Phe Asn Ile Ala Asp Asp Ile 225 230 235 240 Cys Leu Ser Glu Phe Leu Asn Ser Asp Phe Ser Asn Ala Cys Asn Phe 245 250 255 Asp Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp Gln Thr Gln Met Phe 260 265 270 Ser Asp Asp Glu Ile Leu Lys Asn Trp Thr Gln Cys Asn Phe Ala Asp 275 280 285 Glu Thr Asn Val Ser Asn Asn Leu His Ser Phe Ala Ser Phe Leu Glu 290 295 300 Ser Ser Glu Glu Val Leu Gly Glu 305 310 <210> 51 <211> 311 <212> PRT <213> Trifolium repens <400> 51 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Ala His Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Gln Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Pro Ser Ala Gln Pro Lys Asn Ala Asn Ile Lys Gln Lys 130 135 140 Gln Gln Ile Asn Pro Lys Pro Met Lys Pro Asn Ser Asn Val Val Arg 145 150 155 160 Thr Lys Ala Thr Lys Cys Ser Lys Val Leu Phe Ile Asn Ser Pro Pro 165 170 175 Met His Asn Leu Gln Asn Lys Ala Glu Ala Glu Thr Lys Thr Lys Pro 180 185 190 Leu Met Leu Val Asn Gly Val Ala Ser Asp Ser Met Ser Asn Asn Glu 195 200 205 Met Glu Arg Gly Asn Gly Phe Leu Ser Phe Cys Asp Glu Glu Lys Glu 210 215 220 Leu Ser Ala Asp Leu Leu Asp Asp Phe Asn Ile Ala Asp Asp Ile Cys 225 230 235 240 Leu Ser Glu Phe Leu Asn Ser Asp Phe Ser Asn Ala Cys Asn Phe Asp 245 250 255 Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp Gln Thr Gln Met Phe Ser 260 265 270 Asp Asp Glu Ile Leu Lys Asn Trp Thr Gln Cys Asn Phe Ala Asp Glu 275 280 285 Thr Asn Val Ser Asn Asn Leu Asn Ser Phe Ala Ser Phe Leu Glu Ser 290 295 300 Ser Glu Glu Val Leu Gly Glu 305 310 <210> 52 <211> 311 <212> PRT <213> Trifolium repens <400> 52 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Ala His Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Gln Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Pro Ser Ala Gln Pro Lys Asn Ala Asn Ile Lys Gln Lys 130 135 140 Gln Gln Ile Asn Pro Lys Pro Met Lys Pro Asn Ser Asn Val Val Arg 145 150 155 160 Thr Lys Ala Thr Lys Cys Ser Lys Val Leu Phe Ile Asn Ser Pro Pro 165 170 175 Met His Asn Leu Gln Asn Lys Ala Glu Ala Glu Thr Lys Thr Lys Pro 180 185 190 Leu Met Leu Val Asn Gly Val Ala Ser Asp Ser Met Ser Asn Asn Glu 195 200 205 Met Glu Arg Gly Asn Gly Phe Leu Ser Phe Cys Asp Glu Glu Lys Glu 210 215 220 Leu Ser Ala Asp Leu Leu Asp Asp Phe Asn Ile Ala Asp Asp Ile Cys 225 230 235 240 Leu Pro Glu Phe Leu Asn Ser Asp Phe Ser Asn Ala Cys Asn Phe Asp 245 250 255 Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp Gln Thr Gln Met Phe Ser 260 265 270 Asp Asp Glu Ile Leu Lys Asn Trp Thr Gln Cys Asn Phe Ala Asp Glu 275 280 285 Thr Asn Val Ser Asn Asn Leu Asn Ser Phe Ala Ser Phe Leu Glu Ser 290 295 300 Ser Glu Glu Val Leu Gly Glu 305 310 <210> 53 <211> 311 <212> PRT <213> Trifolium repens <400> 53 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Ala His Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Gln Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Pro Ser Ala Gln Pro Lys Asn Ala Asn Ile Lys Gln Lys 130 135 140 Gln Gln Ile Asn Pro Lys Pro Met Lys Pro Asn Ser Asn Val Val Arg 145 150 155 160 Thr Lys Ala Thr Lys Cys Ser Lys Val Leu Phe Ile Asn Ser Pro Pro 165 170 175 Met His Asn Leu Gln Asn Lys Ala Glu Ala Glu Thr Lys Thr Lys Pro 180 185 190 Leu Met Leu Val Asn Gly Val Ala Ser Asp Ser Met Ser Asn Asn Glu 195 200 205 Met Glu Arg Gly Asn Gly Phe Leu Ser Phe Cys Asp Glu Glu Lys Glu 210 215 220 Leu Ser Ala Asp Leu Leu Asp Asp Phe Asn Ile Ala Asp Asp Ile Cys 225 230 235 240 Leu Ser Glu Phe Leu Asn Ser Asp Phe Ser Asn Ala Cys Asn Phe Asp 245 250 255 Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp Gln Thr Gln Met Phe Ser 260 265 270 Asp Asp Glu Ile Leu Lys Asn Trp Thr Gln Cys Asn Phe Ala Asp Glu 275 280 285 Thr Asn Val Ser Asn Asn Leu His Ser Phe Ala Ser Phe Leu Glu Ser 290 295 300 Ser Glu Glu Val Leu Gly Glu 305 310 <210> 54 <211> 311 <212> PRT <213> Trifolium repens <400> 54 Met Gly Arg Ser Pro Cys Cys Ala Lys Glu Gly Leu Asn Arg Gly Ala 1 5 10 15 Trp Thr Ala His Glu Asp Lys Ile Leu Thr Glu Tyr Ile Lys Leu His 20 25 30 Gly Glu Gly Lys Trp Arg Asn Leu Pro Lys Arg Ala Gly Leu Lys Arg 35 40 45 Cys Gly Lys Ser Cys Arg Leu Arg Trp Leu Asn Tyr Leu Arg Pro Asp 50 55 60 Ile Lys Arg Gly Asn Ile Ser Ser Asp Glu Glu Glu Leu Ile Ile Arg 65 70 75 80 Leu His Lys Leu Leu Gly Asn Arg Trp Ser Leu Ile Ala Gly Arg Leu 85 90 95 Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn Tyr Trp Asn Thr Asn Leu 100 105 110 Gly Lys Lys Val Lys Asp Leu Asn Gln Gln Asn Thr Asn Asn Ser Ser 115 120 125 Pro Thr Lys Pro Ser Ala Gln Pro Lys Asn Ala Asn Ile Lys Gln Lys 130 135 140 Gln Gln Ile Asn Pro Lys Pro Met Lys Pro Asn Ser Asn Val Val Arg 145 150 155 160 Thr Lys Ala Thr Lys Cys Ser Lys Val Leu Phe Ile Asn Ser Pro Pro 165 170 175 Met His Asn Leu Gln Asn Lys Ala Glu Ala Glu Thr Lys Thr Lys Pro 180 185 190 Leu Met Leu Val Asn Gly Val Ala Ser Asp Ser Met Ser Asn Asn Glu 195 200 205 Met Glu Arg Gly Asn Gly Phe Leu Ser Phe Cys Asp Glu Glu Lys Glu 210 215 220 Leu Ser Ala Asp Leu Leu Asp Asp Phe Asn Ile Ala Asp Asp Ile Cys 225 230 235 240 Leu Ser Glu Phe Leu Asn Ser Asp Phe Ser Asn Ala Cys Asn Phe Asp 245 250 255 Tyr Asn Asp Leu Leu Ser Pro Cys Ser Asp Gln Thr Gln Met Phe Ser 260 265 270 Asp Asp Glu Ile Leu Lys Asn Trp Thr Gln Cys Asn Phe Ala Asp Glu 275 280 285 Thr Asn Val Ser Asn Asn Leu His Ser Phe Ala Ser Phe Leu Glu Ser 290 295 300 Ser Glu Glu Val Leu Gly Glu 305 310 <210> 55 <211> 942 <212> DNA <213> Trifolium arvense <400> 55 atggggagaa gcccttgttg tgcaaaggaa ggcttgaata gaggtgcttg gacaactcaa 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgcgga aaaagttgta gacttagatg gttgaattat 180 ctaagaccag atattaagcg aggtaatata tcctcggatg aagaagaact tatcatcaga 240 cttcacaaac tactcggaaa cagatggtct ctaatagccg gaagacttcc aggacgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaggttaa ggatcttaat 360 caacaaaaca ccaacaattc ttctcctact aaactctctg ctcaaccaaa aaatgcaaag 420 atcaaacaga aacagatcaa tcctaagcca atgaagccaa actcaaatgt tgtccgtaca 480 aaagctacca agtgttctaa ggtattgttc ataaactcac tccccaactc accaatgcat 540 gatttgcaga acaaagctga ggcagagaca acaacaaagc catcaatgct ggttgatggt 600 gtggctagtg attcaatgag taacaacgaa atggaacacg gttatggatt tttgtcattt 660 tgcgatgaag agaaagaact atccgcagat ttgctagaag attttaacat cgcggatgat 720 atttgcttat ctgaactttt gaactctgat ttctcaaatg cgtgcaattt cgattacaat 780 gatctattgt caccttgttc ggaccaaact caaatgttct ctgatgatga gattctcaag 840 aattggacac aatgtaactt tgctgatgag acaaatgtgt ccaacaacct tcattctttt 900 gcttcctttc ttgaatccag tgaggaagta ctaggagaat ga 942 <210> 56 <211> 933 <212> DNA <213> Trifolium arvense <400> 56 atggggagaa gcccttgttg tgcaaaggaa ggcttgaata gaggtgcttg gacaactcaa 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gacttagatg gttgaattat 180 ctaagaccag atattaagcg aggtaatata tcctcggatg aagaagaact tatcatccga 240 cttcacaaac tactcggaaa cagatggtct ctaatagccg gaagacttcc agggcgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaggttaa ggatcttaat 360 caagaaaaca ccaacaattc ttctcctact aaactttctg ctcaactaaa aaatgcaaag 420 atcaaacaga aacagatcaa tcctaagcca atggagccaa actcaaatgt tgtccgtaca 480 aaagctacca agtgttctaa ggcattgttc ataaactcac cccccaactc accaccaatg 540 catgatttgc agaacaaagc tgaggcagag acaacaacaa agtcatcaat gccatcaatg 600 ctggttgatg gcgtggctag tgattcaatg agtaacaacg aaatggaata cggtgatgga 660 tttgtttcat tttgcgatga cgataaagaa ctatccgcag atttgctaga agattttaac 720 atctcggatg atatttgctt atccgaattt ctaaacttcg atttctcaaa tgcgtgcaat 780 ttcgattaca acgatctatt gtcgccttgt tcggaccaaa cacaaatgtt ctctggtgat 840 gagattctca agaattcgac acaatgtaac tttgctgctg agacaaatta tgtgtccaac 900 aaccaatcca gtgaggaagt actaggagaa tga 933 <210> 57 <211> 933 <212> DNA <213> Trifolium affine <400> 57 atggggagaa gcccttgttg tgcgaaggaa ggcttgaata gaggtgcttg gacaactcaa 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gacttagatg gttgaattat 180 ctaagactag atattaagcg aggtaatata tcctcggatg aagaagaact tatcatccga 240 cttcacaaat tactcggaaa cagatggtct ctaatagccg gaagacttcc aggacgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaggttaa ggatcttaat 360 caagaaaaca ccaacaattc ttctcctact aaactttctg ctcaactaaa aaatgcaaag 420 atcaaacaga aacagatcaa tcctaagcca atggagccaa actcaaatgt tgtccgtaca 480 aaagctacca agtgttctaa ggcattgttc ataaactcac cccccaactc accaccaatg 540 catgatttgc agaacaaagc tgaggcagag acaacaacaa agtcatcaat gccatcaatg 600 ctggttgatg gcgtggctag tgattcaatg agtaacaacg aaatggaata cggtgatgga 660 tttgtttcat tttgcgatga cgataaagaa ctatccgcag atttgctaga agattttaac 720 atctcggatg atatttgctt atccgaattt ctaaacttcg atttctcaaa tgcgtgcaat 780 ttcgattaca acgatctatt gtcgccttgt tcggaccaaa cacaaatgtt ctctgatgat 840 gagattctca agaattcgac accatgtaac tttgctgctg agacaaatta tgtgtccaac 900 aaccaatcca gtgaggaagt actaggagaa tga 933 <210> 58 <211> 891 <212> DNA <213> Trifolium affine <400> 58 atggggagaa gcccttgttg tgcaaaggaa ggcttgaata gaggtgcttg gacaactcaa 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gacttagatg gttgaattat 180 ctaagaccag atattaagcg aggtaatata tcctcggatg aagaagaact tatcatccga 240 cttcacaaac tactcggaaa cagatggtct ctaatagccg gaagacttcc agggcgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaggttaa ggatcttaat 360 caagaaaaca ccaacaattc ttctcctact aaactttctg ctcaactaaa aaatgcaaag 420 atcaaacaga aacagatcaa tcctaagcca atggagccaa actcaaatgt tgtccgtaca 480 aaagctacca agtgttctaa ggcattgttc ataaactcac cccccaactc accaccaatg 540 catgatttgc agaacaaagc tgaggcagag acaacaacaa agtcatcaat gccatcaatg 600 ctggttgatg gcgtggctag tgattcaatg agtaacaacg aaatggaata cggtgatgga 660 tttgtttcat tttgcgatga cgataaagaa ctatccgcag atttgctaga agattttaac 720 atctcggatg atatttgctt atccgaattt ctaaacttcg atttctcaaa tgcgtgcaat 780 ttcgattaca acgatctatt gtcgccttgt tcggaccaaa cacaaatgtt ctctgatgat 840 gagattctca agaattcgac acaatgtaac tttgctgctg agacaaatta a 891 <210> 59 <211> 942 <212> DNA <213> Trifolium occidentale <400> 59 atggggagaa gcccttgttg tgcaaaggaa ggcttgaata gaggtgcttg gacaactcaa 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgcgga aaaagttgta gacttagatg gttgaattat 180 ctaagaccag atattaagcg aggtaatata tcctcggatg aagaagaact tatcatcaga 240 cttcacaaac tactcggaaa cagatggtct ctaatagccg gaagacttcc aggacgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaggttaa ggatcttaat 360 caacaaaaca ccaacaagtc ttctcctact aaactctctg ctcaaccaaa aaatgcaaag 420 atcaaacaga aacagatcaa tcctaagcca atgaagccaa actcaaatgt tgtccgtaca 480 agagctacca agtgttctaa ggtattgttc ataaactcac tccccaactc accaatgcat 540 gatttgcaga acaaagctga ggcagagaca acaacaaagc catcaatgct ggttgatggt 600 gtggctagtg attcaatgag taacaacgaa atggaacacg gttatggatt tttgtcattt 660 tgcgatgaag agaaagaact atccgcagat ttgctagaag attttaacat cgcggatgat 720 atttgcttat ctgaactttt gaactctgat ttctcaaatg cgtgcaattt cgattacaat 780 gatctattgt cmccttgttc ggaccaaact caaatgttct ctgatgatga gattctcaag 840 aattggacac aatgtaactt tgctgatgag acaaatgtgt ccaacaacct tcattctttt 900 gcttcctttc ttgaatccag tgaggaagta ctaggagaat ga 942 <210> 60 <211> 939 <212> DNA <213> Trifolium occidentale <400> 60 atggggagaa gcccttgttg tgcaaaggaa ggtttgaata gaggtgcttg gacagctcat 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gacttagatg gttgaattat 180 cttagaccag atattaagag aggtaatata tcgtccgatg aagaagaact tatcattaga 240 cttcacaaac tacttggaaa ccgatggtct ctaatagccg gaagacttcc agggcgaaca 300 gacaatgaaa taaaaaatta ctggaacacg aatttaggaa aaaaggttaa ggatcttaat 360 caacaaaaca ccaacaattc ttctcctact aaaccttctg ctcaaccaaa aaatgcaaag 420 atcaaacaga aacaacagat caataatcct aagccaatga agccaaactc gaatgttgtc 480 cgtacaaaag ctaccaaatg ttctaaggta ttgttcataa actcaccacc aatgcataat 540 ttgcagaaca aagctgaggc agagacaaaa acaaagacat caatgttggt taatggtgta 600 gctagtgatt caatgagtaa caacgaaatg gaacgaggta atggattttt gtcatttcgc 660 gatgaagaga aagaactatc cgctgatttg ctagatgatt ttaacatcgc ggatgacatt 720 tgcttatccg aatttctaaa ctccgatttc tcaaatgcgt gcaatttcga ttacaatgat 780 ctattgtcac cttgttcgga tcaaactcaa atgttctctg atgatgagat tctcaagaat 840 tggacacaat gtaactttgc tgatgagaca aatgtgtcca acaaccttca ttcttttgct 900 tcctttctcg aatccagtga ggaagtacta ggagaatga 939 <210> 61 <211> 936 <212> DNA <213> Trifolium repens <400> 61 atggggagaa gcccttgttg tgcaaaagaa ggcttgaata gaggtgcttg gacagctcat 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gactaaggtg gttgaattat 180 cttagaccgg atattaagag aggtaatata tcgtcggatg aagaagaact tatcattaga 240 cttcacaaac tactcggaaa ccgatggtct ctaatagccg gaagacttcc agggcgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaagttaa ggatcttaat 360 caacaaaaca ccaacaattc ttctcctact aaaccttctg ctcaaccaaa aaatgcaaat 420 atcaaacaga aacaacagat caatcctaag ccaatgaagc caaactcgaa tgttgtccgt 480 acaaaagcta ccaaatgttc taaggtattg ttcataaact caccaccaat gcataatttg 540 cagaacaaag ctgaggcaga gacaaaaaca aagccattaa tgctggttaa tggtgtagct 600 agtgattcaa tgagtaacaa cgaaatggaa cgcggtaatg gatttttgtc attttgcgac 660 gaagagaaag aactatccgc agatttgcta gatgatttta acatcgcgga tgatatttgc 720 ttatctgaat ttctaaactc cgatttctca aatgcgtgca atttcgatta caatgatcta 780 ttgtcgcctt gttcggatca aactcaaatg ttctctgatg atgagattct caagaattgg 840 acacaatgta actttgctga tgagacaaat gtgtccaaca accttaattc ttttgcttct 900 tttctcgaat ccagtgagga agtactagga gaatga 936 <210> 62 <211> 936 <212> DNA <213> Trifolium repens <400> 62 atggggagaa gcccttgttg tgcaaaagaa ggcttgaata gaggtgcttg gacagctcat 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gactaaggtg gttgaattat 180 cttagaccgg atattaagag aggtaatata tcgtcggatg aagaagaact tatcattaga 240 cttcacaaac tactcggaaa ccgatggtct ctaatagccg gaagacttcc agggcgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaagttaa ggatcttaat 360 caacaaaaca ccaacaattc ttctcctact aaaccttctg ctcaaccaaa aaatgcaaat 420 atcaaacaga aacaacagat caatcctaag ccaatgaagc caaactcgaa tgttgtccgt 480 acaaaagcta ccaaatgttc taaggtattg ttcataaact caccaccaat gcataatttg 540 cagaacaaag ctgaggcaga gacaaaaaca aagccattaa tgctggttaa tggtgtagct 600 agtgattcaa tgagtaacaa cgaaatggaa cgcggtaatg gatttttgtc attttgcgac 660 gaagagaaag aactatccgc agatttgcta gatgatttta acatcgcgga tgatatttgc 720 ttacctgaat ttctaaactc cgatttctca aatgcgtgca atttcgatta caatgatcta 780 ttgtcgcctt gttcggatca aactcaaatg ttctctgatg atgagattct caagaattgg 840 acacaatgta actttgctga tgagacaaat gtgtccaaca accttaattc ttttgcttct 900 tttctcgaat ccagtgagga agtactagga gaatga 936 <210> 63 <211> 936 <212> DNA <213> Trifolium repens <400> 63 atggggagaa gcccttgttg tgcaaaagaa ggcttgaata gaggtgcttg gacagctcat 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gactaaggtg gttgaattat 180 cttagaccgg atattaagag aggtaatata tcgtcggatg aagaagaact tatcattaga 240 cttcacaaac tactcggaaa ccgatggtct ctaatagccg gaagacttcc agggcgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaagttaa ggatcttaat 360 caacaaaaca ccaacaattc ttctcctact aaaccttctg ctcaaccaaa aaatgcaaat 420 atcaaacaga aacaacagat caatcctaag ccaatgaagc caaactcgaa tgttgtccgt 480 acaaaagcta ccaaatgttc taaggtattg ttcataaact caccaccaat gcataatttg 540 cagaacaaag ctgaggcaga gacaaagaca aagccattaa tgctggttaa tggtgtagct 600 agtgattcaa tgagtaacaa cgaaatggaa cgcggtaatg gatttttgtc attttgcgac 660 gaagagaaag aactatccgc agatttgcta gatgatttta acatcgcgga tgatatttgc 720 ttatctgaat ttctaaactc cgatttctca aatgcgtgca atttcgatta caatgatcta 780 ttgtcgcctt gttcggatca aactcaaatg ttctctgatg atgagattct caagaattgg 840 acacaatgta actttgctga tgagacaaat gtgtccaaca accttcattc ttttgcttcc 900 tttctcgaat ccagtgagga agtactagga gaatga 936 <210> 64 <211> 936 <212> DNA <213> Trifolium repens <400> 64 atggggagaa gcccttgttg tgcaaaagaa ggcttgaata gaggtgcttg gacagctcat 60 gaagacaaaa tcctcactga atacattaag ctccatggtg aaggaaaatg gagaaacctt 120 ccaaaaagag caggtttaaa aagatgtgga aaaagttgta gactaaggtg gttgaattat 180 cttagaccgg atattaagag aggtaatata tcgtcggatg aagaagaact tatcattaga 240 cttcacaaac tactcggaaa ccgatggtct ctaatagccg gaagacttcc agggcgaaca 300 gacaatgaaa taaagaacta ctggaacaca aatttaggaa aaaaagttaa ggatcttaat 360 caacaaaaca ccaacaattc ttctcctact aaaccttctg ctcaaccaaa aaatgcaaat 420 atcaaacaga aacaacagat caatcctaag ccaatgaagc caaactcgaa tgttgtccgt 480 acaaaagcta ccaaatgttc taaggtattg ttcataaact caccaccaat gcataatttg 540 cagaacaaag ctgaggcaga gacaaagaca aagccattaa tgctggttaa tggtgtagct 600 agtgattcaa tgagtaacaa cgaaatggaa cgcggtaatg gatttttgtc attttgcgac 660 gaagagaaag aactatccgc agatttgcta gatgatttta acatcgcgga tgatatttgc 720 ttatctgaat ttctaaactc cgatttctca aatgcgtgca atttcgatta caatgatcta 780 ttgtcgcctt gttcggatca aactcaaatg ttctctgatg atgagattct caagaattgg 840 acacaatgta actttgctga tgagacaaat gtgtccaaca accttcattc ttttgcttcc 900 tttctcgaat ccagtgagga agtactagga gaatga 936 <210> 65 <211> 299 <212> DNA <213> Trifolium arvense <400> 65 caatgctggt tgatggtgtg gctagtgatt caatgagtaa caacgaaatg gaacacggtt 60 atggattttt gtcattttgc gatgaagaga aagaactatc cgcagatttg ctagaagatt 120 ttaacatcgc ggatgatatt tgcttatctg aacttttgaa ctctgatttc tcaaatgcgt 180 gcaatttcga ttacaatgat ctattgtcac cttgttcgga ccaaactcaa atgttctctg 240 atgatgagat tctcaagaat tggacacaat gtaactttgc tgatgagaca aatgtgtcc 299 <210> 66 <211> 28 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 66 tctagacaat gctggttgat ggtgtggc 28 <210> 67 <211> 27 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 67 tctagaggac acatttgtct catcagc 27 <210> 68 <211> 28 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 68 ctcgagcaat gctggttgat ggtgtggc 28 <210> 69 <211> 27 <212> DNA <213> Artificial <220> <223> Primer sequence <400> 69 ctcgagggac acatttgtct catcagc 27 ?? ?? ?? ?? sequence listing.doc

Claims (65)

  1. 여기서 기재하고 있는 MYB14 폴리펩티드 또는 이의 기능적 단편을 암호화하는 것을 특징으로 하는 분리된 핵산 분자.
  2. 제 1 항에 있어서,
    상기 MYB14 폴리펩티드는 서열번호 14 및 46 내지 54 중 어느 하나와 70 % 이상의 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  3. 제 1 항에 있어서,
    상기 MYB14 폴리펩티드는 서열번호 14와 70 % 이상의 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  4. 제 1 항에 있어서,
    상기 MYB14 폴리펩티드는 서열번호 14 및 46 내지 54 중 어느 하나의 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  5. 제 1 항에 있어서,
    상기 MYB14 폴리펩티드는 서열번호 15 및 서열번호 17의 서열은 포함하지만 서열번호 16의 서열은 없는 것을 특징으로 하는 분리된 핵산 분자.
  6. 제 1 항에 있어서,
    상기 MYB14 폴리펩티드는 서열번호 14의 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  7. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 MYB14 폴리펩티드는 식물에서의 플라보노이드의 제조를 조절하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  8. 제 7 항에 있어서,
    상기 플라보노이드는 축합형 탄닌인 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  9. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 MYB14 폴리펩티드는 식물의 플라보노이드 생합성 경로에서 하나 이상의 유전자를 조절하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  10. 제 1 항 내지 제 6 항 중 어느 한 항에 있어서,
    상기 MYB14 폴리펩티드는 식물의 축합형 탄닌 생합성 경로에서 하나 이상의 유전자를 조절하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  11. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 MYB14 폴리펩티드 또는 이의 기능적 단편은 서열번호 17과 70 % 이상의 동일성을 갖는 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  12. 제 1 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 MYB14 폴리펩티드 또는 이의 기능적 단편은 서열번호 17의 아미노산 서열을 포함하는 것을 특징으로 하는 분리된 폴리뉴클레오티드.
  13. 하기로 이루어진 군으로부터 선택된 뉴클레오티드 서열을 갖는 것을 특징으로 하는 분리된 핵산 분자:
    a) 서열번호 1 내지 13 및 55 내지 64 중 하나 이상 또는 이의 결합물;
    b) 상기 a)의 서열(들)의 상보체;
    c) 상기 a) 또는 b)의 서열(들)의 기능적 단편 또는 변이체;
    d) 상기 a), b) 또는 c)의 서열(들)의 동족체 또는 상동체; 및
    e) 상기 a), b), c) 또는 d)의 서열로부터 수득된 RNA 서열에 대한 안티센스 서열.
  14. 제 13 항에 있어서,
    변이체는 특정 서열과 70 % 이상의 동일성을 갖는 것을 특징으로 하는 분리된 핵산 분자.
  15. 제 13 항에 있어서,
    뉴클레오티드 서열은 하기로 이루어진 군으로부터 선택되는 것을 특징으로 하는 분리된 핵산 분자:
    a) 서열번호 1, 2 또는 55;
    b) 상기 a)의 서열(들)의 상보체;
    c) 상기 a) 또는 b)의 서열(들)의 기능적 단편 또는 변이체;
    d) 상기 a), b) 또는 c)의 서열(들)의 동족체 또는 상동체; 및
    e) 상기 a), b), c) 또는 d)의 서열로부터 수득된 RNA 서열에 대한 안티센스 서열.
  16. 제 15 항에 있어서,
    상기 변이체는 특정 서열과 70 % 이상의 동일성을 갖는 것을 특징으로 하는 분리된 핵산 분자.
  17. 제 15 항에 있어서,
    서열번호 1의 서열을 포함하는 것을 특징으로 하는 분리된 핵산 분자.
  18. 제 15 항에 있어서,
    서열번호 2의 서열을 포함하는 것을 특징으로 하는 분리된 핵산 분자.
  19. 제 15 항에 있어서,
    서열번호 55의 서열을 포함하는 것을 특징으로 하는 분리된 핵산 분자.
  20. 제 1 항 내지 제 19 항 중 어느 한 항에 따른 핵산 분자 또는 이의 상보체에 결합할 수 있는 것을 특징으로 하는 프로브.
  21. 제 20 항에 있어서,
    강제 혼성화 조건하에서 특정 서열에 결합할 수 있는 것을 특징으로 하는 프로브.
  22. 제 20 항 또는 제 21 항에 있어서,
    서열번호 17로 제시되는 것과 같은 3' 서열 모티프를 암호화하는 핵산에 결합할 수 있는 것을 특징으로 하는 프로브.
  23. 제 1 항 내지 제 19 항 중 어느 한 항에 따른 핵산 분자 또는 이의 상보체에 결합할 수 있는 것을 특징으로 하는 프라이머.
  24. 제 23 항에 있어서,
    PCR 조건하에서 특정 서열에 결합할 수 있는 것을 특징으로 하는 프라이머.
  25. 제 23 항 또는 제 24 항에 있어서,
    서열번호 17로 제시되는 3' 서열 모티프를 암호화하는 핵산에 결합할 수 있는 것을 특징으로 하는 프라이머.
  26. 여기서 규정하는 것과 같은 분리된 MYB14 폴리펩티드 또는 이의 기능적 단편.
  27. 제 26 항에 있어서,
    서열번호 15 및 서열번호 17의 서열은 포함하지만 서열번호 16의 서열은 없는 것을 특징으로 하는 MYB14 폴리펩티드.
  28. 제 26 항에 있어서,
    하기로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 것을 특징으로 하는 분리된 폴리펩티드:
    a) 서열번호 14 및 46 내지 54 중 어느 하나; 및
    b) 상기 a)에서 나열된 서열의 기능적 단편 및 변이체.
  29. 제 28 항에 있어서,
    상기 변이체는 서열번호 14 및 46 내지 54 중 어느 하나와 70 % 이상의 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 분리된 폴리펩티드.
  30. 제 28 항에 있어서,
    상기 변이체는 서열번호 14와 70 % 이상의 동일성을 갖는 서열을 포함하는 것을 특징으로 하는 분리된 폴리펩티드.
  31. 제 28 항에 있어서,
    상기 MYB14 폴리펩티드는 서열번호 14 및 46 내지 54 중 어느 하나의 서열을 포함하는 것을 특징으로 하는 분리된 폴리펩티드.
  32. 제 28 항에 있어서,
    상기 MYB14 폴리펩티드는 서열번호 14의 서열을 포함하는 것을 특징으로 하는 분리된 폴리펩티드.
  33. 제 1 항 내지 제 19 항 중 어느 한 항에 따른 핵산 분자에 의해 암호화되는 것을 특징으로 하는 분리된 폴리펩티드.
  34. 제 26 항 내지 제 33 항 중 어느 한 항에 따른 폴리펩티드를 암호화하는 서열을 포함하는 것을 특징으로 하는 분리된 핵산 분자.
  35. 제 1 항 내지 제 19 항 또는 제 34 항 중 어느 한 항에 실질적으로 기재된 것과 같은 뉴클레오티드 서열을 포함하는 것을 특징으로 하는 구조체.
  36. 제 33 항에 있어서,
    하기를 포함하며, 하기 프로모터는 하기 핵산 분자의 발현을 제어하기 위해서 하기 핵산 분자에 작동가능하게 연결되는 것을 특징으로 하는 구조체:
    - 하나 이상의 프로모터; 및
    - 핵산 분자.
  37. 제 1 항 내지 제 19 항 또는 제 34 항 중 어느 한 항에 실질적으로 기재된 핵산 분자를 포함하기 위해서 야생형으로부터 변경되는 것을 특징으로 하는 숙주 세포.
  38. 제 37 항에 있어서,
    상기 핵산은 제 33 항 또는 제 34 항의 유전적 구조체의 일부인 것을 특징으로 하는 숙주 세포.
  39. 제 37 항 또는 제 38 항에 있어서,
    상기 숙주 세포는 식물 세포인 것을 특징으로 하는 숙주 세포.
  40. 제 1 항 내지 제 19 항 또는 제 34 항 중 어느 한 항에 실질적으로 기재된 핵산 분자로 형질전환되는 것을 특징으로 하는 식물 세포 또는 식물.
  41. 제 40 항에 있어서,
    상기 핵산은 제 35 항 또는 제 36 항의 유전적 구조체의 일부인 것을 특징으로 하는 식물 세포 또는 식물.
  42. 제 40 항 또는 제 41 항의 식물의 씨앗.
  43. 제 40 항 또는 제 41 항의 식물, 또는 이의 일부이거나 또는 제 40 항 또는 제 41 항의 식물 또는 이의 일부로부터 수득되는 성분을 포함하는 것을 특징으로 하는 조성물.
  44. 식물 또는 식물 세포를 변경하기 위한 제 1 항 내지 제 19 항 또는 제 34 항 중 어느 한 항에 실질적으로 기재된 핵산 분자의 용도.
  45. 식물 또는 식물 세포의 변경을 위해 제 1 항 내지 제 19 항 또는 제 34 항 중 어느 한 항에 실질적으로 기재된 핵산 분자를 사용하여 변경된 식물 또는 식물 세포를 제조하는 것을 특징으로 하는 방법.
  46. 제 44 항 또는 제 45 항에 있어서,
    상기 식물 또는 식물 세포는 플라보노이드 또는 플라보노이드 제조에서의 중간체의 제조로 변경되는 것을 특징으로 하는 용도 또는 방법.
  47. 제 46 항에 있어서,
    상기 플라보노이드는 하나 이상의 축합형 탄닌 또는 이의 단량체를 포함하는 것을 특징으로 하는 용도 또는 방법.
  48. 제 47 항에 있어서,
    상기 축합형 탄닌은 카테킨, 에피카테킨, 에피갈로카테킨 및 갈로카테킨으로 이루어진 군으로부터 선택되는 것을 특징으로 하는 용도 또는 방법.
  49. 제 44 항 또는 제 45 항에 있어서,
    상기 식물 또는 식물 세포는 플로보노이드 생합성 경로에서의 하나 이상의 효소의 발현으로 변경되는 것을 특징으로 하는 용도 또는 방법.
  50. 제 49 항에 있어서,
    상기 식물 또는 식물 세포는 축합형 탄닌 생합성 경로에서 하나 이상의 효소의 발현으로 변경되는 것을 특징으로 하는 용도 또는 방법.
  51. 제 50 항에 있어서,
    상기 효소는 LAR 및/또는 ANR인 것을 특징으로 하는 용도 및 방법.
  52. 제 46 항 내지 제 51 항 중 어느 한 항에 있어서,
    상기 변경된 제조 또는 발현은 증가된 제조 또는 증가된 발현인 것을 특징으로 하는 용도 또는 방법.
  53. 제 44 항 내지 제 52 항 중 어느 한 항에 있어서,
    상기 식물은 사료작물 식물이거나 또는 상기 식물 세포는 사료작물 식물 세포인 것을 특징으로 하는 용도 또는 방법.
  54. 제 44 항 내지 제 53 항 중 어느 한 항에 있어서,
    상기 식물은 콩과 식물이거나 또는 상기 식물 세포는 콩과 식물 세포인 것을 특징으로 하는 용도 또는 방법.
  55. 제 44 항 내지 제 54 항 중 어느 한 항에 있어서,
    상기 변경된 제조 또는 발현은 식물의 실질적으로 모든 조직에서 일어나는 것을 특징으로 하는 용도 또는 방법.
  56. 제 44 항 내지 제 54 항 중 어느 한 항에 있어서,
    상기 변경된 제조 또는 발현은 식물의 잎 조직에서 일어나는 것을 특징으로 하는 용도 또는 방법.
  57. 제 44 항 내지 제 54 항 중 어느 한 항에 있어서,
    상기 변경된 제조 또는 발현은 식물의 생장 부분에서 일어나는 것을 특징으로 하는 용도 또는 방법.
  58. 제 44 항 내지 제 54 항 중 어느 한 항에 있어서,
    상기 변경된 제조 또는 발현은 식물의 표피 조직에서 일어나는 것을 특징으로 하는 용도 또는 방법.
  59. 제 44 항 내지 제 55 항 중 어느 한 항에 있어서,
    플라보노이드 또는 축합형 탄닌의 상기 변경된 제조는 플라보노이드 또는 축합형 탄닌이 실질적으로 거의 없는 식물의 조직에서 일어나는 것을 특징으로 하는 용도 또는 방법.
  60. 제 44 항 내지 제 59 항 중 어느 한 항에 있어서,
    상기 식물은 핵산 또는 구조체로 식물을 형질전환시킴으로써 변경되는 것을 특징으로 하는 용도 또는 방법.
  61. 제 44 항 내지 제 60 항 중 어느 한 항에 있어서,
    상기 식물은 식물의 게놈을 조작함으로써 변경시켜 상응하는 야생형 식물 또는 이의 일부에서 제조되는 것과 비교해서 식물 또는 이의 일부에서의 핵산의 수준을 증가 또는 감소시켜 발현하는 것을 특징으로 하는 용도 또는 방법.
  62. 제 44 항 내지 제 61 항 중 어느 한 항에 있어서,
    본 발명에 의해 변경된 플라보노이드 및/또는 축합형 탄닌의 수준은 치료적 또는 작물적 이점을 제공하기에 충분한 것을 특징으로 하는 용도 또는 방법.
  63. 제 45 항 내지 제 62 항 중 어느 한 항에 따른 방법으로 제조되는 것을 특징으로 하는 식물.
  64. 제 40 항, 제 41 항 및 제 63 항 중 어느 한 항에 따른 식물의 일부, 씨앗, 과실, 수확 물질, 번식체 또는 자손.
  65. 제 1 항 내지 제 19 항 중 어느 한 항에 따른 하나 이상의 핵산 분자 또는 제 35 항 또는 제 36 항에 따른 구조체를 포함하도록 유전적으로 변형된 것을 특징으로 하는 제 34 항에 따른 식물의 일부, 씨앗, 과실, 수확 물질, 번식체 또는 자손.
KR1020117000232A 2008-06-06 2009-06-05 생합성과 관련된 신규의 유전자들 KR20110049769A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US5969108P 2008-06-06 2008-06-06
NZ568928 2008-06-06
NZ56892808 2008-06-06
US61/059,691 2008-06-06

Publications (1)

Publication Number Publication Date
KR20110049769A true KR20110049769A (ko) 2011-05-12

Family

ID=41398294

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117000232A KR20110049769A (ko) 2008-06-06 2009-06-05 생합성과 관련된 신규의 유전자들

Country Status (17)

Country Link
US (1) US9051380B2 (ko)
EP (1) EP2294200B1 (ko)
JP (1) JP5774478B2 (ko)
KR (1) KR20110049769A (ko)
CN (1) CN102124111B (ko)
AR (1) AR072022A1 (ko)
AU (1) AU2009255796B2 (ko)
CA (1) CA2726743C (ko)
ES (1) ES2537342T3 (ko)
MA (1) MA32451B1 (ko)
MX (1) MX2010013413A (ko)
NZ (1) NZ588580A (ko)
PL (1) PL2294200T3 (ko)
PT (1) PT2294200E (ko)
UY (1) UY31875A (ko)
WO (1) WO2009148336A1 (ko)
ZA (1) ZA201100093B (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011053167A1 (en) * 2009-10-30 2011-05-05 Grasslanz Technology Limited Transcription factor polynucleotides and their use
KR101566692B1 (ko) 2014-06-26 2015-11-09 한국생명공학연구원 스틸벤 생산이 증가된 형질전환 식물체의 제조 방법 및 그에 따른 식물체
CN104911205A (zh) * 2015-05-28 2015-09-16 甘肃农业大学 一种获得转基因苜蓿的方法及其专用表达载体cpb-lar-gfp
CN104911206A (zh) * 2015-05-28 2015-09-16 甘肃农业大学 一种获得转基因苜蓿的方法及其专用表达载体cpb-ban-gfp
CN106497939B (zh) * 2016-10-14 2019-06-11 昆明理工大学 一种三七转录因子基因PnMYB1及其应用
US20200181632A1 (en) * 2017-01-18 2020-06-11 University Of North Texas Methods for engineering proanthocyanidins (pas) in plants by affecting myb transcription factors
EP3600361A4 (en) * 2017-03-24 2021-01-06 Trait Biosciences, Inc. HIGH LEVEL IN VIVO BIOSYNTHESIS AND ISOLATION OF WATER-SOLUBLE CANNABINOIDS IN PLANT SYSTEMS
EP3681307A4 (en) 2017-09-15 2021-06-16 Covercress Inc. LOW FIBER FIELD LIGHTWEED FLOUR AND PROCESS FOR ITS PRODUCTION
CN108395473B (zh) * 2018-02-13 2020-03-27 中国农业科学院生物技术研究所 植物类胡萝卜素合成相关蛋白及其编码基因与应用
CN109295069B (zh) * 2018-09-19 2021-08-20 昆明理工大学 珠子参转录因子基因PjMYB1的应用
CN111454344B (zh) * 2020-05-14 2022-08-05 安徽农业大学 一种大豆myb转录因子、编码基因及其应用
CN112280787B (zh) * 2020-11-10 2021-09-21 中国科学院华南植物园 一种甘草myb1基因、其编码的蛋白和应用
CN112877339B (zh) * 2021-02-25 2022-02-11 华中农业大学 柿原花青素前体跨膜转运基因DkMATE7及其应用
CN113278630B (zh) * 2021-05-26 2022-02-15 安徽农业大学 一种改良桑树白藜芦醇生物合成的转录因子基因MaMYB14及其应用
CN113831397B (zh) * 2021-08-19 2022-11-25 云南省烟草农业科学研究院 一种原花青素物质调控因子NtMYB330及其表达载体、转化体、试剂盒与方法
CN114395019B (zh) * 2021-12-15 2023-06-16 山东农业大学 草莓FvMYB79基因及其应用

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2683648B1 (fr) * 1991-11-12 1996-12-13 Apple Computer Procede de choix d'objets dans une sequence d'images mobiles et piste d'essai de reussite correspondante.
US7511190B2 (en) * 1999-11-17 2009-03-31 Mendel Biotechnology, Inc. Polynucleotides and polypeptides in plants
WO2000046383A2 (en) * 1999-02-05 2000-08-10 Rijksuniversiteit Leiden Method of modulating metabolite biosynthesis in recombinant cells
US20100293669A2 (en) * 1999-05-06 2010-11-18 Jingdong Liu Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US20110093981A9 (en) * 1999-05-06 2011-04-21 La Rosa Thomas J Nucleic acid molecules and other molecules associated with transcription in plants and uses thereof for plant improvement
CA2522054A1 (en) * 2003-04-09 2004-10-28 Purdue Research Foundation Method for increrasing plant stress resistance by expression of a hos10 transcription factor in transgenic plants
AU2003901797A0 (en) * 2003-04-14 2003-05-01 Agresearch Limited Manipulation of condensed tannin biosynthesis
JP2005204657A (ja) * 2003-12-24 2005-08-04 Japan Science & Technology Agency タンニン含量が低減された植物体の生産方法およびこれを用いて得られる植物体、並びにその利用
US20110099664A1 (en) * 2004-01-07 2011-04-28 Masaru Takagi Producing process of sterile plants, plants obtained by the process, and use of the plants
US20080148432A1 (en) * 2005-12-21 2008-06-19 Mark Scott Abad Transgenic plants with enhanced agronomic traits
WO2007142258A1 (ja) * 2006-06-06 2007-12-13 Plant Genome Center Co., Ltd. アントシアニン合成制御遺伝子、およびその利用
US9200292B2 (en) * 2008-06-06 2015-12-01 Grasslanz Technology Limited MYB14 sequences and uses thereof for flavonoid biosynthesis

Also Published As

Publication number Publication date
NZ588580A (en) 2012-07-27
JP2011523559A (ja) 2011-08-18
PT2294200E (pt) 2015-06-26
CA2726743C (en) 2020-09-01
AU2009255796B2 (en) 2014-09-25
CN102124111B (zh) 2014-09-24
US20110179528A1 (en) 2011-07-21
PL2294200T3 (pl) 2015-08-31
MA32451B1 (fr) 2011-07-03
WO2009148336A1 (en) 2009-12-10
AU2009255796A1 (en) 2009-12-10
EP2294200A1 (en) 2011-03-16
JP5774478B2 (ja) 2015-09-09
US9051380B2 (en) 2015-06-09
ES2537342T3 (es) 2015-06-05
MX2010013413A (es) 2011-05-25
UY31875A (es) 2010-01-29
CA2726743A1 (en) 2009-12-10
CN102124111A (zh) 2011-07-13
AR072022A1 (es) 2010-07-28
ZA201100093B (en) 2011-11-30
EP2294200B1 (en) 2015-03-04
EP2294200A4 (en) 2012-01-04

Similar Documents

Publication Publication Date Title
EP2294200B1 (en) Novel genes involved in biosynthesis
US20170240913A1 (en) Methods and Materials for Producing Coreless Fruit
US20090089892A1 (en) Generation of plants with improved pathogen resistance
EP3390641B1 (en) Compositions and methods for manipulating the development of plants
KR101855136B1 (ko) 식물의 생산성 증대 기능, 노화 지연 기능 및 스트레스 내성 기능을 갖는 atpg7 단백질과 그 유전자 및 이들의 용도
US20160138034A1 (en) Novel Genes Involved In Biosynthesis
US7968768B2 (en) Generation of plants with improved drought tolerance
KR20140135719A (ko) 종자 활력의 조절
WO2005002325A2 (en) Generation of plants with improved drought tolerance
KR20130046180A (ko) 식물의 생산성 증대 기능, 노화 지연 기능 및 스트레스 내성 기능을 갖는 atpg4 단백질과 그 유전자 및 이들의 용도
KR101855137B1 (ko) 식물의 생산성 증대 기능, 노화 지연 기능 및 스트레스 내성 기능을 갖는 atpg8 단백질과 그 유전자 및 이들의 용도
KR20180038717A (ko) 식물의 생산성 증대 기능과 노화 지연 기능을 갖는 MtATPG1 단백질과 그 유전자 및 이들의 용도
WO2015150412A1 (en) Transgenic plants with increased number of fruits and seeds and method for obtaining thereof
KR20150003099A (ko) 식물의 생산성 증대 기능, 스트레스 내성 기능 및 노화 지연 기능을 갖는 atpg6 단백질과 그 유전자 및 이들의 용도
CN112501184B (zh) 大豆的GmMT1基因和含有GmMT1基因的载体及其制备方法与应用
KR101825219B1 (ko) 담배 유래의 탈메틸화 관련 NtROS2a 유전자 및 이의 용도
WO2011053167A1 (en) Transcription factor polynucleotides and their use
KR20040106810A (ko) 식물의 노화 조절에 관여하는 사이토키닌 수용체 ahk3,이의 변이체 및 이들을 이용하여 식물의 노화를지연시키는 방법
KR101592863B1 (ko) 왜성 표현형을 나타내는 D-h 유전자 및 이의 용도
WO2005011366A1 (en) Polynucleotides, polypeptides and their use in the production of plants with altered condensed tannins
KR20110111023A (ko) 식물의 수명 연장 기능 및 스트레스 내성 기능을 가지는 gsdl2 단백질, 그 유전자 및 이들의 용도
KR20120114613A (ko) 유전자 조작에 의한 동해 내성 식물체의 제조방법

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid