KR20230085165A - 단위결과성 수박 식물 - Google Patents

단위결과성 수박 식물 Download PDF

Info

Publication number
KR20230085165A
KR20230085165A KR1020237015642A KR20237015642A KR20230085165A KR 20230085165 A KR20230085165 A KR 20230085165A KR 1020237015642 A KR1020237015642 A KR 1020237015642A KR 20237015642 A KR20237015642 A KR 20237015642A KR 20230085165 A KR20230085165 A KR 20230085165A
Authority
KR
South Korea
Prior art keywords
plant
allele
seq
protein
mutant
Prior art date
Application number
KR1020237015642A
Other languages
English (en)
Inventor
다니엘 푸글리시
알베르토 시리조티
코트니 휴
모나 마자헤리
Original Assignee
넌헴스 비.브이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 넌헴스 비.브이. filed Critical 넌헴스 비.브이.
Publication of KR20230085165A publication Critical patent/KR20230085165A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/34Cucurbitaceae, e.g. bitter melon, cucumber or watermelon 
    • A01H6/342Citrullus lanatus [watermelon]
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/12Processes for modifying agronomic input traits, e.g. crop yield
    • A01H1/121Plant growth habits
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/08Fruits
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Organic Chemistry (AREA)
  • Physiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Pretreatment Of Seeds And Plants (AREA)
  • Cultivation Of Plants (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 씨없는 과실을 생산하는 수박, 오이 또는 멜론 식물에 관한 것이다. 본 발명은 또한 상기 식물을 생산하는 방법 및 씨없는 수박, 오이 또는 멜론 과실을 생산하는 방법을 포함한다.

Description

단위결과성 수박 식물
본 발명은 WAP5.1로 지칭되는 열성 유전자의 돌연변이체 대립유전자의 존재로 인해 암꽃의 수분 없이 씨없는 과실을 생산하는 단위결과성 수박 식물에 관한 것이다. 돌연변이체 대립유전자가 동형접합 형태인 경우, 수분되지 않은 꽃은 씨없는 과실을 생산한다. 그러나, 꽃이 수분되는 경우, 정상적인 씨있는 과실이 생산된다. 이 형질은 통성 단위결과로 지칭된다. 본 발명은 또한 상기 식물을 생산하는 방법 및 씨없는 수박 과실의 생산을 위한 wap5.1로 지칭되는 돌연변이체 대립유전자의 용도를 포함한다.
대부분의 상업용 씨없는 과실은 정상적으로 과실이 과실의 과육 전체에 걸쳐 분포된 상대적으로 크고 단단한 수많은 종자를 함유하는 식물로부터 개발되었다. 씨없는 과실은 예를 들어 수박, 토마토, 오이, 가지, 포도, 바나나, 감귤류의 과실, 예컨대 오렌지, 레몬 및 라임에 대해 공지되어 있다. 씨없는 과실은 일반적으로 더 쉽고 더 편리하게 소비되기 때문에 가치있는 것으로 간주된다.
과실 발달은 정상적으로 꽃의 배주 구획에 있는 하나 이상의 난세포가 화분으로부터의 웅핵에 의해 수정될 때 시작된다.
씨없는 과실은 두 가지 상이한 현상으로 인해 발생할 수 있다. 일부 경우에 화분에 의한 배주의 수정 없이 과실이 발달하는데, 이는 단위결과로 공지된 현상이다. 다른 경우에 씨없는 과실은 수분 후에 종자 (배아 및/또는 내배유) 성장이 억제되거나 종자가 일찍 사멸하지만 과실의 나머지는 계속 성장할 때 발생한다 (위단위결과). 단위결과와는 대조적으로, 위단위결과는 과실 성장의 개시를 위해 수분을 필요로 한다.
씨없는 오렌지 과실은 단위결과의 예이다. 일부 오렌지 품종 (예를 들어, 네이블(Navel))은 생존가능한 화분을 생산하지 않는다. 그러나, 이들은 다른 품종으로부터의 화분과 교차-수분될 수 있다. 과수원에서 웅성 불임 품종만이 성장될 경우, 수분이 없고 단위결과성 씨없는 과실이 생산될 것이다. 각각의 오렌지 나무의 번식은 일반적으로 삽목 후 또 다른 근경에 접목하여 수행된다.
씨없는 바나나는 3배체이다. 일부 경우에 수분이 정상일 수 있지만, 대부분의 과실에는 씨가 없다. 이는 염색체의 고르지 않은 세트 (3x)로 인해 감수분열 동안 염색체의 부적절한 분열로 이어지고 그 결과, 생존불가능한 화분이 생산되는 것으로 설명된다. 수정 없이, 3배체 바나나는 또한 씨없는 과실을 결실하고 발달시킬 수 있다. 수분이 일어나는 경우에도, 300개의 과실 중 최대 1개가 몇 개의 종자를 포함한다. 이는 설명된 이유 때문에 3배체 화분이 비생존가능하기 때문일 수 있다. 따라서, 바나나 식물은 일반적으로 단위결과성인 것으로 볼 수 있다. 바나나 식물은 일반적으로 주 줄기의 바닥에 있는 측면 새싹 또는 흡지로부터 무성 번식되며, 이는 제거되고 재배종을 계속하기 위해 재식될 수 있다. 재배자들은 또한 특히 무병 물질을 생산하기 위해 조직 배양에 의해 바나나를 번식시킨다.
씨없는 오이, 씨없는 호박 및 씨없는 가지는 예를 들어 수분이 손상된 조건 (예를 들어, 낮은 온도) 하에 수분 없이 씨없는 과실을 생산할 수 있는 작물의 예이다 (단위결과). 그럼에도 불구하고, 상업용 품질 과실이 이들 조건 하에 생산될 수 있다. 그러나 이들 모든 작물은 수분 시 종자 보유 과실을 생산할 수 있다. 따라서, 이들 작물은 통성 단위결과성이다. 작물의 번식은 자가- 또는 타가 수분, 시험관내 번식, 및 접목에 의해 수행될 수 있다.
토마토 돌연변이체로부터, 정상적인 수분/수정이 손상된 조건 하에 (예를 들어, 낮은 온도의 환경 하에) 씨없는 과실을 생산할 수 있는 것이 또한 공지되어 있다. 그러므로, 이들 돌연변이체는 또한 통성 단위결과성이다. 이 표현형을 나타내는 것으로 공지된 돌연변이체는 pat, pat-2 및 pat-3/pat-4 시스템이다. 이들 돌연변이의 기저에 있는 유전자는 공지되어 있지 않으며, pat-3/pat-4 시스템은 다중 로커스에 의존하는 것으로 보인다.
단위결과는 또한 유전자 변형에 의해 여러 식물 종에 도입되었다. 배주 및 태반 특이적 DefH9 프로모터의 제어 하에 옥신 합성을 부여하는 박테리아 트립토판 모노옥시게나제 (iaaM)의 발현은 오이 (Yin et al., 2006, Clular & molecular Biotech. Letters 11, 279-290), 가지 (Acciarri et al., 2002, BMC Biotech. 2(4)), 토마토 (Rotino et al., 2005, BMC Biotech. 5(32)) 및 담배에서 단위결과를 유도하였다.
이들 트랜스제닉 식물은 종자 및 과실 발달에서 식물 호르몬의 중요성을 입증한다. 종자 및 과실 발달이 다른 인자 외에 여러 식물 호르몬의 강력한 제어 하에 있다는 것은 관련 기술분야에 널리 공지되어 있다. 과실의 씨없음의 논리적 결과를 포함하여 단위결과가 또한 예를 들어 식물 호르몬, 특히 옥신 또는 지베렐린의 외인성 적용에 의해 유도될 수 있다 (Ruan et al., Trends in Plant Sci. 17(11), 1360-1385).
현재 육종가에 의해 생산되는 씨없는 수박은 위단위결과성 작물의 예이다. 정상적인 수박 식물은 2배체 (2n)이다. 씨없는 과실 생산 수박은 웅성 2배체 (2n) 수박 식물과 자성 4배체 (4n) 수박 식물의 교배에 의해 생산된 하이브리드이다. 생성된 F1 하이브리드 종자는 3배체 (3n)이다. 3배체 F1 하이브리드 식물의 과실 결실의 유도는 수분을 필요로 한다. 3배체 (3n) F1 하이브리드 식물은 가임성 화분을 생산하지 않기 때문에, 소위 화분매개자 또는 수분수 식물은 동일한 밭에 식재되어야 한다. 화분매개자 식물은 2배체 (2n)이다. 일반적으로 모든 F1 하이브리드 식물을 수분하기 위한 충분한 화분을 제공하기 위해 주어진 체계에서 대략 1 대 3의 화분매개자 대 하이브리드 식물의 비율이 식재되어야 한다. 2배체 (2n) 화분매개자 및 자성 3배체 (3n) 하이브리드 식물의 꽃 사이의 교차-수분은 과실 결실을 유도하고 3배체 하이브리드 식물에서 씨없는 3배체 과실의 생산을 유발한다. F1 하이브리드의 2배체 (2n) 및 4배체 (4n) 부모는 각각 종자 보유 과실을 생산하며 둘 다 자가-수분에 의해 서로 독립적으로 번식될 수 있다.
씨없는 포도는 단위결과 또는 위단위결과인 식물로부터 생산될 수 있다. 품종 블랙 코린트(Black Corinth)는 단위결과인 반면, 술타니나(Sultanina)는 위단위결과이다. 포도나무 식물은 일반적으로 삽목 및 또 다른 근경에의 연속적인 접목에 의해 번식된다.
감수분열의 불규칙성은 식물이 씨없는 과실을 생산하도록 유발하는 인자가 될 수 있다. 씨없는 과실을 생산하는 식물의 예는 씨없는 수박을 개시하는 문헌 [Zhang et al. (2012, Scientia Horticulture 140, 107-114)]에 제공된다. 종자에 감마선을 조사한 후 F1-하이브리드의 자손으로부터 웅성 및 자성 불임 (MFS) 돌연변이체를 수득하였다. MFS 돌연변이체로부터의 화분은 전혀 생존가능하지 않았다. 웅성 가임성 식물로부터의 화분으로 수분될 때 MFS 식물에 의해 씨없는 과실이 생산된다. 따라서 MFS 수박 식물은 위단위결과성으로 분류될 수 있다. 상이한 웅성 가임성 식물로부터의 화분과 MFS 돌연변이체의 교차-수분 시 거의 종자가 생산되지 않았기 때문에 배주는 또한 거의 완전히 생존불가능하였다. MFS 돌연변이체에서 불완전한 시냅시스 및 감수분열 동안 염색분체의 비정상적인 분리가 관찰되었으며, 이는 웅성 및 자성 불임의 원인으로 여겨졌다. MFS 돌연변이체에 존재하는 효과를 담당하는 유전자는 식별되지 않았지만, MFS 돌연변이체의 표현형은 단일 열성 유전자로 인한 것으로 보인다.
상기 논의로부터, 식물이 씨없는 과실을 생산하는지 여부를 결정하는 인자는 본질적으로 여러 가지이며 여러 원인, 예를 들어 형태학적, 생리학적 및/또는 유전적 원인으로 존재할 수 있음이 분명하다.
위단위결과성 작물, 예컨대 3배체 (3n) 수박 식물에서 씨없는 과실을 생산하기 위해, 식물의 암꽃 부분이 수분되어야 한다. 오늘날 성장되는 위단위결과성 작물은 웅성 불임이다. 그 결과, 자성 식물 외에, 상이한 웅성 가임성 식물 (화분매개자 또는 수분수)은 또한 동일한 밭에서 성장되어야 한다. 화분매개자 식물에 사용되는 면적은 씨없는 과실 생산 자성 식물에 이용가능한 면적을 희생하기 때문에, 재배 하에 면적당 수확량이 감소된다. 일반적으로, 화분매개자 식물은 또한 자가-수분될 수 있는 정상적인 식물이다. 그러나 화분매개자 식물에 의해 생산된 과실은 종자를 생산한다. 수박에서, 화분매개자 식물은 정상적으로 2배체 (2n)이며, 이는 자가-수분 시 씨있는 과실을 생산하고, 이는 일부 예에서 또한 수확되고 별도로 판매될 수 있다 (WO2012069539 참조). 상업적인 이유로 화분매개자 식물로부터의 이들 씨있는 과실은 씨없는 과실과 혼합되어서는 안된다. 따라서, 씨없는 과실 및 씨있는 과실은 수확 시 또는 수확 후에 분리되도록 보장되어야 하며, 이는 기계 수확을 어렵거나 불가능하게 하거나 수확 후 추가 가공 단계를 필요로 할 수 있다. 이러한 추가 예방조치는 씨없는 과실 생산의 투입 비용을 증가시킨다. 또한, 화분매개자 식물은 개화하고 충분한 생존가능한 화분을 생산함과 동시에 자성 식물 꽃 및 이의 암술머리가 과실 결실의 유도를 위해 화분을 받아들일 수 있도록 개발된다. 그러므로, 화분매개자 식물은 개화 및 수정 시기와 관련하여 씨없는 과실을 생산하는 자성 식물과 맞아야 한다. 화분매개자 식물 및 각 자성 식물의 개화 시기가 충분히 동기화되지 않으면, 수분이 일어나지 않거나 불충분한 경우에만 일어난다. 그 결과, 위단위결과성 자성 식물에 의해 더 적은 과실이 생산된다. 또한, 비, 열 등과 같은 기후 조건이 유전자형 상이한 자성 식물의 암술머리 가임성 시기와는 상이하게 수분수 식물의 화분 생산에 영향을 미칠 수 있다는 것은 관련 기술분야에 널리 공지되어 있다. 따라서, 기후 조건은 또한 수확량을 낮추는 효과와 함께 화분매개자 및 자성 식물의 가임성 시기의 비동기성을 유발할 수 있다.
본 발명자들은 본원에서 WAP5.1 유전자로 지칭되는 재배 수박에서 단일 열성 유전자를 돌연변이시키는 것이 꽃이 수분되지 않을 때 수박 식물이 씨없는 과실을 발달시키는 것, 즉 단위결과를 초래한다는 것을 발견하였다. 꽃이 수분되면, 발달하는 과실은 정상적인 생존가능한 종자를 생산한다. 따라서, 이러한 유형의 단위결과는 수분의 부재 하에서만 볼 수 있으므로 통성 단위결과로 지칭된다. 따라서, WAP5.1 유전자는 수박에서 통성 단위결과를 담당한다. 그러므로, 돌연변이체 wap5.1 대립유전자가 본원에서 wap5.1/wap5.1로 표시되는 2배체 수박 식물에서 동형접합 형태로 존재하는 경우, 식물은 통성 단위결과성이고 비수분된 꽃으로부터 씨없는 과실 및 수분된 꽃으로부터 정상적인 씨있는 과실을 생산한다.
이 유전자는 2배체 수박에서 큰 장점을 가지며, 특히 암꽃의 수분의 부재를 보장하기 위해 웅성 불임 (MS)과 조합된 경우 (식물에서 생산된 수꽃이 불임이기 때문에) 또는 수분이 발생하는 경우, 식물의 emb1 돌연변이체의 동형접합성 존재로 인해 과실에 씨가 없는 것을 보장하기 위해 emb1 돌연변이체 (예를 들어, 동형접합 형태, emb1/emb1)와 조합된 경우에 그러하다. emb1 돌연변이체는 수분 시 씨없는 과실이 생산되도록 초래하는 위단위결과 돌연변이체이다. emb1 돌연변이체 대립유전자를 포함하는 종자는 수탁 번호 NCIMB42532로 2016년 1월 27일에 넌헴스 비.브이.(Nunhems B.V.)에 의해 기탁되었다.
WAP5.1 유전자는 또한 예를 들어 돌연변이체 대립유전자의 2 또는 3개 카피를 갖는 3배체 수박에서 큰 장점을 가지며, 이는 더 이상 이러한 3배체 수박 식물을 수분자 식물 (이는 정상적으로 야생형 WAP5.1 대립유전자의 3개 카피를 갖는 정상적인 3배체에서 과실 결실을 유도하는데 필요함)로 내식할 필요가 없기 때문이다. 이들 단위결과성 3배체 식물은 과실 결실을 유도하기 위해 수분의 필요 없이 씨없는 과실을 생산한다. 따라서, 기본적으로 정상적인 3배체 수박의 위단위결과성 성질이 단위결과로 변화된다. 씨없는 3배체 과실의 수확량은 이에 의해 크게 증가되며, 이는 수분자 식물이 밭에서 더 이상 필요하지 않고 전체 밭이 3배체 수박 식물을 포함할 수 있기 때문이다.
수분이 발생할 수 없도록 곤충-방지 온실에서 성장된 돌연변이유발된 M2 2배체 수박 식물의 집단에서, 비수분된 암꽃으로부터 씨없는 과실을 생산하는 식물 (도 1 참조)이 20,000개 초과의 식물을 스크리닝할 때 관찰되었다. 과실은 공지된 3배체 씨없는 과실에서 볼 수 있는 것과 유사한 모계 기원의 외피의 일부 흔적만을 함유하였다. 유전자 분석은 해당 형질이 단일 열성 유전자로서 격리되었음을 나타내었다. 유전자는 WAP5.1로 지정되었고, 돌연변이체 대립유전자는 wap5.1로 지정되었다.
단일 식물 계통과 상이한 유전적 배경을 갖는 여러 F2 맵핑 집단이 생성되었으며, 이는 단위결과성 과실을 생산할 수 있었다. 2개의 상이한 배경으로부터 유래된 2개의 F2 집단을 표현형분석하고 유전자형분석하였다. QTL은 염색체 5 상의 0.47 Mb 영역에 맵핑되었으며, 이는 2개의 돌연변이를 함유하였으며, 그 중 하나는 유전자간 영역에 있고 또 다른 하나는 유전자에 있으며, 고도로 보존된 아미노산을 류신에서 페닐알라닌 (L528F)으로 변화시킨다. 도 2는 각각 서열식별번호(SEQ ID NO): 1 및 서열식별번호: 4의 야생형 및 돌연변이체 WAP5.1 단백질의 아미노산 서열을 보여준다. 실선 박스는 고도로 보존된 F-박스 도메인을 보여주고, 파선 박스는 고도로 보존된 LRR 도메인 (류신 풍부 반복 도메인)을 보여준다. 도 3a는 야생형 WAP5.1 단백질의 3차원 구조를 보여주며, 단백질의 C-말단에 있는 LRR-도메인의 고도로 정렬된 구조를 보여준다. F-박스는 단백질의 N-말단에 있고, F-박스 다음 단백질의 나머지 부분 (즉, LRR-도메인)은 나선, 베타-브릿지 및 코일에 의해 일종의 꼬리 구조로 폴딩된다. 돌연변이체 wap5.1 단백질에서 페닐알라닌 (즉, L528F 돌연변이)에 의해 대체된 것으로 밝혀진 아미노산 류신 L528의 위치는 도 3a에 표시되어 있으며, LRR-도메인의 코일 영역의 일부이다. 도 3b는 L528F 돌연변이체의 3차원 구조를 보여주며, 여기서 LRR-도메인은 꼬리 구조로 적절하게 폴딩하지 않고 아미노산의 전체 스트레치 (예를 들어 Q581 포함)는 루프에서 튀어나온 것으로 보인다. 적절한 폴딩 (3-D 구조)을 갖지 않는 돌연변이체 단백질은 생체내에서 전혀 기능을 하지 않거나 야생형 단백질과 비교하여 손상된 생체내 기능을 가지며, 이에 의해 돌연변이체가 동형접합 형태일 때 (통성) 단위결과의 표현형을 유발하는 것으로 생각된다.
수박의 게놈에서, 야생형 유전자는 염색체 5에서 발견되며, 예를 들어 cucurbitgenomics.org에서 발견된 찰스턴 그레이 V2 게놈에서 발견되고, WAP5.1 유전자는 ClCG05G015740.1로 라벨링되고 뉴클레오티드 27630305에서 시작하여 뉴클레오티드 27637763에서 끝나는 플러스 가닥에서 발견된다. "F-박스/LRR 반복부" 단백질을 코딩한다고 하지만, 생체내 기능 또는 표현형은 공지되어 있지 않다. 돌연변이체가 생성된 수박 계통 (TY-계통으로 지칭됨)에 찰스턴 그레이 V2 게놈의 야생형 WAP5.1 단백질과 상이한 단일 아미노산이 존재한다. 이 단일 아미노산은 아미노산 번호 51이며, 이는 찰스턴 그레이(Charleston Grey) 게놈의 유전자에 의해 코딩된 WAP5.1 단백질의 글리신 (G)이지만, TY-계통에 의해 코딩된 단백질의 아르기닌 (R)이다. 따라서 야생형 WAP5.1 단백질은 예를 들어 서열식별번호: 1 (G51) 또는 서열식별번호: 9 (R51)의 서열을 갖는다. 본원에서 수박의 야생형 WAP5.1 단백질 (또는 야생형 WAP5.1 단백질을 코딩하는 유전자)을 언급할 때, 따라서, 한 측면에서 서열식별번호: 1의 단백질 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질이 언급된다. R51이 또한 다른 수박, 예컨대 품종 97103 (V2, cucurbitgenomics.org)에서 발견된다. 이 게놈에서 유전자는 Cla97C05G096710이라고 불리며, 뉴클레오티드 위치 25813434 내지 25820323 (+ 가닥)에 있는 염색체 5에 위치된다. 이 유전자에 의해 코딩된 야생형 WAP5.1 단백질은 서열식별번호: 9의 TY-계통의 야생형 단백질과 100% 동일하다.
도 4에 나타낸 바와 같이 오이 및 멜론에 대한 공개 데이터베이스로부터 오르토로거스 단백질이 수득되었다 (본원에서 서열식별번호: 2는 오이 WAP5.1 오르토로그이고, 서열식별번호: 3은 멜론 WAP5.1 오르토로그임). 도 4에서 볼 수 있는 것은 F-박스 도메인 및 LRR-도메인이 둘 다 이들 3개의 단백질 사이에서 고도로 보존되어 있고, F-박스 앞의 N-말단 아미노산 서열이 더 가변적 (즉 덜 보존됨)이라는 것이다. F-박스 도메인은 수박, 멜론 및 오이 WAP5.1 단백질 간에 100% 동일하고 (도 4 참조), LRR-도메인은 수박 및 오이 간에 96.2%, 수박 및 멜론 간에 98%, 및 오이 및 멜론 간에 97.8% 동일하다 (엠보스-니들(Emboss-Needle)을 사용한 쌍별 정렬에서). 이는 공지된 F-박스/LRR 도메인 단백질에 대한 연구와 일치하며, 예를 들어 식물의 F-박스 단백질에 대한 검토 (Xu et al. 2009, PNAS vol. 106, no. 3, pp 835-840) 및 아라비돕시스(Arabidopsis) SLOMO F-박스/LRR 단백질에 대한 연구 (Lohmann et al., 2010, The Plant Cell, Vol. 22: 335-348)를 참조한다. 흥미롭게도, 로만(Lohmann) 등은 3개의 상이한 SLOMO 돌연변이체, slomo-1, slomo-2 및 slomo-3을 비교하였으며, 여기서 slomo-1은 LRR-도메인에 단일 아미노산 치환을 가졌고, slomo-2는 LRR-도메인 앞에 조기 정지-코돈을 가졌고, slomo-3은 제1 인트론에 T-DNA 삽입을 가졌으며, 단백질 생산을 방지한다 (예를 들어 보충 도 2 A 참조). 3개의 돌연변이체 모두는 기능 상실을 갖는 것으로 기재되어 있지만, LRR-도메인의 단일 아미노산 치환이 가장 강한 표현형을 갖는다는 점이 또한 언급되어 있다. 그러므로, 단일 아미노산 대체는 돌연변이체 단백질로 이어져, 기능 상실 또는 표현형이 강하게 발현되는 이러한 감소된 기능을 초래할 수 있으며, 이는 아마도 LRR-도메인의 3차원 구조 (예컨대 올바른 폴딩 및/또는 다른 단백질 또는 기질과의 상호작용)가 영향을 받기 때문일 것이다.
WAP5.1 단백질에 돌연변이를 함유하는 추가 수박 식물이 TILLING 집단에서 생성되고 식별되었으며, 돌연변이체 대립유전자가 동형접합 형태인 경우에 이들 각각이 또한 수박에 통성 단위결과를 부여하는지 여부가 확인될 것이다. L528F 돌연변이체의 잘못된 단백질 폴딩이 표현형의 원인이 되는 것으로 보이기 때문에, 잘못된 단백질 폴딩 또는 기질 또는 다른 단백질과의 잘못된 상호작용을 유발하는 임의의 돌연변이가 단백질의 감소된 기능 또는 기능 상실, 및 이에 의해 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 유발할 것이라고 가정하는 것이 합리적이다. 명백히, 또한 예를 들어 LRR 도메인의 전부 또는 일부의 말단절단을 유발하는 돌연변이는 단백질의 감소된 기능 또는 기능 상실, 및 이에 의해 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 유발할 것이다. 유사하게, 단백질의 조절 영역, 예컨대 프로모터 또는 인핸서에 하나 이상의 돌연변이를 포함하는 돌연변이체 wap5.1 대립유전자는 감소된 활성 야생형 단백질이 생성되거나 생성되지 않도록 초래하며, 이에 의해 동일하게 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 초래할 것으로 예상된다.
현재까지 수박에서 표 1에 나타낸 바와 같이 총 9개의 돌연변이체 대립유전자가 식별되었다. 생성된 돌연변이체 단백질이 야생형 WAP5.1 단백질과 비교하여 변화된 3차원 구조를 갖는 것으로 예측되는지 여부는 RaptorX 접촉 예측 (본원에서 RaptorX 구조 예측으로도 지칭됨)을 사용하여 추정되었다.
표 1
Figure pct00001
Figure pct00002
언급된 바와 같이, 적어도 야생형 단백질과 비교하여 고도로 보존된 F-박스 또는 LRR-도메인에 아미노산 치환을 갖거나, 또는 F-박스 또는 LRR-도메인의 전부 또는 일부의 부재를 초래하는 조기 정지 코돈을 갖고/거나, 및/또는 야생형 WAP5.1 단백질과 비교하여 변형된 3차원 구조/잘못된 3차원 폴딩을 보여줄 것으로 예측되는 돌연변이체 단백질은 돌연변이체 대립유전자가 동형접합 형태인 경우에 표현형을 보여줄 것이며 (즉, 식물은 통성 단위결과를 보여줄 것임), 즉 돌연변이체 대립유전자가 동형접합 형태인 경우, 예를 들어 2배체 식물에 있는 경우에 수분 없이 씨없는 과실 및 수분될 때 씨있는 과실을 생산할 것으로 예상된다. 이것이 사실인지 여부는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물을 생성하고, 이를 수분의 부재 하에 성장시키고, 이들 환경 하에 씨없는 과실을 생산하는지 여부 및 수분될 때 씨있는 과실을 생산하는지 여부를 분석함으로써 테스트될 수 있다. 분명히, 다른 돌연변이체 wap5.1 대립유전자는 수박, 오이 또는 멜론 WAP5.1 유전자에서 예를 들어 무작위 돌연변이유발 또는 표적화된 돌연변이유발에 의해 생성될 수 있다.
상기 돌연변이체, 또는 식물의 내인성 WAP5.1 유전자의 다른 돌연변이체는 예를 들어 무작위 돌연변이유발 또는 표적화된 돌연변이유발, 예컨대 CRISPR-기반 방법에 의해 생성될 수 있다. 표적화된 유전자 편집의 검토는 예를 들어 문헌 [Erpen-Dalla Corte et al. in Plants 2019, 8, 601 (doi:10.3390/plants8120601)] 및 [Bed Prakash Bhatta and Subas Malla in Plants 2020, 9, 1360; doi:10.3390/plants9101360]에 제공된다. Crispr-기반 편집은 또한 수박 및 다른 호로과 작물에서 이미 수행되었으며, 그러므로 수박, 멜론 또는 오이, 또는 오르토로거스 유전자를 포함하는 기타 호로과 종의 내인성 WAP5.1 유전자를 편집하기 위해 통상의 기술자에 의해 사용될 수 있다.
보존된 F-박스 도메인 및/또는 LRR-도메인 (또는 단백질의 다른 부분)에서의 돌연변이와 관련하여, 한 측면에서 특히 아미노산 대체를 유발하는 돌연변이 (여기서 야생형 아미노산 및 대체된 아미노산의 특성은 상이함)는 본원의 한 측면이며, 이와 같이 상이한 아미노산 특성은 단백질 또는 도메인의 적절한 폴딩 및/또는 정상적인 기능을 감소 또는 폐지할 것이다. 따라서, 예를 들어 비극성 아미노산을 극성 아미노산 (친수성 측쇄 포함)으로 대체하는 것 (또는 그 반대도 마찬가지임), 또는 하전된 측쇄를 갖는 아미노산을 비하전된 또는 상이하게 하전된 측쇄를 갖는 아미노산으로 대체하는 것. 비극성 아미노산은 알라닌 (A 또는 Ala), 시스테인 (C 또는 Cys), 글리신 (G 또는 Gly), 이소류신 (I 또는 Ile), 류신 (L 또는 Leu), 메티오닌 (M 또는 Met), 페닐알라닌 (F 또는 Phe), 프롤린 (P 또는 Pro), 트립토판 (W 또는 Trp), 발린 (V 또는 Val)이다. 극성 아미노산은 아르기닌 (R 또는 Arg), 아스파라긴 (N 또는 Asn), 아스파르테이트 (D 또는 Asp), 글루타메이트 (E 또는 Glu), 글루타민 (Q 또는 Gln), 히스티딘 (H 또는 His), 리신 (K 또는 Lys), 세린 (S 또는 Ser), 트레오닌 (T 또는 Thr), 티로신 (Y 또는 Tyr)이다.
그러므로, 한 측면에서 F-박스 도메인의 24개의 비극성 아미노산 중 임의의 하나 (또는 그 초과)는 극성 아미노산에 의해 대체되고/거나, F-박스 도메인의 17개의 극성 아미노산 중 임의의 하나 (또는 그 초과)는 비극성 아미노산에 의해 대체된다. 그 후, 생성된 돌연변이체 대립유전자는 돌연변이체 대립유전자에 대해 동형접합성인 식물을 생성하고 표현형을 분석함으로써 이의 기능에 대해 테스트될 수 있다. 돌연변이체 대립유전자가 식물이 통성 단위결과성이 되도록 초래하는 경우, 돌연변이체 대립유전자는 생체내에서 감소된 기능을 갖거나 기능을 갖지 않는 돌연변이체 wap5.1 단백질을 코딩하는 대립유전자이다.
한 측면에서 수박 WAP5.1 유전자는 WAP5.1 단백질을 코딩하는 유전자이며, 여기서 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함하는 단백질이다. 수박 WAP5.1 유전자는 시트룰루스 라나투스(Citrullus lanatus) WAP5.1의 경우에 ClWAP5.1로도 지칭될 수 있다. 서열식별번호: 1의 야생형 단백질은 예를 들어 찰스턴 그레이 게놈에서 발견되는 단백질이지만, 다른 재배 수박, 예컨대 본원에서 사용된 계통 TY 또는 동아시아 품종 97103 (이의 게놈은 또한 시퀀싱되었고 cucurbitgenomics.org에서 V1 및 V2로 제공됨)은 1 또는 2개의 아미노산의 작은 차이를 함유하며, 즉 단백질은 서열식별번호: 1과 99.9% 또는 99.8% 동일하다. 따라서, 다른 재배 수박은 서열식별번호: 1에 대해 적어도 94%, 95%, 96%, 97%, 98% 또는 99% 또는 99.5% 또는 99.8% 또는 99.9% 서열 동일성을 갖는 야생형 (기능적) WAP5.1 단백질을 코딩하는 WAP5.1 유전자를 함유한다. 예는 서열식별번호: 9의 단백질을 코딩하는 유전자이며, 이는 서열식별번호: 1의 단백질과 단일 아미노산 (아미노산 51)만이 상이하다. 그러므로 서열식별번호: 1 및 서열식별번호: 9는 아미노산 서열에서 99.9% 동일하고, 둘 다 기능적 (야생형) WAP5.1 단백질이다. 이들 야생형 단백질을 코딩하는 유전자를 포함하는 수박 식물은 단위결과성이 아니며, 즉 이들은 수분 후에만 과실을 생산한다.
또 다른 측면에서 오이 WAP5.1 유전자는 WAP5.1 단백질을 코딩하는 유전자이며, 여기서 WAP5.1 단백질은 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질이다. 오이 WAP5.1 유전자는 쿠쿠미스 사티부스(Cucumis sativus) WAP5.1의 경우에 CsWAP5.1로도 지칭될 수 있다.
또 다른 측면에서 멜론 WAP5.1 유전자는 WAP5.1 단백질을 코딩하는 유전자이며, 여기서 WAP5.1 단백질은 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질이다. 멜론 WAP5.1 유전자는 쿠쿠미스 멜로(Cucumis melo) WAP5.1의 경우에 CmWAP5.1로도 지칭될 수 있다.
본 발명의 한 측면에서 식물 또는 식물 세포가 상응하는 야생형 식물 세포와 비교하여 WAP5.1 단백질의 감소된 활성을 갖는 것을 특징으로 하는 식물 또는 식물 세포가 제공되며, 여기서 야생형 식물 세포의 WAP5.1 단백질은 하기로 이루어진 군으로부터 선택된 핵산 분자에 의해 코딩된다:
a) 서열식별번호: 1 또는 서열식별번호: 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)에 주어진 아미노산 서열을 갖는 단백질을 코딩하는 핵산 분자;
b) 서열식별번호: 1 또는 서열식별번호: 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)에 주어진 아미노산 서열과 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9%의 동일성을 갖는 서열을 갖는 단백질을 코딩하는 핵산 분자;
c) 서열식별번호: 1 또는 서열식별번호: 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)에 주어진 아미노산 서열과 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9%의 동일성을 갖는 서열을 갖는 단백질을 코딩하는 핵산 분자로서, 여기서 단백질은 F-박스 도메인의 아미노산 서열, 즉 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 237 내지 277 (아미노산 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL - 서열식별번호: 13)을 포함하고 LRR-도메인을 포함하며, 여기서 LRR-도메인은 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 291 내지 1033 (수박), 또는 서열식별번호: 2의 아미노산 298 내지 1040 (오이), 또는 아미노산 301 내지 1043 (멜론)의 영역인 핵산 분자.
WAP5.1 단백질의 감소된 활성은 돌연변이체 wap5.1 대립유전자에 의해 유발된다. 감소된 활성은 돌연변이체 wap5.1 대립유전자의 발현의 녹다운 또는 녹아웃 (예를 들어, 프로모터 또는 다른 조절 서열에서의 돌연변이를 통해) 또는 기능 상실 또는 감소된 기능 WAP5.1 단백질 (돌연변이체 WAP5.1 단백질)을 코딩하는 돌연변이체 wap5.1 대립유전자를 통해 유발될 수 있다.
한 측면에서 돌연변이체 wap5.1 대립유전자는 야생형 단백질과 비교하여 감소된 기능 또는 기능 상실을 갖는 돌연변이체 WAP5.1 단백질을 코딩하며, 예를 들어 돌연변이체 WAP5.1 단백질은 야생형 단백질과 비교하여 대체, 결실 또는 삽입된 하나 이상의 아미노산을 포함한다. 한 측면에서 돌연변이체 WAP5.1 단백질은 단백질의 보존된 "F-박스" 도메인 및/또는 단백질의 보존된 LRR-도메인에 대체, 결실 또는 삽입된 하나 이상의 아미노산을 포함한다. 바람직한 측면에서, 보존된 "F-박스 도메인" 및/또는 "LRR-도메인" 내의 적어도 하나의 아미노산은 또 다른 아미노산 또는 정지 코돈에 의해 대체되어, 대립유전자가 동형접합 형태인 경우에 (야생형 대립유전자가 2배체 식물 또는 식물 세포에 존재하지 않는 경우에) 통성 단위결과 및 기능 상실 또는 감소된 기능 단백질을 초래한다. 또 다른 측면에서 보존된 "F-박스 도메인" 및/또는 "LRR-도메인"의 하나 이상의 아미노산은 예를 들어 조기 정지 코돈을 유발하는 돌연변이를 통해 누락되어, 대립유전자가 동형접합 형태인 경우에 (야생형 대립유전자가 2배체 식물 또는 식물 세포에 존재하지 않는 경우에) 통성 단위결과 및 기능 상실 또는 감소된 기능 단백질을 초래한다.
한 측면에서 돌연변이체 wap5.1 대립유전자는 예를 들어 RaptorX 접촉 예측 도구를 사용하여 야생형 단백질 및 돌연변이체 단백질의 3차원 구조를 비교함으로써 볼 수 있는 바와 같이 야생형 WAP5.1 단백질과 비교하여 3차원 구조 / 단백질 폴딩과 비교하여 변형된 3차원 구조 / 단백질 폴딩을 갖는 돌연변이체 WAP5.1 단백질을 코딩한다. 특히 LRR-도메인의 적절한 폴딩에 영향을 미치는 아미노산 변화 (치환 또는 결실)을 쉽게 볼 수 있다. 야생형 LRR-도메인은 도 3a에 나타낸 바와 같이 긴 꼬리-유사 구조로 폴딩한다. 임의의 부적절한 폴딩은 예를 들어 도 3b에 나타낸 바와 같이 쉽게 가시적이 된다. 또한, 말단절단된 WAP5.1 단백질에서 LRR-도메인의 전부 또는 일부의 부재는 야생형 단백질과 비교하여 변형된 3차원 구조 / 단백질 폴딩을 갖는 단백질인 것으로 본원에 포함된다. LRR-도메인은 고도로 구조화되고 보존되어 있기 때문에, 이의 구조의 임의의 변화는 단백질의 기능 상실 또는 감소된 기능 및 이에 의해 2배체 식물에서 돌연변이체 대립유전자가 동형접합 형태인 경우에 생체내 표현형 (통성 단위결과)을 유발할 것으로 예측된다.
한 측면에서 돌연변이체 대립유전자는 돌연변이체 단백질을 코딩하며, 여기서 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 528, 266, 287, 257, 333, 274, 209, 308 또는 330, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산은 상이한 아미노산 또는 정지 코돈에 의해 결실 또는 대체된다. 동등한 아미노산은 예를 들어 서열식별번호: 1 또는 서열식별번호: 9와의 쌍별 정렬 (예를 들어, 프로그램 니들 사용)에 의해 식별될 수 있으며 (예를 들어 도 4 참조), 여기서 언급된 수박 아미노산 및 동등한 오이 및 멜론 아미노산은 굵게 표시되어 있다.
한 측면에서 수박 단백질의 L528 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 F에 의해 대체되고/거나, 수박 단백질의 A266 (또는 서열식별번호: 1에 대해 적어도 94% 또는 95% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 V에 의해 대체되고/거나, 수박 단백질의 E287 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 K에 의해 대체되고/거나, 수박 단백질의 A257 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 V에 의해 대체되고/거나, 수박 단백질의 Q333 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 정지 코돈에 의해 대체되고/거나, 수박 단백질의 W274 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)는 정지 코돈에 의해 대체되고/거나, 수박 단백질의 D209 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)는 V에 의해 대체되고/거나, 수박 단백질의 P308 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 L에 의해 대체되고/거나, 수박 단백질의 G330 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94% 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하는 서열 내의 동등한 아미노산, 또는 서열식별번호: 2 또는 3 내의 동등한 아미노산)은 E에 의해 대체된다.
WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 재배 수박, 오이 또는 멜론 식물 또는 식물 부분이 제공되며, 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여한다.
한 측면에서 유전자는 수박 게놈의 염색체 5에 위치되고, 특히 유전자는 예를 들어 찰스턴 그레이 염색체의 염색체 5의 염기쌍 27630305에서 시작하여 염기쌍 27637763에서 끝나는 영역, 또는 예를 들어 수박 97103 V2 염색체의 염색체 5의 염기쌍 25813434에서 시작하여 염기쌍 25820323에서 끝나는 영역에 위치된다.
한 실시양태에서 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물 또는 식물 부분은 2배체, 4배체, 3배체 또는 다배수체이다. 바람직하게는 돌연변이체 대립유전자는 2배체 식물 또는 식물 부분에 2개 카피로, 4배체 식물 또는 식물 부분에 4개 카피로 또는 3배체 식물 또는 식물 부분에 1, 2 또는 3개 카피로 존재한다.
임의로 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물 또는 식물 부분은 웅성 불임을 부여하는 유전자 또는 위단위결과를 부여하는 유전자, 예컨대 WO2017202715 및/또는 WO2019238832에 기재된 유전자를 추가로 포함한다.
임의로 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물 또는 식물 부분은 단위결과를 부여하는 유전자, 예를 들어 WO2018/060444에 기재된 유전자를 추가로 포함한다.
WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물 부분은 세포, 꽃, 잎, 줄기, 삽목, 배주, 화분, 뿌리, 근경, 접순, 과실, 원형질체, 배아, 꽃밥일 수 있다.
또한 WAP5.1 유전자의 적어도 하나의 돌연변이체 대립유전자를 포함하는 이러한 식물 부분으로부터 번식된 영양 번식 수박, 오이 또는 멜론 식물이 포함된다.
마찬가지로 본 발명의 식물이 성장될 수 있는 종자가 제공된다.
또한, 본 발명에 따른 식물에 의해 생산된 씨없는 과실이 제공된다.
씨없는 수박, 오이 또는 멜론 과실을 생산하는 방법이 제공되며, 상기 방법은 WAP5.1 유전자의 돌연변이체 대립유전자의 2개 카피를 포함하는 2배체 식물을 성장시키는 단계 및 상기 식물에 의해 생산된 과실을 수확하는 단계를 포함한다. 특히 과실은 암꽃의 수분 없이 발달하는 반면, 씨있는 과실은 꽃의 수분 시 생산된다.
씨없는 수박 과실을 생산하는 방법이 제공되며, 상기 방법은 WAP5.1 유전자의 돌연변이체 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 식물을 성장시키는 단계 및 상기 식물에 의해 생산된 과실을 수확하는 단계를 포함한다. 특히 과실은 암꽃의 수분 없이 발달하며, 즉 과실 발달을 유도하기 위해 화분이 필요하지 않다.
WAP5.1 유전자의 돌연변이체 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 수박 식물을, 특히 수분자 식물이 없는 밭에서 성장시키는 단계, 및 임의로 상기 식물로부터 씨없는 수박 과실을 수확하는 단계를 포함하는, 수박 식물을 성장시키는 방법이 제공된다.
하기 단계를 포함하는, 통성 단위결과성 재배 수박, 오이 또는 멜론 식물을 생산하는 방법이 제공된다:
a) 수박, 오이 또는 멜론 식물 집단에 돌연변이를 도입하거나; 또는 돌연변이체 식물 집단 (예를 들어, TILLING 집단, 예를 들어 M2, M3, M4 또는 추가 세대)을 제공하는 단계;
b) 암꽃의 수분 없이 씨없는 과실을 생산하고 암꽃의 수분 후 씨있는 과실을 생산하는 식물을 선택하는 단계;
c) 임의로 b)에서 선택된 식물이 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는지 확인하는 단계; 및
d) 임의로 c)에서 수득된 식물을 성장시키는 단계.
하기 단계를 포함하는, 통성 단위결과성 재배 수박, 오이 또는 멜론 식물을 생산하는 방법이 제공된다:
a) 수박, 오이 또는 멜론 식물에 돌연변이를 도입하거나; 또는 돌연변이체 식물 집단 (예를 들어, TILLING 집단, 예를 들어 M2, M3, M4 또는 추가 세대)을 제공하는 단계;
b) WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물을 선택하는 단계;
c) 임의로 WAP5.1 유전자의 돌연변이체 대립유전자에 대해 동형접합성인 식물을 생성하기 위해 선택된 식물을 자가생식하는 단계;
d) 임의로 식물을 성장시키는 단계.
상기 방법에 의해 생산된 수박, 오이 또는 멜론 식물 또는 과실이 본원에 포함된다.
바람직하게는 식물의 암꽃의 수분 없이 씨없는 수박, 오이 또는 멜론 과실을 생산하기 위한 통성 단위결과성 수박, 오이 또는 멜론 식물의 용도가 또한 본 발명의 한 측면이다.
통성 단위결과성 수박, 오이 또는 멜론 식물을 생산하기 위한 본원에 기재된 바와 같은 WAP5.1 유전자의 돌연변이체 wap5.1 대립유전자의 용도가 또한 본 발명의 한 측면이다.
하기 단계를 포함하는, 수분의 부재 하에 씨없는 과실 및 수분의 존재 하에 씨있는 과실을 생산하는 재배 수박, 오이 또는 멜론 식물을 생산하는 방법이 제공된다:
a) 하나 이상의 수박, 오이 또는 멜론 식물, 식물 부분 또는 종자에 무작위 또는 표적화된 돌연변이를 도입하거나; 또는 돌연변이체 식물 또는 종자 집단 (예를 들어, TILLING 집단, 예를 들어 M2, M3, M4 또는 추가 세대)를 제공하는 단계,
b) wap5.1 유전자의 돌연변이체 대립유전자, 예를 들어 유의하게 감소된 야생형 WAP5.1 단백질을 생산하거나 전혀 생산하지 않는 돌연변이체 대립유전자 (예를 들어, 녹아웃 대립유전자) 또는 야생형 단백질과 비교하여 결실, 대체, 삽입 또는 복제된 하나 이상의 아미노산을 포함하는 단백질을 코딩하는 돌연변이체 대립유전자를 포함하는 식물을 선택하는 단계,
c) 임의로 식물로부터 임의의 트랜스제닉 구축물 (예를 들어, CRISPR 구축물)을 제거하는 단계, 및/또는
d) 임의로 돌연변이체 대립유전자에 대해 동형접합성인 식물을 생성하고, 씨없는 과실이 수분의 부재 하에 발달하는지 및 씨있는 과실이 수분의 존재 하에 발달하는지 여부를 분석하는 단계.
하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분을 선택 또는 식별하는 방법이 제공된다:
a) 식물 또는 식물 부분의 게놈 DNA가 이들의 게놈에 돌연변이체 대립유전자를 포함하고/거나 WAP5.1 유전자의 야생형 대립유전자를 포함하는지 여부를 분석하는 단계, 및 임의로
b) 게놈에 wap5.1 유전자의 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 식물 또는 식물 부분을 선택하는 단계,
여기서 수박 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 오이 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 멜론 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩한다.
단계 a)는 예를 들어 PCR 기반 방법, 시퀀싱 기반 방법, 핵산 혼성화 기반 방법, 유전자 발현 수준 등을 사용하여 다양한 방식으로 수행될 수 있다. 한 측면에서 예를 들어 KASP 검정이 사용될 수 있다.
하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분의 게놈 DNA를 스크리닝하는 방법 (예를 들어, 유전자형분석)이 제공된다:
a) 수박, 멜론 또는 오이 식물 또는 복수의 식물 (예를 들어, F2 집단, 근친교배 계통, 역교배 집단, 육종 집단, 하이브리드 식물 등)의 게놈 DNA의 샘플 (또는 복수의 샘플)을 제공하는 단계,
b) 한 쌍의 PCR 프라이머 또는 올리고뉴클레오티드 프로브를 제공하는 단계로서, 상기 프라이머 또는 (올리고뉴클레오티드) 프로브는 수박, 오이 또는 멜론 WAP5.1 유전자의 게놈 WAP5.1 대립유전자의 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22개 또는 그 초과의 연속 뉴클레오티드를 포함하고, PCR 검정에서 게놈 대립유전자에 혼성화하고/거나 게놈 대립유전자의 일부를 증폭시킬 수 있는 것인 단계, 및
c) 단계 a)의 샘플(들)에 대해 프라이머 쌍을 사용하는 PCR 검정 또는 단계 b)의 프로브를 사용하는 혼성화 검정을 수행하는 단계, 및 임의로
d) 게놈에 수박, 오이 또는 멜론 WAP5.1 유전자의 대립유전자 (예를 들어, 야생형 대립유전자 및/또는 돌연변이체 대립유전자)의 1 또는 2개 카피를 포함하는 식물 또는 식물 부분 또는 종자를 선택하는 단계,
여기서 수박 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 오이 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 멜론 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩한다.
단계 b)에서 PCR 프라이머 쌍은 WAP5.1 대립유전자의 DNA 가닥 중 하나에 상보적인 적어도 하나의 정방향 프라이머, 및 WAP5.1 대립유전자의 다른 DNA 가닥에 상보적인 하나의 역방향 프라이머이며, 상기 프라이머 쌍은 PCR 반응에서 변성된 게놈 DNA에 혼성화하고 WAP5.1 대립유전자의 일부를 증폭시킨다. 프라이머는 프라이머 설계 도구를 사용하여 야생형 또는 임의의 돌연변이체 WAP5.1 대립유전자를 증폭시키도록 설계될 수 있다. 한 측면에서 2개의 정방향 프라이머가 사용되며, 하나는 야생형 대립유전자를 증폭시키도록 설계되고, 하나는 WAP5.1 유전자의 돌연변이체 대립유전자를 증폭시키도록 설계되고, 하나는 공통 역방향 프라이머이다. 이들 3개의 프라이머가 단계 a)의 샘플을 유전자형분석하기 위해 KASP-검정에서 사용될 수 있다. 그러므로, 한 측면에서 단계 c)의 검정은 KASP-검정이지만, 또한 다른 유전자형분석 검정, 예컨대 월드 와이드 웹 biosearchtech.com/sectors/agrigenomics/agrigenomics-pcr-qpcr-technologies에 기재된 검정이 사용될 수 있다.
한 측면에서 검정은 WAP5.1 유전자의 야생형 및 돌연변이체 대립유전자 사이, 예를 들어 야생형 WAP5.1 대립유전자 및 표 1의 돌연변이체 대립유전자 사이, 또는 또 다른 돌연변이체 대립유전자를 구별한다.
게놈 DNA를 분석하기 위해 적어도 조질 게놈 DNA 추출이 필요할 수 있다. 게놈 DNA 내의 돌연변이체 대립유전자 또는 야생형 대립유전자의 존재는 직접적으로 또는 간접적으로 검출될 수 있다. 예를 들어 직접적으로는 예를 들어 올리고뉴클레오티드 프로브의 핵산 혼성화에 의한 것일 수 있다. 예를 들어 간접적으로는 예를 들어 PCR 프라이머를 사용하는 핵산 증폭에 의한 것일 수 있으며, 이는 예를 들어 프라이머에 부착된 꼬리 서열을 포함하고, PCR 동안 대립유전자-특이적 프라이머는 주형 DNA에 결합하고 신장하여, 이에 의해 꼬리 서열을 새로 합성된 가닥에 부착하고 후속 PCR 라운드에서 FRET 카세트 (형광 공명 에너지 전달 카세트)는 꼬리에 결합하고 형광을 방출한다. 그 후 형광 신호가 검출될 수 있다. 이는 예를 들어 KASP-검정에서 사용된다.
돌연변이체 대립유전자는 다양한 측면에서, 예를 들어 프로모터 서열 또는 단백질 코딩 서열 또는 인트론/엑손 스플라이스 부위에서 야생형 대립유전자와 상이할 수 있다. 돌연변이체 대립유전자는 감소된 유전자 발현을 갖거나 유전자 발현을 갖지 않을 수 있거나, 야생형 단백질과 비교하여 결실, 대체, 또는 삽입 또는 복제된 하나 이상의 아미노산을 포함하는 단백질의 생산을 초래할 수 있다.
한 측면에서 돌연변이체 대립유전자는 표 1에 기재된 바와 같은 돌연변이체 단백질을 코딩하는 대립유전자이다.
한 측면에서 식물 또는 식물 부분은 수박이고, 돌연변이체 대립유전자는 서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩한다.
또한 이들의 게놈에 수박 WAP5.1 유전자, 또는 오이 WAP5.1 유전자 또는 멜론 WAP5.1 유전자의 적어도 하나의 돌연변이체 대립유전자를 포함하는 식물 또는 식물 부분을 생성 및/또는 선택하는 방법이 제공된다.
한 측면에서 또한 게놈에서 수박 WAP5.1 유전자, 또는 오이 WAP5.1 유전자 또는 멜론 WAP5.1 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 존재를 검출하는 방법이 제공된다.
한 측면에서, 수박 식물 또는 식물 부분 또는 종자가 예를 들어 서열식별번호: 1 또는 9의 단백질을 코딩하는 야생형 대립유전자의 적어도 하나의 카피를 포함하고/거나, 예를 들어 서열식별번호: 4 또는 10의 단백질을 코딩하는 돌연변이체 대립유전자의 적어도 하나의 카피, 또는 표 1에 나타낸 바와 같은 돌연변이체 단백질을 포함하는지 여부를 검출하고, 임의로 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 식물, 식물 부분 또는 종자를 선택하는 방법이 제공된다.
또한, 2개의 대립유전자 특이적 정방향 프라이머, 예를 들어 FAM 프라이머 및 VIC 프라이머 및 공통 역방향 프라이머를 포함하는 KASP-검정 (케이바이오사이언스(Kbioscience) 경쟁적 대립유전자 특이적 PCR-유전자형분석 검정)이 제공된다. 분명히, 야생형 대립유전자 및 예를 들어 야생형 단백질에 대해 대체, 복제, 결실 또는 삽입된 하나 이상의 아미노산을 포함하는 임의의 다른 돌연변이체 대립유전자를 검출 및/또는 구별하기 위해 다른 대립유전자 특이적 프라이머가 개발될 수 있다.
마찬가지로, (야생형 또는 돌연변이체) 게놈 서열, cDNA 또는 mRNA 서열, 단백질 서열의 단리된 서열 또는 분자, 뿐만 아니라 수박 WAP5.1 유전자, 또는 오이 WAP5.1 유전자 또는 멜론 WAP5.1 유전자의 야생형 또는 돌연변이체 대립유전자를 검출하기 위한 올리고뉴클레오티드 프라이머 또는 프로브가 본원에 포함된다.
또한, 하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분의 게놈 DNA (이의 일부)의 PCR 증폭 생성물 및/또는 올리고뉴클레오티드 혼성화 생성물을 생성하는 방법이 제공된다:
a) 수박, 멜론 또는 오이 식물 또는 복수의 식물 (예를 들어, F2 집단, 근친교배 계통, 역교배 집단, 육종 집단, 하이브리드 식물 등)의 게놈 DNA의 샘플 (또는 복수의 샘플)을 제공하는 단계,
b) 적어도 한 쌍의 PCR 프라이머 또는 적어도 하나의 올리고뉴클레오티드 프로브를 제공하는 단계로서, 상기 프라이머 또는 (올리고뉴클레오티드) 프로브는 수박, 오이 또는 멜론 WAP5.1 유전자의 게놈 WAP5.1 대립유전자의 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22개 또는 그 초과의 연속 뉴클레오티드를 포함하고, PCR 검정에서 게놈 대립유전자에 혼성화하고/거나 게놈 대립유전자의 일부를 증폭시킬 수 있는 것인 단계, 및
c) PCR 증폭 생성물 및/또는 올리고뉴클레오티드 혼성화 생성물을 생성하기 위해 단계 a)의 샘플(들)에 대해 프라이머 쌍을 사용하는 PCR 검정 또는 단계 b)의 프로브를 사용하는 혼성화 검정을 수행하는 단계, 및 임의로
d) 게놈에 WAP5.1 유전자의 대립유전자 (예를 들어, 야생형 대립유전자 및/또는 돌연변이체 대립유전자)의 1 또는 2개 카피를 포함하는 식물 또는 식물 부분 또는 종자를 선택하는 단계,
여기서 수박 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 오이 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 멜론 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩한다.
추가로, 하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분의 게놈 DNA (이의 일부)를 증폭 및/또는 혼성화하는 방법이 제공된다:
a) 수박, 멜론 또는 오이 식물 또는 복수의 식물 (예를 들어, F2 집단, 근친교배 계통, 역교배 집단, 육종 집단, 하이브리드 식물 등)의 게놈 DNA의 샘플 (또는 복수의 샘플)을 제공하는 단계,
b) 적어도 한 쌍의 PCR 프라이머 또는 적어도 하나의 올리고뉴클레오티드 프로브를 제공하는 단계로서, 상기 프라이머 또는 (올리고뉴클레오티드) 프로브는 수박, 오이 또는 멜론 WAP5.1 유전자의 게놈 WAP5.1 대립유전자의 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22개 또는 그 초과의 연속 뉴클레오티드를 포함하고, PCR 검정에서 게놈 대립유전자에 혼성화하고/거나 게놈 대립유전자의 일부를 증폭시킬 수 있는 것인 단계, 및
c) PCR 증폭 생성물 및/또는 올리고뉴클레오티드 혼성화 생성물을 생성하기 위해 단계 a)의 샘플(들)에 대해 프라이머 쌍을 사용하는 PCR 검정 또는 단계 b)의 프로브를 사용하는 혼성화 검정을 수행하는 단계, 및 임의로
d) 게놈에 수박, 오이 또는 멜론 WAP5.1 유전자의 대립유전자 (예를 들어, 야생형 대립유전자 및/또는 돌연변이체 대립유전자)의 1 또는 2개 카피를 포함하는 식물 또는 식물 부분 또는 종자를 선택하는 단계,
여기서 수박 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 오이 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩하고, 멜론 WAP5.1 유전자의 야생형 대립유전자는 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 동일성을 포함하는 야생형 단백질)을 코딩한다.
또한 WAP5.1 유전자의 게놈 DNA의 일부를 증폭 및/또는 혼성화하기 위한 프라이머 및/또는 프로브 및 반응 구성성분을 포함하는 유전자형분석 키트가 제공된다.
프라이머 및 프로브는 바람직하게는 증폭 또는 혼성화 반응 생성물을 검출할 수 있도록 예를 들어 꼬리 서열 또는 라벨에 의해 라벨링 또는 변형된다.
일반적인 정의
동사 "포함하다" 및 그 활용형은 이의 비제한적인 의미로 단어 뒤에 오는 항목이 포함되지만 구체적으로 언급되지 않은 항목은 배제되지 않는다는 의미로 사용된다. 또한, 단수형에 의한 요소에 대한 언급은 문맥상 요소 중 하나 및 오직 하나만이 존재함을 명백히 요구하지 않는 한, 하나 초과의 요소가 존재할 가능성을 배제하지 않는다. 그러므로 단수형은 대개 "적어도 하나"를 의미하며, 예를 들어 "식물"은 또한 여러 세포 식물 등을 지칭한다. 유사하게, "과실" 또는 "식물"은 또한 복수의 과실 및 식물을 지칭한다.
본원에서 사용된 바와 같은 용어 "식물"은 바람직하게는 식물이 수득되는 식물과 동일한 유전적 구성을 갖는 전체 식물 또는 이의 임의의 부분 또는 파생물, 예컨대 식물 기관 (예를 들어, 수확된 또는 수확되지 않은 과실, 잎, 꽃, 꽃밥 등), 식물 세포, 식물 원형질체, 전체 식물을 재생시킬 수 있는 식물 세포 조직 배양물, 식물 캘러스, 식물 세포 덩어리, 식물 이식체, 묘목, 식물에서 무손상인 식물 세포, 식물 클론 또는 미세번식, 또는 식물의 부분, 예컨대 식물 삽목, 배아, 화분, 꽃밥, 배주, 과실 (예를 들어, 수확된 조직 또는 기관), 꽃, 잎, 종자, 무성적으로 번식된 식물, 뿌리, 줄기, 근단, 접목 (접순 및/또는 근경) 등을 포함한다. 또한, 임의의 발달 단계, 예컨대 묘목, 발근 전 또는 후의 삽목 등이 포함된다. "식물의 종자"가 언급될 때, 이들은 식물이 성장될 수 있는 종자 또는 자가-수정 또는 교차-수정 후 식물 상에 생산된 종자를 지칭한다.
본원에서 사용된 바와 같은 용어 "품종" 또는 "재배종"은 주어진 유전자형 또는 유전자형의 조합으로부터 기인하는 특징의 발현에 의해 정의될 수 있는 가장 낮은 공지된 등급의 단일 식물학 분류군 내의 식물 그룹화를 의미한다.
용어 "대립유전자(들)"는 특정 로커스, 예를 들어 WAP5.1 로커스 (WAP5.1 유전자가 위치된 곳; 유전자의 대립유전자는 WAP5.1로 지정된 야생형 대립유전자, 또는 wap5.1로 지정된 돌연변이체 대립유전자일 수 있음)에 있는 유전자의 하나 이상의 대안적 형태 중 임의의 것을 의미하며, 이들 모든 대립유전자는 특정 로커스에 있는 하나의 형질 또는 특징에 관한 것이다 (예를 들어, 통성 단위결과). 유기체의 2배체 세포에서, 주어진 유전자의 대립유전자는 염색체 상의 특정 위치 또는 로커스 (복수의 로커스들)에 위치된다. 상동 염색체 쌍의 각 염색체 상에 하나의 대립유전자가 존재한다. 2배체 식물 종은 특정 로커스에서 다수의 상이한 대립유전자를 포함할 수 있다. 이들은 유전자의 동일한 대립유전자 (동형접합성) 또는 2개의 상이한 대립유전자 (이형접합성), 예를 들어 돌연변이체 wap5.1 대립유전자의 2개의 동일한 카피 (즉, wap5.1/wap5.1) 또는 돌연변이체 wap5.1 대립유전자의 1개 카피 및 야생형 대립유전자의 1개 카피 (즉, wap5.1/WAP5.1)일 수 있다. 마찬가지로 3배체 식물은 유전자의 3개의 동일한 대립유전자를 갖는 경우에 유전자에 대해 동형접합성으로 지칭되고 (예를 들어, 돌연변이체 wap5.1 대립유전자의 3개 카피, 즉 wap5.1/wap5.1wap5.1), 4배체 식물은 유전자의 4개의 동일한 대립유전자를 갖는 경우에 유전자에 대해 동형접합성으로 지칭된다 (예를 들어, 돌연변이체 wap5.1 대립유전자의 4개 카피 (즉, wap5.1 / wap5.1 / wap5.1 / wap5.1)).
"WAP5.1 유전자"는 염색체 5 상의 재배 수박에서 식별된 단일, 열성 유전자이며, 이는 돌연변이된 경우에 단위결과, 특히 통성 단위결과를 초래한다. WAP5.1은 비-단위결과성 재배 수박 식물에 존재하는 바와 같은 야생형 (WT), 기능적 대립유전자이고, wap5.1은 대립유전자가 2배체 (wap5.1/wap5.1), 3배체 (wap5.1/ wap5.1/ wap5.1), 4배체 (wap5.1/ wap5.1/ wap5.1/ wap5.1), 또는 다른 다배수체, 예를 들어 8배체 등에서 동형접합 형태인 경우에 단위결과를 초래하는 돌연변이체 대립유전자이다. 한 측면에서 WAP5.1 유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질을 코딩하거나, 또는 쌍별 정렬된 경우에 서열식별번호: 1 또는 서열식별번호: 9 (수박)에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 유전자이다. 이는 한 측면에서 오이 (서열식별번호: 2) 및 멜론 (서열식별번호: 3)에서 WAP5.1의 오르토로그를 포함한다.
"단위결과" 또는 "단위결과성"은 일반적으로 관련 기술분야에서 이해되고, 또한 본 발명과 관련하여 자성 배주의 수정 없이 과실의 발달을 기술하는 것으로 이해되어야 한다. 과실을 생산하기 위해서는 수분 프로세스가 필요하지 않지만 수분 결여의 결과로 상기 과실은 씨가 없다. 그러므로, 단위결과는 본원에서 암꽃의 수분 없이 식물 상에 과실이 형성되는 것을 의미한다. 마찬가지로 "단위결과성 식물" 또는 "동형접합 형태인 경우에 단위결과를 부여하는 돌연변이체 유전자 (또는 유전자의 돌연변이체 대립유전자)를 포함하는 식물"은 식물이 암꽃의 수분 없이 씨없는 과실을 생산한다는 것을 의미한다.
"통성 단위결과"는 통성 단위결과성 식물의 꽃이 수분될 때 단위결과 형질이 보이지 않고, 이 경우 정상적인 수정 및 정상적인 과실 발달이 일어난다는 것을 의미하는 것으로 이해된다. 정상적인 수정이 일어나면, 과실은 씨가 있다.
"F1, F2, F3 등"은 2개의 부모 식물 또는 부모 계통 사이의 교잡 후 연속적인 관련 세대를 지칭한다. 2개의 식물 또는 계통의 교배에 의해 생산된 종자로부터 성장된 식물은 F1 세대라고 불린다. F1 식물의 자가생식은 F2 세대 등을 초래한다.
"F1 하이브리드" 식물 (또는 F1 하이브리드 종자)은 2개의 근친교배 부모 계통의 교배로부터 수득된 세대이다. 그러므로, F1 하이브리드 종자는 F1 하이브리드 식물이 성장하는 종자이다. F1 하이브리드는 헤테로시스로 인해 더 활발하고 더 높은 수율을 보인다. 근친교배 계통은 본질적으로 게놈의 대부분의 로커스에서 동형접합성이다.
"식물 계통" 또는 "육종 계통"은 식물 및 이의 자손을 지칭한다. 본원에서 사용된 바와 같은 용어 "근친교배 계통"은 반복적으로 자가생식되고 거의 동형접합성인 식물 계통을 지칭한다. 그러므로, "근친교배 계통" 또는 "부모 계통"은 여러 세대 (예를 들어, 적어도 5, 6, 7 또는 그 초과)의 근친교배를 거쳐 높은 균일성을 갖는 식물 계통을 초래하는 식물을 지칭한다.
용어 "유전자"는 세포 내에서 메신저 RNA 분자 (mRNA)로 전사되는 영역 (전사된 영역), 및 작동가능하게 연결된 조절 영역 (예를 들어, 프로모터)을 포함하는 (게놈) DNA 서열을 의미한다. 예는 본 발명의 WAP5.1 유전자이다. 그러므로 유전자의 상이한 대립유전자는 유전자의 상이한 대체 형태이며, 이는 예를 들어 게놈 DNA 서열 (예를 들어, 프로모터 서열, 엑손 서열, 인트론 서열 등), mRNA 및/또는 코딩된 단백질의 아미노산 서열의 하나 이상의 뉴클레오티드의 차이의 형태일 수 있다.
"돌연변이체 wap5.1 대립유전자" 또는 "wap5.1 대립유전자"는 본원에서 수박의 염색체 5에 있는 WAP5.1 유전자의 돌연변이체 대립유전자를 지칭하며, 이는 돌연변이체 대립유전자가 동형접합 형태인 경우에 식물이 통성 단위결과성이 되도록 유발한다. 돌연변이체 대립유전자에서의 돌연변이는 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 돌연변이 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이 및/또는 하나 이상의 조절 서열, 예컨대 프로모터 서열, 또는 인핸서 또는 사일런서 서열 내의 돌연변이를 포함하는 임의의 돌연변이 또는 돌연변이의 조합일 수 있다. 한 측면에서 돌연변이체 wap5.1 대립유전자는 WAP5.1 유전자의 돌연변이체 대립유전자이며, 여기서 WAP5.1 유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질을 코딩하거나, 또는 (쌍별 정렬된 경우에) 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 유전자이다. 이는 한 측면에서 오이 또는 멜론 식물 또는 식물 세포에 존재하는 오이 (서열식별번호: 2) 및 멜론 (서열식별번호: 3)에서 WAP5.1 유전자의 오르토로그의 돌연변이체 대립유전자를 포함한다.
"야생형 WAP5.1 대립유전자" 또는 "WAP5.1 대립유전자"는 본원에서 WAP5.1 유전자의 기능적 대립유전자를 지칭하며, 이는 식물이 정상적인 과실 결실을 갖도록 유발하여, 과실 결실을 위해 정상적인 수분 및 수정을 필요로 한다. 야생형 WAP5.1 대립유전자는 수박의 임의의 상업용 품종 (예를 들어, 넌헴스 품종 프리미엄 F1, 몬트리올 F1 등)에서 발견된다. 한 측면에서 야생형 WAP5.1 대립유전자는 WAP5.1 유전자의 야생형 대립유전자이며, 여기서 WAP5.1 유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질을 코딩하거나, 또는 (쌍별 정렬된 경우에) 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 유전자이다. 이는 한 측면에서 오이 또는 멜론 식물 또는 식물 세포에 존재하는 오이 (서열식별번호: 2) 및 멜론 (서열식별번호: 3)에서 WAP5.1 유전자의 오르토로그를 포함한다.
용어 "로커스" (복수의 로커스들)는 예를 들어 유전자 또는 유전적 마커가 발견되는 염색체 상의 특정 장소 또는 장소들 또는 부위를 의미한다. 그러므로, WAP5.1 로커스는 WAP5.1 유전자의 돌연변이체 대립유전자 및/또는 야생형 대립유전자가 발견되는 수박 게놈 내의 위치이다. WAP5.1 로커스는 재배 수박 염색체 5 상의 로커스이며 ("수박: 게놈", "찰스턴 그레이" 또는 "수박 97103" 하에 월드 와이드 웹 cucurbitgenomics.org에서 발견되는 공개된 수박 게놈의 염색체 할당 사용), 즉 wap5.1은 돌연변이유발에 의해 재배 수박 게놈에서 생성되었고, 돌연변이체 wap5.1 대립유전자는 재배 수박의 염색체 5의 정의된 영역에 맵핑되었다.
"유도된 돌연변이체" 대립유전자는 돌연변이(들)가 인간 개입에 의해, 예를 들어 물리적 또는 화학적 돌연변이유발 방법을 통한 또는 예를 들어 조직 배양을 통한 돌연변이유발에 의해 유도된 돌연변이체 대립유전자이다 (예를 들어 문헌 [Zhang et al., Plos 9(5) e96879]에 기재된 바와 같음) (또한 표적화된 유전자 편집 기술 (예컨대 Crispr 기반 기술, TALENS 등) 포함).
"2배체 식물"은 2배체 식물이 성장될 수 있는 식물, 영양 식물 부분(들), 또는 종자를 지칭하며, 본원에서 2n으로 지정된 2개 세트의 염색체를 갖는다.
"DH 식물" 또는 "배가된-반수체 식물"은 예를 들어 시험관내 기술을 사용하여 2배체 식물의 반수체 게놈을 배가함으로써 생산되는 2배체 식물이다. 따라서, DH 식물은 모든 로커스에서 동형접합성이다.
"3배체 식물"은 본원에서 3n으로 지정된 3개 세트의 염색체를 갖는 식물, 영양 식물 부분(들), 또는 3배체 식물이 성장될 수 있는 종자를 지칭한다.
"4배체 식물"은 본원에서 4n으로 지정된 4개 세트의 염색체를 갖는 식물, 영양 식물 부분(들), 또는 4배체 식물이 성장될 수 있는 종자를 지칭한다.
"다배수체 식물"은 2배체보다 더 높은 배수체, 즉 3배체 (3n), 4배체 (4n), 6배체 (6n), 8배체 (8n) 등을 갖는 식물을 지칭한다.
"수분자 식물" 또는 "수분자"는 3배체 식물에 과실 결실을 유도하기 위한 수분자로서 적합한 (근친교배 또는 하이브리드) 2배체 식물, 또는 이의 부분 (예를 들어, 이의 화분 또는 접순)을 지칭한다. 그러므로, 수분자 식물은 적절한 낮 시간에 및 적절한 기간 동안 적절한 양의 화분을 생산함으로써 정상적인 3배체 식물 (야생형 WAP5.1 대립유전자의 3개 카피 포함)의 양호한 과실 결실 (및 양호한 3배체 과실 수확량)을 유발할 수 있다.
"하이브리드 3배체 식물" 또는 "F1 3배체" 또는 "3배체 하이브리드"는 웅성 2배체 부모와 자성 4배체 부모의 교잡 수정으로부터 수득된 하이브리드, 3배체 종자로부터 성장된 3배체 식물이다. 웅성 부모는 4배체 자성 부모에서 과실 결실 및 종자 생산을 유도하여, F1 하이브리드 3배체 종자를 함유하는 과실을 초래하기 위해 사용된다. F1 3배체 종자를 생산하는데 사용되는 웅성 부모 및 자성 부모 둘 다는 각 부모 계통이 거의 동형접합성이고 안정적이도록 근친교배이다.
"씨없는 과실"은 생존가능한 성숙 종자를 함유하지 않는 과실이다. 과실은 예를 들어 도 1 또는 도 5에서 볼 수 있는 바와 같이 하나 이상의 작고 식용의 백색 배주를 함유할 수 있다. 임의로 과실은 몇 개의 갈색 또는 흑색 종자를 함유할 수 있지만, 이들은 생존가능하지 않다. 생존가능한 성숙 종자는 적절한 조건 하에 토양에서 발아되고 식물로 성장할 수 있는 종자이다.
"식재" 또는 "식재된"은 기계 또는 손에 의해 밭에 파종 (직파)하거나 묘목 (소식물체)을 식재하는 것을 지칭한다.
"영양 번식" 또는 "무성 번식"은 예를 들어 시험관내 번식 또는 접목 방법 (접순 및 근경 사용)에 의해 영양 조직으로부터 식물의 번식을 지칭한다. 시험관내 번식은 시험관내 세포 또는 조직 배양 및 시험관내 배양으로부터 전체 식물의 재생을 수반한다. 접목은 근경에 접목에 의해 원래 식물을 번식시키는 것을 수반한다. 그러므로 원래 식물의 클론 (즉, 유전적으로 동일한 영양 번식)은 시험관내 배양 또는 접목에 의해 생성될 수 있다. "세포 배양" 또는 "조직 배양"은 식물의 세포 또는 조직의 시험관내 배양을 지칭한다. "재생"은 세포 배양 또는 조직 배양 또는 영양 번식으로부터 식물의 발달을 지칭한다. "비번식 세포"는 전체 식물로 재생될 수 없는 세포를 지칭한다.
"열성"은 2배체 게놈에 우성 대립유전자가 존재하지 않는 경우, 즉 2배체에서 동형접합성인 경우에 이의 표현형 (예를 들어, 단위결과 또는 통성 단위결과)을 발현하는 대립유전자를 지칭한다. 돌연변이체 wap5.1 대립유전자는 2배체 식물에서 2개 카피로, 임의로 4배체 식물에서 4개 카피로 또는 3배체 식물에서 2 또는 3개 카피로 또는 또 다른 다배수체에서 각각의 수의 카피로 존재하는 경우에 (통성) 단위결과성 식물을 초래한다. 우성 대립유전자는 본원에서 야생형 (WT) 대립유전자로도 지칭된다.
"재배 수박" 또는 "시트룰루스 라나투스"는 본원에서 양호한 농경학적 특징을 갖고, 특히 양호한 과실 품질 및 과실 균일성의 시장성 있는 과실을 생산하는 시트룰루스 라나투스 아종 불가리스(Citrullus lanatus ssp. vulgaris), 또는 시트룰루스 라나투스 (Thunb.) 마트숨. & 나카이 아종 불가리스(Matsum. & Nakai subsp. vulgaris) (Schrad.)를 지칭한다. 재배 오이 및 재배 멜론은 양호한 농경학적 특징을 갖고, 특히 양호한 과실 품질 및 과실 균일성의 시장성 있는 과실을 생산하는 쿠쿠미스 사티부스 및 쿠쿠미스 멜로 식물을 지칭한다.
"야생 수박"은 본원에서 불량한 품질 및 불량한 균일성의 과실을 생산하는 시트룰루스 라나투스 아종 라나투스(Citrullus lanatus ssp. lanatus) 및 시트룰루스 라나투스 아종 무코소스페르무스(Citrullus lanatus ssp. mucosospermus)를 지칭한다.
"SNP 마커"는 예를 들어 돌연변이체 wap5.1 대립유전자 및 야생형 WAP5.1 대립유전자 사이의 단일 뉴클레오티드 다형성을 지칭한다. 예를 들어 서열식별번호: 8은 뉴클레오티드 61에 SNP를 포함하는 서열을 제공하며, 여기서 'C' (시토신)의 존재는 야생형 WAP5.1 대립유전자의 존재를 나타내고, 'T' (티민)의 존재는 서열식별번호: 4의 단백질을 코딩하는 돌연변이체 대립유전자의 존재를 나타낸다 (L528F 돌연변이). WAP5.1 유전자의 돌연변이체 및 야생형 대립유전자를 구별할 수 있는 SNP 마커 검정 (즉, 대립유전자 특이적 검정)을 사용하여, 돌연변이체 대립유전자 및/또는 야생형 대립유전자의 존재에 대해 식물, 식물 부분 또는 이로부터의 DNA를 스크리닝할 수 있다.
"INDEL 마커"는 예를 들어 돌연변이체 wap5.1 대립유전자 및 야생형 WAP5.1 대립유전자 사이의 삽입/결실 다형성을 지칭한다. 유전자의 돌연변이체 및 야생형 대립유전자를 구별할 수 있는 INDEL 마커 검정 (즉, 대립유전자 특이적 검정)을 사용하여, 돌연변이체 대립유전자의 존재에 대해 식물, 식물 부분 또는 이로부터의 DNA를 스크리닝할 수 있다.
"유전자형분석" 방법은 식물 또는 식물 부분 또는 종자의 유전자형 또는 대립유전자 조성을 결정할 수 있는 방법이다. 이중-대립유전자 유전자형분석 검정, 예컨대 KASP-검정은 로커스에서 2개의 대립유전자를 구별할 수 있다.
"재배 수박 게놈" 및 "재배 수박 게놈 상의 물리적 위치" 및 "염색체 5"는 재배 수박의 물리적 게놈을 지칭하며, 참조 게놈은 "수박: 게놈", 예를 들어 "수박 (찰스턴 그레이)" 및 물리적 염색체 및 염색체 상의 물리적 위치 하에 월드 와이드 웹 cucurbitgenomics.org에서 찾을 수 있다.
"돌연변이체 wap5.1 대립유전자를 포함하는 염색체 영역"은 예를 들어 돌연변이체 wap5.1 대립유전자를 운반하는 재배 수박의 염색체 5의 게놈 영역을 지칭한다. 대립유전자의 존재는 표현형적으로 및/또는 하나 이상의 분자 마커, 예를 들어 돌연변이체 wap5.1 대립유전자에 연결된 SNP 마커 또는 다른 마커 또는 바람직하게는 상이한 wap5.1 대립유전자를 구별하는 마커의 존재에 의해 또는 대립유전자 서열 자체의 게놈 서열에 의해 (예를 들어, 대립유전자의 시퀀싱) 결정될 수 있다. 마커는 대립유전자에 물리적으로 커플링된 경우에 "wap5.1 대립유전자에 연결"된다. "대립유전자 특이적 마커"는 특정 대립유전자 (예를 들어, 특이적 돌연변이체 대립유전자)에 특이적이고 그러므로 예를 들어 돌연변이체 대립유전자 및 야생형 대립유전자를 구별하는 마커이다.
한 쌍의 "플랭킹 마커"는 wap5.1 대립유전자에 연결되고/거나 wap5.1 대립유전자에 밀접하게 연결된 2개의 마커, 바람직하게는 2개의 SNP 마커 또는 SNP 마커를 포함하는 2개의 서열을 지칭하며, 여기서 wap5.1 대립유전자는 2개의 마커 사이에 또는 마커를 포함하는 2개의 서열 사이에 위치된다.
"브릭스" 또는 "브릭스도" 또는 "° 브릭스"는 굴절계를 사용하여 여러 성숙 과실에서 측정된 바와 같은 평균 총 가용성 고체 함량을 지칭한다. 바람직하게는 절단-개방 과실의 중앙 및 껍질 사이에서 각각 측정된 적어도 3개의 과실의 평균이 계산된다.
과실 품질과 관련하여 "시장성 있는"은 수박 과실이 신선한 소비를 위해 판매되기에 적합하고, 양호한 향미 (이취 없음), 적어도 9.0, 바람직하게는 적어도 10.0 또는 적어도 11.0의 브릭스도 및 바람직하게는 또한 균일한 과실 과육 색상 (예를 들어 백색 (예를 들어, 품종 서스캐처원 크림(Cream of Saskatchewan)), 노란색 (예를 들어, 품종 야마토 크림(Yamato Cream) 1), 주황색 (예를 들어, 품종 텐더스위트(Tendersweet)), 분홍색 (예를 들어, 품종 사둘(Sadul)), 적분홍색 (예를 들어, 품종 크림슨 스위트(Crimson Sweet)), 적색 (예를 들어, 품종 슈가 베이비(Sugar Baby)) 또는 암적색 (예를 들어, 품종 딕시 리(Dixie Lee)))을 갖는 것을 의미한다.
"균일한 과실 과육 색상"은 중간 (중간부)을 통해 절단 개방하였을 때 성숙 과실 전체에 걸친 색상이 과실 과육 전체에 걸쳐 고르게 분포되어 있음 (즉 드문드문하지 않음)을 의미한다. 그러므로, 적색 과실은 과실 과육 전체에 걸쳐 적색이고 백색 패치를 함유하지 않는다. 균일한 적색 색상을 갖는 과실의 예는 2배체 품종 프리미엄 F1 (넌헴스)이다.
동일한 염색체 상의 로커스 사이 (예를 들어, 분자 마커 사이 및/또는 표현형 마커 사이)의 "물리적 거리"는 염기 또는 염기쌍 (bp), 킬로 염기 또는 킬로 염기쌍 (kb) 또는 메가 염기 또는 메가 염기쌍 (Mb)으로 표현되는 실제 거리이다.
동일한 염색체 상의 로커스 사이 (예를 들어, 분자 마커 사이 및/또는 표현형 마커 사이)의 "유전적 거리"는 교차 빈도 또는 재조합 빈도 (RF)에 의해 측정되며 센티모건 (cM)으로 표시된다. 1 cM은 약 1%의 재조합 빈도에 상응한다. 재조합체를 찾을 수 없는 경우, RF는 0이고 로커스는 물리적으로 함께 극히 가깝거나 동일하다. 2개의 로커스가 멀리 떨어져 있을수록 RF가 높아진다.
"균일성" 또는 "균일한"은 식물 계통 또는 품종의 유전적 및 표현형 특징과 관련된다. 근친교배 계통은 여러 세대의 근친교배에 의해 생산되기 때문에 유전적으로 고도로 균일하다. 마찬가지로, 및 이러한 근친교배 계통으로부터 생산되는 F1 하이브리드 및 3배체 하이브리드는 이들의 유전자형 및 표현형 특징 및 성능에서 고도로 균일하다.
형질 (예컨대 단위결과)을 부여하는 유전적 요소, 이입 단편, 또는 유전자 또는 대립유전자는 유전적 요소, 로커스, 이입 단편, 유전자 또는 대립유전자에 의해 부여된 형질의 첨가 외에 수용자 식물의 표현형 변화를 초래하지 않고 전통적인 육종 기술을 사용하여 그것이 존재하는 식물 또는 종자로부터 그것이 존재하지 않는 또 다른 식물 또는 종자로 전달될 수 있는 경우 (예컨대 비-단위결과성 계통 또는 품종) 식물 또는 종자 또는 조직 또는 세포"로부터 수득가능한"이라고 하거나, "로부터 수득" 또는 "로부터 유래가능"할 수 있거나, "로부터 유래" 또는 "에 존재하는 바와 같이" 또는 "에서 발견된 바와 같을" 수 있다. 상기 용어는 상호교환가능하게 사용되고, 유전적 요소, 로커스, 이입 단편, 유전자 또는 대립유전자는 그러므로 형질이 결여된 임의의 다른 유전적 배경으로 전달될 수 있다. 유전적 요소, 로커스, 이입 단편, 유전자 또는 대립유전자 (예를 들어, 돌연변이체 wap5.1 대립유전자)를 함유하는 재배 수박은 예를 들어 돌연변이유발 (예를 들어, 화학적 돌연변이유발, CRISPR-Cas 유도 등)에 의해 드 노보 생성된 후, 예를 들어 다른 재배 수박으로 교배될 수 있다. 오이 및 멜론에 동일하게 적용되며, 즉 돌연변이체 wap5.1 대립유전자는 돌연변이유발에 의해 드 노보 생성될 수 있다.
"애버리지" 또는 "평균"은 본원에서 산술 평균을 지칭하고, 용어 둘 다는 상호교환가능하게 사용된다. 그러므로 용어 "애버리지" 또는 "평균"은 여러 측정의 산술 평균을 지칭한다. 통상의 기술자는 식물 계통 또는 품종의 표현형이 어느 정도 성장 조건에 의존하고, 따라서 적어도 10, 15, 20, 30, 40, 50개 또는 그 초과의 식물 (또는 식물 부분)의 산술 평균이 바람직하게는 동일한 실험에서 동일한 조건 하에 성장된 여러 복제물 및 적합한 대조군 식물을 사용한 무작위화된 실험 설계에서 측정된다는 것을 이해한다. "통계적으로 유의한" 또는 "통계적으로 유의하게" 상이함 또는 "유의하게" 상이함은 적합한 대조군과 비교할 때 대조군 (의 평균)으로부터 해당 특징의 통계적으로 유의한 차이 (예를 들어, p-값이 0.05 미만임, p < 0.05, ANOVA 사용)를 나타내는 식물 계통 또는 품종의 특징을 지칭한다.
용어 "전통적인 육종 기술"은 본원에서 교배, 역교배, 자가생식, 선택, 이중 반수체 생산, 염색체 배가, 배아 구조, 원형질체 융합, 마커 보조 선택, 돌연변이 육종 등을 포함하며, 모두는 육종가에게 공지되어 있으며 (즉, 유전자 변형 / 형질전환 / 트랜스제닉 방법 이외의 방법), 이에 의해 예를 들어 돌연변이체 wap5.1 대립유전자를 포함하는 염색체 5가 수득, 식별 및/또는 전달될 수 있다.
"역교배"는 (단일) 형질, 예컨대 통성 단위결과 형질을 하나의 (종종 열등한) 유전적 배경 ("공여자"로도 지칭됨)으로부터 또 다른 (종종 우수한) 유전적 배경 ("반복친"으로도 지칭됨)으로 전달할 수 있는 육종 방법을 지칭한다. 교잡의 자손 (예를 들어, 예를 들어 공여자와 반복친 수박의 교배에 의해 수득된 F1 식물, 또는 F1의 자가생식으로부터 수득된 F2 식물 또는 F3 식물 등)은 예를 들어 우수한 유전적 배경을 갖는 부모로 "역교배"된다. 반복된 역교배 후, 하나의 (종종 열등한) 유전적 배경의 형질이 다른 (종종 우수한) 유전적 배경에 혼입될 것이다.
또 다른 마커 (또는 분자 마커를 포함하는 서열) 또는 로커스의 5 Mb, 3 Mb, 2.5 Mb, 2 Mb, 1 Mb, 0.5 Mb, 0.4Mb, 0.3Mb, 0.2Mb, 0.1 Mb, 74kb, 50kb, 20kb, 10kb, 5kb, 2kb, 1kb 또는 그 미만 이내의 분자 마커 (또는 분자 마커를 포함하는 서열)는 게놈 DNA 영역 플랭킹 마커 (즉, 마커의 어느 한쪽)의 5 Mb, 3 Mb, 2.5 Mb, 2 Mb, 1 Mb, 0.5 Mb, 0.4Mb, 0.3Mb, 0.2Mb, 0.1 Mb, 74kb, 50kb, 20kb, 10kb, 5kb, 2kb, 1kb 또는 그 미만 이내에 물리적으로 위치된 마커를 지칭한다.
"LOD-스코어" (오즈의 대수 (밑수 10))는 동물 및 식물 집단에서 연결 분석을 위해 종종 사용되는 통계 테스트를 지칭한다. LOD 스코어는 2개의 로커스 (분자 마커 로커스 및/또는 표현형 형질 로커스)가 실제로 연결된 경우에 테스트 데이터를 수득할 가능도를 순전히 우연히 동일한 데이터를 관찰할 가능도와 비교한다. 양의 LOD 스코어는 연결의 존재를 선호하고, 3.0 초과의 LOD 스코어는 연결에 대한 증거로 간주된다. +3의 LOD 스코어는 관찰 중인 연결이 우연히 발생하지 않았다는 오즈가 1000 대 1임을 나타낸다.
"트랜스진" 또는 "키메라 유전자"는 형질전환, 예컨대 아그로박테리움 매개 형질전환에 의해 식물의 게놈에 도입된 DNA 서열, 예컨대 재조합 유전자를 포함하는 유전자의 로커스를 지칭한다. 이의 게놈에 안정적으로 통합된 트랜스진을 포함하는 식물은 "트랜스제닉 식물"로 지칭된다.
"단리된 핵산 서열" 또는 "단리된 DNA"는 그것이 단리된 자연 환경에서 더 이상 존재하지 않는 핵산 서열, 예를 들어 박테리아 숙주 세포 또는 식물 핵 또는 색소체 게놈 내의 핵산 서열을 지칭한다. 본원에서 "서열"을 언급할 때, 이러한 서열을 갖는 분자는 예를 들어 핵산 분자를 지칭하는 것으로 이해된다.
"숙주 세포" 또는 "재조합 숙주 세포" 또는 "형질전환된 세포"는 상기 세포에 도입된 적어도 하나의 핵산 분자의 결과로서 발생하는 새로운 개별 세포 (또는 유기체)를 지칭하는 용어이다. 숙주 세포는 바람직하게는 식물 세포 또는 박테리아 세포이다. 숙주 세포는 염색체외 (에피솜) 복제 분자로서 핵산을 함유할 수 있거나, 또는 숙주 세포의 핵 또는 색소체 게놈에 통합된 핵산, 또는 도입된 염색체, 예를 들어 미니염색체로서 핵산을 포함할 수 있다.
"서열 동일성" 및 "서열 유사성"은 글로벌 또는 로컬 정렬 알고리즘을 사용하여 2개의 펩티드 또는 2개의 뉴클레오티드 서열의 정렬에 의해 결정될 수 있다. 그 후, 서열은 예를 들어 프로그램 GAP 또는 BESTFIT 또는 엠보스 프로그램 "니들" (디폴트 파라미터 사용, 하기 참조)에 의해 최적으로 정렬되어 적어도 특정 최소 백분율의 서열 동일성 (하기 추가로 정의된 바와 같음)을 공유하는 경우에 "실질적으로 동일한" 또는 "본질적으로 유사한"으로 지칭될 수 있다. 이들 프로그램은 매치의 수를 최대화하고 갭의 수를 최소화하면서 2개의 서열을 이들의 전체 길이에 걸쳐 정렬하기 위해 니들만 및 분쉬 글로벌 정렬 알고리즘을 사용한다. 일반적으로, 디폴트 파라미터가 사용되며, 갭 생성 페널티 = 10 및 갭 연장 페널티 = 0.5 (둘 다는 뉴클레오티드 및 단백질 정렬을 위한 것임)이다. 뉴클레오티드의 경우 사용되는 디폴트 스코어링 매트릭스는 DNAFULL이고, 단백질의 경우 디폴트 스코어링 매트릭스는 Blosum62이다 (Henikoff & Henikoff, 1992, PNAS 89, 10915-10919). 백분율 서열 동일성에 대한 서열 정렬 및 스코어는 예를 들어 컴퓨터 프로그램, 예컨대 엠보스 (월드 와이드 웹 ebi.ac.uk/Tools/psa/emboss_needle/에서 이용가능함)를 사용하여 결정될 수 있다. 대안적으로 서열 유사성 또는 동일성은 데이터베이스, 예컨대 FASTA, BLAST 등에 대해 써치함으로써 결정될 수 있지만, 히트는 검색되고 서열 동일성을 비교하기 위해 쌍별 정렬되어야 한다. 2개의 단백질 또는 2개의 단백질 도메인, 또는 2개의 핵산 서열은 백분율 서열 동일성이 적어도 85%, 90%, 92%, 95%, 98%, 99% 또는 그 초과인 경우에 "실질적인 서열 동일성"을 갖는다 (디폴트 파라미터, 즉 갭 생성 페널티 = 10, 갭 연장 페널티 = 0.5를 사용하여 엠보스 "니들"에 의해 결정된 바와 같음, 핵산의 경우 스코어링 매트릭스 DNAFULL 및 단백질의 경우 Blosum62 사용).
참조 서열에 대해 "실질적인 서열 동일성"을 갖거나 참조 서열에 대해 적어도 80%의 서열 동일성, 예를 들어 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 98%, 99%, 99.2%, 99.5%, 99.9% 핵산 서열 동일성을 갖는 핵산 서열 (예를 들어, DNA 또는 게놈 DNA)을 참조할 때, 한 실시양태에서 상기 뉴클레오티드 서열은 주어진 뉴클레오티드 서열과 실질적으로 동일한 것으로 간주되며, 엄격한 혼성화 조건을 사용하여 식별될 수 있다. 또 다른 실시양태에서, 핵산 서열은 주어진 뉴클레오티드 서열과 비교하여 하나 이상의 돌연변이를 포함하지만, 여전히 엄격한 혼성화 조건을 사용하여 식별될 수 있다.
"엄격한 혼성화 조건"은 주어진 뉴클레오티드 서열과 실질적으로 동일한 뉴클레오티드 서열을 식별하기 위해 사용될 수 있다. 엄격한 조건은 서열 의존적이며 상이한 환경에서 상이할 것이다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특이적 서열에 대한 열 융점 (Tm)보다 약 5℃ 더 낮도록 선택된다. Tm은 표적 서열의 50%가 완벽하게 매치된 프로브에 혼성화되는 온도 (정의된 이온 강도 및 pH 하에)이다. 전형적으로, 염 농도가 pH 7에서 약 0.02 몰이고 온도가 적어도 60℃인 엄격한 조건이 선택될 것이다. 염 농도를 낮추고/거나 온도를 증가시키는 것은 엄격성을 증가시킨다. RNA-DNA 혼성화를 위한 엄격한 조건 (예를 들어 100nt의 프로브를 사용하는 노던 블롯)은 예를 들어 63℃에서 20분 동안 0.2X SSC에서 적어도 한 번의 세척을 포함하는 조건, 또는 동등한 조건이다. DNA-DNA 혼성화를 위한 엄격한 조건 (예를 들어 100nt의 프로브를 사용하는 서던 블롯)은 예를 들어 적어도 50℃, 대개 약 55℃의 온도에서 20분 동안 0.2X SSC에서 적어도 한 번의 세척 (대개 2회)을 포함하는 조건, 또는 동등한 조건이다.
본 발명과 관련하여 "M1 세대" 또는 "M1 식물"은 돌연변이유발 처리로부터 직접적으로 생산되는 1세대를 지칭할 것이다. 돌연변이원으로 처리된 종자로부터 성장된 식물은 예를 들어 M1 세대를 대표한다.
"M2 세대" 또는 "M2 식물"은 본원에서 M1 세대의 자가-수분으로부터 수득된 세대를 지칭할 것이다. 자가-수분된 M1 식물로부터 수득된 종자로부터 성장된 식물은 M2 식물을 나타낸다. M3, M4 등은 자가-수분 후 수득된 추가 세대를 지칭한다.
"대립성 테스트"는 2개의 식물 계통 또는 품종에서 보여지는 표현형, 예를 들어 통성 단위결과가 동일한 유전자 또는 로커스 또는 상이한 유전자 또는 로커스에 의해 결정되는지 여부를 테스트할 수 있는 유전자 테스트를 지칭한다. 예를 들어, 테스트될 식물은 서로 교배되고 (바람직하게는 이들이 동형접합성인지 보장하기 위해 자가생식 후), F1 또는 추가 자가생식 또는 역교배 자손 중에서 표현형의 격리가 결정된다. 격리 비율은 유전자 또는 로커스가 대립유전자인지 또는 이들이 상이한지 여부를 나타낸다. 따라서 예를 들어 대립유전자가 동일한 유전자인 경우, F1 식물 (2개의 동형접합성 식물의 교배에 의해 생산됨)은 모두 (100%) 동일한 표현형을 가질 것이나, 대립유전자가 상이한 유전자인 경우에는 그렇지 않을 수 있다. 마찬가지로 F2 식물에서 표현형 격리는 동일한 또는 상이한 유전자가 관여하는지 여부를 나타낼 것이다.
"mRNA 코딩 서열"은 본원에서 일반적인 의미를 가질 것이다. mRNA 코딩 서열은 티민 (T)이 우라실 (U)에 의해 대체되는 것을 제외하고 유전자/대립유전자의 각각의 DNA 코딩 (cDNA) 서열에 상응한다.
핵산 분자 (DNA 또는 RNA)에서의 "돌연변이"는 예를 들어 하나 이상의 뉴클레오티드의 대체, 결실 또는 삽입에 의한 상응하는 야생형 서열과 비교하여 하나 이상의 뉴클레오티드의 변화이다. 이러한 돌연변이의 예는 점 돌연변이, 넌센스 돌연변이, 미스센스 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이 또는 조절 서열에서의 돌연변이이다.
"핵산 분자"는 관련 기술분야에서 일반적인 이해를 가질 것이다. 이는 당 데옥시리보스 (DNA) 또는 리보스 (RNA) 중 하나를 포함하는 뉴클레오티드로 구성된다.
"점 돌연변이"는 단일 뉴클레오티드의 대체, 또는 단일 뉴클레오티드의 삽입 또는 결실이다.
"넌센스 돌연변이"는 단백질을 코딩하는 핵산 서열에서의 (점) 돌연변이이며, 여기서 핵산 분자의 코돈은 정지 코돈으로 변화된다. 이는 조기 정지 코돈이 mRNA에 존재하도록 초래하고 말단절단된 단백질의 번역을 초래한다. 말단절단된 단백질은 감소된 기능 또는 기능 상실을 가질 수 있다.
"미스센스 또는 비동의 돌연변이"는 단백질을 코딩하는 핵산 서열에서의 (점) 돌연변이이며, 여기서 코돈은 상이한 아미노산을 코딩하도록 변화된다. 생성된 단백질은 감소된 기능 또는 기능 상실을 가질 수 있다.
"스플라이스-부위 돌연변이"는 단백질을 코딩하는 핵산 서열에서의 돌연변이이며, 여기서 프리-mRNA의 RNA 스플라이싱이 변화되어, 야생형과 상이한 뉴클레오티드 서열을 갖는 mRNA 및 상이한 아미노산 서열을 갖는 단백질을 초래한다. 생성된 단백질은 감소된 기능 또는 기능 상실을 가질 수 있다.
"프레임 시프트 돌연변이"는 단백질을 코딩하는 핵산 서열에서의 돌연변이이며, 여기서 mRNA의 리딩 프레임이 변화되어, 상이한 아미노산 서열을 초래한다. 생성된 단백질은 감소된 기능 또는 기능 상실을 가질 수 있다.
본 발명의 맥락에서 "결실"은 상응하는 야생형 서열의 핵산 서열과 비교하여 주어진 핵산 서열의 어느 곳에서든 적어도 하나의 뉴클레오티드가 누락되거나, 상응하는 (야생형) 서열의 아미노산 서열과 비교하여 주어진 아미노산 서열의 어느 곳에서든 적어도 하나의 아미노산이 누락됨을 의미할 것이다.
"말단절단"은 상응하는 야생형 서열의 핵산 서열과 비교하여 뉴클레오티드 서열의 3'-말단 또는 5'-말단에 있는 적어도 하나의 뉴클레오티드가 누락되거나, 상응하는 야생형 단백질의 아미노산 서열과 비교하여 단백질의 N-말단 또는 C-말단에 있는 적어도 하나의 아미노산이 누락됨을 의미하는 것으로 이해될 것이며, 여기서 3'-말단 또는 C-말단 말단절단에서 각각 적어도 5'-말단에 있는 제1 뉴클레오티드 또는 N-말단에 있는 제1 아미노산이 여전히 존재하고, 5'-말단 또는 N-말단 말단절단에서 각각 적어도 3'-말단에 있는 마지막 뉴클레오티드 또는 C-말단에 있는 마지막 아미노산이 여전히 존재한다. 5'-말단은 상응하는 야생형 핵산 서열의 번역에서 시작 코돈으로서 사용되는 ATG 코돈에 의해 결정된다.
"대체"는 핵산 서열 내의 적어도 하나의 뉴클레오티드 또는 단백질 서열 내의 하나의 아미노산이 각각의 단백질의 코딩 서열 내의 뉴클레오티드의 교환으로 인해 상응하는 야생형 핵산 서열 또는 상응하는 야생형 아미노산 서열과 비교하여 각각 상이함을 의미할 것이다.
"삽입"은 단백질의 핵산 서열 또는 아미노산 서열이 상응하는 야생형 핵산 서열 또는 상응하는 야생형 아미노산 서열과 비교하여 각각 적어도 하나의 추가 뉴클레오티드 또는 아미노산을 포함함을 의미할 것이다.
본 발명과 관련하여 "조기 정지 코돈"은 상응하는 야생형 코딩 서열의 정지 코돈과 비교하여 5'-말단에서 시작 코돈에 더 가까운 코딩 서열 (cds)에 정지 코돈이 존재함을 의미한다.
"조절 서열에서의 돌연변이", 예를 들어 유전자의 프로모터 또는 인핸서에서의 돌연변이는 야생형 서열과 비교하여 하나 이상의 뉴클레오티드의 변화 (예를 들어 하나 이상의 뉴클레오티드의 대체, 결실 또는 삽입에 의한)이며, 이는 예를 들어 유전자의 감소된 mRNA 전사체가 생성되거나 전혀 생성되지 않도록 유발한다.
"단백질에서의 돌연변이"는 야생형 서열과 비교하여 하나 이상의 아미노산 잔기의 변화 (예를 들어 하나 이상의 아미노산 잔기의 대체, 결실, 말단절단 또는 삽입에 의한)이다.
"돌연변이체 단백질"은 본원에서 단백질을 코딩하는 핵산 서열에서의 하나 이상의 돌연변이를 포함하는 단백질이며, 여기서 돌연변이는 예를 들어 생체내에서 측정가능한 바와 같이, 예를 들어 돌연변이체 대립유전자에 의해 부여된 표현형에 의해 "감소된 기능" 또는 "기능 상실" 단백질을 (코딩하는 돌연변이체 핵산 분자를) 초래한다.
"야생형 3차원 구조" 또는 "야생형 단백질 폴딩"은 생체내에서 이의 정상적인 기능을 수행하기 위한 야생형 단백질의 생체내 폴딩을 지칭한다. "변형된 3차원 구조 또는 변형된 단백질 폴딩"은 야생형 단백질과 상이한 폴딩을 갖는 돌연변이체 단백질을 지칭하며, 이는 생체내에서 이의 정상적인 기능 또는 활성을 감소 또는 폐지하며, 즉 단백질은 감소된 기능 또는 기능 상실을 갖는다.
본 발명의 맥락에서, 단백질의 "감소된 활성"은 상응하는 야생형 식물 세포 또는 상응하는 야생형 식물과 비교할 때 WAP5.1 단백질의 활성의 감소를 의미할 것이다. 감소는 한 측면에서 유전자 발현의 전체 녹아웃 또는 녹다운, 또는 기능 상실 또는 감소된 기능 WAP5.1 단백질의 생산을 포함할 것이며, 예를 들어 돌연변이체 WAP5.1 단백질은 야생형 기능적 WAP5.1 단백질과 비교하여 상실된 기능 또는 감소된 기능을 가질 수 있다. 활성의 감소는 WAP5.1 단백질을 코딩하는 유전자의 발현의 감소 (녹다운으로도 지칭됨), 또는 WAP5.1 단백질을 코딩하는 유전자의 발현의 녹아웃 및/또는 세포 내 WAP5.1 단백질의 양의 감소, 또는 세포 내 WAP5.1 단백질의 활성의 감소된 기능 또는 기능 상실일 수 있다.
본 발명과 관련하여, 용어 "야생형 식물 세포" 또는 "야생형 식물"은 야생형 wap5.1 대립유전자를 포함하고 돌연변이체 wap5.1 대립유전자를 포함하지 않음을 의미한다. 그러므로, 야생형 식물 또는 야생형 식물 세포는 완전히 기능적인 WAP5.1 단백질 (야생형 WAP5.1 단백질로도 지칭됨)을 코딩하는 완전히 기능적인 WAP5.1 유전자를 포함하는 식물 또는 식물 세포이며, 예를 들어 수박 식물 또는 식물 세포와 관련하여 2배체 수박 식물은 서열식별번호: 1 또는 서열식별번호: 9의 단백질 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 서열 동일성을 포함하는 단백질)을 생산하고 수분 후에만 과실을 생산한다. 또는, 멜론 식물 또는 세포와 관련하여 2배체 멜론 식물은 서열식별번호: 3의 단백질 (또는 서열식별번호: 3에 대해 적어도 95% 96%, 97%, 98%, 99% 서열 동일성을 포함하는 단백질)을 생산하거나, 또는 오이 식물 또는 세포와 관련하여 2배체 오이 식물은 서열식별번호: 2의 단백질 (또는 서열식별번호: 2에 대해 적어도 95% 96%, 97%, 98%, 99% 서열 동일성을 포함하는 단백질)을 생산한다.
"녹아웃" 또는 "전체 녹아웃"은 각각의 유전자의 발현이 더 이상 검출가능하지 않음을 의미하는 것으로 이해되어야 한다.
"기능 상실" 또는 "감소된-기능" 또는 "감소된 기능"은 본 발명의 맥락에서 단백질이 가능하게는 상응하는 야생형 단백질과 동일한 또는 유사한 양으로 존재하지만 더 이상 이의 정상적인 효과를 나타내지 않음을 의미할 것이며, 즉 2배체 식물에 동형접합 형태로 존재할 때 이러한 단백질을 코딩하는 돌연변이체 대립유전자의 경우, 식물은 수분의 부재 하에 씨없는 과실 및 수분의 존재 하에 씨있는 과실을 생산한다.
"보존된 도메인"은 보존된 단백질 도메인, 예컨대 "LRR-도메인" 및 "F-박스 도메인"을 지칭하며, 이들 둘 다는 단백질-단백질 상호작용에 관여할 가능성이 있다. 서열식별번호: 1 또는 서열식별번호: 9의 수박 WAP5.1 단백질에서, F-박스 도메인은 아미노산 237 내지 277에서 발견되고, 서열식별번호: 2의 오이 WAP5.1 단백질에서 아미노산 244 내지 284에서 발견되고, 서열식별번호: 3의 멜론 단백질에서 아미노산 247 내지 287에서 발견된다. 서열식별번호: 1 또는 서열식별번호: 9의 수박 WAP5.1 단백질에서, LRR-도메인 도메인은 아미노산 291 내지 1033에서 발견되고, 서열식별번호: 2의 오이 WAP5.1 단백질에서 아미노산 297 내지 1040에서 발견되고, 서열식별번호: 3의 멜론 단백질에서 아미노산 301 내지 1043에서 발견된다. 보존된 도메인은 예를 들어 NCBI의 보존된 도메인 데이터베이스에서 찾을 수 있다 (월드 와이드 웹 ncbi.nlm.nih.gov/cdd).
"마커 보조 선택" 또는 "MAS"는 특정 로커스 또는 영역 또는 대립유전자의 존재에 대해 식물을 선택하기 위해 특정 로커스 또는 특정 염색체 영역 또는 대립유전자 특이적 마커에 유전적으로 및 물리적으로 연결된 분자 마커 (예컨대 SNP 마커 또는 INDEL 마커)의 존재를 사용하는 프로세스이다. 예를 들어, 돌연변이체 wap5.1 대립유전자 또는 대립유전자 특이적 마커에 유전적으로 및 물리적으로 연결된 분자 마커는 예를 들어 돌연변이체 wap5.1 대립유전자를 포함하는 수박 식물 또는 식물 부분을 검출 및/또는 선택하기 위해 사용될 수 있다. 대립유전자 특이적 마커는 대립유전자에 대해 직접적으로 선택하므로 바람직한 마커이다.
"표적화된 유전자 편집"은 내인성 표적 유전자를 변형할 수 있는 기술, 예를 들어 하나 이상의 뉴클레오티드가 예를 들어 프로모터 또는 코딩 서열에서 삽입, 대체 및/또는 결실될 수 있는 기술로 지칭된다. 예를 들어 CRISPR 기반 기술, 예컨대 Crispr-Cas9 유전자 편집, Crispr-CpfI 유전자 편집, 또는 '베이스 편집' 또는 '프라이머 편집'이라고 불리는 더 최근의 기술은 수박에서 내인성 표적 유전자, 예컨대 내인성 야생형 WAP5.1 유전자 (서열식별번호: 1 또는 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 서열 동일성을 포함하는 야생형 단백질을 코딩함)를 변형시키기 위해 사용될 수 있다. 본원에 기재된 돌연변이체는 예를 들어 야생형 WAP5.1 유전자의 표적화된 유전자 편집에 의해 재생될 수 있다.
"올리고뉴클레오티드" 또는 "올리고" 또는 "올리고뉴클레오티드 프라이머 또는 프로브"는 핵산의 짧은 단일-가닥 중합체, 예를 들어 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24개 또는 그 초과의 뉴클레오티드 길이이다. 올리고는 이들의 의도된 용도에 따라 다양한 화학으로 비변형 또는 변형될 수 있으며, 예를 들어 5' 또는 3' 포스페이트 기의 첨가는 프로브로서 사용하기 위한 방사성핵종 또는 형광단 및/또는 켄처로 라벨링하여 각각 라이게이션 또는 블록 연장을 가능하게 하고, 티올, 아미노, 또는 다른 반응성 모이어티의 혼입은 기능적 분자, 예컨대 효소의 공유결합적 커플링, 및 다양한 관능성의 다른 링커 및 스페이서를 사용한 연장을 가능하게 한다. DNA 올리고가 가장 흔하게 사용되지만, RNA 올리고가 또한 이용가능하다. 올리고의 길이는 대개 접미사 -mer를 첨가함으로써 지정된다. 예를 들어, 19개 뉴클레오티드 (염기)를 갖는 올리고뉴클레오티드는 19-mer라고 불린다. 대부분의 용도의 경우, 올리고뉴클레오티드는 DNA 또는 RNA 가닥과 염기쌍을 형성하도록 설계된다. 올리고뉴클레오티드에 대한 가장 일반적인 용도는 PCR (폴리머라제 연쇄 반응)을 위한 프라이머로서의 용도이다. 프라이머는 증폭을 위해 표적화된 서열에 상보적인 이들의 서열의 적어도 일부로 설계된다. 상보적 서열에 대한 최적의 프라이머 길이는 예를 들어 18 내지 22개 뉴클레오티드이다. PCR을 위한 최적의 프라이머 서열은 대개 프라이머 설계 소프트웨어에 의해 결정된다.
"DNA 마이크로어레이"는 고체 지지체 상에 결합된 DNA, 대개 올리고뉴클레오티드의 많은 미시적 스팟을 갖는 어레이이다. 검정 표적은 DNA, cDNA 또는 cRNA일 수 있다. 시스템에 따라, 특이적 스팟에 대한 표적의 혼성화는 형광, 화학발광, 또는 콜로이드성 은 또는 금에 의해 검출된다. 마이크로어레이는 다중 적용, 예컨대 다수의 유전자의 발현의 동시 측정을 위해 사용되어, 게놈-차원의 유전자 발현 분석, 뿐만 아니라 예를 들어 단일-뉴클레오티드 다형성 (SNP) 또는 InDel 분석을 사용한 유전자형분석 연구를 가능하게 한다.
"상보적 가닥"은 상보적 서열의 2개 가닥을 지칭하고, 이중 가닥 DNA에 대해 센스 (또는 플러스) 및 안티센스 (또는 마이너스) 가닥으로 지칭될 수 있다. 센스 / 플러스 가닥은 일반적으로 DNA의 전사된 서열 (또는 전사에서 생성된 mRNA)인 반면, 안티센스 / 마이너스 가닥은 센스 서열에 상보적인 가닥이다. 본원에 제공된 임의의 서열에 대해 서열의 한 가닥만이 제공되지만, 주어진 가닥의 상보적 가닥이 또한 본원에 포함된다. DNA의 상보적 뉴클레오티드는 T에 상보적인 A, 및 C에 상보적인 G이다. RNA의 상보적 뉴클레오티드는 U에 상보적인 A, 및 C에 상보적인 G이다.
도 1: 위치 528에 있는 아미노산 류신이 아미노산 페닐알라닌에 의해 대체된 단백질 (L528F)을 코딩하는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물 상에 수분의 부재 하에 발달된 수박 과실의 단면 사진.
도 2: 아미노산 528에 아미노산 류신 (L)을 포함하는 수박 야생형 ('wt'로서 라벨링됨) WAP5.1 단백질 및 아미노산 528에 페닐알라닌 (F)을 포함하는 돌연변이체 WAP5.1 단백질 ('wap5.1'로서 라벨링됨)의 단백질 서열 정렬. 또한 F-박스는 실선 박스에 의해 표시되고, LRR-도메인은 파선 박스에 의해 표시된다.
도 3a: RaptorX 접촉 예측에 의해 생성된 서열식별번호: 1의 야생형 WAP5.1 단백질의 3차원 구조. 아미노산 류신 528은 화살표로 표시된다. LRR-도메인은 긴 꼬리-유사 구조로 폴딩된다.
도 3b: RaptorX 접촉 예측에 의해 생성된, 위치 528에 (류신 대신) 페닐알라닌을 포함하는 서열식별번호: 4의 돌연변이체 WAP5.1 단백질의 3차원 구조. 튀어나온 루프에서 볼 수 있는 바와 같이, 도 3a의 야생형 단백질에서 보이는 3차원 꼬리 구조가 붕괴되고, 단백질이 적절하게 폴딩되지 않는다. 이 붕괴는 루프에서 튀어나온 아미노산 Q581을 지나 연장된다.
도 4: 수박 ('wap5.1'로서 라벨링됨, 서열식별번호: 1), 멜론 (서열식별번호: 3) 및 오이 (서열식별번호: 2)의 야생형 WAP5.1 단백질의 다중 서열 정렬. 도시된 수박 단백질은 서열식별번호: 1의 단백질이다. 서열식별번호: 9의 야생형 WAP5.1 수박 단백질은 도시되지 않았지만, 아미노산 51이 상이한 것을 제외하고 서열식별번호: 1과 동일하다. 서열식별번호: 1 및 서열식별번호: 9의 야생형 WAP5.1 단백질은 99.9% 서열 동일성을 갖는다. 각 아미노산 아래의 별표는 동일한 아미노산을 나타낸다. 실선 박스에 의해 둘러싸인 F-박스 도메인은 수박, 오이 및 멜론 WAP5.1 단백질 사이에 100% 동일하다. 파선 박스에 의해 둘러싸인 LRR-도메인은 또한 수박, 오이 및 멜론 WAP5.1 단백질 사이에 높은 아미노산 동일성을 갖는다. F-박스 앞의 N-말단 영역은 3개의 종 사이에 가장 적게 보존된다. 굵은 글씨로 강조된 아미노산은 수박에서 돌연변이체 대립유전자가 생성된 아미노산 위치 (단일 아미노산 치환 또는 정지 코돈 돌연변이체) 및 멜론 및 오이에서 생성될 수 있는 아미노산 위치를 나타낸다.
도 5: 위치 528에 있는 아미노산 류신이 아미노산 페닐알라닌에 의해 대체된 단백질 (L528F)을 코딩하는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물 상에 수분의 부재 하에 발달된 절단된 수박 과실의 사진.
본 발명의 제1 실시양태는 돌연변이체 대립유전자가 동형접합 형태인 경우에 단위결과, 특히 통성 단위결과를 부여하는 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는, 재배 수박 식물, 시트룰루스 라나투스에 관한 것이다. 그러므로, 한 측면에서 WAP5.1이라고 불리는 단일 열성 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 재배 수박 식물이 제공된다.
WAP5.1 유전자는 재배 수박의 내인성 유전자이며, 이는 돌연변이된 경우에 및 동형접합 형태인 경우에 단위결과, 특히 통성 단위결과를 초래한다.
본 발명자들에 의해 식별된 돌연변이체 단위결과성 수박 식물을 엘리트 수박 계통과 교배시킴으로써 생성된 격리 집단은 염색체 5 상의 영역으로의 WAP5.1 유전자의 맵핑을 가능하게 하였다. 2개의 맵핑 집단에서의 추가 분석은 코딩된 단백질에서 단일 아미노산 치환 (L528F)을 유발하는 돌연변이를 포함하는 유전자의 식별에 이르게 하였다. 돌연변이는 계통에 고유하였고, 93 전체 게놈 재시퀀싱된 계통에서 발견되지 않았다. 유전자는 WAP5.1로 명명되었다 (염색체 5 상의 수박 단위결과 유전자에 대해). 돌연변이체 대립유전자에 대해 식물을 스크리닝하기 위해 대립유전자 특이적 마커를 설계하였으며, 서열식별번호: 8에 제공된다.
돌연변이체 단위결과성 수박 식물에서 야생형 WAP5.1 단백질 (서열식별번호: 1 또는 서열식별번호: 9)의 위치 528에 있는 류신은 도 2에 나타낸 바와 같이 돌연변이체 단백질 (서열식별번호: 4 또는 서열식별번호: 10에 표시됨)에서 페닐알라닌 (L528F)에 의해 대체되었다. 돌연변이체 대립유전자 (서열식별번호: 5 또는 서열식별번호: 12)의 cDNA에서 뉴클레오티드 1582는 티민 (T)인 반면, 야생형 wap5.1 cDNA (서열식별번호: 6 또는 서열식별번호: 11)에서는 시토신 (C)이다. 이 단일 뉴클레오티드 변화 (또는 SNP, C→T)는 코돈 CTT (류신, L을 코딩함)로부터 TTT (페닐알라닌, F를 코딩함)로의 코돈 변화를 초래한다. 서열식별번호: 7의 게놈 DNA (찰스턴 그레이 게놈의 야생형 WAP5.1 대립유전자를 코딩함)에서 돌연변이는 뉴클레오티드 4123에 있는 C의 뉴클레오티드 4123에 있는 T로의 변화, 코돈 CTT의 TTT로의 변화에 상응한다. 서열식별번호: 14의 게놈 DNA (수박 97103 게놈의 야생형 WAP5.1 대립유전자를 코딩함)에서 돌연변이는 뉴클레오티드 4118에 있는 C의 뉴클레오티드 4118에 있는 T로의 변화, 코돈 CTT의 TTT로의 변화에 상응한다.
돌연변이체 WAP5.1 단백질의 이 단일 아미노산 변화는 LRR-도메인의 정상적인 단백질 폴딩을 변화시켜 단백질이 비기능적이거나 생체내에서 감소된 기능을 갖도록 유발하는 것으로 나타났다. 그 결과, 이 돌연변이체 단백질에 대해 동형접합성인 (및 그러므로 기능적 야생형 단백질이 결여된) 식물은 수분의 부재 하에 씨없는 과실, 및 수분이 일어날 때 정상적인 씨있는 과실을 발달시킨다.
WAP5.1 대립유전자에서의 다른 돌연변이체가 생성되었고, 또한 오이 및 멜론의 오르토로그가 식별되었다. 따라서, 이 발견은 통성 단위결과성 수박 식물, 뿐만 아니라 통성 단위결과성 오이 또는 멜론 식물의 생산을 가능하게 한다.
한 측면에서 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물 또는 식물 부분이 제공되며, 여기서 상기 돌연변이체 대립유전자는
a) 야생형 대립유전자와 비교하여 대립유전자의 발현 없음 또는 감소된 발현을 초래하는 조절 요소에 하나 이상의 돌연변이를 포함하고/거나,
b) 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고,
여기서 a) 또는 b)의 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고, 여기서 야생형 수박 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 오이 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 멜론 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩한다.
수박, 오이 및 멜론의 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 및 서열식별번호: 9 (수박), 서열식별번호: 2 (오이) 및 서열식별번호: 3 (멜론)에 제공된다. 이들은 또한 도 4의 다중 서열 정렬에 도시되어 있다. 그러나 각 종에 일부 아미노산 서열 변이가 있을 수 있으며, 기능적 WAP5.1 단백질은 예를 들어 본원에 제공된 서열식별번호: 1, 2 및 3과 상이한 1, 2, 3, 4 또는 5개의 아미노산을 포함할 수 있거나, 여기서 단백질은 서열식별번호: 1, 2 또는 3의 단백질에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성을 포함한다. 예를 들어 수박 찰스턴 그레이 품종 및 엘리트 계통 TY에서 야생형 단백질 간에 차이가 발견되었다. 엘리트 수박 계통 TY에서, 야생형 WAP5.1 단백질 (서열식별번호: 9)은 야생형 찰스턴 그레이 WAP5.1 단백질 (서열식별번호: 1)로부터의 아미노산 51이 상이한 것으로 밝혀졌다. 계통 TY는 아미노산 51에 아르기닌 (R)을 갖는 반면, 찰스턴 그레이는 아미노산 51에 글리신 (G)을 갖는다. 계통 TY의 cDNA에서 서열식별번호: 11의 뉴클레오티드 151 내지 153에 있는 코돈은 'CGT'인 반면, 찰스턴 그레이의 cDNA에서 서열식별번호: 6의 뉴클레오티드 151 내지 153에 있는 코돈은 'GGT'이다. 대립유전자 간의 또 다른 차이는 S450에 대한 코돈이 상이한 반면, 아미노산 (S450)이 동일하다는 것이다. TY 계통에서 서열식별번호: 11의 뉴클레오티드 1348 내지 1350에 있는 코돈은 'AGC' (Ser, S를 코딩함)인 반면, 찰스턴 그레이 대립유전자에서 서열식별번호: 6의 뉴클레오티드 1348 내지 1350에 있는 코돈은 'AGT' (Ser, S를 코딩함)이다. 야생형 대립유전자의 게놈 DNA는 분명히 이들 코돈의 동일한 차이를 포함한다.
그러므로, 수박에서 예를 들어 참조 게놈 찰스턴 그레이는 서열식별번호: 1의 단백질을 코딩하는 유전자를 함유하는 반면, 품종 97103의 참조 게놈 (게놈 버전 v2) 및 엘리트 계통 TY는 서열식별번호: 1과 상이한 1개의 아미노산 (아미노산 51)을 갖는 WAP5.1 유전자를 함유하며, 즉 단백질은 서열식별번호: 1과 99.9% 동일하다 (쌍별 정렬, 예컨대 엠보스-니들에서). F-박스 앞의 N-말단 서열은 덜 보존되어 있으며 이들은 기능적 (야생형) WAP5.1 단백질이다. 따라서, 한 측면에서 수박 단백질 (서열식별번호: 1 및 서열식별번호: 9), 오이 단백질 (서열식별번호: 2) 및 멜론 단백질 (서열식별번호: 3)의 기능적 변이체는 쌍별 정렬된 경우에 (예를 들어 디폴트 파라미터를 사용하는 니들 사용) 서열식별번호: 1, 9, 2 또는 3의 단백질에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질이다.
한 측면에서 아미노산 서열 변이는 F-박스 앞에 있으며, 즉 서열식별번호: 1 또는 서열식별번호: 9 (수박)의 아미노산 1 내지 236, 또는 서열식별번호: 2 (오이)의 아미노산 1 내지 243 또는 서열식별번호: 3 (멜론)의 아미노산 1 내지 246에 있다. 한 측면에서 기능적 단백질은 서열식별번호: 1, 9, 2 또는 3의 단백질에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성을 포함하고, 따라서 아미노산 237에서 시작하여 서열식별번호: 1 또는 9의 끝까지, 또는 아미노산 244에서 시작하여 서열식별번호: 2의 끝까지, 또는 아미노산 247에서 시작하여 서열식별번호: 3의 끝까지의 영역에 대해 서열식별번호: 1, 9, 2 또는 3과 100% 동일한 아미노산을 포함하며, 이는 변이가 F-박스 도메인 앞에 있기 때문이다.
F-박스 도메인 및 LRR-도메인은 고도로 보존되어 있기 때문에 (둘 다는 종 내에 및 종 간에 있음), 이들 보존된 도메인 중 어느 하나에서의 임의의 돌연변이는 생체내에서 감소된 기능을 갖거나 기능을 갖지 않는 돌연변이체 WAP5.1 단백질을 유발하여, 이에 의해 예를 들어 2배체 식물에서 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과성 표현형을 유발할 것으로 예측된다.
언급된 바와 같이, F-박스는 수박, 오이 및 멜론 WAP5.1 단백질 간에 100% 동일하다. F-박스는 일반적으로 단백질-단백질 상호작용에 관여하는 도메인이며, 따라서 F-박스에서 하나 이상의 아미노산의 삽입, 결실 또는 대체에 의한 F-박스 서열의 변화는 단백질 기능에 부정적인 영향을 미칠 것이다.
따라서, 한 측면에서 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물 또는 식물 부분이 제공되며, 여기서 상기 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (수박)의 아미노산 237에서 시작하여 아미노산 277에서 끝나는, 서열식별번호: 2 (오이)의 아미노산 244에서 시작하여 아미노산 284에서 끝나는, 서열식별번호: 3 (멜론)의 아미노산 247에서 시작하여 아미노산 287에서 끝나는 단백질의 F-박스 도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하며, 여기서 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고,
여기서 야생형 수박 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 오이 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 멜론 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩한다. 상기 언급된 바와 같이, 기능적 야생형 단백질에서 적어도 95% 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성의 변이는 한 측면에서 F-박스 도메인 앞의 N-말단 부분에, 즉 서열식별번호: 1 또는 9 (수박)의 아미노 1 내지 236의 단백질 영역, 또는 서열식별번호: 2 (오이)의 아미노산 1 내지 243, 또는 서열식별번호: 3 (멜론)의 아미노산 1 내지 246의 영역에 있다.
용어 '에서 시작하여' 및 '에서 끝나는' 또는 '부터' 및 '까지'는 언급된 첫 번째 및 마지막 아미노산을 포함한다.
LRR-도메인은 또한 하기 표에 나타낸 바와 같이 고도로 보존되어 있다 (둘 다는 종 내에 및 종 간에 있음) (니들, 디폴트 파라미터를 사용하여 LRR-도메인의 쌍별 정렬을 사용한 서열 동일성):
Figure pct00003
LRR-도메인은 또한 일반적으로 단백질-단백질 상호작용에 관여하는 도메인이며, 따라서 LRR-도메인에서 하나 이상의 아미노산의 삽입, 결실 또는 대체에 의한 LRR-도메인 서열의 변화는 단백질 기능에 부정적인 영향을 미칠 것이다. LRR-도메인은 수박의 야생형 WAP5.1 단백질에서 폴딩하는 '꼬리 유사' 구조에서 볼 수 있는 바와 같이 고도로 구조화되어 있다 (도 3a 참조). 아미노산 치환, 결실 또는 삽입은 LRR-도메인의 부적절한 폴딩을 유발할 수 있다. 이는 하기 표 1 및 도 3b에 나타낸 바와 같이 프로그램 RaptorX 접촉 예측을 사용하여 분석될 수 있으며, 여기서 단일 아미노산 치환 (L528F)은 손상된 또는 부적절한 LRR-도메인 폴딩 (야생형 LRR-도메인과 비교하여)을 초래하고, 이 돌연변이체 대립유전자는 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 초래한다.
따라서, 한 측면에서 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물 또는 식물 부분이 제공되며, 여기서 상기 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (수박)의 아미노산 291에서 시작하여 아미노산 1033에서 끝나는, 서열식별번호: 2 (오이)의 아미노산 298에서 시작하여 아미노산 1040에서 끝나는, 서열식별번호: 3 (멜론)의 아미노산 301에서 시작하여 아미노산 1043에서 끝나는 단백질의 LRR-도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고, 바람직하게는 여기서 상기 삽입, 결실 또는 대체는 단백질의 LRR-도메인의 부적절한 폴딩을 초래하며, 여기서 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고,
여기서 야생형 수박 대립유전자는 서열식별번호: 1 또는 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 오이 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 멜론 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩한다. 상기 언급된 바와 같이, 기능적 야생형 단백질에서 적어도 95% 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9% 서열 동일성의 변이는 한 측면에서 F-박스 도메인 앞의 N-말단 부분에, 즉 서열식별번호: 1 또는 9 (수박)의 아미노 1 내지 236의 단백질 영역, 또는 서열식별번호: 2 (오이)의 아미노산 1 내지 243, 또는 서열식별번호: 3 (멜론)의 아미노산 1 내지 246의 영역에 있다.
부적절한 폴딩은 RaptorX 접촉 예측에 기초하여 예측될 수 있으며, 여기서 LRR-도메인 또는 '꼬리'의 3차원 모델은 돌연변이체 단백질의 LRR 도메인 폴딩이 야생형 단백질의 꼬리-유사 폴딩에서 벗어남을 보여주며, 예를 들어 꼬리로부터 튀어나온 루프 또는 꼬리는 예를 들어 적어도 5, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 250, 300, 350, 400, 450, 500개 또는 그 초과의 C-말단 아미노산에 의해 말단절단되거나 전체 꼬리가 부재한다.
그러므로, LRR-도메인에서 하나 이상의 아미노산의 삽입, 결실 및/또는 대체는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 또는 그 초과의 아미노산의 삽입, 결실 및/또는 대체일 수 있다. 또한 코돈의 정지 코돈으로의 돌연변이를 통한 하나 이상의 아미노산의 결실이 본원에 포함된다.
돌연변이체 대립유전자는 다양한 기술, 예컨대 무작위 돌연변이유발 또는 표적화된 유전자 편집에 의해 생성될 수 있고, 그 후 돌연변이체 대립유전자의 표현형은 돌연변이체 대립유전자에 대해 동형접합성인 식물에서 분석될 수 있다.
야생형 기능적 단백질의 하나 이상의 아미노산의 삽입, 결실 및/또는 대체를 초래하는 임의의 돌연변이체 대립유전자는 감소된 기능을 갖거나 기능을 갖지 않는 돌연변이체 단백질을 초래할 수 있고, 그러므로 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과의 표현형을 초래할 수 있다. 한 측면에서 서열식별번호: 1 또는 9의 수박 WAP5.1 단백질, 서열식별번호: 2의 오이 WAP5.1 단백질 및 서열식별번호: 3의 멜론 WAP5.1 단백질 사이에 보존된 임의의 아미노산 중 하나 이상 (다중 서열 정렬 아래에 *로서 도 4에 표시됨)은 상이한 아미노산에 의해 대체되거나 결실되거나 코돈이 정지 코돈으로 돌연변이된다. 이러한 돌연변이체 대립유전자를 포함하는 식물 및 식물 부분이 본원의 한 실시양태이다.
본원에서 다수의 돌연변이체 대립유전자가 상기 표 1에 나타낸 바와 같이 수박 식물 (엘리트 TY 계통)에서 생성되었다. 이들 돌연변이체 대립유전자, 및 이들을 포함하는 수박, 오이 또는 멜론 식물 및 식물 부분이 또한 한 측면이다. 그러므로 한 측면에서 식물 또는 식물 부분은 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하며, 여기서 상기 돌연변이체 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질)의 아미노산 번호 D209, A257, A266, W274, E287, Q333, L528, P308 또는 G330을 코딩하거나 서열식별번호: 2 또는 3 내의 동등한 아미노산 (또는 서열식별번호: 2 또는 3에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질)을 코딩하는 코돈에 돌연변이를 포함한다. 이들 아미노산은 또한 도 4에서 볼 수 있는 바와 같이 3개의 종 사이에 보존되어 있으며, 여기서 이들은 굵은 글씨로 강조되어 있다. 한 측면에서 코돈에서의 돌연변이는 상이한 아미노산을 코딩하거나 정지 코돈을 코딩하도록 코돈을 변화시킨다.
'동등한 아미노산'은 아미노산 서열 정렬에 의해 쉽게 결정될 수 있다 (예를 들어 도 4 참조, 여기서 오이 및 멜론의 동등한 아미노산은 굵은 글씨로 강조됨).
코돈에서의 돌연변이는 코돈에서의 (적어도 하나의) 뉴클레오티드 삽입, 결실 또는 대체일 수 있으며, 예를 들어 상이한 리딩 프레임 또는 상이한 코돈이 예를 들어 상이한 아미노산 또는 정지 코돈을 코딩하도록 유발한다. 또한 전체 코돈은 결실되거나 상이한 코돈 (또는 임의로 정지 코돈)에 의해 대체될 수 있으며, 코딩된 아미노산의 결실 또는 이의 대체를 초래한다.
한 측면에서 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질)의 아미노산 번호 D209, A257, A266, W274, E287, Q333, L528, P308 또는 G330 또는 서열식별번호: 2 또는 3 (또는 서열식별번호: 2 또는 3에 대해 적어도 95% 서열 동일성을 포함하는 단백질) 내의 동등한 아미노산의 아미노산 치환 또는 정지 코돈을 코딩한다.
추가 측면에서 돌연변이체 대립유전자는 하기 변화 중 하나 이상을 코딩한다: 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 단백질)의 D209V, A257V, A266V, W274STOP, E287K, Q333STOP, L528F, P308L 및/또는 G330E 또는 서열식별번호: 2 또는 3 (또는 서열식별번호: 2 또는 3에 대해 적어도 95% 서열 동일성을 포함하는 단백질) 내의 동등한 아미노산.
언급된 바와 같이 수박, 오이 또는 멜론 식물 또는 종자 또는 식물 부분은 돌연변이체 wap5.1 대립유전자를 포함할 수 있으며, 여기서 돌연변이체 대립유전자는 무작위 돌연변이유발 또는 표적화된 돌연변이유발, 예컨대 CRISPR 기반 방법에 의해 생산된다. 무작위 돌연변이유발은 예를 들어 화학적 유도된 (예를 들어, EMS 처리) 또는 방사선 유도된 돌연변이유발 또는 다른 방법일 수 있으며, 여기서 돌연변이는 게놈에서 무작위로 유도된 후, 내인성 wap5.1 유전자에 돌연변이를 포함하는 식물 또는 식물 부분은 스크리닝 및 식별될 수 있다. 표적화된 돌연변이유발은 예를 들어 Crispr-Cas9, 또는 Crispr-CpfI 또는 다른 공지된 방법을 사용하여 돌연변이를 표적 유전자, 예컨대 wap5.1 유전자에 특이적으로 도입하는 방법이다. 이러한 방법을 사용하여, 예를 들어 표 1에 기재된 돌연변이체 대립유전자가 과도한 부담 없이 생성될 수 있거나 다른 돌연변이체 대립유전자가 만들어질 수 있음을 주목해야 한다.
본원에서 수박, 오이 또는 멜론 식물을 언급할 때 이는 한 측면에서 식물이 성장될 수 있는 종자를 포함하며, 즉 종자 내의 배아는 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함할 수 있다.
한 측면에서 돌연변이체 대립유전자를 포함하는 식물은 본질적으로 생물학적 프로세스에 의해 배타적으로 생산되지 않으며, 이는 돌연변이체 대립유전자가 한 지점에서 인간 개입에 의해 생성되었음을 의미한다. 이러한 인간 생성된 돌연변이체 대립유전자가 교배 및 선택에 의해 한 식물로부터 또 다른 식물로 전달되는 경우, 식물 자체가 교배 및 선택에 의해서만 생성된 경우에도 특허는 돌연변이체 대립유전자를 포함하는 식물을 포함한다. 바람직하게는 식물은 트랜스제닉이 아니고, 예를 들어 표적화된 유전자 편집의 경우에 내인성 유전자를 변형시키는데 사용된 임의의 구축물은 게놈으로부터 제거되었다. 또한 돌연변이체 wap5.1 대립유전자가 외부로부터 도입되어 식물 형질전환 기술을 사용하여 식물 게놈의 어느 곳에도 통합되지 않는다는 점에서 식물은 바람직하게는 트랜스제닉 식물이 아니며, 오히려 돌연변이체 대립유전자는 야생형 대립유전자가 위치된 게놈 내의 로커스에서 돌연변이된 (표적화된 또는 무작위 돌연변이유발 사용) 내인성, 야생형 WAP5.1 대립유전자이다.
한 측면에서 수박, 오이 또는 멜론 식물은 2배체이고, 상기 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하며, 즉 식물은 이형접합성이다. 표현형은 돌연변이체 대립유전자가 동형접합 형태인 경우에만 나타나기 때문에, 이들 식물은 통성 단위결과성이 아니지만, 수분 시 정상적인 씨있는 과실을 생산하고 꽃의 수분의 부재 하에 과실을 생산하지 않는다. 이러한 이형접합성 식물의 자가생식은 동형접합성이고 돌연변이체 대립유전자의 2개 카피를 포함하는 식물을 생성할 것이다. 한 측면에서 수박, 오이 또는 멜론 식물은 2배체이고, 상기 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하며, 즉 식물은 동형접합성이다. 따라서, 식물은 또한 통성 단위결과성이며, 수분의 부재 하에 씨없는 과실 및 수분이 일어나는 경우에 씨있는 과실을 생산한다.
돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 식물 및 식물 부분은 바람직하게는 야생 식물이 아닌 재배 식물이다. 따라서, 바람직하게는 재배 수박 (시트룰루스 라나투스), 재배 오이 (쿠쿠미스 사티부스) 또는 재배 멜론 (쿠쿠미스 멜로)이다. 식물은 근친교배 계통, F1 하이브리드 또는 육종 계통일 수 있다.
한 측면에서 식물은 수박 식물이고, 수박 식물은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 2배체, 3배체 또는 4배체이다. 2배체 식물 또는 식물 부분은 한 측면에서 2개 카피를 포함하고, 3배체 식물 또는 식물 부분은 1, 2 또는 3개 카피를 포함하고, 4배체 식물 또는 식물 부분은 돌연변이체 wap5.1 대립유전자의 2 또는 4개 카피를 포함한다.
또한 상기 기재된 바와 같은 식물 또는 식물 부분이 성장될 수 있는 종자가 본원에 포함된다.
마찬가지로 상기 기재된 식물에 의해 생산된 과실이 본원에 포함되며, 임의로 여기서 과실은 씨가 없고 수분의 부재 하에 생산된다.
따라서, 식물 또는 식물 부분은 웅성 불임을 부여하는 유전자 또는 위단위결과를 부여하는 유전자 또는 단위결과를 부여하는 또 다른 유전자를 추가로 포함할 수 있다.
식물 부분은 세포, 꽃, 잎, 줄기, 삽목, 배주, 화분, 뿌리, 근경, 접순, 과실, 원형질체, 배아, 꽃밥일 수 있다.
추가로, 식물 부분으로부터 번식되고 이의 게놈에 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 영양 번식 식물이 제공된다.
한 측면에서 또한 씨없는 수박 과실을 생산하는 방법이 제공되며, 상기 방법은 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 수박 식물을 성장시키는 단계를 포함하며, 여기서 꽃의 수분은 성장 동안 방지된다. 수분의 방지는 다양한 방법에 의해, 예를 들어 수꽃 또는 웅성 생식 기관 (수술, 화분)의 제거, 곤충이 없는 환경에서의 성장 및/또는 식물의 웅성 불임에 의해 수행될 수 있다.
추가 측면에서 씨없는 수박 과실을 생산하는 방법이 제공되며, 상기 방법은 기재된 바와 같은 돌연변이체 wap5.1 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 수박 식물을 성장시키는 단계를 포함하며, 여기서 성장 동안 수분자 식물이 존재하지 않는다.
WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 존재에 대해 식물, 종자, 식물 부분 또는 이로부터의 DNA를 스크리닝 또는 검출 또는 유전자형분석하기 위한, 또는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는 식물, 종자 또는 식물 부분을 선택하기 위한, 또는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는 식물, 종자 또는 식물 부분을 생성하기 위한 방법이 제공되며, 여기서 상기 돌연변이체 대립유전자는
a) 야생형 대립유전자와 비교하여 대립유전자의 발현 없음 또는 감소된 발현을 초래하는 조절 요소에 하나 이상의 돌연변이를 포함하고/거나,
b) 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고,
여기서 야생형 수박 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 오이 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하고, 야생형 멜론 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩한다.
한 측면에서 돌연변이체 wap5.1 대립유전자는 상기 기재된 바와 같이 삽입, 결실 또는 대체된 하나 이상의 아미노산, 예를 들어 서열식별번호: 1 또는 서열식별번호: 9의 D209, A257, A266, E287, W274, Q333, L528, P308 또는 G330 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열 내의 동등한 아미노산) 또는 서열식별번호: 2 또는 3 (또는 서열식별번호: 2 또는 3에 대해 적어도 95% 동일성을 포함하는 서열) 내의 동등한 아미노산을 포함하는 돌연변이체 WAP5.1 단백질의 발현을 초래하는 게놈 DNA에 돌연변이를 포함한다.
그러나, 또한 동형접합 형태인 경우에 통성 단위결과를 유발하는 WAP5.1 유전자의 상이한 돌연변이체 대립유전자가 본 발명의 실시양태이다. 이러한 상이한 돌연변이체 wap5.1 대립유전자는 과도한 부담 없이 통상의 기술자에 의해 생성될 수 있다. 통상의 기술자는 예를 들어 WAP5.1 유전자에서 다른 돌연변이체를 생성하고, 이들이 동일하게 2배체 수박, 오이 또는 멜론 식물에서 동형접합 형태인 경우에 통성 단위결과를 초래하는지 여부를 결정할 수 있다.
유전자의 뉴클레오티드 서열을 식별한 후, 통상의 기술자는 WAP5.1 유전자에 돌연변이체를 포함하는 수박, 멜론 또는 오이 식물을 다양한 방법, 예를 들어 돌연변이유발, TILLING 또는 CRISPR-Cas 또는 관련 기술분야에 공지된 다른 방법에 의해 생성할 수 있다. 특히 표적화된 유전자 변형 기술, 예컨대 Crispr-Cas, TALENS 등을 사용하여, 표적화된 돌연변이가 관련 기술분야의 통상의 기술자에 의해 만들어질 수 있다. 그 후, 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 식물의 표현형, 즉 통성 단위결과성을 확인할 수 있다. 따라서, 통상의 기술자는 본 발명자들에 의해 생성된 특정 WAP5.1 돌연변이체 (통상의 기술자가 또한 생성할 수 있음)에 제한되지 않지만, 통상의 기술자는 수박 및 또한 오이 및 멜론의 wap5.1 대립유전자에서 다른 돌연변이를 동일하게 생성할 수 있으며, 이에 의해 동형접합 형태인 경우에 통성 단위결과를 유발하는 다른 돌연변이체를 생성할 수 있다. 다양한 돌연변이가 생성되고 생성된 표현형에 대해 테스트될 수 있으며, 예를 들어 조절 요소는 대립유전자의 발현 (녹다운)을 감소시키거나 발현 (녹아웃)을 제거하고 그러므로 세포 또는 식물에 존재하는 WAP5.1 단백질의 양을 감소 또는 제거하도록 돌연변이될 수 있다. 대안적으로, WAP5.1 단백질의 감소된 기능 또는 기능 상실을 유발하는 돌연변이, 즉 하나 이상의 아미노산이 치환, 삽입 또는 결실되도록 유발하는 돌연변이 (예컨대 미스센스 돌연변이 또는 프레임 시프트 돌연변이) 또는 코딩 서열에서 정지-코돈의 도입을 통해 단백질이 말단절단되는 돌연변이 (넌센스 돌연변이)가 생성될 수 있다. WAP5.1 단백질이 2개의 보존된 도메인, "F-박스 도메인" 및 "LRR-도메인"을 포함하기 때문에, 한 측면에서 하나 이상의 아미노산이 이들 도메인 중 어느 하나에서 대체, 결실 또는 삽입되는 것이 포함되며, 이는 이러한 돌연변이가 단백질 기능을 감소시키거나 기능 상실을 초래할 가능성이 있기 때문이다. 그 후, 돌연변이가 예상된 표현형 (통성 단위결과)을 초래하는지 여부는 자가생식을 통해 돌연변이에 대해 동형접합성인 식물을 생성하고, 꽃의 수분의 존재 및 부재 하에 식물 계통을 성장시켜 과실이 통성 단위결과성 방식으로 발달하는지 확인함으로써 테스트될 수 있다.
대안적으로, 통상의 기술자는 하기 단계를 포함하는, 통성 단위결과성 재배 수박, 오이 또는 멜론 식물을 생산하는 방법을 수행할 수 있다:
a) 수박, 오이 또는 멜론 식물(들) 또는 종자(들), 특히 재배 식물(의 집단)에 돌연변이를 도입하거나, 또는 돌연변이된 식물(들) 또는 종자 또는 이의 자손(의 집단)을 제공하는 단계;
b) 암꽃의 수분 없이 씨없는 과실을 생산하고 암꽃의 수분 후 씨있는 과실을 생산하는 식물을 선택하는 단계;
c) 임의로 b)에서 선택된 식물이 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는지 결정하는 단계; 및
d) 임의로 c)에서 수득된 식물을 성장시키는 단계.
단계 b)는 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물을 선택하는 단계이고, 단계 c)는 식물 (또는 자가생식에 의해 생산된 이의 자손)이 암꽃의 수분 없이 씨없는 과실을 생산하고 암꽃의 수분 후 씨있는 과실을 생산하는지 결정하는 단계가 되도록, 단계 b) 및 c)는 또한 전환될 수 있다.
단계 a)는 예를 들어 수박, 오이 또는 멜론의 하나 이상의 계통 또는 품종의 종자의 돌연변이유발에 의해, 예를 들어 돌연변이유발제, 예컨대 화학적 돌연변이원, 예를 들어 EMS (에틸 메탄 술포네이트)를 사용한 처리, 또는 UV 방사선, X선 또는 감마선 등을 사용한 조사에 의해 수행될 수 있다. 집단은 예를 들어 TILLING 집단일 수 있다. 바람직하게는 돌연변이유발된 식물 집단은 단계 b)를 수행하기 전에 적어도 1회 자가생식된다 (예를 들어, M2 세대, 또는 M3, M4 등을 생산하기 위해). 표현형분석과 관련된 단계 b)에서, 식물은 바람직하게는 곤충 화분매개자의 존재를 회피하기 위해 곤충 방지 환경에서 성장된다. 암꽃의 정기적인 육안 검사, 수분 없이 꽃의 과실 결실 및 성숙 과실의 육안 검사 (예를 들어, 생존가능한 종자의 존재 또는 씨없음)는 암꽃의 수분 없이 씨없는 과실을 생산하는 돌연변이체를 식별하기 위해 수행될 수 있다. 이러한 식물 또는 이의 자가생식 자손은 수분 후 과실이 씨가 있는지 확인하기 위해 암꽃을 수분함으로써, WAP5.1 유전자 및 코딩된 단백질에서의 돌연변이에 대해 식물을 유전자형분석함으로써, 또는 WAP5.1 유전자의 발현, 시퀀싱 및 통상의 기술자에게 공지된 다른 방법에 의해 돌연변이체 WAP5.1 유전자의 존재에 대해 테스트될 수 있다. 그러므로, 표현형적으로 선택된 식물이 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는지 확인하기 위한 다양한 방법 또는 방법의 조합이 있다.
단계 b)가 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물의 선택인 경우, 통상의 기술자는 또한 돌연변이체 wap5.1 대립유전자를 포함하는 식물을 식별하기 위해 WAP5.1 유전자의 DNA, mRNA 또는 단백질을 검출하기 위한 다양한 방법을 사용할 수 있다. 기능적 WAP5.1 단백질 (서열식별번호: 1)을 코딩하는 야생형 수박 wap5.1 유전자의 게놈 DNA는 서열식별번호: 7의 DNA이고, 서열식별번호: 1의 단백질을 코딩하는 cDNA (mRNA)는 서열식별번호: 6에 제공된다. 기능적 WAP5.1 단백질 (서열식별번호: 9)을 코딩하는 야생형 수박 wap5.1 유전자의 게놈 DNA는 서열식별번호: 14의 DNA이고, 서열식별번호: 9의 단백질을 코딩하는 cDNA (mRNA)는 서열식별번호: 11에 제공된다. 프로모터는 이 서열의 상류에 있고, 예를 들어 시퀀싱에 의해 또는 수박 게놈 데이터베이스로부터 검색될 수 있다. 마찬가지로, 오이 또는 멜론 WAP5.1 유전자의 프로모터 서열은 통상의 기술자에 의해 쉽게 검색될 수 있다. 특정 단백질을 코딩하는 게놈 서열은 약간 다를 수 있기 때문에 (예를 들어, 유전자 코드의 축퇴로 인해 또는 인트론 서열의 변이로 인해), 야생형 WAP5.1 단백질을 코딩하는 게놈 대립유전자는 서열식별번호: 7 및/또는 서열식별번호: 14에 대해 적어도 90%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 서열 동일성을 포함할 수 있다.
한 측면에서 WAP5.1 유전자의 돌연변이체 대립유전자는 WAP5.1 유전자의 감소된 발현 또는 발현 없음을 초래하는 돌연변이체 대립유전자이거나, 또는 야생형 WAP5.1 단백질과 비교하여 코딩된 WAP5.1 단백질의 하나 이상의 아미노산이 대체, 삽입 또는 결실되도록 초래하는 돌연변이체 대립유전자이다.
한 측면에서 WAP5.1 유전자의 돌연변이체 대립유전자는 유전자 (프로모터 또는 다른 조절 요소, 스플라이스 부위, 코딩 영역 등)에 표적화된 또는 무작위 돌연변이를 유도하고, 돌연변이체 wap5.1 대립유전자를 포함하는 식물 (예를 들어 자손으로부터)을 선택함으로써 수득가능하다. 한 측면에서 코돈, 특히 F-박스 또는 LRR-도메인의 코돈에 돌연변이를 포함하는 대립유전자, 예를 들어 아미노산 대체, 프레임 시프트 또는 정지-코돈을 야기하는 돌연변이가 선택된다. 한 측면에서 돌연변이체 대립유전자는 수박 WAP5.1 유전자에서 표 1에 표시된 변화 또는 오이 또는 멜론 WAP5.1 유전자에서 동등한 변화를 야기한다.
한 측면에서 서열식별번호: 8 (마커 mWM23348429)의 뉴클레오티드 61에 있는 SNP 마커 티민 (T)은 수박, 멜론 또는 오이 식물 또는 식물 부분의 게놈 또는 이로부터의 DNA에서 검출된다.
이 SNP 마커는 수박에서 L528F 돌연변이를 포함하는 대립유전자, 또는 오이 또는 멜론 wap5.1 대립유전자의 상응하는 아미노산 변화를 검출한다. 티민을 포함하는 게놈 영역은 서열식별번호: 8의 서열과 적어도 92%, 93%, 94%, 95%, 96% 또는 97% 동일할 수 있고 (서열에 2개의 'Y' 뉴클레오티드가 있기 때문에, 뉴클레오티드는 피리미딘 (C 또는 T)을 지칭함), 서열식별번호: 8의 뉴클레오티드 61에 있는 SNP를 플랭킹하는 게놈 서열에 다른 동일하지 않은 뉴클레오티드가 있을 수 있음을 주목해야 한다. 수박 찰스턴 그레이 게놈에 대한 서열식별번호: 8의 Blast는 예를 들어 서열식별번호: 8이 돌연변이가 결여되어 있고 게놈 서열의 뉴클레오티드 61에 C (시토신)을 포함하는 찰스턴 그레이 참조 게놈과 97.52% 동일함을 보여준다.
다른 돌연변이체 wap5.1 대립유전자의 경우, 유사한 SNP 마커 (또는 다른 마커) 및 SNP 유전자형분석 (또는 다른 유전자형분석) 검정이 쉽게 설계될 수 있다. 그러므로, 특히 수박, 오이 또는 멜론의 WAP5.1 단백질의 F-박스 또는 LRR-도메인에서 아미노산 삽입, 결실 또는 대체를 초래하는 임의의 돌연변이체 대립유전자에 대한 대립유전자 특이적 마커 및 검출 방법이 본원에 포함된다.
특히 한 측면에서 마커 mWM23348429의 유전자형은 서열식별번호: 8의 뉴클레오티드 61에 티민을 포함하고 그러므로 서열식별번호: 1 또는 9의 아미노산 L528 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열의 상응하는 아미노산)이 F (페닐알라닌)에 의해 대체되거나, 또는 멜론 또는 오이에서 상응하는 L (류신)이 F (페닐알라닌)에 의해 대체된 돌연변이체 wap5.1 대립유전자를 포함하는 식물 또는 자손 식물을 선택하기 위해 결정 및 사용될 수 있으며, 여기서 상응하는 아미노산은 오이에서 서열식별번호: 2의 L535 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열의 상응하는 아미노산) 및 멜론에서 서열식별번호: 3의 L538 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열의 상응하는 아미노산)이다.
wap5.1에 대해 이형접합성인 2배체 식물 (즉, wap5.1/WAP5.1)은 SNP 마커에 대해 이형접합성일 것이며, 예를 들어 서열식별번호: 8의 뉴클레오티드 61에 대한 유전자형 'TC'를 가질 것인 반면 (즉, 식물은 서열식별번호: 8의 뉴클레오티드 61에 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 티민 (T)을 갖는 하나의 염색체 및 서열식별번호: 8의 뉴클레오티드 61에 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 시토신 (C)을 갖는 제2 염색체을 포함함), wap5.1에 대해 동형접합성인 식물 (즉, wap5.1/wap5.1)은 서열식별번호: 8의 뉴클레오티드 61에 대한 유전자형 'TT'를 가질 것이다 (즉, 식물은 둘 다 서열식별번호: 8의 뉴클레오티드 61에 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 티민 (T)을 갖는 2개의 염색체를 포함함).
마커 mWM23348429는 서열식별번호: 7의 야생형 WAP5.1 유전자의 게놈 DNA에서 뉴클레오티드 4123 (시토신)의 티민 (C4123→T)으로의 유도된 돌연변이에 기초하여 설계되었으며, 여기서 코돈 CTT (류신을 코딩함)는 코돈 TTT (페닐알라닌을 코딩함)로 변화되어, 수박 WAP5.1 단백질에서 L528P 치환을 초래한다. 그러므로, 서열식별번호: 7의 게놈 WAP5.1 서열의 뉴클레오티드 4123은 서열식별번호: 8의 마커 mWM23348429의 뉴클레오티드 61에 상응한다.
마찬가지로, 서열식별번호: 14의 게놈 DNA에서 마커 mWM23348429는 서열식별번호: 14의 야생형 WAP5.1 유전자의 게놈 DNA에서 뉴클레오티드 4118 (시토신)의 티민 (C4118→T)으로의 돌연변이에 대한 SNP를 포함하며, 여기서 코돈 CTT (류신을 코딩함)는 코돈 TTT (페닐알라닌을 코딩함)로 변화되어, 수박 WAP5.1 단백질에서 L528P 치환을 초래한다.
돌연변이체-대립유전자-특이적 마커 및 마커 검정은 임의의 돌연변이체 wap5.1 대립유전자에 대해 동일하게 쉽게 개발될 수 있으며, 근본적인 게놈 변화 (예를 들어 코돈에서)가 게놈 변화, 예를 들어 표 1에 개시된 근본적인 아미노산 변화 또는 야생형 WAP5.1 대립유전자와 비교하여 돌연변이체 wap5.1 대립유전자의 다른 게놈 변화를 검출하기 위한 마커 검정을 설계하는데 사용될 수 있기 때문이다.
특이적 돌연변이체 wap5.1 대립유전자를 검출하는 이러한 대립유전자-특이적 마커를 사용하여, 유전자형분석은 식물 및 식물 물질 (또는 이로부터 유래된 DNA)에서 대립유전자의 존재 및 카피 수를 검출하기 위해 수행될 수 있다. 따라서 2배체에서, 상기 돌연변이체 wap5.1 대립유전자에 대한 마커 유전자형 (수박에서 단백질의 L528F 변화 또는 오이 또는 멜론에서 상응하는 변화의 기초가 됨)은 돌연변이체 대립유전자가 동형접합 형태인 경우 'TT'이다. 3배체 또는 4배체에서 마커 유전자형은 돌연변이체 대립유전자의 카피 수를 결정하는데 사용될 수 있다. 그러므로 유전자형은 예를 들어 3배체에 3개 카피가 존재하는 경우 TTT, 또는 4배체에 4개 카피가 존재하는 경우 TTTT, 또는 3배체에 2개 카피가 존재하는 경우 TTC 등일 수 있다.
식물 및 식물 부분
한 실시양태에서 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 재배 수박, 오이 또는 멜론 식물 또는 이의 부분 (예컨대 세포, 조직, 기관, 과실 등)이 제공되며, 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여한다.
한 측면에서 돌연변이체 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 WAP5.1 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9 (야생형 기능적 단백질)에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 수박 유전자의 돌연변이체 대립유전자이거나, 또는 서열식별번호: 2의 WAP5.1 단백질 또는 서열식별번호: 2 (야생형 기능적 단백질)에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 오이 유전자의 돌연변이체 대립유전자이거나, 또는 서열식별번호: 3의 WAP5.1 단백질 또는 서열식별번호: 3 (야생형 기능적 단백질)에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 멜론 유전자의 돌연변이체 대립유전자이며, 여기서 돌연변이체 대립유전자는 감소된 발현 또는 발현 없음을 갖거나, 또는 여기서 돌연변이체 대립유전자는 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 WAP5.1 단백질을 코딩한다.
한 실시양태에서 하나 이상의 아미노산 대체, 삽입 또는 결실은 보존된 도메인, 즉 F-박스 도메인 및 LRR-도메인 중 하나 또는 둘 다에서 하나 이상의 아미노산의 대체, 삽입 또는 결실을 포함하거나 이로 이루어진다. 돌연변이체 단백질은 야생형 단백질과 비교하여 (및 그러므로 야생형 WAP5.1 유전자를 포함하는 야생형 식물과 비교하여) 감소된 기능 또는 기능 상실을 가지며, 바람직하게는 동형접합 형태의 돌연변이체 대립유전자를 포함하는 식물 세포 또는 식물은 통성 단위결과성이다.
본원에서 특정 뉴클레오티드 또는 아미노산 위치를 언급할 때 (예를 들어 서열식별번호: 1 또는 9의 아미노산 528에서, "또는 서열식별번호에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 서열의 아미노산 528에서" (또는 '적어도 95% …를 포함하는 서열의 동등한 위치에서')), 이는 뉴클레오티드 또는 아미노산이 변이체 서열, 즉 언급된 서열식별번호에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 서열에서 동일한 뉴클레오티드 또는 아미노산 (예를 들어, 서열식별번호: 1 또는 9의 아미노산 528에 상응함)에 상응하는 뉴클레오티드 또는 아미노산에서 변이체 서열에 존재함을 의미한다. 예를 들어 변이체 서열은 하나 또는 몇 개의 뉴클레오티드 또는 아미노산이 더 짧을 수 있지만, 변이체 서열을 언급된 서열식별번호와 쌍별 정렬할 때, 변이체 서열의 어떤 뉴클레오티드 또는 아미노산이 동일한 뉴클레오티드 또는 아미노산에 상응하는지 확인할 수 있다. 변이체 서열에서 이는 예를 들어 언급된 서열의 아미노산 528에 상응하는 변이체 서열의 아미노산 527 또는 529일 수 있다.
돌연변이체 대립유전자는 재배 수박, 오이 및 멜론의 내인성 유전자의 돌연변이이다. 통성 단위결과를 부여하는 유전자의 존재는 통상의 기술자가 예를 들어 임의의 재배된 계통 또는 품종에서 유전자의 다른 드 노보 돌연변이체를 생성하는 것을 가능하게 한다.
통상의 기술자는 과도한 부담 없이 예를 들어 돌연변이체 집단에서 WAP5.1 돌연변이체의 생성 및/또는 식별을 위한 방법을 수행함으로써 또는 WAP5.1 유전자의 표적화된 유전자 편집에 의해 본 발명에 따른 식물을 생성할 수 있다.
상기 언급된 바와 같이, WAP5.1 유전자는 정상적인 비-단위결과성 수박 식물에서 서열식별번호: 1 또는 9의 단백질 (야생형 수박 단백질)을 코딩하는 유전자인 것으로 식별되었기 때문에, 본 발명자들에 의해 생성된 것과 다른 돌연변이체 (예를 들어, 서열식별번호: 4 또는 서열식별번호: 10의 돌연변이체 단백질, 또는 상기 표 1에 언급된 다른 돌연변이체 단백질을 코딩함)가 드 노보 생성될 수 있다. 오이 및 멜론도 마찬가지이며, 또한 여기서 임의의 돌연변이체가 드 노보 생성될 수 있다.
야생형 기능적 WAP5.1 단백질에 자연 변이가 존재할 수 있기 때문에, 야생형 WAP5.1 단백질은 서열식별번호: 1, 9, 2 또는 3의 단백질과 100% 동일할 필요는 없지만, 서열식별번호: 1, 9, 2 또는 3에 대해 더 적은 서열 동일성, 예를 들어 서열식별번호: 1, 9, 2 또는 3에 대해 전체 길이에 걸쳐 쌍별 정렬된 경우에 적어도 95% 96%, 97%, 98%, 99% 또는 99.5% 또는 99.6%, 99.7%, 99.8% 또는 99.9%를 가질 수 있다. 그러나 한 측면에서 보존된 F-박스 도메인은 서열식별번호: 1, 9, 2 또는 3의 것과 100% 동일하므로, 적어도 95% 동일성의 변이는 F-박스 도메인의 외부에 있다. 또 다른 측면에서 보존된 LRR-도메인은 서열식별번호: 1, 9, 2 또는 3의 것과 100% 동일하므로, 적어도 95% 동일성의 변이는 LRR-도메인의 외부에 있다. 추가 측면에서 적어도 95% 동일성의 변이는 LRR-도메인의 외부 및 LRR-도메인의 외부에 있다. 또 다른 측면에서 서열식별번호: 1, 9, 2 또는 3의 기능적 야생형 단백질에서 적어도 95% 서열 동일성의 변이는 F-박스 도메인 앞의 N-말단 부분에, 즉 서열식별번호: 1 또는 9 (수박)의 아미노 1 내지 236의 단백질 영역, 또는 서열식별번호: 2 (오이)의 아미노산 1 내지 243, 또는 서열식별번호: 3 (멜론)의 아미노산 1 내지 246의 영역에 있다.
언급된 바와 같이, WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자는 식물이 돌연변이체 대립유전자에 대해 동형접합성인 경우 (특히 돌연변이체 대립유전자에 대해 동형접합성인 2배체 식물 및 임의로 돌연변이체 대립유전자의 적어도 1, 2 또는 3개 카피를 포함하는 3배체 식물 또는 돌연변이체 대립유전자의 적어도 2 또는 4개 카피를 포함하는 4배체 식물) 식물이 수분의 부재 하에 씨없는 과실 및 수분의 존재 하에 씨있는 과실을 생산하도록 야기한다. 본 발명의 실시양태와 관련하여, WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자에서의 돌연변이는 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이 및/또는 조절 서열에서의 돌연변이를 포함하는 임의의 돌연변이일 수 있다. 한 측면에서 WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자에서의 돌연변이는 점 돌연변이이다. 돌연변이는 WAP5.1 단백질-코딩 유전자의 코딩 서열을 포함하는 DNA 서열에서 또는 WAP5.1 단백질을 코딩하는 RNA 서열에서 발생할 수 있거나, WAP5.1 단백질의 아미노산에서 발생할 수 있다. WAP5.1 단백질-코딩 유전자의 DNA 서열과 관련하여 돌연변이는 코딩 서열에서 발생할 수 있거나, WAP5.1 단백질 -코딩 유전자의 비-코딩 서열, 예컨대 5'- 및 3'-비번역된 영역, 프로모터, 인핸서 등에서 발생할 수 있다. WAP5.1 단백질을 코딩하는 RNA와 관련하여 돌연변이는 프리-mRNA 또는 mRNA에서 발생할 수 있다. 한 측면에서 돌연변이체 대립유전자는 하나 이상의 아미노산이 대체, 삽입 및/또는 결실됨으로 인해 (예를 들어 보존된 F-박스 도메인 또는 LRR-도메인에서 하나 이상의 아미노산이 대체, 삽입 또는 결실되도록 초래함) 기능 상실 또는 기능 감소를 갖는 단백질을 초래한다. 예를 들어, 이들 도메인 중 하나 또는 둘 다, 또는 이들 도메인 중 하나의 일부의 결실을 야기하는 단백질의 말단절단은 단백질의 기능 상실 또는 기능 감소를 초래할 것이다. 그러므로, 정지 코돈 돌연변이, 예를 들어 F-박스 도메인 앞의 N-말단 부분에 (서열식별번호: 1 또는 9의 아미노산 1 내지 236 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 서열 동일성을 포함하는 서열; 서열식별번호: 2의 아미노산 1 내지 243 또는 서열식별번호: 2에 대해 적어도 95% 서열 동일성을 포함하는 서열; 서열식별번호: 3의 아미노산 1 내지 246 또는 서열식별번호: 3에 대해 적어도 95% 서열 동일성을 포함하는 서열) 또는 보존된 도메인 중 하나에 있는 정지 코돈 돌연변이는 감소된 기능 또는 기능 상실을 갖는 말단절단된 단백질을 초래한다.
마찬가지로, F-박스 도메인 또는 보존된 도메인 중 하나, 즉 F-박스 도메인 또는 LRR-도메인 앞의 N-말단 부분에서 아미노산 삽입, 결실 또는 대체는 감소된 기능 또는 기능 상실을 갖는 단백질을 초래할 수 있다.
한 측면에서 RaptorX 접촉 예측 분석에 의해 예측된 바와 같은 일탈적/부적절한 3차원 단백질 폴딩을 초래하는 임의의 아미노산 삽입, 결실 및/또는 대체는 돌연변이체 WAP5.1 단백질의 감소된 생체내 기능 또는 기능 없음을 초래할 가능성이 있다.
임의의 돌연변이체 대립유전자는 실제로 식물이 통성 단위결과성이 되는지 확인하기 위해 예를 들어 2배체 식물에서 대립유전자가 동형접합 형태인 경우에 표현형에 대해 분석될 수 있다.
따라서 본 발명의 한 실시양태는 WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자를 포함하는 본 발명에 따른 식물 세포 또는 식물에 관한 것이며, 돌연변이체 대립유전자는 하기로 이루어진 군으로부터 선택된 하나 이상의 돌연변이를 포함 또는 수행하는 것을 특징으로 한다:
a) 게놈 서열에서의 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이;
b) 하나 이상의 조절 서열에서의 돌연변이;
c) 코딩 서열에서의 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이;
d) 프리-mRNA 또는 mRNA에서의 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이; 및/또는
e) WAP5.1 단백질에서의 하나 이상의 아미노산의 결실, 말단절단, 삽입 또는 대체.
한 측면에서 돌연변이체 대립유전자는 WAP5.1 유전자의 감소된 발현 또는 발현 없음을 초래하거나, 돌연변이체 대립유전자는 감소된 기능 또는 기능 상실을 갖는 단백질을 코딩한다.
감소된 발현 또는 발현 없음은 WAP5.1 유전자의 조절 영역, 예컨대 프로모터에 돌연변이가 있음을 의미하며, 여기서 야생형 WAP5.1 대립유전자를 포함하는 식물 및 식물 부분과 비교하여 WAP5.1 대립유전자의 감소된 mRNA 전사체가 만들어지거나 mRNA 전사체가 만들어지지 않는다. 예를 들어 발현의 감소는 예를 들어 노던 블롯 분석 또는 RT-PCR을 사용하여 WAP5.1 단백질을 코딩하는 mRNA 전사체의 양을 측정함으로써 결정될 수 있다. 여기서, 감소는 바람직하게는 야생형 WAP5.1 유전자를 포함하는 식물 또는 식물 부분과 비교하여 적어도 50%만큼, 특히 적어도 70%만큼, 임의로 적어도 85%만큼 또는 적어도 95%만큼, 또는 심지어 100%만큼 (발현 없음) RNA 전사체의 양의 감소를 의미한다. 발현은 예를 들어 어린 잎 조직 또는 씨방 조직에서 분석될 수 있다.
한 측면에서 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 단백질. 그러므로, 수박의 경우, 서열식별번호: 1 또는 9의 야생형 WAP5.1 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 WAP5.1 단백질과 비교하여 하나 이상의 아미노산이 삽입, 결실 또는 대체되고; 오이의 경우, 서열식별번호: 2의 야생형 WAP5.1 단백질 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 WAP5.1 단백질과 비교하여 하나 이상의 아미노산이 삽입, 결실 또는 대체되고; 멜론의 경우, 서열식별번호: 3의 야생형 WAP5.1 단백질 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 WAP5.1 단백질과 비교하여 하나 이상의 아미노산이 삽입, 결실 또는 대체되며, 여기서 돌연변이체 단백질은 야생형 단백질과 비교하여 감소된 기능 또는 기능 상실을 가지며, 그러므로 2배체 식물에서 돌연변이체 대립유전자가 동형접합 형태로 존재하는 경우에 통성 단위결과를 초래한다.
한 측면에서 야생형 WAP5.1 단백질은 보존된 F-박스 도메인을 포함한다. 그러므로 한 측면에서 돌연변이체 대립유전자는 유전자 WAP5.1의 돌연변이체 대립유전자이며, 상기 유전자는 서열식별번호: 1 또는 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)의 야생형 단백질, 또는 서열식별번호: 1 또는 9, 서열식별번호: 2 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 단백질을 코딩하고, 여기서 야생형 단백질은 서열식별번호: 1 또는 9의 아미노산 237 내지 277의 보존된 F-박스 도메인을 포함한다.
한 측면에서 야생형 WAP5.1 단백질은 보존된 LRR-도메인을 포함한다. 그러므로 한 측면에서 돌연변이체 대립유전자는 유전자 WAP5.1의 돌연변이체 대립유전자이며, 상기 유전자는 서열식별번호: 1 또는 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)의 야생형 단백질, 또는 서열식별번호: 1 또는 9, 서열식별번호: 2 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 야생형 단백질을 코딩하고, 여기서 수박 야생형 단백질은 서열식별번호: 1 또는 9 (수박)의 아미노산 291 내지 1033의 보존된 LRR-도메인을 포함하거나, 오이 야생형 단백질은 서열식별번호: 2 (오이)의 아미노산 298 내지 1040의 보존된 LRR-도메인을 포함하거나, 멜론 야생형 단백질은 서열식별번호: 3 (멜론)의 아미노산 301 내지 1043의 보존된 LRR-도메인을 포함한다.
한 측면에서 야생형 WAP5.1 단백질은 보존된 F-박스 및 LRR-도메인을 포함하며, 즉 기능적 야생형 단백질의 임의의 변이는 F-박스 도메인 앞의 N-말단에 있다. 그러므로 한 측면에서 돌연변이체 대립유전자는 유전자 WAP5.1의 돌연변이체 대립유전자이며, 상기 유전자는 서열식별번호: 1 또는 9 (수박) 또는 서열식별번호: 2 (오이) 또는 서열식별번호: 3 (멜론)의 야생형 단백질, 또는 서열식별번호: 1 또는 9, 서열식별번호: 2 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하고, 여기서 수박 야생형 단백질은 서열식별번호: 1 또는 9 (수박)의 아미노산 237 내지 1033을 포함하거나, 오이 야생형 단백질은 서열식별번호: 2 (오이)의 아미노산 244 내지 1040을 포함하거나, 멜론 야생형 단백질은 서열식별번호: 3 (멜론)의 아미노산 247 내지 1043을 포함한다.
상기 야생형 대립유전자의 돌연변이체 대립유전자는 한 측면에서 감소된 발현 또는 발현 없음 (예를 들어 프로모터 또는 인핸서 요소에서의 돌연변이를 통해)을 갖거나 야생형 단백질과 비교하여 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 생산하는 돌연변이체 대립유전자이며, 여기서 예를 들어 돌연변이체 단백질의 3차원 단백질 폴딩은 RaptorX 접촉 예측에 의해 분석될 수 있는 바와 같이 야생형 폴딩으로부터 벗어났고/거나, 돌연변이체 단백질은 식물에서 돌연변이체 대립유전자가 동형접합 형태인 경우에 결정될 수 있는 바와 같이 및 수분의 부재 하에 (단위결과), 예를 들어 곤충이 없는 환경에서 성장되는 경우에 식물이 과실을 생산하는지 여부 및 수분되지 않았음에도 불구하고 (자성) 꽃이 과실을 생산하는지 여부를 분석함으로써 생체내에서 감소된 기능 또는 기능 없음을 갖는다. 또한, 식물은 (자성) 꽃이 수분되는 경우에 정상적인 씨있는 과실을 생산하는지 여부에 대해 테스트될 수 있다. 돌연변이체 대립유전자가 생체내에서 통성 단위결과를 야기하는 반면, 야생형 WAP5.1 대립유전자만을 포함하는 대조군 식물은 통성 단위결과성이 아닌 경우, 돌연변이체 단백질은 야생형 단백질과 비교하여 감소된 기능 또는 기능 없음을 갖는다. 감소된 유전자 발현 또는 유전자 발현 없음을 갖는 돌연변이체 대립유전자에 대해 동일한 표현형 분석이 수행될 수 있다. 그러므로, 임의의 돌연변이체 대립유전자는 식물에서 동형접합성으로 만들어질 수 있고, 표현형은 원래의 비-돌연변이된 대립유전자를 포함하는 대조군 식물과 비교될 수 있다.
F-박스 도메인은 도 4에 나타낸 바와 같이 3개의 쿠쿠르비타세아에(Cucurbitaceae) 종, 수박, 멜론 및 오이 간에 동일한 것으로 밝혀졌다. 이것은 서열 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL (서열식별번호: 13)을 포함하며, 이는 서열식별번호: 1 및 9의 야생형 ClWAP5.1의 아미노산 237 내지 277, 서열식별번호: 2의 야생형 CsWAP5.1의 아미노산 244 내지 284, 서열식별번호: 3의 야생형 CmWAP5.1의 아미노산 247 내지 287에 존재한다.
필시, F-박스는 고도로 보존되어 있고 단백질의 적절한 기능 (필시 단백질-단백질 상호작용을 통해)에 필요하기 때문에 다른 야생형 기능적 WAP5.1 변이체에서도 100% 동일할 것이다. 따라서, 이의 아미노산 중 하나 이상을 삽입, 결실 또는 대체함으로써 F-박스를 돌연변이시키는 것은 생체내에서 WAP5.1 단백질 기능을 감소 또는 폐지할 것이다.
한 측면에서, 따라서, 본원에 제공된 식물은 서열 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL (서열식별번호: 13)의 F-박스 도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 WAP5.1 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함한다. 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하도록 돌연변이된 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 ClWAP5.1 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 단백질, 서열식별번호: 2의 CsWAP5.1 또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 단백질, 및 서열식별번호: 3의 CmWAP5.1 또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 단백질로부터 선택되며, 여기서 모든 야생형 단백질은 서열 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL (서열식별번호: 13)의 F-박스 도메인을 포함한다.
추가 측면에서 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하도록 돌연변이된 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 ClWAP5.1, 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 단백질, 서열식별번호: 2의 CsWAP5.1 또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 단백질, 및 서열식별번호: 3의 CmWAP5.1 또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 단백질로부터 선택되며, 여기서 모든 야생형 단백질은 서열 LTDDLLHMVFSFLDHINLCRAAIVCRQWQAASAHEDFWRCL (서열식별번호: 13)의 F-박스 도메인을 포함하고, 여기서 '적어도 95%' 서열 변이는 F-박스 도메인 앞의 단백질의 N-말단 부분에서 발견된다. 그러므로, 한 측면에서, F-박스의 시작부터 단백질의 끝까지의 영역은 서열식별번호: 1, 9, 2 또는 3과 서열이 100% 동일하다.
F-박스 도메인에서 하나 이상의 아미노산의 변화를 유발하는 프레임 시프트를 포함하는 돌연변이체 단백질 또는 F-박스 도메인의 하나 이상의 아미노산의 결실을 유발하는 말단절단을 포함하는 돌연변이체 단백질은 생체내에서 감소된 기능 또는 기능 없음을 포함하는 돌연변이체 단백질인 것으로 본원에 포함된다.
표 1 및 도 4에 나타낸 바와 같이, F-박스 도메인에서 3개의 특이적 돌연변이체가 수박에서 생성되었다. 한 측면에서 ClWAP5.1, CsWAP5.1 또는 CmWAP5.1 단백질의 F-박스 도메인에서 이들 3개의 특이적 돌연변이체 중 임의의 것을 각각 포함하는 수박, 오이 또는 멜론 식물이 본원에 포함된다.
한 측면에서 따라서 돌연변이체 단백질을 코딩하는 돌연변이체 ClWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 A257, 서열식별번호: 1 또는 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 A266 및/또는 서열식별번호: 1 또는 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 W274는 또 다른 아미노산에 의해 대체되거나 결실된다.
또 다른 측면에서 따라서 돌연변이체 단백질을 코딩하는 돌연변이체 CsWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 A264, 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 A273 및/또는 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 W281은 또 다른 아미노산에 의해 대체되거나 결실된다.
또 다른 측면에서 따라서 돌연변이체 단백질을 코딩하는 돌연변이체 CmWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 A267, 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 A276 및/또는 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 W284는 또 다른 아미노산에 의해 대체되거나 결실된다.
하나의 아미노산부터 또 다른 아미노산까지의 아미노산이 본원에서 언급될 때 이는 언급된 시작/첫 번째 및 끝/마지막 아미노산을 포함한다.
LRR-도메인은 도 4에 나타낸 바와 같이 3개의 쿠쿠르비타세아에 종, 수박, 멜론 및 오이 사이에 고도로 보존된 것으로 밝혀졌다. LRR-도메인은 수박 및 오이 사이에 96.2% 동일하고, 수박 및 멜론 사이에 98% 동일하고, 오이 및 멜론 사이에 97.8% 동일하다 (엠보스-니들을 사용한 쌍별 정렬에서). 또한 도 3a에서 볼 수 있는 바와 같이 이는 일종의 '꼬리'로 폴딩하기 때문에 고도로 구조화되어 있다.
LRR-도메인은 서열식별번호: 1 및 서열식별번호: 9의 야생형 ClWAP5.1의 아미노산 291 내지 1033, 서열식별번호: 2의 야생형 CsWAP5.1의 아미노산 298 내지 1040 및 서열식별번호: 3의 야생형 CmWAP5.1의 아미노산 301 내지 1043에 존재한다. 필시, LRR-도메인은 고도로 보존되어 있고 단백질의 적절한 3차원 폴딩 및 적절한 기능 (필시 단백질-단백질 상호작용을 통해)에 필요하기 때문에 다른 야생형 기능적 WAP5.1 변이체에서도 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인과 적어도 95%, 96%, 97%, 98% 또는 99% 동일할 것이다. 따라서, 이의 아미노산 중 하나 이상을 삽입, 결실 또는 대체함으로써 LRR-도메인을 돌연변이시키는 것은 도메인의 상이한 3차원 단백질 폴딩을 초래하고/거나 생체내에서 WAP5.1 단백질 기능을 감소 또는 폐지할 것이다.
한 측면에서, 따라서, 본원에 제공된 식물은 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인, 또는 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인과 적어도 95%, 96%, 97%, 98% 또는 99% 동일한 LRR-도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 WAP5.1 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함한다.
또 다른 측면에서, 따라서, 본원에 제공된 식물은 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인, 또는 변이체 야생형 WAP5.1 단백질의 LRR-도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 WAP5.1 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함하며, 상기 야생형 단백질은 서열식별번호: 1, 9, 2 또는 3에 대해 적어도 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 포함한다.
한 측면에서 LRR-도메인에서 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하도록 돌연변이된 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 ClWAP5.1, 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 단백질, 서열식별번호: 2의 CsWAP5.1 또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 단백질, 및 서열식별번호: 3의 CmWAP5.1 또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 단백질로부터 선택되며, 여기서 모든 야생형 단백질은 서열식별번호: 1, 9, 2 또는 3의 LRR-도메인과 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 LRR-도메인을 포함한다.
한 측면에서 LRR-도메인에서 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하도록 돌연변이된 야생형 기능적 WAP5.1 단백질은 서열식별번호: 1 또는 서열식별번호: 9의 ClWAP5.1, 또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 단백질, 서열식별번호: 2의 CsWAP5.1 또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 단백질, 및 서열식별번호: 3의 CmWAP5.1 또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 단백질로부터 선택되며, 여기서 '적어도 95%, 96% 또는 그 초과'의 서열 변이는 단백질의 N-말단 부분 (즉, F-박스 도메인 앞의)에서의 서열 변이로 인한 것인 반면, 단백질의 나머지 부분 (F-박스 도메인의 시작부터 단백질의 끝까지)은 서열식별번호: 1, 9, 2 또는 3의 서열과 동일하다.
LRR-도메인에서 하나 이상의 아미노산의 변화를 유발하는 프레임 시프트를 포함하는 돌연변이체 단백질 또는 LRR-도메인의 하나 이상의 아미노산의 결실을 유발하는 말단절단을 포함하는 돌연변이체 단백질은 생체내에서 감소된 기능 또는 기능 없음을 포함하는 돌연변이체 단백질인 것으로 본원에 포함된다.
표 1 및 도 4에 나타낸 바와 같이, LRR-도메인에서 4개의 특이적 돌연변이체가 수박에서 생성되었다. 한 측면에서 ClWAP5.1, CsWAP5.1 또는 CmWAP5.1 단백질의 LRR-도메인에서 이들 4개의 특이적 돌연변이체 중 임의의 것을 각각 포함하는 수박, 오이 또는 멜론 식물이 본원에 포함된다.
한 측면에서 따라서 돌연변이체 단백질을 코딩하는 돌연변이체 ClWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 Q333 및/또는 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 L528 및/또는 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 P308, 및/또는 서열식별번호: 1 또는 서열식별번호: 9 (또는 서열식별번호: 1 또는 9에 대해 적어도 95% 동일성을 포함하는 서열)의 G330은 또 다른 아미노산에 의해 대체되거나 결실된다.
한 측면에서 돌연변이체 단백질을 코딩하는 돌연변이체 CsWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 Q340 및/또는 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 L535 및/또는 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 P315, 및/또는 서열식별번호: 2 (또는 서열식별번호: 2에 대해 적어도 95% 동일성을 포함하는 서열)의 G337은 또 다른 아미노산에 의해 대체되거나 결실된다.
한 측면에서 돌연변이체 단백질을 코딩하는 돌연변이체 CmWAP5.1 대립유전자가 제공되며, 여기서 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 Q343 및/또는 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 L538, 및/또는 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 P318, 및/또는 서열식별번호: 3 (또는 서열식별번호: 3에 대해 적어도 95% 동일성을 포함하는 서열)의 G340은 또 다른 아미노산에 의해 대체되거나 결실된다.
아미노산이 '결실'되는 것을 언급할 때, 이는 코돈이 정지 코돈으로 변화되거나 코돈이 결실되는 돌연변이, 또는 프레임시프트가 있어 아미노산이 코딩되지 않도록 초래하는 돌연변이를 포함한다. 동일하게, 아미노산이 '대체'되는 것을 언급할 때, 이는 코돈이 상이한 아미노산을 코딩하거나 코돈이 삽입되는 돌연변이, 또는 프레임시프트가 있어 상이한 아미노산이 코딩되도록 초래하는 돌연변이를 포함한다.
돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 식물 및 식물 부분은 쿠쿠르비타세아에 과의 식물, 특히 재배 종, 예컨대 오이 (쿠쿠미스 사티부스), 멜론 (쿠쿠미스 멜로) 및 수박 (시트룰루스 라나투스)일 수 있다. 또한 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 쿠쿠르비타세아에 과의 식물 및 식물 부분, 특히 오이, 멜론 및 수박이 본원에 포함되며, 여기서 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 식물은 통성 단위결과의 표현형을 나타내는 식물을 초래한다.
한 측면에서 돌연변이체 wap5.1 대립유전자는 2배체 식물 세포 또는 식물, 예를 들어 2배체 수박, 오이 또는 멜론 식물에서 이형접합성이다. 또 다른 측면에서 돌연변이체 wap5.1 대립유전자는 2배체 식물 세포 또는 식물에서 동형접합성이다.
식물 세포 및 식물은 바람직하게는 야생 식물이 아닌 재배 식물, 예컨대 엘리트 육종 계통 또는 품종이다. 오이는 임의의 유형의 오이, 예컨대 긴 오이, 피클링 오이, 슬라이싱 오이 등일 수 있다. 마찬가지로 멜론은 임의의 유형의 멜론 (갈리아(Galia), 피엘 데 사포(Piel de Sapo), 칸탈루프(Cantaloupe), 허니듀(honeydew) 등)일 수 있고, 수박은 임의의 유형의 수박일 수 있다.
돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 수박 식물 및 이의 부분은 2배체, 4배체 또는 3배체일 수 있다. 또 다른 측면에서 이는 또 다른 다배수체, 예를 들어 5배체, 6배체, 7배체, 8배체 등일 수 있다. wap5.1의 4개 카피를 포함하는 4배체 식물은 예를 들어 염색체 배가에 의해 8배체를 만드는데 사용될 수 있다. 이러한 8배체를 wap5.1에 대해 동형접합성인 2배체와 교배하는 것은 wap5.1의 5개 카피를 포함하는 5배체를 초래할 것이다. 한 측면에서 다배수성 수박 식물은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하지만, 이는 또한 더 많은 카피를 포함할 수 있으며, 예를 들어 바람직한 측면에서 3배체 식물은 돌연변이체 wap5.1 대립유전자의 2 또는 3개 카피를 포함하거나, 4배체는 돌연변이체 wap5.1 대립유전자의 2 또는 4개 카피를 포함한다.
그러므로 2배체 식물은 유전자형 wap5.1/WAP5.1 (돌연변이체 대립유전자에 대해 이형접합성) 또는 wap5.1/wap5.1 (돌연변이체 대립유전자에 대해 동형접합성)을 가질 수 있다. 한 측면에서 동형접합 형태의 wap5.1 대립유전자를 포함하는 2배체 식물은 이중 반수체 식물 (DH), 예를 들어 이중 반수체 수박, 오이 또는 멜론 식물 또는 식물 세포 또는 식물 부분이다. DH 식물은 반수체 세포의 염색체 배가 (예를 들어, 콜히친 처리를 통해)에 의해 만들어질 수 있다.
3배체 수박 식물은 유전자형 wap5.1/WAP5.1/WAP5.1 또는 wap5.1/wap5.1/WAP5.1 또는 wap5.1/wap5.1/wap5.1을 가질 수 있다. 유전자형 wap5.1/WAP5.1/WAP5.1을 갖는 3배체 식물은 야생형 자성 4배체 (WAP5.1/WAP5.1/ WAP5.1/WAP5.1)와 돌연변이체 대립유전자에 대해 동형접합성인 웅성 2배체 (wap5.1/wap5.1)의 교배에 의해 만들어질 수 있다. 유전자형 wap5.1/wap5.1/WAP5.1을 갖는 3배체 식물은 자성 4배체 (wap5.1/wap5.1/ wap5.1/wap5.1)와 야생형 대립유전자에 대해 동형접합성인 웅성 2배체 (WAP5.1/WAP5.1)의 교배에 의해 만들어질 수 있다.
4배체 수박 식물은 유전자형 wap5.1/WAP5.1/WAP5.1/WAP5.1 또는 wap5.1/wap5.1/WAP5.1 /WAP5.1 또는 wap5.1/wap5.1/wap5.1/WAP5.1 또는 wap5.1/wap5.1/ wap5.1/wap5.1을 가질 수 있다. 유전자형 wap5.1/wap5.1/WAP5.1 /WAP5.1은 2배체 wap5.1/WAP5.1의 염색체 배가에 의해 만들어질 수 있다. 유전자형 wap5.1/wap5.1/ wap5.1/wap5.1은 2배체 wap5.1/wap5.1의 염색체 배가에 의해 만들어질 수 있다. 다른 2개의 유전자형, wap5.1/ WAP5.1 / WAP5.1 / WAP5.1 및 wap5.1/ wap5.1/ wap5.1/ WAP5.1은 예를 들어 유전자형 wap5.1/w wap5.1/ WAP5.1 / WAP5.1의 2개의 4배체의 교배 및 자손에서 유전자형의 식별에 의해 만들어질 수 있다.
한 측면에서 수박 식물은 wap5.1에 대해 동형접합성이고, 또 다른 측면에서 wap5.1에 대해 이형접합성이다. 한 측면에서 이는 근친교배 계통 또는 품종이다. 추가 측면에서 이는 F1 하이브리드이다.
기재된 임의의 수박 식물, 오이 식물 또는 멜론 식물이 성장될 수 있는 종자가 또한 본원에 포함되며, 이러한 식물의 부분도 마찬가지로, 예컨대 수분의 부재 하에 생산된 씨없는 과실, 꽃, 세포, 뿌리, 근경, 접순, 잎, 줄기, 영양 번식, 삽목, 종자 번식 (예를 들어, 자가생식) 및 또한 시험관내 세포- 또는 조직 배양물, 뿐만 아니라 화분, 씨방 등이 본원에 포함된다.
돌연변이체 wap5.1 대립유전자를 포함하는 2배체 수박, 오이 및 멜론 식물
한 측면에서 수박 식물 또는 오이 또는 멜론 식물은 wap5.1의 적어도 하나의 돌연변이체 카피, 바람직하게는 2개의 돌연변이체 카피 (즉, wap5.1에 대해 동형접합성임)를 포함하는 2배체 계통 (예를 들어, 근친교배 계통) 또는 품종이다. 암꽃의 수분을 방지하는 경우, wap5.1에 대해 동형접합성인 2배체 식물은 씨없는 과실을 생산할 것이다. 수분이 발생하는 경우, 과실은 씨가 있을 것이다.
수분을 방지하기 위해 예를 들어 식물을 곤충이 없는 환경에서 성장시킬 수 있다. 그러나, 또한 웅성 불임인 2배체 식물을 생산할 수 있다. 그러므로, 본 발명의 한 측면에서 wap5.1에 대해 동형접합성이고 추가적으로 웅성 불임인 2배체 식물이 제공된다. 웅성 불임은 식물이 기능적 꽃밥, 화분 또는 웅성 배우자를 생산하지 못하는 것이다. ms-1 유전자를 포함하여 여러 웅성 불임 유전자가 수박에서 식별되었다. ms-1 핵 유전자는 웅성 불임을 제어하고, 동형접합 형태의 ms-1 유전자 (ms-1은 열성임)를 갖는 식물에서, 꽃밥의 정상적인 발달은 방해받는 반면 암꽃 발달은 정상적이다. 유전자는 화분 생산을 제거한다. ms-1 유전자에 대한 마커 및 상기 유전자를 포함하는 식물은 EP2959771에 기재되어 있으며, 데이터베이스 PINTO는 세미니스(Seminis)의 품종 본타(Bonta) 또는 본타 F1이 본 특허에 따른 식물임을 언급하고 있다. ms-1 유전자는 또한 문헌 [Zhang et al. 1996 (HortScience 31(1): 123-126)]에 기재되어 있다. ms-1 유전자는 수박의 염색체 6 상에 있으며, 따라서 염색체 5 상의 wap5.1과 쉽게 조합될 수 있다. 멜론에도 웅성 불임 유전자가 존재한다. 오이에서 돌연변이체 wap5.1 대립유전자는 자주성, 즉 자성 암꽃의 생산과 조합될 수 있다.
따라서, 한 측면에서 본 발명에 따른 2배체 식물 및 식물 부분은 웅성 불임이고/거나 웅성 불임 유전자를 포함한다. 웅성 불임 유전자가 열성 유전자인 경우, 식물 및 식물 부분은 바람직하게는 동형접합 형태의 유전자를 포함한다. 한 측면에서 수박 식물은 ms-1 유전자를 바람직하게는 동형접합 형태로 포함한다. 그러므로, 한 측면에서 2배체 수박 식물은 염색체 5 상에 동형접합 형태의 돌연변이체 wap5.1 유전자 (wap5.1/wap5.1)를 포함하고, 웅성 불임 유전자, 예를 들어 ms-1을, 예를 들어 웅성 불임 유전자가 열성인 경우에 동형접합 형태로 (예를 들어, ms-1/ms-1) 또는 임의로 웅성 불임이 우성인 경우에 이형접합 형태로 추가로 포함한다. 하나의 바람직한 식물은 wap5.1에 대해 동형접합성이고 ms-1에 대해 동형접합성인 2배체 식물이다.
본 발명에 따른 식물, 특히 2배체 수박 식물이 항상 (수분의 부재 하에서 뿐만 아니라) 씨없는 과실을 생산하도록 보장하는 추가 방법은 동형접합 형태의 wap5.1 유전자를 위단위결과를 부여하는 유전자와 조합하여 수분이 발생하더라도 수분에도 불구하고 과실이 씨가 없도록 하는 것이다. 한 측면에서 위단위결과 유전자는 emb1이라고 불리는 열성 유전자이다. 야생형 및 돌연변이체 Emb1 유전자는 동시 계류 중인 출원 EP16171462.1에 기재되어 있다. Emb1 유전자는 사이클린 SDS 유사 단백질을 코딩한다. 돌연변이체 대립유전자 emb1이 동형접합 형태인 경우, 위단위결과가 초래된다. "위단위결과"는 과실 결실의 유도 및 발달이 수분을 필요로 하지만 성숙 또는 생존가능한 종자를 생산하는 과실이 없는 것을 의미한다. 성숙 또는 생존가능한 종자는 성숙함에 도달하기 전에 저지된 종자 발달 또는 배주 및/또는 배아 및/또는 내배유의 분해 또는 배주 및/또는 배아 및/또는 내배유의 유산으로 인해 위단위결과성 식물에서 발달되지 않는다. 그러므로, 돌연변이체 emb1 대립유전자에 대해 동형접합성인 2배체 식물 (emb1/emb1)이 자가-수분되거나 또 다른 식물로부터의 화분에 의해 수분되는 경우, 이들은 씨없는 2배체 과실을 생산하였다.
그러므로, 한 측면에서 2배체 수박 식물은 염색체 5 상에 동형접합 형태의 wap5.1 유전자 (wap5.1/wap5.1)를 포함하고, 위단위결과 유전자, 예를 들어 emb1을, 예를 들어 위단위결과 유전자가 열성인 경우에 동형접합 형태로 (예를 들어, emb1/emb1) 또는 임의로 위단위결과 유전자가 우성인 경우에 이형접합 형태로 추가로 포함한다. 하나의 바람직한 식물은 wap5.1에 대해 동형접합성이고 emb1에 대해 동형접합성인 2배체 식물이다.
emb1의 하나의 돌연변이체 대립유전자는 NCIMB 42532 하에 넌헴스 비.브이.에 의해 기탁된 사이클린 SDS 유사 단백질 코딩 유전자 (Emb1 유전자로도 지칭됨)의 돌연변이체 대립유전자에 대해 이형접합성 또는 동형접합성인 수박 종자로부터 수득될 수 있다. 이들 종자 중 25%는 서열식별번호: 28의 돌연변이체 단백질을 코딩하는 돌연변이체 대립유전자 (서열식별번호: 27의 mRNA 참조)를 함유한다. Emb1 유전자의 야생형 대립유전자는 NCIMB 42532 하에 넌헴스 비.브이.에 의해 기탁된 야생형 사이클린 SDS 유사 단백질 코딩 유전자에 대해 이형접합성 또는 동형접합성인 수박 종자로부터 수득될 수 있다. 이들 종자 중 25%는 서열식별번호: 26의 야생형 단백질을 코딩하는 서열식별번호: 25의 야생형 대립유전자를 동형접합 형태로 함유한다. Emb1 유전자의 다른 돌연변이체 대립유전자는 예를 들어 돌연변이유발 또는 통상의 기술자에게 공지된 다른 방법에 의해 드 노보 생성될 수 있다. 서열식별번호: 25에 표시된 게놈 Emb1 뉴클레오티드 서열은 서열식별번호: 26에 표시된 바와 같은 아미노산 서열을 갖는 시트룰루스 라나투스의 야생형 사이클린 SDS 유사 단백질을 코딩한다. 서열식별번호: 27에 표시된 mRNA 서열, 및 서열식별번호: 28에 표시된 돌연변이체 단백질은 NCIMB42532 하에 기탁된 종자에서 발견된 돌연변이체 emb1 대립유전자의 것이다.
emb1의 돌연변이체 대립유전자는 식물이 돌연변이체 대립유전자에 대해 동형접합성인 경우에 식물이 웅성 가임성이지만 씨없는 과실을 생산하도록 야기한다. Emb1 유전자에서의 돌연변이는 결실, 말단절단, 삽입, 점 돌연변이, 넌센스 돌연변이, 미스센스 또는 비동의 돌연변이, 스플라이스-부위 돌연변이, 프레임 시프트 돌연변이 및/또는 조절 서열에서의 돌연변이를 포함하는 임의의 돌연변이일 수 있다. 바람직하게는 돌연변이는 점 돌연변이 및/또는 스플라이스-부위 돌연변이이다. 돌연변이는 사이클린 SDS 유사 단백질 코딩 유전자 (Emb1 유전자)의 코딩 서열을 포함하는 DNA 서열에서 또는 사이클린 SDS 유사 단백질을 코딩하는 RNA 서열에서 발생할 수 있거나, 사이클린 SDS 유사 단백질 (또는 Emb1 단백질)의 아미노산에서 발생할 수 있다. 사이클린 SDS 유사 단백질 코딩 유전자의 DNA 서열과 관련하여 돌연변이는 코딩 서열 (cds, 엑손으로 구성됨)에서 발생할 수 있거나, 사이클린 SDS 유사 단백질 코딩 유전자의 비-코딩 서열, 예컨대 5'- 및 3'-비번역된 영역, 인트론, 프로모터, 인핸서 등에서 발생할 수 있다. 사이클린 SDS 유사 단백질을 코딩하는 RNA와 관련하여 돌연변이는 프리-mRNA 또는 mRNA에서 발생할 수 있다.
사이클린 SDS 유사 단백질 코딩 유전자의 돌연변이체 대립유전자에 대해 격리하는 식물의 2배체 시트룰루스 라나투스 종자는 2016년 1월 27일에 NCIMB Ltd. (영국 스코틀랜드 에이비21 9와이에이 애버딘 벅스번 크레이브스톤 이스테이트 퍼거슨 빌딩)에서 수탁 번호 NCIMB 42532 하에 넌헴스 비.브이.에 의해 부다페스트 조약 하에 기탁되었다. 종자 기탁을 위해 사이클린 SDS 유사 단백질 코딩 유전자의 대립유전자는 emb1로 지정되었다.
기탁된 종자는 emb1 돌연변이체 대립유전자에 대해 동형접합성인 식물과 emb1 야생형 대립유전자에 대해 동형접합성인 식물의 자가-수분된 역교배로부터 수득되었다. 따라서 기탁된 종자의 25%는 emb1 돌연변이체 대립유전자에 대해 동형접합성이고 씨없는 과실을 생산하고, 50%는 돌연변이체 대립유전자에 대해 이형접합성이고, 25%는 야생형 사이클린 SDS 유사 단백질을 코딩하는 야생형 대립유전자에 대해 동형접합성이다.
한 측면에서 따라서 본 발명은 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피, 바람직하게는 2개 카피, 및 돌연변이체 emb1 대립유전자의 적어도 하나의 카피, 바람직하게는 돌연변이체 emb1 대립유전자의 2개 카피를 포함하는 2배체 수박 식물 또는 식물 부분에 관한 것이다. 한 측면에서 돌연변이체 emb1 대립유전자는 NCIMB 42532 하에 기탁된 종자에서 발견되는 대립유전자이다.
이러한 2배체 식물이 성장될 수 있는 종자가 또한 본원에 포함되며, 이러한 식물의 부분도 마찬가지로, 예컨대 2배체 씨없는 과실, 꽃, 잎, 줄기, 영양 번식, 세포, 삽목, 종자 번식 (예를 들어, 자가생식) 및 또한 시험관내 세포- 또는 조직 배양물, 뿐만 아니라 화분, 씨방, 근경, 접순 등이 본원에 포함된다. 그러므로, 한 실시양태에서 2배체 식물, 또는 식물이 성장될 수 있는 종자, 또는 식물의 조직 또는 부분 (화분, 꽃밥, 배주)은 상기 표 1에 기재된 바와 같은 돌연변이체 wap5.1 대립유전자 또는 상이한 돌연변이체 wap5.1 대립유전자를 포함한다.
돌연변이체 wap5.1 대립유전자를 포함하는 4배체 수박 식물
씨없는 3배체 수박 생산은 2배체 웅성 부모 식물로부터의 화분을 사용하여 4배체 모계 부모 식물의 꽃을 수정시키는 것을 수반한다. 2배체 화분을 사용한 4배체 꽃의 수분은 3배체인 F1 종자를 유발한다 (Kihara, 1951, Proceedings of American Society for Horticultural Science 58: 217-230; Eigsti 1971, Hort Science 6: 1-2). 이들 F1 종자로부터 성장된 3배체 하이브리드 식물은 염색체 불균형으로 인해 불임 화분을 생산하므로 자가-불임성이다. 따라서, 3배체 하이브리드는 정상적으로 수박 과실을 생산하기 위해 2배체 수분자에 의해 수분될 필요가 있다.
그러나, 본 발명에 따르면 돌연변이체 wap5.1 유전자의 1, 2 또는 3개 카피를 포함하는 3배체 식물은 수분 없이 과실을 생산하고 더 이상 수분자 식물이 존재할 필요가 없다. 따라서, 씨없는 과실을 생산하기 위해 이러한 3배체 수박 식물을 예를 들어 수분자 식물의 부재 하에 및/또는 (가임성) 화분의 부재 하에 밭에서 성장시키는 방법이 본원에 포함된다.
본 발명의 한 측면에서 따라서 자성 부모로서 사용하기 위한, 바람직하게는 열성 wap5.1 대립유전자의 4개 카피를 포함하는 4배체 식물, 및 웅성 부모로서 사용하기 위한, 바람직하게는 열성 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 식물 둘 다, 뿐만 아니라 2배체 웅성 부모와 4배체 자성 부모의 교배에 의해 생산된 3배체 F1 하이브리드 (바람직하게는 돌연변이체 wap5.1 대립유전자의 3개 카피를 포함함)가 제공된다.
이러한 4배체 식물을 만들기 위해, 바람직하게는 wap5.1에 대해 동형접합성인 상기 기재된 임의의 2배체 식물이 4배체 식물을 생성하기 위한 출발 물질로서 사용될 수 있다. 통상의 기술자에게 공지된 염색체 배가 기술이 이러한 2배체 식물로부터 4배체 식물을 생성하기 위해 사용될 수 있다. 예를 들어 문헌 [Noh et al. (2012) Hort. Environ. Biotechnol. 53(6):521-529]은 4배체 수박을 생성하는 상이한 방법을 평가하였다. 모든 방법에서 염색체 배가를 유도하기 위해 항유사분열제, 예컨대 콜히친, 디니트로알라닌 또는 오리잘린이 사용된다. 임의로 조직 배양이 식물 부분으로부터 4배체 식물을 생성하기 위해 사용될 수 있다. 식물이 4배체인지 확인하기 위해 염색체 번호를 확인할 수 있다. 배수성은 염색체 계수 또는 유동 세포계측법 또는 다른 공지된 방법에 의해 쉽게 결정될 수 있다 (Sari et al. 1999, Scientia Horticulturae 82: 265 - 277, 본원에 참조로 포함됨).
그러므로, 본 발명의 한 측면에서 시트룰루스 라나투스 종의 4배체 재배 수박 식물이 제공되며, 여기서 상기 식물은 돌연변이체 wap5.1 대립유전자 (상기 기재된 바와 같음)의 2개 또는 바람직하게는 4개 카피를 포함하고, 4개의 염색체 5 각각 상에 하나씩 있다.
상기 돌연변이체 wap5.1 대립유전자에 대해 기재된 모든 실시양태는 4배체에 동일하게 적용된다. 따라서 예를 들어 4배체 식물은 표 1에 기재된 wap5.1 대립유전자의 4개 카피, 또는 상기 추가로 기재된 바와 같은 상이한 돌연변이체 wap5.1 대립유전자의 4개 카피를 포함할 수 있다.
그러므로, 한 측면에서 본 발명은 서열식별번호: 1 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 단백질을 코딩하는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 1, 2, 3 또는 4개 카피를 포함하는 4배체 수박 식물 또는 식물 부분을 포함한다. 돌연변이체 wap5.1 대립유전자의 1 또는 2개 카피를 포함하는 2배체 수박 식물에 대해 상기 기재된 돌연변이체 wap5.1 대립유전자에 관한 측면은 4배체 식물 및 식물 부분에 적용된다. 따라서, 예를 들어 한 측면에서 돌연변이체 대립유전자는 WAP5.1 유전자의 감소된 발현 또는 발현 없음을 초래하거나, 돌연변이체 대립유전자는 감소된 기능 또는 기능 상실을 갖는 돌연변이체 WAP5.1 단백질을 코딩한다.
한 측면에서 4배체 식물은 LRR-도메인에 L528F 아미노산 대체를 포함하는 서열식별번호: 4 또는 서열식별번호: 10의 돌연변이체 단백질을 코딩하는 돌연변이체 wap5.1 대립유전자의 2개 또는 바람직하게는 4개 카피를 포함한다.
4배체 식물 또는 식물 부분 (세포, 잎, DNA 등)의 유전자형분석은 예를 들어 SNP 유전자형을 구별하기 위해 KASP-검정을 사용하여 2배체와 동일한 방식으로 수행될 수 있으며, 예를 들어 서열식별번호: 8의 뉴클레오티드 61에 마커 mwm233348429에 대한 TTTT (L528F 돌연변이를 포함하는 서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 4개의 돌연변이체 wap5.1 대립유전자를 검출함)를 포함하는 식물 또는 부분은 이들의 게놈에서 서열식별번호: 8의 뉴클레오티드 61에 마커 mwm233348429에 대한 CTTT (서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 3개의 돌연변이체 대립유전자를 검출함), CCTT (서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 2개의 돌연변이체 대립유전자를 검출함), CCCT (서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 하나의 돌연변이체 대립유전자를 검출함) 또는 CCCC (서열식별번호: 1 또는 서열식별번호: 9의 단백질을 코딩하는 4개의 야생형 대립유전자를 검출함)를 포함하는 식물 또는 부분과 구별될 수 있다. 다른 대립유전자-특이적 마커에 동일하게 적용된다.
본 발명의 한 측면에서 돌연변이체 wap5.1 대립유전자 (상기 기재된 바와 같음)의 적어도 1 또는 2 또는 3개 카피를 포함하지만 바람직하게는 돌연변이체 wap5.1 대립유전자 (상기 기재된 바와 같음)의 4개 카피를 포함하는 4배체 수박이 제공된다. 바람직하게는 수박 식물은 F1 하이브리드 종자 생산을 위한 부모로서 적합한 4배체 근친교배 자성 계통이다.
4배체 자성 근친교배 계통의 생성은 염색체를 배가하고 4배체 식물을 생성하기 위해 wap5.1 대립유전자의 1개 또는 바람직하게는 2개 카피를 포함하는 2배체 식물을 사용함으로써 수행될 수 있다. 예를 들어 wap5.1에 대해 동형접합성인 2배체 근친교배 계통이 4배체 식물을 생성하기 위해 사용될 수 있다.
돌연변이체 wap5.1 대립유전자의 4개 카피를 포함하는 4배체 식물은 표현형, 즉 통성 단위결과성을 발현할 것이다.
이러한 4배체 식물이 성장될 수 있는 종자가 또한 본원에 포함되며, 이러한 식물의 부분도 마찬가지로, 예컨대 수분의 부재 하에 생산된 4배체 씨없는 과실, 꽃, 잎, 줄기, 삽목, 영양 번식, 세포, 종자 번식 (예를 들어, 자가생식) 및 또한 시험관내 세포- 또는 조직 배양물, 뿐만 아니라 화분, 씨방, 근경, 접순 등이 본원에 포함된다. 그러므로, 한 실시양태에서 4배체 식물, 또는 식물이 성장될 수 있는 종자, 또는 식물의 조직 또는 부분 (화분, 꽃밥, 배주)은 상기 기재된 바와 같은 돌연변이체 wap5.1 대립유전자를 포함한다.
4배체는 상이한 돌연변이체 wap5.1 대립유전자, 예를 들어 말단절단된 WAP5.1 단백질을 코딩하는 2개의 돌연변이체 wap5.1 대립유전자 및 아미노산 치환을 갖는 WAP5.1 단백질을 코딩하는 2개의 돌연변이체 wap5.1 대립유전자를 포함할 수 있다. 이러한 식물은 예를 들어 먼저 상이한 돌연변이체 wap5.1 대립유전자를 포함하는 2배체를 만든 후, 이러한 2배체의 염색체를 배가함으로써 만들어질 수 있다. 그러나, 한 측면에서 4배체는 동일한 돌연변이체 wap5.1 대립유전자의 4개 카피를 포함하며, 즉 4배체는 wap5.1 대립유전자에 대해 동형접합성인 2배체로부터 만들어진다.
돌연변이체 wap5.1 대립유전자를 포함하는 3배체 수박 식물
추가 측면에서 돌연변이체 wap5.1 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 수박 종자, 식물 및 식물 부분이 제공된다 (즉, 각각 wap5.1 /WAP5.1/WAP5.1 또는 wap5.1 / wap5.1 /WAP5.1 또는 wap5.1 / wap5.1 / wap5.1). 이러한 3배체는 상기 기재된 바와 같이, 그리고 하기 표 2에 나타낸 바와 같이 만들어질 수 있다:
표 2
Figure pct00004
한 측면에서 돌연변이체 wap5.1 대립유전자의 4개 카피를 포함하는 4배체 식물이 자성 부모로서 사용되고, 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 웅성 부모의 화분으로 수분되고, 교배로부터의 종자가 수확된다. 이들 종자는 3배체이고, 이들은 본 발명의 돌연변이체 wap5.1 대립유전자의 3개 카피를 포함한다 (표 2, A행). 이들 종자로부터 성장된 식물은 과실 결실을 유도하기 위해 수분의 필요 없이 씨없는 수박 과실 (3배체 과실)을 생산한다. 이들 F1 3배체 종자로부터 성장된 3배체 하이브리드 식물은 염색체 불균형으로 인해 불임 화분을 생산하므로 자가-불임성이다. 그러므로 이들 종자는 수분자 식물의 필요 없이 생산 밭에서 성장될 수 있다. 이는 화분 및 수분자 식물의 부재 하에 씨없는 3배체 수박 과실을 생산할 수 있는 최초의 사례이다.
한 측면에서 상기 A행의 3배체는 3개의 동일한 돌연변이체 wap5.1 대립유전자를 포함하며, 즉 자성 및 웅성 부모는 동일한 돌연변이체 대립유전자를 포함한다. 그러나, 또 다른 측면에서 자성 부모 및 웅성 부모는 상이한 돌연변이체 wap5.1 대립유전자를 포함할 수 있다. 예를 들어 자성 부모는 말단절단된 WAP5.1 단백질을 코딩하는 4개의 돌연변이체 wap5.1 대립유전자를 포함할 수 있고, 웅성 부모는 아미노산 치환을 갖는 WAP5.1 단백질을 코딩하는 2개의 돌연변이체 wap5.1 대립유전자를 포함할 수 있으며, 예를 들어 서열식별번호: 1 또는 9 (또는 이들 중 어느 하나에 대해 적어도 95% 동일성을 포함하는 서열)의 류신 528은 페닐알라닌 (돌연변이체 L528F)에 의해 대체되거나, 또는 그 반대이다.
한 측면에서 본원에 기재된 통성 단위결과를 부여하는 돌연변이체 wap5.1 대립유전자는 단위결과를 부여하는, 특히 통성 단위결과를 부여하는 또 다른 돌연변이체 대립유전자와 조합된다. 이러한 또 다른 돌연변이체 대립유전자는 예를 들어 WO2018/060444에 기재된 wop1 대립유전자이며, 이는 염색체 4 상에 위치된다 (이는 wap4.1로도 지칭됨). 한 측면에서 돌연변이체 wap5.1 대립유전자는 2배체, 3배체 또는 4배체 수박 식물에서 돌연변이체 wop1 대립유전자와 조합된다. wop1은 상이한 염색체 상에 있기 때문에, wop1 및 wap5.1 사이에 상이한 조합, 예를 들어 3배체 수박에서 wop1 및 of wap5.1 각각의 3개의 돌연변이체 카피, 또는 3배체 수박에서 wop1의 1 또는 2개의 돌연변이체 카피 및 wap5.1의 3개의 돌연변이체 카피, 또는 그 반대 등을 만들 수 있다.
3배체 씨없는 과실은 바람직하게는 시장성이 있다. 바람직하게는 이들은 적어도 6.0, 7.0, 8.0 또는 바람직하게는 적어도 9.0, 바람직하게는 적어도 10.0, 보다 바람직하게는 적어도 11.0의 애버리지 브릭스를 갖는다. 과실은 임의의 크기, 형상, 색상 및 껍질 패턴의 것일 수 있다. 바람직하게는 성숙기의 과실 과육 색상은 균일하다. 한 측면에서 과실 과육은 적색 또는 암적색이다.
3개 카피에 wap5.1을 포함하는 3배체 하이브리드의 애버리지 과실 중량은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 또는 14 kg과 동일하거나 그 초과실 수 있다. 또 다른 실시양태에서 3개 카피에 wap5.1을 포함하는 3배체 하이브리드의 애버리지 과실 중량은 5 kg, 예를 들어 4, 3, 2, 1.5 또는 1 kg 또는 심지어 그 미만과 동일하거나 그 미만일 수 있다.
씨없는 과실은 임의의 형상 (예를 들어, 길쭉한, 타원형, 괴상형, 구형 또는 원형), 과실 표면 (고랑, 매끄러운), 과육 색상 (적색, 암적색, 스칼렛 레드, 코랄 레드, 주황색, 연어색, 분홍색, 적분홍색, 노란색, 카나리아 옐로 또는 백색), 껍질 색상 (예를 들어, 밝은 녹색; 암녹색; 좁은, 중간 또는 넓은 줄무늬를 갖는 녹색-줄무늬; 회색 유형; 반점 있음 또는 없음; 황금색), 껍질 두께, 껍질 인성, 껍질 패턴 (예를 들어, 줄무늬 있음, 줄무늬 없음, 그물형), 과육 구조 / 과육 치밀도, 리코펜 및/또는 비타민 함량, 다양한 당도 대 산 비율, 과실 향미 등의 것일 수 있다.
그러므로, 돌연변이체 wap5.1 대립유전자는 전통적인 육종에 의해 다양한 형상 및 크기 등의 과실을 생산하는 다양한 씨없는 품종을 육종하는데 사용될 수 있다. 문헌 [Guner and Wehner 2004, Hort Science 39(6): 1175-1182], 특히 과실 특징에 대한 유전자를 기술하는 페이지 1180-1181을 참조한다. 일반적으로 중요한 육종 목적은 조기 성숙, 높은 과실 수확량, 높은 내부 과실 품질 (양호한 균일한 색상, 높은 당도, 적절한 당도 : 산 비율, 양호한 향미, 높은 비타민 및 리코펜 함량, 치밀한 과육 질감, 비섬유질 과육 질감, 결함, 예컨대 중심 공동, 껍질 괴사, 꽃말썩음병 또는 크로스 스티치가 없음 및 양호한 껍질 특징 및 내균열성)이다.
이러한 3배체 F1 하이브리드 식물이 성장될 수 있는 종자는 본 발명의 한 측면이다. 그러므로, 한 측면에서 3배체 수박 식물 성장/ 씨없는 수박 과실 생산 방법은 하기 단계를 포함한다: 이들의 게놈에 1, 2 또는 3개의 돌연변이체 wap5.1 대립유전자를 포함하는 3배체 수박 식물을 파종 또는 식재하는 단계, 임의로 꽃의 수분을 방지하는 단계 (예를 들어, 웅성 불임, 수분자의 부재 및/또는 화분의 부재에 의해) 및 단위결과를 통해 수분의 부재 하에 발달하는 씨없는 수박 과실을 수확하는 단계. 원칙적으로, 3배체 과실은 어쨌든 씨없는 과실을 생산하기 때문에 수분의 방지는 필요하지 않다. 차이점은 돌연변이체 wap5.1 대립유전자(들)를 포함하는 3배체는 과실 발달을 유도하기 위해 더 이상 화분을 필요로 하지 않으므로, 재배 구역이 3배체 식물에 의해 완전히 점유될 수 있고 수분자 식물의 내식이 더 이상 필요하지 않다는 것이다.
또한 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 수박 식물에 대해 씨없는 과실을 생산하는 방법이 제공된다. 그러므로, 한 측면에서 2배체 수박 식물 성장/ 씨없는 수박 과실 생산 방법은 하기 단계를 포함한다: 이들의 게놈에 돌연변이체 wap5.1 대립유전자의 2개 카피를 포함하는 2배체 수박 식물을 파종 또는 식재하는 단계, 꽃의 수분을 방지하는 단계 (예를 들어, 웅성 불임, 수분자의 부재 및/또는 화분의 부재에 의해) 및 단위결과를 통해 수분의 부재 하에 발달하는 씨없는 수박 과실을 수확하는 단계. 2배체 재배의 경우에 과실은 달리 종자를 함유할 것이므로 암꽃의 수분을 방지할 필요가 있다. 수분은 다양한 수단 또는 이들의 조합에 의해, 예를 들어 보호되고 화분이 없는 환경에서 식물을 성장시킴, 식물이 웅성 불임이고/거나 화분을 생산하지 않도록 보장, 화분 생산 및 암꽃 개화에 시차 생성, 수꽃 제거 등에 의해 방지될 수 있다.
본 발명의 돌연변이체 wap5.1 대립유전자의 1 또는 2개 카피만을 포함하는 3배체 종자 및 3배체 식물에 관하여 (상기 표 2, B행 및 C행에 나타낸 바와 같음), 표현형은 아직 테스트되지 않았지만, 이들은 또한 화분 없이 씨없는 과실을 생산하기에 적합할 수 있고, 또한 수분자 식물이 없는 밭에서 성장될 수 있다. 임의의 경우에, 이러한 3배체 식물 및 이러한 식물이 성장될 수 있는 종자는 본 발명의 측면이며, 이러한 식물에 의해 생산된 3배체 과실 및 이의 부분도 마찬가지이다. 바람직하게는 이러한 3배체 과실은 시장성이 있다. 바람직하게는 이들은 적어도 6.0, 7.0, 8.0 또는 바람직하게는 적어도 9.0, 바람직하게는 적어도 10.0, 보다 바람직하게는 적어도 11.0의 애버리지 브릭스를 갖는다. 과실은 임의의 크기, 형상, 색상 및 껍질 패턴의 것일 수 있다. 바람직하게는 성숙기의 과실 과육 색상은 균일하다. 한 측면에서 과실 과육은 적색 또는 암적색이다.
한 측면에서 본 발명의 3배체 식물은 영양 번식이다.
또한 3배체 하이브리드 수박 종자를 생산하는 방법이 제공되며, 여기서 이러한 종자로부터 성장된 3배체 식물은 수분의 부재 하에 과실을 생산하며, 상기 방법은 하기를 포함한다:
(a) 통성 단위결과성 2배체 수박 식물 및 통성 단위결과성 4배체 식물 (예를 들어 표 2 A행 참조)을 제공하는 단계,
(b) 2배체 식물의 화분으로 4배체 식물의 암꽃의 수분을 허용하는 단계, 및
(c) 4배체 식물의 과실에서 생산된 종자를 수확하는 단계, 및 임의로
(d) 수확된 종자를 건조시키는 단계.
그 후, 임의로 건조 및 수확된 F1 종자는 포장된다. 이들은 또한 포장 전에 처리될 수 있다. 그러므로, 상기 방법에 의해 수득된 종자를 포함하거나 이로 이루어진 패키지 또는 컨테이너는 본원의 실시양태이다.
또한 3배체 하이브리드 수박 종자를 생산하는 방법이 제공되며, 상기 방법은 하기를 포함한다:
(a) 돌연변이체 wap5.1 대립유전자가 결여된 2배체 수박 식물 및 돌연변이체 wap5.1 대립유전자의 4개 카피를 포함하는 4배체 식물 (예를 들어 표 2 B행 참조)을 제공하거나, 또는 돌연변이체 wap5.1 대립유전자에 대해 동형접합성인 2배체 수박 식물 및 돌연변이체 wap5.1 대립유전자가 결여된 4배체 식물 (예를 들어, 표 2 C행)을 제공하는 단계,
(b) 2배체 식물의 화분으로 4배체 식물의 암꽃의 수분을 허용하는 단계, 및
(c) 4배체 식물의 과실에서 생산된 종자를 수확하는 단계, 및 임의로
(d) 수확된 종자를 건조시키는 단계.
그 후, 임의로 건조 및 수확된 F1 종자는 포장된다. 이들은 또한 포장 전에 처리될 수 있다. 그러므로, 상기 방법에 의해 수득된 종자를 포함하거나 이로 이루어진 패키지 또는 컨테이너는 본원의 실시양태이다.
임의의 상기 3배체 식물이 성장될 수 있는 종자가 또한 본원에 포함되며, 이러한 식물의 부분도 마찬가지로, 예컨대 3배체 과실, 꽃, 잎, 줄기, 삽목, 영양 번식, 세포, 종자 번식 (예를 들어, 자가생식) 및 또한 시험관내 세포- 또는 조직 배양물, 뿐만 아니라 화분, 씨방, 근경, 접순 등이 본원에 포함된다. 그러므로, 한 실시양태에서 3배체 식물, 또는 식물이 성장될 수 있는 종자, 또는 식물의 조직 또는 부분 (화분, 꽃밥, 배주)은 상기 기재된 바와 같은 돌연변이체 wap5.1 대립유전자를 포함한다.
돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 3배체 식물을 성장시키는 방법이 또한 제공된다. 3배체 식물은 위단위결과성에서 단위결과성으로 변화되며, 즉 꽃으로부터 과실 발달을 유도하기 위해 수분자 식물이 더 이상 필요하지 않고, 따라서 이들 식물은 수분자 식물의 부재 하에 성장되어 씨없는 과실을 생산할 수 있다. 그러므로, 전체 밭 또는 온실은 3배체 식물만으로 성장될 수 있어 씨없는 3배체 과실의 수확량을 증가시킨다. 이들의 게놈에 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피 (또는 2 또는 3개 카피)를 포함하는 씨없는 과실이 또한 본원에 포함되며, 과실 또는 과실 부분을 포함하는 식품 또는 사료 제품도 마찬가지이다.
그러므로 상기 방법은 하기를 포함한다: 수분자 식물의 존재 없이 (예를 들어, 수분자 식물의 내식 없이) 재배 구역, 예컨대 밭 또는 온실 또는 터널에서 돌연변이체 wap5.1 대립유전자의 적어도 하나의 카피를 포함하는 3배체 수박 식물을 파종 또는 성장시키는 단계, 및 꽃의 수분 없이 과실이 발달하도록 허용하는 단계 (단위결과성), 및 임의로 씨없는 3배체 과실을 수확하는 단계.
영양 번식 및 세포 또는 조직 배양
상기 2배체 식물, 4배체 식물 또는 3배체 식물 (또는 다른 다배수체)은 또한 영양적으로 (무성적으로) 재생될 수 있고, 이러한 영양 번식 식물 또는 '영양 번식'은 본 발명의 실시양태이다. 이들은 돌연변이체 wap5.1 대립유전자의 존재에 의해 및/또는 표현형적으로 다른 수박, 오이 또는 멜론 식물과 쉽게 구별될 수 있다. 하나 이상의 돌연변이체 wap5.1 대립유전자의 존재는 본원의 다른 곳에 기재된 바와 같이 결정될 수 있다.
영양 번식은 다양한 방법에 의해 만들어질 수 있다. 예를 들어 본 발명의 식물의 하나 이상의 접순은 상이한 근경, 예를 들어 생물적 또는 비생물적 스트레스 관용적 근경에 접목될 수 있다.
다른 방법은 시험관내 세포 또는 조직 배양 방법 및 이러한 배양물로부터 영양 번식의 재생을 포함한다. 이러한 세포 또는 조직 배양물은 본 발명의 식물의 다양한 세포 또는 조직을 포함하거나 이로 이루어진다. 한 측면에서 이러한 세포 또는 조직 배양물은 본 발명의 식물의 영양 세포 또는 영양 조직을 포함하거나 이로 이루어진다.
또 다른 측면에서 세포 또는 조직 배양물은 본 발명의 식물의 생식 세포 또는 조직, 예컨대 꽃밥 또는 배주를 포함하거나 이로 이루어진다. 이러한 배양물은 예를 들어 이중 반수체 식물을 만들기 위해 염색체 배가제로 처리될 수 있거나, 또는 대안적으로 반수체 식물을 만들기 위해 사용될 수 있다 (예를 들어, 4배체로부터 2배체를 만들기 위해 또는 2배체로부터 반수체를 만들기 위해).
그러므로 시험관내 세포 또는 조직 배양물은 하기로 이루어진 군으로부터 선택된 식물 부분으로부터의 세포 또는 원형질체 또는 식물 조직을 포함하거나 이로 이루어질 수 있다: 과실, 배아, 분열조직, 떡잎, 화분, 배주, 잎, 꽃밥, 뿌리, 근단, 암술, 꽃, 종자, 줄기. 또한 예를 들어 종피 단독 (모계 조직)과 같은 이들 중 임의의 것의 부분이 포함된다.
그러므로, 본 발명의 한 측면에서 돌연변이체 wap5.1 대립유전자의 1, 2, 3 또는 4개 카피를 포함하는 식물의 세포의 세포 배양물 또는 조직 배양물 (모두 상기 기재된 바와 같음)이 제공된다. 언급된 바와 같이, 세포 배양물 또는 조직 배양물은 돌연변이체 wap5.1 대립유전자를 포함하는 식물의 식물 부분으로부터의 세포 또는 원형질체 또는 식물 조직을 포함하며, 하기로 이루어진 군으로부터 선택된 세포 또는 조직을 포함하거나 이로 이루어질 수 있다: 배아, 분열조직, 떡잎, 화분, 잎, 꽃밥, 뿌리, 근단, 암술, 꽃, 종자, 줄기; 또는 이들 중 임의의 것의 부분.
또한 이러한 세포 배양물 또는 조직 배양물로부터 재생된 수박, 오이 또는 멜론 식물이 제공되며, 여기서 재생된 식물 (또는 예를 들어 재생된 식물의 자가생식 후 수득된 이의 자손)은 돌연변이체 wap5.1 대립유전자를 포함한다. 따라서, 한 측면에서 하나 이상의 카피에 돌연변이체 wap5.1 대립유전자를 포함하는 수박, 오이 또는 멜론 식물은 영양 번식 수박, 오이 또는 멜론 식물이다.
상이한 측면에서 하나 이상의 카피에 wap5.1을 포함하는 본 발명의 세포 및 조직 (및 임의로 또한 세포 또는 조직 배양물)은 비번식 세포 또는 조직이다.
방법
씨없는 3배체 수박 과실 생산 방법이 제공되며, 상기 방법은 하기를 포함한다:
1. 돌연변이체 wap5.1 대립유전자의 적어도 1개, 바람직하게는 2개 또는 바람직하게는 3개 카피를 포함하는 3배체 하이브리드 (F1) 수박 식물 또는 종자를 제공하는 단계,
2. 상기 3배체 하이브리드 식물을 밭에 식재 또는 파종하는 단계 (바람직하게는 2배체 수분자 식물을 동일한 밭에 식재 또는 파종하지 않고), 및 임의로
3. 3배체 식물 상에 생산된 씨없는 수박 과실을 수확하는 단계로서, 여기서 과실은 바람직하게는 암꽃의 수분 없이 생산되는 것인 단계.
한 측면에서 단계 1의 3배체 하이브리드 식물은 바람직하게는 상이한 근경에 접목되지 않는다. 또 다른 측면에서 이는 상이한 근경에 접목될 수 있다.
언급된 바와 같이, 3배체 식물의 암꽃의 과실 결실을 유도하기 위해 2배체 수분자 식물을 더 이상 제공할 필요가 없다. 이는 전체 밭이 본질적으로 F1 3배체 종자 또는 식물의 종자 또는 이식체만으로 파종 또는 식재될 수 있음을 의미한다. 따라서 헥타르당 씨없는 수박 과실의 수확량이 크게 향상된다. 또한 하나의 유전자형만이 파종 또는 식재되기 때문에 파종 및 식재가 훨씬 더 쉽게 이루어진다.
그러므로, 방법은 또한 씨없는 수박 과실을 생산하는 방법으로서 기재될 수 있으며, 상기 방법은 돌연변이체 wap5.1 대립유전자의 적어도 1개, 바람직하게는 2개, 보다 바람직하게는 3개 카피를 포함하는 3배체 식물을 성장시키는 단계 및 상기 식물에 의해 생산된 과실을 수확하는 단계를 포함한다. 과실은 바람직하게는 암꽃의 수분 없이, 즉 생존가능한 또는 가임성 화분의 부재 하에 발달한다. 곤충, 예컨대 꿀벌은 과실 결실에 더 이상 필요하지 않으며, 즉 밭 안 또는 근처에 벌집을 배치할 필요가 없다.
수확된 3배체 씨없는 과실은 신선한 시장 또는 가공을 위해 포장될 수 있다. 상기 방법에 의해 수득가능한 1, 2 또는 3개의 wap5.1 대립유전자를 포함하는 과실이 본원에 포함된다. 임의로 돌연변이체 wap5.1 대립유전자의 검출 (예를 들어 다른 곳에 기재된 바와 같은 DNA, RNA 또는 단백질 검출을 사용한 돌연변이체 wap5.1 대립유전자의 검출에 의해, 예를 들어 wap5.1 대립유전자에 연결 (또는 밀접하게 연결)되거나 대립유전자-특이적인 (예를 들어, 야생형 대립유전자로부터 돌연변이체 대립유전자를 구별하는 돌연변이를 검출함) 마커의 PCR, 유전자형분석 또는 마커 분석에 의해)은 이러한 과실을 구별할 수 있다. 그러므로, 한 실시양태에서, 수확된 3배체 과실 (즉, wap5.1/WAP5.1/WAP5.1 또는 wap5.1/wap5.1/WAP5.1 또는 wap5.1/ wap5.1/wap5.1), 예컨대 포장된 전체 과실 또는 과실 부분 및/또는 가공된 과실 또는 과실 부분이 제공된다.
또한 하기 단계를 포함하는, 통성 단위결과성 재배 수박 식물의 생산 방법이 제공된다:
a) 수박 식물 집단에 돌연변이를 도입하거나, 또는 돌연변이체 수박 식물 집단을 제공하는 단계;
b) 암꽃의 수분 없이 씨없는 과실을 생산하고 암꽃의 수분 후 씨있는 과실을 생산하는 식물을 선택하고/거나, WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는 식물을 선택하는 단계;
c) 임의로 b)에서 선택된 식물이 WAP5.1 유전자의 돌연변이체 대립유전자를 포함하는지 확인하는 단계; 및
d) 임의로 c)에서 수득된 식물을 성장시키는 단계.
상기 방법에 의해 생산된 수박 식물이 포함된다.
a)에서 수박 식물 집단은 바람직하게는 돌연변이유발성 작용제로 처리되는 / 처리된 (또는 이에 적용되는) 재배 수박 육종 계통 또는 품종의 단일 유전자형, 또는 이러한 집단의 자손 (예를 들어 M2, M3 또는 추가 세대 식물을 생산하기 위해 집단의 개체의 자가생식 후 수득됨)이다. 이는 예를 들어 TILLING 집단일 수 있다.
단계 b)에서 식물은 표현형, 즉 통성 단위결과성에 대해 스크리닝되고/거나, 식물 (또는 식물 부분 또는 이로부터의 DNA)은 WAP5.1 유전자의 돌연변이체 대립유전자, 즉 야생형 WAP5.1 단백질의 감소된 발현 또는 발현 없음을 갖는 대립유전자 또는 돌연변이체 WAP5.1 단백질을 코딩하는 대립유전자의 존재에 대해 스크리닝된다. 표현형에 대한 스크리닝에 관하여, 암꽃의 수분 없이 씨없는 과실이 발달해야 하며; 암꽃의 수분으로 씨있는 과실이 발달해야 하는 것으로 이해된다. 이 표현형 스크리닝은 여러 단계로 수행될 수 있다. 예를 들어 제1 식물은 곤충이 없는 환경에서 성장될 수 있고 수꽃은 제거될 수 있다. 암꽃은 개화 및 과실 발달 (화분의 부재 하에)에 대해 육안으로 관찰될 수 있다. 발달된 과실을 성숙기에 반으로 절단하여 씨가 없는지 체크할 수 있다. 선택된 식물은 예를 들어 영양적으로 재생되어 단위결과 표현형을 확인하고/거나, 예를 들어 꽃을 손으로 수분하여 수분 시 과실이 씨가 있는지 확인할 수 있다 (통성 단위결과). WAP5.1 유전자의 돌연변이체 대립유전자의 존재에 대한 식물의 스크리닝에 관하여, 이는 예를 들어 wap5.1 DNA, RNA 또는 단백질을 검출하는 다양한 방법에 의해, 예를 들어 식물이 게놈 DNA에 돌연변이를 포함하는지 결정하기 위해 게놈 DNA를 증폭시키기 위해 코딩 영역의 일부 또는 코딩 영역 전체를 증폭시키는 PCR 프라이머를 설계함으로써, 또는 다른 방법에 의해 수행될 수 있다.
단계 c)는 돌연변이체 wap5.1 대립유전자가 존재하는지 여부를 결정하기 위한 다양한 방법을 수반할 수 있다. 예를 들어 WAP5.1 로커스를 포함하는 염색체 영역의 마커 분석 또는 서열 분석이 수행될 수 있거나, 또는 wap5.1 대립유전자 (또는 이의 부분) 또는 mRNA (cDNA)를 증폭시키기 위해 PCR 또는 RT-PCR이 사용될 수 있다. 또한 열성 유전을 결정하기 위한 유전자 분석이 수행될 수 있다.
또한 바람직하게는 식물의 암꽃의 수분 없이 씨없는 수박 과실을 생산하기 위한 통성 단위결과성 수박 식물의 용도가 제공된다. 추가로 통성 단위결과성 수박 식물 및/또는 암꽃의 수분의 부재 하에 씨없는 수박 과실을 생성하기 위한 돌연변이체 wap5.1 대립유전자의 용도가 제공된다. 마찬가지로 통성 단위결과성 수박 식물을 생산하기 위한 본 발명에 따른 WAP5.1 유전자의 돌연변이체 wap5.1 대립유전자의 용도가 본원에 포함된다.
한 측면에서 본 발명에 따른 식물, 식물 부분 및 식물 세포는 규칙 28 (2) EPC (유럽 특허 협약)에 의해 정의된 바와 같이 본질적으로 생물학적 프로세스에 의해 배타적으로 수득되는 것은 아니다.
한 측면에서 식물은 비-GMO (유전자 변형되지 않음)이다.
한 측면에서 돌연변이체 대립유전자는 돌연변이유발 (예를 들어, 화학적 또는 방사선 돌연변이유발) 또는 표적화된 돌연변이유발에 의해, 특히 CRISPR 시스템 (예를 들어, Crispr/Cas9 또는 Crispr/CpfI 또는 다른 뉴클레아제)을 사용하여 생성된다. 한 측면에서 돌연변이체 wap5.1 대립유전자를 포함하는 재배 식물은 트랜스제닉 식물이 아니며, 예를 들어 CRISPR 구축물을 포함하지 않는 비-트랜스제닉 자손이 예를 들어 선택된다.
한 측면에서 WAP5.1 유전자의 돌연변이체 대립유전자는 인간 유도된 돌연변이, 즉 돌연변이유발 기술, 예컨대 화학적 돌연변이유발 또는 방사선 돌연변이유발, 또는 표적화된 돌연변이유발 기술, 예컨대 Crispr 기반 기술에 의해 도입된 돌연변이를 포함한다.
임의의 표적화된 유전자 변형 방법, 예컨대 CRISPR 기반 방법 (예를 들어, Crispr/Cas9 또는 Crispr/CpfI), TALENS, 아연 핑거 또는 다른 방법을 사용하여 수박, 멜론 및 오이에서 내인성 WAP5.1 유전자의 표적화된 돌연변이유발 방법이 본원에 제공된다.
한 측면에서 단리된 돌연변이체 WAP5.1 단백질 및 단리된 야생형 WAP5.1 단백질, 또는 돌연변이체 WAP5.1 단백질 또는 야생형 WAP5.1 단백질을 코딩하는 단리된 핵산 분자가 제공된다. 또한 돌연변이체 또는 야생형 WAP5.1 단백질에 결합할 수 있는 항체가 본원에 포함된다.
검출 방법
한 측면에서 이들의 게놈에 WAP5.1 단백질-코딩 유전자의 돌연변이체 대립유전자를 포함하는 종자, 식물 또는 식물 부분 또는 이러한 종자, 식물 또는 식물 부분으로부터의 DNA를 식별 및/또는 선택하기 위한 스크리닝 방법이 제공된다.
상기 방법은 돌연변이체 대립유전자의 존재를 검출하기 위해 공지된 방법을 사용하여 DNA, RNA (또는 cDNA) 또는 단백질 수준에서 스크리닝하는 것을 포함한다. 유전자의 돌연변이체 대립유전자의 존재를 검출하기 위한 많은 방법이 있다.
그러므로, 하기 단계 중 하나 이상을 포함하는, 돌연변이체 wap5.1 대립유전자의 존재에 대해 식물 또는 식물 물질 또는 식물 부분, 또는 이로부터 유래된 DNA 또는 RNA 또는 단백질을 스크리닝 및/또는 선택하는 방법이 제공된다:
a) 내인성 WAP5.1 유전자의 유전자 발현이 감소 또는 폐지되었는지 결정하는 단계;
b) 야생형 WAP5.1 단백질의 양이 감소 또는 폐지되었는지 결정하는 단계;
c) 돌연변이체 WAP5.1 단백질을 코딩하는 돌연변이체 mRNA, cDNA 또는 게놈 DNA가 존재하는지 결정하는 단계;
d) 돌연변이체 WAP5.1 단백질이 존재하는지 결정하는 단계;
e) 식물 또는 이의 자손이 통성 단위결과성인지 결정하는 단계.
일상적인 방법, 예컨대 RT-PCR, PCR, 항체 기반 검정, 시퀀싱, 유전자형분석 검정 (예를 들어, 대립유전자-특이적 유전자형분석), 표현형분석 등이 사용될 수 있다.
식물 또는 식물 물질 또는 식물 부분은 수박, 오이 또는 멜론 식물 또는 식물 물질 또는 식물 부분, 예컨대 잎, 잎 부분, 세포, 과실, 과실 부분, 씨방, 줄기, 배축, 종자, 종자의 부분, 종피, 배아 등일 수 있다.
예를 들어 야생형 및 돌연변이체 대립유전자 사이에 단일 뉴클레오티드 차이 (단일 뉴클레오티드 다형성, SNP)가 있는 경우, SNP 유전자형분석 검정은 식물 또는 식물 부분 또는 세포가 이의 게놈에 야생형 뉴클레오티드 또는 돌연변이체 뉴클레오티드를 포함하는지 여부를 검출하기 위해 사용될 수 있다. 예를 들어 SNP는 KASP-검정 (월드 와이드 웹 kpbioscience.co.uk 참조) 또는 다른 SNP 유전자형분석 검정을 사용하여 쉽게 검출될 수 있다. KASP-검정을 개발하기 위해, 예를 들어 SNP의 70개 염기쌍 상류 및 70개 염기쌍 하류를 선택할 수 있고, 2개의 대립유전자-특이적 정방향 프라이머 및 1개의 대립유전자 특이적 역방향 프라이머를 설계할 수 있다. 예를 들어 문헌 [Allen et al. 2011, Plant Biotechnology J. 9, 1086-1099], 특히 KASP-검정 방법에 대한 p097-1098을 참조한다.
동일하게 다른 유전자형분석 검정이 사용될 수 있다. 예를 들어, TaqMan SNP 유전자형분석 검정, 고분해능 용융 (HRM) 검정, SNP-유전자형분석 어레이 (예를 들어, 플루이다임(Fluidigm), 일루미나(Illumina) 등) 또는 DNA 시퀀싱이 동일하게 사용될 수 있다.
한 측면에서 예를 들어 서열식별번호: 8의 뉴클레오티드 61, 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 있는 SNP 마커 mwm23348429는 수박에서 L528F 아미노산 치환, 오이에서 L535F 아미노산 치환 또는 멜론에서 L538F 아미노산 치환을 포함하는 돌연변이체 단백질을 코딩하는 돌연변이체 wap5.1 대립유전자의 존재 또는 부재를 검출하기 위해 사용될 수 있다. 야생형 대립유전자 및 돌연변이체 대립유전자의 게놈 서열 사이의 차이에 기초하여, 통상의 기술자는 특이적 대립유전자를 검출하기 위해 사용될 수 있는 마커를 쉽게 개발할 수 있다.
또한, 돌연변이체 wap5.1 대립유전자를 포함하는 수박, 오이 또는 멜론 식물 (또는 식물 부분)을 식별하는 방법이 본원에 제공되며, 상기 방법은 식물 (또는 식물 부분)에서 돌연변이체 wap5.1 대립유전자의 존재를 검출하는 것을 포함하며, 여기서 존재는 wap5.1 대립유전자 내의 적어도 하나의 마커에 의해 또는 wap5.1 대립유전자에 의해 코딩된 단백질을 검출함으로써 검출된다. 돌연변이체 wap5.1 대립유전자를 검출하는 방법은 대립유전자에 의해 코딩된 wap5.1 단백질을 검출하기 위한 PCR 증폭, 핵산 시퀀싱, 핵산 혼성화 및 항체 기반 검정 (예를 들어, 면역검정)으로 이루어진 군으로부터 선택된다.
또한, 조절 요소에 돌연변이를 포함하는 돌연변이체 wap5.1 대립유전자를 포함하는 수박, 오이 또는 멜론 식물 (또는 식물 부분)을 식별하는 방법이 본원에 제공되며, 상기 방법은 식물 (또는 식물 부분)에서 돌연변이체 wap5.1 대립유전자의 감소된 유전자 발현 또는 유전자 발현의 부재를 검출하는 것을 포함하며, 여기서 존재는 야생형 WAP5.1 대립유전자의 mRNA 수준 (cDNA)에 의해 또는 야생형 WAP5.1 단백질의 단백질 수준을 검출함으로써 검출된다. 돌연변이체 wap5.1 대립유전자를 검출하는 방법은 대립유전자에 의해 코딩된 WAP5.1 단백질을 검출하기 위한 PCR 증폭 (예를 들어, RT-PCR), 핵산 시퀀싱, 웨스턴 블롯팅 및 항체 기반 검정 (예를 들어, 면역검정)으로 이루어진 군으로부터 선택된다.
또한, 세포 또는 수박 식물 또는 식물 부분이 서열식별번호: 1 또는 9의 단백질, 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97% 또는 98% 서열 동일성을 포함하는 단백질을 코딩하는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는지 여부를 결정 또는 검출 또는 검정하는 방법이 본원에 제공된다. 한 측면에서 방법은 대립유전자의 발현을 결정하는 것, 및/또는 대립유전자의 코딩 서열을 결정하는 것, 및/또는 대립유전자의 코딩 서열의 일부 (예를 들어, 대립유전자의 SNP 유전자형)를 결정하는 것, 및/또는 생산된 단백질의 아미노산 서열 및/또는 생산된 단백질의 양을 결정하는 것을 포함한다. 세포 또는 오이 또는 멜론 식물 또는 식물 부분이 서열식별번호: 2의 단백질, 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97% 또는 98% 서열 동일성을 포함하는 단백질 (오이), 또는 서열식별번호: 3의 단백질, 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97% 또는 98% 서열 동일성을 포함하는 단백질 (멜론)을 코딩하는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는지 여부를 결정 또는 검출 또는 검정하는 방법에 동일하게 적용된다.
식물 또는 이의 부분이 본 발명의 돌연변이체 wap5.1 대립유전자를 포함하는지 여부를 결정하는데 다양한 방법이 사용될 수 있다. 언급된 바와 같이, 야생형 대립유전자의 감소된 발현 또는 발현 없음이 있는지 확인하기 위해 야생형 대립유전자의 mRNA (또는 cDNA) 수준을 결정할 수 있거나, 야생형 단백질 수준을 결정될 수 있다. 또한, 코딩 서열 또는 이의 부분이 분석될 수 있으며, 예를 들어 어떤 돌연변이체 대립유전자가 존재할 수 있는지 이미 알고 있는 경우, 돌연변이를 검출하기 위한 검정이 개발될 수 있으며, 예를 들어 SNP 유전자형분석 검정은 예를 들어 돌연변이체 대립유전자 및 야생형 대립유전자의 존재를 구별할 수 있다 (예를 들어 마커 mwm23348429에 대한 유전자형분석).
하기 단계를 포함하는, 식물 또는 종자의 선택 방법:
a) WAP5.1 단백질을 코딩하는 유전자의 대립유전자에 돌연변이를 갖는 식물 또는 종자를 식별하는 단계로서, 여기서 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 1 또는 서열식별번호: 2 또는 서열식별번호: 3의 군으로부터 선택된 단백질 중 어느 하나에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.9% 서열 동일성을 포함하는 WAP5.1 단백질을 코딩하는 것인 단계, 및 임의로
b) 식물 또는 자가-수정에 의해 생산된 자손 식물이 통성 단위결과성인지 여부를 결정하는 단계, 및 임의로
c) 단계 a)의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 식물 또는 종자를 선택하는 단계.
하기 단계를 포함하는, 식물, 바람직하게는 수박, 멜론 또는 오이 식물의 생산 방법:
a) 식물 또는 종자 집단에 돌연변이를 도입하는 단계,
b) 수분의 부재 하에 씨없는 과실 및 수분 후 씨있는 과실을 생산하는 식물을 선택하고/거나, 이의 게놈에 돌연변이체 wap5.1 대립유전자를 포함하는 식물 또는 종자를 선택하는 단계,
c) 임의로 b)에서 선택된 식물이 WAP5.1 단백질을 코딩하는 대립유전자에 돌연변이를 갖는지 확인하는 단계, 및 임의로
d) c)에서 수득된 식물 또는 종자를 성장 또는 재배하는 단계,
여기서 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9 또는 서열식별번호: 2 또는 서열식별번호: 3의 군으로부터 선택된 단백질 중 어느 하나에 대해 적어도 95% 서열 동일성을 포함하는 WAP5.1 단백질을 코딩한다.
하기 단계를 포함하는, 식물의 생산 방법:
a) 외래 핵산 분자를 식물에 도입하는 단계로서, 여기서 외래 핵산 분자는 하기로 이루어진 군으로부터 선택되는 것인 단계:
i) WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소에 영향을 미치는 적어도 하나의 안티센스 RNA를 코딩하는 DNA 분자;
ii) 공동-저해 효과에 의해 WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소를 유발하는 DNA 분자;
iii) WAP5.1 단백질을 코딩하는 내인성 유전자의 특이적 전사체를 분할하는 적어도 하나의 리보자임을 코딩하는 DNA 분자;
iv) 적어도 하나의 안티센스 RNA 및 적어도 하나의 센스 RNA를 동시에 코딩하는 DNA 분자, 여기서 상기 안티센스 RNA 및 상기 센스 RNA는 WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소에 영향을 미치는 이중-가닥 RNA 분자를 형성함 (RNAi 기술);
v) WAP5.1 단백질을 코딩하는 내인성 유전자에서 이종 서열의 돌연변이 또는 삽입을 유발하는 생체내 돌연변이유발에 의해 도입된 핵산 분자, 여기서 돌연변이 또는 삽입은 WAP5.1 단백질을 코딩하는 유전자의 발현 감소에 영향을 미치거나 기능 상실 또는 감소된 기능 WAP5.1 단백질의 합성을 초래함;
vi) 항체를 코딩하는 핵산 분자, 여기서 항체는 내인성 WAP5.1 단백질에 대한 항체의 결합으로 인해 WAP5.1 단백질을 코딩하는 내인성 유전자의 활성 감소를 초래함;
vii) 트랜스포존을 함유하는 DNA 분자, 여기서 이들 트랜스포존의 통합은 WAP5.1 단백질을 코딩하는 내인성 유전자에서 돌연변이 또는 삽입을 유발하며, 이는 WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소에 영향을 미치거나 비활성 단백질의 합성을 초래함;
viii) WAP5.1 단백질을 코딩하는 내인성 유전자에서의 삽입으로 인해 WAP5.1 단백질을 코딩하는 내인성 유전자의 발현 감소에 영향을 미치거나, 기능 상실 또는 감소된 기능 WAP5.1 단백질의 합성을 초래하는 T-DNA 분자;
ix) 희귀-절단 엔도뉴클레아제 또는 맞춤형 희귀-절단 엔도뉴클레아제, 바람직하게는 메가뉴클레아제, TALEN 또는 CRISPR/Cas 시스템을 코딩하는 핵산 분자.
b) 식물을 선택하며, 여기서 식물 또는 자가-수정에 의해 생산된 식물의 자손은 수분의 부재 하에 씨없는 과실 및 수분 후 씨있는 과실을 생산하는 것인 단계, 임의로
c) b)에서 선택된 식물이 이의 게놈에 예를 들어 외래 핵산 분자가 통합되지 않은 야생형 식물과 비교하여 WAP5.1 단백질의 감소된 활성을 갖는지 확인하는 단계, 임의로
d) c)에서 수득된 식물을 성장/재배하는 단계.
임의의 상기 방법에 의해 수득된 식물이 본원에 포함된다.
한 측면에서 유전적으로 변형된 식물 및 식물 부분이 제공되며, 여기서 식물은 예를 들어 내인성 WAP5.1 유전자의 침묵을 통해 내인성 WAP5.1 유전자의 감소된 발현 또는 발현 없음을 갖는다. 이러한 식물은 임의의 식물일 수 있으며, 한 측면에서 이는 수박, 멜론 또는 오이이다. 그러나, 이는 또한 옥수수, 대두, 밀, 카놀라, 토마토, 목화 등일 수 있다.
또 다른 측면에서 내인성 WAP5.1 유전자에 돌연변이, 예를 들어 표적화된 돌연변이유발에 의해 예를 들어 생성된 유도된 돌연변이를 포함하는 식물 및 식물 부분이 제공되며, 여기서 유전자 발현은 감소 또는 폐지되거나, 발현된 유전자는 야생형 단백질과 비교하여 감소된 기능 또는 기능 상실 WAP5.1 단백질을 코딩한다. 이러한 식물은 임의의 식물일 수 있으며, 한 측면에서 이는 기재된 바와 같이 수박, 멜론 또는 오이이다. 그러나, 이는 또한 옥수수, 대두, 밀, 카놀라, 토마토, 목화, 후추 등일 수 있다. 다른 종의 WAP5.1 유전자는 쿠르비타세아에 WAP5.1 유전자에 대해 더 적은 서열 동일성을 가질 수 있기 때문에, 본 발명의 이 측면에서 WAP5.1 유전자는 서열식별번호: 1, 9, 2 또는 3에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 서열 동일성을 포함하는 단백질을 코딩하는 유전자임이 본원에 포함된다. 임의로 WAP5.1 유전자는 서열식별번호: 1, 9, 2 또는 3에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 서열 동일성을 포함하는 단백질을 코딩하는 유전자이며, 여기서 단백질은 서열식별번호: 1, 9, 2 또는 3의 보존된 F-박스 도메인 및/또는 LRR-도메인, 또는 서열식별번호: 1, 9, 2 또는 3의 F-박스 또는 LRR-도메인에 대해 적어도 70%, 75%, 80%, 85%, 90%, 95% 서열 동일성을 포함하는 F-박스 또는 LRR-도메인을 포함한다. 통상의 기술자는 이러한 다른 종에서, 예를 들어 후추 또는 토마토에서 WAP5.1 유전자의 오르토로그를 식별하고, 이에 의해 통성 단위결과성 후추 또는 토마토 식물을 만들 수 있다. 수박, 오이 및 멜론에 대해 본원에 기재된 모든 실시양태는 WAP5.1 유전자가 그러므로 서열식별번호: 1, 9, 2 또는 3의 야생형 WAP5.1 수박, 오이 또는 멜론 단백질에 대해 각각 95% 미만의 서열 동일성을 갖는 단백질을 코딩할 수 있다는 차이를 제외하고는 다른 작물 종에 동일하게 적용된다.
또한, 하기 단계를 포함하는, WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 존재에 대해 수박 식물, 종자, 식물 부분 또는 이로부터의 DNA를 스크리닝하기 위한, 또는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는 수박 식물, 종자 또는 식물 부분을 선택하기 위한 방법이 본원에 제공된다:
a) 게놈 DNA가 서열식별번호: 1 또는 9의 단백질을 코딩하는 야생형 WAP5.1 대립유전자 및/또는 야생형 WAP5.1 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함하는지 여부를 분석하는 단계, 및 임의로
b) 야생형 대립유전자의 2개 카피, 돌연변이체 대립유전자의 2개 카피 또는 야생형 대립유전자의 1개 카피 및 돌연변이체 대립유전자의 1개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
한 측면에서 방법 단계 a)는 하기로부터 선택된 방법을 포함한다:
i) WAP5.1 대립유전자의 DNA에 혼성화하는 하나 이상의 올리고뉴클레오티드 프라이머를 사용한 WAP5.1 대립유전자의 적어도 일부의 증폭,
ii) WAP5.1 대립유전자의 DNA의 적어도 일부에 대한 하나 이상의 올리고뉴클레오티드 프로브의 혼성화,
iii) WAP5.1 대립유전자의 DNA, mRNA 또는 cDNA의 시퀀싱.
따라서, 예를 들어 DNA 샘플은 식물, 종자 또는 식물 부분으로부터 수득될 수 있고, 야생형 WAP5.1 대립유전자의 일부 및/또는 돌연변이체 WAP5.1 대립유전자의 일부를 증폭시키기 위해 PCR 반응이 수행될 수 있다. 예를 들어 경쟁적 PCR 방법은 게놈 DNA의 WAP5.1 로커스에 존재하는 대립유전자의 증폭 생성물을 생성하기 위해 사용될 수 있다 (예컨대 KASP 검정). 유사하게, 올리고뉴클레오티드 프로브는 게놈 DNA의 WAP5.1 로커스에 존재하는 대립유전자의 혼성화 생성물을 생성할 수 있다. 프라이머 또는 프로브는 예를 들어 야생형 대립유전자 및 돌연변이체 대립유전자를 구분하기 위해 특정 WAP5.1 대립유전자에 특이적이도록 설계될 수 있다. 예를 들어, SNP 마커 mwm23348429는 뉴클레오티드 61에 SNP를 포함하며, 이는 아미노산 L528을 포함하는 단백질을 코딩하는 야생형 대립유전자 및 서열식별번호: 1 또는 9에서 아미노산 F528을 포함하는 단백질을 코딩하는 돌연변이체 대립유전자를 구분한다. 프라이머 또는 프로브는 이러한 SNP를 검출하도록 설계될 수 있으며, 야생형 및 돌연변이체 WAP5.1 대립유전자, 예컨대 표 1의 것들 사이에서 발견되는 임의의 다른 다형성 (예를 들어, SNP 또는 INDEL)에 대해서도 동일하게 수행될 수 있다.
한 측면에서, 하기 단계를 포함하는, 수박 식물, 종자, 식물 부분, 세포 또는 조직의 유전자형분석을 위한 유전자형분석 검정이 제공된다:
a) 하나 이상의 수박 식물 또는 식물 집단의 게놈 DNA를 제공하는 단계, 및
b) 서열식별번호: 1 또는 9의 단백질을 코딩하는 야생형 대립유전자의 존재 및/또는 돌연변이체 대립유전자의 존재를 검출하는 유전자형분석 검정을 수행하는 단계로서, 여기서 돌연변이체 대립유전자는 서열식별번호: 1 또는 9에 대해 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하는 것인 단계, 및 임의로
c) 야생형 대립유전자의 2개 카피, 또는 야생형 대립유전자의 1개 카피 및 돌연변이체 대립유전자의 1개 카피, 또는 돌연변이체 대립유전자의 2개 카피를 포함하는 식물, 종자, 식물 부분, 세포 또는 조직을 선택하는 단계.
단계 b)에서 돌연변이체 대립유전자에서의 돌연변이는 바람직하게는 하나 이상의 아미노산이 야생형 단백질에 대해 삽입, 결실 또는 대체되도록 야기하며, 예를 들어 돌연변이체 대립유전자는 본원에 기재된, 예를 들어 표 1에 기재된 돌연변이체 WAP5.1 단백질 중 하나를 코딩한다.
야생형 대립유전자는 예를 들어 기재된 영역의 찰스턴 그레이 로커스 또는 앞서 기재된 영역의 품종 97103 로커스에 상응하는 염색체 5 상의 로커스에 있는 게놈 DNA이다. 이들 WAP5.1 로커스는 각각 서열식별번호: 7 및 서열식별번호: 14의 게놈 서열을 포함한다. 둘 다는 프로그램 니들을 사용하여 쌍별 정렬된 경우에 99.8%의 서열 동일성을 갖는다. 야생형 로커스에 의해 코딩된 cDNA는 각각 서열식별번호: 6의 cDNA (서열식별번호: 1의 야생형 단백질을 코딩함) 및 서열식별번호: 11의 cDNA (서열식별번호: 9의 야생형 단백질을 코딩함)이다.
단계 a)는 유전자형분석 검정에서 분석될 식물, 종자, 식물 부분, 세포 또는 조직으로부터의 게놈 DNA의 단리를 포함할 수 있다. 관련 기술분야에 공지된 바와 같이 종종 조질 DNA 추출 방법이 사용될 수 있다.
단계 b)는 바람직하게는 이중-대립유전자 유전자형분석 검정을 포함하며, 이는 대립유전자-특이적 올리고뉴클레오티드 프라이머 및/또는 대립유전자-특이적 프로브, 즉 야생형 대립유전자 및 돌연변이체 대립유전자를 구별하는 프라이머 또는 프로브를 사용한다.
단계 a)의 식물은 예를 들어 화학적 또는 방사선 돌연변이원 또는 유전자 편집 기술을 사용하여 돌연변이유발될 수 있다. 그러므로 단계 a) 이전에 식물, 종자 또는 식물 부분을 돌연변이유발제로 처리하거나 WAP5.1 대립유전자에서 표적화된 돌연변이를 유도하는 단계가 있을 수 있다.
INDEL 및 SNP를 검출할 수 있고 게놈 DNA에 존재하는 야생형 대립유전자 (염색체 5 상의 WAP5.1 로커스에서) 또는 게놈 DNA에 존재하는 WAP5.1 유전자의 돌연변이체 대립유전자를 구분할 수 있는 한, 다양한 유전자형분석 검정이 사용될 수 있다. 유전자형분석 검정은 일반적으로 야생형 또는 돌연변이체 대립유전자를 증폭시키고 증폭 생성물을 검출하기 위해 PCR 또는 열 순환 반응 (폴리머라제 연쇄 반응)에서 사용되는 대립유전자-특이적 프라이머, 또는 야생형 대립유전자 또는 돌연변이체 대립유전자 또는 둘 다에 혼성화하는 대립유전자-특이적 올리고뉴클레오티드 프로브에 기초한다. 예를 들어 BHQplus 프로브를 사용한 유전자형분석은 다형성 영역을 플랭킹하는 2개의 대립유전자 특이적 프로브 및 2개의 프라이머를 사용하고, 열 순환 동안 폴리머라제는 DNA에 결합된 대립유전자-특이적 프로브를 만나 형광 신호를 방출한다. 대립유전자 구별은 2개의 대립유전자-특이적 BHQPlus 프로브의 경쟁적 결합을 수반한다 (또한 biosearchtech.com 참조).
유전자형분석 검정의 예는 경쟁적 대립유전자-특이적 PCR 및 종점 형광 검출에 기반한 KASP-검정 (LGC에 의한, www LGCgenomics.com 및 또한 www biosearchtech.com/products/ pcr-kits-and-reagents/ genotyping-assays/ kasp-genotyping-chemistry 참조), TaqMan-검정 (어플라이드 바이오시스템즈(Applied Biosystems)) (이는 또한 PCR 기반임), HRM 검정 (고분해능 용융 검정) (여기서 대립유전자-특이적 프로브는 실시간 PCR을 사용하여 검출됨), 또는 rhAmp 검정 (Rnase H2-의존적 PCR, BHQplus 유전자형분석, BHQplex CoPrimer 유전자형분석 등에 기반함)이다.
KASP-검정은 또한 문헌 [He C, Holme J, Anthony J. 'SNP genotyping: the KASP assay. Methods Mol Biol. 2014;1145:75-86'] 및 EP1726664B1 또는 US7615620 B2 (참조로 포함됨)에 기재되어 있다. KASP 유전자형분석 검정은 단일 뉴클레오티드 다형성 (SNP) 또는 삽입물 및 결실물 (InDels)을 검출하기 위해 뉴클레오티드 수준에서 발생하는 유전적 변이의 식별 및 측정을 위한 신규의 균질 형광-기반 보고 시스템과 조합된 경쟁적 대립유전자-특이적 PCR의 고유한 형태를 활용한다. KASP 기술은 다양한 장비 플랫폼에서 사용하기에 적합하고, 분석될 수 있는 SNP의 수 및 샘플의 수의 측면에서 유연성을 제공한다. KASP 화학은 96-, 384- 및 1,536-웰 마이크로타이터 플레이트 형식에서 동일하게 잘 기능하고, 인간, 동물 및 식물 유전학 분야의 사용자에 의해 크고 작은 실험실에서 수년에 걸쳐 활용되어 왔다.
TaqMan 유전자형분석 검정은 또한 문헌 [Woodward J. 'Bi-allelic SNP genotyping using the TaqMan® assay.' Methods Mol Biol. 2014;1145:67-74], US5210015 및 US5487972 (본원에 참조로 포함됨)에 기재되어 있다. TaqMan(®) 기술을 통해 대립유전자-특이적 프로브는 공지된 다형성 부위의 신속하고 신뢰가능한 유전자형분석을 위해 활용된다. TaqMan 검정은 단일 뉴클레오티드 다형성, 삽입/결실 및 존재/부재 변이체를 포함하여 다중 변이체 유형의 유전자형분석에 강력하다. 단일 이중-대립유전자 다형성을 쿼리하기 위해, 별개의 형광단으로 라벨링된 2개의 TaqMan 프로브는 주변 표적 영역의 PCR-기반 증폭 동안 상이한 대립유전자에 혼성화하도록 설계된다. PCR의 프라이머 연장 단계 동안, Taq 폴리머라제의 5'-3' 엑소뉴클레아제 활성이 결합된 프로브로부터 형광단을 절단 및 방출한다. PCR의 종료 시, 각 형광단의 방출 강도를 측정하고, 쿼리된 부위에서 대립유전자 결정을 수행할 수 있다.
따라서 서열식별번호: 1 또는 9의 단백질을 코딩하는 WAP5.1 유전자의 야생형 대립유전자 또는 WAP5.1 유전자의 돌연변이체 대립유전자의 존재를 구분할 수 있는 다양한 유전자형분석 검정이 사용될 수 있다. WAP5.1 유전자의 다양한 돌연변이체 대립유전자가 검출될 수 있다. 따라서, 서열식별번호: 4 또는 서열식별번호: 10의 단백질을 코딩하는 돌연변이체 대립유전자 (L528F 돌연변이 포함), 뿐만 아니라 표 1에 기재된 것들 및 기타를 포함하여 WAP5.1 유전자의 임의의 다른 돌연변이체 대립유전자를 검출하기 위한 검정이 설계될 수 있다.
언급된 바와 같이 바람직하게는 이중-대립유전자 유전자형분석 검정, 예를 들어 KASP-검정, TaqMan 검정, BHQplus 검정, PACE 유전자형분석 (월드 와이드 웹 idtdna.com/pages/products/qpcr-and-pcr/genotyping/pace-snp-genotyping-assays 참조) 또는 임의의 다른 이중-대립유전자 유전자형분석 검정이 사용된다.
한 측면에서 상기 방법의 단계 b)에서 유전자형분석 검정은 KASP-검정이다. 그러므로 단계 b)에서 경쟁적 PCR은 2개의 정방향 프라이머 및 1개의 공통 역방향 프라이머를 사용하여 수행된다. 2개의 정방향 프라이머는 게놈 서열 (또는 이의 상보체 가닥)에 상보적인 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 뉴클레오티드를 포함한다. 또한 2개의 정방향 프라이머는 야생형 서열을 대립유전자의 돌연변이체 서열과 구분하는 SNP 또는 INDEL에 대한 특이성을 제공하는 1, 2, 3개 또는 그 초과의 뉴클레오티드 (바람직하게는 프라이머의 3' 말단에)를 포함한다. 이에 의해 2개의 정방향 프라이머는 야생형 대립유전자 또는 돌연변이체 대립유전자에 대한 상이한 결합 특이성 (또는 선호도)을 갖는다. 예를 들어 Fam-프라이머는 예를 들어 야생형 서열의 17개 뉴클레오티드 및 돌연변이체 대립유전자의 뉴클레오티드에 특이적인 1개 뉴클레오티드를 포함할 수 있고, VIC-프라이머는 야생형 대립유전자의 18개 뉴클레오티드 및 야생형 대립유전자의 뉴클레오티드에 특이적인 1개 뉴클레오티드를 포함할 수 있다. KASP-검정은 야생형 대립유전자 및 하나 이상의 뉴클레오티드가 삽입, 결실 또는 대체되어 야생형 대립유전자와 상이한 WAP5.1 유전자의 임의의 돌연변이체 대립유전자를 구분하도록 쉽게 설계될 수 있으며, 따라서 예를 들어 검정은 2개의 대립유전자를 구분하는 임의의 SNP 또는 INDEL에 대해 설계될 수 있다.
유전자형분석 검정, 예컨대 KASP 검정은 또한 2배체 수박 식물 및 식물 부분에 대해 기재된 바와 동일한 방식으로 3배체 또는 4배체 수박 식물 및 식물 부분에서 돌연변이체 및/또는 야생형 WAP5.1 대립유전자를 검출하기 위해 수행될 수 있음을 주목해야 한다.
한 측면에서 WAP5.1 유전자의 돌연변이체 대립유전자는 본원의 다른 곳에 이미 기재된 바와 같이 서열식별번호: 1 또는 9의 야생형 단백질에 대해 삽입, 대체 또는 결실된 하나 이상의 아미노산을 포함하는 단백질을 코딩한다.
따라서, 한 실시양태에서 하기를 포함하는, WAP5.1로 명명된 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박 식물, 종자 또는 식물 부분을 검출하고 임의로 선택하기 위한 방법이 제공된다:
a) 수박 식물 또는 복수의 식물 (예를 들어, 육종 집단, F2, 역교배 등)의 게놈 DNA를 제공하는 단계,
b) 유전자의 야생형 대립유전자 및/또는 유전자의 돌연변이체 대립유전자의 존재를 검출하기 위해 핵산 증폭 (예를 들어, 대립유전자 특이적 올리고뉴클레오티드 프라이머의 사용을 포함함) 및/또는 핵산 혼성화 (예를 들어, 대립유전자-특이적 올리고뉴클레오티드 프로브의 사용을 포함함)에 기초하여 a)의 게놈 DNA에서 대립유전자의 존재를 구별하거나 구별할 수 있는 검정 (예를 들어, 이중-대립유전자 유전자형분석 검정)을 수행하는 단계로서, 여기서 야생형 대립유전자는 서열식별번호: 1 또는 9의 단백질 (또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.8% 또는 99.9% 동일성을 포함하는 야생형 WAP5.1 단백질)을 코딩하고, 돌연변이체 대립유전자는 서열식별번호: 1 또는 9의 야생형 단백질에 대해 (또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99%, 99.5% 또는 99.8% 또는 99.9% 동일성을 포함하는 야생형 WAP5.1 단백질에 대해) 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 단백질을 코딩하는 것인 단계, 및 임의로
c) 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
단계 b)에서 유전자형분석 검정은 예를 들어 올리고뉴클레오티드 프라이머, 예컨대 PCR (폴리머라제 연쇄 반응) 및 PCR 프라이머, 바람직하게는 대립유전자-특이적 프라이머를 사용하는 핵산 (특히 DNA) 증폭 반응, 및/또는 올리고뉴클레오티드 프로브, 바람직하게는 대립유전자-특이적 프로브를 사용하는 핵산 혼성화에 기초하여 야생형 및 돌연변이체 대립유전자를 구별한다.
프라이머 또는 프로브는 바람직하게는 라벨, 예를 들어 형광 라벨을 포함하거나 꼬리 서열 또는 다른 변형을 포함하도록 변형된다.
한 측면에서, 임의의 상기 방법에서 검정은 하나 이상의 WAP5.1 대립유전자 특이적 프라이머 또는 하나 이상의 WAP5.1 대립유전자 특이적 프로브를 사용한다. 언급된 바와 같이, 서열식별번호: 7 또는 14의 게놈 서열 또는 서열식별번호: 1 또는 9의 단백질을 코딩하는 다른 (예를 들어, 축퇴) 게놈 서열 또는 예를 들어 서열식별번호: 1 또는 9와 비교하여 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 단백질을 코딩하는 돌연변이체 대립유전자의 게놈 서열에 기초하여, PCR 프라이머 및 핵산 프로브는 올리고뉴클레오티드 설계를 위한 공지된 방법 또는 소프트웨어 프로그램을 사용하여 설계될 수 있다. 프라이머 및 프로브는 예를 들어 길이가 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24개 또는 그 초과의 뉴클레오티드 (염기)일 수 있고, 주형 DNA 서열에 어닐링 (또는 혼성화)하며, 즉 이들은 바람직하게는 표적 서열에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는다. 야생형 대립유전자 또는 돌연변이체 대립유전자에 대한 프라이머 또는 프로브 특이성은 프라이머 또는 프로브의 적어도 1, 2, 3개 또는 그 초과의 뉴클레오티드가 대립유전자에 대해 특이적이기 때문이다. 그러므로 프라이머 또는 프로브는 표적 유전자의 2개의 대립유전자 사이의 다형성 (예를 들어, SNP 또는 InDel) 주위에 설계되어 이들을 구별한다. 한 측면에서 검정은 예를 들어 KASP-검정, TaqMan-검정, BHQplus 프로브 검정 또는 임의의 다른 이중-대립유전자 유전자형분석 검정으로부터 선택된 이중-대립유전자 유전자형분석 검정이다.
한 측면에서, 돌연변이체 대립유전자는 대립유전자의 코딩 영역에서 삽입 또는 복제된 적어도 하나의 코돈, 또는 또 다른 코돈으로 변화된 적어도 하나의 코돈 (예를 들어, 단일 뉴클레오티드 변화를 통해), 또는 결실되거나 정지 코돈으로 변화된 적어도 하나의 코돈을 포함한다.
임의의 상기 방법에서, 한 측면에서 돌연변이체 대립유전자는 표 1에 기재된 바와 같은 단백질을 코딩한다. 그러므로, 한 측면에서 방법은 서열식별번호: 1 또는 9의 단백질을 코딩하는 야생형 WAP5.1 대립유전자의 2개 카피, 표 1의 돌연변이체 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자의 2개 카피, 또는 각 대립유전자의 1개 카피 (이형접합성)를 포함하는 식물, 종자 또는 식물 부분을 구별하기 위해 사용될 수 있다. 임의로 이들 유전자형 중 임의의 것을 포함하는 식물, 식물 부분 또는 종자는 예를 들어 추가 육종을 위해 또는 수박 생산에서 사용하기 위해 선택될 수 있다.
임의의 DNA 유전자형분석 검정이 상기 방법에서 사용될 수 있지만 (PCR 기반 (PCR 프라이머 사용) 및/또는 혼성화 기반 (프로브 사용)), 한 측면에서 KASP-검정은 야생형 및 돌연변이체 대립유전자를 구별하기 위해 사용된다. 검정은 높은 처리량 방식으로, 예를 들어 96 웰 플레이트 또는 그 초과의 웰 플레이트 (예를 들어, 384 웰 플레이트)에서 사용될 수 있다.
한 측면에서 검정은 서열식별번호: 8의 뉴클레오티드 61에서 C/T SNP를 구별한다. 따라서 프라이머 또는 프로브는 서열식별번호: 8의 뉴클레오티드 61에서 C 또는 T를 포함하는 대립유전자를 검출한다.
야생형 및 돌연변이체 WAP5.1 대립유전자 사이의 SNP 또는 INDEL에 따라, 검정에서 사용하기 위한 다양한 대립유전자-특이적 프라이머 및 프로브를 설계할 수 있다.
한 측면에서 2개의 정방향 프라이머 (하나는 야생형 대립유전자에 대한 것이고 하나는 돌연변이체 대립유전자에 대한 것임) 및 1개의 공통 역방향 프라이머 (둘 다 야생형 및 돌연변이체 대립유전자에 대한 것임)가 KASP-검정에서 사용된다. 한 측면에서 2개의 정방향 프라이머 및 역방향 프라이머는 게놈 WAP5.1 서열 또는 이의 상보체 서열의 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19개 또는 그 초과의 뉴클레오티드를 포함한다. 정방향 프라이머는 야생형 대립유전자의 증폭 또는 돌연변이체 대립유전자의 증폭에 대한 특이성 (또는 선호도)을 부여하는 적어도 1, 2 또는 3개의 뉴클레오티드 (바람직하게는 프라이머의 3' 말단에)를 추가로 포함한다. 각 정방향 프라이머는 공통 역방향 프라이머와 프라이머 쌍을 형성하여 열 순환 동안 프라이머 쌍 사이의 표적 대립유전자의 DNA 서열을 증폭시킨다. 열 순환을 위한 표준 구성성분이 사용되고, KASP-검정을 위한 표준 구성성분이 사용된다.
또 다른 실시양태에서 하기를 포함하는, WAP5.1로 명명된 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 혼성화 생성물 또는 증폭 생성물을 생산하는 방법이 제공된다:
a) 수박 식물 또는 복수의 식물 (예를 들어, 육종 집단, F2, 역교배 등)의 게놈 DNA를 제공하는 단계,
b) a)의 게놈 DNA에서 대립유전자의 존재를 구별하거나 구별할 수 있는 검정 (예를 들어, 이중-대립유전자 유전자형분석 검정)을 수행하는 단계로서, 상기 검정은 핵산 증폭 생성물을 생성하고/거나 (예를 들어, 생성물을 생성하기 위한 대립유전자 특이적 올리고뉴클레오티드 프라이머의 사용을 통해), 상기 검정은 핵산 혼성화 생성물을 생성하고 (예를 들어, 혼성화 생성물을 생성하기 위한 대립유전자-특이적 올리고뉴클레오티드 프로브의 사용을 통해), 여기서 증폭 생성물 또는 혼성화 생성물은 DNA에서 유전자의 야생형 대립유전자 및/또는 유전자의 돌연변이체 대립유전자의 존재를 나타내며, 여기서 야생형 대립유전자는 서열식별번호: 1 또는 9의 단백질을 코딩하고, 돌연변이체 대립유전자는 서열식별번호: 1 또는 9의 야생형 단백질에 대해 삽입, 복제, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 단백질을 코딩하는 것인 단계, 및 임의로
c) 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
또한, 수박 식물, 식물 부분 또는 종자로부터 유래된 게놈 DNA 샘플로부터 돌연변이체 및/또는 야생형 WAP5.1 대립유전자의 전부 또는 일부를 증폭시키는 방법이 제공되며, 상기 방법은 샘플에서 돌연변이체 WAP5.1 또는 야생형 WAP5.1 대립유전자의 전부 또는 일부를 증폭시키는 프라이머 쌍과 게놈 DNA를 접촉시키는 단계, 및 증폭 생성물을 검출하는 단계를 포함한다.
또한, 수박 식물, 식물 부분 또는 종자로부터 유래된 게놈 DNA 샘플에서 돌연변이체 및/또는 야생형 WAP5.1 대립유전자에 프로브를 혼성화하는 방법이 제공되며, 상기 방법은 샘플에서 돌연변이체 WAP5.1 또는 야생형 WAP5.1 대립유전자에 혼성화하는 올리고뉴클레오티드 프로브와 게놈 DNA를 접촉시키는 단계, 및 혼성화 생성물을 검출하는 단계를 포함한다.
상기 및 본원의 다른 곳에 기재된 모든 실시양태는 또한 이들 실시양태에 적용된다. 그러므로 증폭 생성물은 예를 들어 DNA 샘플에서 돌연변이체 및/또는 야생형 대립유전자를 검출하기 위한 KASP 검정 또는 다른 검정에서 생성된 PCR 증폭 생성물, 예를 들어 경쟁적 PCR 증폭 생성물일 수 있다. 그러므로 혼성화 생성물은 DNA 샘플에서 돌연변이체 및/또는 야생형 대립유전자를 검출하기 위해 DNA 샘플에서 핵산에 혼성화하는 올리고뉴클레오티드 프로브의 혼성화 생성물일 수 있다. 프라이머 쌍 또는 프로브는 바람직하게는 대립유전자 특이적이고, 그러므로 생성물은 야생형 대립유전자의 2개 카피, 돌연변이체 대립유전자의 2개 카피 또는 수박 식물, 식물 부분 또는 종자의 게놈 DNA에 존재하는 각각의 1개 카피로서 구별가능하다.
프라이머 또는 프로브는 바람직하게는 변형되며, 예를 들어 꼬리 서열 또는 형광 라벨에 의해 라벨링되거나, 증폭 또는 혼성화하는 야생형 서열과 관련하여 달리 변형된다.
기재된 방법은 식물, 식물 부분 또는 종자의 게놈 DNA에서 돌연변이체 및/또는 야생형 대립유전자의 검출을 필요로 하기 때문에, 게놈 DNA는 검출을 위해 접근가능할 필요가 있으며, 예를 들어 이는 DNA 추출 방법을 사용하여 식물 세포로부터 추출될 수 있거나, 적어도 손상된 세포로부터 용액 (예를 들어, 완충 용액)으로 용리될 수 있다.
다른 쿠쿠르비타세아에의 오르토로그 유전자가 본원에 제공되기 때문에, 상기 방법은 또한 다른 종, 특히 오이 및 멜론에서 다른 WAP5.1 유전자 및 대립유전자에 적용될 수 있다.
한 측면에서, 따라서, 하기 단계를 포함하는, 수박, 오이 또는 멜론 식물, 종자, 식물 부분, 세포 또는 조직의 유전자형분석을 위한 유전자형분석 검정이 제공된다:
a) 하나 이상의 수박, 오이 또는 멜론 식물 또는 식물 집단 (예를 들어, 육종 집단, F2 집단, 역교배 집단 등)의 게놈 DNA를 제공하는 단계, 및
b) 서열식별번호: 1 또는 9의 단백질 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (수박 야생형 WAP5.1 단백질) 또는 서열식별번호: 2 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (오이 야생형 WAP5.1 단백질) 또는 서열식별번호: 3 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (멜론 야생형 WAP5.1 단백질)을 코딩하는 야생형 대립유전자의 존재 및/또는 돌연변이체 대립유전자의 존재를 검출할 수 있는 (또는 검출하는) 유전자형분석 검정을 수행하는 단계로서, 여기서 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해), 또는 서열식별번호: 2 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해) 또는 서열식별번호: 3 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해)에 대해 삽입, 결실, 대체 또는 복제된 하나 이상의 아미노산을 포함하는 것인 단계, 및 임의로
c) 야생형 대립유전자의 2개 카피, 또는 야생형 대립유전자의 1개 카피 및 돌연변이체 대립유전자의 1개 카피, 또는 돌연변이체 대립유전자의 2개 카피를 포함하는 식물, 종자, 식물 부분, 세포 또는 조직을 선택하는 단계.
그러므로, 하기를 포함하는, ClWAP5.1 (시트룰루스 라나투스 WAP5.1), CsWAP5.1 (쿠쿠미스 사티부스 WAP5.1) 또는 CmWAP5.1 (쿠쿠미스 멜로 WAP5.1)로 명명된 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분을 검출하고 임의로 선택하기 위한 방법이 제공된다:
a) 유전자의 야생형 대립유전자 및/또는 유전자의 돌연변이체 대립유전자의 존재를 검출하기 위해 핵산 증폭 및/또는 핵산 혼성화에 기초하여 WAP5.1 대립유전자를 검출 또는 구별하는 검정을 적어도 하나의 식물로부터 수득된 게놈 DNA 샘플에 대해 수행하는 단계로서, 여기서 야생형 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (수박에서), 서열식별번호: 2 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (오이에서) 및 서열식별번호: 3 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (멜론에서)을 코딩하고, 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해), 서열식별번호: 2 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해) 또는 서열식별번호: 3 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해)에 대해 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 것인 단계, 및 임의로
b) 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
추가로, 하기를 포함하는, WAP5.1 유전자의 유전자형을 결정하고 임의로 특정 유전자형, 예를 들어 ClWAP5.1 (시트룰루스 라나투스 WAP5.1), CsWAP5.1 (쿠쿠미스 사티부스 WAP5.1) 또는 CmWAP5.1 (쿠쿠미스 멜로 WAP5.1)로 명명된 유전자의 야생형 대립유전자 및/또는 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분을 선택하기 위한 방법이 제공된다:
a) 하나 이상의 식물로부터 수득된 하나 이상의 게놈 DNA 샘플에 대해 이중-대립유전자 유전자형분석 검정을 수행하는 단계로서, 여기서 상기 유전자형분석 검정은 WAP5.1 대립유전자-특이적 프라이머 및/또는 WAP5.1 대립유전자-특이적 프로브에 기초하여 WAP5.1 대립유전자를 검출 또는 구별하며, 상기 대립유전자 특이적 프라이머 또는 대립유전자 특이적 프로브는 유전자의 야생형 대립유전자 또는 유전자의 돌연변이체 대립유전자의 존재를 검출하며, 여기서 야생형 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (수박에서), 서열식별번호: 2 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (오이에서) 및 서열식별번호: 3 또는 이에 대해 적어도 95% 서열 동일성을 포함하는 단백질 (멜론에서)을 코딩하고, 돌연변이체 대립유전자는 서열식별번호: 1 또는 9 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해), 서열식별번호: 2 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해) 또는 서열식별번호: 3 (또는 이에 대해 적어도 95% 동일성을 포함하는 야생형 서열에 대해)에 대해 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 것인 단계, 및 임의로
b) 돌연변이체 대립유전자의 1 또는 2개 카피를 포함하는 하나 이상의 식물, 종자 또는 식물 부분을 선택하는 단계.
이러한 검정은 예를 들어 특정 유전자형을 포함하는 식물, 예를 들어 WAP5.1 유전자의 야생형 대립유전자에 대해 동형접합성, WAP5.1 대립유전자의 돌연변이체 대립유전자에 대해 동형접합성 또는 이형접합성인 식물을 선택하기 위한 육종 프로그램에서 식물의 마커 보조 선택 (MAS)을 위해 사용될 수 있다.
따라서, 또한 수박, 오이 또는 멜론 식물의 육종 방법이 본원에 제공되며, 상기 방법은 게놈 내의 WAP5.1 로커스에서 대립유전자 조성에 대해 하나 이상의 식물을 유전자형분석하는 단계 및 임의로 WAP5.1 로커스에 특이적 유전자형을 갖는 하나 이상의 식물을 선택하는 단계를 포함한다. 한 측면에서 또한 시퀀싱에 의한 유전자형분석은 WAP5.1 유전자에 대해 수행될 수 있다.
언급된 바와 같이, 임의로 돌연변이체 WAP5.1 대립유전자의 2개 카피를 포함하는 식물 또는 종자는 성장되고 통성 단위결과에 대해 표현형분석될 수 있다. 돌연변이체 대립유전자는 한 측면에서 동형접합 형태로 통성 단위결과를 부여하는 돌연변이체 대립유전자이다.
상이한 측면에서 수박에서 ClWAP5.1, 오이에서 CsWAP5.1 및 멜론에서 CmWAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물, 종자 또는 식물 부분이 제공되며, 여기서 상기 돌연변이체 대립유전자는
a) 야생형 대립유전자와 비교하여 대립유전자의 발현 없음 또는 감소된 발현을 초래하는 조절 요소에 하나 이상의 돌연변이를 포함하고/거나,
b) 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고,
여기서 a) 또는 b)의 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고 (동형접합 형태의 야생형 대립유전자를 포함하는 식물과 비교하여), 여기서 야생형 수박 ClWAP5.1 대립유전자는 서열식별번호: 1 또는 9의 단백질 또는 서열식별번호: 1 또는 9에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 포함하는 단백질을 코딩하며, 여기서 야생형 오이 CsWAP5.1 대립유전자는 서열식별번호: 2의 단백질 또는 서열식별번호: 2에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 포함하는 단백질을 코딩하고, 여기서 야생형 멜론 CmWAP5.1 대립유전자는 서열식별번호: 3의 단백질 또는 서열식별번호: 3에 대해 적어도 95%, 96%, 97%, 98%, 99% 또는 그 초과의 서열 동일성을 포함하는 단백질을 코딩한다.
육종 방법
추가로, 본원에 기재된 바와 같은 적어도 하나의 돌연변이체 WAP5.1 대립유전자를 포함하는 식물을 예를 들어 돌연변이체 WAP5.1 대립유전자가 결여된 식물과 교배시키는 방법이 제공되고, 돌연변이체 WAP5.1 대립유전자의 적어도 하나의 카피를 포함하는 자손을 선택하는 방법이 제공된다.
그러므로, 한 측면에서 하기 단계를 포함하는, 수박, 오이 또는 멜론 식물을 생성하는 방법이 제공된다:
a) 기재된 바와 같은 돌연변이체 WAP5.1 대립유전자의 적어도 하나의 카피를 포함하는 수박, 오이 또는 멜론 식물을 제공하는 단계;
b) 상기 수박, 오이 또는 멜론 식물을 또 다른 수박, 오이 또는 멜론 식물과 교배시켜 F1 종자를 생산하는 단계;
c) 임의로 F1 종자로부터 성장된 수박 식물을 1회 이상 자가생식시켜 F2, F3 또는 추가 세대 자가생식 자손을 생산하는 단계;
d) 상기 F1 또는 추가 세대 자가생식 자손을 단계 b)의 식물과 교배시켜 역교배 자손을 생산하는 단계;
e) 단계 a)의 돌연변이체 WAP5.1 대립유전자를 포함하는 역교배 자손을 선택하는 단계.
임의로 단계 e)의 식물은 돌연변이체 WAP5.1 대립유전자의 2개 카피를 포함하고 통성 단위결과성이다.
임의로 임의의 단계에서 돌연변이체 WAP5.1 대립유전자의 존재의 선택 또는 검출은 분자 방법, 예컨대 SNP 또는 INDEL 유전자형분석, 시퀀싱 등을 사용하여 수행될 수 있다.
바람직하게는 단계 a)에서 대립유전자는 동형접합 형태인 경우에 통성 단위결과를 부여하는 돌연변이체 대립유전자이다. 한 측면에서 단계 a)에서 식물은 이형접합 또는 동형접합 형태의 표 1의 돌연변이체 대립유전자를 포함하는 수박 식물이다.
또한, 하기 단계를 포함하는, 수박 식물의 생산 방법이 제공된다:
a) 수박 식물 집단에 돌연변이를 도입하거나, 또는 돌연변이유발된 수박 식물 집단, 예를 들어 M2, M3 또는 추가 세대의 TILLING 집단을 제공하는 단계,
b) WAP5.1 단백질을 코딩하는 대립유전자에 돌연변이를 갖는 식물을 식별하는 단계로서, 여기서 유전자의 야생형 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질에 대해 적어도 95% 서열 동일성을 포함하는 WAP5.1 단백질을 코딩한다.
상기 방법은 하기 단계 중 하나 또는 둘 다를 추가로 포함할 수 있다:
단계 b)의 돌연변이체 대립유전자의 적어도 2개 카피를 포함하는 식물을 선택하는 단계,
수분의 부재 하에 식물이 과실을 생산하는지 결정하는 단계.
추가로, 제공된 서열에 대해 적어도 90%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.8% 또는 99.9% 서열 동일성을 포함하는 서열과 같이, 임의의 서열 및 서열의 분자가 포함된다. 또한 임의의 단편 및/또는 변형된 서열 (예를 들어, 서열 또는 상보체 서열의 적어도 10, 15, 16, 17, 18, 19, 20개 또는 그 초과의 뉴클레오티드를 포함하는 프라이머 또는 프로브) 및 육종 (예를 들어, MAS) 또는 식물 또는 식물 부분의 검출 또는 선택에서의 이들의 용도가 제공된다.
돌연변이체 단백질이 기재될 때, 단백질에서의 돌연변이를 유발하는 돌연변이를 코딩하는 게놈 서열 및 mRNA 또는 cDNA 서열은 본원에 포함되고, 아미노산 변화를 유발하는 돌연변이를 포함하는 게놈 내의 대립유전자를 검출하고 예를 들어 돌연변이체 대립유전자에 지정된 유전자형분석 검정을 수행하기 위해 사용될 수 있다는 것은 명백하다.
서열 설명
서열식별번호: 1: 수박의 야생형 WAP5.1 단백질.
서열식별번호: 2: 오이의 야생형 WAP5.1 단백질.
서열식별번호: 3: 멜론의 야생형 WAP5.1 단백질.
서열식별번호: 4: 돌연변이체 수박 WAP5.1 단백질, 여기서 아미노산 L (류신) 528은 F (페닐알라닌)에 의해 대체된다.
서열식별번호: 5: 서열식별번호: 4의 돌연변이체 WAP5.1 단백질을 코딩하는 cDNA.
서열식별번호: 6: 서열식별번호: 1의 야생형 WAP5.1 단백질을 코딩하는 cDNA.
서열식별번호: 7: 서열식별번호: 1의 야생형 WAP5.1 단백질을 코딩하는 게놈 DNA.
서열식별번호: 8: 돌연변이체 wap5.1 대립유전자 또는 야생형 Wap5.1 대립유전자를 검출하기 위한 뉴클레오티드 61 (C/T)에 있는 SNP 마커 (mwm23348429). 야생형 대립유전자에서 코돈 CTT는 류신, 서열식별번호: 1 또는 서열식별번호: 9의 L528, 또는 서열식별번호: 2의 L535 또는 서열식별번호: 3의 L538을 코딩한다. 돌연변이체 대립유전자에서 C는 T로 변화되고 (C→T), 생성된 돌연변이된 코돈 TTT는 L, 류신 대신 F, 페닐알라닌을 코딩한다. 그러므로 서열식별번호: 8 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 T를 포함하는 SNP 마커는 돌연변이체 wap5.1 대립유전자를 검출하기 위해 사용될 수 있는 반면, 서열식별번호: 8, 또는 서열식별번호: 8에 대해 적어도 92%, 93%, 94%, 95% 또는 그 초과의 서열 동일성을 포함하는 서열의 뉴클레오티드 61에 C를 포함하는 SNP 마커는 야생형 wap5.1 대립유전자를 검출하기 위해 사용될 수 있다.
서열식별번호: 9: 수박 계통 TY의 야생형 수박 WAP5.1 단백질의 단백질 서열; 아미노산 51이 R (Arg)임을 주목한다.
서열식별번호: 10: 계통 TY에 존재하는 돌연변이체 수박 WAP5.1 단백질, 여기서 아미노산 L (류신) 528은 F (페닐알라닌)에 의해 대체된다.
서열식별번호: 11: 서열식별번호: 9의 야생형 단백질을 코딩하는 cDNA.
서열식별번호: 12: 서열식별번호: 10의 돌연변이체 단백질을 코딩하는 cDNA.
서열식별번호: 13: F-박스 도메인.
서열식별번호: 14: 서열식별번호: 9의 야생형 단백질을 코딩하는 게놈 DNA.
실시예
수박 돌연변이체 집단 (TY라고 불리는 엘리트 계통의 EMS 처리를 통해 발달됨)은 칠레에서 정방향 스크리닝 접근법으로 스크리닝되었으며, 곤충 방지 온실에서 수분 없이 과실을 생산한 하나의 돌연변이체가 발견되었다.
단위결과성 과실을 생산할 수 있는 단일 식물을 선택하고, 상이한 유전적 배경에서 여러 F2 맵핑 집단을 만드는데 사용하였다. 한 집단에서 QTL은 염색체 5 상의 0.47 Mb/8.2 cM 영역에 맵핑되었다. 이 간격 내에 2개의 돌연변이가 있었으며: 제1 돌연변이는 유전자간 영역에 있었고, 제2 돌연변이는 본원에서 wap5.1로 명명된 유전자에서 고도로 보존된 아미노산을 류신 (L)에서 페닐알라닌 (L528F)으로 변화시켰다.
이 돌연변이체 wap5.1 대립유전자는 93개의 전체 게놈 재시퀀싱된 계통과 비교할 때 이 계통에 완전히 고유한 것으로 밝혀졌다.
염색체 5 간격을 포화시키는 마커를 설계하고, F2 집단에서 실행하였다. 형질과 가장 높은 연관성을 갖는 마커인 mWM23348429는 wap5.1 유전자에서의 비동의 돌연변이에 대해 설계되었다. 이 돌연변이를 확인하기 위해, 추가 92개의 F2 식물을 mWM23348429 및 플랭킹 마커로 유전자형분석하였다. 가장 높은 연관된 마커는 mWM23348429였으며, 이는 이 마커가 설계된 돌연변이가 형질의 근본임을 추가로 확인하였다.
wap5.1 유전자는 단일 열성 유전자이고, 돌연변이에 대해 동형접합성인 식물 (wap5.1/wap5.1)에서 돌연변이체 wap5.1 대립유전자와 공동-격리된 통성 단위결과성 표현형이다.
RaptorX 접촉 예측을 야생형 및 돌연변이체 Wap5.1 단백질에 대해 수행하였으며, 이는 L528F 돌연변이가 야생형 단백질과 비교하여 LRR-도메인의 잘못된 3차원 단백질 폴딩을 유발하여, 필시 정상적인 생체내 단백질 기능을 유의하게 감소시키거나 심지어 정상적인 생체내 기능을 완전히 폐지할 가능성이 높다는 것을 보여준다. LRR-도메인은 단백질-단백질 상호작용에 관여할 가능성이 높기 때문에, 이 고도로 정렬되고 고도로 보존된 단백질 도메인의 작은 구조적 변화가 기능에 유의한 영향을 미칠 수 있다.
BLAST 분석을 사용하여 Wap5.1 유전자의 오르토로그를 식별하였다. 오이 및 멜론 단백질은 3개의 쿠쿠르비타세아에 종 모두에서 동일한 F-박스 도메인을 함유하였다. 또한 LRR-도메인은 고도로 보존되었다. 대부분의 아미노산 변이는 F-박스 도메인 앞에 있는 N-말단 단백질 부분에 있는 것으로 밝혀졌다.
추가로, wap5.1 유전자의 돌연변이체가 돌연변이체 수박 집단에서 식별되었으며 (표 1 참조), 돌연변이체 대립유전자에 대해 동형접합성인 식물에서 이들의 표현형에 대해 테스트될 것이다.
추가로, 야생형 배경 수박 계통 TY 및 돌연변이체 wap5.1 계통 (TY 배경에서 생성됨)에서 WAP5.1 유전자의 게놈 서열을 살펴보면, 위치 51에 있는 아미노산이 찰스턴 그레이 참조 게놈에서 발견되는 G (Gly; 글리신, 서열식별번호: 6의 뉴클레오티드 151 내지 153에 있는 코돈 GGT)가 아닌 R (Arg; 아르기닌, 서열식별번호: 11 및 12의 뉴클레오티드 151 내지 153에 있는 코돈 CGT)임이 밝혀졌다. R51은 계통 TY의 야생형 WAP5.1 단백질 및 돌연변이체 wap5.1 단백질 (L528F 치환 포함) 둘 다에서 발견된다. 또한 동일한 R51이 본원에서 앞서 기재된 바와 같이 수박 97103 게놈의 야생형 WAP5.1 단백질에서 발견되었다.
또한, TY-계통에서 S450 (세린 450)은 서열식별번호: 11 및 12의 뉴클레오티드 1348 내지 1350에 있는 코돈 AGC에 의해 코딩되는 반면, 찰스턴 그레이 참조 게놈에서 S450은 서열식별번호: 6의 뉴클레오티드 1348 내지 1350에 있는 코돈 AGT에 의해 코딩된다. 계통 TY의 야생형 WAP5.1 단백질은 본원에서 서열식별번호: 9에 제공되고, 계통 TY의 야생형 WAP5.1 단백질을 코딩하는 cDNA는 본원에서 서열식별번호: 11에 제공된다. cDNA는 cucurbitgenomics.org 데이터베이스에서 발견되는 품종 97103 V2의 cDNA와 동일하다. 야생형 WAP5.1 단백질을 코딩하는 서열식별번호: 14의 게놈 서열은 수박 품종 97103 V2 데이터베이스로부터 수득된다.
TY 돌연변이체 집단에서 발견되고 L528F 아미노산 치환을 포함하는 돌연변이체 wap5.1 단백질은 본원에서 서열식별번호: 10에 제공된다. 마찬가지로 이 돌연변이체 단백질을 코딩하는 cDNA는 서열식별번호: 12에 제공된다.
서열식별번호: 1의 야생형 WAP5.1 단백질 (찰스턴 그레이 게놈) 및 서열식별번호: 9의 야생형 WAP5.1 단백질 (TY-계통 및 수박 97103 게놈)은 서로에 대해 99.9% 서열 동일성을 포함하며, 쌍별 정렬된 경우에 단일 아미노산만이 상이하기 때문이다.
서열식별번호: 1의 야생형 WAP5.1 단백질 (찰스턴 그레이 게놈)을 코딩하는 cDNA 및 서열식별번호: 9의 야생형 WAP5.1 단백질 (TY 계통)을 코딩하는 cDNA는 또한 99.9% 서열 동일성을 포함하며, 2개의 뉴클레오티드가 상이하다.
돌연변이체 wap5.1 대립유전자 (L528F 치환 포함)에 대해 동형접합성인 수박 식물은 정상적인 성장 및 형태를 가졌다. 식물의 성장 및 발달 동안 이상은 관찰되지 않았다. 동형접합성 wap5.1 돌연변이체 식물에서 볼 수 있는 유일한 표현형 차이는 수분의 부재 하에 발달한 성숙 과실이 한쪽 끝에 약간 삼각형 형상을 가졌다는 것이다 (도 5 참조). 그러나, 이것이 돌연변이의 효과인지 배경 효과인지는 명확하지 않다.
SEQUENCE LISTING <110> Nunhems B.V. <120> Parthenocarpic watermelon plants <130> 202259WO01 <150> EP20201337.1 <151> 2020-10-12 <150> US63111898 <151> 2020-11-10 <150> US63117223 <151> 2020-11-23 <160> 14 <170> PatentIn version 3.5 <210> 1 <211> 1033 <212> PRT <213> artificial <220> <223> Wild type watermelon WAP5.1 protein <400> 1 Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Asp Glu 1 5 10 15 Arg Glu Arg Glu Glu Glu Leu Lys Lys Glu Gly Glu Met Lys Pro Met 20 25 30 Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser Asp Arg Ile Val 35 40 45 Arg Asn Gly Asp Asp Ser Gln Gly Ser Asn Pro Leu Pro Ile Ala Val 50 55 60 Asp Asp Ala Pro Asp Arg His Asp Gly Asp Arg Leu Arg Leu Phe Glu 65 70 75 80 Asp Met Val Arg Ala Met His Asp Gly Ala Asp Gly Gly Gly Ala His 85 90 95 Trp Asp Asp Glu Leu Arg Gly Gly Gly Gly Gly Ala Ile Asn Pro Trp 100 105 110 Asn Phe Ser Phe Gly Ile Leu His Gln Ser Glu Gly Gly Glu Ser Ser 115 120 125 Ser Ala Ser Ala Leu Ser Leu Ser Ser Thr Val Glu Thr Ser Asn Glu 130 135 140 Glu Arg Asp Arg Asp Ala Asn His Lys Arg Ala Lys Val Leu Ser Lys 145 150 155 160 Phe Thr Glu Ser Ser Phe Ala Thr Pro Trp Pro Leu Gly Ala Gly Asn 165 170 175 Pro Met Arg Asp Tyr Asp Phe Ile His Gly Ser Ser Ser Ile Met Ser 180 185 190 Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser Cys Arg Val Asp Glu 195 200 205 Asp Leu Glu Ser Ser Phe Gly Arg Asp Asp Gly Ile Asn Asp Asn Asp 210 215 220 Thr Cys Lys Ser Glu Gly Phe Glu Val Arg Met Asp Leu Thr Asp Asp 225 230 235 240 Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile Asn Leu Cys Arg 245 250 255 Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser Ala His Glu Asp 260 265 270 Phe Trp Arg Cys Leu Asn Phe Glu Asn Arg Asn Ile Ser Met Glu Gln 275 280 285 Phe Glu Asp Met Cys Gly Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile 290 295 300 Ser Gly Val Pro Ala Val His Leu Leu Ala Met Lys Ala Val Ser Ser 305 310 315 320 Leu Arg His Leu Glu Val Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp 325 330 335 Asn Phe Phe His Ala Leu Thr Asp Cys His Leu Leu Lys Ser Leu Thr 340 345 350 Val Asn Asp Ser Thr Leu Val Asn Val Thr Gln Glu Ile Pro Ile Ser 355 360 365 His Asp Arg Leu Arg His Leu His Leu Thr Lys Cys Arg Val Ile Arg 370 375 380 Ile Ser Val Arg Cys Pro Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser 385 390 395 400 Asn Met Ala Gln Ala Val Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp 405 410 415 Ile Gly Ser Cys His Lys Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala 420 425 430 Ile Ser Cys Pro Gln Leu Glu Ser Leu Asp Met Ser Asn Cys Ser Cys 435 440 445 Val Ser Asp Glu Thr Leu Arg Glu Ile Ser Ala Asn Cys Pro Asn Leu 450 455 460 Gln Leu Leu Asn Ala Ser Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val 465 470 475 480 Arg Leu Thr Met Leu Thr Val Leu Lys Leu His Ser Cys Glu Gly Ile 485 490 495 Thr Ser Ala Ser Met Thr Ala Ile Ser Ser Ser Ser Gly Leu Lys Val 500 505 510 Leu Glu Leu Asp Asn Cys Ser Leu Leu Thr Ser Val Ser Leu Asp Leu 515 520 525 Pro His Leu Gln Asn Ile Arg Leu Val His Cys Arg Lys Phe Ser Asp 530 535 540 Leu Ser Leu Gln Ser Val Lys Leu Ser Ser Ile Met Val Ser Asn Cys 545 550 555 560 Pro Ser Leu His Arg Ile Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu 565 570 575 Val Leu Lys Lys Gln Glu Ser Leu Ala Lys Leu Val Leu Gln Cys Pro 580 585 590 Ser Leu Gln Asp Val Asp Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser 595 600 605 Ile Cys Glu Val Phe Ser Asp Gly Gly Gly Cys Pro Met Leu Lys Ser 610 615 620 Leu Val Leu Asp Asn Cys Glu Ser Leu Thr Ala Val Arg Phe Cys Ser 625 630 635 640 Ser Ser Leu Gly Ser Leu Ser Leu Val Gly Cys Arg Ala Ile Thr Ser 645 650 655 Leu Glu Leu Gln Cys Pro Asn Leu Glu Gln Val Ser Leu Asp Gly Cys 660 665 670 Asp His Leu Glu Arg Ala Ser Phe Ser Pro Val Gly Leu Arg Ser Leu 675 680 685 Asn Leu Gly Ile Cys Pro Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro 690 695 700 Arg Met Asp Leu Leu Glu Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala 705 710 715 720 Ala Ile Asn Cys Pro Arg Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly 725 730 735 Gln Leu Lys Asp Glu Cys Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln 740 745 750 Ile Glu Ser Leu Ile Leu Met Ser Cys Pro Ser Val Gly Ser Glu Gly 755 760 765 Leu Tyr Ser Leu Arg Cys Leu Leu Lys Leu Val Val Leu Asp Leu Ser 770 775 780 Tyr Thr Phe Leu Met Ser Leu Gln Pro Val Phe Glu Ser Cys Ile Gln 785 790 795 800 Leu Lys Val Leu Lys Leu Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser 805 810 815 Leu Glu Pro Leu Tyr Lys Glu Asp Ala Leu Pro Ala Leu Gln Glu Leu 820 825 830 Asp Leu Ser Tyr Gly Thr Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu 835 840 845 Ala Cys Cys Thr His Leu Thr His Val Ser Leu Asn Gly Cys Val Asn 850 855 860 Met His Asp Leu Asn Trp Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser 865 870 875 880 Ser Ile Pro Ile Pro Leu Gly Gln Ala Thr Leu Asp Glu Ile Glu Glu 885 890 895 Pro Val Ala Gln Pro Asn Arg Leu Leu Gln Asn Leu Asn Cys Val Gly 900 905 910 Cys Gln Asn Ile Arg Lys Val Leu Ile Pro Pro Ala Ala Arg Cys Phe 915 920 925 His Leu Ser Ser Leu Asn Leu Ser Leu Ser Ser Asn Leu Lys Glu Val 930 935 940 Asp Val Ser Cys Tyr Asn Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys 945 950 955 960 Ser Leu Glu Val Leu Lys Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe 965 970 975 Leu Gln Ser Cys Asn Ile Glu Glu Glu Val Val Val Ala Ala Val Ser 980 985 990 Arg Cys Ser Met Leu Glu Thr Leu Asp Val Arg Leu Cys Pro Lys Ile 995 1000 1005 Ser Ser Ile Ser Met Val Gln Leu Arg Ile Ala Cys Pro Ser Leu 1010 1015 1020 Lys Arg Ile Phe Ser Thr Leu Ser Pro Thr 1025 1030 <210> 2 <211> 1040 <212> PRT <213> artificial <220> <223> wild type cucumber WAP5.1 ortholog <400> 2 Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Glu Glu 1 5 10 15 Glu Asp Glu Arg Ala Arg Glu Glu Glu Val Lys Lys Glu Glu Gly Glu 20 25 30 Met Lys Pro Met Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser 35 40 45 Asp Arg Ile Val Arg Asn Gly Asp Asp Ser Gln Gly Ser Asn Pro Leu 50 55 60 Ala Ser Ala Val Asp Asp Val Pro Glu Arg His Asp Gly Asp Arg Leu 65 70 75 80 Arg Leu Phe Glu Asp Met Val Arg Ala Met His Asp Gly Gly Asp Gly 85 90 95 Gly Ala His Trp Asp Asp Glu Leu Arg Gly Ala Gly Ala Gly Gly Gly 100 105 110 Ala Ile Asn Pro Trp Asn Leu Ser Phe Gly Ile Met His Gln Ser Glu 115 120 125 Gly Gly Glu Ser Ser Ser Ala Ser Ala Leu Pro Leu Ser Ser Met Val 130 135 140 Glu Thr Ser Met Glu Glu Arg Asp Arg Asp Ala His His Lys Arg Ala 145 150 155 160 Lys Val His Ser Lys Phe Ile Glu Ser Ser Phe Ala Thr Pro Trp Pro 165 170 175 Leu Gly Ala Gly Asn Pro Met Arg Glu Tyr Asp Phe Ile His Gly Ser 180 185 190 Pro Ser Ile Met Ser Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser 195 200 205 Ser Arg Phe Asp Ala Asp Lys Asp Leu Glu Ser Ser Phe Gly Arg Asp 210 215 220 Asp Gly Ile Asn Glu Asn Asp Thr Cys Lys Ser Glu Gly Phe Glu Val 225 230 235 240 Arg Met Asp Leu Thr Asp Asp Leu Leu His Met Val Phe Ser Phe Leu 245 250 255 Asp His Ile Asn Leu Cys Arg Ala Ala Ile Val Cys Arg Gln Trp Gln 260 265 270 Ala Ala Ser Ala His Glu Asp Phe Trp Arg Cys Leu Asn Phe Glu Asn 275 280 285 Lys Asn Ile Ser Met Glu Gln Phe Glu Asp Met Cys Gly Arg Tyr Pro 290 295 300 Asn Ala Thr Glu Val Asn Ile Ser Gly Val Pro Ala Val His Leu Leu 305 310 315 320 Ala Met Lys Ala Val Ser Ser Leu Arg Asn Leu Glu Val Leu Thr Leu 325 330 335 Gly Arg Gly Gln Leu Ala Asp Asn Phe Phe His Ala Leu Ala Asp Cys 340 345 350 His Leu Leu Lys Ser Leu Thr Val Asn Asp Ser Thr Leu Val Asn Val 355 360 365 Thr Gln Glu Ile Pro Ile Ser His Asp Gly Leu Arg His Leu His Leu 370 375 380 Thr Lys Cys Arg Val Ile Arg Ile Ser Val Arg Cys Pro Gln Leu Glu 385 390 395 400 Thr Leu Ser Leu Lys Arg Ser Asn Met Ala Gln Ala Val Leu Asn Cys 405 410 415 Pro Leu Leu Arg Asp Leu Asp Ile Gly Ser Cys His Lys Leu Ser Asp 420 425 430 Ala Ala Ile Arg Ser Ala Ala Ile Ser Cys Pro Gln Leu Glu Ser Leu 435 440 445 Asp Met Ser Asn Cys Ser Cys Val Ser Asp Glu Thr Leu Arg Glu Ile 450 455 460 Ser Gly Ser Cys Pro Asn Leu Gln Leu Leu Asn Ala Ser Tyr Cys Pro 465 470 475 480 Asn Ile Ser Leu Glu Ser Val Arg Leu Thr Met Leu Thr Val Leu Lys 485 490 495 Leu His Ser Cys Glu Gly Ile Thr Ser Ala Ser Met Thr Ala Ile Ser 500 505 510 Asn Ser Ser Ser Leu Lys Val Leu Glu Leu Asp Asn Cys Ser Leu Leu 515 520 525 Thr Ser Val Cys Leu Asp Leu Pro Asp Leu Gln Asn Ile Arg Leu Val 530 535 540 His Cys Arg Lys Phe Ser Asp Leu Ser Leu Gln Ser Ile Lys Leu Ser 545 550 555 560 Ser Ile Met Val Ser Asn Cys Pro Ser Leu His Arg Ile Asn Ile Thr 565 570 575 Ser Asn Leu Leu Gln Lys Leu Val Leu Lys Lys Gln Glu Ser Leu Ala 580 585 590 Lys Leu Ile Leu Gln Cys Pro Ser Leu Gln Asp Val Asp Leu Thr Asp 595 600 605 Cys Glu Ser Leu Thr Asn Ser Leu Cys Glu Val Phe Ser Asp Gly Gly 610 615 620 Gly Cys Pro Met Leu Lys Ser Leu Val Leu Asp Asn Cys Glu Ser Leu 625 630 635 640 Thr Ala Val Arg Phe Cys Ser Ser Ser Leu Gly Ser Leu Ser Leu Val 645 650 655 Gly Cys Arg Ala Ile Thr Ser Leu Glu Leu Gln Cys Pro Asn Leu Glu 660 665 670 Lys Val Ser Leu Asp Gly Cys Asp Arg Leu Glu Arg Ala Ser Phe Ser 675 680 685 Pro Val Gly Leu Arg Ser Leu Asn Leu Gly Ile Cys Pro Lys Leu Asn 690 695 700 Glu Leu Lys Leu Glu Ala Pro His Met Asp Leu Leu Glu Leu Lys Gly 705 710 715 720 Cys Gly Gly Leu Ser Glu Ala Ala Ile Asn Cys Pro Arg Leu Thr Ser 725 730 735 Leu Asp Ala Ser Phe Cys Ser Gln Leu Lys Asp Glu Cys Leu Ser Ala 740 745 750 Thr Thr Ala Ser Cys Pro Gln Ile Glu Ser Leu Ile Leu Met Ser Cys 755 760 765 Pro Ser Val Gly Ser Glu Gly Leu Tyr Ser Leu Gln Cys Leu Leu Lys 770 775 780 Leu Val Val Leu Asp Leu Ser Tyr Thr Phe Leu Leu Asn Leu Gln Pro 785 790 795 800 Val Phe Glu Ser Cys Ile Gln Leu Lys Val Leu Lys Leu Gln Ala Cys 805 810 815 Lys Tyr Leu Thr Asp Ser Ser Leu Glu Pro Leu Tyr Lys Glu Gly Ala 820 825 830 Leu Pro Ala Leu Gln Glu Leu Asp Leu Ser Tyr Gly Thr Leu Cys Gln 835 840 845 Ser Ala Ile Glu Glu Leu Leu Ala Cys Cys Thr His Leu Thr His Val 850 855 860 Ser Leu Asn Gly Cys Val Asn Met His Asp Leu Asn Trp Gly Cys Ser 865 870 875 880 Ile Gly Gln Leu Ser Leu Ser Gly Ile Pro Ile Pro Leu Gly Gln Ala 885 890 895 Thr Phe Asp Glu Ile Glu Glu Pro Ile Ala Gln Pro Asn Arg Leu Leu 900 905 910 Gln Asn Leu Asn Cys Val Gly Cys Gln Asn Ile Arg Lys Val Leu Ile 915 920 925 Pro Pro Ala Ala Arg Cys Phe His Leu Ser Ser Leu Asn Leu Ser Leu 930 935 940 Ser Ser Asn Leu Lys Glu Val Asp Val Ser Cys Tyr Asn Leu Cys Val 945 950 955 960 Leu Asn Leu Ser Asn Cys Cys Ser Leu Glu Val Leu Lys Leu Asp Cys 965 970 975 Pro Arg Leu Thr Asn Leu Phe Leu Gln Ser Cys Asn Ile Glu Glu Glu 980 985 990 Val Val Val Ala Ala Val Ser Lys Cys Ser Met Leu Glu Thr Leu Asp 995 1000 1005 Val Arg Phe Cys Pro Lys Ile Ser Ser Ile Ser Met Val Gln Leu 1010 1015 1020 Arg Ile Ala Cys Pro Ser Leu Lys Arg Ile Phe Ser Ser Leu Ser 1025 1030 1035 Pro Thr 1040 <210> 3 <211> 1043 <212> PRT <213> artificial <220> <223> wild type melon WAP5.1 ortholog protein <400> 3 Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Glu Glu 1 5 10 15 Glu Glu Asp Glu Arg Glu Arg Glu Glu Glu Val Lys Lys Glu Glu Gly 20 25 30 Glu Met Lys Pro Met Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp 35 40 45 Ser Asp Arg Ile Val Arg Asn Gly Asp Asp Ser Gln Gly Ser Asn Pro 50 55 60 Leu Ala Ser Ala Val Asp Asp Val Pro Glu Arg His Gly Ser Asp Gln 65 70 75 80 Leu Arg Leu Phe Glu Asp Met Val Arg Ala Met His Asp Gly Gly Asp 85 90 95 Gly Gly Ala His Cys His Trp Asp Asp Glu Leu Arg Gly Gly Gly Ala 100 105 110 Gly Gly Gly Val Ile Asn Pro Trp Asn Leu Ser Phe Gly Ile Met His 115 120 125 Gln Ser Glu Gly Gly Glu Ser Ser Ser Ala Ser Ala Leu Pro Leu Ser 130 135 140 Ser Met Ala Glu Thr Ser Ile Glu Glu Arg Asp Arg Asp Ala His His 145 150 155 160 Lys Arg Ala Lys Val His Ser Lys Phe Ile Glu Ser Ser Phe Ala Thr 165 170 175 Pro Trp Pro Leu Gly Ala Gly Asn Pro Met Arg Glu Phe Asp Phe Ile 180 185 190 His Gly Ser Ser Ser Ile Met Ser Arg Asn Glu Phe Leu Tyr His Ala 195 200 205 Ser Thr Ser Ser Arg Ile Asp Ala Asp Lys Asp Leu Glu Ser Ser Phe 210 215 220 Gly Arg Asp Asp Gly Ile Asn Glu Asn Asp Thr Cys Lys Ser Glu Gly 225 230 235 240 Phe Glu Val Arg Met Asp Leu Thr Asp Asp Leu Leu His Met Val Phe 245 250 255 Ser Phe Leu Asp His Ile Asn Leu Cys Arg Ala Ala Ile Val Cys Arg 260 265 270 Gln Trp Gln Ala Ala Ser Ala His Glu Asp Phe Trp Arg Cys Leu Asn 275 280 285 Phe Glu Asn Arg Asn Ile Ser Met Glu Gln Phe Glu Asp Met Cys Gly 290 295 300 Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile Ser Gly Val Pro Ala Val 305 310 315 320 His Leu Leu Ala Met Lys Ala Val Ser Ser Leu Arg Asn Leu Glu Val 325 330 335 Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp Asn Phe Phe His Ala Leu 340 345 350 Ala Asp Cys His Leu Leu Lys Ser Leu Thr Val Asn Asp Ser Thr Leu 355 360 365 Val Asn Val Thr Gln Glu Ile Pro Ile Ser His Asp Arg Leu Arg His 370 375 380 Leu His Leu Thr Lys Cys Arg Val Ile Arg Ile Ser Val Arg Cys Pro 385 390 395 400 Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser Asn Met Ala Gln Ala Val 405 410 415 Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp Ile Gly Ser Cys His Lys 420 425 430 Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala Ile Ser Cys Pro Gln Leu 435 440 445 Glu Ser Leu Asp Met Ser Asn Cys Ser Cys Val Ser Asp Glu Thr Leu 450 455 460 Arg Glu Ile Ser Gly Ser Cys Pro Asn Leu Gln Leu Leu Asn Ala Ser 465 470 475 480 Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val Arg Leu Thr Met Leu Thr 485 490 495 Val Leu Lys Leu His Ser Cys Glu Gly Ile Thr Ser Ala Ser Met Thr 500 505 510 Ala Ile Ser Asn Ser Ser Ser Leu Lys Val Leu Glu Leu Asp Asn Cys 515 520 525 Ser Leu Leu Thr Ser Val Cys Leu Asp Leu Pro His Leu Gln Asn Ile 530 535 540 Arg Leu Val His Cys Arg Lys Phe Ser Asp Leu Ser Leu Gln Ser Val 545 550 555 560 Lys Leu Ser Ser Ile Met Val Ser Asn Cys Pro Ser Leu His Arg Ile 565 570 575 Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu Val Leu Lys Lys Gln Glu 580 585 590 Ser Leu Ala Lys Leu Val Leu Gln Cys Pro Ser Leu Gln Asp Val Asp 595 600 605 Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser Ile Cys Glu Val Phe Ser 610 615 620 Asp Gly Gly Gly Cys Pro Met Leu Lys Ser Leu Val Leu Asp Asn Cys 625 630 635 640 Glu Ser Leu Thr Ala Val Arg Phe Cys Ser Ser Ser Leu Gly Ser Leu 645 650 655 Ser Leu Val Gly Cys Arg Ala Ile Thr Ser Leu Glu Leu Gln Cys Pro 660 665 670 Asn Leu Glu Gln Val Ser Leu Asp Gly Cys Asp His Leu Glu Arg Ala 675 680 685 Ser Phe Ser Pro Val Gly Leu Arg Ser Leu Asn Leu Gly Ile Cys Pro 690 695 700 Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro Arg Met Asp Leu Leu Glu 705 710 715 720 Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala Ala Ile Asn Cys Pro Arg 725 730 735 Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly Gln Leu Lys Asp Glu Cys 740 745 750 Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln Ile Glu Ser Leu Ile Leu 755 760 765 Met Ser Cys Pro Ser Val Gly Ser Glu Gly Leu Tyr Ser Leu Arg Cys 770 775 780 Leu Leu Lys Leu Val Val Leu Asp Leu Ser Tyr Thr Phe Leu Met Asn 785 790 795 800 Leu Gln Pro Val Phe Glu Ser Cys Ile Gln Leu Lys Val Leu Lys Leu 805 810 815 Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser Leu Glu Pro Leu Tyr Lys 820 825 830 Glu Gly Ala Leu Pro Ala Leu Gln Glu Leu Asp Leu Ser Tyr Gly Thr 835 840 845 Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu Ala Cys Cys Thr His Leu 850 855 860 Thr His Val Ser Leu Asn Gly Cys Val Asn Met His Asp Leu Asn Trp 865 870 875 880 Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser Val Ile Pro Ile Pro Leu 885 890 895 Gly Gln Ala Thr Phe Asp Glu Ile Glu Glu Pro Val Ala Gln Pro Asn 900 905 910 Arg Leu Leu Gln Asn Leu Asn Cys Val Gly Cys Pro Asn Ile Arg Lys 915 920 925 Val Leu Ile Pro Pro Ala Ala Arg Cys Phe His Leu Ser Ser Leu Asn 930 935 940 Leu Ser Leu Ser Ser Asn Leu Lys Glu Val Asp Val Ser Cys Tyr Asn 945 950 955 960 Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys Ser Leu Glu Val Leu Lys 965 970 975 Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe Leu Gln Ser Cys Asn Ile 980 985 990 Glu Glu Glu Val Val Val Ala Ala Val Ser Lys Cys Ser Met Leu Glu 995 1000 1005 Thr Leu Asp Val Arg Phe Cys Pro Lys Ile Ser Ser Ile Ser Met 1010 1015 1020 Val Gln Leu Arg Ile Ala Cys Pro Ser Leu Lys Arg Ile Phe Ser 1025 1030 1035 Ser Leu Ser Pro Thr 1040 <210> 4 <211> 1033 <212> PRT <213> artificial <220> <223> Mutant wap5.1 protein with L528F substitution <400> 4 Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Asp Glu 1 5 10 15 Arg Glu Arg Glu Glu Glu Leu Lys Lys Glu Gly Glu Met Lys Pro Met 20 25 30 Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser Asp Arg Ile Val 35 40 45 Arg Asn Gly Asp Asp Ser Gln Gly Ser Asn Pro Leu Pro Ile Ala Val 50 55 60 Asp Asp Ala Pro Asp Arg His Asp Gly Asp Arg Leu Arg Leu Phe Glu 65 70 75 80 Asp Met Val Arg Ala Met His Asp Gly Ala Asp Gly Gly Gly Ala His 85 90 95 Trp Asp Asp Glu Leu Arg Gly Gly Gly Gly Gly Ala Ile Asn Pro Trp 100 105 110 Asn Phe Ser Phe Gly Ile Leu His Gln Ser Glu Gly Gly Glu Ser Ser 115 120 125 Ser Ala Ser Ala Leu Ser Leu Ser Ser Thr Val Glu Thr Ser Asn Glu 130 135 140 Glu Arg Asp Arg Asp Ala Asn His Lys Arg Ala Lys Val Leu Ser Lys 145 150 155 160 Phe Thr Glu Ser Ser Phe Ala Thr Pro Trp Pro Leu Gly Ala Gly Asn 165 170 175 Pro Met Arg Asp Tyr Asp Phe Ile His Gly Ser Ser Ser Ile Met Ser 180 185 190 Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser Cys Arg Val Asp Glu 195 200 205 Asp Leu Glu Ser Ser Phe Gly Arg Asp Asp Gly Ile Asn Asp Asn Asp 210 215 220 Thr Cys Lys Ser Glu Gly Phe Glu Val Arg Met Asp Leu Thr Asp Asp 225 230 235 240 Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile Asn Leu Cys Arg 245 250 255 Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser Ala His Glu Asp 260 265 270 Phe Trp Arg Cys Leu Asn Phe Glu Asn Arg Asn Ile Ser Met Glu Gln 275 280 285 Phe Glu Asp Met Cys Gly Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile 290 295 300 Ser Gly Val Pro Ala Val His Leu Leu Ala Met Lys Ala Val Ser Ser 305 310 315 320 Leu Arg His Leu Glu Val Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp 325 330 335 Asn Phe Phe His Ala Leu Thr Asp Cys His Leu Leu Lys Ser Leu Thr 340 345 350 Val Asn Asp Ser Thr Leu Val Asn Val Thr Gln Glu Ile Pro Ile Ser 355 360 365 His Asp Arg Leu Arg His Leu His Leu Thr Lys Cys Arg Val Ile Arg 370 375 380 Ile Ser Val Arg Cys Pro Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser 385 390 395 400 Asn Met Ala Gln Ala Val Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp 405 410 415 Ile Gly Ser Cys His Lys Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala 420 425 430 Ile Ser Cys Pro Gln Leu Glu Ser Leu Asp Met Ser Asn Cys Ser Cys 435 440 445 Val Ser Asp Glu Thr Leu Arg Glu Ile Ser Ala Asn Cys Pro Asn Leu 450 455 460 Gln Leu Leu Asn Ala Ser Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val 465 470 475 480 Arg Leu Thr Met Leu Thr Val Leu Lys Leu His Ser Cys Glu Gly Ile 485 490 495 Thr Ser Ala Ser Met Thr Ala Ile Ser Ser Ser Ser Gly Leu Lys Val 500 505 510 Leu Glu Leu Asp Asn Cys Ser Leu Leu Thr Ser Val Ser Leu Asp Phe 515 520 525 Pro His Leu Gln Asn Ile Arg Leu Val His Cys Arg Lys Phe Ser Asp 530 535 540 Leu Ser Leu Gln Ser Val Lys Leu Ser Ser Ile Met Val Ser Asn Cys 545 550 555 560 Pro Ser Leu His Arg Ile Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu 565 570 575 Val Leu Lys Lys Gln Glu Ser Leu Ala Lys Leu Val Leu Gln Cys Pro 580 585 590 Ser Leu Gln Asp Val Asp Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser 595 600 605 Ile Cys Glu Val Phe Ser Asp Gly Gly Gly Cys Pro Met Leu Lys Ser 610 615 620 Leu Val Leu Asp Asn Cys Glu Ser Leu Thr Ala Val Arg Phe Cys Ser 625 630 635 640 Ser Ser Leu Gly Ser Leu Ser Leu Val Gly Cys Arg Ala Ile Thr Ser 645 650 655 Leu Glu Leu Gln Cys Pro Asn Leu Glu Gln Val Ser Leu Asp Gly Cys 660 665 670 Asp His Leu Glu Arg Ala Ser Phe Ser Pro Val Gly Leu Arg Ser Leu 675 680 685 Asn Leu Gly Ile Cys Pro Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro 690 695 700 Arg Met Asp Leu Leu Glu Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala 705 710 715 720 Ala Ile Asn Cys Pro Arg Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly 725 730 735 Gln Leu Lys Asp Glu Cys Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln 740 745 750 Ile Glu Ser Leu Ile Leu Met Ser Cys Pro Ser Val Gly Ser Glu Gly 755 760 765 Leu Tyr Ser Leu Arg Cys Leu Leu Lys Leu Val Val Leu Asp Leu Ser 770 775 780 Tyr Thr Phe Leu Met Ser Leu Gln Pro Val Phe Glu Ser Cys Ile Gln 785 790 795 800 Leu Lys Val Leu Lys Leu Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser 805 810 815 Leu Glu Pro Leu Tyr Lys Glu Asp Ala Leu Pro Ala Leu Gln Glu Leu 820 825 830 Asp Leu Ser Tyr Gly Thr Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu 835 840 845 Ala Cys Cys Thr His Leu Thr His Val Ser Leu Asn Gly Cys Val Asn 850 855 860 Met His Asp Leu Asn Trp Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser 865 870 875 880 Ser Ile Pro Ile Pro Leu Gly Gln Ala Thr Leu Asp Glu Ile Glu Glu 885 890 895 Pro Val Ala Gln Pro Asn Arg Leu Leu Gln Asn Leu Asn Cys Val Gly 900 905 910 Cys Gln Asn Ile Arg Lys Val Leu Ile Pro Pro Ala Ala Arg Cys Phe 915 920 925 His Leu Ser Ser Leu Asn Leu Ser Leu Ser Ser Asn Leu Lys Glu Val 930 935 940 Asp Val Ser Cys Tyr Asn Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys 945 950 955 960 Ser Leu Glu Val Leu Lys Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe 965 970 975 Leu Gln Ser Cys Asn Ile Glu Glu Glu Val Val Val Ala Ala Val Ser 980 985 990 Arg Cys Ser Met Leu Glu Thr Leu Asp Val Arg Leu Cys Pro Lys Ile 995 1000 1005 Ser Ser Ile Ser Met Val Gln Leu Arg Ile Ala Cys Pro Ser Leu 1010 1015 1020 Lys Arg Ile Phe Ser Thr Leu Ser Pro Thr 1025 1030 <210> 5 <211> 3102 <212> DNA <213> artificial <220> <223> cDNA encoding mutant wap5.1 protein of SEQ ID NO: 4 <400> 5 atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60 gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120 caggatgact ctgatcgcat tgtgcgaaat ggtgatgatt ctcaagggag taatccactt 180 ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240 gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300 ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360 caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420 acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480 ttcactgaga gctcatttgc aactccatgg cctttgggtg ctggaaatcc tatgagagat 540 tatgatttta ttcacggatc atcttcaatt atgagtagga atgaatttct ataccatgct 600 tctacatcat gcagagttga cgaagatttg gaatctagtt ttggtagaga tgatgggatc 660 aatgataatg acacctgtaa atcagaagga tttgaagtaa gaatggatct tacagatgat 720 ttactgcata tggtgttctc tttcttggat cacatcaatc tttgtcgagc tgctatagtc 780 tgcaggcagt ggcaagctgc tagtgctcat gaagatttct ggaggtgttt gaattttgaa 840 aataggaaca tatccatgga acaattcgag gatatgtgtg gaagatatcc aaatgctaca 900 gaggtcaata tctctggtgt acctgccgtt cacttgcttg ccatgaaagc agtttcttct 960 ttaagacatc tggaggtttt aactctgggg agaggacaac tggcagataa cttttttcac 1020 gccctgactg attgccattt attgaagagt ttgactgtca atgattctac gctggttaat 1080 gttacacaag agatacctat aagccatgat agactgcgtc atcttcatct tactaaatgt 1140 cgtgttatac gcatatctgt tagatgtcca caacttgaaa cattgtcgtt gaagcgcagc 1200 aacatggcac aggctgttct taactgcccc cttcttcggg acctggatat aggctcttgc 1260 cacaagctct cagatgctgc aattcgctca gccgctattt catgcccaca gttggaatct 1320 cttgatatgt ctaattgttc atgtgttagt gatgagacat tacgtgaaat ttctgcaaac 1380 tgcccgaatc tccagcttct gaatgcatca tactgcccaa atatatcttt ggagtctgta 1440 agactgacaa tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca 1500 atgaccgcaa tatctagtag ttctggtttg aaggttttgg agcttgataa ttgcagtctt 1560 ttgacttctg tttctctgga ttttccccat ttacagaata tcagacttgt tcattgccgc 1620 aaattctcag acttgagttt acagagtgtt aaattatcat ccataatggt ctctaattgt 1680 ccatcacttc atcggatcaa catcacttcc aatttacttc aaaaattggt gttgaagaaa 1740 caagagagct tggccaaatt ggttttgcag tgccctagtc tgcaagatgt ggacctcaca 1800 gactgtgaat cgctaacgaa ttctatttgt gaggttttta gtgatggtgg tggatgccct 1860 atgttgaaat cacttgttct tgataactgt gagagtctga ctgctgttcg attctgtagc 1920 agttctttag gcagtctttc ccttgttggt tgccgggcaa tcacttcact tgaacttcaa 1980 tgccctaatc tcgaacaggt ttctttagat ggctgtgatc atcttgagag agcatcattt 2040 tccccggttg gtctgcggtc actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa 2100 cttgaggccc ctcggatgga tttacttgag ttaaaaggtt gtggtggatt gtctgaagca 2160 gccatcaatt gtcctcgtct aacatcgttg gatgcttcct tttgtggcca actgaaagat 2220 gagtgtttgt ctgcgactac tgcctcatgt ccacagattg agtcgttaat actgatgtca 2280 tgtccatcgg ttggttcaga ggggctttac tctctgcgat gccttctgaa gttggttgtg 2340 ctcgatttat catatacctt tttgatgagc ttgcagccag tcttcgagtc ttgtatacaa 2400 cttaaggtat tgaaactaca agcatgcaag tatttaactg actcatcgct agagcctctt 2460 tataaggaag acgctcttcc agctcttcaa gagttagact tatcttacgg gactctttgt 2520 cagtctgcca tagaagagct tcttgcttgt tgcactcact taactcatgt gagcttaaat 2580 gggtgtgtga acatgcatga tctaaattgg ggttgtagca ttggacagct ttcgttgtcc 2640 agcatcccaa ttcctcttgg tcaggccact cttgatgaga ttgaggaacc agttgcacag 2700 ccaaaccgtt tgttacagaa ccttaactgt gtaggttgtc agaatattag aaaggttctc 2760 attcctccag ctgctcgttg ttttcattta tcatcattaa acctatcctt gtcttcaaat 2820 ctcaaggaag ttgacgtctc ttgttacaac ctatgctttc ttaatttgag taattgctgc 2880 tctttggaag ttctaaaact tgactgcccg cggttaacca gtctctttct tcagtcttgc 2940 aacattgaag aagaagtggt tgtggctgcg gtatcgagat gtagcatgct cgagacgttg 3000 gatgtccgct tatgtccaaa gatctcctct attagcatgg tacaactgcg tattgcttgt 3060 ccaagtttga agcggatctt cagcactctg tctccaacat ga 3102 <210> 6 <211> 3102 <212> DNA <213> artificial <220> <223> cDNA encoding wild type WAP5.1 protein of SEQ ID NO: 1 <400> 6 atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60 gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120 caggatgact ctgatcgcat tgtgcgaaat ggtgatgatt ctcaagggag taatccactt 180 ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240 gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300 ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360 caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420 acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480 ttcactgaga gctcatttgc aactccatgg cctttgggtg ctggaaatcc tatgagagat 540 tatgatttta ttcacggatc atcttcaatt atgagtagga atgaatttct ataccatgct 600 tctacatcat gcagagttga cgaagatttg gaatctagtt ttggtagaga tgatgggatc 660 aatgataatg acacctgtaa atcagaagga tttgaagtaa gaatggatct tacagatgat 720 ttactgcata tggtgttctc tttcttggat cacatcaatc tttgtcgagc tgctatagtc 780 tgcaggcagt ggcaagctgc tagtgctcat gaagatttct ggaggtgttt gaattttgaa 840 aataggaaca tatccatgga acaattcgag gatatgtgtg gaagatatcc aaatgctaca 900 gaggtcaata tctctggtgt acctgccgtt cacttgcttg ccatgaaagc agtttcttct 960 ttaagacatc tggaggtttt aactctgggg agaggacaac tggcagataa cttttttcac 1020 gccctgactg attgccattt attgaagagt ttgactgtca atgattctac gctggttaat 1080 gttacacaag agatacctat aagccatgat agactgcgtc atcttcatct tactaaatgt 1140 cgtgttatac gcatatctgt tagatgtcca caacttgaaa cattgtcgtt gaagcgcagc 1200 aacatggcac aggctgttct taactgcccc cttcttcggg acctggatat aggctcttgc 1260 cacaagctct cagatgctgc aattcgctca gccgctattt catgcccaca gttggaatct 1320 cttgatatgt ctaattgttc atgtgttagt gatgagacat tacgtgaaat ttctgcaaac 1380 tgcccgaatc tccagcttct gaatgcatca tactgcccaa atatatcttt ggagtctgta 1440 agactgacaa tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca 1500 atgaccgcaa tatctagtag ttctggtttg aaggttttgg agcttgataa ttgcagtctt 1560 ttgacttctg tttctctgga tcttccccat ttacagaata tcagacttgt tcattgccgc 1620 aaattctcag acttgagttt acagagtgtt aaattatcat ccataatggt ctctaattgt 1680 ccatcacttc atcggatcaa catcacttcc aatttacttc aaaaattggt gttgaagaaa 1740 caagagagct tggccaaatt ggttttgcag tgccctagtc tgcaagatgt ggacctcaca 1800 gactgtgaat cgctaacgaa ttctatttgt gaggttttta gtgatggtgg tggatgccct 1860 atgttgaaat cacttgttct tgataactgt gagagtctga ctgctgttcg attctgtagc 1920 agttctttag gcagtctttc ccttgttggt tgccgggcaa tcacttcact tgaacttcaa 1980 tgccctaatc tcgaacaggt ttctttagat ggctgtgatc atcttgagag agcatcattt 2040 tccccggttg gtctgcggtc actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa 2100 cttgaggccc ctcggatgga tttacttgag ttaaaaggtt gtggtggatt gtctgaagca 2160 gccatcaatt gtcctcgtct aacatcgttg gatgcttcct tttgtggcca actgaaagat 2220 gagtgtttgt ctgcgactac tgcctcatgt ccacagattg agtcgttaat actgatgtca 2280 tgtccatcgg ttggttcaga ggggctttac tctctgcgat gccttctgaa gttggttgtg 2340 ctcgatttat catatacctt tttgatgagc ttgcagccag tcttcgagtc ttgtatacaa 2400 cttaaggtat tgaaactaca agcatgcaag tatttaactg actcatcgct agagcctctt 2460 tataaggaag acgctcttcc agctcttcaa gagttagact tatcttacgg gactctttgt 2520 cagtctgcca tagaagagct tcttgcttgt tgcactcact taactcatgt gagcttaaat 2580 gggtgtgtga acatgcatga tctaaattgg ggttgtagca ttggacagct ttcgttgtcc 2640 agcatcccaa ttcctcttgg tcaggccact cttgatgaga ttgaggaacc agttgcacag 2700 ccaaaccgtt tgttacagaa ccttaactgt gtaggttgtc agaatattag aaaggttctc 2760 attcctccag ctgctcgttg ttttcattta tcatcattaa acctatcctt gtcttcaaat 2820 ctcaaggaag ttgacgtctc ttgttacaac ctatgctttc ttaatttgag taattgctgc 2880 tctttggaag ttctaaaact tgactgcccg cggttaacca gtctctttct tcagtcttgc 2940 aacattgaag aagaagtggt tgtggctgcg gtatcgagat gtagcatgct cgagacgttg 3000 gatgtccgct tatgtccaaa gatctcctct attagcatgg tacaactgcg tattgcttgt 3060 ccaagtttga agcggatctt cagcactctg tctccaacat ga 3102 <210> 7 <211> 6896 <212> DNA <213> artificial <220> <223> genomic DNA of wild type WAP5.1 gene <400> 7 atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60 gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120 caggatgact ctgatcgcat tgtgcgaaat ggtgatgatt ctcaagggag taatccactt 180 ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240 gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300 ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360 caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420 acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480 ttcacgtgag tcacttgtag actgcttctg gatatgaatt atgctaaggt ttcatgggtt 540 tgccattttt cttggttttc ttttccccct tttccgaaag gggtgttggt tttttttttt 600 tttttttttt tttcttgttc cttcttaaat gttctctctt tgtgggattt aggactagat 660 attgtggtgg tttttggatg gagatcgtta gcatttattg aggttatcat ttacgaatat 720 gcagggttct ttgtaattta gctatcaatg caggctgttt gttgttattt ttgtgccggc 780 atctctgaat aatttgctgt tttgcactgc aagatagcta tggaaaatta cgtattttat 840 gatctaaacg tgctccgctt ctttagctct cgggctgtat cagcgtttgg aaagtagttg 900 ttctatagat tttcacgagc accttctatt cttgaatact tgaagtggtg tctaatataa 960 agcaatatgt ttttgcatcg accttatccc gtccatcttt attgtatgta ttagactgtt 1020 ggcaggctct ttatcattgt attttaaata ttttttcccg atttctaaat tagaaatgtg 1080 tttcttaatc aatagtggca tgttgcttgg gcttttctag aagagatatc atacggtgtg 1140 ccaagatgat atctcaaagt cttcttcagt tgcgagtctt ctgagtgagt tgtcaccatg 1200 gaaaagtttc cttttcttca tggaatagaa aatcatttat atttgagaaa ttcaatatat 1260 ggttttcttt ctctgagaag agtttgaaaa tgaaaagtat agatatgaat gtttattgtt 1320 tttgattgtc ttattaattg tttttttgaa gcaaaccttc atgtacaacg atatttaggg 1380 tgtttgaatg cacataggtt ctcctattac atgatttatt tatgtactga aaattaaagg 1440 tgtattaaat ttgagtcata atttttgtaa aaactattct ttctaaattg ttttctggat 1500 atgcccaaac aagtccttat attttcaagc actgttgacc ttggtagtat agttatcaca 1560 ctcatttgca aacctacttg tgatactata ctttcattac tagttaaaaa aatgtcttcg 1620 ttaaggttta tcatggaggg atgagtatat agctgttgtc ttactgctaa atatgatctt 1680 atgttggaaa ctctgccctt cacatggtgg ttgatgatgt atcatgtgat ctttagttta 1740 aaaaagagta aactctgagt taactaaatg taagtatgtg cagtaatact cattccagat 1800 aattcacatt ctctcaaccg tttagatctt gcaaattagc accatcaagt ttcctataat 1860 ttacaagtta gactaactga taagtgtaaa gttagaaatg atgctcgtta ttcactttta 1920 acaattgttt cttattttct tttcttttca atcttcccta gtgagagctc atttgcaact 1980 ccatggcctt tgggtgctgg aaatcctatg agagattatg attttattca cggatcatct 2040 tcaattatga gtaggaatga atttctatac catgcttcta catcatgcag agttgacgaa 2100 gatttggaat ctagttttgg tagagatgat gggatcaatg ataatgacac ctgtaaatca 2160 gaaggatttg aagtaagaat ggatcttaca gatgatttac tgcatatggt atgcatctcc 2220 agagatttat tattgttttc ttgcttaccg tcttatttct tggatttctt attcacatga 2280 agttaaatta attgatatca ggtgttctct ttcttggatc acatcaatct ttgtcgagct 2340 gctatagtct gcaggcagtg gcaagctgct agtgctcatg aagatttctg gaggtgtttg 2400 aattttgaaa ataggaacat atccatggaa caatgtaggt gttgttctgc ttcttccttt 2460 cattttctag agtagttgag acaagaatga ggtgatttta aaaatgttgg ttgcctcttg 2520 gaaatagagg tgatatatta tgatgtaact tcaaaacatg taggatgcag tatttgagtc 2580 tggaatgtct ttagcactca tgaaatgttg ttaaaagcct aggactgcga catatttggg 2640 gcttgttttc agtactcagt aggatttttc tccctaaatc tttttgacta ggtatgtata 2700 taatattaaa ggaaagaact tcttgatgct atttttagct ttggcaatct cttgattctt 2760 ttaaaataag ttctggatat aattgtataa atgtgatagg atgtgacata tctctgtagc 2820 agtcttggtg ccagtgccaa tgcaacactt tcaatcgtat ttcaagttta acctactttt 2880 atccagtcac attttctttc tacccaccat acagtataaa ttgatccggt tgtatttctt 2940 tgtgcctctg tattaacaac tgtcctatcc tattctatgt tgcttacttt ctaacatcat 3000 tctgatttgg agctagttag ttaattgatt aattctgact gcagtcgagg atatgtgtgg 3060 aagatatcca aatgctacag aggtcaatat ctctggtgta cctgccgttc acttgcttgc 3120 catgaaagca gtttcttctt taaggtaatg attacggttt tgtatttttg ttttttttcc 3180 tcatcctgaa tctttatggt ggtgcttatt attttattat tgtctcagac atctggaggt 3240 tttaactctg gggagaggac aactggcaga taactttttt cacgccctga ctgattgcca 3300 tttattgaag agtttgactg tcaatgattc tacgctggtt aatgttacac aagagatacc 3360 tataagccat gatagactgc gtcatcttca tcttactaaa tgtcgtgtta tacgcatatc 3420 tgttaggttg ctaatgttta tgtatcttaa tgctaactgt atttaattgt ttagtttgtt 3480 tttttttttt tttggtctaa agcatgtttt cttgcagatg tccacaactt gaaacattgt 3540 cgttgaagcg cagcaacatg gcacaggctg ttcttaactg cccccttctt cgggacctgg 3600 atataggctc ttgccacaag ctctcagatg ctgcaattcg ctcagccgct atttcatgcc 3660 cacagttgga atctcttgat atgtctaatt gttcatgtgt tagtgatgag acattacgtg 3720 aaatttctgc aaactgcccg aatctccagc ttctgaatgc atcatactgc ccaaatatat 3780 ctttggaggt ggcataccat ttttagttaa attttgagcg aaagtgacta ttttgccctt 3840 cagacttgtt tttcctgata ttttggttcc tttttctttt gaagtctgta agactgacaa 3900 tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca atgaccgcaa 3960 tatctagtag ttctggtttg aaggtctgaa ataacctatt tcgactgttt atattttcta 4020 gttgtctggt gctgtgtctg agttagttga aaatggaatg gagacttatt gcaggttttg 4080 gagcttgata attgcagtct tttgacttct gtttctctgg atcttcccca tttacagaat 4140 atcagacttg ttcattgccg caagtatgtc ttctcatctc caagcaactc atagcttcta 4200 tcacatgatt aatttcattt agaaggactt ttgaactggg ccttcacttc ttttttcctt 4260 gagttgaatc tgtttcgcca ttcttgcaga ttctcagact tgagtttaca gagtgttaaa 4320 ttatcatcca taatggtctc taattgtcca tcacttcatc ggatcaacat cacttccaat 4380 ttacttcaag tatgtcgtaa tggatcttaa agttttcttt cttattaatt tcatttcata 4440 agggtataaa cgaacattgg actgtacttt tgtggacttg cagaaattgg tgttgaagaa 4500 acaagagagc ttggccaaat tggttttgca gtgccctagt ctgcaagatg tggacctcac 4560 agactgtgaa tcgctaacga attctatttg tgaggttttt agtgatggtg gtggatgccc 4620 tatgttgaaa tcacttgttc ttgataactg tgaggtaagt agcttggtgt tacccatcag 4680 tatcatcgca ttggcccttg tgatttcata atttggaaat tatttgattg agactttcca 4740 ttgatttcta atgtgaacat gtttcttttg ttcagagtct gactgctgtt cgattctgta 4800 gcagttcttt aggcagtctt tcccttgttg gttgccgggc aatcacttca cttgaacttc 4860 aatgccctaa tctcgaacag gtttctttag atggctgtga tcatcttgag agagcatcat 4920 tttccccggt atgtgaaaac tgacaacttg taaatttttc tcagtcacta tattataaat 4980 attctcctta gcgctaaaga ttgggctttt ttctctcttt tttaaggttg gtctgcggtc 5040 actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa cttgaggccc ctcggatgga 5100 tttacttgag ttaaaaggtt gtggtggatt gtctgaagca gccatcaatt gtcctcgtct 5160 aacatcgttg gatgcttcct tttgtgggtt agtttgttat gattatttgg atgacacctt 5220 ctatttgatg gatactggtt gcttatgtcg ttgagttctt ctttttccct tgcagccaac 5280 tgaaagatga gtgtttgtct gcgactactg cctcatgtcc acagattgag tcgttaatac 5340 tgatgtcatg tccatcggtt ggttcagagg ggctttactc tctgcgatgc cttctgaagt 5400 tggttgtgct cgatttatca tatacctttt tgatgagctt gcagccagtc ttcgagtctt 5460 gtatacaact taaggtacct ttttgataga tattatcatg acccctgtct gatttctgtt 5520 gtattgatgc cttcttcttt gtgttcttaa tgaaggtatt gaaactacaa gcatgcaagt 5580 atttaactga ctcatcgcta gagcctcttt ataaggaaga cgctcttcca gctcttcaag 5640 agttagactt atcttacggg actctttgtc agtctgccat agaagagctt cttgcttgtt 5700 gcactcactt aactcatgtg agcttaaatg ggtgtgtgaa catgcatgat ctaaattggg 5760 gttgtagcat tggacagctt tcgttgtcca gcatcccaat tcctcttggt caggccactc 5820 ttgatgagat tgaggaacca gttgcacagc caaaccgttt gttacagaac cttaactgtg 5880 taggttgtca gaatattaga aaggttctca ttcctccagc tgctcgttgt tttcatttat 5940 catcattaaa cctatccttg tcttcaaatc tcaaggaagt tgacgtctct tgttacaacc 6000 tatgctttct taatttgagg ttatgccccc ctaccctttt gctccattaa caattttagt 6060 tggttccttt cttttttttt tttttggcct accctgctaa atccgtgttt ttgtgatcta 6120 gtaattgctg ctctttggaa gttctaaaac ttgactgccc gcggttaacc agtctctttc 6180 ttcaggtaat tttttcttca atgtaagttt tggatgttca tactaatcta ctctgaatag 6240 tccagaatct ggtcttccaa gcaatccgaa actaaccgtt ggggataggg tggacaaaaa 6300 atggggtcaa gacagattac aacgcacaag tccacattat aaggacccag tcaatgactg 6360 gagttgaact cccaacctga gacccccctg tagggctgta ggcctcgggt ctaaggaccc 6420 caattttgtt tgcatccccc tccactttta accttttttt tttttttttt ttttgggata 6480 ggaattcatc cattgttgga atcatttgat tatagtttat tttttatctt attttttact 6540 gttgtgttgg gtaaacaata ctttggtttc aaacttgaga aaaaaagaaa tggcagctaa 6600 gagatgcata tgaattttat gatatgaggc taactagatc tgtcttttcc tagtcttgca 6660 acattgaaga agaagtggtt gtggctgcgg tatcgagatg tagcatgctc gagacgttgg 6720 atgtccgctt atgtccaaag gtgaggggtg tctctctttt cctctacatt gtttgatagt 6780 tttggctgac ttcataatat ttcttctact ggcagatctc ctctattagc atggtacaac 6840 tgcgtattgc ttgtccaagt ttgaagcgga tcttcagcac tctgtctcca acatga 6896 <210> 8 <211> 121 <212> DNA <213> artificial <220> <223> marker mwm23348429 to detect mutant allele encoding L528F mutant wap5.1 protein <220> <221> C/T SNP <222> (61)..(61) <400> 8 gacttattgc aggttttgga gcttgataat tgcagtcttt tgacttctgt ttctytggat 60 tttccccatt tacagaatat cagacttgty cattgccgca agtatgtctt ctcatctcca 120 a 121 <210> 9 <211> 1033 <212> PRT <213> Citrullus lanatus <400> 9 Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Asp Glu 1 5 10 15 Arg Glu Arg Glu Glu Glu Leu Lys Lys Glu Gly Glu Met Lys Pro Met 20 25 30 Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser Asp Arg Ile Val 35 40 45 Arg Asn Arg Asp Asp Ser Gln Gly Ser Asn Pro Leu Pro Ile Ala Val 50 55 60 Asp Asp Ala Pro Asp Arg His Asp Gly Asp Arg Leu Arg Leu Phe Glu 65 70 75 80 Asp Met Val Arg Ala Met His Asp Gly Ala Asp Gly Gly Gly Ala His 85 90 95 Trp Asp Asp Glu Leu Arg Gly Gly Gly Gly Gly Ala Ile Asn Pro Trp 100 105 110 Asn Phe Ser Phe Gly Ile Leu His Gln Ser Glu Gly Gly Glu Ser Ser 115 120 125 Ser Ala Ser Ala Leu Ser Leu Ser Ser Thr Val Glu Thr Ser Asn Glu 130 135 140 Glu Arg Asp Arg Asp Ala Asn His Lys Arg Ala Lys Val Leu Ser Lys 145 150 155 160 Phe Thr Glu Ser Ser Phe Ala Thr Pro Trp Pro Leu Gly Ala Gly Asn 165 170 175 Pro Met Arg Asp Tyr Asp Phe Ile His Gly Ser Ser Ser Ile Met Ser 180 185 190 Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser Cys Arg Val Asp Glu 195 200 205 Asp Leu Glu Ser Ser Phe Gly Arg Asp Asp Gly Ile Asn Asp Asn Asp 210 215 220 Thr Cys Lys Ser Glu Gly Phe Glu Val Arg Met Asp Leu Thr Asp Asp 225 230 235 240 Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile Asn Leu Cys Arg 245 250 255 Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser Ala His Glu Asp 260 265 270 Phe Trp Arg Cys Leu Asn Phe Glu Asn Arg Asn Ile Ser Met Glu Gln 275 280 285 Phe Glu Asp Met Cys Gly Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile 290 295 300 Ser Gly Val Pro Ala Val His Leu Leu Ala Met Lys Ala Val Ser Ser 305 310 315 320 Leu Arg His Leu Glu Val Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp 325 330 335 Asn Phe Phe His Ala Leu Thr Asp Cys His Leu Leu Lys Ser Leu Thr 340 345 350 Val Asn Asp Ser Thr Leu Val Asn Val Thr Gln Glu Ile Pro Ile Ser 355 360 365 His Asp Arg Leu Arg His Leu His Leu Thr Lys Cys Arg Val Ile Arg 370 375 380 Ile Ser Val Arg Cys Pro Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser 385 390 395 400 Asn Met Ala Gln Ala Val Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp 405 410 415 Ile Gly Ser Cys His Lys Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala 420 425 430 Ile Ser Cys Pro Gln Leu Glu Ser Leu Asp Met Ser Asn Cys Ser Cys 435 440 445 Val Ser Asp Glu Thr Leu Arg Glu Ile Ser Ala Asn Cys Pro Asn Leu 450 455 460 Gln Leu Leu Asn Ala Ser Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val 465 470 475 480 Arg Leu Thr Met Leu Thr Val Leu Lys Leu His Ser Cys Glu Gly Ile 485 490 495 Thr Ser Ala Ser Met Thr Ala Ile Ser Ser Ser Ser Gly Leu Lys Val 500 505 510 Leu Glu Leu Asp Asn Cys Ser Leu Leu Thr Ser Val Ser Leu Asp Leu 515 520 525 Pro His Leu Gln Asn Ile Arg Leu Val His Cys Arg Lys Phe Ser Asp 530 535 540 Leu Ser Leu Gln Ser Val Lys Leu Ser Ser Ile Met Val Ser Asn Cys 545 550 555 560 Pro Ser Leu His Arg Ile Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu 565 570 575 Val Leu Lys Lys Gln Glu Ser Leu Ala Lys Leu Val Leu Gln Cys Pro 580 585 590 Ser Leu Gln Asp Val Asp Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser 595 600 605 Ile Cys Glu Val Phe Ser Asp Gly Gly Gly Cys Pro Met Leu Lys Ser 610 615 620 Leu Val Leu Asp Asn Cys Glu Ser Leu Thr Ala Val Arg Phe Cys Ser 625 630 635 640 Ser Ser Leu Gly Ser Leu Ser Leu Val Gly Cys Arg Ala Ile Thr Ser 645 650 655 Leu Glu Leu Gln Cys Pro Asn Leu Glu Gln Val Ser Leu Asp Gly Cys 660 665 670 Asp His Leu Glu Arg Ala Ser Phe Ser Pro Val Gly Leu Arg Ser Leu 675 680 685 Asn Leu Gly Ile Cys Pro Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro 690 695 700 Arg Met Asp Leu Leu Glu Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala 705 710 715 720 Ala Ile Asn Cys Pro Arg Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly 725 730 735 Gln Leu Lys Asp Glu Cys Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln 740 745 750 Ile Glu Ser Leu Ile Leu Met Ser Cys Pro Ser Val Gly Ser Glu Gly 755 760 765 Leu Tyr Ser Leu Arg Cys Leu Leu Lys Leu Val Val Leu Asp Leu Ser 770 775 780 Tyr Thr Phe Leu Met Ser Leu Gln Pro Val Phe Glu Ser Cys Ile Gln 785 790 795 800 Leu Lys Val Leu Lys Leu Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser 805 810 815 Leu Glu Pro Leu Tyr Lys Glu Asp Ala Leu Pro Ala Leu Gln Glu Leu 820 825 830 Asp Leu Ser Tyr Gly Thr Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu 835 840 845 Ala Cys Cys Thr His Leu Thr His Val Ser Leu Asn Gly Cys Val Asn 850 855 860 Met His Asp Leu Asn Trp Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser 865 870 875 880 Ser Ile Pro Ile Pro Leu Gly Gln Ala Thr Leu Asp Glu Ile Glu Glu 885 890 895 Pro Val Ala Gln Pro Asn Arg Leu Leu Gln Asn Leu Asn Cys Val Gly 900 905 910 Cys Gln Asn Ile Arg Lys Val Leu Ile Pro Pro Ala Ala Arg Cys Phe 915 920 925 His Leu Ser Ser Leu Asn Leu Ser Leu Ser Ser Asn Leu Lys Glu Val 930 935 940 Asp Val Ser Cys Tyr Asn Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys 945 950 955 960 Ser Leu Glu Val Leu Lys Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe 965 970 975 Leu Gln Ser Cys Asn Ile Glu Glu Glu Val Val Val Ala Ala Val Ser 980 985 990 Arg Cys Ser Met Leu Glu Thr Leu Asp Val Arg Leu Cys Pro Lys Ile 995 1000 1005 Ser Ser Ile Ser Met Val Gln Leu Arg Ile Ala Cys Pro Ser Leu 1010 1015 1020 Lys Arg Ile Phe Ser Thr Leu Ser Pro Thr 1025 1030 <210> 10 <211> 1033 <212> PRT <213> Citrullus lanatus <400> 10 Met Thr Ile Trp Cys Cys Leu Cys Phe Thr Val Gly Glu Glu Asp Glu 1 5 10 15 Arg Glu Arg Glu Glu Glu Leu Lys Lys Glu Gly Glu Met Lys Pro Met 20 25 30 Met Arg Glu Glu Val Phe Glu Asn Gln Asp Asp Ser Asp Arg Ile Val 35 40 45 Arg Asn Arg Asp Asp Ser Gln Gly Ser Asn Pro Leu Pro Ile Ala Val 50 55 60 Asp Asp Ala Pro Asp Arg His Asp Gly Asp Arg Leu Arg Leu Phe Glu 65 70 75 80 Asp Met Val Arg Ala Met His Asp Gly Ala Asp Gly Gly Gly Ala His 85 90 95 Trp Asp Asp Glu Leu Arg Gly Gly Gly Gly Gly Ala Ile Asn Pro Trp 100 105 110 Asn Phe Ser Phe Gly Ile Leu His Gln Ser Glu Gly Gly Glu Ser Ser 115 120 125 Ser Ala Ser Ala Leu Ser Leu Ser Ser Thr Val Glu Thr Ser Asn Glu 130 135 140 Glu Arg Asp Arg Asp Ala Asn His Lys Arg Ala Lys Val Leu Ser Lys 145 150 155 160 Phe Thr Glu Ser Ser Phe Ala Thr Pro Trp Pro Leu Gly Ala Gly Asn 165 170 175 Pro Met Arg Asp Tyr Asp Phe Ile His Gly Ser Ser Ser Ile Met Ser 180 185 190 Arg Asn Glu Phe Leu Tyr His Ala Ser Thr Ser Cys Arg Val Asp Glu 195 200 205 Asp Leu Glu Ser Ser Phe Gly Arg Asp Asp Gly Ile Asn Asp Asn Asp 210 215 220 Thr Cys Lys Ser Glu Gly Phe Glu Val Arg Met Asp Leu Thr Asp Asp 225 230 235 240 Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile Asn Leu Cys Arg 245 250 255 Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser Ala His Glu Asp 260 265 270 Phe Trp Arg Cys Leu Asn Phe Glu Asn Arg Asn Ile Ser Met Glu Gln 275 280 285 Phe Glu Asp Met Cys Gly Arg Tyr Pro Asn Ala Thr Glu Val Asn Ile 290 295 300 Ser Gly Val Pro Ala Val His Leu Leu Ala Met Lys Ala Val Ser Ser 305 310 315 320 Leu Arg His Leu Glu Val Leu Thr Leu Gly Arg Gly Gln Leu Ala Asp 325 330 335 Asn Phe Phe His Ala Leu Thr Asp Cys His Leu Leu Lys Ser Leu Thr 340 345 350 Val Asn Asp Ser Thr Leu Val Asn Val Thr Gln Glu Ile Pro Ile Ser 355 360 365 His Asp Arg Leu Arg His Leu His Leu Thr Lys Cys Arg Val Ile Arg 370 375 380 Ile Ser Val Arg Cys Pro Gln Leu Glu Thr Leu Ser Leu Lys Arg Ser 385 390 395 400 Asn Met Ala Gln Ala Val Leu Asn Cys Pro Leu Leu Arg Asp Leu Asp 405 410 415 Ile Gly Ser Cys His Lys Leu Ser Asp Ala Ala Ile Arg Ser Ala Ala 420 425 430 Ile Ser Cys Pro Gln Leu Glu Ser Leu Asp Met Ser Asn Cys Ser Cys 435 440 445 Val Ser Asp Glu Thr Leu Arg Glu Ile Ser Ala Asn Cys Pro Asn Leu 450 455 460 Gln Leu Leu Asn Ala Ser Tyr Cys Pro Asn Ile Ser Leu Glu Ser Val 465 470 475 480 Arg Leu Thr Met Leu Thr Val Leu Lys Leu His Ser Cys Glu Gly Ile 485 490 495 Thr Ser Ala Ser Met Thr Ala Ile Ser Ser Ser Ser Gly Leu Lys Val 500 505 510 Leu Glu Leu Asp Asn Cys Ser Leu Leu Thr Ser Val Ser Leu Asp Phe 515 520 525 Pro His Leu Gln Asn Ile Arg Leu Val His Cys Arg Lys Phe Ser Asp 530 535 540 Leu Ser Leu Gln Ser Val Lys Leu Ser Ser Ile Met Val Ser Asn Cys 545 550 555 560 Pro Ser Leu His Arg Ile Asn Ile Thr Ser Asn Leu Leu Gln Lys Leu 565 570 575 Val Leu Lys Lys Gln Glu Ser Leu Ala Lys Leu Val Leu Gln Cys Pro 580 585 590 Ser Leu Gln Asp Val Asp Leu Thr Asp Cys Glu Ser Leu Thr Asn Ser 595 600 605 Ile Cys Glu Val Phe Ser Asp Gly Gly Gly Cys Pro Met Leu Lys Ser 610 615 620 Leu Val Leu Asp Asn Cys Glu Ser Leu Thr Ala Val Arg Phe Cys Ser 625 630 635 640 Ser Ser Leu Gly Ser Leu Ser Leu Val Gly Cys Arg Ala Ile Thr Ser 645 650 655 Leu Glu Leu Gln Cys Pro Asn Leu Glu Gln Val Ser Leu Asp Gly Cys 660 665 670 Asp His Leu Glu Arg Ala Ser Phe Ser Pro Val Gly Leu Arg Ser Leu 675 680 685 Asn Leu Gly Ile Cys Pro Lys Leu Asn Glu Leu Lys Leu Glu Ala Pro 690 695 700 Arg Met Asp Leu Leu Glu Leu Lys Gly Cys Gly Gly Leu Ser Glu Ala 705 710 715 720 Ala Ile Asn Cys Pro Arg Leu Thr Ser Leu Asp Ala Ser Phe Cys Gly 725 730 735 Gln Leu Lys Asp Glu Cys Leu Ser Ala Thr Thr Ala Ser Cys Pro Gln 740 745 750 Ile Glu Ser Leu Ile Leu Met Ser Cys Pro Ser Val Gly Ser Glu Gly 755 760 765 Leu Tyr Ser Leu Arg Cys Leu Leu Lys Leu Val Val Leu Asp Leu Ser 770 775 780 Tyr Thr Phe Leu Met Ser Leu Gln Pro Val Phe Glu Ser Cys Ile Gln 785 790 795 800 Leu Lys Val Leu Lys Leu Gln Ala Cys Lys Tyr Leu Thr Asp Ser Ser 805 810 815 Leu Glu Pro Leu Tyr Lys Glu Asp Ala Leu Pro Ala Leu Gln Glu Leu 820 825 830 Asp Leu Ser Tyr Gly Thr Leu Cys Gln Ser Ala Ile Glu Glu Leu Leu 835 840 845 Ala Cys Cys Thr His Leu Thr His Val Ser Leu Asn Gly Cys Val Asn 850 855 860 Met His Asp Leu Asn Trp Gly Cys Ser Ile Gly Gln Leu Ser Leu Ser 865 870 875 880 Ser Ile Pro Ile Pro Leu Gly Gln Ala Thr Leu Asp Glu Ile Glu Glu 885 890 895 Pro Val Ala Gln Pro Asn Arg Leu Leu Gln Asn Leu Asn Cys Val Gly 900 905 910 Cys Gln Asn Ile Arg Lys Val Leu Ile Pro Pro Ala Ala Arg Cys Phe 915 920 925 His Leu Ser Ser Leu Asn Leu Ser Leu Ser Ser Asn Leu Lys Glu Val 930 935 940 Asp Val Ser Cys Tyr Asn Leu Cys Phe Leu Asn Leu Ser Asn Cys Cys 945 950 955 960 Ser Leu Glu Val Leu Lys Leu Asp Cys Pro Arg Leu Thr Ser Leu Phe 965 970 975 Leu Gln Ser Cys Asn Ile Glu Glu Glu Val Val Val Ala Ala Val Ser 980 985 990 Arg Cys Ser Met Leu Glu Thr Leu Asp Val Arg Leu Cys Pro Lys Ile 995 1000 1005 Ser Ser Ile Ser Met Val Gln Leu Arg Ile Ala Cys Pro Ser Leu 1010 1015 1020 Lys Arg Ile Phe Ser Thr Leu Ser Pro Thr 1025 1030 <210> 11 <211> 3102 <212> DNA <213> Citrullus lanatus <400> 11 atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60 gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120 caggatgact ctgatcgcat tgtgcgaaat cgtgatgatt ctcaagggag taatccactt 180 ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240 gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300 ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360 caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420 acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480 ttcactgaga gctcatttgc aactccatgg cctttgggtg ctggaaatcc tatgagagat 540 tatgatttta ttcacggatc atcttcaatt atgagtagga atgaatttct ataccatgct 600 tctacatcat gcagagttga cgaagatttg gaatctagtt ttggtagaga tgatgggatc 660 aatgataatg acacctgtaa atcagaagga tttgaagtaa gaatggatct tacagatgat 720 ttactgcata tggtgttctc tttcttggat cacatcaatc tttgtcgagc tgctatagtc 780 tgcaggcagt ggcaagctgc tagtgctcat gaagatttct ggaggtgttt gaattttgaa 840 aataggaaca tatccatgga acaattcgag gatatgtgtg gaagatatcc aaatgctaca 900 gaggtcaata tctctggtgt acctgccgtt cacttgcttg ccatgaaagc agtttcttct 960 ttaagacatc tggaggtttt aactctgggg agaggacaac tggcagataa cttttttcac 1020 gccctgactg attgccattt attgaagagt ttgactgtca atgattctac gctggttaat 1080 gttacacaag agatacctat aagccatgat agactgcgtc atcttcatct tactaaatgt 1140 cgtgttatac gcatatctgt tagatgtcca caacttgaaa cattgtcgtt gaagcgcagc 1200 aacatggcac aggctgttct taactgcccc cttcttcggg acctggatat aggctcttgc 1260 cacaagctct cagatgctgc aattcgctca gccgctattt catgcccaca gttggaatct 1320 cttgatatgt ctaattgttc atgtgttagc gatgagacat tacgtgaaat ttctgcaaac 1380 tgcccgaatc tccagcttct gaatgcatca tactgcccaa atatatcttt ggagtctgta 1440 agactgacaa tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca 1500 atgaccgcaa tatctagtag ttctggtttg aaggttttgg agcttgataa ttgcagtctt 1560 ttgacttctg tttctctgga tcttccccat ttacagaata tcagacttgt tcattgccgc 1620 aaattctcag acttgagttt acagagtgtt aaattatcat ccataatggt ctctaattgt 1680 ccatcacttc atcggatcaa catcacttcc aatttacttc aaaaattggt gttgaagaaa 1740 caagagagct tggccaaatt ggttttgcag tgccctagtc tgcaagatgt ggacctcaca 1800 gactgtgaat cgctaacgaa ttctatttgt gaggttttta gtgatggtgg tggatgccct 1860 atgttgaaat cacttgttct tgataactgt gagagtctga ctgctgttcg attctgtagc 1920 agttctttag gcagtctttc ccttgttggt tgccgggcaa tcacttcact tgaacttcaa 1980 tgccctaatc tcgaacaggt ttctttagat ggctgtgatc atcttgagag agcatcattt 2040 tccccggttg gtctgcggtc actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa 2100 cttgaggccc ctcggatgga tttacttgag ttaaaaggtt gtggtggatt gtctgaagca 2160 gccatcaatt gtcctcgtct aacatcgttg gatgcttcct tttgtggcca actgaaagat 2220 gagtgtttgt ctgcgactac tgcctcatgt ccacagattg agtcgttaat actgatgtca 2280 tgtccatcgg ttggttcaga ggggctttac tctctgcgat gccttctgaa gttggttgtg 2340 ctcgatttat catatacctt tttgatgagc ttgcagccag tcttcgagtc ttgtatacaa 2400 cttaaggtat tgaaactaca agcatgcaag tatttaactg actcatcgct agagcctctt 2460 tataaggaag acgctcttcc agctcttcaa gagttagact tatcttacgg gactctttgt 2520 cagtctgcca tagaagagct tcttgcttgt tgcactcact taactcatgt gagcttaaat 2580 gggtgtgtga acatgcatga tctaaattgg ggttgtagca ttggacagct ttcgttgtcc 2640 agcatcccaa ttcctcttgg tcaggccact cttgatgaga ttgaggaacc agttgcacag 2700 ccaaaccgtt tgttacagaa ccttaactgt gtaggttgtc agaatattag aaaggttctc 2760 attcctccag ctgctcgttg ttttcattta tcatcattaa acctatcctt gtcttcaaat 2820 ctcaaggaag ttgacgtctc ttgttacaac ctatgctttc ttaatttgag taattgctgc 2880 tctttggaag ttctaaaact tgactgcccg cggttaacca gtctctttct tcagtcttgc 2940 aacattgaag aagaagtggt tgtggctgcg gtatcgagat gtagcatgct cgagacgttg 3000 gatgtccgct tatgtccaaa gatctcctct attagcatgg tacaactgcg tattgcttgt 3060 ccaagtttga agcggatctt cagcactctg tctccaacat ga 3102 <210> 12 <211> 3102 <212> DNA <213> Citrullus lanatus <400> 12 atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60 gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120 caggatgact ctgatcgcat tgtgcgaaat cgtgatgatt ctcaagggag taatccactt 180 ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240 gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300 ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360 caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420 acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480 ttcactgaga gctcatttgc aactccatgg cctttgggtg ctggaaatcc tatgagagat 540 tatgatttta ttcacggatc atcttcaatt atgagtagga atgaatttct ataccatgct 600 tctacatcat gcagagttga cgaagatttg gaatctagtt ttggtagaga tgatgggatc 660 aatgataatg acacctgtaa atcagaagga tttgaagtaa gaatggatct tacagatgat 720 ttactgcata tggtgttctc tttcttggat cacatcaatc tttgtcgagc tgctatagtc 780 tgcaggcagt ggcaagctgc tagtgctcat gaagatttct ggaggtgttt gaattttgaa 840 aataggaaca tatccatgga acaattcgag gatatgtgtg gaagatatcc aaatgctaca 900 gaggtcaata tctctggtgt acctgccgtt cacttgcttg ccatgaaagc agtttcttct 960 ttaagacatc tggaggtttt aactctgggg agaggacaac tggcagataa cttttttcac 1020 gccctgactg attgccattt attgaagagt ttgactgtca atgattctac gctggttaat 1080 gttacacaag agatacctat aagccatgat agactgcgtc atcttcatct tactaaatgt 1140 cgtgttatac gcatatctgt tagatgtcca caacttgaaa cattgtcgtt gaagcgcagc 1200 aacatggcac aggctgttct taactgcccc cttcttcggg acctggatat aggctcttgc 1260 cacaagctct cagatgctgc aattcgctca gccgctattt catgcccaca gttggaatct 1320 cttgatatgt ctaattgttc atgtgttagc gatgagacat tacgtgaaat ttctgcaaac 1380 tgcccgaatc tccagcttct gaatgcatca tactgcccaa atatatcttt ggagtctgta 1440 agactgacaa tgctgaccgt gcttaagctt cacagctgtg agggcatcac atcagcttca 1500 atgaccgcaa tatctagtag ttctggtttg aaggttttgg agcttgataa ttgcagtctt 1560 ttgacttctg tttctctgga ttttccccat ttacagaata tcagacttgt tcattgccgc 1620 aaattctcag acttgagttt acagagtgtt aaattatcat ccataatggt ctctaattgt 1680 ccatcacttc atcggatcaa catcacttcc aatttacttc aaaaattggt gttgaagaaa 1740 caagagagct tggccaaatt ggttttgcag tgccctagtc tgcaagatgt ggacctcaca 1800 gactgtgaat cgctaacgaa ttctatttgt gaggttttta gtgatggtgg tggatgccct 1860 atgttgaaat cacttgttct tgataactgt gagagtctga ctgctgttcg attctgtagc 1920 agttctttag gcagtctttc ccttgttggt tgccgggcaa tcacttcact tgaacttcaa 1980 tgccctaatc tcgaacaggt ttctttagat ggctgtgatc atcttgagag agcatcattt 2040 tccccggttg gtctgcggtc actaaacctg ggaatctgtc ccaaattgaa tgaattaaaa 2100 cttgaggccc ctcggatgga tttacttgag ttaaaaggtt gtggtggatt gtctgaagca 2160 gccatcaatt gtcctcgtct aacatcgttg gatgcttcct tttgtggcca actgaaagat 2220 gagtgtttgt ctgcgactac tgcctcatgt ccacagattg agtcgttaat actgatgtca 2280 tgtccatcgg ttggttcaga ggggctttac tctctgcgat gccttctgaa gttggttgtg 2340 ctcgatttat catatacctt tttgatgagc ttgcagccag tcttcgagtc ttgtatacaa 2400 cttaaggtat tgaaactaca agcatgcaag tatttaactg actcatcgct agagcctctt 2460 tataaggaag acgctcttcc agctcttcaa gagttagact tatcttacgg gactctttgt 2520 cagtctgcca tagaagagct tcttgcttgt tgcactcact taactcatgt gagcttaaat 2580 gggtgtgtga acatgcatga tctaaattgg ggttgtagca ttggacagct ttcgttgtcc 2640 agcatcccaa ttcctcttgg tcaggccact cttgatgaga ttgaggaacc agttgcacag 2700 ccaaaccgtt tgttacagaa ccttaactgt gtaggttgtc agaatattag aaaggttctc 2760 attcctccag ctgctcgttg ttttcattta tcatcattaa acctatcctt gtcttcaaat 2820 ctcaaggaag ttgacgtctc ttgttacaac ctatgctttc ttaatttgag taattgctgc 2880 tctttggaag ttctaaaact tgactgcccg cggttaacca gtctctttct tcagtcttgc 2940 aacattgaag aagaagtggt tgtggctgcg gtatcgagat gtagcatgct cgagacgttg 3000 gatgtccgct tatgtccaaa gatctcctct attagcatgg tacaactgcg tattgcttgt 3060 ccaagtttga agcggatctt cagcactctg tctccaacat ga 3102 <210> 13 <211> 41 <212> PRT <213> Citrullus lanatus <400> 13 Leu Thr Asp Asp Leu Leu His Met Val Phe Ser Phe Leu Asp His Ile 1 5 10 15 Asn Leu Cys Arg Ala Ala Ile Val Cys Arg Gln Trp Gln Ala Ala Ser 20 25 30 Ala His Glu Asp Phe Trp Arg Cys Leu 35 40 <210> 14 <211> 6890 <212> DNA <213> Citrullus lanatus <400> 14 atgacgattt ggtgctgctt atgcttcacc gttggagaag aagacgaaag ggaaagggaa 60 gaggaactga agaaggaagg tgaaatgaaa cccatgatgc gtgaggaggt ttttgagaac 120 caggatgact ctgatcgcat tgtgcgaaat cgtgatgatt ctcaagggag taatccactt 180 ccgattgctg tagatgatgc gcctgaccgt catgacggtg atcgacttag actgtttgag 240 gatatggtca gagcaatgca cgatggcgcc gatggtggtg gtgctcattg ggacgatgag 300 ctgcgcggcg gcggcggcgg ggctattaat ccctggaatt tttcttttgg aattctgcat 360 caatctgagg gaggagaaag tagtagcgcc tcggctttgt ccttgtcttc tacggtggag 420 acttctaatg aggaacgcga tcgggatgcc aaccataagc gcgctaaagt tctctccaaa 480 ttcacgtgag tcacttgtag actgcttctg gatatgaatt atgctaaggt ttcatgggtt 540 tgccattttt cttggttttc ttttccccct tttccgaaag gggtgttggt tttttttttt 600 tttttttttg ttccttctta aatgttctct ctttgtggga tttaggacta gatattgtgg 660 tggtttttgg atggagatcg ttagcattta ttgaggttat catttacgaa tatgcagggt 720 tctttgtaat ttagctatca atgcaggctg tttgttgtta tttttgtgcc ggcatctctg 780 aataatttgc tgttttgcac tgcaagatag ctatggaaaa ttacgtattt tatgatctaa 840 acgtgctccg cttctttagc tctcgggctg tatcagcgtt tggaaagtag ttgttctata 900 gattttcacg agcaccttct attcttgaat acttgaagtg gtgtctaata taaagcaata 960 tgtttttgca tcgaccttat cccgtccatc tttattgtat gtattagact gttggcaggc 1020 tctttatcat tgtattttaa atattttttc ccgatttcta aattagaaat gtgtttctta 1080 atcaatagtg gcatgttgct tgggcttttc tagaagagat atcatacggt gtgccaagat 1140 gatatctcaa agtcttcttc agttgcgagt cttctgagtg agttgtcacc atggaaaagt 1200 ttccttttct tcatggaata gaaaatcatt tatatttgag aaattcaata tatggttttc 1260 tttctctgag aagagtttga aaatgaaaag tatagatatg aatgtttatt gtttttgatt 1320 gtcttattaa ttgttttttt gaagcaaacc ttcatgtaca acgatattta gggtgtttga 1380 atgcacatag gttctcctat tacatgattt atttatgtac tgaaaattaa aggtgtatta 1440 aatttgagtc ataatttttg taaaaactat tctttctaaa ttgttttctg gatatgccca 1500 aacaagtcct tatattttca agcactgttg accttggtag tatagttatc acactcattt 1560 gcaaacctac ttgtgatact atactttcat tactagttaa aaaaatgtct tcgttaaggt 1620 ttatcatgga gggatgagta tatagctgtt gtcttactgc taaatatgat cttatgttgg 1680 aaactctgcc cttcacatgg tggttgatga tgtatcatgt gatctttagt ttaaaaaaga 1740 gtaaactctg agttaactaa atgtaagtat gtgcagtaat actcattcca gataattcac 1800 attctctcaa ccgtttagat cttgcaaatt agcaccatca agtttcctat aatttacaag 1860 ttagactaac tgataagtgt aaagttagaa atgatgctcg ttattcactt ttaacaattg 1920 tttcttattt tcttttcttt tcaatcttcc ctagtgagag ctcatttgca actccatggc 1980 ctttgggtgc tggaaatcct atgagagatt atgattttat tcacggatca tcttcaatta 2040 tgagtaggaa tgaatttcta taccatgctt ctacatcatg cagagttgac gaagatttgg 2100 aatctagttt tggtagagat gatgggatca atgataatga cacctgtaaa tcagaaggat 2160 ttgaagtaag aatggatctt acagatgatt tactgcatat ggtatgcatc tccagagatt 2220 tattattgtt ttcttgctta ccgtcttatt tcttggattt cttattcaca tgaagttaaa 2280 ttaattgata tcaggtgttc tctttcttgg atcacatcaa tctttgtcga gctgctatag 2340 tctgcaggca gtggcaagct gctagtgctc atgaagattt ctggaggtgt ttgaattttg 2400 aaaataggaa catatccatg gaacaatgta ggtgttgttc tgcttcttcc tttcattttc 2460 tagagtagtt gagacaagaa tgaggtgatt ttaaaaatgt tggttgcctc ttggaaatag 2520 aggtgatata ttatgatgta acttcaaaac atgtaggatg cagtatttga gtctggaatg 2580 tctttagcac tcatgaaatg ttgttaaaag cctaggactg cgacatattt ggggcttgtt 2640 ttcagtactc agtaggattt ttctccctaa atctttttga ctaggtatgt atataatatt 2700 aaaggaaaga acttcttgat gctattttta gctttggcaa tctcttgatt cttttaaaat 2760 aagttctgga tataattgta taaatgtgat aggatgtgac atatctctgt agcagtcttg 2820 gtgccagtgc caatgcaaca ctttcaatcg tatttcaagt ttaacctact tttatccagt 2880 cacattttct ttctacccac catacagtat aaattgatcc ggttgtattt ctttgtgcct 2940 ctgtattaac aactgtccta tcctattcta tgttgcttac tttctaacat cattctgatt 3000 tggagctagt tagttaattg attaattctg actgcagtcg aggatatgtg tggaagatat 3060 ccaaatgcta cagaggtcaa tatctctggt gtacctgccg ttcacttgct tgccatgaaa 3120 gcagtttctt ctttaaggta atgattacgg ttttgtattt ttgttttttt tcctcatcct 3180 gaatctttat ggtggtgctt attattttat tattgtctca gacatctgga ggttttaact 3240 ctggggagag gacaactggc agataacttt tttcacgccc tgactgattg ccatttattg 3300 aagagtttga ctgtcaatga ttctacgctg gttaatgtta cacaagagat acctataagc 3360 catgatagac tgcgtcatct tcatcttact aaatgtcgtg ttatacgcat atctgttagg 3420 ttgctaatgt ttatgtatct taatgctaac tgtatttaat tgtttagttt gttttttttt 3480 tttttttggg tctaaagcat gttttcttgc agatgtccac aacttgaaac attgtcgttg 3540 aagcgcagca acatggcaca ggctgttctt aactgccccc ttcttcggga cctggatata 3600 ggctcttgcc acaagctctc agatgctgca attcgctcag ccgctatttc atgcccacag 3660 ttggaatctc ttgatatgtc taattgttca tgtgttagcg atgagacatt acgtgaaatt 3720 tctgcaaact gcccgaatct ccagcttctg aatgcatcat actgcccaaa tatatctttg 3780 gaggtggcat accattttta gttaaatttt gagcgaaagt gactattttg cccttcagac 3840 ttgtttttcc tgatattttg gttccttttt cttttgaagt ctgtaagact gacaatgctg 3900 accgtgctta agcttcacag ctgtgagggc atcacatcag cttcaatgac cgcaatatct 3960 agtagttctg gtttgaaggt ctgaaataac ctatttcgac tgtttatatt ttctagttgt 4020 ctggtgctgt gtctgagtta gttgaaaatg gaatggagac ttattgcagg ttttggagct 4080 tgataattgc agtcttttga cttctgtttc tctggatctt ccccatttac agaatatcag 4140 acttgttcat tgccgcaagt atgtcttctc atctccaagc aactcatagc ttctatcaca 4200 tgattaattt catttagaag gacttttgaa ctgggccttc acttcttttt tccttgagtt 4260 gaatctgttt cgccattctt gcagattctc agacttgagt ttacagagtg ttaaattatc 4320 atccataatg gtctctaatt gtccatcact tcatcggatc aacatcactt ccaatttact 4380 tcaagtatgt cgtaatggat cttaaagttt tctttcttat taatttcatt tcataagggt 4440 ataaacgaac attggactgt acttttgtgg acttgcagaa attggtgttg aagaaacaag 4500 agagcttggc caaattggtt ttgcagtgcc ctagtctgca agatgtggac ctcacagact 4560 gtgaatcgct aacgaattct atttgtgagg tttttagtga tggtggtgga tgccctatgt 4620 tgaaatcact tgttcttgat aactgtgagg taagtagctt ggtgttaccc atcagtatca 4680 tcgcattggc ccttgtgatt tcataatttg gaaattattt gattgagact ttccattgat 4740 ttctaatgtg aacatgtttc ttttgttcag agtctgactg ctgttcgatt ctgtagcagt 4800 tctttaggca gtctttccct tgttggttgc cgggcaatca cttcacttga acttcaatgc 4860 cctaatctcg aacaggtttc tttagatggc tgtgatcatc ttgagagagc atcattttcc 4920 ccggtatgtg aaaactgaca acttgtaaat ttttctcagt cactatatta taaatattct 4980 ccttagcgct aaagattggg cttttttctc tcttttttaa ggttggtctg cggtcactaa 5040 acctgggaat ctgtcccaaa ttgaatgaat taaaacttga ggcccctcgg atggatttac 5100 ttgagttaaa aggttgtggt ggattgtctg aagcagccat caattgtcct cgtctaacat 5160 cgttggatgc ttccttttgt gggttagttt gttatgatta tttggatgac accttctatt 5220 tgatggatac tggttgctta tgtcgttgag ttcttctttt tcccttgcag ccaactgaaa 5280 gatgagtgtt tgtctgcgac tactgcctca tgtccacaga ttgagtcgtt aatactgatg 5340 tcatgtccat cggttggttc agaggggctt tactctctgc gatgccttct gaagttggtt 5400 gtgctcgatt tatcatatac ctttttgatg agcttgcagc cagtcttcga gtcttgtata 5460 caacttaagg tacctttttg atagatatta tcatgacccc tgtctgattt ctgttgtatt 5520 gatgccttct tctttgtgtt cttaatgaag gtattgaaac tacaagcatg caagtattta 5580 actgactcat cgctagagcc tctttataag gaagacgctc ttccagctct tcaagagtta 5640 gacttatctt acgggactct ttgtcagtct gccatagaag agcttcttgc ttgttgcact 5700 cacttaactc atgtgagctt aaatgggtgt gtgaacatgc atgatctaaa ttggggttgt 5760 agcattggac agctttcgtt gtccagcatc ccaattcctc ttggtcaggc cactcttgat 5820 gagattgagg aaccagttgc acagccaaac cgtttgttac agaaccttaa ctgtgtaggt 5880 tgtcagaata ttagaaaggt tctcattcct ccagctgctc gttgttttca tttatcatca 5940 ttaaacctat ccttgtcttc aaatctcaag gaagttgacg tctcttgtta caacctatgc 6000 tttcttaatt tgaggttatg cccccctacc cttttgctcc attaacaatt ttagttggtt 6060 cctttctttt tttttttttt ggcctaccct gctaaatccg tgtttttgtg atctagtaat 6120 tgctgctctt tggaagttct aaaacttgac tgcccgcggt taaccagtct ctttcttcag 6180 gtaatttttt cttcaatgta agttttggat gttcatacta atctactctg aatagtccag 6240 aatctggtct tccaagcaat ccgaaactaa ccgttgggga tagggtggac aaaaaatggg 6300 gtcaagacag attacaacgc acaagtccac attataagga cccagtcaat gactggagtt 6360 gaactcccaa cctgagaccc ccctgtaggg ctgtaggcct cgggtctaag gaccccaatt 6420 ttgtttgcat ccccctccac ttttaacctt tttttttttt ttttttttgg gataggaatt 6480 catccattgt tggaatcatt tgattatagt ttatttttta tcttattttt tactgttgtg 6540 ttgggtaaac aatactttgg tttcaaactt gagaaaaaaa gaaatggcag ctaagagatg 6600 catatgaatt ttatgatatg aggctaacta gatctgtctt ttcctagtct tgcaacattg 6660 aagaagaagt ggttgtggct gcggtatcga gatgtagcat gctcgagacg ttggatgtcc 6720 gcttatgtcc aaaggtgagg ggtgtctctc ttttcctcta cattgtttga tagttttggc 6780 tgacttcata atatttcttc tactggcaga tctcctctat tagcatggta caactgcgta 6840 ttgcttgtcc aagtttgaag cggatcttca gcactctgtc tccaacatga 6890

Claims (18)

  1. 염색체 5에 위치된 WAP5.1로 명명된 내인성 유전자의 돌연변이체 대립유전자의 적어도 하나의 카피를 포함하는 수박 식물 또는 식물 부분으로서, 여기서 상기 돌연변이체 대립유전자는
    a) 야생형 대립유전자와 비교하여 대립유전자의 발현 없음 또는 감소된 발현을 초래하는 조절 요소에 하나 이상의 돌연변이를 포함하거나, 또는
    b) 야생형 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하고,
    여기서 a) 또는 b)의 상기 돌연변이체 대립유전자는 돌연변이체 대립유전자가 동형접합 형태인 경우에 통성 단위결과를 부여하고, 여기서 야생형 WAP5.1 대립유전자는 서열식별번호: 1 또는 서열식별번호: 9의 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하는 것인 수박 식물 또는 식물 부분.
  2. 제1항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 237에서 시작하여 아미노산 277에서 끝나는 단백질의 F-박스 도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하는 것인 수박 식물 또는 식물 부분.
  3. 제1항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 291에서 시작하여 아미노산 1033에서 끝나는 단백질의 LRR-도메인에서 삽입, 결실 또는 대체된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하며, 여기서 상기 삽입, 결실 또는 대체가 단백질의 LRR-도메인의 부적절한 폴딩을 초래하는 것인 수박 식물 또는 식물 부분.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 번호 D209, A257, A266, W274, E287, Q333, L528, P308 또는 G330을 코딩하는 코돈에 돌연변이를 포함하는 것인 수박 식물 또는 식물 부분.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 아미노산 번호 D209, A257, A266, W274, E287, Q333, L528, P308 또는 G330의 아미노산 치환 또는 정지 코돈을 코딩하는 것인 수박 식물 또는 식물 부분.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 돌연변이체 대립유전자가 서열식별번호: 1 또는 서열식별번호: 9의 하기 아미노산 변화: D209V, A257V, A266V, W274STOP, E287K, Q333STOP, L528F, P308L 또는 G330E 중 하나 이상을 코딩하는 것인 수박 식물 또는 식물 부분.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 식물 또는 식물 부분이 2배체이고 돌연변이체 대립유전자에 대해 동형접합성인 수박 식물 또는 식물 부분.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 수박 식물이 2배체, 3배체 또는 4배체인 식물 또는 식물 부분.
  9. 제8항에 있어서, 2배체 식물 또는 식물 부분이 돌연변이체 대립유전자의 2개 카피를 포함하고, 3배체 식물 또는 식물 부분이 1, 2 또는 3개 카피를 포함하고, 4배체 식물 또는 식물 부분이 2 또는 4개 카피를 포함하는 것인 식물 또는 식물 부분.
  10. 제1항 내지 제9항 중 어느 한 항에 따른 식물 또는 식물 부분이 성장될 수 있는 종자.
  11. 제1항 내지 제9항 중 어느 한 항에 따른 식물에 의해 생산된 과실로서, 임의로 여기서 과실은 씨가 없고 수분의 부재 하에 생산된 것인 과실.
  12. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 식물 또는 식물 부분이 웅성 불임을 부여하는 유전자 또는 위단위결과를 부여하는 유전자 또는 단위결과를 부여하는 또 다른 유전자를 추가로 포함하는 것인 식물 또는 식물 부분.
  13. 제1항 내지 제9항 및 제12항 중 어느 한 항에 있어서, 식물 부분이 세포, 꽃, 잎, 줄기, 삽목, 배주, 화분, 뿌리, 근경, 접순, 과실, 원형질체, 배아, 꽃밥인 식물 부분.
  14. 제13항에 따른 식물 부분으로부터 번식된 영양 번식 식물.
  15. 제1항 내지 제6항 중 어느 한 항에 따른 돌연변이체 대립유전자의 2개 카피를 포함하는 2배체 수박 식물을 성장시키는 단계로서, 여기서 꽃의 수분이 성장 동안 방지되는 것인 단계, 및 수분되지 않은 꽃으로부터 생산된 씨없는 과실을 수확하는 단계를 포함하는, 씨없는 수박 과실을 생산하는 방법.
  16. 제1항 내지 제6항 중 어느 한 항에 따른 돌연변이체 대립유전자의 1, 2 또는 3개 카피를 포함하는 3배체 수박 식물을 성장시키는 단계로서, 여기서 성장 동안 수분자 식물이 존재하지 않는 것인 단계, 및 수분되지 않은 꽃으로부터 생산된 씨없는 과실을 수확하는 단계를 포함하는, 씨없는 수박 과실을 생산하는 방법.
  17. 하기 단계를 포함하는, WAP5.1로 명명된 유전자의 돌연변이체 대립유전자의 존재에 대해 수박 식물, 종자, 식물 부분 또는 이로부터의 DNA를 스크리닝하기 위한, 또는 WAP5.1로 명명된 유전자의 돌연변이체 대립유전자를 포함하는 수박 식물, 종자 또는 식물 부분을 선택하기 위한 방법:
    a) 게놈 DNA가 서열식별번호: 1 또는 9의 단백질, 또는 서열식별번호: 1 또는 서열식별번호: 9에 대해 적어도 95% 서열 동일성을 포함하는 단백질을 코딩하는 야생형 WAP5.1 대립유전자, 및/또는 야생형 WAP5.1 단백질과 비교하여 대체, 삽입 또는 결실된 하나 이상의 아미노산을 포함하는 돌연변이체 단백질을 코딩하는 돌연변이체 WAP5.1 대립유전자를 포함하는지 여부를 분석하는 단계, 및 임의로
    b) 야생형 대립유전자의 2개 카피, 돌연변이체 대립유전자의 2개 카피 또는 야생형 대립유전자의 1개 카피 및 돌연변이체 대립유전자의 1개 카피를 포함하는 식물, 종자 또는 식물 부분을 선택하는 단계.
  18. 제17항에 있어서, 단계 a)가 하기로부터 선택된 방법을 포함하는 것인 방법:
    i) WAP5.1 대립유전자의 DNA에 혼성화하는 하나 이상의 올리고뉴클레오티드 프라이머를 사용한 WAP5.1 대립유전자의 적어도 일부의 증폭,
    ii) WAP5.1 대립유전자의 DNA의 적어도 일부에 대한 하나 이상의 올리고뉴클레오티드 프로브의 혼성화,
    iii) WAP5.1 대립유전자의 DNA, mRNA 또는 cDNA의 시퀀싱.
KR1020237015642A 2020-10-12 2021-10-04 단위결과성 수박 식물 KR20230085165A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP20201337.1 2020-10-12
EP20201337 2020-10-12
US202063111898P 2020-11-10 2020-11-10
US63/111,898 2020-11-10
US202063117223P 2020-11-23 2020-11-23
US63/117,223 2020-11-23
PCT/EP2021/077239 WO2022078792A1 (en) 2020-10-12 2021-10-04 Parthenocarpic watermelon plants

Publications (1)

Publication Number Publication Date
KR20230085165A true KR20230085165A (ko) 2023-06-13

Family

ID=78049260

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237015642A KR20230085165A (ko) 2020-10-12 2021-10-04 단위결과성 수박 식물

Country Status (9)

Country Link
US (1) US20230371453A1 (ko)
EP (1) EP4225020A1 (ko)
JP (1) JP2023544432A (ko)
KR (1) KR20230085165A (ko)
CN (1) CN116390646A (ko)
AU (1) AU2021359680A1 (ko)
IL (1) IL302009A (ko)
MX (1) MX2023004203A (ko)
WO (1) WO2022078792A1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2022301661A1 (en) 2021-06-30 2024-02-08 Nunhems B.V. Methods for selecting watermelon plants and plant parts comprising a modified dwarf14 gene

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
GB0510979D0 (en) 2005-05-28 2005-07-06 Kbiosciences Ltd Detection system for PCR assay
MX2013005856A (es) 2010-11-24 2013-12-06 Nunhems Bv Sandias polinizadoras de doble proposito.
US10316369B2 (en) 2014-06-27 2019-06-11 Seminis Vegetable Seeds, Inc. Methods and assays for male sterile watermelon
US10745710B2 (en) * 2015-08-06 2020-08-18 University Of Tsukuba Plant having mutant cyclin F-box gene
EA201892624A1 (ru) 2016-05-26 2019-06-28 Нунхемс Б.В. Растения, дающие бессемянные плоды
AU2017336342B2 (en) 2016-09-30 2023-09-21 Nunhems B.V. Parthenocarpic watermelon plants
WO2019238832A1 (en) 2018-06-15 2019-12-19 Nunhems B.V. Seedless watermelon plants comprising modifications in an abc transporter gene

Also Published As

Publication number Publication date
IL302009A (en) 2023-06-01
MX2023004203A (es) 2023-05-17
US20230371453A1 (en) 2023-11-23
AU2021359680A1 (en) 2023-06-15
WO2022078792A1 (en) 2022-04-21
JP2023544432A (ja) 2023-10-23
AU2021359680A9 (en) 2024-02-08
EP4225020A1 (en) 2023-08-16
CN116390646A (zh) 2023-07-04

Similar Documents

Publication Publication Date Title
AU2017336342B2 (en) Parthenocarpic watermelon plants
KR20230098337A (ko) 단위결과성 수박 식물
CN113365494B (zh) 能够发生种子败育型的果实形成的茄子科植物
US20230371453A1 (en) Parthenocarpic watermelon plants
US20230404007A1 (en) Parthenocarpic watermelon plants
US20240164270A1 (en) Watermelon gene conferring a high number of male flowers
US11987799B2 (en) Downy mildew resistance in Cucurbitaceae plants
US20230323385A1 (en) Plants with improved nematode resistance
US20230189732A1 (en) Didymella bryoniae internal fruit rot resistance in cucumis sativus plants
OA21227A (en) Parthenocarpic watermelon plants.
OA21301A (en) Parthenocarpic watermelon plants.
CN116615098A (zh) 单性结实西瓜植物
KR20240029040A (ko) 변형된 dwarf14 유전자를 포함하는 수박 식물 및 식물 부분을 선택하는 방법
JP2024523647A (ja) 改変dwarf14遺伝子を含むスイカ植物及び植物部分を選択する方法
CN117677286A (zh) 用于选择包含修饰的dwarf14基因的西瓜植物和植物部分的方法