KR102174017B1 - Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof - Google Patents

Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof Download PDF

Info

Publication number
KR102174017B1
KR102174017B1 KR1020190103645A KR20190103645A KR102174017B1 KR 102174017 B1 KR102174017 B1 KR 102174017B1 KR 1020190103645 A KR1020190103645 A KR 1020190103645A KR 20190103645 A KR20190103645 A KR 20190103645A KR 102174017 B1 KR102174017 B1 KR 102174017B1
Authority
KR
South Korea
Prior art keywords
ccs
gene
mutations
mutation
color
Prior art date
Application number
KR1020190103645A
Other languages
Korean (ko)
Inventor
강병철
정효봉
Original Assignee
서울대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 서울대학교산학협력단 filed Critical 서울대학교산학협력단
Priority to KR1020190103645A priority Critical patent/KR102174017B1/en
Application granted granted Critical
Publication of KR102174017B1 publication Critical patent/KR102174017B1/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

The present invention relates to: a composition for predicting a color of full ripe fruit of Capsicum sp. genetic resources, comprising, as active ingredients, an oligonucleotide capable of detecting a mutation of a phytoene synthase 1 (PSY1) gene derived from pepper consisting of the nucleotide sequence of SEQ ID NO: 1 and an oligonucleotide capable of detecting a mutation of a capsanthin-capsorubin synthase (CCS) gene derived from pepper consisting of the nucleotide sequence of SEQ ID NO: 2; and a use thereof.

Description

캡시큠 속 유전자원의 완숙과색 예측용 조성물 및 이의 용도{Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof}Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof}

본 발명은 캡시큠 속 유전자원의 완숙과색 예측용 조성물 및 이의 용도에 관한 것이다.The present invention relates to a composition for predicting ripeness and color of genetic resources in capsicum genus, and to a use thereof.

다양한 고추의 완숙과색은 엽록소의 분해와 함께 진행되는 카로티노이드의 축적에 기인한다. 카로티노이드는 탄소 40개로 구성된 폴리엔(polyene) 골격을 전형으로 하는 이소프레노이드(isoprenoids)의 소집단에 속한다. 카로티노이드는 식물 내에서 광합성과 광 보호를 비롯하여 다양한 필수적 역할을 수행한다. 또한 이 화합물은 아스코르브산(abscisic acid, ABA)과 스트리고락톤(strigolactone)을 비롯한 식물 호르몬 합성의 전구체를 제공하기도 한다. 한편, 카로티노이드 생합성 경로와 이에 관련된 효소들은 가지과 작물에서 특히 잘 규명되어 있다. 카로티노이드 생합성은 PSY(phytoene synthase)에 의해 파이토엔(phytoene)이 합성되면서부터 시작된다. 이후 연속적인 불포화 및 이성질화 반응을 거쳐 파이토엔은 완숙 토마토 과실의 주요 성분인 라이코펜(lycopene)이 된다. 토마토의 적색은 라이코펜의 축적에 의한 것인 반면, 고추의 적색은 캡산틴(capsanthin)과 캡소루빈(capsorubin)의 축적에 기인하는데, 이러한 고추 특이적인 반응은 CCS(capsanthin-capsorubin synthase)라는 효소에 의해 조절된다. 해당 효소는 안테라크산틴(antheraxanthin)과 비올라키산틴(violaxanthin)을 각각 캡산틴과 캡소루빈으로 전환시킨다.The ripening and color of various peppers is due to the accumulation of carotenoids that proceed with the breakdown of chlorophyll. Carotenoids belong to a subgroup of isoprenoids, typical of a polyene skeleton composed of 40 carbons. Carotenoids play a variety of essential roles in plants, including photosynthesis and light protection. It also provides precursors for the synthesis of plant hormones, including ascorbic acid (ABA) and strigolactone. On the other hand, the carotenoid biosynthetic pathway and the enzymes related thereto are particularly well elucidated in eggplant crops. Carotenoid biosynthesis begins when phytoene is synthesized by PSY (phytoene synthase). Subsequently, through continuous unsaturation and isomerization reactions, phytoene becomes lycopene, a major component of ripe tomato fruit. The red color of tomatoes is due to the accumulation of lycopene, whereas the red color of peppers is due to the accumulation of capsanthin and capsorubin, and this pepper-specific reaction is caused by an enzyme called CCS (capsanthin-capsorubin synthase). Controlled by The enzyme converts anteraxanthin and violaxanthin into capxanthin and capsorubin, respectively.

고추 과색의 유전 현상을 설명하기 위하여 3유전자좌 모델 (Y, C1, C2)이 제시된 바 있다(Hurtado-Hernandez and Smith, (1985) J. Hered. 76, 211-213). 이후 카로티노이드 생합성 유전자의 후보 유전자 분석을 통해 YC2 유전자좌는 각각 CCS와 PSY1을 암호화함이 밝혀졌다. 하지만 마지막 유전자좌인 C1의 정체는 아직까지 밝혀지지 않았다. 이들 유전자좌의 규명 이래로, 많은 연구자들은 과색의 변이를 PSY1CCS 대립유전자의 변이를 통하여 설명하고자 노력해왔다. 일반적으로 노란색 과실을 가지는 고추는 CCS 암호화 부위에 구조적 변이가 발생하여 조기 종결 코돈을 형성한다고 알려져 있다. 하지만, CCS의 조기 종결은 캡시큠 안늄(Capsicum annuum) 'Fogo'에서와 같이 주황색 과실을 초래하기도 한다. 따라서 현재까지의 보고로는 CCS의 변이가 비록 과색에 결정적인 역할을 수행하지만 특정한 색을 규정짓지는 못함을 암시한다. 반면, 캡시큠 치넨세(C. chinense) 'Habanero'의 경우에는 PSY1의 스플라이싱 변이에 의해 해당 단백질의 활성이 손상되어 주황색 과실이 된다고 한다. 이러한 선행 연구들을 종합해 볼 때 PSY1CCS의 변이만으로는 고추의 과색 변이를 충분히 설명할 수 없다고 결론 내릴 수 있다. 따라서 마지막 유전자좌를 규명하여 기존의 3유전좌 모델을 보완하는 과정이 필요하며, 이러한 맥락에서 카로티노이드 생합성에 관여하는 다른 유전자들이 과색에 미치는 영향들을 연구해 오고 있다. 대표적으로 바이러스를 이용한 유전자 침묵(virus-induced gene silencing, VIGS)을 통해 캡산틴 생합성 유전자의 발현을 억제한 사례를 들 수 있는데, 해당 사례에서는 PSY1과 CCS 뿐만 아니라 Lcyb(Lycopene beta cyclase)와 CrtZ-2(Beta-carotene hydroxylase 1, chloroplastic) 또한 카로티노이드 생합성에 중요한 역할을 수행함을 입증하였다. 나아가 EMS(Ethyl methanesulfonate)를 이용하여 유기한 CrtZ-2 유전자 내 뉴클레오티드의 치환으로 인해 빨간색 캡시큠 안늄 'Maor'가 주황색이 된 사례도 존재하며, 착색이 증가하여 'high-pigment 3'이라는 이름이 붙여진 토마토 돌연변이체에서는 ZEP(zeaxanthin epoxidase)의 보존된 서열 내에 아미노산이 치환이 존재함이 보고되어 있다. 따라서 과색의 변이를 보다 명확하게 이해하기 위해서는 다양한 후보 카로티노이드 생합성 유전자의 철저한 분석이 필요하다고 할 수 있다.Three loci models ( Y , C1 , C2 ) have been proposed to explain the genetic phenomena of red pepper color (Hurtado-Hernandez and Smith, (1985) J. Hered. 76, 211-213). Afterwards, analysis of candidate genes for carotenoid biosynthesis genes revealed that the Y and C2 loci encode CCS and PSY1, respectively. However, the identity of the last locus, C1 , has not been identified. Since the identification of these loci, many researchers have tried to explain the hypercolor mutation through mutations in the PSY1 and CCS alleles. In general, it is known that red peppers with yellow fruits have structural mutations in the CCS coding region to form an early termination codon. However, early termination of CCS can also lead to orange fruit, as in Capsicum annuum'Fogo'. Therefore, reports to date imply that the variation of CCS , although playing a decisive role in hypercolor, does not define a specific color. On the other hand, in the case of C. chinense'Habanero ', the activity of the corresponding protein is impaired by the splicing mutation of PSY1 , resulting in orange fruit. From these previous studies, it can be concluded that the mutations in PSY1 and CCS alone cannot sufficiently explain the hyperchromic mutations in pepper. Therefore, it is necessary to identify the last locus to complement the existing trigenic locus model, and in this context, the effects of other genes involved in carotenoid biosynthesis on hypercolor have been studied. Representatively, there is a case of suppressing the expression of the capsantin biosynthetic gene through virus-induced gene silencing (VIGS). In this case, Lcyb (Lycopene beta cyclase) and CrtZ- as well as PSY1 and CCS. 2 (Beta-carotene hydroxylase 1, chloroplastic) also proved to play an important role in carotenoid biosynthesis. Furthermore, there are cases in which the red capsicum annium'Maor' became orange due to the substitution of nucleotides in the CrtZ-2 gene organic by using EMS (Ethyl methanesulfonate), and the name'high- pigment 3'was renamed due to increased coloring. In the pasted tomato mutant, it has been reported that amino acid substitutions exist in the conserved sequence of ZEP (zeaxanthin epoxidase). Therefore, it can be said that a thorough analysis of various candidate carotenoid biosynthetic genes is necessary to more clearly understand the color variation.

차세대 염기서열 분석법(next-generation sequencing, NGS)은 전체 유전체의 해독을 가능케 했으며, 유전 연구와 작물 육종 분야에 혁신을 불러왔다. 차세대 염기서열 분석법은 또한 다양한 시료에서 특정 유전자 부위나 후보 유전자의 변이를 탐색하는 데에도 활용된다. 이러한 맥락에서 목표 염기서열 분석법(targeted sequencing)이라고도 불리는 이 기술은 부분 특이적인 프라이머를 이용한 1차 증폭과 각각의 시료들에 바코드 서열을 부여하는 2차 증폭을 통하여 이루어진다. 그러나 Illumina사의 차세대 염기서열 분석법은 짧은 길이의 리드들만이 얻어지기 때문에 목표 부위의 온전한 서열을 모두 확보하기에는 제한이 따른다. 이러한 문제는 Pacific BioSciences사에서 개발된 single-molecule real-time(이하, SMRT) 염기서열 분석법을 통하여 해결할 수 있다. SMRT 염기서열 분석법은 일반적으로 10 kb가 넘는 리드 길이를 자랑하며, 다른 염기서열 분석법보다 실행 시간이 빠르다는 장점이 있다. 만약 목표로 하는 유전자의 길이가 10 kb보다 짧을 경우, 목표 유전자 서열은 한 번의 실행을 통하여 확보할 수 있다.Next-generation sequencing (NGS) has made it possible to decipher the entire genome and has revolutionized genetic research and crop breeding. Next-generation sequencing methods are also used to search for mutations in specific gene sites or candidate genes in a variety of samples. In this context, this technique, also called targeted sequencing, is achieved through a first amplification using a partially specific primer and a second amplification that gives a barcode sequence to each sample. However, since Illumina's next-generation sequencing method only obtains short-length reads, it is limited to secure all of the intact sequence of the target site. This problem can be solved through the single-molecule real-time (hereinafter, SMRT) sequencing method developed by Pacific BioSciences. The SMRT sequencing method generally boasts a read length of more than 10 kb, and has the advantage of faster execution time than other sequencing methods. If the length of the target gene is shorter than 10 kb, the target gene sequence can be obtained through one run.

한편, 한국공개특허 제2018-0065785호에는 '루테인 및 베타카로틴 함량이 높은 고추 판별용 마커'가 개시되어 있고, 한국등록특허 제0331183호에는 '고추의 빨간색 결정에 관여하는 psy 변형유전자 및 그를 이용한 선발육종방법'이 개시되어 있으나, 본 발명의 캡시큠 속 유전자원의 완숙과색 예측용 조성물 및 이의 용도에 대해서는 기재된 바가 없다.On the other hand, Korean Patent Publication No. 2018-0065785 discloses a'marker for discriminating peppers with a high lutein and beta-carotene content', and Korean Patent No. 0331183 discloses'Psy modified genes involved in red crystals of peppers and Although the'selective breeding method' is disclosed, there is no description of the composition for predicting ripeness and color of genetic resources in the capsicum genus of the present invention and the use thereof.

본 발명은 상기와 같은 요구에 의해 도출된 것으로서, 본 발명자들은 SMRT 염기서열 분석법을 통해 94종의 캡시큠 속 유전자원에서 PSY1, PSY2, Lcyb, CrtZ-2, ZEP, CCS 암호화 부위 내 변이들을 신속하게 분석하였고, 대표적인 유전자원을 선발하여 UPLC(ultra-performance liquid chromatography)를 시행함으로써 대립유전자의 변이와 과색간의 연관성을 조사하였다. 그 결과, 서로 다른 조합의 PSY1CCS의 변이들은 비적색 과색의 유전자원들에서 카로티노이드 함량의 변이를 설명할 수 있음을 알 수 있었고, 특히, PSY1/ccs 유전형을 가지는 특정 크로마토그램 그룹에서, 카로틴(carotene), 크립토잔틴(cryptoxanthin), 제아잔틴(zeaxanthin)의 함량을 기준으로 두 개의 소집단으로 세분화되었다. 상기 결과를 통해 SMRT 염기서열 분석법이 많은 개수의 시료를 대상으로 하더라도 목표 부위 내의 유전적 변이들을 성공적으로 검출할 수 있음을 입증함으로써, 본 발명을 완성하였다.The present invention was derived from the above requirements, and the present inventors quickly identified mutations within the PSY1 , PSY2 , Lcyb , CrtZ-2 , ZEP , and CCS coding sites in 94 types of capsicum gene sources through SMRT sequencing. Then, representative genetic resources were selected and UPLC (ultra-performance liquid chromatography) was performed to investigate the relationship between the allele mutation and hypercolor. As a result, it was found that the mutations of PSY1 and CCS in different combinations could explain the variance in carotenoid content in non-red and hyper-colored genetic resources.In particular, in a specific chromatogram group having a PSY1/ccs genotype, carotene (carotene), cryptoxanthin, and zeaxanthin were subdivided into two subgroups based on the content. Through the above results, the present invention was completed by demonstrating that the SMRT sequencing method can successfully detect genetic variations in the target site even when targeting a large number of samples.

상기 과제를 해결하기 위해, 본 발명은 서열번호 1의 염기서열로 이루어진 고추 유래의 PSY1(phytoene synthase 1) 유전자의 변이를 검출할 수 있는 올리고뉴클레오티드 및 서열번호 2의 염기서열로 이루어진 고추 유래의 CCS(capsanthin-capsorubin synthase) 유전자의 변이를 검출할 수 있는 올리고뉴클레오티드를 유효성분으로 포함하는, 캡시큠 속(Capsicum) 유전자원의 완숙과색 예측용 조성물을 제공한다.In order to solve the above problem, the present invention is an oligonucleotide capable of detecting a mutation in the PSY1 ( phytoene synthase 1 ) gene derived from pepper consisting of the nucleotide sequence of SEQ ID NO: 1 and CCS derived from pepper consisting of the nucleotide sequence of SEQ ID NO: 2 (capsanthin-capsorubin synthase) provides a mature color and composition of the prediction kaepsi kyum in (Capsicum) genetic resources, including the oligonucleotide that is capable of detecting a mutation of a gene nucleotide as an active ingredient.

또한, 본 발명은 상기 조성물을 포함하는, 캡시큠 속(Capsicum) 유전자원의 완숙과색 예측용 키트를 제공한다.In addition, the present invention provides a kit for predicting maturity and color of the genetic resources of the genus Capsicum , including the composition.

또한, 본 발명은 서열번호 1의 염기서열로 이루어진 고추 유래의 PSY1(phytoene synthase 1) 유전자 및 서열번호 2의 염기서열로 이루어진 고추 유래의 CCS(capsanthin-capsorubin synthase) 유전자의 유전형을 결정하는 단계;를 포함하는, 캡시큠 속(Capsicum) 유전자원의 완숙과색 예측 방법을 제공한다.In addition, the present invention comprises the steps of determining the genotype of the red pepper-derived PSY1 ( phytoene synthase 1 ) gene consisting of the nucleotide sequence of SEQ ID NO: 1 and the red pepper-derived CCS ( capsanthin-capsorubin synthase ) gene consisting of the nucleotide sequence of SEQ ID NO: 2; Comprising, Capsicum genus ( Capsicum ) provides a method for predicting maturity and color of genetic resources.

본 발명에서 탐색된 PSY1, PSY2, Lcyb, CrtZ-2, ZEP, CCS 암호화 부위 내 변이들은 고추자원에서 과색을 예측하기 위한 분자표지(molecular marker) 개발에 유용하게 사용될 수 있을 것으로 기대되며, 고추의 카로티노이드 생합성 과정을 연구하는 데에도 활용될 것으로 기대된다.The mutations in the PSY1 , PSY2 , Lcyb , CrtZ-2 , ZEP , and CCS coding regions explored in the present invention are expected to be useful in the development of molecular markers for predicting hypercolor in red pepper resources. It is also expected to be used to study the process of carotenoid biosynthesis.

도 1은 SMRT 염기서열 분석을 위한 라이브러리 구축 과정을 나타낸 것으로, SMRT 염기서열 분석법은 총 5단계로 구성되어 있다. 먼저 유전자 특이적 결합 서열과 범용 태그 서열이 포함되어 있는 프라이머를 이용하여 목표 유전자 부위를 증폭시킨다. 이 후 범용 태그 서열과 함께 각 시료를 구분하기 위한 바코드 서열이 포함된 프라이머로 2차 증폭을 실시한다. 최종 라이브러리는 증폭산물들을 혼합하여 구성하는데, 이 때 헤어핀 어댑터를 부착하여 연속적으로 서열분석을 할 수 있도록 한다. 연파랑과 연주황 정사각형은 각각 1차 중합효소 연쇄반응에 사용된 범용 태그를 나타내며, 진파랑 진주황 정사각형은 2차 중합효소 연쇄반응에 사용된 바코드 서열을 나타낸다.
도 2는 PSY1 CCS 유전자의 구조와 캡시큠(Capsicum) 유전자원 간의 암호화 부위 비교 결과로, 검정 사각형과 굵은 선은 각각 엑손과 인트론을 나타낸다. 엑손 부분 내의 변이들 중에서 아미노산 서열의 변화를 초래하는 경우에 한하여 대립유전자 이름을 부여하였다. 인트론 부분에 발생한 삽입/결실 변이는 그 위치만을 표시하였다. ATG와 TGA는 각각 개시코돈과 종결코돈을 나타내며, 숫자는 cDNA 서열 상에서의 뉴클레오티드 위치를 나타낸다. (a) PSY1은 6개의 엑손과 5개의 인트론으로 구성되어 있으며, 총 13개의 돌연변이형 대립유전자가 발견되었다. 붙임표(-)는 조기 종결코돈을 형성시키는 1 bp 결실을 나타내며, 속이 빈 역삼각형(▽)은 2 bp 삽입에 의해 발생된 구조이동돌연변이(frame shift)를 나타낸다. (b) CCS는 단일 엑손으로 구성되어 있으며, 총 13종의 대립유전자 변이가 발견되었다. 별표(*)는 정지돌연변이에 의해 형성된 종결코돈을 의미한다. 붙임표(-)는 조기 종결코돈을 형성시키는 1 bp 결실을 의미하며, 속이 빈 역삼각형(▽), 속이 채워진 역삼각형(▼), 체크(√) 표시는 각각 1, 8, 76 bp 삽입을 나타낸다. 해당 삽입 변이들은 구조이동돌연변이를 유발한다.
도 3은 PSY2 Lcyb 유전자의 구조와 캡시큠 유전자원 간의 암호화 부위 비교 결과로, 검정 사각형과 굵은 선은 각각 엑손과 인트론을 나타내며, 엑손 내 변이들 중에서 아미노산 서열의 변화를 가져올 것으로 예상되는 변이만 대립유전자 이름을 부여하였다. 인트론 내 삽입/결실 변이는 오직 위치만을 표시하였다. ATG와 TGA/TAA는 각각 개시코돈과 종결코돈을 나타내며, 숫자는 cDNA 서열 상에서의 뉴클레오티드 위치를 의미한다. (a) PSY2는 6개의 엑손과 5개의 인트론으로 구성되어 있으며, 3개의 대립유전자 변이가 발견되었다. (b) Lcyb의 경우 단일 엑손으로 구성되어 있으며, 7개의 변이가 발견되었다. 붙임표(-)는 12 bp 결실을 가리킨다.
도 4는 CrtZ-2 ZEP 유전자의 구조와 캡시큠 유전자원 간의 암호화 부위 비교 결과로, 검정 사각형과 굵은 선은 각각 엑손과 인트론을 나타내며, 엑손 내 변이들 중에서 아미노산 서열의 변화를 가져올 것으로 예상되는 변이만 대립유전자 이름을 부여하였다. 인트론 내 삽입/결실 변이는 오직 위치만을 표시하였으며, ZEP의 경우 공간상 제약으로 생략하였다. ATG와 TGA/TAA는 각각 개시코돈과 종결코돈을 나타내며, 숫자는 cDNA 서열 상에서의 뉴클레오티드 위치를 의미한다. (a) CrtZ-2는 7개의 엑손과 6개의 인트론으로 구성되어 있으며, 총 11개의 변이가 검출되었다. (b) ZEP는 16개의 엑손과 15개의 인트론으로 구성되어 있으며, 총 16개의 변이가 발견되었다.
도 5는 비적색 캡시큠 유전자원에서 발견된 CCS의 프로모터 및 암호화 부위 내 구조적 돌연변이를 모식화하였다. 속이 비어있는 사각형과 검정색 사각형은 각각 프로모터와 암호화 부위을 나타내며, 물음표와 함께 회색 음영으로 표시된 부분은 서열이 완전히 분석되지 않은 구역을 나타낸다. ccs-p1에는 -3,686 nt에서부터 1,193 nt까지의 4,879 bp가 결실되어 있으며, ccs-p2에는 -3,010부터 -42 nt까지의 2,968 bp가 결실되어 있다. ccs-p3에는 여러 크기의 삽입과 결실이 존재한다. 끝으로 ccs-in 대립유전자는 898 nt에 2,828 bp의 삽입이 존재한다. 검정색 역삼각형(▼)과 속이 비어있는 역삼각형(▽)은 각각 결실과 삽입을 나타낸다. 검정 화살표는 프라이머의 결합 부위를 나타낸다.
도 6은 43종의 유전자원을 대상으로 작성한 10종류 카로티노이드 heatmap이다. 각 사각형의 색은 카로티노이드의 절대량을 반영하며, 이 때 각 성분의 함량은 모식도 우측 하단에 위치한 비례(scale)에 따라 파랑부터 빨강에 이르기까지의 색의 강도로 표현되어 진다. 그룹 숫자는 좌측 열에 기재되어 있으며, PSY1CCS를 기반으로 표현한 유전형은 우측 열에 기재되어 있다. 카로티노이드의 이름은 첫 세 글자로 축약하여 나타내었다. 크로마토그램 군과 유전형은 4종의 유전자원(ACN 38, 79, 7, 67)을 제외하고 높은 연관성을 보이고 있다.
1 shows a library construction process for SMRT sequencing analysis, and the SMRT sequencing method consists of a total of 5 steps. First, a target gene site is amplified using a primer containing a gene-specific binding sequence and a universal tag sequence. After that, secondary amplification is performed with a primer containing a universal tag sequence and a barcode sequence for distinguishing each sample. The final library is composed by mixing the amplification products, and at this time, a hairpin adapter is attached to enable sequential sequencing. The light blue and the yellow pearl squares each represent a general purpose tag used in the first polymerase chain reaction, and the deep blue pearl yellow squares represent the barcode sequence used in the second polymerase chain reaction.
2 is a result of comparison of coding regions between the structure of the PSY1 and CCS genes and the Capsicum gene source, and the black squares and the thick lines represent exons and introns, respectively. The allele name was given only in the case of causing a change in the amino acid sequence among the mutations in the exon portion. Insertion/deletion mutations occurring in the intron portion were indicated only at that location. ATG and TGA represent the start and stop codons, respectively, and the numbers represent the nucleotide positions on the cDNA sequence. (a) PSY1 consists of 6 exons and 5 introns, and a total of 13 mutant alleles were found. The asterisk (-) represents the 1 bp deletion that forms the early termination codon, and the hollow inverted triangle (▽) represents the frame shift caused by the 2 bp insertion. (b) CCS consists of a single exon, and a total of 13 allelic mutations were found. The asterisk (*) means the stop codon formed by the stop mutation. The asterisk (-) indicates a 1 bp deletion that forms an early termination codon, and a hollow inverted triangle (▽), a filled inverted triangle (▼), and a check (√) indicate 1, 8, and 76 bp insertions, respectively. . These insertional mutations cause structural migration mutations.
3 is a result of comparing the structure of the PSY2 and Lcyb genes and the coding region between the capsicum gene source, and the black square and the bold line represent exons and introns, respectively, and only mutations expected to bring about changes in amino acid sequence among mutations in exons Allele names were given. Insertion/deletion mutations within the intron indicated only the location. ATG and TGA/TAA represent the start and stop codons, respectively, and the numbers represent the nucleotide positions on the cDNA sequence. (a) PSY2 consists of 6 exons and 5 introns, and 3 allelic mutations were found. (b) Lcyb consists of a single exon, and 7 mutations were found. An asterisk (-) indicates a 12 bp deletion.
4 is a result of comparing the structure of the CrtZ-2 and ZEP genes and the coding region between the capsicum gene source, and the black square and the bold line represent exons and introns, respectively, and are expected to bring about a change in amino acid sequence among mutations in exons. Only the mutation was given an allele name. Only the position of the insertion/deletion mutation in the intron was indicated, and the ZEP was omitted due to space constraints. ATG and TGA/TAA represent the start and stop codons, respectively, and the numbers represent the nucleotide positions on the cDNA sequence. (a) CrtZ-2 consists of 7 exons and 6 introns, and a total of 11 mutations were detected. (b) ZEP consists of 16 exons and 15 introns, and a total of 16 mutations were found.
5 schematically illustrates structural mutations in the promoter and coding region of CCS found in the non-red capsicum gene source. The hollow squares and the black squares represent the promoter and the coding region, respectively, and the gray-shaded regions with question marks represent regions where the sequence has not been fully analyzed. 4,879 bp from -3,686 nt to 1,193 nt are deleted in ccs-p1 , and 2,968 bp from -3,010 to -42 nt are deleted in ccs-p2 . There are several sizes of insertions and deletions in ccs-p3 . Finally, the ccs-in allele has an insertion of 2,828 bp at 898 nt. The black inverted triangle (▼) and the hollow inverted triangle (▽) represent deletion and insertion, respectively. Black arrows indicate the binding sites of the primers.
6 is a heatmap of 10 types of carotenoids prepared for 43 types of genetic resources. The color of each square reflects the absolute amount of carotenoid, and the content of each component is expressed as the intensity of color from blue to red according to the scale located at the bottom right of the schematic diagram. Group numbers are listed in the left column, and genotypes expressed based on PSY1 and CCS are listed in the right column. The names of carotenoids are abbreviated to the first three letters. The chromatogram group and genotype are highly correlated except for the four gene sources (ACN 38, 79, 7, 67).

본 발명의 목적을 달성하기 위하여, 본 발명은 서열번호 1의 염기서열로 이루어진 고추 유래의 PSY1(phytoene synthase 1) 유전자의 변이를 검출할 수 있는 올리고뉴클레오티드 및 서열번호 2의 염기서열로 이루어진 고추 유래의 CCS(capsanthin-capsorubin synthase) 유전자의 변이를 검출할 수 있는 올리고뉴클레오티드를 유효성분으로 포함하는, 캡시큠 속(Capsicum) 유전자원의 완숙과색 예측용 조성물을 제공한다.In order to achieve the object of the present invention, the present invention is derived from pepper consisting of an oligonucleotide capable of detecting a mutation of the PSY1 ( phytoene synthase 1 ) gene derived from pepper consisting of the nucleotide sequence of SEQ ID NO: 1 and the nucleotide sequence of SEQ ID NO: 2 of CCS (capsanthin-capsorubin synthase) provides a mature color and composition of the prediction kaepsi kyum in (Capsicum) genetic resources, including the oligonucleotide that is capable of detecting a mutation of a gene nucleotide as an active ingredient.

본 발명에 따른 캡시큠 속 유전자원의 완숙과색 예측용 조성물에 있어서, 상기 PSY1 유전자 변이는 서열번호 1의 염기서열 중 120번째 염기가 결실되거나 679번째 염기 아데닌(A)이 티민(T)으로 치환된 것일 수 있으나, 이에 제한되지 않는다.In the composition for predicting ripeness and color of genetic resources in Capsicum according to the present invention, the PSY1 gene mutation is the 120th base of the nucleotide sequence of SEQ ID NO: 1 is deleted or the 679th base adenine (A) is thymine (T). It may be substituted, but is not limited thereto.

또한, 본 발명에 따른 캡시큠 속 유전자원의 완숙과색 예측용 조성물에 있어서, 상기 CCS 유전자 변이는 서열번호 2의 염기서열 중 374번째 염기 구아닌(G)이 아데닌(A)으로 치환; 599번째 염기 시토신(C)이 아데닌으로 치환; 883번째 염기 구아닌이 티민으로 치환; 1,009번째 염기 결실; 1,265번째 염기 결실; 및 1,337번째 염기 구아닌이 아데닌으로 치환;된 변이로 이루어진 군으로부터 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.In addition, in the composition for predicting maturity and color of genetic resources in the genus Capsicum according to the present invention, the CCS gene mutation is the 374th base guanine (G) of the nucleotide sequence of SEQ ID NO: 2 is substituted with adenine (A); The 599th base cytosine (C) is substituted with adenine; Guanine at position 883 is substituted with thymine; 1,009th base deletion; Base deletion at 1,265th base; And 1,337th base guanine substituted with adenine; may be one or more selected from the group consisting of mutations, but is not limited thereto.

본 발명의 상기 PSY1CCS 유전자 변이는 단백질 암호화 서열 내 특정 염기의 치환 또는 결실에 의해 조기종결 또는 정지 돌연변이가 발생하여 각 유전자의 기능 상실을 유도하는 knock-out 돌연변이를 의미할 수 있으나, 상기 돌연변이로 그 범위를 제한하지는 않는다.The mutations in the PSY1 and CCS genes of the present invention may refer to knock-out mutations inducing the loss of function of each gene due to the occurrence of an early termination or stop mutation due to substitution or deletion of a specific base in the protein coding sequence, but the mutation It does not limit its scope.

본 발명에 따른 캡시큠 속 유전자원의 완숙과색 예측용 조성물에 있어서, 상기 유전자의 변이를 검출할 수 있는 올리고뉴클레오티드는 각 유전자의 변이 염기를 포함하는 염기서열을 증폭할 수 있는 프라이머, 각 유전자의 변이 염기와 혼성화될 수 있는 프로브 및 이들의 조합으로 이루어진 군으로부터 선택되는 하나 이상일 수 있으나, 이에 제한되지 않는다.In the composition for predicting maturity and color of genetic resources in capsicum according to the present invention, the oligonucleotide capable of detecting the mutation of the gene is a primer capable of amplifying a nucleotide sequence including the mutation base of each gene, each gene It may be one or more selected from the group consisting of probes capable of hybridizing with mutant bases and combinations thereof, but is not limited thereto.

본 발명에서, 용어 "프라이머"는 짧은 자유 3말단 수산화기(free 3' hydroxyl group)를 가지는 핵산 서열로 상보적인 주형(template)과 염기쌍(base pair)을 형성할 수 있고 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 핵산 서열을 의미한다. 프라이머는 적절한 완충용액 및 온도에서 중합반응(즉, DNA 중합효소 또는 역전사효소)을 위한 시약 및 상이한 4가지 뉴클레오사이드 트리포스페이트의 존재하에서 DNA 합성을 개시할 수 있다. PCR 조건, 센스 및 안티센스 프라이머의 길이는 당업계에 공지된 것을 기초로 변형할 수 있다.In the present invention, the term "primer" is a nucleic acid sequence having a short free 3'hydroxyl group, which can form a complementary template and a base pair, and is the starting point for template strand copying. It refers to a short nucleic acid sequence that functions as. Primers can initiate DNA synthesis in the presence of reagents for polymerization (ie, DNA polymerase or reverse transcriptase) and four different nucleoside triphosphates at an appropriate buffer and temperature. The PCR conditions, the length of the sense and antisense primers can be modified based on those known in the art.

본 발명에서, 용어 "프로브"란 mRNA와 특이적 결합을 이룰 수 있는 짧게는 수 염기 내지 길게는 수백 염기에 해당하는 RNA 또는 DNA 등의 핵산 단편을 의미하며 라벨링 되어 있어서 특정 mRNA의 존재 유무를 확인할 수 있다. 프로브는 올리고뉴클로타이드(oligonucleotide) 프로브, 단쇄 DNA(single stranded DNA) 프로브, 이중쇄 DNA(double stranded DNA) 프로브, RNA 프로브 등의 형태로 제작될 수 있다. 적당한 프로브의 선택 및 혼성화 조건은 당업계에 공지된 것을 기초로 변형할 수 있다.In the present invention, the term "probe" refers to a nucleic acid fragment such as RNA or DNA corresponding to a few bases to a few hundred bases for a specific binding to mRNA, and is labeled to confirm the presence or absence of a specific mRNA. I can. The probe may be manufactured in the form of an oligonucleotide probe, a single stranded DNA probe, a double stranded DNA probe, or an RNA probe. Selection of suitable probes and conditions for hybridization can be modified based on those known in the art.

본 발명의 프라이머 또는 프로브는 포스포르아미다이트 고체 지지체 방법, 또는 기타 널리 공지된 방법을 사용하여 화학적으로 합성할 수 있다. 이러한 핵산 서열은 또한 당해 분야에 공지된 많은 수단을 이용하여 변형시킬 수 있다. 이러한 변형의 비-제한적인 예로는 메틸화, 캡화, 천연 뉴클레오타이드 하나 이상의 동족체로의 치환, 및 뉴클레오타이드 간의 변형, 예를 들면, 하전되지 않은 연결체(예: 메틸 포스포네이트, 포스포트리에스테르, 포스포로아미데이트, 카바메이트 등) 또는 하전된 연결체(예: 포스포로티오에이트, 포스포로디티오에이트 등)로의 변형이 있다.The primers or probes of the present invention can be chemically synthesized using the phosphoramidite solid support method, or other well known methods. Such nucleic acid sequences can also be modified using a number of means known in the art. Non-limiting examples of such modifications include methylation, encapsulation, substitution of one or more homologs of natural nucleotides, and modifications between nucleotides, e.g., uncharged linkers (e.g., methyl phosphonate, phosphorester, phosphoro Amidates, carbamates, etc.) or to charged linkers (eg phosphorothioate, phosphorodithioate, etc.).

본 발명은 또한, 본 발명에 따른 상기 조성물을 포함하는, 캡시큠 속(Capsicum) 유전자원의 완숙과색 예측용 키트를 제공한다.The present invention also provides a kit for predicting maturity and color of the genetic source of Capsicum , comprising the composition according to the present invention.

본 발명의 키트는 서열번호 1의 염기서열로 이루어진 고추 유래의 PSY1(phytoene synthase 1) 유전자 및 서열번호 2의 염기서열로 이루어진 고추 유래의 CCS(capsanthin-capsorubin synthase) 유전자의 변이를 검출함으로써 캡시큠 속(Capsicum) 유전자원의 완숙과색을 예측할 수 있다. 본 발명의 캡시큠 속 유전자원의 완숙과색을 예측용 키트에는 PSY1CCS 유전자 변이를 검출하기 위한 프라이머, 프로브 뿐만 아니라 분석 방법에 적합한 한 종류 또는 그 이상의 다른 구성 성분 조성물, 용액 또는 장치가 포함될 수 있다.The kit of the present invention detects a mutation in the PSY1 ( phytoene synthase 1 ) gene derived from pepper consisting of the nucleotide sequence of SEQ ID NO: 1 and the CCS ( capsanthin-capsorubin synthase ) gene derived from pepper consisting of the nucleotide sequence of SEQ ID NO: 2 It is possible to predict the ripeness and color of the genus ( Capsicum ) genetic resources. The kit for predicting ripeness and color of genetic resources in the capsicum of the present invention includes primers and probes for detecting PSY1 and CCS gene mutations, as well as one or more other constituent compositions, solutions, or devices suitable for analysis methods. I can.

본 발명의 키트가 RT-PCR 키트일 경우, PSY1CCS 유전자의 변이에 대해 특이적인 각각의 프라이머 세트 외에도 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액(pH 및 마그네슘 농도는 다양), 데옥시뉴클레오타이드(dNTPs), Taq-중합효소 및 역전사효소와 같은 효소, DNase, RNAse 억제제, DEPC-수(DEPC-water), 멸균수 등을 포함할 수 있다. 또한 정량 대조구로 사용되는 유전자에 특이적인 프라이머 세트를 포함할 수 있다. 또한 본 발명의 키트는 DNA 칩을 수행하기 위해 필요한 필수 요소를 포함하는 진단용 키트일 수 있다. DNA 칩 키트는, 유전자 또는 그의 단편에 해당하는 cDNA가 프로브로 부착되어 있는 기판, 및 형광표식 프로브를 제작하기 위한 시약, 제제, 효소 등을 포함할 수 있다. 또한, 기판은 정량 대조구 유전자 또는 그의 단편에 해당하는 cDNA를 포함할 수 있다.When the kit of the present invention is an RT-PCR kit, a test tube or other suitable container, reaction buffer (various pH and magnesium concentration), deoxynucleotide (dNTPs), in addition to each primer set specific for mutations in PSY1 and CCS genes. ), enzymes such as Taq-polymerase and reverse transcriptase, DNase, RNAse inhibitor, DEPC-water, sterile water, and the like. In addition, a primer set specific to a gene used as a quantitative control may be included. In addition, the kit of the present invention may be a diagnostic kit including essential elements necessary to perform a DNA chip. The DNA chip kit may include a substrate to which cDNA corresponding to a gene or a fragment thereof is attached as a probe, and reagents, agents, enzymes, etc. for producing a fluorescently labeled probe. In addition, the substrate may include cDNA corresponding to a quantitative control gene or a fragment thereof.

본 발명은 또한, 서열번호 1의 염기서열로 이루어진 고추 유래의 PSY1(phytoene synthase 1) 유전자 및 서열번호 2의 염기서열로 이루어진 고추 유래의 CCS(capsanthin-capsorubin synthase) 유전자의 유전형을 결정하는 단계;를 포함하는, 캡시큠 속(Capsicum) 유전자원의 완숙과색 예측 방법을 제공한다.The present invention further comprises the steps of determining the genotype of the red pepper-derived PSY1 ( phytoene synthase 1 ) gene consisting of the nucleotide sequence of SEQ ID NO: 1 and the red pepper-derived CCS ( capsanthin-capsorubin synthase ) gene consisting of the nucleotide sequence of SEQ ID NO: 2; Comprising, Capsicum genus ( Capsicum ) provides a method for predicting maturity and color of genetic resources.

본 발명에 따른 완숙과색 예측 방법에 있어서, 유전자의 유전형 결정 방법은 시퀀싱 분석일 수 있으나, 이에 제한되지 않으며, 당업계에 공지된 다양한 기술을 통해 이루어질 수 있다.In the method for predicting ripeness and color according to the present invention, the method for determining the genotype of a gene may be sequencing analysis, but is not limited thereto, and may be performed through various techniques known in the art.

본 발명의 일 구현 예에 따른 캡시큠 속 유전자원의 완숙과색 예측 방법에 있어서, 상기 PSY1CCS 유전자의 유전형이 PSY1/CCS일 경우 빨간색의 완숙과색; 상기 유전형이 psy1/CCS일 경우 진한 오렌지색(=진주황색), 오렌지색(=주황색) 또는 분홍색의 완숙과색; 상기 유전형이 PSY1/ccs일 경우 오렌지색, 밝은 오렌지색(=연주황색) 또는 노란색의 완숙과색; 및 상기 유전형이 psy1/ccs일 경우 밝은 노란색(=연황색) 또는 아이보리색(=상아색)의 완숙과색;으로 예측될 수 있다. 대문자 PSY1CCS는 야생형의 유전형을 의미하고, 소문자 psy1ccs는 돌연변이 유전형을 의미한다.In the method for predicting ripeness and color of genetic resources in capsicum according to an embodiment of the present invention, when the genotype of the PSY1 and CCS genes is PSY1 / CCS , the red color of ripeness; If the genotype is psy1 / CCS , then dark orange (= dark orange), orange (= orange) or pink ripe fruit color; When the genotype is PSY1 / ccs , it is orange, bright orange (=pale orange) or yellow ripe fruit color; And when the genotype is psy1 / ccs , it can be predicted as bright yellow (= light yellow) or ivory color (= ivory color). The uppercase letters PSY1 and CCS refer to the wild type genotype, and the lowercase letters psy1 and ccs refer to the mutant genotype.

상기 psy1 돌연변이 유전형은 서열번호 1의 염기서열 중 120번째 염기가 결실되거나 679번째 염기 아데닌(A)이 티민(T)으로 치환된 유전자를 포함하는 것일 수 있고, ccs 돌연변이 유전형은 서열번호 2의 염기서열 중 374번째 염기 구아닌(G)이 아데닌(A)으로 치환; 599번째 염기 시토신(C)이 아데닌으로 치환; 883번째 염기 구아닌이 티민으로 치환; 1,009번째 염기 결실; 1,265번째 염기 결실; 및 1,337번째 염기 구아닌이 아데닌으로 치환;된 변이로 이루어진 군으로부터 선택되는 하나 이상의 변이를 포함하는 유전자를 가지는 것일 수 있으나, 이에 제한되지 않는다.The psy1 mutant genotype may include a gene in which the 120th base of the nucleotide sequence of SEQ ID NO: 1 is deleted or the 679th base adenine (A) is substituted with thymine (T), and the ccs mutant genotype is the base of SEQ ID NO: 2 Guanine (G) at the 374th base in the sequence is substituted with adenine (A); The 599th base cytosine (C) is substituted with adenine; Guanine at position 883 is substituted with thymine; 1,009th base deletion; Base deletion at 1,265th base; And guanine at the 1,337th base is substituted with adenine; It may have a gene including one or more mutations selected from the group consisting of mutations, but is not limited thereto.

이하, 본 발명을 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.Hereinafter, the present invention will be described in detail by examples. However, the following examples are only illustrative of the present invention, and the contents of the present invention are not limited to the following examples.

재료 및 방법Materials and methods

1. 식물재료1. Plant material

캡시큠 안늄(C. annuum), 캡시큠 바카툼(C. baccatum), 캡시큠 차코엔세(C. chacoense), 캡시큠 치넨세(C. chinense), 캡시큠 엑시미움(C. eximium), 캡시큠 프루테센스(C. frutescens), 캡시큠 프래테르미슘(C. praetermissum), 캡시큠 푸베센스(C. pubescens)를 포함하여 총 94종의 유전자원이 사용되었다. 해당 유전자원들은 농업유전자원센터에서 분양받았으며, 이 중 62종의 유전자원은 캡시큠 안늄에 속한다. 모든 식물체는 서울대학교 부속 실험농장에서 재배하였다. 유전자원의 과색은 QPcard 203에 명시되어 있는 색을 바탕으로 총 8개의 그룹으로 분류하였으며, 그 색은 빨강, 진주황, 주황, 연주황, 노랑, 연노랑, 상아(ivory), 분홍으로 구성된다. C. annuum , C. baccatum, C. chacoense , C. chinense , C. eximium , C. eximium , A total of 94 genetic resources were used, including C. frutescens , C. praetermissum , and C. pubescens . These genetic resources were sold at the Agricultural Genetic Resource Center, of which 62 species belong to capsicum annium. All plants were cultivated in an experimental farm attached to Seoul National University. The color of the genetic resources is classified into 8 groups based on the color specified in QPcard 203, and the colors are composed of red, pearly yellow, orange, golden yellow, yellow, light yellow, ivory, and pink.

2. SMRT 염기서열 분석을 위한 라이브러리 구성2. Library construction for SMRT sequencing analysis

100 ng의 DNA 주형과 10 pmol의 유전자 특이적 프라이머를 이용하여 중합효소연쇄반응(polymerase chain reaction, PCR)을 진행하였다. 유사한 신뢰도의 염기서열 분석 결과를 확보하기 위해 각각의 프라이머들은 유사한 크기의 산물을 증폭시킬 수 있도록 설계되었다. 라이브러리 구축은 총 2단계에 걸친 중합효소 연쇄반응을 통하여 이루어졌다(도 1). 먼저 1차 증폭을 통해 목표 유전자 부위를 증폭시켰는데, 해당 프라이머에는 2차 증폭에서 사용할 프라이머가 결합하는 데에 필요한 공통 서열을 포함하고 있다(표 1). 1차 중합효소 연쇄반응 조건은 다음과 같다. 95℃에서 4분간 가열한 이후, 95℃ 30초, 55℃ 30초, 72℃ 1분 40초 세 조건으로 구성된 프로그램을 35회 반복하였다. 2차 증폭은 1차 증폭산물을 주형으로 하여 진행하는데, 해당 프라이머에는 각각의 시료들을 구별할 수 있도록 바코드 서열이 포함되어 있다. 2차 PCR 조건은 다음과 같다. 95℃에서 4분간 가열한 이후, 95℃ 30초, 60℃ 30초, 72℃ 1분 50초 세 조건으로 구성된 프로그램을 30회 반복하였다. 2단계에 걸친 증폭을 거쳐 얻어진 산물은 QiaQuick PCR 정제 키트를 사용하여 정제한 다음, NanoDrop을 이용하여 정량하였다. 측정한 농도를 바탕으로 모든 산물이 동일한 양이 포함되도록 계산한 다음 단일 튜브에 혼합하였다.A polymerase chain reaction (PCR) was performed using 100 ng of a DNA template and 10 pmol of a gene-specific primer. Each primer was designed to amplify products of similar size in order to secure a sequence analysis result with similar reliability. The library was constructed through a polymerase chain reaction over a total of two steps (Fig. 1). First, the target gene site was amplified through primary amplification, and the primers contain a common sequence necessary for binding of the primers to be used in the secondary amplification (Table 1). The conditions for the first polymerase chain reaction are as follows. After heating at 95°C for 4 minutes, a program consisting of three conditions of 95°C for 30 seconds, 55°C for 30 seconds, and 72°C for 1 minute and 40 seconds was repeated 35 times. The second amplification proceeds using the first amplification product as a template, and the primer contains a barcode sequence to distinguish each sample. The secondary PCR conditions are as follows. After heating at 95° C. for 4 minutes, a program consisting of three conditions of 95° C. 30 seconds, 60° C. 30 seconds, and 72° C. 1 minute 50 seconds was repeated 30 times. The product obtained through amplification over two steps was purified using a QiaQuick PCR purification kit, and then quantified using NanoDrop. Based on the measured concentration, all products were calculated to contain the same amount and then mixed in a single tube.

본 발명에서 사용된 프라이머 정보Primer information used in the present invention 이름name 서열정보(5'→3') (서열번호)Sequence information (5'→3') (SEQ ID NO) 목표 유전자Target gene PSY1-P1-pacbio-FPSY1-P1-pacbio-F TCGTCGGCAGCGTCGAGGTCGCTATAGGAGCCGA (3) TCGTCGGCAGCGTC GAGGTCGCTATAGGAGCCGA (3) N-PSY1N-PSY1 PSY1-P1-pacbio-RPSY1-P1-pacbio-R GTCTCGTGGGCTCGGAACCCAACCGTACCAGCAAC (4) GTCTCGTGGGCTCGG AACCCAACCGTACCAGCAAC (4) PSY1-P2-pacbio-FPSY1-P2-pacbio-F TCGTCGGCAGCGTCCTGTTTCACAGTTTTGCGAACTC (5) TCGTCGGCAGCGTC CTGTTTCACAGTTTTGCGAACTC (5) C-PSY1C-PSY1 PSY1-P2-pacbio-RPSY1-P2-pacbio-R GTCTCGTGGGCTCGGTATTGGCTTCATTGGCCTTG (6) GTCTCGTGGGCTCGG TATTGGCTTCATTGGCCTTG (6) PSY2-P1-pacbio-FPSY2-P1-pacbio-F TCGTCGGCAGCGTCTGGGATAAACTAGGCTGAGGTG (7) TCGTCGGCAGCGTC TGGGATAAACTAGGCTGAGGTG (7) N-PSY2N-PSY2 PSY2-P1-pacbio-RPSY2-P1-pacbio-R GTCTCGTGGGCTCGGCAACTGGAAATCTGGAAACG (8) GTCTCGTGGGCTCGG CAACTGGAAATCTGGAAACG (8) PSY2-P2-pacbio-FPSY2-P2-pacbio-F TCGTCGGCAGCGTCGGTGCAGGAGAACTGATGAG (9) TCGTCGGCAGCGTC GGTGCAGGAGAACTGATGAG (9) C-PSY2C-PSY2 PSY2-P2-pacbio-RPSY2-P2-pacbio-R GTCTCGTGGGCTCGGCATTCATGTCTTTGTTAGTGAAGA (10) GTCTCGTGGGCTCGG CATTCATGTCTTTGTTAGTGAAGA (10) LCYB-pacbio-FLCYB-pacbio-F TCGTCGGCAGCGTCAGGACCCCATTTGCTGTTTT (11) TCGTCGGCAGCGTC AGGACCCCATTTGCTGTTTT (11) LcybLcyb LCYB-pacbio-RLCYB-pacbio-R GTCTCGTGGGCTCGGTCCGATCATTCTCCCGAGTT (12) GTCTCGTGGGCTCGG TCCGATCATTCTCCCGAGTT (12) CRTZ2-P1-pacbio-FCRTZ2-P1-pacbio-F TCGTCGGCAGCGTCCCTGTGCATCAAGTCCTATTCA (13) TCGTCGGCAGCGTC CCTGTGCATCAAGTCCTATTCA (13) N-CrtZ-2N-CrtZ-2 CRTZ2-P1-pacbio-RCRTZ2-P1-pacbio-R GTCTCGTGGGCTCGGATGAGAACACGTACAGCGCC (14) GTCTCGTGGGCTCGG ATGAGAACACGTACAGCGCC (14) CRTZ2-P2-pacbio-FCRTZ2-P2-pacbio-F TCGTCGGCAGCGTCGCCCTAACCTTTTTCCCAAA (15) TCGTCGGCAGCGTC GCCCTAACCTTTTTCCCAAA (15) C-CrtZ-2C-CrtZ-2 CRTZ2-P2-pacbio-RCRTZ2-P2-pacbio-R GTCTCGTGGGCTCGGGCTGCTTTTTCGTGGTGTTC (16) GTCTCGTGGGCTCGG GCTGCTTTTTCGTGGTGTTC (16) ZEP-P1-pacbio-FZEP-P1-pacbio-F TCGTCGGCAGCGTCTCCTTTCACTTCCTTTGGCCT (17) TCGTCGGCAGCGTC TCCTTTCACTTCCTTTGGCCT (17) N-ZEPN-ZEP ZEP-P1-pacbio-RZEP-P1-pacbio-R GTCTCGTGGGCTCGGAGCTTCACTGTGTCCGAACA (18) GTCTCGTGGGCTCGG AGCTTCACTGTGTCCGAACA (18) ZEP-P2-pacbio-FZEP-P2-pacbio-F TCGTCGGCAGCGTCCAAACATTTCCGTTGTGTTG (19) TCGTCGGCAGCGTC CAAACATTTCCGTTGTGTTG (19) M-ZEPM-ZEP ZEP-P2-pacbio-RZEP-P2-pacbio-R GTCTCGTGGGCTCGGCAAACCACAGGATATCAACTTCC (20) GTCTCGTGGGCTCGG CAAACCACAGGATATCAACTTCC (20) ZEP-P3-pacbio-FZEP-P3-pacbio-F TCGTCGGCAGCGTCGGACTTGGGAATGCCTCTAATG (21) TCGTCGGCAGCGTC GGACTTGGGAATGCCTCTAATG (21) C-ZEPC-ZEP ZEP-P3-pacbio-RZEP-P3-pacbio-R GTCTCGTGGGCTCGGATGCTGTACAAATTTCCCGTTT (22) GTCTCGTGGGCTCGG ATGCTGTACAAATTTCCCGTTT (22) CCS-pacbio-FCCS-pacbio-F TCGTCGGCAGCGTCTGATTCCCCTAGTTCGGTATTTC (23) TCGTCGGCAGCGTC TGATTCCCCTAGTTCGGTATTTC (23) CCSCCS CCS-pacbio-RCCS-pacbio-R GTCTCGTGGGCTCGGGCTTTTGTTTCACTTTTGCATTG (24) GTCTCGTGGGCTCGG GCTTTTGTTTCACTTTTGCATTG (24) CDF4000CDF4000 CCCCTGGCACACCACTCTTGGAGCC (25)CCCCTGGCACACCACTCTTGGAGCC (25) CCSCCS 밑줄 친 서열은 범용 태그 서열을 나타낸다.The underlined sequence represents the universal tag sequence.

3. SMRT 염기서열 분석3. SMRT sequence analysis

총 6개의 카로티노이드 생합성 유전자를 분석하기 위해 2차례에 걸친 SMRT 염기서열 분석을 진행하였다. PSY1, Lcyb, CrtZ-2 CCS의 경우 P5-C3 chemistry 방식을 이용하여 (주)마크로젠에서 분석을 실시하였으며, PSY2ZEP의 경우 P6-C4 chemistry 방식에 근거하여 DNA Link에서 분석을 진행하였다. SMRT bell library는 상기 2.에서 완성된 라이브러리의 말단 교정, 연결, 핵산말단 분해효소 정제 과정을 거쳐 제작되었다. 끝으로 25℃에서 4시간 동안 SMRT bell library와 중합효소 분자를 반응시킨 다음, 이로써 완성된 중합효소-주형 복합체를 SMRT cell에 고정시켰다. SMRT cell에는 zero-mode waveguide(ZMW)가 포함되어 있으며, 해당 부분에서 염기서열 분석이 진행되며 리드들을 생산해 내게 된다.In order to analyze a total of 6 carotenoid biosynthetic genes, SMRT sequencing was performed twice. In the case of PSY1 , Lcyb , CrtZ-2 and CCS , the analysis was performed in Macrogen Co., Ltd. using the P5-C3 chemistry method, and in the case of PSY2 and ZEP , the analysis was performed in DNA Link based on the P6-C4 chemistry method. The SMRT bell library was produced through the process of end-calibration, ligation, and nucleic acid-terminating enzyme purification of the library completed in 2 above. Finally, the SMRT bell library and the polymerase molecule were reacted at 25° C. for 4 hours, and the polymerase-template complex thus completed was immobilized on the SMRT cell. The SMRT cell contains a zero-mode waveguide (ZMW), and sequencing is performed in that part to produce reads.

4. 염기서열 분석결과 가공4. Processing of nucleotide sequence analysis results

SMRT 염기서열 분석을 통하여 얻어진 정보들은 SMRT 분석 소프트웨어 v2.3.0을 이용하여 처리하였다. 먼저 가공되지 않은 상태의 리드들을 필터링한 다음, 역다중화(demultiplexing) 과정을 거쳐 각각의 시료별 리드로 분리하였다. 그 후 시료별 리드들을 6개의 카로티노이드 생합성 유전자의 참고 서열에 대조하였다. 해당 과정에서의 기본 설정은 SMRT Portal에 포함된 RS_Resequencing_Barcode.1 프로토콜을 참고하였다. 최소 포함범위(coverage) 및 신뢰도 20 이상의 변이만을 이후 분석에 사용하였으며, Quiver를 이용하여 각 유전자별 일치 서열과 변이들을 추출하였다.Information obtained through SMRT sequencing was processed using SMRT analysis software v2.3.0. First, the unprocessed leads were filtered, and then separated into leads for each sample through a demultiplexing process. Then, the reads for each sample were compared to the reference sequences of 6 carotenoid biosynthetic genes. For the basic setting in this process, refer to the RS_Resequencing_Barcode.1 protocol included in SMRT Portal. Only mutations with a minimum coverage and reliability of 20 or more were used for subsequent analysis, and matching sequences and mutations for each gene were extracted using Quiver.

5. 카로티노이드 추출 및 검화(saponification)5. Carotenoid extraction and saponification

완숙 단계의 과실을 수확한 뒤 태좌를 제외한 과피 시료만을 확보하였다. 카로티노이드 색소의 추출은 아세톤을 이용하여 진행하였으나(Collera-Zuniga et al., (2005) Food Chem. 90, 109-114), 첨가하는 용매의 부피를 조건에 맞게 조절하였다. 동결건조 및 분쇄가 완료된 시료 1 g당 아세톤 20 mL를 첨가한 뒤 4℃에서 20시간 동안 정치하여 색소를 추출하였다. 이후 추출액을 질소 농축기를 이용하여 건조시킨 다음 아세톤 3 mL, 메탄올 3 mL, 30% 수산화칼륨/메탄올 혼합액 1 mL를 첨가한 뒤 2시간 30분 간 암실 상태에서 반응시켰다. 해당 검화 과정이 완료된 후에는 추출액을 분획여두에 옮겨 주었다. 이후 20 mL의 다이에틸에테르(diethyl ether)를 첨가하여 섞어준 다음 정치하여 층 분리를 유도하였다. 추가적으로 10% 염화칼슘 혼합액 2 mL와 2% 황산나트륨 혼합액 2 mL를 차례대로 첨가하여 층 분리를 유도하고 다이에틸에테르층에 잔존하는 수분을 모두 제거하였다. 최종적으로 얻어진 다이에틸에테르는 진공 농축기를 이용하여 완전히 증발시킨 다음, 아세톤 2 mL를 이용하여 재용해시켰다. 재용해가 완료된 시료는 UPLC 분석 전에 앞서 Acrodisc 주사기 필터(0.2 μm)를 이용하여 여과시켰다.After harvesting the fruits at the ripening stage, only the skin samples excluding the placenta were obtained. Extraction of the carotenoid pigment was performed using acetone (Collera-Zuniga et al., (2005) Food Chem. 90, 109-114), but the volume of the added solvent was adjusted according to the conditions. After adding 20 mL of acetone per 1 g of freeze-dried and pulverized sample, it was allowed to stand at 4° C. for 20 hours to extract the pigment. Thereafter, the extract was dried using a nitrogen concentrator, and then 3 mL of acetone, 3 mL of methanol, and 1 mL of a 30% potassium hydroxide/methanol mixture were added and reacted in a dark room for 2 hours and 30 minutes. After the saponification process was completed, the extract was transferred to the fractionation filter. Thereafter, 20 mL of diethyl ether was added, mixed, and allowed to stand to induce layer separation. In addition, 2 mL of a 10% calcium chloride mixture and 2 mL of a 2% sodium sulfate mixture were sequentially added to induce layer separation, and all water remaining in the diethyl ether layer was removed. The finally obtained diethyl ether was completely evaporated using a vacuum concentrator, and then re-dissolved with 2 mL of acetone. Samples that had been redissolved were filtered using an Acrodisc syringe filter (0.2 μm) before UPLC analysis.

6. UPLC를 통한 카로티노이드 분석6. Carotenoid analysis through UPLC

카로티노이드는 Acquity UPLC-H-Class 시스템을 이용하여 분석하였으며, 성분의 분리를 위하여 T3 컬럼(1.8 μm)을 사용하였다. 이동상으로는 아세토니트릴/메탄올/메틸렌클로라이드(methylene chloride)가 65/25/10의 부피비로 혼합된 A상과 증류수로 구성된 B상을 이용하였다. 시간 별 A/B 이동상의 조성은 선행 연구의 조건을 따랐으며, UV 파장은 450 nm로 설정하였다(Kim et al., (2016) Food Chem. 201, 64-71). 카로티노이드의 정성 및 정량 분석을 위하여 Sigma-Aldrich에서 10종의 카로티노이드 표준품을 구매하였으며, 해당 카로티노이드는 안테라크산틴(antheraxanthin), 캡산틴(capsanthin), 루테인(lutein), 네오크산틴(neoxanthin), 비올라키산틴(violaxanthin), 제아잔틴(zeaxanthin), 알파-카로틴(α-carotene), 알파-크립토잔틴(α-cryptoxanthin), 베타-카로틴 및 베타-크립토잔틴을 포함한다.Carotenoids were analyzed using the Acquity UPLC-H-Class system, and a T3 column (1.8 μm) was used to separate components. As the mobile phase, phase B composed of acetonitrile/methanol/methylene chloride in a volume ratio of 65/25/10 and distilled water was used. The composition of the A/B mobile phase over time followed the conditions of the previous study, and the UV wavelength was set to 450 nm (Kim et al., (2016) Food Chem. 201, 64-71). For the qualitative and quantitative analysis of carotenoids, 10 carotenoid standards were purchased from Sigma-Aldrich, and the carotenoids were anteraxanthin, capsanthin, lutein, neoxanthin, and viola. Violaxanthin, zeaxanthin, alpha-carotene, alpha-cryptoxanthin, beta-carotene and beta-cryptoxanthin.

실시예 1. SMRT 염기서열 분석을 위한 라이브러리 구축Example 1. Library construction for SMRT sequencing analysis

SMRT 염기서열 분석을 진행하기 위해 총 6개의 카로티노이드 생합성 유전자를 대상으로 라이브러리를 구축하였다. PSY1은 6개의 엑손으로 구성되어 있으며, 암호화 서열(coding sequence)의 길이는 1,260 bp이다. PSY1의 N-말단과 C-말단 부위를 증폭시키기 위해 2쌍의 프라이머를 설계하였으며, 해당 프라이머를 사용하여 PCR을 진행할 경우 각각 1,695 bp와 1,690 bp의 산물을 확보할 수 있다. 총 94종의 유전자원 중에서 75종과 74종의 유전자원에서만 예상 크기의 증폭산물을 얻을 수 있었다. 하지만 C. baccatum 유전자원 ACN 64의 경우 양 말단에서 예상과 다른 크기의 증폭산물이 얻어졌으며, 18종과 19종의 유전자원에서는 N-말단과 C-말단에서 증폭산물 자체를 얻을 수 없었다. 다음으로 PSY2는 6개의 엑손으로 구성되어 있으며 1,299 bp의 암호화 서열로 구성되어 있다. PSY1과 마찬가지로 2쌍의 프라이머를 설계하였으며, 각 말단의 예상 PCR 증폭산물의 크기는 모두 1,623 bp이다. 모든 유전자원에서 예상과 동일한 형태의 증폭이 이루어졌다. 세 번째로 Lcyb의 경우 1,497 bp의 단일 엑손으로 구성되어 있으며, 1,706 bp의 단편을 확보할 수 있도록 프라이머를 설계하였다. 총 90종의 유전자원에서 예상 크기의 증폭산물이 얻어졌으나, 나머지 4종의 C. annuum 유전자원(ACN 4, 15, 53, 58)에서는 증폭산물을 확보할 수 없었다. 네 번째로 CrtZ-2의 경우 7개의 엑손으로 구성되어 있으며 암호화 서열은 948 bp에 달한다. 각 말단을 증폭시키기 위하여 두 쌍의 프라이머를 설계하였으며, 예상 증폭산물의 크기는 1,677 bp와 1,634 bp이다. N-말단의 경우, 75종에서는 예상 크기의 밴드가 확보되었으나 17종의 유전자원에서는 보다 큰 밴드가, 2종의 유전자원(C. annuum ACN 27, C. baccatum ACN 69)에서는 보다 작은 크기의 밴드가 얻어졌다. C-말단의 경우 모든 유전자원에서 기대했던 바와 같은 증폭이 이루어졌다. 다섯 번째로 ZEP의 경우 16개의 엑손으로 구성되어 있으며, 1,986 bp의 암호화 서열로 구성되어 있다. 모든 유전자의 단편이 유사한 범위 내의 길이를 가지게 하기 위하여 ZEP의 경우 N-말단, 중앙부, C-말단을 증폭시키기 위한 3쌍의 프라이머를 설계하였으며, 각각 1,760 bp, 1,709 bp, 1,704 bp의 단편을 증폭시킨다. 모든 유전자원에서 예외 없이 예상 크기의 밴드가 확보되었다. 끝으로 CCS의 경우 1,497 bp의 단일 엑손으로 구성되어 있으며, 1,674 bp의 증폭산물을 확보할 수 있도록 프라이머를 설계하였다. 62종의 유전자원에서만 예상 크기의 밴드가 확보되었으며, 32종의 유전자원에서는 증폭산물을 얻을 수 없었다. 본 발명에서는 정상적인 크기의 밴드들만을 대상으로 바코드 서열을 부착하는 2차 중합효소연쇄반응을 진행하였으며, 이를 혼합하여 도 1과 같은 절차를 거쳐 SMRT 염기서열 분석을 진행하였다.In order to proceed with SMRT sequencing, a library was constructed for a total of 6 carotenoid biosynthetic genes. PSY1 consists of 6 exons, and the length of the coding sequence is 1,260 bp. Two pairs of primers were designed to amplify the N-terminal and C-terminal regions of PSY1 , and when PCR is performed using the primers, products of 1,695 bp and 1,690 bp, respectively, can be obtained. Of a total of 94 genetic resources, only 75 and 74 genetic resources were able to obtain an amplification product of the expected size. However, in the case of the C. baccatum gene source ACN 64, an amplification product of a different size than expected was obtained at both ends, and the amplification product itself could not be obtained at the N-terminus and C-terminus in 18 and 19 genetic resources. Next, PSY2 is composed of 6 exons and a coding sequence of 1,299 bp. Like PSY1 , two pairs of primers were designed, and the size of the expected PCR amplification products at each end was all 1,623 bp. The same type of amplification as expected was achieved in all genetic resources. Third, Lcyb consists of a single exon of 1,497 bp, and a primer was designed to obtain a fragment of 1,706 bp. Amplification products of expected size were obtained from a total of 90 genetic resources, but the amplification products could not be obtained from the remaining four C. annuum genetic resources (ACN 4, 15, 53, 58). Fourth, in the case of CrtZ-2 , it consists of 7 exons and the coding sequence reaches 948 bp. Two pairs of primers were designed to amplify each end, and the sizes of the expected amplification products are 1,677 bp and 1,634 bp. In the case of the N-terminus, a band of the expected size was secured in 75 species, but a larger band in 17 genetic resources and a smaller size in two genetic resources ( C. annuum ACN 27, C. baccatum ACN 69). The band was obtained. In the case of the C-terminus, amplification was achieved as expected for all genetic resources. Fifth, in the case of ZEP , it consists of 16 exons, and consists of a coding sequence of 1,986 bp. In order to ensure that all gene fragments have a length within a similar range, in the case of ZEP , three pairs of primers were designed to amplify the N-terminus, the central part, and the C-terminus, respectively, amplifying the fragments of 1,760 bp, 1,709 bp and 1,704 bp Let it. Bands of the expected size were obtained without exception in all genetic resources. Finally, in the case of CCS , it is composed of a single exon of 1,497 bp, and a primer was designed to secure an amplification product of 1,674 bp. Bands of the expected size were secured only in 62 genetic resources, and amplification products could not be obtained from 32 genetic resources. In the present invention, a secondary polymerase chain reaction was performed in which a barcode sequence was attached to only normal-sized bands, and the mixture was mixed and SMRT sequence analysis was performed through the procedure shown in FIG. 1.

실시예 2. SMRT 염기서열 분석 및 대립유전자 변이 분석Example 2. SMRT sequence analysis and allele mutation analysis

6개의 카로티노이드 생합성 유전자에서 모두 충분한 정보를 확보할 수 있도록 2개의 SMRT cell을 이용하여 염기서열 분석을 진행하였다. 첫 번째 cell을 이용하여 PSY1, Lcyb, CrtZ-2 CCS의 서열을 분석한 결과 300,584개의 가공되지 않은 리드들을 확보할 수 있었으며, 필터링 과정을 거쳐 94,318개의 리드를 추려낼 수 있었다. 평균 리드의 길이는 13,551 bp이었으며, 전체 데이터의 크기는 1,278,193,633 bp이었다. 다음으로 두 번째 cell을 이용하여 PSY2ZEP의 서열을 분석한 결과, 150,292개의 가공되지 않은 리드들을 얻을 수 있었으며, 필터링 과정을 거쳐 108,181개의 리드만을 선별해 내었다. 해당 리드들의 평균 길이는 18,871 bp이었으며, 전체 데이터의 크기는 2,041,520,976 bp이었다. 해당 리드들은 각 유전자별 참고 서열에 대조하였는데, 최소 포함범위 및 신뢰도가 20을 초과하는 데이터만을 추후 분석에 활용하였다. 적색 완숙과색을 가지는 유전자원에서 발견된 단일염기다형성(single nucleotide polymorphism, SNP) 변이와 삽입/결실 (insertion/deletion, indel) 변이들은 모두 제거되었다.Sequence analysis was performed using two SMRT cells to obtain sufficient information from all six carotenoid biosynthetic genes. As a result of analyzing the sequence of PSY1 , Lcyb , CrtZ-2, and CCS using the first cell, 300,584 raw reads were obtained, and 94,318 reads were selected through a filtering process. The average read length was 13,551 bp, and the total data size was 1,278,193,633 bp. Next, as a result of analyzing the sequence of PSY2 and ZEP using the second cell, 150,292 unprocessed reads were obtained, and only 108,181 reads were selected through a filtering process. The average length of the reads was 18,871 bp, and the size of the total data was 2,041,520,976 bp. The reads were compared to the reference sequence for each gene, and only data with a minimum coverage and reliability exceeding 20 were used for later analysis. Single nucleotide polymorphism (SNP) mutations and insertion/deletion (indel) mutations found in genetic resources with red ripeness and color were all removed.

2-1. 2-1. PSY1PSY1 대립유전자 내 변이 Variation within alleles

SMRT 염기서열 분석을 통하여 PSY1의 엑손과 인트론 내 각각 36개와 60개의 변이들을 검출할 수 있었다. 총 96개의 변이들 중에, 엑손에 존재하면서 아미노산 서열의 변화로 귀결되는 변이와 인트론에 존재하는 삽입/결실 변이만을 도 2a에 나타내었다. 또한 엑손 부위에서 발견된 대립유전자 변이들은 변이가 발생한 위치를 기준으로 이름을 부여하였다. PSY1 암호화 서열에서 발견된 12개의 변이들 중에서 9개는 과오돌연변이(missense mutation)이었다. 나머지 3개의 변이들 중 2개는 구조이동돌연변이(frame-shift mutation)이었고, 마지막 1개는 정지돌연변이(nonsense mutation)이었다. 120번째 뉴클레오티드(nucleotide, nt) 위치에 발생한 1 bp 결실로 인한 구조이동돌연변이는 psy1-c5로 이름 붙여졌으며, 해당 변이는 3종의 C. frutescens 유전자원(ACN 87, 90, 91)에서만 발견되었다. 다른 구조이동돌연변이인 psy1-c10의 경우, 714번째 nt에 발생한 2 bp 삽입에 의한 것으로 2종의 C. chinense 유전자원(ACN 79, 80)과 1종의 C. frutescens 유전자원(ACN 88)에서만 발견되었다. 끝으로 679번째 nt에 발생한 정지돌연변이는 오직 2종의 C. chinense 유전자원(ACN 81, 82)에서만 발견되었다.Through SMRT sequencing analysis, 36 and 60 mutations in the exon and intron of PSY1 were detected, respectively. Among a total of 96 mutations, only the mutations present in the exon resulting in a change in the amino acid sequence and the insertion/deletion mutations present in the intron are shown in FIG. 2A. In addition, the allelic mutations found in the exon were given names based on the location of the mutation. Of the 12 mutations found in the PSY1 coding sequence, 9 were missense mutations. Of the remaining three mutations, two were frame-shift mutations, and the last one was a nonsense mutation. The structural shift mutation due to the 1 bp deletion occurring at the 120th nucleotide (nt) position was named psy1-c5 , and the mutation was found only in three C. frutescens genetic resources (ACN 87, 90, 91). . In the case of psy1-c10 , another structure-shifting mutation, it was caused by 2 bp insertion at the 714th nt, and only in two C. chinense gene sources (ACN 79, 80) and one C. frutescens gene source (ACN 88). Was found. Finally, the stop mutation occurring at 679th nt was found only in two C. chinense gene sources (ACN 81, 82).

2-2. 2-2. CCSCCS 대립유전자 내 변이 Variation within alleles

SMRT 시퀀싱을 통해 CCS 내에서 총 29개의 변이들을 탐색할 수 있었다. 이들 중 6개의 구조이동돌연변이, 4개의 정지돌연변이, 3개의 과오돌연변이를 포함한 13개의 변이가 아미노산 서열의 변화를 유발하였다(도 2b). 가장 빈번하게 발견된 변이는 ccs-3라고 이미 이름 붙여진 구조이동돌연변이였다. 이 변이는 1,265번째 nt에 발생한 1 bp 결실에 의한 것으로 18종의 C. annuum 유전자원과 1종의 C. baccatum 유전자원(ACN 67)에서 발견되었다. 그 다음으로 빈번하게 검출된 돌연변이는 1,024번째 nt에 발생한 1 bp 삽입에 의한 구조이동돌연변이(ccs-c7)로서 5종의 C. annuum 유전자원(ACN 16, 21, 23, 41, 61)에서 발견되었다. 또 다른 구조이동돌연변이인 ccs-c11의 경우 1,431번째 nt에 발생한 8 bp 삽입에 의한 것으로서 1종의 C. annuum 유전자원(ACN 47)과 1종의 C. chinense 유전자원(ACN 77)에서 확인되었다. 정지돌연변이 중에서 599번째 nt에 발생한 ccs-c3는 2종의 C. chinense 유전자원(ACN 75, 76)와 2종의 C. frutescens 유전자원(ACN 90, 91)에서 발견되었다. 하지만 나머지 변이들의 경우, 소수의 제한된 유전자원에서만 발견되었기 때문에 종 특이적 경향을 논하기 어려웠다. ccs-c2, ccs-c6, ccs-c10을 포함한 3개의 구조이동돌연변이는 오직 1개씩의 유전자원, 각 ACN 94, 67, 78에서만 발견되었다. 마찬가지로 ccs-c1, ccs-c5, ccs-c9를 포함한 3개의 정지돌연변이 또한 1개씩의 유전자원, 각 ACN 89, 36, 38에서만 발견되었다. 위에서 논한 10개의 녹아웃(knockout) 변이들 중, ccs-c3, ccs-3, ccs-c11의 경우 이미 보고된 바 있다.SMRT sequencing was able to detect a total of 29 mutations within CCS . Among these, 13 mutations, including 6 structural shift mutations, 4 stop mutations, and 3 overmutations, induced changes in the amino acid sequence (FIG. 2B). The most frequently found mutation was the structural shift mutation, already named ccs-3. This mutation was caused by a 1 bp deletion occurring at 1,265 nt, and was found in 18 C. annuum gene sources and one C. baccatum gene source (ACN 67). The next frequently detected mutation was a structural shift mutation ( ccs-c7 ) by 1 bp insertion occurring at the 1,024th nt, and was found in five C. annuum genetic resources (ACN 16, 21, 23, 41, 61). Became. In the case of ccs-c11 , another structure-shifting mutation, it was identified in one C. annuum gene source (ACN 47) and one C. chinense gene source (ACN 77) as a result of 8 bp insertion occurring at the 1,431th nt. . Of the quiescent mutations, ccs-c3 , which occurred at the 599th nt, was found in two C. chinense gene sources (ACN 75 and 76) and two C. frutescens gene sources (ACN 90 and 91). However, for the rest of the mutations, it was difficult to discuss species-specific trends because they were found only in a few limited genetic resources. Three conformational mutations, including ccs-c2 , ccs-c6 , and ccs-c10 , were found in only one gene source, ACN 94, 67, and 78, respectively. Similarly, three stop mutations, including ccs-c1 , ccs-c5 , and ccs-c9, were also found only in one gene source, ACN 89, 36, and 38, respectively. Of the 10 knockout mutations discussed above, ccs-c3 , ccs-3 , and ccs-c11 have already been reported.

2-3. 2-3. PSY2PSY2 대립유전자 내 변이 Variation within alleles

SMRT 염기서열 분석을 통하여 PSY2의 엑손과 인트론 내 각각 7개와 20개의 변이들을 검출할 수 있었다. 주목할 만한 점이 있다면, 다른 유전자들에 비하여 발견된 변이의 수가 상당히 적었다. 7개의 엑손 내 변이들 중 3개만이 아미노산의 변화를 가져왔지만, 모두 조기 종결코돈을 형성하지는 않았다(도 3a). 첫 번째 엑손에서 발견된 과오돌연변이인 psy2-c1은 2종의 C. chinense 유전자원(ACN 79, 80)에서만 발견되었으며, 다섯 번째 엑손에서 발견된 또 다른 과오돌연변이인 psy2-c3은 2종의 C. pubescens 유전자원(ACN 93, 94)에서 발견되었다.Through SMRT sequence analysis, 7 and 20 mutations in the exon and intron of PSY2 were detected, respectively. Notably, compared to other genes, the number of mutations found was significantly smaller. Only 3 of the 7 exon mutations brought about a change in amino acid, but all did not form an early stop codon (FIG. 3A). Psy2-c1 , an over- mutant found in the first exon, was only found in two C. chinense gene sources (ACN 79, 80), and psy2-c3 , another over- mutant found in the fifth exon, was found in two C. pubescens genetic resources (ACN 93, 94).

2-4. 2-4. LcybLcyb 대립유전자 내 변이 Variation within alleles

SMRT 염기서열 분석을 통하여 Lcyb 내 31 종류의 대립유전자 변이를 검출할 수 있었으나, 이 중 7개만이 아미노산의 변화를 초래하였다(도 3b). 대부분의 변이는 과오돌연변이였으나 lcyb-c1의 경우 140번째 nt 위치에 12 bp 결실이 일어난 구조이동돌연변이에 해당되었다. 해당 변이는 2종의 C. pubescens 유전자원(ACN 93, 94)에서 발견되었다. 나아가 16종의 C. annuum 유전자원에서 특이적으로 발견된 변이(lcyb-c6)도 존재했으며, 해당 변이는 아미노산 서열 상 379번에 위치한 아스파라긴이 아스파라트산으로 전환되는 변이였다. lcyb-c6 변이를 보유하고 있는 유전자원은 분홍부터 주황에 이르기까지의 다양한 과색을 나타내었다.Through SMRT sequencing analysis, 31 kinds of allelic mutations in Lcyb could be detected, but only 7 of them resulted in amino acid changes (FIG. 3B). Most of the mutations were over-error mutations, but in the case of lcyb-c1 , a 12 bp deletion occurred at the 140 th nt position. This mutation was found in two C. pubescens genetic resources (ACN 93, 94). Furthermore, there was also a mutation ( lcyb-c6 ) specifically found in 16 C. annuum genetic resources, and the mutation was a mutation in which asparagine located at 379 on the amino acid sequence was converted to aspartic acid. Genetic resources carrying the lcyb-c6 mutation showed a variety of hypercolors , ranging from pink to orange.

2-5. 2-5. CrtZ-2CrtZ-2 대립유전자 내 변이 Variation within alleles

SMRT 염기서열 분석을 통해 CrtZ-2의 엑손과 인트론 내 각각 16개와 58개의 변이들을 검출할 수 있었다. 암호화 서열에 존재하는 16개의 변이들 중에서 9개의 변이만이 아미노산의 변화를 유도하였으나 이들 모두 종결코돈을 형성하지는 못하였다(도 4a). 이들 변이 중 2개의 과오돌연변이, crtz-c1crtz-c5의 경우, 4종의 C. annuum 유전자원(ACN 22, 24, 39, 51)에서 지속적으로 발견되었고, 4개의 과오돌연변이인 crtz-c2, crtz-c3, crtz-c4, crtz-c6의 경우, 3종의 C. baccatum 유전자원(ACN 65, 66, 67)에서 특이적으로 발견되었다. 끝으로 crtz-c8crtz-c9는 2종의 C. pubescens 유전자원(ACN 93, 94)에서 발견되었다.Through SMRT sequencing, 16 and 58 mutations in the exons and introns of CrtZ-2 were detected, respectively. Of the 16 mutations present in the coding sequence, only 9 mutations induced amino acid changes, but none of them formed a stop codon (FIG. 4A). Two of these mutations, crtz-c1 and crtz-c5 , were continuously found in four C. annuum gene sources (ACN 22, 24, 39, 51), and four over- mutations, crtz-c2. , crtz-c3 , crtz-c4 , and crtz-c6 were specifically found in three C. baccatum genetic resources (ACN 65, 66, 67). Finally, crtz-c8 and crtz-c9 were found in two C. pubescens genetic resources (ACN 93, 94).

2-6. 2-6. ZEPZEP 대립유전자 내 변이 Variation within alleles

SMRT 염기서열 분석을 통해 ZEP의 엑손과 인트론 내 각각 30개와 61개의 변이들을 검출할 수 있었다. 암호화 서열에 존재하는 30개의 변이들 중에서 16개의 변이만이 아미노산의 변화를 초래하였다. 16종의 변이 모두 과오돌연변이에 해당되었다(도 4b). zep-c6, zep-c9, zep-c12, zep-c13, zep-c14, zep-c15, zep-c16를 포함한 7개의 돌연변이는 전적으로 2종의 C. pubescens 유전자원(ACN 93, 94)에서만 발견되었다. 반면, zep-c5zep-c11은 1종의 C. annuum 유전자원(ACN 47)을 포함하여 4종의 C. chinense 유저자원(ACN 76, 77, 78, 72), 2종의 C. frutescens 유전자원(ACN 90, 91)과 같이 다양한 종에서 발견되었다.Through SMRT sequencing, 30 and 61 mutations in the exons and introns of ZEP were detected, respectively. Of the 30 mutations present in the coding sequence, only 16 mutations resulted in amino acid changes. All of the 16 types of mutations corresponded to the false mutations (Fig. 4b). Seven mutations including zep-c6 , zep-c9 , zep-c12 , zep-c13 , zep-c14 , zep-c15 and zep-c16 were found exclusively in two C. pubescens gene sources (ACN 93, 94). Became. On the other hand, zep-c5 and zep-c11 include one C. annuum gene resource (ACN 47), four C. chinense user resources (ACN 76, 77, 78, 72), and two C. frutescens. It has been found in a variety of species, such as genetic resources (ACN 90, 91).

Figure 112019086830830-pat00001
Figure 112019086830830-pat00001

Figure 112019086830830-pat00002
Figure 112019086830830-pat00002

Figure 112019086830830-pat00003
Figure 112019086830830-pat00003

실시예 3. 중합효소연쇄반응을 통하여 발견한 구조적 돌연변이Example 3. Structural mutation found through polymerase chain reaction

총 94종의 유전자원 중에서 PSY1 N-말단, PSY1 C-말단, Lcyb CCS 라이브러리 구축 시 각각 18, 19, 4, 32종의 유전자원에서 증폭산물을 얻을 수 없었다. 이와 같이 비정상적인 증폭양상을 나타내는 유전자원을 대상으로는 SMRT 염기서열 분석을 진행할 수 없었기에, 그 대안으로서 조건을 달리하여 중합효소연쇄반응을 진행하였다. 증폭 시간을 10분까지 증가시키고 동시에 일부 유전자를 대상으로는 유전자의 다른 부위(프로모터 등)에 결합하는 프라이머를 이용하여 증폭을 시도해 보았다. PSY2ZEP의 경우에는 모든 유전자원에서 예상대로의 증폭이 이루어졌었다.Of the 94 genetic resources, the PSY1 N-terminus, PSY1 C-terminus, Lcyb and CCS libraries were not able to obtain amplification products from 18, 19, 4 and 32 genetic resources, respectively. Since SMRT sequencing could not be performed for genetic resources exhibiting such abnormal amplification patterns, as an alternative, polymerase chain reaction was performed under different conditions. The amplification time was increased to 10 minutes, and at the same time, amplification was attempted using primers that bind to other regions of the gene (promoter, etc.) for some genes. In the case of PSY2 and ZEP , the amplification was as expected in all genetic sources.

3-1. 3-1. PSY1PSY1 내 구조적 돌연변이 My structural mutation

SMRT 서열분석을 위한 라이브러리 구축 과정에서 18종의 유전자원에서는 PSY1 N-말단에 해당되는 밴드가 증폭되지 않았으며, C. baccatum 유전자원인 ACN 64의 경우에는 예상 크기보다 큰 3 kb 내외의 밴드가 증폭되었다. C-말단의 경우에는 19종의 유전자원에서 밴드가 증폭되지 않았고, 마찬가지로 ACN 64의 경우에는 예상 크기보다 큰 밴드가 증폭되었다. 한편, 다른 C. baccatum 유전자원 ACN 69의 경우에는 오직 N-말단에서만 단편이 확보되었다. PCR을 통해 ACN 64의 경우 세 번째 인트론에 1,395 bp의 삽입이 일어났음을 밝혀내었다(psy1-in1). 삽입이 일어난 위치가 1차 증폭에 사용한 역방향 프라이머와 2차 증폭에 사용한 정방향 프라이머의 결합 부위 사이에 위치하기 때문에 양 말단에서 예상 크기보다 큰 밴드가 확보된 것으로 사료되었다. ACN 69의 경우에는 증폭시간을 10분으로 증가시킨 광범위(long-range) PCR을 통하여 증폭산물을 확보하는 데에 성공했으며, 해당 유전자원에는 7 kb 내외의 삽입이 존재함을 발견하였다(psy1-in2). 그러나 PSY1의 증폭 자체가 실패한 18종의 유전자원에서는 어떠한 변이가 존재하는지 규명하지는 못하였는데, 이는 아마도 크기가 큰 삽입이나 결실이 존재하기 때문인 것으로 유추되었다.In the process of constructing a library for SMRT sequencing analysis, the band corresponding to the PSY1 N-terminus was not amplified in 18 genetic resources, and in the case of ACN 64, a C. baccatum gene source, a band within 3 kb larger than the expected size was amplified. Became. In the case of the C-terminus, the band was not amplified in 19 genetic sources, and in the case of ACN 64, a band larger than the expected size was amplified. Meanwhile, in the case of ACN 69, another C. baccatum gene source, fragments were obtained only at the N-terminus. In the case of ACN 64 through PCR, it was found that 1,395 bp was inserted into the third intron ( psy1-in1 ). Since the site where the insertion took place is located between the binding site of the reverse primer used for the first amplification and the forward primer used for the second amplification, it was considered that a band larger than the expected size was secured at both ends. In the case of ACN 69, it succeeded in securing the amplification product through long-range PCR that increased the amplification time to 10 minutes, and it was found that there existed insertions of around 7 kb in the gene resource ( psy1- in2 ). However, it was not possible to clarify what mutations exist in the 18 genetic resources in which the amplification of PSY1 itself failed, which was presumably due to the presence of large insertions or deletions.

3-2. 3-2. LcybLcyb 내 구조적 돌연변이 My structural mutation

SMRT 염기서열 분석을 위한 라이브러리 구축 과정 중 총 4종의 C. annuum 유전자원(ACN 4, 15, 53, 58)에서 Lcyb의 증폭산물을 확보하지 못하였다. 해당 유전자원의 완숙과색이 각각 진주황, 주황, 노랑, 연노랑으로 다양하기 때문에, 규명해 내지 못한 변이 자체는 과색과 밀접한 관련이 없어 보인다. 선행 연구에서도 Lcyb의 변이에 대한 단서를 확보할 수 없었는데, 아마도 프라이머 결합 부위 부근에 존재하는 변이가 중합효소 연쇄반응을 저해하기 때문에 증폭이 실패하였을 가능성을 고려하고 있다.During the library construction process for SMRT sequencing analysis, the amplification products of Lcyb could not be obtained from a total of 4 C. annuum genetic resources (ACN 4, 15, 53, 58). Since the ripe fruit color of the gene resource varies in pearl yellow, orange, yellow, and pale yellow, respectively, the mutation itself that has not been identified does not seem to be closely related to the fruit color. Even in previous studies, it was not possible to obtain a clue about the mutation of Lcyb , but we are considering the possibility that the amplification failed because the mutation present near the primer binding site inhibits the polymerase chain reaction.

3-3. 3-3. CrtZ-2CrtZ-2 내 구조적 돌연변이 My structural mutation

CrtZ-2의 N-말단 라이브러리를 구축하던 도중 총 19종의 유전자원에서 예상에서 벗어난 크기의 증폭산물이 확보되었다. 그 중, 17종의 유전자원에서는 첫 번째 인트론에 960 bp의 삽입이 존재함을 알게 되었는데(crtz-in), 해당 형태의 변이를 보유하고 있는 유전자원은 모두 C. annuum 계통에 속하였다. 이들의 완숙과색은 연노랑에서 빨강에 이르기까지 다양한 범위의 색을 나타내었다. 한편, 나머지 두 유전자원(ACN 27, 69)에서는 첫 번째 인트론에서 84 bp의 결실이 발견되었고, 이들 유전자원은 각각 C. annuumC. baccatum에 해당되었다. While constructing the N-terminal library of CrtZ-2 , an unexpectedly large amplification product was obtained from a total of 19 genetic resources. Among them, it was found that there was an insertion of 960 bp in the first intron in 17 kinds of genetic resources ( crtz-in ), and all of the genetic resources carrying the mutation of the corresponding type belonged to the C. annuum line. Their maturity and color ranged from light yellow to red. On the other hand, 84 bp deletion was found in the first intron in the other two genetic resources (ACN 27, 69), and these genetic resources corresponded to C. annuum and C. baccatum , respectively.

3-4. 3-4. CCSCCS 내 구조적 돌연변이 My structural mutation

CCS의 경우, 총 32종의 유전자원에서 SMRT 염기서열 분석을 위한 라이브러리 구축에 실패하였다. CCS 내에 구조적 변이가 존재할 가능성을 고려하여, 개시코돈으로부터 4.3 kb 상류에 존재하는 부분에 결합하는 정방향 프라이머를 설계하였다. 라이브러리 구축에 사용한 동일한 역방향 프라이머와 새로이 설계한 정방향 프라이머를 이용하여 PCR을 진행할 경우, 적색 유전자원에서는 5.9 kb의 증폭산물이 확보되어야 한다. 하지만 23종의 유전자원에서는 1 kb 내외의 밴드들이 확보되었다(ccs-p1). 서열 분석을 진행한 결과, -3,686 nt에서부터 1,193 nt까지 총 4,879 bp의 서열이 결실되었음을 알 수 있었다. 해당 형태의 변이를 보유하고 있는 유전자원은 모두 C. annuum 계통에 속하였다. 한편, 5종의 C. baccatum 유전자원(ACN 64, 66, 67, 68, 69)에서는 2.5 kb의 증폭산물이 얻어졌는데(ccs-p2), 해당 변이는 -3,010 nt에서부터 -42 nt에 이르기까지 총 2,968 bp가 결실되었음이 밝혀졌다. 본 발명에서는 또한 9종의 유전자원에서 프로모터 내 변이를 검출하였는데, 이 경우 프라이머 결합 부위 자체는 온전하기 때문에 증폭 및 SMRT 염기서열 분석은 문제없이 이루어졌다. 그러나 프로모터 부분을 목표로 하는 PCR에서 예상 크기보다 큰 6 kb 가량의 밴드가 증폭되었다(ccs-p3). 해당 대립유전자에는 11 bp 결실, 197 bp 결실, 5 bp 삽입을 비롯한 다양한 삽입/결실 변이가 존재하였고, C. annuum 유전자원(ACN 12), C. chinense 유전자원(ACN 75, 78, 79, 80, 81, 82), C frutescens 유전자원(ACN 90, 91)에서 발견되었다. CCS 프로모터 부분에 발생한 구조적 돌연변이를 발견한 후에는 증폭시간을 10분으로 증가시켜 중합효소 연쇄반응을 진행해 보았다. 그 결과, C. annuum 유전자원인 ACN 42에서 9 kb 가량의 단편이 증폭되었고, 이는 898 nt에 발생한 3 kb의 삽입에 의한 것으로 확인되었다(도 5). 그러나 본 발명에서는 C. annuum ACN 27, C. baccatum ACN 65 및 C. pubescens ACN 93에 존재하는 변이를 규명하지는 못하였다. 아마도 다른 형태의 변이들이 해당 유전자원에 존재하는 것으로 예측되었다. In the case of CCS , it failed to construct a library for SMRT sequencing in a total of 32 genetic resources. In consideration of the possibility that there is a structural variation in CCS , a forward primer that binds to a portion present 4.3 kb upstream from the start codon was designed. When PCR is carried out using the same reverse primer used to construct the library and the newly designed forward primer, a 5.9 kb amplification product must be secured from the red genetic resource. However, in 23 genetic resources, bands of around 1 kb were secured ( ccs-p1 ). As a result of sequence analysis, it was found that a total of 4,879 bp of sequence from -3,686 nt to 1,193 nt was deleted. All genetic resources carrying this type of mutation belonged to the C. annuum family. On the other hand, from 5 C. baccatum genetic resources (ACN 64, 66, 67, 68, 69), 2.5 kb of amplification product was obtained ( ccs-p2 ), and the mutation ranged from -3,010 nt to -42 nt. It was found that a total of 2,968 bp was deleted. In the present invention, mutations in the promoter were also detected in 9 kinds of genetic sources. In this case, since the primer binding site itself is intact, amplification and SMRT sequencing were performed without problems. However, in PCR targeting the promoter portion, a band of about 6 kb larger than the expected size was amplified ( ccs-p3 ). Various insertion/deletion mutations, including 11 bp deletion, 197 bp deletion, and 5 bp insertion, existed in the allele, and C. annuum gene source (ACN 12), C. chinense gene source (ACN 75, 78, 79, 80) , 81, 82), C frutescens genetic resources (ACN 90, 91). After finding the structural mutation occurring in the CCS promoter, the amplification time was increased to 10 minutes to proceed with the polymerase chain reaction. As a result, a fragment of about 9 kb was amplified from ACN 42, which is a C. annuum gene source, and it was confirmed that this was caused by the insertion of 3 kb generated at 898 nt (FIG. 5). However, in the present invention, mutations present in C. annuum ACN 27, C. baccatum ACN 65 and C. pubescens ACN 93 were not identified. Perhaps other types of mutations were predicted to be present in the genetic resource.

실시예 4. 카로티노이드 프로파일(profile)의 분류Example 4. Classification of carotenoid profiles

94종의 유전자원 중에서 후보 유전자의 대립유전자 내 변이를 충분히 반영할 수 있는 43종의 유전자원을 선발하였다. 해당 유전자원들을 대상으로 UPLC를 진행하여 카로티노이드의 프로파일을 확보했으며, 해당 과정은 2반복씩 실시하였다. 본 발명에서는 크로마토그램의 양상을 바탕으로 43종의 유전자원을 4개의 군으로 분류하였다. 8종의 유전자원이 해당되는 그룹Ⅰ의 경우, 캡산틴이 주요 카로티노이드 성분이며 루테인은 검출되지 않았다. 26종의 유전자원이 속하는 그룹Ⅱ에서는 캡산틴을 제외한 모든 카로티노이드 성분들이 검출되었고, 그 중 가장 많이 존재하는 3가지의 카로티노이드는 루테인, 안테라크산틴, 비올라키산틴이었다. 7종의 유전자원이 속하는 그룹Ⅲ의 경우, 대부분의 카로티노이드들이 매우 소량씩 검출되었다. 그룹Ⅱ에서와 마찬가지로 높은 비율의 루테인이 검출되었지만, 그룹Ⅱ와는 달리 크립토잔틴과 카로틴은 거의 발견되지 않았다. 마지막으로 2종의 유전자원이 포함된 그룹Ⅳ의 경우, α-크립토잔틴과 안테라크산틴이 주요 카로티노이드였으며, 루테인과 캡산틴은 검출되지 않았다. 요약하면, 그룹Ⅰ에 속하는 유전자원은 캡산틴의 축적에 따라 분홍부터 빨강에 이르기까지의 붉은 계열의 과색을 나타내며, 그룹Ⅱ의 유전자원은 루테인, 안테라크산틴, 비올라키산틴의 조합에 따라 노랑부터 주황까지의 과색을 나타낸다. 끝으로 그룹Ⅲ의 유전자원은 루테인과 소량씩 축적되는 나머지 카로티노이드 성분들에 의해 상아부터 연노랑까지의 과색을 나타낸다고 볼 수 있다.Of the 94 genetic resources, 43 genetic resources were selected that could sufficiently reflect the variation within the allele of the candidate gene. UPLC was performed for the genetic resources to obtain a profile of carotenoids, and the process was repeated twice. In the present invention, 43 kinds of genetic resources were classified into 4 groups based on the aspect of the chromatogram. In the case of Group I, where 8 kinds of genetic resources are applicable, capsantin was the main carotenoid component and lutein was not detected. In Group II to which 26 kinds of genetic resources belong, all carotenoid components except capxanthin were detected, and the three most common carotenoids were lutein, anteraxanthin, and violaxanthin. In the case of group III to which 7 kinds of genetic resources belong, most carotenoids were detected in very small amounts. As in group II, a high proportion of lutein was detected, but unlike group II, cryptoxanthin and carotene were hardly found. Lastly, in the case of group IV, which contained two kinds of genetic resources, α-cryptoxanthin and anteraxanthin were the main carotenoids, and lutein and capxanthin were not detected. In summary, the genetic resources belonging to Group I show reddish colors ranging from pink to red according to the accumulation of capxanthin, and the genetic resources of Group II are yellow according to the combination of lutein, anteraxanthin, and violaxanthin. The color ranges from orange to orange. Finally, it can be seen that the genetic resources of group III exhibit hypercolor from ivory to light yellow due to lutein and the remaining carotenoid components accumulated in small amounts.

실시예 5. 카로티노이드 프로파일과 유전형 간의 상관관계Example 5. Correlation between carotenoid profile and genotype

카로티노이드 프로파일과 유전형 간의 상관관계를 확인하기 위해 먼저 PSY1, PSY2, Lcyb, CrtZ-2, ZEP, CCS에서 해당 유전자의 기능을 손상시킬 것으로 예측되는 녹아웃 돌연변이를 선별하였다. 이러한 변이들은 정지돌연변이와 암호화 부위에 발생한 삽입/결실에 따른 구조이동돌연변이를 포함하며, CCS의 경우 프로모터 부분에 발생한 대규모 결실까지를 포함한다. 한편 위의 기준(조기종결)을 충족시키는 유전자가 오직 PSY1CCS에서만 발견되었기 때문에, 카로티노이드 성분을 바탕으로 heatmap을 작성한 뒤 PSY1/CCS 유전형과 대조해 보았다(도 6). Heatmap에서 카로티노이드의 함량은 파랑(최소), 하양(중간), 빨강(최대) 순서로 나타내었다. 그룹Ⅰ에 속하는 유전자원은 C. annuum ACN 38을 제외하고 모두 정상 기능의 CCS를 가지고 있었다. 한편, 그룹Ⅰ은 PSY1의 유전형에 따라 소그룹 2개로 세분화될 수 있었다. 정상 기능의 PSY1을 보유한 그룹은 많은 양의 캡산틴이 축적되었으나, 비정상 기능의 PSY1을 보유한 그룹은 캡산틴의 양이 감소함에 따라 비적색 과색을 나타내었다. 해당 소그룹에 속하는 유전자원들의 과색은 진주황(ACN 5), 주황(ACN 15), 분홍(ACN 82)이었다. 그룹Ⅱ에 속하는 유전자원은 C. chinense ACN 79를 제외하고 정상의 PSY1과 돌연변이형 CCS를 보유하였다. 이들의 과색은 노랑부터 주황에 이르기까지의 과색을 나타내었다. 그룹Ⅲ의 유전자원은 PSY1CCS 모두의 기능이 손상되었으며, 상아부터 연노랑까지의 과색을 나타내었다. 끝으로 그룹Ⅳ에 속하는 C. annuum ACN 7과 C. baccatum ACN 67은 각각 psy1/CCSPSY1/ccs 유전형을 나타내었다. 이 경우에는 시료의 개수가 제한적이어서 카로티노이드 함량과 유전형 간의 상관관계를 논하기는 어려웠다. 상기 결과를 통해, 크로마토그램 그룹Ⅰ부터 Ⅲ까지는 ACN 38 및 79 유전자원을 제외하고, PSY1CCS로 나타낸 유전형과 밀접한 관련이 있음을 알 수 있었다.To confirm the correlation between the carotenoid profile and genotype, first, knockout mutations predicted to impair the function of the corresponding gene in PSY1 , PSY2 , Lcyb , CrtZ-2 , ZEP , and CCS were selected. These mutations include stop mutations and structural shift mutations resulting from insertion/deletion occurring in the coding region, and in the case of CCS , even large-scale deletions occurring in the promoter region. On the other hand, since genes satisfying the above criteria (early termination) were found only in PSY1 and CCS , a heatmap was created based on the carotenoid component and then compared with the PSY1 / CCS genotype (Fig. 6). In the heatmap, the content of carotenoids was expressed in the order of blue (minimum), white (medium), and red (maximum). Genetic resources belonging to group I all had normal functioning CCS except for C. annuum ACN 38. Meanwhile, group I could be subdivided into two subgroups according to the genotype of PSY1 . The group possessing the normal functioning PSY1 accumulated a large amount of capxanthin , but the group possessing the abnormal functioning PSY1 showed non-red red color as the amount of capsantin decreased. The hypercolors of the genetic resources belonging to the subgroup were pearl yellow (ACN 5), orange (ACN 15), and pink (ACN 82). Genetic resources belonging to group II had normal PSY1 and mutant CCS except for C. chinense ACN 79. Their supercolors ranged from yellow to orange. The genetic resources of group III had impaired functions of both PSY1 and CCS , and exhibited excessive color ranging from ivory to light yellow. Finally, C. annuum ACN 7 and C. baccatum ACN 67 belonging to group IV exhibited psy1 / CCS and PSY1 / ccs genotypes, respectively. In this case, the number of samples was limited, so it was difficult to discuss the correlation between carotenoid content and genotype. Through the above results, it was found that chromatogram groups I to III were closely related to genotypes represented by PSY1 and CCS , excluding ACN 38 and 79 genetic resources.

<110> Seoul National University R&DB Foundation <120> Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof <130> PN19186 <160> 25 <170> KoPatentIn 3.0 <210> 1 <211> 1260 <212> DNA <213> Capsicum annuum <400> 1 atgtctgttg ccttgttatg ggttgtttct ccttgtgacg tctcaaacgg gacaggattc 60 ttggtatccg ttcgtgaggg aaaccggatt tttgattcgt cggggcgtag gaatttggcg 120 tgcaatgaga gaatcaagag aggaggtgga aaacaaaggt ggagttttgg ttcttacttg 180 ggaggagcac aaactggaag tggacggaaa ttttctgtac gttctgctat cgtggctact 240 ccggctggag aaatgacgat gtcatcagaa cggatggtat atgatgtggt tttgaggcag 300 gcagccttgg tgaagagaca gctgagatcg accgatgagt tagatgtgaa gaaggatata 360 cctattccgg ggactttggg cttgttgagt gaagcatatg ataggtgtag tgaagtatgt 420 gcagagtacg caaagacgtt ttacttagga acgatgctaa tgactccgga gagaagaaag 480 gctatctggg caatatacgt atggtgcagg agaacagacg aacttgttga tggtccgaat 540 gcatcacaca ttactccggc ggccttagat aggtgggaag acaggctaga agatgttttc 600 agtggacggc catttgacat gctcgatgct gctttgtccg acacagtttc caaatttcca 660 gttgatattc agccattcag agatatgatt gaaggaatgc gtatggactt gaggaagtca 720 agatacagaa actttgacga actataccta tattgttatt acgttgctgg tacggttggg 780 ttgatgagtg ttccaattat gggcatcgca cctgaatcaa aggcaacaac ggagagcgta 840 tataatgctg ctttggcttt ggggatcgca aatcagctga ccaacatact tagagatgtt 900 ggagaagatg ccagaagagg aagagtctat ttgcctcaag atgaattagc acaggcaggt 960 ctatccgacg aagacatatt tgctggaaga gtgaccgata aatggagaat cttcatgaag 1020 aaacaaattc agagggcaag aaagttcttt gacgaggcag agaaaggagt gaccgaattg 1080 agcgcagcta gtagatggcc tgtgttggca tctctgctgt tgtaccgcag gatactggac 1140 gagatcgaag ccaatgacta caacaacttc acaaagagag cttatgtgag caaaccaaag 1200 aagttgattg cattacctat tgcatatgca aaatctcttg tgccttctac aagaacatga 1260 1260 <210> 2 <211> 1427 <212> DNA <213> Capsicum annuum <400> 2 aacacaactc cacttttcca aatccaacca aacaaaaaga ttcaagaaag ttccattata 60 gaaacaaaag cagtacacat ttttgtagct ttcttgattt agcacccaca tcaaagccag 120 agtctttaga tgttaacatc tcatgggttg atactgatct ggaccgggct gaattcgacg 180 tgatcatcat tggaactggc cctgccgggc ttcggctagc tgaacaagtt tctaaatatg 240 gtattaaggt atgttgcgtt gacccttcac cactttccat gtggccaaat aattatggtg 300 tttgggttga tgagtttgaa aagttgggat tagaagattg tctagatcat aagtggcctg 360 tgagttgtgt tcatataagt gatcacaaga ctaagtattt ggacagacca tatggtagag 420 taagtagaaa gaagttgaag ttgaaattgt tgaatagttg tgttgaaaat agagtgaagt 480 tttataaagc caaggttttg aaagtgaagc atgaagaatt tgagtcttcg attgtttgtg 540 atgatggtag gaagataagt ggtagcttga ttgttgatgc aagtggctat gctagtgatt 600 ttatagagta tgacaagcca agaaaccatg gttatcaagt tgctcatggg attttagcag 660 aagttgataa tcatccattt gatttggata aaatgatgct tatggattgg agggattctc 720 atttaggtaa tgagccatat ctgagggtga agaatactaa agaaccaaca ttcttgtatg 780 caatgccatt tgataggaat ttggtattct tggaagagac ttccttagtg agtcggccta 840 tgttatcgta tatggaagtg aaaagaagga tggtagcaag attaagacat ttggggatca 900 aagtgagaag tgtccttgag gaagagaagt gtgtgatcac tatgggagga ccacttccgc 960 ggattcctca aaatgttatg gctattggtg ggacttcagg gatagttcat ccatcgtctg 1020 ggtacatggt ggctcgtagc atggcattgg caccagtact ggctgaggcc atcgtcgaaa 1080 gccttggctc aacaagaatg ataagagggt ctcaacttta ccatagagtt tggaatggtt 1140 tgtggccttc ggatagaaga cgtgttagag aatgttattg tttcggaatg gagactttgt 1200 tgaagcttga tttggaaggt actaggagat tgtttgatgc tttctttgat gttgatccca 1260 agtactggca cgggttcctt tcttcaagat tgtctgtcaa agaacttgct gtactcagtt 1320 tgtacctttt tggacatgcc tctaatttgg ctaggttgga tattgttaca aagtgcactg 1380 tccccttggt taaactgctg ggcaatctag caatagagag cctttga 1427 <210> 3 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 3 tcgtcggcag cgtcgaggtc gctataggag ccga 34 <210> 4 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 4 gtctcgtggg ctcggaaccc aaccgtacca gcaac 35 <210> 5 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 5 tcgtcggcag cgtcctgttt cacagttttg cgaactc 37 <210> 6 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 6 gtctcgtggg ctcggtattg gcttcattgg ccttg 35 <210> 7 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 7 tcgtcggcag cgtctgggat aaactaggct gaggtg 36 <210> 8 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 8 gtctcgtggg ctcggcaact ggaaatctgg aaacg 35 <210> 9 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 9 tcgtcggcag cgtcggtgca ggagaactga tgag 34 <210> 10 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 10 gtctcgtggg ctcggcattc atgtctttgt tagtgaaga 39 <210> 11 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 11 tcgtcggcag cgtcaggacc ccatttgctg tttt 34 <210> 12 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 12 gtctcgtggg ctcggtccga tcattctccc gagtt 35 <210> 13 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 13 tcgtcggcag cgtccctgtg catcaagtcc tattca 36 <210> 14 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 14 gtctcgtggg ctcggatgag aacacgtaca gcgcc 35 <210> 15 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 15 tcgtcggcag cgtcgcccta acctttttcc caaa 34 <210> 16 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 16 gtctcgtggg ctcgggctgc tttttcgtgg tgttc 35 <210> 17 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 17 tcgtcggcag cgtctccttt cacttccttt ggcct 35 <210> 18 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 18 gtctcgtggg ctcggagctt cactgtgtcc gaaca 35 <210> 19 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 19 tcgtcggcag cgtccaaaca tttccgttgt gttg 34 <210> 20 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 20 gtctcgtggg ctcggcaaac cacaggatat caacttcc 38 <210> 21 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 21 tcgtcggcag cgtcggactt gggaatgcct ctaatg 36 <210> 22 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 22 gtctcgtggg ctcggatgct gtacaaattt cccgttt 37 <210> 23 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 23 tcgtcggcag cgtctgattc ccctagttcg gtatttc 37 <210> 24 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 24 gtctcgtggg ctcgggcttt tgtttcactt ttgcattg 38 <210> 25 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 25 cccctggcac accactcttg gagcc 25 <110> Seoul National University R&DB Foundation <120> Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof <130> PN19186 <160> 25 <170> KoPatentIn 3.0 <210> 1 <211> 1260 <212> DNA <213> Capsicum annuum <400> 1 atgtctgttg ccttgttatg ggttgtttct ccttgtgacg tctcaaacgg gacaggattc 60 ttggtatccg ttcgtgaggg aaaccggatt tttgattcgt cggggcgtag gaatttggcg 120 tgcaatgaga gaatcaagag aggaggtgga aaacaaaggt ggagttttgg ttcttacttg 180 ggaggagcac aaactggaag tggacggaaa ttttctgtac gttctgctat cgtggctact 240 ccggctggag aaatgacgat gtcatcagaa cggatggtat atgatgtggt tttgaggcag 300 gcagccttgg tgaagagaca gctgagatcg accgatgagt tagatgtgaa gaaggatata 360 cctattccgg ggactttggg cttgttgagt gaagcatatg ataggtgtag tgaagtatgt 420 gcagagtacg caaagacgtt ttacttagga acgatgctaa tgactccgga gagaagaaag 480 gctatctggg caatatacgt atggtgcagg agaacagacg aacttgttga tggtccgaat 540 gcatcacaca ttactccggc ggccttagat aggtgggaag acaggctaga agatgttttc 600 agtggacggc catttgacat gctcgatgct gctttgtccg acacagtttc caaatttcca 660 gttgatattc agccattcag agatatgatt gaaggaatgc gtatggactt gaggaagtca 720 agatacagaa actttgacga actataccta tattgttatt acgttgctgg tacggttggg 780 ttgatgagtg ttccaattat gggcatcgca cctgaatcaa aggcaacaac ggagagcgta 840 tataatgctg ctttggcttt ggggatcgca aatcagctga ccaacatact tagagatgtt 900 ggagaagatg ccagaagagg aagagtctat ttgcctcaag atgaattagc acaggcaggt 960 ctatccgacg aagacatatt tgctggaaga gtgaccgata aatggagaat cttcatgaag 1020 aaacaaattc agagggcaag aaagttcttt gacgaggcag agaaaggagt gaccgaattg 1080 agcgcagcta gtagatggcc tgtgttggca tctctgctgt tgtaccgcag gatactggac 1140 gagatcgaag ccaatgacta caacaacttc acaaagagag cttatgtgag caaaccaaag 1200 aagttgattg cattacctat tgcatatgca aaatctcttg tgccttctac aagaacatga 1260 1260 <210> 2 <211> 1427 <212> DNA <213> Capsicum annuum <400> 2 aacacaactc cacttttcca aatccaacca aacaaaaaga ttcaagaaag ttccattata 60 gaaacaaaag cagtacacat ttttgtagct ttcttgattt agcacccaca tcaaagccag 120 agtctttaga tgttaacatc tcatgggttg atactgatct ggaccgggct gaattcgacg 180 tgatcatcat tggaactggc cctgccgggc ttcggctagc tgaacaagtt tctaaatatg 240 gtattaaggt atgttgcgtt gacccttcac cactttccat gtggccaaat aattatggtg 300 tttgggttga tgagtttgaa aagttgggat tagaagattg tctagatcat aagtggcctg 360 tgagttgtgt tcatataagt gatcacaaga ctaagtattt ggacagacca tatggtagag 420 taagtagaaa gaagttgaag ttgaaattgt tgaatagttg tgttgaaaat agagtgaagt 480 tttataaagc caaggttttg aaagtgaagc atgaagaatt tgagtcttcg attgtttgtg 540 atgatggtag gaagataagt ggtagcttga ttgttgatgc aagtggctat gctagtgatt 600 ttatagagta tgacaagcca agaaaccatg gttatcaagt tgctcatggg attttagcag 660 aagttgataa tcatccattt gatttggata aaatgatgct tatggattgg agggattctc 720 atttaggtaa tgagccatat ctgagggtga agaatactaa agaaccaaca ttcttgtatg 780 caatgccatt tgataggaat ttggtattct tggaagagac ttccttagtg agtcggccta 840 tgttatcgta tatggaagtg aaaagaagga tggtagcaag attaagacat ttggggatca 900 aagtgagaag tgtccttgag gaagagaagt gtgtgatcac tatgggagga ccacttccgc 960 ggattcctca aaatgttatg gctattggtg ggacttcagg gatagttcat ccatcgtctg 1020 ggtacatggt ggctcgtagc atggcattgg caccagtact ggctgaggcc atcgtcgaaa 1080 gccttggctc aacaagaatg ataagagggt ctcaacttta ccatagagtt tggaatggtt 1140 tgtggccttc ggatagaaga cgtgttagag aatgttattg tttcggaatg gagactttgt 1200 tgaagcttga tttggaaggt actaggagat tgtttgatgc tttctttgat gttgatccca 1260 agtactggca cgggttcctt tcttcaagat tgtctgtcaa agaacttgct gtactcagtt 1320 tgtacctttt tggacatgcc tctaatttgg ctaggttgga tattgttaca aagtgcactg 1380 tccccttggt taaactgctg ggcaatctag caatagagag cctttga 1427 <210> 3 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 3 tcgtcggcag cgtcgaggtc gctataggag ccga 34 <210> 4 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 4 gtctcgtggg ctcggaaccc aaccgtacca gcaac 35 <210> 5 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 5 tcgtcggcag cgtcctgttt cacagttttg cgaactc 37 <210> 6 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 6 gtctcgtggg ctcggtattg gcttcattgg ccttg 35 <210> 7 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 7 tcgtcggcag cgtctgggat aaactaggct gaggtg 36 <210> 8 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 8 gtctcgtggg ctcggcaact ggaaatctgg aaacg 35 <210> 9 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 9 tcgtcggcag cgtcggtgca ggagaactga tgag 34 <210> 10 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 10 gtctcgtggg ctcggcattc atgtctttgt tagtgaaga 39 <210> 11 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 11 tcgtcggcag cgtcaggacc ccatttgctg tttt 34 <210> 12 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 12 gtctcgtggg ctcggtccga tcattctccc gagtt 35 <210> 13 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 13 tcgtcggcag cgtccctgtg catcaagtcc tattca 36 <210> 14 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 14 gtctcgtggg ctcggatgag aacacgtaca gcgcc 35 <210> 15 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 15 tcgtcggcag cgtcgcccta acctttttcc caaa 34 <210> 16 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 16 gtctcgtggg ctcgggctgc tttttcgtgg tgttc 35 <210> 17 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 17 tcgtcggcag cgtctccttt cacttccttt ggcct 35 <210> 18 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 18 gtctcgtggg ctcggagctt cactgtgtcc gaaca 35 <210> 19 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 19 tcgtcggcag cgtccaaaca tttccgttgt gttg 34 <210> 20 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 20 gtctcgtggg ctcggcaaac cacaggatat caacttcc 38 <210> 21 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 21 tcgtcggcag cgtcggactt gggaatgcct ctaatg 36 <210> 22 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 22 gtctcgtggg ctcggatgct gtacaaattt cccgttt 37 <210> 23 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 23 tcgtcggcag cgtctgattc ccctagttcg gtatttc 37 <210> 24 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 24 gtctcgtggg ctcgggcttt tgtttcactt ttgcattg 38 <210> 25 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 25 cccctggcac accactcttg gagcc 25

Claims (7)

서열번호 1의 염기서열로 이루어진 고추 유래의 PSY1(phytoene synthase 1) 유전자의 120번째 염기가 결실된 변이를 검출할 수 있는 올리고뉴클레오티드 및 서열번호 2의 염기서열로 이루어진 고추 유래의 CCS(capsanthin-capsorubin synthase) 유전자의 599번째 염기 시토신(C)이 아데닌(A)으로 치환된 변이를 검출할 수 있는 올리고뉴클레오티드를 유효성분으로 포함하는, 캡시큠 프루테센스(Capsicum frutescens) 유전자원의 아이보리색의 완숙과색 예측용 조성물.An oligonucleotide capable of detecting a mutation in which the 120th base of the PSY1 ( phytoene synthase 1 ) gene derived from a pepper consisting of the nucleotide sequence of SEQ ID NO: 1 is deleted, and a CCS derived from pepper consisting of the nucleotide sequence of SEQ ID NO: 2 ( capsanthin-capsorubin synthase ) Capsicum frutescens ( Capsicum frutescens ), containing an oligonucleotide capable of detecting a mutation in which the 599th base cytosine (C) is substituted with adenine (A) as an active ingredient, the ivory color of the genetic resource Composition for predicting hypercolor. 제1항에 있어서, 상기 유전자의 변이를 검출할 수 있는 올리고뉴클레오티드는 상기 유전자의 변이에 특이적인 프라이머, 프로브 및 이들의 조합으로 이루어진 군으로부터 선택되는 하나 이상인 것을 특징으로 하는 캡시큠 프루테센스 유전자원의 아이보리색의 완숙과색 예측용 조성물.The capsicum frutesense gene according to claim 1, wherein the oligonucleotide capable of detecting mutation of the gene is at least one selected from the group consisting of primers, probes, and combinations thereof specific for mutation of the gene. A composition for predicting ripeness and color of the ivory color of a circle. 삭제delete 삭제delete 제1항 또는 제2항에 따른 캡시큠 프루테센스 유전자원의 아이보리색의 완숙과색 예측용 조성물을 포함하는, 캡시큠 프루테센스(Capsicum frutescens) 유전자원의 아이보리색의 완숙과색 예측용 키트. Capsicum frutescens ( Capsicum frutescens ) Comprising the composition for predicting the color of the ivory color of the capsicum frutesense genetic resources according to claim 1 or 2 for predicting the color of the ivory color of the genetic resources Kit. 삭제delete 삭제delete
KR1020190103645A 2019-08-23 2019-08-23 Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof KR102174017B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190103645A KR102174017B1 (en) 2019-08-23 2019-08-23 Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190103645A KR102174017B1 (en) 2019-08-23 2019-08-23 Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof

Publications (1)

Publication Number Publication Date
KR102174017B1 true KR102174017B1 (en) 2020-11-04

Family

ID=73571356

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190103645A KR102174017B1 (en) 2019-08-23 2019-08-23 Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof

Country Status (1)

Country Link
KR (1) KR102174017B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103695537A (en) * 2013-11-29 2014-04-02 西北农林科技大学 Method for rapidly identifying functions of pepper fruit color development related genes
KR20160069382A (en) * 2014-12-08 2016-06-16 순천대학교 산학협력단 Method for determining yellow color of vegetable fruit
US9723797B2 (en) * 2013-06-21 2017-08-08 Seminis Vegetable Seeds, Inc. Selection of mature fruit color in pepper plants

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9723797B2 (en) * 2013-06-21 2017-08-08 Seminis Vegetable Seeds, Inc. Selection of mature fruit color in pepper plants
CN103695537A (en) * 2013-11-29 2014-04-02 西北农林科技大学 Method for rapidly identifying functions of pepper fruit color development related genes
KR20160069382A (en) * 2014-12-08 2016-06-16 순천대학교 산학협력단 Method for determining yellow color of vegetable fruit

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NCBI REFERENCE SEQUENCE: NM_001324967 *
NCBI REFERENCE SEQUENCE: NM_001325069 *

Similar Documents

Publication Publication Date Title
Ellison et al. Fine mapping, transcriptome analysis, and marker development for Y2, the gene that conditions β-carotene accumulation in carrot (Daucus carota L.)
US11578336B2 (en) Tobacco plant and method for manufacturing same
Ori et al. Regulation of LANCEOLATE by miR319 is required for compound-leaf development in tomato
Jeong et al. Single‐molecule real‐time sequencing reveals diverse allelic variations in carotenoid biosynthetic genes in pepper (Capsicum spp.)
CN106470544B (en) The melon plant that fruit yield improves
US20230242932A1 (en) Autoflowering Markers
KR100984736B1 (en) Marker for selecting brown planthopper-resistant rice cultivar
CN110904266A (en) Identification of maize stalk lodging resistance QTL and development and application of molecular marker
AU2020233660A1 (en) Disease resistance loci in onion
EP3597744A1 (en) Tobacco plant and production method thereof
CN110093346A (en) With the molecular marker and application thereof of purple tsai-tai a kind of sedge color gene linkage
KR102174017B1 (en) Composition for predicting color of full ripe fruit of Capsicum genetic resource and uses thereof
WO2016093387A1 (en) Method for determining orange color of fruit or vegetable
KR101814173B1 (en) Method for determining green color of tomato fruit
CN109468330B (en) Barley yellow mosaic disease resistance gene eIF4EHOR3298And identification method and application thereof
ES2711627T3 (en) Genetic markers for resistance to orobanca in sunflower
AU2019253139A1 (en) Genes associated with resistance to wheat yellow rust
KR101720582B1 (en) Markers for discrimination of solanum nigrum from other solanum species including potato(s. tuberosum) using chloroplast sequences and method
KR100331183B1 (en) Psy mutant gene involved with hot pepper red color determination and process for selection breeding
RU2718584C2 (en) Molecular markers of rlm4 gene of brassica napus black stem resistance and methods of using them
KR102390826B1 (en) CAPS marker for selecting orange flesh watermelon and uses thereof
KR102286619B1 (en) Molecular marker for predicting color of full ripe fruit of pepper and uses thereof
KR101832458B1 (en) Molecular marker for determining yellow fruit in tomato and sorting method for yellow tomato using same
JP7493802B2 (en) Genes involved in regulating the amount of assimilates distributed to edible parts in Solanaceae plants and their utilization
Babak et al. Development of DNA-markers to fruit quality genes of sweet pepper (Capsicum annuum L.)

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant