KR20230165037A - 이탈리안 라이그라스 ir605 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 ir605 품종 식별 방법 - Google Patents

이탈리안 라이그라스 ir605 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 ir605 품종 식별 방법 Download PDF

Info

Publication number
KR20230165037A
KR20230165037A KR1020220064924A KR20220064924A KR20230165037A KR 20230165037 A KR20230165037 A KR 20230165037A KR 1020220064924 A KR1020220064924 A KR 1020220064924A KR 20220064924 A KR20220064924 A KR 20220064924A KR 20230165037 A KR20230165037 A KR 20230165037A
Authority
KR
South Korea
Prior art keywords
base
seq
variety
italian ryegrass
polynucleotide
Prior art date
Application number
KR1020220064924A
Other languages
English (en)
Inventor
이기원
이상훈
우제훈
천동원
정기화
Original Assignee
대한민국(농촌진흥청장)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국(농촌진흥청장) filed Critical 대한민국(농촌진흥청장)
Priority to KR1020220064924A priority Critical patent/KR20230165037A/ko
Publication of KR20230165037A publication Critical patent/KR20230165037A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Botany (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 이탈리안 라이그라스 IR605 품종 식별용 조성물에 관한 것으로, 서열번호 1 또는 서열번호 2, 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(single nucleotide polymorphism, SNP) 마커를 검출할 수 있는 제제를 포함한다.

Description

이탈리안 라이그라스 IR605 품종 식별용 SNP 마커 및 이를 이용한 이탈리안 라이그라스 IR605 품종 식별 방법{SNP MARKERS FOR DISCRIMINATING ITALIAN RYEGRASS IR605 VARIETIES AND METHOD FOR DISCRIMINATING ITALIAN RYEGRASS IR605 VARIETIES USING THE SAME}
본 발명은 이탈리안 라이그라스 IR605 품종 식별용 SNP 마커 및 이를 이용한 이탈리안 라이그라스 IR605 품종 식별 방법에 관한 것이다.
최근 국제 곡물가격의 변동 심화, 기상이변 등 불안정한 곡물사료 수급의 안정과 축우농가의 사료비 부담을 완화하기 위하여, 정부는 조사료 생산기반을 확충하기 위하여 양질 조사료 증산대책과 더불어 다양한 지원 정책을 실시하고 있다. 국내에서 조사료 생산기반이 확대되고 재배 면적이 급격히 증가하면서 해외로부터 사료 작물의 종자 수입량도 매년 증가하고 있는 추세이다.
각 품종에 다른 최적의 재배 방법이 다소 상이하기 때문에, 양질의 조사료 생산을 위하여 품종을 식별하는 것은 조사료의 생산성을 높이고 결국 농가의 이익을 증대시킬 수 있다. 하지만, 이탈리안 라이그라스의 종자는 형태적 특성이 비슷하여 육안으로 품종 구별이 힘들어 출현 후 생육 및 형태적 특성을 이용하여 품종을 구별하고 있는 실정이다. 심지어, 출현 후 생육 및 형태적 특성을 이용하여 품종을 구별한다고 하더라도 이탈리안 라이그라스 중에서 극조생종, 조생종, 중생종, 만생종, 및/또는 수입종을 명확하게 구별하기 어렵다.
이러한 품종 식별의 문제점을 해결하기 위하여 최근 많은 연구자들에 의해 생화학분석법을 이용한 품종 식별에 대한 접근이 시도되고 있다.
본 발명의 목적은 이탈리안 라이그라스 IR605 품종을 식별할 수 있는 이탈리안 라이그라스 IR605 품종 식별용 SNP 마커 및 이를 이용한 이탈리안 라이그라스 IR605 품종 식별 방법을 제공하는 것이다.
본 발명은 이탈리안 라이그라스 IR605 품종 식별용 조성물에 관한 것으로, 서열번호 1 또는 서열번호 2, 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(single nucleotide polymorphism, SNP) 마커를 검출할 수 있는 제제를 포함한다.
본 발명의 일 실시예에 있어서, 상기 단일염기다형성 마커는, 서열번호 1의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 G 또는 A이고, 서열번호 2의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고, 서열번호 3의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 T이고, 서열번호 4의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 T 또는 C이고, 서열번호 5의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고, 서열번호 6의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고, 서열번호 7의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 A 또는 C이고, 서열번호 8의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 G 또는 T이고, 서열번호 9의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 G 또는 T인 단일염기다형성 마커일 수 있다.
본 발명의 일 실시예에 있어서, 상기 단일염기다형성 마커를 검출할 수 있는 제제는 단일염기다형성 마커 부위를 포함하는, 10개 내지 350개의 연속적인 DNA 서열로 구성되는 폴리뉴클레오티드; 또는 이의 상보적인 폴리뉴클레오티드;와 특이적으로 혼성화(hybridization)하는 폴리뉴클레오티드일 수 있다.
본 발명의 일 실시예에 있어서, 상기 폴리뉴클레오티드는 단일염기다형성 마커를 검출할 수 있는 프라이머, 프로브, 및 이들의 조합으로 구성된 군으로부터 선택된 하나 이상일 수 있다.
본 발명은 이탈리안 라이그라스 IR605 품종 식별 키트에 관한 것으로, 서열번호 1 또는 서열번호 2, 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(single nucleotide polymorphism, SNP) 마커를 검출할 수 있는 제제를 포함하는 이탈리안 라이그라스 IR605 품종 식별용 조성물을 포함한다.
본 발명은 이탈리안 라이그라스 IR605 품종 식별 방법에 관한 것으로, 이탈리안 라이그라스의 DNA를 추출하는 단계; 상기 추출된 DNA를 주형으로 하고, 이탈리안 라이그라스 IR605 품종 식별용 조성물을 이용하여 중합효소연쇄반응(PCR)을 수행하는 단계; 및 상기 중합효소연쇄반응에 의해 생성된 산물을 분석하여 상기 이탈리안 라이그라스의 품종을 식별하는 단계;를 포함한다.
본 발명의 일 실시예에 있어서, 상기 품종을 식별하는 단계는, 상기 이탈리안 라이그라스의 DNA 중, 서열번호 1로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 A이거나 서열번호 2로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 G이고, 서열번호 3으로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고, 서열번호 4로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T이고, 서열번호 5로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고, 서열번호 6으로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고, 서열번호 7로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고, 서열번호 8로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T이고, 서열번호 9로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T인 경우, 상기 이탈리안 라이그라스가 IR605 품종인 것으로 식별할 수 있다.
본 발명의 일 실시예에 있어서, 상기 이탈리안 라이그라스의 품종은 코위너(Kowinner), 코스피드(Kospeed), 그린콜(Green Call), 그린콜(Green Call) 2호, IR601, IR602, IR603, IR605, IR901, 그린팜(Green Farm), 그린팜(Green Farm) 2호, 그린팜(Green Farm) 3호, 코윈어리(Kowinearly), 애스(AE), 화산 101호, 화산 102호, 화산 104호, 헤르쿨레스(HC), 코윈마스터(Kowinmaster), 코그린(Kogreen), 플로리다(Florida), 빌켄(Billiken), 및 리오(Rio) 중 어느 하나일 수 있다.
본 발명은 이탈리안 라이그라스 IR605 품종 식별용 조성물에 관한 것으로, 서열번호 1 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(single nucleotide polymorphism, SNP) 마커를 검출할 수 있는 제제를 포함한다.
본 발명은 이탈리안 라이그라스 IR605 품종 식별용 조성물에 관한 것으로, 서열번호 2 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(single nucleotide polymorphism, SNP) 마커를 검출할 수 있는 제제를 포함한다.
본 발명의 일 실시예에 따른 이탈리안 라이그라스 IR605 품종 식별용 SNP 마커 및 이를 이용한 이탈리안 라이그라스 IR605 품종 식별 방법을 활용하면, 이탈리안 라이그라스 IR605 품종을 식별할 수 있다.
도 1은 본 발명의 일 실시예에 따른 이탈리안 라이그라스 샘플의 gDNA 전기영동 결과를 나타낸 것이다.
도 2는 본 발명의 일 실시예에 따른 GBS 라이브러리를 대상으로 전기영동을 실시한 결과를 나타낸 것이다.
도 3은 본 발명의 일 실시예에 따른 분석 모식도를 나타낸 것이다.
도 4는 본 발명의 일 실시예에 따른 개체간 유연관계 분석 결과인 계통수를 나타낸 것이다.
도 5a 및 도 5b는 본 발명의 일 실시예에 따른 두 가지 요소에 의한 주성분 분석 결과를 나타낸 것이다.
도 6은 본 발명의 일 실시예에 따른 세 가지 요소에 의한 주성분 분석 결과를 나타낸 것이다.
도 7은 본 발명의 일 실시예에 따른 델타-K 메소드 결과를 나타낸 그래프이다.
도 8은 본 발명의 일 실시예에 따라 K 값이 2인 피크에서의 포퓰레이션 스트럭쳐 분석 결과를 나타낸 그래프이다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 이탈리안 라이그라스 IR605 품종 식별용 SNP 마커 및 이를 이용한 이탈리안 라이그라스 IR605 품종 식별 방법을 상세히 설명하기로 한다.
이에 앞서, 본 명세서 및 청구범위에 사용된 용어는 사전적인 의미로 한정 해석되어서는 아니되며, 발명자는 자신의 발명을 최선의 방법으로 설명하기 위해 용어의 개념을 적절히 정의할 수 있다는 원칙에 입각하여, 본 발명의 기술적 사상에 부합되는 의미와 개념으로 해석되어야 한다.
상세한 설명, 도면들, 및 청구항들에서 상술하는 예시적인 실시 예들은 한정을 위한 것이 아니며, 다른 실시 예들이 이용될 수 있으며, 여기서 개시되는 기술의 사상이나 범주를 벗어나지 않는 한 다른 변경들도 가능하다.
따라서, 본 명세서에 기재된 실시 예 및 도면에 도시된 구성은 본 발명의 바람직한 실시 예에 불과할 뿐이고, 본 발명의 기술적 사상을 모두 표현하는 것은 아니므로, 본 출원 시점에 있어 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 존재할 수 있음을 이해하여야 한다.
당업자는 본 개시의 구성요소들, 즉 여기서 일반적으로 기술되고, 도면에 기재되는 구성요소들을 다양하게 다른 구성으로 배열, 구성, 결합, 및 도안할 수 있으며, 이것들의 모두는 명백하게 고안되며, 본 개시의 일부를 형성하고 있음을 용이하게 이해할 수 있을 것이다.
본 발명은 이탈리안 라이그라스 IR605 품종 식별용 SNP 마커 및 이를 이용한 이탈리안 라이그라스 IR605 품종 식별 방법을 활용하여 이탈리안 라이그라스 IR605 품종을 식별하기 위한 것이다.
생물 종은 일반적으로 형태학적 및 분자생물학적인 방법을 통해 식별할 수 있으며, 특히 분자생물학적 식별 방법은 형태학적 분류의 한계를 보완하여 생물 종의 식별 정확도를 향상시키는데 도움이 되고 있다.
최근 차세대 시퀀싱 기술이 급속도로 발전하고 고도화됨에 따라 생물로부터 유전체 정보를 보다 효율적으로 생산할 수 있게 되었다. 특히 GBS(Genotyping-By-Sequencing)는 차세대 시퀀싱 기술을 바탕으로 새롭게 발전하고 있는 분석법 중 하나이다. 상기 GBS(Genotyping-By-Sequencing) 분석은 제한효소(RE, Restriction Enzyme)를 사용하여 유전체 서열에서 잘리는 영역 주변의 서열만을 시퀀싱하게 되므로, 전장 유전체 분석을 수행하지 않고도 넓은 범위의 유전체 정보를 고루 확보할 수 있다. 또한, 적절한 제한효소를 선택함으로써 유전체 서열 내 반복적인 영역을 피할 수 있으며, 동시에 원하는 영역의 염기 서열을 확보하는 것이 가능하다.
본 명세서에서 '단일염기다형성(SNP, Single Nucleotide Polymorphism)'은 유전체 상에서 A(Adenine), T(Thymine), G(Guanine), C(Cytosine)로 구성되는 염기서열의 한 개가 다른 염기서열로 변한 것을 의미한다. 다형성(polymorphism)이란 하나의 유전자 좌위(locus)에 두 가지 이상의 대립 유전자(allele)가 존재하는 경우를 말하며, 다형성 부위 중 개체에 따라 단일 염기만이 다른 것을 단일염기다형성(SNP)이라 한다. 바람직한 다형성 마커는 선택된 집단에서 1% 이상의 발생빈도를 나타내는 두 가지 이상의 대립 유전자를 갖는다.
본 명세서에서 '대립 유전자(allele)'는 상동 염색체의 동일한 유전자 좌 위에 존재하는 한 유전자의 여러 타입을 의미한다. 상기 대립 유전자는 다형성을 나타내는데 사용될 수 있다.
본 명세서에서 '마커(marker)는 유전적으로 불특정 연관된 유전자 좌(genetic locus)를 동정할 때 참고 점으로 사용되는 염기서열을 의미하며, 상기 마커의 유전자 지도 상의 위치는 유전자 좌로 표시할 수 있다.
본 발명은 이탈리안 라이그라스 IR605 품종 식별용 조성물로, 서열번호 1 또는 서열번호 2, 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(SNP) 마커를 검출할 수 있는 제제를 포함할 수 있다.
예를 들어, 상기 이탈리안 라이그라스 IR605 품종 식별용 조성물은 서열번호 1 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(SNP) 마커를 검출할 수 있는 제제를 포함할 수 있다.
또한, 예를 들어, 상기 이탈리안 라이그라스 IR605 품종 식별용 조성물은 서열번호 2 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(SNP) 마커를 검출할 수 있는 제제를 포함할 수 있다.
본 발명의 일 실시예에 따른 단일염기다형성(SNP) 마커는, 서열번호 1의 염기서열로 표시되는 폴리뉴클레오티드(polynucleotide)에서 301번째 염기가 G 또는 A이고, 서열번호 2의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고, 서열번호 3의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 T이고, 서열번호 4의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 T 또는 C이고, 서열번호 5의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고, 서열번호 6의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고, 서열번호 7의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 A 또는 C이고, 서열번호 8의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 G 또는 T이고, 서열번호 9의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 G 또는 T일 수 있다.
본 발명의 일 실시예에 따른 상기 서열번호 1 내지 9의 염기서열 내 특정 지점에 A, C, G, 및 T 중 어느 염기나 포함될 수 있다면 다중염기기재 방식에 따라 “n”으로 기재될 수 있다.
본 발명의 일 실시예에 따른 상기 서열번호 1 또는 서열번호 2, 및 서열번호 3 내지 9의 염기서열 중 서열번호의 301번째 염기는 다중염기기재 방식에 따라 작성될 수 있다.
예를 들어, 대립유전자형이 C/G인 경우 C 또는 G일 수 있으므로 “s”로 기재될 수 있다. 또한, 예를 들어, 대립유전자형이 T/C인 경우 T 또는 C일 수 있으므로, “y”로 기재될 수 있다. 또한, 예를 들어, 대립유전자형이 A/T인 경우 A 또는 T일 수 있으므로, “w”로 기재될 수 있다. 또한, 예를 들어, 대립유전자형이 G/A인 경우 G 또는 A일 수 있으므로 “r”로 기재될 수 있다. 또한, 예를 들어, 대립유전자형이 A/C인 경우 A 또는 C일 수 있으므로 “m”으로 기재될 수 있다. 또한, 예를 들어, 대립유전자형이 G/T인 경우 G 또는 T일 수 있으므로 “k”로 기재될 수 있다.
본 발명의 일 실시예에 따른 단일염기다형성(SNP) 마커를 검출할 수 있는 제제는 단일염기다형성 마커 부위를 포함하는, 10개 내지 350개의 연속적인 DNA 서열로 구성되는 폴리뉴클레오티드; 또는 이의 상보적인 폴리뉴클레오티드;와 특이적으로 혼성화(hybridization)하는 폴리뉴클레오티드인 것이 바람직하나, 이에 제한되지 않는다. 바람직하게, 상기 단일염기다형성(SNP) 마커를 검출할 수 있는 제제는 폴리뉴클레오티드일 수 있으며, 이는 단일염기다형성 마커를 검출할 수 있는 프라이머, 프로브, 및 이들의 조합으로 구성된 군으로부터 선택된 하나 이상일 수 있다.
본 명세서에서 '프라이머(primer)'는 짧은 자유 3' 말단 수산화기(free 3' hydroxyl group)를 가지는 염기 서열로 상보적인 템플레이트(template)와 염기쌍(base pair)을 형성할 수 있고 주형 가닥 복사를 위한 시작 지점으로 기능을 하는 짧은 서열을 의미한다. 상기 프라이머는 적절한 완충 용액 및 온도에서 중합반응을 위한 시약 및 상이한 4가지 뉴클레오사이드 트리포스페이트(nucleoside triphosphate)의 존재 하에서 DNA 합성을 개시할 수 있다. 상기 프라이머 설계 시, 프라이머의 A, G, C, T 함량비, 프라이머 결합체(dimer) 형성 방지, 같은 염기서열의 3회 이상 반복 금지 등 여러 가지 제약이 따르며, 그 외에 단독 PCR 반응조건에 있어서 주형(template) DNA의 양, 프라이머의 농도, dNTP의 농도, Mg2+의 농도, 반응 온도, 반응 시간 등의 조건이 적정해야 한다.
상기의 프라이머는 기본 성질을 변화시키지 않은 추가의 특징을 혼입할 수 있다. 즉, 핵산 서열이 당해 분야에 공지된 많은 수단을 이용하여 변형될 수 있다. 이러한 변형의 예로는 메틸화(methylation), 캡화, 뉴클레오타이드(nucleotide)의 하나 이상의 동족체로의 치환 및 포스포네이트(phosphonate), 포스포트리에스테르(phosphotriester), 포스포아미데이트(phosphoroamidate), 또는 카바메이트(carbamate) 등의 하전되지 않은 연결체나 포스포로티오에이트(phosphorothioate) 또는 포르포로디티오에이트(phosphorodithioate) 등의 하전된 연결체로의 뉴클레오타이드의 변형이 가능하다. 또한, 핵산은 뉴클레아제(nuclease), 독소, 항체, 시그널 펩타이드(signal peptide), 폴리 L 리신 등의 단백질, 아크리딘(acridine) 또는 프소랄렌(Psoralen) 등의 삽입체, 금속, 방사성 급속, 철 산화성 금속 등의 킬레이트화제(chelant) 및 알킬화제(alkylating agent) 등의 하나 이상의 부가적인 공유 결합된 잔기를 가질 수 있다.
또한, 본 발명의 프라이머 서열은 검출 가능한 시그널을 직접적으로 또는 간접적으로 제공할 수 있는 표지를 이용하여 변형시킬 수 있다. 상기 프라이머는 분광학, 광화학, 생화학, 면역화학, 또는 화학적 수단을 이용하여 검출될 수 있는 표지를 포함할 수 있다.
본 발명은 서열번호 1 또는 서열번호 2, 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(SNP) 마커를 검출할 수 있는 제제를 포함하는 이탈리안 라이그라스 IR605 품종 식별용 조성물을 포함하는 이탈리안 라이그라스 IR605 품종 식별 키트를 제공한다.
본 발명의 일 실시예에 따른 이탈리안 라이그라스 IR605 품종 식별 키트는 단일염기다형성(SNP) 마커를 검출하여 이탈리안 라이그라스가 IR605 품종인지 식별할 수 있다. 상기 이탈리안 라이그라스 IR605 품종 식별 키트는 단일염기다형성 마커를 검출하기 위한 폴리뉴클레오티드, 프라이머, 및 프로브 등을 포함할 수 있으며, 식별 방법에 적합한 한 종류 또는 그 이상의 다른 구성 성분, 용액, 또는 장치가 포함될 수 있다.
예를 들어, 본 발명의 이탈리안 라이그라스 IR605 품종 식별 키트는 대립 유전자 특이 중합효소연쇄반응(PCR)을 수행하기 위한 필수 요소를 포함하는 키트일 수 있다. 상기 대립 유전자 특이 중합효소연쇄반응(PCR) 키트는 본 발명의 단일염기다형성(SNP) 마커에 대한 특이적인 폴리뉴클레오티드, 프라이머, 또는 프로브 외에도 테스트 튜브 또는 다른 적절한 컨테이너, 반응 완충액, dNTP(deoxyribonucleotide triphophate), Taq-폴리머레이즈(polymerase), 및 역전사 효소, DNase, RNAse 억제제, DEPC(DiEthyl PyroCarbonate) 수, 및 멸균수 등을 포함할 수 있다.
본 발명은 이탈리안 라이그라스의 DNA를 추출하고, 상기 추출된 DNA를 주형으로 하고 이탈리안 라이그라스 IR605 품종 식별용 조성물을 이용하여 중합효소연쇄반응(PCR)을 수행하고, 상기 중합효소연쇄반응(PCR)에 의해 생성된 산물을 분석하여 상기 이탈리안 라이그라스의 품종을 식별하는 이탈리안 라이그라스 IR605 품종 식별 방법을 제공한다.
상기 이탈리안 라이그라스의 품종은 코위너(Kowinner), 코스피드(Kospeed), 그린콜(Green Call), 그린콜(Green Call) 2호, IR601, IR602, IR603, IR605, IR901, 그린팜(Green Farm), 그린팜(Green Farm) 2호, 그린팜(Green Farm) 3호, 코윈어리(Kowinearly), 애스(AE), 화산 101호, 화산 102호, 화산 104호, 헤르쿨레스(HC), 코윈마스터(Kowinmaster), 코그린(Kogreen), 플로리다(Florida), 빌켄(Billiken), 및 리오(Rio) 품종 중 어느 하나일 수 있으나 이 외 다른 품종을 대상으로도 이탈리안 라이그라스 IR605 품종 식별 방법을 적용할 수 있어, 이에 제한되지 않는다.
상기 코위너(Kowinner)는 이탈리안 라이그라스 내한성 품종을 육성하기 위한 농촌진흥청의 연구에 의해 총 5개의 우량 영양계통 X8907, X9517, X9518, X9519, X8709로 교배조합을 작성하여 육성된 종으로, 4배체 품종으로서 엽의 색은 농녹, 월동 전 초형은 반포복형, 봄의 초형은 중간형인 개체이다. 상기 코위너는 5월 19일경에 출수하는 중만생 품종으로, 화산 101호에 비해 초장 및 최장간장의 길이가 길고, 지엽의 길이가 유사하며, 줄기 두께가 두텁다는 특성을 갖는다.
상기 코스피드(Kospeed)는 이탈리안 라이그라스 내한 조숙성 품종을 육성하기 위한 농촌진흥청의 연구에 의해 총 5개의 우량 영양계통 00CR10, 00CR15, 00CR18, 00CR19, 00CR41로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색이며, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 코스피드는 5월 01일경에 출수하는 조숙성 품종으로, 플로리다(Florida) 80에 비해 지엽의 폭이 넓고, 지엽의 길이가 길며, 초장의 길이가 작았다. 또한, 상기 코스피드의 줄기 두께가 중간 정도에 해당하고, 내한성이 플로리다 80보다 강한 품종이다.
상기 그린콜(Green Call)은 숙기가 빠르고 생산량이 많은 이탈리안 라이그라스 품종을 육성하기 위한 농촌진흥청의 연구에 의해 조생 계통인 총 5개의 09CR02, 09CR04, 09CR06, 09CR09, 09CRR11로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 그린콜은 4월 25일경에 출수하는 극조생종 품종으로, 플로리다(Florida) 80에 비해 지엽 폭, 지엽 길이, 및 초장이 짧고, 줄기 두께가 두꺼우며, 이삭 길이가 대등하다.
상기 그린콜(Green Call) 2호는 숙기가 빠르고 생산량이 많은 이탈리안 라이그라스 품종을 육성하기 위한 농촌진흥청의 연구에 의해 조생 계통인 총 5개의 09CR01, 09CR05, 09CR07, 09CR10, 09CRR12(K191022)로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 그린콜 2호는 4월 24일경에 출수하는 극조생종 품종으로, 플로리다(Florida) 80에 비해 지엽 길이가 길고, 지엽 폭 및 초장이 짧으며, 줄기 두께가 두껍고, 이삭 길이가 대등하다.
상기 아이알(IR)601은 농촌진흥청의 연구에 의해 총 5개의 09CR17, 09CR19, 09CR20, 09CR22, 09CR18로 교배조합을 작성하여 육성된 종으로, 4배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 아이알(IR)601은 5월 18일에 출수하는 만생종 품종으로, 코윈어리에 비해 지엽 길이 및 이삭 길이가 길고, 수당소수수가 많으며, 지엽 폭이 유사하고, 줄기 굵기가 두꺼우며, 최장 간장이 짧다는 특성을 갖는다.
상기 아이알(IR)602는 농촌진흥청의 연구에 의해 총 5개의 09CR15, 09CR16, 09CR21, 09CR13, 09CR14로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 직립형, 봄의 초형은 직립형인 개체이다. 상기 아이알(IR)602는 5월 10일에 출수하는 중생종 품종으로, 코윈어리에 비해 지엽 길이가 약간 길고, 지엽 폭, 이삭 길이, 수당소수수, 및 줄기 굵기가 유사하며, 최장 간장이 짧다는 특성을 갖는다.
상기 아이알(IR)603은 농촌진흥청의 연구에 의해 총 5개의 15CR19, 15CR18, 15CR17, 15CR13, 15CR21로 교배조합을 작성하여 육성된 종으로, 4배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 아이알(IR)603은 5월 16일에 출수하는 만생종 품종으로, 코윈어리에 비해 지엽 길이 및 이삭 길이가 현저히 길고, 수당소수수가 현저히 많으며, 지엽 폭이 유사하고, 줄기 굵기가 현저히 두꺼우며, 최장 간장이 약간 짧다는 특성을 갖는다.
상기 아이알(IR)605는 농촌진흥청의 연구에 의해 총 5개의 12EtYG2N18, 12EtYG2N18, 12EtYG2N27, ARIKG07, ARIXRO18로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 아이알(IR)605는 5월 15일에 출수하는 중생종 품종으로, 코윈어리에 비해 지엽 길이, 초장, 및 이삭 길이가 약간 길고, 수당소수수가 약간 많으며, 지엽 폭 및 줄기 굵기가 유사하다는 특성을 갖는다.
상기 아이알(IR)901은 농촌진흥청의 연구에 의해 총 5개의 12EtHN4NN14, 12EtHN4NN23, ARIXJN09, ARIXJN14, ARIXJN18로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 아이알(IR)901은 5월 22일에 출수하는 만생종 품종으로, 코윈어리에 비해 이삭 길이가 약간 길고, 수당소수수가 약간 많으며, 지엽 길이, 지엽 폭, 줄기 굵기가 유사하다는 특성을 갖는다.
상기 그린팜(Green Farm)은 농촌진흥청의 연구에 의해 총 5개의 06CR47, 06CR16, 06CR80, 06CR11, 06CR26으로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 직립형, 봄의 초형은 반직립형인 개체이다. 상기 그린팜(Green Farm)은 4월 28일에 출수하는 극조생종 품종으로, 플로리다(Florida) 80에 비해 줄기 굵기가 두껍고, 최장 간장이 유사하며, 지엽 길이, 지엽 폭, 및 이삭 길이가 짧고, 수당소수수가 적다는 특성을 갖는다.
상기 그린팜(Green Farm) 2호는 농촌진흥청의 연구에 의해 총 5개의 06CR33, 06CR52, 06CR05, 06CR38, 06CR79로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 그린팜(Green Farm) 2호는 5월 04일에 출수하는 극조생종 품종으로, 플로리다(Florida) 80에 비해 줄기 굵기가 두껍고, 최장 간장 및 지엽 폭이 유사하며, 지엽 길이 및 이삭 길이가 짧고, 수당소수수가 현저히 적다는 특성을 갖는다.
상기 그린팜(Green Farm) 3호는 농촌진흥청의 연구에 의해 총 5개의 08CR01, 08CR06, 08CR07, 08CR11, 08CR16으로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 그린팜(Green Farm) 3호는 4월 27일에 출수하는 극조생종 품종으로, 그린팜(Green Farm)에 비해 지엽 길이, 이삭 길이, 및 최장 간장이 길고, 줄기 굵기 및 수당소수수가 유사하며, 지엽 폭이 좁다는 특성을 갖는다.
상기 코윈어리(Kowinearly)는 농촌진흥청의 연구에 의해 총 5개의 00CR04, 00CR32, 00CR40, 00CR48, 00CR58로 교배조합을 작성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반부복형, 봄의 초형은 반직립형인 개체이다. 상기 코윈어리(Kowinearly)는 5월 03일에 출수하는 조생종 품종으로, 플로리다(Florida) 80에 비해 지엽 길이 및 이삭 길이가 길고, 지엽 폭이 넓으며, 줄기 굵기 및 수당소수수가 유사하고, 최장 간장이 짧다는 특성을 갖는다.
상기 화산 101호는 농촌진흥청의 연구에 의해 총 5개의 94CR01, 94CR02, 94CR03, 94CR10, 93CR06으로 종자합성하여 육성된 종으로, 4배체 품종으로서 엽의 색은 농녹, 월동전 초형은 반포복형, 봄의 초형은 중간형인 개체이다. 상기 화산 101호는 5월 20일에 출수하는 중만생종 품종으로, 마셜(Marshall)에 비해 지엽 폭이 넓고, 이삭 길이 및 수당 소수수가 유사하며, 출수기 초고는 낮다는 특성을 갖는다.
상기 화산 102호는 농촌진흥청의 연구에 의해 총 5개의 93CR04, 93CR05, 93CR07, 93CR08, 93CR09으로 종자합성하여 육성된 종으로, 4배체 품종으로서 엽의 색은 농녹, 월동전 초형은 반포복형, 봄의 초형은 중간형인 개체이다. 상기 화산 102호는 5월 19일에 출수하는 중만생종 품종으로, 마셜(Marshall)에 비해 지엽 폭이 넓고, 이삭 길이 및 수당 소수수가 유사하며, 출수기 초고는 낮다는 특성을 갖는다.
상기 화산 104호는 농촌진흥청의 연구에 의해 총 5개의 P8702, P8705, X8818, BC19107, ELm9107로 교배조합을 작성하여 육성된 종으로, 4배체 품종으로서 엽의 색은 농녹, 월동전 초형은 반부복형, 봄의 초형은 중간형인 개체이다. 상기 화산 104호는 5월 19일에 출수하는 만생종 품종으로, 화산 101호에 비해 지엽 폭이 넓고, 지엽 길이 및 초장이 길고, 줄기의 두께는 두꺼운 특성을 갖는다.
상기 코윈마스터(Kowinmaster)는 이탈리안 라이그라스 내한성 품종을 육성하기 위한 농촌진흥청의 연구에 의해 총 5개의 00CR22, 00CR35, 00CR31, 00CR46, 00CR55로 종자합성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 담녹, 월동 전 초형은 중간형, 봄의 초형은 반직립형인 개체이다. 상기 코윈마스터(Kowinmaster)는 5월 10일에 출수하는 중생종 품종으로, 플로리다(Florida) 80에 비해 지엽 길이 및 이삭 길이가 길고, 지엽 폭, 수당소수수, 최장 간장, 및 줄기 굵기가 유사하다는 특성을 갖는다.
상기 코그린(Kogreen)은 이탈리안 라이그라스 내한성 품종을 육성하기 위한 농촌진흥청의 연구에 의해 총 5개의 00CR02, 00CR05, 00CR24, 00CR28, 00CR43으로 종자합성하여 육성된 종으로, 2배체 품종으로서 엽의 색은 녹색, 월동 전 초형은 반직립형, 봄의 초형은 직립형인 개체이다. 상기 코그린(Kogreen)은 5월 04일에 출수하는 조생종 품종으로, 플로리다(Florida) 80에 비해 지엽 폭이 넓고, 줄기 두께가 두꺼우며, 지엽 길이, 이삭 길이, 및 수당소수수가 유사하다는 특성을 갖는다.
상기 품종을 식별하는 단계는, 상기 중합효소연쇄반응(PCR)에 의해 생성된 산물을 분석하여 상기 이탈리안 라이그라스의 DNA를 파악할 수 있고, 파악된 DNA의 염기 서열을 확인하여 상기 이탈리안 라이그라스의 품종을 식별할 수 있다.
또한, 상기 품종을 식별하는 단계는 상기 이탈리안 라이그라스의 DNA 중, 서열번호 1로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 A이거나 서열번호 2로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 G이고, 서열번호 3으로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고, 서열번호 4로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T이고, 서열번호 5로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고, 서열번호 6으로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고, 서열번호 7로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고, 서열번호 8로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T이고, 서열번호 9로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T인 경우, 상기 이탈리안 라이그라스의 품종을 IR605 품종으로 식별할 수 있다.
실시예 1: 이탈리안 라이그라스 샘플을 이용한 GBS 라이브러리 서열 분석
실시예 1-1: 이탈리안 라이그라스 샘플 준비
하기 표 1은 GBS(Genotyping-By-Sequencing) 라이브러리(library) 제작에 사용된 96개의 이탈리안 라이그라스 샘플 리스트를 나타낸 표이다.
상기 표 1을 참조하면, GBS 라이브러리 제작에 사용된 96개의 이탈리안 라이그라스 샘플 리스트를 확인할 수 있다. KW는 코윈어리(Kowinearly) 품종을 의미하고, KS는 코스피드(Kospeed) 품종을 의미하고, GC는 그린콜(Green Call) 품종을 의미하고, GC2는 그린콜(Green Call) 2호 품종을 의미하고, 601, 602, 603, 605, 및 901은 아이알601(IR601), 아이알602(IR602), 아이알603(IR603), 아이알605(IR605), 및 아이알901(IR901) 품종을 의미하고, GF는 그린팜(Green farm) 품종을 의미하고, GF2는 그린팜(Green Farm) 2호 품종을 의미하고, GF3은 그린팜(Green Farm) 3호 품종을 의미하고, KWR은 코위너(Kowinner) 품종을 의미하고, AE는 애스(ACE) 품종에서 출수기가 빠른 선발된 계통을 의미하고, HS101, HS102, HS104는 화산 101호, 화산 102호, 및 화산 104호 품종을 의미하고, HC는 헤르쿨레스(Hercules) 품종에서 출수기가 빠른 선발된 계통을 의미하고, KM은 코윈마스터(Kowinmaster) 품종을 의미하고, KG는 코그린(Kogreen) 품종을 의미하고, FLO는 플로리다(Florida)80 품종을 의미하고, BK는 빌켄(Billiken) 품종을 의미하고, Rio는 리오(Rio) 품종을 의미한다. 총 24종의 품종을 대상으로 각각 4개의 샘플을 준비하였으므로, 총 96개의 이탈리안 라이그라스 샘플을 준비하였다.
실시예 1-2: 이탈리안 라이그라스 샘플의 gDNA QC(Quality Check)
도 1은 본 발명의 일 실시예에 따른 이탈리안 라이그라스 샘플의 gDNA 전기영동 결과를 나타낸 것이다.
도 1을 참조하면, 앞서 실시예 1-1에서 준비된 총 96개의 샘플의 gDNA를 대상으로 전기영동을 실시한 것을 확인할 수 있다. 상기 과정을 통해, GBS(Genotyping-By-Sequencing) 라이브러리 제작에 적합한 96개의 샘플의 gDNA를 확인하였다.
실시예 1-3: 이탈리안 라이그라스 샘플의 GBS(Genotyping-By-Sequencing) 라이브러리 제작
본 발명의 일 실시예에 따른 GBS(Genotyping-By-Sequencing) 라이브러리는, 각 바코드 어댑터의 상단 및 하단 가닥과 공통 어댑터를 포함하는 올리고뉴클레오타이드(oligonucleotide)를 대상으로 어닐링(annealing)하는 단계, 준비된 이탈리안 라이그라스 샘플의 DNA를 제한효소(RE, Restriction Enzyme)인 ApekⅠ으로 분해하는 단계, 어댑터를 gDNA 단편의 끝에 연결하는 단계, 가열하여 리가아제를 불활성화하고 각 샘플을 합친(풀링, pooling) 후 미반응 어댑터를 제거하는 정제를 실시하는 단계, 결찰된 어댑터에 결합 부위를 갖는 적절한 프라이머를 추가하고 멀티플렉스(multiplex) PCR을 수행하는 단계, 및 PCR 산물을 정리하고 아가로스 겔 러닝(agarose gel running)을 실시하여 확인하는 단계를 거쳐 제작되었다.
보다 상세하게, GBS 라이브러리는 제한 효소 ApekⅠ을 사용하여 제작하였다. 각 바코드 어댑터와 공통 어댑터를 포함하는 올리고뉴클레오타이드(oligonucleotide)를 50 uM의 TE 버퍼(10 mM Tris, 0.1 mM EDTA)에 희석하고, 열 순환기(thermocycler)에서 어닐링(annealing)을 진행하였다. 이후, 10x 어댑터 버퍼(500 mM NaCl, 100 mM Tris-Cl)를 이용하여 바코드 및 일반 어댑터를 10 uM로 희석하고 1:1 비율로 함께 혼합한 다음 2.4 ㎕의 믹스를 96웰 PCR 플레이트에 추가하였다. 샘플 DNA(100 ng/㎕)를 개별 어댑터가 함유된 웰에 첨가하였고, 샘플(DNA + 어댑터)은 1x NEB 버퍼 3 및 3.6 U ApekⅠ을 포함하는 20 ㎕ 부피로 75℃에서 반응시켰다. 샘플을 22℃에서 배양하고 65℃에서 20분 동안 가열하여 T4 DNA 리가아제를 불활성화시켰다. 이후, 각각 다른 바코드 어댑터를 갖는 96개 DNA 샘플(각각 5 ㎕) 세트를 조합하였고, 키트(QIAquick PCR Purification Kit, Qiagen, CA)를 사용하여 정제하였다. 풀링된 DNA 단편 2 ㎕, DNA 폴리머라아제(Agilent) 및 25 pmol의 프라이머를 이용하여, Life ECO Thermal Cycler(Bioer Technology Co.)를 통해 PCR을 수행하여 각 라이브러리의 제한 단편을 증폭하여 라이브러리를 구축하였다.
실시예 1-4: 제작된 GBS 라이브러리 정제
앞서 실시예 1-3에서 제작된 GBS(Genotyping-By-Sequencing) 라이브러리를 대상으로 2차례에 걸친 정제(purification) 과정을 실시하였고, 그 결과는 하기 표 2와 같다.
No Sample 1st Purification 2nd Purification
1 이탈리안라이그라스 GBS library set-1(IRG-1) O O
2 이탈리안라이그라스 GBS library set-2(IRG-2) O O
3 이탈리안라이그라스 GBS library pooling X O
4 Positive control O O
5 Negative control X O
도 2는 본 발명의 일 실시예에 따른 GBS 라이브러리를 대상으로 전기영동을 실시한 결과를 나타낸 것이다. 상기 전기영동은 1.5% 아가로스 겔을 사용하여 200v로 30분동안 실시되었으며, 100bp 마커(M, Marker) 및 라이브러리는 각각 5㎕씩 사용되었다.
도 2를 참조하면, 본 발명의 일 실시예에 따른 GBS(Genotyping-By-Sequencing) 라이브러리(library)는 스메어(smear)하게 끌리듯 형성된 것을 확인할 수 있다. 특히, 250bp 내지 350bp에서 농도가 높게 나타났다.
실시예 1-5: GBS 라이브러리 QC(Quality Check)
앞서 실시예 1-4에서 정제된 GBS(Genotyping-By-Sequencing) 라이브러리를 대상으로 퀄리티 체크(QC, Quality Check)를 실시하였다.
하기 표 3은 상기 GBS(Genotyping-By-Sequencing) 라이브러리를 대상으로 실시된 퀄리티 체크(QC)의 결과를 나타낸 것이다.
Library Name Library Type Conc.
(ng/㎕)
Conc.
(nM)
Size
(bp)
Result
1 IRG-1 GBS library (single enzyme) 11.62 39.62 451 Pass
2 IRG-2 GBS library (single enzyme) 11.68 35.64 504 pass
상기 표 3을 참조하면, IRG-1의 nM 단위의 농도 값이 더 높은 것을 확인할 수 있다. 이에 따라, 이후 실시예에서는 IRG-1 라이브러리를 사용하기로 결정하였다.
도 3은 본 발명의 일 실시예에 따른 분석 모식도를 나타낸 것이다.
도 3을 참조하면, 이후 실시예에서 진행될 분석의 순서를 확인할 수 있다. 이후 실시예에서는 GBS(Genotyping-By-Sequencing) 데이터를 추출하고, 시퀀스 디멀티플렉싱(Sequence demultiplexing) 및 프리-프로세싱(Pre-processing)을 실시하고, 레퍼런스 게놈(reference genome)에 매핑(mapping)하고, 로우(raw) SNP (In/Del)을 디텍션(detection)하며 컨센서스 시퀀스(consensus sequence, 공통염기서열)를 추출하고, SNP 매트릭스를 생성하고, SNP 필터링 및 셀렉션(selection)을 실시하고, 선택된 SNP를 적용하거나 그룹 중에서 다형성 SNP를 선발할 수 있다. 보다 상세한 내용은 하기 실시예를 통해 개시될 것이다.
실시예 2: GBS data
실시예 2-1: Sequencing raw data
앞서 실시예 1에서 제작된 IRG-1 라이브러리를 사용하고, 일루미나(illumine) 하이식(HiSeq) X 10 장비를 사용하여 1 레인(약 100Gbp) 시퀀싱을 진행하였다.
하기 표 4는 IRG-1 라이브러리를 사용하여 진행된 시퀀싱 결과를 나타낸 것이다.
Plate No. of barcode No. of sample No. of reads Avg. length (bp) Total length (bp) GC
(%)
Q30
(%)
No. of
demultiplexed reads (%)
1차 생산1 96 96 391,722,338 151 59,150,073,038 48.36 93.46 675,379,548 (86.21%)
1차 생산2 391,722,338 151 59,150,073,038
추가 생산1 96 96 375,155,903 151 56,648,541,353 48.39 92.69 646,988,004 (86.23%)
추가 생산2 375,155,903 151 56,648,541,353
Total 192 96 1,533,756,482 231,597,228,782
상기 표 4를 참조하면, 앞서 제작된 IRG-1 라이브러리를 사용하여 이탈리안 라이그라스 96개의 샘플에 대한 시퀀싱 로우 데이터(sequencing law data)를 확보한 것을 확인할 수 있다.
실시예 2-2: GBS sequencing pre-processing
앞서 실시예 1에서 제작된 IRG-1 라이브러리의 바코드 시퀀스(barcode sequence)를 이용하여 샘플 별로 서열을 분리하는 디멀티플렉싱(역다중화, demultiplexing)를 수행하였다.
하기 표 5는 본 발명의 일 실시예에 따른 디멀티플렉싱(demultiplexing)을 통한 샘플 별 로우(raw) 데이터 통계치를 나타낸 것이다.
BarCode Sample name Sum of raw reads Total length of raw reads
CTCC KW_01 27,984,674 4,225,685,774
TGCA KW_02 20,508,824 3,096,832,424
ACTA KW_03 10,094,474 1,524,265,574
CAGA KW_04 11,023,322 1,664,521,622
AACT KS_01 24,973,212 3,770,955,012
GCGT KS_02 20,586,020 3,108,489,020
CGAT KS_03 16,037,266 2,421,627,166
GTAA KS_04 5,343,352 806,846,152
AGGC GC2_01 43,252,098 6,531,066,798
GATC GC2_02 28,706,912 4,334,743,712
TCAC GC2_03 18,224,244 2,751,860,844
TGCGA GC2_04 10,023,360 1,513,527,360
CGCTT GC_01 23,261,356 3,512,464,756
TCACC GC_02 26,581,886 4,013,864,786
CTAGC GC_03 19,102,102 2,884,417,402
ACAAA GC_04 13,195,778 1,992,562,478
TTCTC 901_01 56,763,672 8,571,314,472
AGCCC 901_02 24,411,272 3,686,102,072
GTATT 901_03 24,158,770 3,647,974,270
CTGTA 901_04 7,742,580 1,169,129,580
ACCGT 605_01 29,695,634 4,484,040,734
GCTTA 605_02 10,394,096 1,569,508,496
GGTGT 605_03 7,667,484 1,157,790,084
AGGAT 605_04 13,233,298 1,998,227,998
ATTGA 604_01 4,852,450 732,719,950
CATCT 604_02 25,011,476 3,776,732,876
CCTAC 604_03 34,245,834 5,171,120,934
GAGGA 604_04 12,545,584 1,894,383,184
GGAAC 603_01 22,336,060 3,372,745,060
GTCAA 603_02 16,499,444 2,491,416,044
TAATA 603_03 11,454,554 1,729,637,654
TACAT 603_04 15,046,218 2,271,978,918
TCGTT 602_01 10,197,584 1,539,835,184
GGTTGT 602_02 11,741,306 1,772,937,206
CCAGCT 602_03 10,880,226 1,642,914,126
TTCAGA 602_04 3,457,092 522,020,892
TAGGAA 601_01 5,693,774 859,759,874
GCTCTA 601_02 3,661,468 552,881,668
CCACAA 601_03 6,965,674 1,051,816,774
CTTCCA 601_04 7,619,840 1,150,595,840
GAGATA GF3_01 16,284,028 2,458,888,228
ATGCCT GF3_02 36,885,684 5,569,738,284
AGTGGA GF3_03 2,874,510 434,051,010
ACCTAA GF3_04 7,997,846 1,207,674,746
ATATGT GF2_01 11,568,158 1,746,791,858
ATCGTA GF2_02 6,219,668 939,169,868
CATCGT GF2_03 17,454,040 2,635,560,040
CGCGGT GF2_04 18,283,940 2,760,874,940
CTATTA GF_01 11,180,026 1,688,183,926
GCCAGT GF_02 16,376,054 2,472,784,154
GGAAGA GF_03 4,017,876 606,699,276
GTACTT GF_04 26,145,584 3,947,983,184
GTTGAA KWR_01 8,605,762 1,299,470,062
TAACGA KWR_02 5,258,768 794,073,968
TGGCTA KWR_03 7,583,138 1,145,053,838
TATTTTT KWR_04 30,645,534 4,627,475,634
CTTGCTT AE_01 12,043,426 1,818,557,326
ATGAAAC AE_02 17,350,990 2,619,999,490
AAAAGTT AE_03 15,840,586 2,391,928,486
GAATTCA AE_04 14,806,830 2,235,831,330
GAACTTC HS104_01 21,381,014 3,228,533,114
GGACCTA HS104_02 4,089,342 617,490,642
GTCGATT HS104_03 12,723,770 1,921,289,270
AACGCCT HS104_04 14,317,194 2,161,896,294
AATATGC HC_01 20,170,526 3,045,749,426
ACGTGTT HC_02 14,699,634 2,219,644,734
ATTAATT HC_03 8,487,060 1,281,546,060
ATTGGAT HC_04 11,535,506 1,741,861,406
CATAAGT HS102_01 7,520,160 1,135,544,160
CGCTGAT HS102_02 7,965,080 1,202,727,080
CGGTAGA HS102_03 2,530,602 382,120,902
CTACGGA HS102_04 8,076,456 1,219,544,856
GCGGAAT HS101_01 21,054,910 3,179,291,410
TAGCGGA HS101_02 13,352,672 2,016,253,472
TCGAAGA HS101_03 4,452,216 672,284,616
TCTGTGA HS101_04 8,781,464 1,326,001,064
TGCTGGA KM_01 8,381,220 1,265,564,220
ACGACTAC KM_02 15,430,376 2,329,986,776
TAGCATGC KM_03 10,553,204 1,593,533,804
TAGGCCAT KM_04 11,838,336 1,787,588,736
TGCAAGGA KG_01 6,387,922 964,576,222
TGGTACGT KG_02 13,455,236 2,031,740,636
TCTCAGTC KG_03 20,725,562 3,129,559,862
CCGGATAT KG_04 9,328,880 1,408,660,880
CGCCTTAT FLO_01 8,434,712 1,273,641,512
AACCGAGA FLO_02 3,945,090 595,708,590
ACAGGGAA FLO_03 3,202,022 483,505,322
ACGTGGTA FLO_04 5,163,006 779,613,906
CCATGGGT BK_01 7,995,282 1,207,287,582
CGCGGAGA BK_02 3,333,304 503,328,904
CGTGTGGT BK_03 4,666,524 704,645,124
GCTGTGGA BK_04 2,680,124 404,698,724
GGATTGGT Rio_01 8,503,012 1,283,954,812
GTGAGGGT Rio_02 5,582,316 842,929,716
TATCGGGA Rio_03 7,055,828 1,065,430,028
TTCCTGGA Rio_04 1,971,272 297,662,072
평균(AVG) 13,774,662 13,429,185
합계(SUM) 1,322,367,552 1,289,201,798
또한, 디멀티플렉싱(demultiplexing)을 통한 샘플 별 로우(raw) 데이터를 대상으로 바코드(barcode) 및 어댑터 시퀀스(adapter sequence)를 제거하고, 시퀀스 퀄리티 트리밍(sequence quality trimming)을 수행하였다.
어댑터 트리밍(adapter trimming)은 컷어댑트(cutadapt, version 1.8.3) 프로그램을 사용하고, 시퀀스 퀄리티 트리밍(sequence quality trimming)은 솔렉사큐에이 패키지(SolexaQA package)의 다이나믹트림(DynamicTrim)과 렝스솔트(LengthSort) 프로그램을 사용하였다.
상기 다이나믹트림(DynamicTrim)은 프레드 스코어(phred score)에 따라 숏 리드(short read)의 양쪽 끝의 배드 퀄리티 베이스(bad quality base)를 잘라내고 양질의 클린 리드(cleaned read)로 정제하는 과정을 수행하며, 렝스솔트(LengthSort)는 다이나믹트림(DynamicTrim)에서 너무 많은 베이스(base)가 잘린 리드(read)를 제거하는 과정을 수행하였다. 다이나믹트림(DynamicTrim)에서 프레드 스코어(phred score)는 20 이상을, 렝스솔트(LengthSort)에서 숏 리드 렝스(short read length)는 25bp(base pair) 이상을 사용하였다.
하기 표 6은 프레드 퀄리티 스코어의 점수에 따른 정확도를 나타낸 것이다.
Phred Quality Score Probability of Incorrect Base Call Base call Accuracy
10 1 in 10 90%
20 1 in 100 99%
30 1 in 1,000 99.9%
40 1 in 10,000 99.99%
상기 표 6을 참조하면, 본 발명의 일 실시예에 따른 상기 다이나믹트림(Dynamic Trim)에서는 베이스 콜 애큐러시(염기 해독 정확도, base call accuracy)가 99% 이상인 것을 사용했음을 확인할 수 있다.
하기 표 7은 본 발명의 일 실시예에 따른 디멀티플렉싱(demultiplexing)을 통한 샘플 별 트리밍(trimming)된 데이터 통계치를 나타낸 것이다.
BarCode Sample name Sum of trimmed reads Total length of trimmed reads (bp) Avg. length of trimmed reads (bp) Trimmed/Raw (%)
CTCC KW_01 27,275,748 3,451,335,884 126.53 97.47%
TGCA KW_02 19,994,044 2,535,790,267 126.83 97.49%
ACTA KW_03 9,839,642 1,252,579,236 127.30 97.48%
CAGA KW_04 10,751,044 1,363,582,041 126.83 97.53%
AACT KS_01 24,367,894 3,098,411,409 127.15 97.58%
GCGT KS_02 20,110,828 2,560,487,624 127.32 97.69%
CGAT KS_03 15,657,066 1,989,405,726 127.06 97.63%
GTAA KS_04 5,212,994 661,714,594 126.94 97.56%
AGGC GC2_01 42,251,322 5,383,515,857 127.42 97.69%
GATC GC2_02 28,055,162 3,561,867,436 126.96 97.73%
TCAC GC2_03 17,775,900 2,256,018,257 126.91 97.54%
TGCGA GC2_04 9,775,488 1,239,906,948 126.84 97.53%
CGCTT GC_01 22,661,814 2,868,957,974 126.60 97.42%
TCACC GC_02 25,919,568 3,292,060,831 127.01 97.51%
CTAGC GC_03 18,598,778 2,342,989,872 125.98 97.37%
ACAAA GC_04 12,855,874 1,630,601,653 126.84 97.42%
TTCTC 901_01 55,333,290 7,009,107,424 126.67 97.48%
AGCCC 901_02 23,805,438 3,011,204,578 126.49 97.52%
GTATT 901_03 23,583,014 2,994,447,575 126.97 97.62%
CTGTA 901_04 7,546,312 955,762,430 126.65 97.47%
ACCGT 605_01 28,963,328 3,677,531,171 126.97 97.53%
GCTTA 605_02 10,131,974 1,287,061,981 127.03 97.48%
GGTGT 605_03 7,498,770 951,053,597 126.83 97.80%
AGGAT 605_04 12,928,504 1,637,232,763 126.64 97.70%
ATTGA 604_01 4,735,144 601,324,788 126.99 97.58%
CATCT 604_02 24,394,414 3,088,358,722 126.60 97.53%
CCTAC 604_03 33,350,966 4,230,887,688 126.86 97.39%
GAGGA 604_04 12,262,020 1,559,723,150 127.20 97.74%
GGAAC 603_01 21,797,130 2,766,281,029 126.91 97.59%
GTCAA 603_02 16,119,982 2,052,084,130 127.30 97.70%
TAATA 603_03 11,158,524 1,415,077,014 126.82 97.42%
TACAT 603_04 14,663,850 1,859,221,925 126.79 97.46%
TCGTT 602_01 9,957,556 1,264,468,759 126.99 97.65%
GGTTGT 602_02 11,476,614 1,455,393,357 126.81 97.75%
CCAGCT 602_03 10,596,762 1,336,288,603 126.10 97.39%
TTCAGA 602_04 3,369,536 426,129,681 126.47 97.47%
TAGGAA 601_01 5,553,860 703,419,411 126.65 97.54%
GCTCTA 601_02 3,566,280 451,100,513 126.49 97.40%
CCACAA 601_03 6,771,856 855,511,063 126.33 97.22%
CTTCCA 601_04 7,412,280 934,676,535 126.10 97.28%
GAGATA GF3_01 15,870,268 1,998,349,954 125.92 97.46%
ATGCCT GF3_02 35,908,458 4,494,133,934 125.16 97.35%
AGTGGA GF3_03 2,807,100 355,144,515 126.52 97.65%
ACCTAA GF3_04 7,782,006 984,545,413 126.52 97.30%
ATATGT GF2_01 11,281,864 1,426,204,139 126.42 97.53%
ATCGTA GF2_02 6,056,750 765,613,900 126.41 97.38%
CATCGT GF2_03 17,007,396 2,149,951,332 126.41 97.44%
CGCGGT GF2_04 17,821,792 2,249,742,665 126.24 97.47%
CTATTA GF_01 10,876,724 1,369,550,932 125.92 97.29%
GCCAGT GF_02 15,966,054 2,020,329,611 126.54 97.50%
GGAAGA GF_03 3,921,630 496,165,910 126.52 97.60%
GTACTT GF_04 25,478,418 3,222,074,462 126.46 97.45%
GTTGAA KWR_01 8,398,816 1,062,557,308 126.51 97.60%
TAACGA KWR_02 5,116,732 645,289,422 126.11 97.30%
TGGCTA KWR_03 7,387,354 934,175,295 126.46 97.42%
TATTTTT KWR_04 29,789,550 3,735,900,055 125.41 97.21%
CTTGCTT AE_01 11,719,510 1,474,675,787 125.83 97.31%
ATGAAAC AE_02 16,896,068 2,132,239,778 126.20 97.38%
AAAAGTT AE_03 15,459,336 1,950,733,471 126.18 97.59%
GAATTCA AE_04 14,427,082 1,820,502,390 126.19 97.44%
GAACTTC HS104_01 20,803,738 2,616,639,232 125.78 97.30%
GGACCTA HS104_02 3,984,684 501,708,101 125.91 97.44%
GTCGATT HS104_03 12,428,134 1,568,292,657 126.19 97.68%
AACGCCT HS104_04 13,928,584 1,751,567,681 125.75 97.29%
AATATGC HC_01 19,623,186 2,464,758,296 125.60 97.29%
ACGTGTT HC_02 14,341,476 1,811,119,778 126.29 97.56%
ATTAATT HC_03 8,275,758 1,044,415,849 126.20 97.51%
ATTGGAT HC_04 11,271,380 1,424,145,107 126.35 97.71%
CATAAGT HS102_01 7,325,992 923,497,075 126.06 97.42%
CGCTGAT HS102_02 7,764,184 979,000,772 126.09 97.48%
CGGTAGA HS102_03 2,465,222 310,685,306 126.03 97.42%
CTACGGA HS102_04 7,856,212 986,175,040 125.53 97.27%
GCGGAAT HS101_01 20,510,334 2,586,720,662 126.12 97.41%
TAGCGGA HS101_02 13,010,938 1,638,915,759 125.96 97.44%
TCGAAGA HS101_03 4,340,348 548,188,024 126.30 97.49%
TCTGTGA HS101_04 8,559,258 1,079,498,526 126.12 97.47%
TGCTGGA KM_01 8,166,996 1,029,238,008 126.02 97.44%
ACGACTAC KM_02 15,009,954 1,887,498,346 125.75 97.28%
TAGCATGC KM_03 10,264,012 1,286,776,171 125.37 97.26%
TAGGCCAT KM_04 11,542,352 1,453,301,548 125.91 97.50%
TGCAAGGA KG_01 6,224,482 783,442,672 125.86 97.44%
TGGTACGT KG_02 13,112,664 1,650,397,076 125.86 97.45%
TCTCAGTC KG_03 20,232,582 2,549,553,994 126.01 97.62%
CCGGATAT KG_04 9,085,132 1,143,313,688 125.84 97.39%
CGCCTTAT FLO_01 8,200,218 1,027,827,512 125.34 97.22%
AACCGAGA FLO_02 3,844,176 484,104,712 125.93 97.44%
ACAGGGAA FLO_03 3,123,198 393,699,697 126.06 97.54%
ACGTGGTA FLO_04 5,028,826 629,143,384 125.11 97.40%
CCATGGGT BK_01 7,806,476 984,852,104 126.16 97.64%
CGCGGAGA BK_02 3,249,990 408,441,100 125.67 97.50%
CGTGTGGT BK_03 4,559,274 574,531,180 126.01 97.70%
GCTGTGGA BK_04 2,613,926 328,857,180 125.81 97.53%
GGATTGGT Rio_01 8,318,062 1,048,888,019 126.10 97.82%
GTGAGGGT Rio_02 5,468,334 690,763,234 126.32 97.96%
TATCGGGA Rio_03 6,886,696 863,563,540 125.40 97.60%
TTCCTGGA Rio_04 1,921,542 241,788,575 125.83 97.48%
평균(AVG) 13,429,185 1,697,872,535 126.34 97.49%
합계(SUM) 1,289,201,798 162,995,763,374
실시예 3: Alignment to reference genome
앞서 실시예 2에서 디멀티플렉싱 및 시퀀스 퀄리티 트리밍을 통해 확보된 각 샘플의 클린 리드(clean reads)를 표준 유전체(참조 유전체, reference genome)에 매핑(mapping)하고 통계치를 추출하였다.
상기 표준 유전체(reference genome)로는, 2018년 12월 09일에 발행된 'GRASSLAND SCIENCE' 65권 2호의 125쪽 내지 134쪽에 개시된 'First assembly of the gene-space of Lolium multiflorum and comparison to other Poaceae genomes'에 포함된 롤리움 멀티플로룸(Lolium multiflorum)의 유전체를 사용하였다.
하기 표 8은 상기 표준 유전체의 통계치를 나타낸 것이다.
No. of scaffolds Total length (bp) Min. length (bp) Max. length (bp) Avg. length (bp) N50 length (bp)
129,579 585,844,536 2,000 43,903 4,521 5,036
상기 매핑(mapping)의 통계치 추출에 있어서, 보다 상세하게, 전처리 과정을 통과한 클린 리드(cleaned reads)를 BWA(Burrows-Wheeler Aligner, 0.7.17-r1188) 프로그램을 사용하여 표준 유전체(참조 유전체, reference genome)에 매핑(mapping)을 수행하였다. 매핑(mapping)은 표준 유전체와 시퀀싱한 샘플 간의 로우(raw) SNP (In/Del)을 찾기 위한 선행과정으로서 BAM(Binary alignment Map) 포맷의 파일을 생성하며, 옵션은 기본값으로 설정하였다.
하기 표 9 및 표 10은 각 샘플의 클린 리드(clean reads)를 표준 유전체에 매칭하여 통계치를 추출한 결과를 나타낸 것이다.
실시예 4: Genome-wide SNP
실시예 4-1: Raw SNP detection 및 consensus sequence extract
앞서 개시된 이탈리안 라이그라스 총 96개의 샘플로부터 추출된 클린 리드(cleaned reads)를 표준 유전체(reference genome)에 매핑(mapping)하여 생성된 BAM 포맷의 파일을 SAM 툴(SAM tool, 0.1.16) 프로그램을 사용하여 로우(raw) SNP (In/Del)을 디텍션(detection)하고, 컨센서스 시퀀스(consensus sequence, 공통염기서열)를 추출하였다. 이때 SNP 디텍션(detection)을 하는 과정 전에 씨더스 인-하우스 스크립트(SEEDERS in-house script)를 사용하여 SNP 밸리데이션(validation)을 거친 후, 로우(raw) SNP (In/Del) 디텍션(detection)을 수행하였다. 하기 표 11에 개시된 옵션 이외에는 기본 값을 적용하였다.
Minimum mapping quality for SNPs (-Q) = 30
Minimum mapping quality for gaps (-q) = 15
Minimum read depth (-d) = 3
Maximum read depth (-D) = 611
Min In/Del score for nearby SNP filtering (-G) = 30
SNP within INT bp around a gap to be filtered (-w) = 15
Window size for filtering dense SNPs (-W) = 15
실시예 4-2: Generate SNP matrix
분석 대상 간의 SNP 비교 분석을 수행하기 위해 이탈리안 라이그라스 총 96개의 샘플간 통합 SNP 매트릭스(matrix)를 작성하였다. 각 샘플을 표준 유전체(reference genome)와 비교하여 얻은 로우(raw) SNP 포지션(position)을 후보로 하여 합집합의 리스트를 구축하였다. 이때, 빈 영역(non-SNP loci)은 샘플의 공통염기서열(consensus sequence)로부터 채워 넣는 필링(filling) 과정을 거쳐 매트릭스(matrix)를 작성하였다. 이후 샘플 간의 SNP 비교를 통해 미스-콜링(miss-calling)된 SNP (In/Del)좌를 필터(filter)하여 파이널(final) SNP 매트릭스(matrix)를 작성하였다. 해당 좌를 기반으로 SNP (In/Del)을 하기 표 12에 개시된 유형 구분 기준에 따라 분류하였다.
Homozygous(동형접합자): read rate ≥ 90%
Heterozygous(이형접합자): 40% ≤ read rate ≤ 60%
Etc.: 20% ≤ read rate ≤ 40%, and 60% ≤ read rate ≤ 90%
Read rate: Total mapped read 수 대비 변이가 발생한 read 수의 비율
하기 표 13은 상기 유형 구분 기준에 따라 분류된 SNP의 수를 나타낸 것이다.
Sample No. of Total SNP No. of Homozygous SNP
(read rate ≥ 90%)
No. of Heterozygous SNP
(40% ≤ read rate ≤ 60%)
No. of etc. SNP
(20% ≤ read rate < 40%,
60% < read rate < 90%)
KW_01 334,041 258,794 27,911 47,336
KW_02 370,155 270,313 38,515 61,327
KW_03 198,035 156,595 16,702 24,738
KW_04 226,906 172,438 22,037 32,431
KS_01 380,929 281,305 37,616 62,008
KS_02 326,216 243,515 31,626 51,075
KS_03 281,094 212,041 27,242 41,811
KS_04 99,880 83,523 6,682 9,675
GC2_01 484,751 344,905 51,501 88,345
GC2_02 364,455 274,761 33,799 55,895
GC2_03 250,107 196,642 20,596 32,869
GC2_04 172,185 136,339 14,449 21,397
GC_01 334,595 244,670 34,585 55,340
GC_02 334,687 257,613 28,671 48,403
GC_03 260,707 200,099 23,525 37,083
GC_04 214,168 164,867 19,847 29,454
901_01 593,127 414,218 63,530 115,379
901_02 313,508 239,767 28,025 45,716
901_03 336,473 244,224 35,631 56,618
901_04 141,322 112,549 11,773 17,000
605_01 393,642 282,746 42,090 68,806
605_02 173,941 138,049 14,607 21,285
605_03 135,036 110,228 10,187 14,621
605_04 209,477 162,759 19,131 27,587
604_01 100,458 83,326 7,119 10,013
604_02 359,679 258,410 39,494 61,775
604_03 412,954 302,930 40,232 69,792
604_04 217,390 165,108 20,912 31,370
603_01 298,378 228,396 26,801 43,181
603_02 254,674 190,503 25,401 38,770
603_03 198,842 152,766 18,685 27,391
603_04 246,443 186,899 23,935 35,609
602_01 154,886 126,361 11,438 17,087
602_02 187,921 150,479 14,912 22,530
602_03 190,842 151,221 15,875 23,746
602_04 58,546 51,014 3,089 4,443
601_01 103,489 85,287 7,477 10,725
601_02 66,729 57,560 3,726 5,443
601_03 123,593 100,632 9,324 13,637
601_04 126,822 102,498 9,944 14,380
GF3_01 232,880 180,383 19,426 33,071
GF3_02 375,031 279,621 33,067 62,343
GF3_03 55,613 48,218 3,085 4,310
GF3_04 118,370 97,610 8,480 12,280
GF2_01 182,844 148,343 13,541 20,960
GF2_02 108,315 91,477 6,662 10,176
GF2_03 256,284 199,346 21,492 35,446
GF2_04 256,699 199,333 21,510 35,856
GF_01 171,339 135,493 13,981 21,865
GF_02 244,596 190,448 20,709 33,439
GF_03 74,607 63,419 4,568 6,620
GF_04 348,598 261,539 32,219 54,840
KWR_01 168,850 134,079 13,913 20,858
KWR_02 82,656 69,360 5,347 7,949
KWR_03 126,348 103,132 9,401 13,815
KWR_04 412,013 295,706 42,977 73,330
AE_01 170,847 138,308 12,784 19,755
AE_02 197,420 163,240 12,452 21,728
AE_03 220,598 176,080 16,966 27,552
AE_04 218,459 173,395 17,146 27,918
HS104_01 295,216 230,112 24,164 40,940
HS104_02 75,215 64,840 4,199 6,176
HS104_03 204,739 161,628 17,029 26,082
HS104_04 218,793 171,227 18,817 28,749
HC_01 257,382 204,395 19,245 33,742
HC_02 198,777 160,944 14,575 23,258
HC_03 118,006 100,546 6,915 10,545
HC_04 189,222 153,513 14,079 21,630
HS102_01 107,836 88,943 7,777 11,116
HS102_02 137,452 111,562 10,306 15,584
HS102_03 27,239 24,202 1,365 1,672
HS102_04 134,099 107,997 10,491 15,611
HS101_01 294,478 220,586 27,757 46,135
HS101_02 188,347 145,506 16,788 26,053
HS101_03 75,385 63,763 4,898 6,724
HS101_04 130,969 105,758 10,130 15,081
KM_01 127,088 103,321 9,721 14,046
KM_02 209,184 168,372 14,887 25,925
KM_03 150,273 122,600 10,804 16,869
KM_04 151,921 123,898 11,299 16,724
KG_01 97,177 81,470 6,452 9,255
KG_02 104,461 85,859 7,471 11,131
KG_03 267,736 207,308 22,536 37,892
KG_04 134,001 109,656 9,960 14,385
FLO_01 122,959 100,811 9,269 12,879
FLO_02 39,271 34,460 2,047 2,764
FLO_03 53,362 46,358 3,014 3,990
FLO_04 74,002 63,350 4,339 6,313
BK_01 123,054 100,383 9,246 13,425
BK_02 53,958 46,499 3,121 4,338
BK_03 41,617 36,438 2,185 2,994
BK_04 26,510 23,709 1,192 1,609
Rio_01 87,307 71,977 6,465 8,865
Rio_02 75,928 64,652 4,759 6,517
Rio_03 59,810 50,627 3,856 5,327
Rio_04 21,932 19,908 888 1,136
실시예 4-3: SNP filtering
이탈리안 라이그라스 96개의 샘플의 SNP 매트릭스를 사용하여 하기 표 14의 조건으로 SNP 필터 과정을 수행하였다.
SNP loci of biallelic
Minor allele frequency > 5%
Missing data < 30%
하기 표 15는 이탈리안 라이그라스 96개의 샘플의 SNP 매트릭스를 사용하여 SNP 필터 과정을 수행한 결과를 나타낸 것이다.
필터 단계 필터 항목 SNP matrix loci
1 Total SNP matrix 3,675,167
2 MAF (minor allele frequency) >5%*1 2,131,719
3 Missing data <30%*2 65,498
4 MAF >5% and Missing data <30% 13,196
5 Random 5,000 5,000
*1) MAF(Minor Allele Frequency) > 5%: 해당 좌의 전체 샘플에서 minor allele frequency가 5%보다 큰 SNP를 선발함.
*2) Missing data < 30%: 해당 좌의 전체 샘플에서 missing data가 30% 미만인 SNP를 선발함.
상기 표 15에 개시된 랜덤(random) 5,000은 필터 처리된 SNP 13,196좌에서 분석에 이용 가능한 수준의 SNP 5,000좌를 대상으로 랜덤 셀렉션(random selection)을 수행한 것을 의미한다.
실시예 5: Construction of phylogenetic tree
실시예 5-1: Phylogenetic tree
앞서 실시예 4에 개시된 필터 과정을 거쳐 선발된 SNP 13,196좌를 대상으로 MEGA6 프로그램을 이용하여 개체간 유연관계 분석을 수행하였다.
보다 상세하게, 상기 유연관계 분석은 앞서 개시된 SNP 13,196좌를 이용하여 네이버-조이닝(Neighbor-joining) 방법으로 실시되었다. 그 결과, 가지 길이의 합이 14.09591913인 최적의 트리가 완성되었다. 진화 거리는 맥시멈 컴포짓 라이클리후드 방법(Maximum Composite Likelihood method)을 사용하여 계산되었으며, 사이트당 염기 대체 수의 단위를 의미한다.
도 4는 본 발명의 일 실시예에 따른 개체간 유연관계 분석 결과인 계통수를 나타낸 것이다.
도 4를 참조하면, 본 발명의 일 실시예에 따른 이탈리안 라이그라스 96 개체의 분류가 구조화된 것을 확인할 수 있다. 상기 계통수에 개시된 EMC(Early Maturing Crop)는 조생종을 의미하고, LMC(Late Maturing Crop)는 장생종을 의미하고, MMC(Medium Maturing Crop)는 중생종을 의미하고, SEMC(Super Early Maturing Crop)은 극조생종을 의미하고, Imported는 수입종을 의미한다.
다만, 상기 계통수는 부트스트랩 메소드를 수행하여 얻은 종합수(consensus tree)로, 컷-오프(cut-off) 밸류(value)를 적용하지 않은 결과라는 점을 감안해야 할 것이다.
실시예 5-2: Principal Component Analysis(PCA)
앞서 실시예 4에 개시된 필터 과정을 거쳐 선발된 SNP 13,196좌를 대상으로 R 패키지 SNP릴레이트(R package SNPRelate)를 이용하여 주성분 분석(PCA, Principal Component Analysis)을 수행하였다. 그 결과 두 가지 주요 구성 요소(PC1 및 PC2)는 유전적 변이의 약 17.5%를 설명할 수 있는 것을 확인하였다.
도 5a 및 도 5b는 본 발명의 일 실시예에 따른 두 가지 요소에 의한 주성분 분석 결과를 나타낸 것이다.
도 5a 및 도 5b를 참조하면, 본 발명의 일 실시예에 따른 이탈리안 라이그라스 96 개체 샘플은 품종에 따라 어느 정도 구분되는 것을 확인할 수 있다. 다만, 2D로 작성된 플롯(plot)에서는 겹쳐지는 부분이 많아 명확하게 구분된다고 하기는 다소 어려움이 있었다.
도 6은 본 발명의 일 실시예에 따른 세 가지 요소에 의한 주성분 분석 결과를 나타낸 것이다.
도 6을 참조하면, 본 발명의 일 실시예에 따른 이탈리안 라이그라스 96 개체 샘플은 앞서 2D 플롯(plot)보다 명확하게 품종에 따라 구분되는 것을 확인할 수 있다.
실시예 5-3: Population structure
앞서 실시예 4에 개시된 필터 과정을 거쳐 선발된 SNP 13,196좌에서 분석에 이용 가능한 수준의 SNP 5,000좌를 선발하는 랜덤 셀렉션(random selection)을 3회 실시하여 포퓰레이션 스트럭쳐(population structure) 분석을 수행하였다.
하기 표 16은 상기 포퓰레이션 스트럭쳐(population structure) 분석에 사용된 조건을 개시한 것이다.
SNP loci of biallelic
Bayesian model-based approach (MCMC: Markov Chain Monte Carlo)
Burn-in period: 10,000
Number of MCMC Reps: 10,000
Ancestry Model: Admixture model
Allele Frequency Model: correlated allele frequency
Number of populations (K): 1 to 10
Number of iterations: 10
보다 상세하게, 포퓰레이션 스트럭쳐(population structure) 분석은 적정 K 값(population)를 찾기 위해 여러 K 값으로 분석을 수행하고, 이를 반복 수행하면서 델타-K 메소드(delta-K method, an ad hoc quantity (Δdescribed by Evanno et al. 2005.)를 통해 적정 K 값을 계산하는데, 이때 반복 횟수를 높일수록 많은 시간 및 자원이 필요한 상황이므로, 분석에 이용 가능한 수준의 SNP 5,000좌를 3회 선발하여 세 결과 모두 반복성이 있는 결과를 얻는지 확인하였다. 스트럭쳐(structure) 반복 수행 횟수는 10회로 설정하여 분석하였다.
도 7은 본 발명의 일 실시예에 따른 델타-K 메소드 결과를 나타낸 그래프이다.
도 7을 참조하면, 스트럭쳐(structure)를 10회 반복 수행하여 계산한 결과, K=2일 때 피크(peak)가 확인되었다. 이에 따라, 이하에서는 해당 피크에서의 결과가 담긴 그래프를 확인할 수 있다.
하기 표 17은 K=2일 때, 각 품종에 따른 포퓰레이션 스트럭쳐(population structure) 분석 결과를 나타낸 것이다.
Sample Group Missing (%) Pop1 Pop2
GF3_02 SEMC 3 0.935 0.065
GF_04 SEMC 2 0.918 0.082
GF2_04 SEMC 6 0.746 0.254
GF2_03 SEMC 6 0.745 0.255
GF_02 SEMC 6 0.697 0.303
GF3_01 SEMC 8 0.596 0.404
GF2_01 SEMC 13 0.549 0.451
GF_01 SEMC 12 0.494 0.506
GF3_04 SEMC 24 0.163 0.837
GF2_02 SEMC 28 0.043 0.957
GF_03 SEMC 39 0.005 0.995
GF3_03 SEMC 48 0.002 0.998
GC2_01 EMC 1 0.999 0.001
GC_02 EMC 2 0.949 0.051
GC2_02 EMC 3 0.926 0.074
KS_01 EMC 4 0.864 0.136
KW_01 EMC 4 0.857 0.143
GC_01 EMC 4 0.855 0.145
GC_03 EMC 4 0.829 0.171
KS_02 EMC 5 0.791 0.209
KG_03 EMC 4 0.788 0.212
GC2_03 EMC 9 0.694 0.306
KS_03 EMC 8 0.686 0.314
KW_02 EMC 4 0.683 0.317
GC_04 EMC 12 0.39 0.61
KW_04 EMC 13 0.356 0.644
KW_03 EMC 16 0.314 0.686
GC2_04 EMC 17 0.299 0.701
KG_04 EMC 20 0.244 0.756
KG_02 EMC 36 0.146 0.854
KS_04 EMC 36 0.009 0.991
KG_01 EMC 32 0.008 0.992
604_03 MMC 1 0.999 0.001
605_01 MMC 2 0.882 0.118
603_01 MMC 4 0.881 0.119
604_02 MMC 4 0.828 0.172
KM_02 MMC 9 0.624 0.376
603_04 MMC 12 0.562 0.438
603_02 MMC 5 0.561 0.439
605_04 MMC 14 0.478 0.522
602_03 MMC 15 0.474 0.526
KM_03 MMC 17 0.447 0.553
602_02 MMC 13 0.43 0.57
604_04 MMC 10 0.403 0.597
603_03 MMC 13 0.349 0.651
KM_04 MMC 17 0.331 0.669
602_01 MMC 19 0.294 0.706
605_02 MMC 16 0.219 0.781
KM_01 MMC 21 0.163 0.837
601_04 MMC 20 0.141 0.859
605_03 MMC 29 0.141 0.859
601_03 MMC 24 0.1 0.9
601_01 MMC 29 0.008 0.992
604_01 MMC 35 0.006 0.994
601_02 MMC 46 0.001 0.999
602_04 MMC 52 0.001 0.999
901_01 LMC 0 1 0
KWR_04 LMC 2 0.934 0.066
901_02 LMC 4 0.872 0.128
901_03 LMC 2 0.813 0.187
HS101_01 LMC 3 0.759 0.241
HS104_01 LMC 5 0.723 0.277
HS104_04 LMC 10 0.497 0.503
HS104_03 LMC 13 0.41 0.59
HS101_02 LMC 11 0.363 0.637
KWR_01 LMC 15 0.299 0.701
HS102_02 LMC 21 0.29 0.71
HS101_04 LMC 20 0.203 0.797
HS102_04 LMC 23 0.147 0.853
901_04 LMC 23 0.122 0.878
HS102_01 LMC 25 0.122 0.878
KWR_03 LMC 22 0.099 0.901
KWR_02 LMC 35 0.002 0.998
HS101_03 LMC 40 0.001 0.999
HS102_03 LMC 71 0.001 0.999
HS104_02 LMC 42 0.001 0.999
HC_01 Imported 5 0.741 0.259
AE_02 Imported 10 0.589 0.411
AE_03 Imported 10 0.517 0.483
HC_02 Imported 11 0.462 0.538
HC_04 Imported 13 0.442 0.558
AE_01 Imported 14 0.431 0.569
AE_04 Imported 10 0.364 0.636
BK_01 Imported 21 0.267 0.733
FLO_01 Imported 24 0.213 0.787
HC_03 Imported 27 0.179 0.821
Rio_01 Imported 32 0.104 0.896
Rio_02 Imported 40 0.004 0.996
FLO_04 Imported 43 0.002 0.998
BK_02 Imported 49 0.001 0.999
BK_03 Imported 62 0.001 0.999
BK_04 Imported 73 0.001 0.999
FLO_02 Imported 66 0.001 0.999
FLO_03 Imported 51 0.001 0.999
Rio_03 Imported 55 0.001 0.999
Rio_04 Imported 79 0.001 0.999
도 8은 본 발명의 일 실시예에 따라 K 값이 2인 피크에서의 포퓰레이션 스트럭쳐 분석 결과를 나타낸 그래프이다.
도 8을 참조하면, 각 개체의 SNP가 조상 집단(ancestral population)으로부터 기여된 비율을 세그먼트(segment) 단위로 나타낸 것을 확인할 수 있다. 극조생종, 조생종, 중생종, 만생종, 및 수입종 각각의 종 내에서의 Pop1 및 Pop2 비율은 점차 감소하는 유사한 형상으로 나타는 것을 확인하였다. 또한, Pop1 비율의 최대치에 있어서, 극조생종, 조생종, 중생종, 및 만생종을 포함하는 국내종은 0.935 내지 1인 반면, 수입종은 0.741로 다소 차이가 있는 것을 확인하였다.
실시예 6: Pairwise F ST 분석
앞서 실시예 4에 개시된 필터 과정을 거쳐 선발된 SNP 13,196좌를 이용하여 이탈리안 라이그라스 숙기 관련 그룹(극조생종, 조생종, 중생종, 만생종, 및 수입종) 정보를 기준으로 그룹 간 페어와이즈(pairwise) FST 분석을 수행하였다. 추가로 각 그룹 내 샘플 간 페어와이즈(pairwise) FST 분석도 진행하여 그룹 내 개체 간의 거리를 예측하였다. 상기 FST 값은 0 내지 1 사이로 계산되며, 1에 가까울수록 그룹 간 거리가 먼 것으로 예측 가능하다.
하기 표 18은 그룹 내에서의 페어와이즈(pairwise) FST 분석 결과를 나타낸 것이다.
그룹명 극조생종 조생종 중생종 만생종 수입종
극조생종 - 0.025 0.029 0.040 0.033
조생종 0.025 - 0.007 0.028 0.020
중생종 0.029 0.007 - 0.015 0.011
만생종 0.040 0.028 0.015 - 0.017
수입종 0.033 0.020 0.011 0.017 -
상기 표 18을 참조하면, 극조생종, 조생종, 중생종, 만생종, 및 수입종은 동속 동종인 롤리움 멀티플로룸(Lolium multiflorum)이므로, FST 값이 상당히 가까운 것을 확인할 수 있다. 즉, 극조생종, 조생종, 중생종, 만생종, 및 수입종은 개체 간의 거리가 상당히 가까운 것을 알 수 있다. 이에 따라, 극조생종, 조생종, 중생종, 만생종, 및 수입종을 구분하는 것은 매우 어려운 것을 확인하였다.
하기 표 19는 극조생종 내에서의 페어와이즈(pairwise) FST 분석 결과를 나타낸 것이다.
극조생종 GF GF2 GF3
GF - 0.014 0.009
GF2 0.014 - 0.016
GF3 0.009 0.016 -
하기 표 20은 조생종 내에서의 페어와이즈(pairwise) FST 분석 결과를 나타낸 것이다.
조생종 GC GC2 KG KS KW
GC - 0.004 0.034 0.027 0.033
GC2 0.004 - 0.043 0.033 0.035
KG 0.034 0.043 - 0.031 0.046
KS 0.027 0.033 0.031 - 0.042
KW 0.033 0.035 0.046 0.042 -
하기 표 21은 중생종 내에서의 페어와이즈(pairwise) FST 분석 결과를 나타낸 것이다.
중생종 601 602 603 604 605 KM
601 - 0.084 0.060 0.062 0.082 0.091
602 0.084 - 0.036 0.038 0.033 0.037
603 0.060 0.036 - -0.003 0.021 0.036
604 0.062 0.038 -0.003 - 0.022 0.036
605 0.082 0.033 0.021 0.022 - 0.042
KM 0.091 0.037 0.036 0.036 0.042 -
하기 표 22는 만생종 내에서의 페어와이즈(pairwise) FST 분석 결과를 나타낸 것이다.
만생종 901 HS101 HS102 HS104 KWR
901 - 0.039 0.068 0.033 0.029
HS101 0.039 - 0.026 0.020 0.004
HS102 0.068 0.026 - 0.031 0.019
HS104 0.033 0.020 0.031 - 0.020
KWR 0.029 0.004 0.019 0.020 -
하기 표 23은 수입종 내에서의 페어와이즈(pairwise) FST 분석 결과를 나타낸 것이다.
수입종 AE BK FLO HC Rio
AE - 0.043 0.046 -0.011 0.052
BK 0.043 - 0.015 0.049 0.000
FLO 0.046 0.015 - 0.059 -0.007
HC -0.011 0.049 0.059 - 0.070
Rio 0.052 0.000 -0.007 0.070 -
상기 표 19 내지 표 23을 참조하면, 극조생종, 조생종, 중생종, 만생종, 및 수입종의 각 그룹 내 품종들은 동속 동종인 롤리움 멀티플로룸(Lolium multiflorum)이면서 출수 시기가 유사하다는 공통점을 갖고 있어, FST 값이 상당히 가까운 것을 확인할 수 있다. 즉, 극조생종, 조생종, 중생종, 만생종, 및 수입종의 각 그룹 내 품종들은 개체 간의 거리가 상당히 가까운 것을 알 수 있다. 이에 따라, 극조생종, 조생종, 중생종, 만생종, 및 수입종의 각 그룹 내에서 품종들을 구분하는 것은 매우 어려운 것을 확인하였다.
실시예 7: Genotyping
IR605 품종 샘플 특이적인 마커 개발을 위하여, 앞서 실시예 4에 개시된 필터 과정을 거쳐 선발된 SNP 13,196좌 중에서 IR605 품종 반복 샘플간 공통좌를 선발하였고, 그 결과는 하기 표 24와 같다.
필터 단계 필터 항목 No. of SNP
1 확보된 SNP 총 수 13,196
2 IR605 반복 샘플간 공통 Homo-type SNP 좌*1 810
상기 표 24에 개시된 바와 같이, IR605 품종 반복 샘플간 공통 호모-타입(Homo-type) SNP 좌는 810좌가 선발되었다.
앞서 선발된 공통좌를 이용하여 IR605 품종과 나머지 92 개체의 샘플 간에 식별 가능한 바코드(barcode) SNP를 선발하였다.
하기 표 25는 이탈리안 라이그라스 96 개체 중에서 IR605 품종을 식별할 수 있는 8개의 바코드로 구성된 바코드 SNP 세트를 나타낸 것이다.
605 식별용 마커 세트
Marker Set No. 1 2 3 4 5 6 7 8
후보 마커 수 2 1 1 1 1 1 1 1
605 a b b b b a a a
KW_01 a h - b h b - a
KW_02 a a b h a - h a
KW_03 h a h b h - a a
KW_04 h a h b b - h a
KS_01 b b h b b a - a
KS_02 b h - b b a h a
KS_03 h h h b b b h a
KS_04 h a h b a - h a
GC2_01 h h h b b b b a
GC2_02 h h h b b h b a
GC2_03 h h b b b a b a
GC2_04 h a h b - - a h
GC_01 h h h b a a a a
GC_02 b b h b b h - a
GC_03 b h a b h h - a
GC_04 h a h b - a h a
901_01 b h h b b a b a
901_02 b h a b B a - a
901_03 b h b b B a - a
901_04 b a h b - a h a
604_01 h a b b b a h a
604_02 b b h b b a b a
604_03 h h h b a h h a
604_04 b a h b h - h a
603_01 b h h b h h - a
603_02 b a h b b b b a
603_03 b a h b a a b a
603_04 b h h h b a - a
602_01 b h b b - a - a
602_02 b h a a h h b a
602_03 b b a h - h - a
602_04 b a a - b - b -
601_01 h a h h b a h a
601_02 b a h - a - b -
601_03 b a h b b a a a
601_04 h a h b b - h a
GF3_01 b a h a h a a a
GF3_02 b b a a a a h h
GF3_03 b a h - b a h -
GF3_04 b a h a - - a -
GF2_01 b a a h b a b a
GF2_02 b a h a - - h -
GF2_03 b h - a b a h a
GF2_04 b h a h - a h -
GF_01 b a h a h - h -
GF_02 b b h b - a a h
GF_03 b a h a b - h -
GF_04 b h a a b a h a
KWR_01 b a h h b a - a
KWR_02 b a h a b - h -
KWR_03 h a h - - - a -
KWR_04 h h a h h a h h
AE_01 a h a - a a h h
AE_02 a h a a b a b a
AE_03 a h a h b a a a
AE_04 a a h a h - h h
HS104_01 b - h h b a - a
HS104_02 b a h - b - b -
HS104_03 b h a h b a - a
HS104_04 b h a - - a - h
HC_01 a h a a - - b h
HC_02 a h a b - - h a
HC_03 a h a a b a h a
HC_04 a h a h b a h h
HS102_01 b h a a b a a -
HS102_02 b b a h - - h a
HS102_03 b a h - b - a -
HS102_04 b a h h b - h a
HS101_01 b h a b b h b h
HS101_02 b a h b h a b a
HS101_03 b a h - - - - a
HS101_04 b a h a b a b -
KM_01 a a h a - - a a
KM_02 h h a h - a h b
KM_03 a h - a - b b b
KM_04 a h - a - b h h
KG_01 h a h a - - a h
KG_02 - - - a b b a b
KG_03 h b a h b a h h
KG_04 h b - a a a h b
FLO_01 h b - a b a a h
FLO_02 h a b - - a a h
FLO_03 a a h - - - a h
FLO_04 h a a - - a a b
BK_01 b b h h b a b b
BK_02 b a h a b a - h
BK_03 - - - - - a - b
BK_04 b a h - b - a b
Rio_01 a h - a - a a h
Rio_02 a b - h b a h b
Rio_03 h a h - a a a b
Rio_04 h a h - - - a b
상기 표 25를 참조하면, IR605 품종을 식별할 수 있는 바코드 SNP 세트는 8개의 바코드로 구성되어 있으며, 마커 세트 1번에 2개의 후보좌 및 마커 세트 2번 내지 8번에 1개의 좌를 갖는 것을 확인할 수 있다. 상기 표 24에 개시된 바와 같이, 마커 타입(type)이 IR605 품종과 같은 'abbbbaaa'에 해당하는 품종이 없으므로, 본 발명의 일 실시예에 따른 IR605 품종 식별용 바코드 SNP 세트를 이탈리안 라이그라스에 사용한다면 상기 이탈리안 라이그라스가 IR605 품종인지 확인할 수 있다.
상기 'a'는 선발된 SNP에서 표준 유전체(reference genome)와 동일한 대립 유전자(얼릴, allele)이며 뎁스(depth) 비율이 동형접합자(homozygote)인 좌를 의미하고, 상기 'b'는 선발된 SNP에서 표준 유전체(reference genome)와 상이한 대립 유전자(얼릴, allele)이며 뎁스(depth) 비율이 동형접합자(homozygote)인 좌를 의미하며, 상기 'h'는 선발된 SNP에서 표준 유전체(reference genome)와 상이한 대립 유전자(얼릴, allele)이며 뎁스(depth) 비율이 이형접합자(heterozygote)인 좌를 의미한다.
이에 따라, 본 발명의 IR605 품종을 식별할 수 있는 바코드 SNP 세트의 염기서열 정보는 하기 표 26과 같다.
마커 번호 관련 정보 주변 서열(Flanking sequence)
1(a) ID: LM_39437611_10876_151303 GTTAGACTTTCTGCATTACTCTTAACTAATAGTTGGAAGAAAAAGTGGATCTGTCGTTGGTGGAAAGTTGGAGTAAGCCCATTGAATTTTCCATTTTAACATATTCAGATTGTCATGGTGTCGCCAAGTCATCCCTGAGGGCAGACGACAGTTTTTTTTGCATCCACTGTGTGTGCGTGCGGGGCTTGAGGATGTACTTGTACTACCCTAAAGAGGGATCAATTAATGGGGTTCATTTTTCTTAAGGCAAACCTTGAATCACAGGGTTTGTACAGCAGATGCTGGATATCTTACACGTAG[G/A]CTTGTTGAAGTAGTTCAACATATTATTGTGCGTAGAAGAGATTGTGGTACTATCCGAGGTATTTCTGTGAATCCTCAAAATGGGATGACGGAAAAACTTTTTGTCCAAACACTAATTGGTCGTGTATTACCAGACGATATAGGGGTAGGGAGGTTATGTACTCGTTTGGTACCAGTTTTATCTTTGACACCCTGGACAGGAAGATATGAATCGTAATAACCTTGTTTCCAAGCTGTTCTACTTTTTATTCAGCTTATACTCCTTCCATTTCTGAAAAGAATGTCTATAAGTTTTTTCCTG
위치: 442
Reference allele:
A
Allele:
[G/A]
1(a) ID: LM_39437611_10876_151303 AGTTGGAAGAAAAAGTGGATCTGTCGTTGGTGGAAAGTTGGAGTAAGCCCATTGAATTTTCCATTTTAACATATTCAGATTGTCATGGTGTCGCCAAGTCATCCCTGAGGGCAGACGACAGTTTTTTTTGCATCCACTGTGTGTGCGTGCGGGGCTTGAGGATGTACTTGTACTACCCTAAAGAGGGATCAATTAATGGGGTTCATTTTTCTTAAGGCAAACCTTGAATCACAGGGTTTGTACAGCAGATGCTGGATATCTTACACGTAGACTTGTTGAAGTAGTTCAACATATTATTGT[C/G]CGTAGAAGAGATTGTGGTACTATCCGAGGTATTTCTGTGAATCCTCAAAATGGGATGACGGAAAAACTTTTTGTCCAAACACTAATTGGTCGTGTATTACCAGACGATATAGGGGTAGGGAGGTTATGTACTCGTTTGGTACCAGTTTTATCTTTGACACCCTGGACAGGAAGATATGAATCGTAATAACCTTGTTTCCAAGCTGTTCTACTTTTTATTCAGCTTATACTCCTTCCATTTCTGAAAAGAATGTCTATAAGTTTTTTCCTGAGTCAGACAATGTAAAGTCTTGACCAAGTT
위치: 472
Reference allele:G
Allele:[C/G]
2(b) ID: LM_39387179_2778_76522 TCAGCGCGGCAAGATAAGAAACATTCAATTCCCTGCCATTAGATATTTTGCTTACTACCTTGCTACTAGAATCCTTGGTAGGGAGAACACTAGTAATATTTCTAGTTATCATCTTGCTTTCTTAGTTGCTGCACTTACTGGAGAGACACCTTATCATCTTGGTGCTCTTATTGCTCGCCGTTTGTCCACTAAGGGACCTATTTTTGGAGGAATTATTGCCTCCCGCATTTTAGAATATCTTAACCTTCCTCTTAACCCTACTGATGTGAAACTAACTCCTATAAGGCTCGATATTACTGC[C/T]ATGAAGAGCCATCAATTTGTTACAACTAACTCTAGTTTAAATAATATTATCTATAAAATGTTGTTAACTGACGGGGATGAAAGAGAAATCCCTTTGCCGCTTCCTGCATTGTTCAATATTCACAGGAAACCGTGGTCGCGCTCTAAGGAGGAGGTGGATGACCAGCTGAGGGTGCATGGTTTCCATCAGCAACATGACCCCACGGACGCCAAGCCCTCCGATAGGTACACCGTCACATATCCTGGCGCATCCTCCAGCACATACCCAGAACAGGATCCGTCCTCGTCATACTACGGAGGC
위치: 1809
Reference allele:T
Allele:[C/T]
3(b) ID: LM_39430339_2231_44467 GTAGAGAAATCTAAGTACAGTAGTCCGGATAAAACCATAAAAGCTGCTAGGGCTGCAGTAGAGTTATGTGAATCGCTTACCGGAGATGCTTTAGCAAAACAGCAAGATCGTGTTAGAGGGTTGCTTGATATGATTGAGCAGCAAAATGCTGAGCAGCTTGCTAAGGTAAACAAAGTTGCGGCTTCAAAATCTGTGCGTTCTACAAAGAATGCCGGAAGCAAGTCCCATGGGCAGGCATCGTCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAATGCACAGCAAATGACTGTGTA[T/C]GATCCGGTGCTTGCCGGAAAACAACAAGTCAGGCAACACGAGGCCGGTAGAAAAAGCCATGGGGCAGGTCGTGGCTATGCCGGATATGGCTATGCCGGAAATGAGTATGCCGGTAGAGGTGAAACTGGGCAAAATTATCGTGCACCAAGAGCTGCTTATGCAGAGGAGGAGATGCCTCCGCCGAGGTACCGGCAAGTAAGAGACGCGATACCGGAAAGATACGATGAGGCTGATTCGGGAACCGAAAGAATCGTAGCCTACCGGAACCCTCTGGGGGAACGGTTAGGAGAATGATGCCTA
위치: 1067
Reference allele:C
Allele:[T/C]
4(b) ID: LM_39430639_2950_55399 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCGGCTTTGCCTCCAAGACAGGCCCCCTCAAAGTAGAGAGGAAAGTACGAGGAGGTCTGGCGTTAATCCACACAATCAACTTCCCCTGCCTCAAGCAGTCGTCAGAAGAGAATGGGATGGACGCATGGTACACCATCCTTCAGATGATGGAGTATGTAAAGGACGCAGAAGACATGTTGTTGCCAGATAGTCTTAAAAAGAAGTATAAAAACATGGCGGATGTCAGCGATAGAGAGCTGAGACTACAGTGGTGTCACATCCAGCAGAT[C/G]ATTTGCACGATAATCCAGCAGGATGTCTGCTCTAGGTCTGGCGCGTTCTTCTACGGCCACGCTCTACCACCTAATGATGAGATAGAACTCCGCTTGGAGATGTCGCGTGAGGATAGGCCATTCAACTCGCTGAAGGGCTGCCGTCCATTCCCCCCGAGGCCTATGTAACATCCCAACTTTTGAATAAGAAGAACCAGAGAGAGATTTCAAGAATCCAAAAATCAGAGCCAACAAAAACTTTTTATCATCATATCGGTCTATGCATATAGTTCCCCTTTTTAATTATTTGAGTGTGCTTTT
위치: 1291
Reference allele:G
Allele:[C/G]
5(b) ID: LM_39432399_7818_106933 GCAGTGTTCAGGATCGTCTGCTCCGGCTAGCAATCCTCATTCTGCATCGTCCGATCCCTCGTCAGATTCTATGCCTCCCAATGCTGTGGTCCCTCGTGTGCAGCCGGTGCCTGCTGCTGATCGTCCGCGTACACGCAGTCTGAGTGGCATATCTCAGCCTAAGATCATTACAGATGGTCGTATTCGGTATGACAGGATACGGTTTGCTAATTATTGCAGCACTGGTGAACCCACAACTCTTGATGAAGCCTTTGCTGATCCTAAGTGGAAGTCTGCAATGGATGAAGAATATATGGCCCT[C/G]AAGAACAATCAGACCTGGCATTTGGTTCCTGCTACTGCTGGCAGAAATGTGATTGATTGTAAGTGGGTTTATAAGGTCAAACGTCGAGCCGATGGATCTATTGATCGTTACAAGGCTCGTCTCGTTGCCAAAGTATTCAAACAGCGTTATGGCATCGACTATGAGGATACATTTAGTCATGTAGTCAAAGTGGAGACCATTCGACTGGTTCTTTCTTTGGCAGTCTCTCGAGGGTGGCATCTTCGTCAACTTGATGTAAAGAATGCATTTTTGCATGGTATTCTGGAAGAAGAAGTATGC
위치: 4037
Reference allele:G
Allele:[C/G]
6(a) ID: LM_39274398_2409_51892 ATGTGGTCGTACACCAGGAGGAGCTCGTCCTTGCGCCGGCAGTAGCCGTCTAGCCGAGCAGCTGCACGAGGTTGCGGTCCGGAGCCGGGCGCCGATGGTCACCACTTCGGTTATGAACTCCTTATCCCCATCGTGTAGTATTGATCTGTGTCCTGTAGTGGTAGTGTATCCAAGCTGTACCTCTGATGTTCTTAGCAGGTAGCAATGAAAAATATAACTGAATATGTATGTGTTTCAGCTTGTAGTGTTAGCATCTACGTTCAGTGCCATCTTGTACTGAACTGGATTCAGTCGCGTACC[A/C]GATTTTTCTTCAGTGTAGAGGACTGGTGTGTTCCAGCGTGTAGTGTTACCATTTTTGC
위치: 2351
Reference allele:C
Allele:[A/C]
7(a) ID: LM_39419441_4783_228315 TTCTTAATCTTTCTCTTTTTAAACTTAGGAGCATCAGATGTTCCTTTTCCTGCTTTTGTTTTGCTGTTTCAGCTCTTTTCCCACTCACTGAGGCCTTCAACTGCCTCAGTTTCTCAGCTGTTTCCTTGCACTGCTTGGCACCTTCAGCTGCTTCAGTCTGAGCTCTTCTTCTGGCTTGAGATTCTCGAACTCTTTGAACTGCCTCTGCAGCCAGTTTTTCATGCTTAGTAGCCTCAGCTTTAGCTTCCTGTTTTCTTGCCAGGCACTCAGCCAGCAAGAGAAATTCTTTCTTCATTTTGC[G/T]CCCTTTCACTTGTATTCTTGGCTGTATTGGGTGTTCTTATATTTATGAAACAGATCTGTCTTTCTTCTCAGCAAGAATAGCTGCTTTTCTTTGAGTCAAGGTCATTCTTTCATCAGAGTCATCACTATCTATGATCTCCACTGCAGCTTTCTGACTGCTGCTTCCCTCTCTAGATTTAGCCTGGGCAGTCTCTTGTTGAGTCTTTTCAGATACTGCATTTTGCAGCTGCCTCCTGTGCTTCCCTTTGAGCAGTTTCAGCCTCAGCCTGCTGTTTTGCTGCTCTCTTCTTCCCTTTTCTTG
위치: 3303
Reference allele:T
Allele:[G/T]
8(a) ID: LM_39401264_3073_36703 CAATGATCTCAATACTGACCCGGAAGCAGGATACAAGCACGCCCAGAAGCACCGCCCACGCGGCAAAGGAGGCAAGGGCAAGAACAAGGACAGGGATGAAGAGAGTTCTGAGGCGATGGATGAGGATGATGCTTCGCCGGATCCCAAAGAGGGTTCCGCAGCTAACAAATCCAACCCCTTCGGCAAAAAGAGTGTTGGGGCTTACCATACCTTCCTCGGAACCCCAACGGTCCGGGCCAAGAAATCGGCCCTTCGGATCCTGAATGCCACAGTTCCGGCTGTGCCGCAGTACGTCAAGTG[G/T]CGGAAAAACCCTGCACCTTCGACAGGACGGATCACCCGACCATCATCCCCAAAGAGTGCTACGCCCTGGTTGTGAGTCCCCGCATCGACAGGTATGACTTCTCCAAGTGTCTTATGGATGGCGGAGCCAGCTTGAACATCATGTACCTGGAGACTATGGAGAGGATGAACCTTACCAAGGAGCATCTCAAGCACAGCAGCAGTGAGTTTCATGGTGTAGTTCCGGGTAAAAAGGCAAACTCCCTGAGTAGCATCAAACTTCCCATGGCCTTCAGCGATGTTAATAATTTCCGCGAAGAGA
위치: 2618
Reference allele:T
Allele:[G/T]
* A: Adenien; G: Guanine; C: Cytosine; T: Thymine; N: Any nucleotide;
a: 선발된 SNP에서 reference genome과 동일한 allele이며 depth 비율이 homozygote인 좌
b: 선발된 SNP에서 reference genome과 상이한 allele이며 depth 비율이 homozygote인 좌
이상 설명한 내용을 통해 당업자라면 본 발명의 기술 사상을 일탈하지 아니하는 범위에서 다양한 변경 및 수정이 가능함을 알 수 있을 것이다. 따라서 본 발명의 기술적 범위는 명세서의 상세한 설명에 기재된 내용으로 한정되는 것이 아니며 특허 청구의 범위에 의해 정해져야만 할 것이다.
<110> REPUBLIC OF KOREA(RURAL DEVELOPMENT ADMINISTRATION) <120> SNP MARKERS FOR DISCRIMINATING ITALIAN RYEGRASS IR605 VARIETIES AND METHOD FOR DISCRIMINATING ITALIAN RYEGRASS IR605 VARIETIES USING THE SAME <130> FP-2201002-KR <160> 9 <170> KoPatentIn 3.0 <210> 1 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 1 gttagacttt ctgcattact cttaactaat agttggaaga aaaagtggat ctgtcgttgg 60 tggaaagttg gagtaagccc attgaatttt ccattttaac atattcagat tgtcatggtg 120 tcgccaagtc atccctgagg gcagacgaca gttttttttg catccactgt gtgtgcgtgc 180 ggggcttgag gatgtacttg tactacccta aagagggatc aattaatggg gttcattttt 240 cttaaggcaa accttgaatc acagggtttg tacagcagat gctggatatc ttacacgtag 300 rcttgttgaa gtagttcaac atattattgt gcgtagaaga gattgtggta ctatccgagg 360 tatttctgtg aatcctcaaa atgggatgac ggaaaaactt tttgtccaaa cactaattgg 420 tcgtgtatta ccagacgata taggggtagg gaggttatgt actcgtttgg taccagtttt 480 atctttgaca ccctggacag gaagatatga atcgtaataa ccttgtttcc aagctgttct 540 actttttatt cagcttatac tccttccatt tctgaaaaga atgtctataa gttttttcct 600 g 601 <210> 2 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 2 agttggaaga aaaagtggat ctgtcgttgg tggaaagttg gagtaagccc attgaatttt 60 ccattttaac atattcagat tgtcatggtg tcgccaagtc atccctgagg gcagacgaca 120 gttttttttg catccactgt gtgtgcgtgc ggggcttgag gatgtacttg tactacccta 180 aagagggatc aattaatggg gttcattttt cttaaggcaa accttgaatc acagggtttg 240 tacagcagat gctggatatc ttacacgtag acttgttgaa gtagttcaac atattattgt 300 scgtagaaga gattgtggta ctatccgagg tatttctgtg aatcctcaaa atgggatgac 360 ggaaaaactt tttgtccaaa cactaattgg tcgtgtatta ccagacgata taggggtagg 420 gaggttatgt actcgtttgg taccagtttt atctttgaca ccctggacag gaagatatga 480 atcgtaataa ccttgtttcc aagctgttct actttttatt cagcttatac tccttccatt 540 tctgaaaaga atgtctataa gttttttcct gagtcagaca atgtaaagtc ttgaccaagt 600 t 601 <210> 3 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 3 tcagcgcggc aagataagaa acattcaatt ccctgccatt agatattttg cttactacct 60 tgctactaga atccttggta gggagaacac tagtaatatt tctagttatc atcttgcttt 120 cttagttgct gcacttactg gagagacacc ttatcatctt ggtgctctta ttgctcgccg 180 tttgtccact aagggaccta tttttggagg aattattgcc tcccgcattt tagaatatct 240 taaccttcct cttaacccta ctgatgtgaa actaactcct ataaggctcg atattactgc 300 yatgaagagc catcaatttg ttacaactaa ctctagttta aataatatta tctataaaat 360 gttgttaact gacggggatg aaagagaaat ccctttgccg cttcctgcat tgttcaatat 420 tcacaggaaa ccgtggtcgc gctctaagga ggaggtggat gaccagctga gggtgcatgg 480 tttccatcag caacatgacc ccacggacgc caagccctcc gataggtaca ccgtcacata 540 tcctggcgca tcctccagca catacccaga acaggatccg tcctcgtcat actacggagg 600 c 601 <210> 4 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 4 gtagagaaat ctaagtacag tagtccggat aaaaccataa aagctgctag ggctgcagta 60 gagttatgtg aatcgcttac cggagatgct ttagcaaaac agcaagatcg tgttagaggg 120 ttgcttgata tgattgagca gcaaaatgct gagcagcttg ctaaggtaaa caaagttgcg 180 gcttcaaaat ctgtgcgttc tacaaagaat gccggaagca agtcccatgg gcaggcatcg 240 tcnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnaat gcacagcaaa tgactgtgta 300 ygatccggtg cttgccggaa aacaacaagt caggcaacac gaggccggta gaaaaagcca 360 tggggcaggt cgtggctatg ccggatatgg ctatgccgga aatgagtatg ccggtagagg 420 tgaaactggg caaaattatc gtgcaccaag agctgcttat gcagaggagg agatgcctcc 480 gccgaggtac cggcaagtaa gagacgcgat accggaaaga tacgatgagg ctgattcggg 540 aaccgaaaga atcgtagcct accggaaccc tctgggggaa cggttaggag aatgatgcct 600 a 601 <210> 5 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 5 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnccggcttt gcctccaaga caggccccct 60 caaagtagag aggaaagtac gaggaggtct ggcgttaatc cacacaatca acttcccctg 120 cctcaagcag tcgtcagaag agaatgggat ggacgcatgg tacaccatcc ttcagatgat 180 ggagtatgta aaggacgcag aagacatgtt gttgccagat agtcttaaaa agaagtataa 240 aaacatggcg gatgtcagcg atagagagct gagactacag tggtgtcaca tccagcagat 300 satttgcacg ataatccagc aggatgtctg ctctaggtct ggcgcgttct tctacggcca 360 cgctctacca cctaatgatg agatagaact ccgcttggag atgtcgcgtg aggataggcc 420 attcaactcg ctgaagggct gccgtccatt ccccccgagg cctatgtaac atcccaactt 480 ttgaataaga agaaccagag agagatttca agaatccaaa aatcagagcc aacaaaaact 540 ttttatcatc atatcggtct atgcatatag ttcccctttt taattatttg agtgtgcttt 600 t 601 <210> 6 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 6 gcagtgttca ggatcgtctg ctccggctag caatcctcat tctgcatcgt ccgatccctc 60 gtcagattct atgcctccca atgctgtggt ccctcgtgtg cagccggtgc ctgctgctga 120 tcgtccgcgt acacgcagtc tgagtggcat atctcagcct aagatcatta cagatggtcg 180 tattcggtat gacaggatac ggtttgctaa ttattgcagc actggtgaac ccacaactct 240 tgatgaagcc tttgctgatc ctaagtggaa gtctgcaatg gatgaagaat atatggccct 300 saagaacaat cagacctggc atttggttcc tgctactgct ggcagaaatg tgattgattg 360 taagtgggtt tataaggtca aacgtcgagc cgatggatct attgatcgtt acaaggctcg 420 tctcgttgcc aaagtattca aacagcgtta tggcatcgac tatgaggata catttagtca 480 tgtagtcaaa gtggagacca ttcgactggt tctttctttg gcagtctctc gagggtggca 540 tcttcgtcaa cttgatgtaa agaatgcatt tttgcatggt attctggaag aagaagtatg 600 c 601 <210> 7 <211> 359 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 7 atgtggtcgt acaccaggag gagctcgtcc ttgcgccggc agtagccgtc tagccgagca 60 gctgcacgag gttgcggtcc ggagccgggc gccgatggtc accacttcgg ttatgaactc 120 cttatcccca tcgtgtagta ttgatctgtg tcctgtagtg gtagtgtatc caagctgtac 180 ctctgatgtt cttagcaggt agcaatgaaa aatataactg aatatgtatg tgtttcagct 240 tgtagtgtta gcatctacgt tcagtgccat cttgtactga actggattca gtcgcgtacc 300 mgatttttct tcagtgtaga ggactggtgt gttccagcgt gtagtgttac catttttgc 359 <210> 8 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 8 ttcttaatct ttctcttttt aaacttagga gcatcagatg ttccttttcc tgcttttgtt 60 ttgctgtttc agctcttttc ccactcactg aggccttcaa ctgcctcagt ttctcagctg 120 tttccttgca ctgcttggca ccttcagctg cttcagtctg agctcttctt ctggcttgag 180 attctcgaac tctttgaact gcctctgcag ccagtttttc atgcttagta gcctcagctt 240 tagcttcctg ttttcttgcc aggcactcag ccagcaagag aaattctttc ttcattttgc 300 kccctttcac ttgtattctt ggctgtattg ggtgttctta tatttatgaa acagatctgt 360 ctttcttctc agcaagaata gctgcttttc tttgagtcaa ggtcattctt tcatcagagt 420 catcactatc tatgatctcc actgcagctt tctgactgct gcttccctct ctagatttag 480 cctgggcagt ctcttgttga gtcttttcag atactgcatt ttgcagctgc ctcctgtgct 540 tccctttgag cagtttcagc ctcagcctgc tgttttgctg ctctcttctt cccttttctt 600 g 601 <210> 9 <211> 601 <212> DNA <213> Artificial Sequence <220> <223> Scaffold Sequence of Lolium multiflorum <400> 9 caatgatctc aatactgacc cggaagcagg atacaagcac gcccagaagc accgcccacg 60 cggcaaagga ggcaagggca agaacaagga cagggatgaa gagagttctg aggcgatgga 120 tgaggatgat gcttcgccgg atcccaaaga gggttccgca gctaacaaat ccaacccctt 180 cggcaaaaag agtgttgggg cttaccatac cttcctcgga accccaacgg tccgggccaa 240 gaaatcggcc cttcggatcc tgaatgccac agttccggct gtgccgcagt acgtcaagtg 300 kcggaaaaac cctgcacctt cgacaggacg gatcacccga ccatcatccc caaagagtgc 360 tacgccctgg ttgtgagtcc ccgcatcgac aggtatgact tctccaagtg tcttatggat 420 ggcggagcca gcttgaacat catgtacctg gagactatgg agaggatgaa ccttaccaag 480 gagcatctca agcacagcag cagtgagttt catggtgtag ttccgggtaa aaaggcaaac 540 tccctgagta gcatcaaact tcccatggcc ttcagcgatg ttaataattt ccgcgaagag 600 a 601

Claims (10)

  1. 서열번호 1 또는 서열번호 2, 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(single nucleotide polymorphism, SNP) 마커를 검출할 수 있는 제제를 포함하는 이탈리안 라이그라스 IR605 품종 식별용 조성물.
  2. 제1 항에 있어서,
    상기 단일염기다형성 마커는,
    서열번호 1의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 G 또는 A이고,
    서열번호 2의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고,
    서열번호 3의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 T이고,
    서열번호 4의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 T 또는 C이고,
    서열번호 5의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고,
    서열번호 6의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 C 또는 G이고,
    서열번호 7의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 A 또는 C이고,
    서열번호 8의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 G 또는 T이고,
    서열번호 9의 염기서열로 표시되는 폴리뉴클레오티드에서 301번째 염기가 G 또는 T인 단일염기다형성 마커인, 이탈리안 라이그라스 IR605 품종 식별용 조성물.
  3. 제1 항에 있어서,
    상기 단일염기다형성 마커를 검출할 수 있는 제제는 단일염기다형성 마커 부위를 포함하는, 10개 내지 350개의 연속적인 DNA 서열로 구성되는 폴리뉴클레오티드; 또는 이의 상보적인 폴리뉴클레오티드;와 특이적으로 혼성화(hybridization)하는 폴리뉴클레오티드인, 이탈리안 라이그라스 IR605 품종 식별용 조성물.
  4. 제3 항에 있어서,
    상기 폴리뉴클레오티드는 단일염기다형성 마커를 검출할 수 있는 프라이머, 프로브, 및 이들의 조합으로 구성된 군으로부터 선택된 하나 이상인, 이탈리안 라이그라스 IR605 품종 식별용 조성물.
  5. 제1 항 내지 제4 항 중 어느 한 항에 따른 조성물을 포함하는 이탈리안 라이그라스 IR605 품종 식별 키트.
  6. 이탈리안 라이그라스의 DNA를 추출하는 단계;
    상기 추출된 DNA를 주형으로 하고, 제1 항 내지 제4 항 중 어느 한 항에 따른 조성물을 이용하여 중합효소연쇄반응(PCR)을 수행하는 단계; 및
    상기 중합효소연쇄반응에 의해 생성된 산물을 분석하여 상기 이탈리안 라이그라스의 품종을 식별하는 단계;를 포함하는 이탈리안 라이그라스 IR605 품종 식별 방법.
  7. 제6 항에 있어서,
    상기 품종을 식별하는 단계는,
    상기 이탈리안 라이그라스의 DNA 중, 서열번호 1로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 A이거나 서열번호 2로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 G이고,
    서열번호 3으로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고,
    서열번호 4로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T이고,
    서열번호 5로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고,
    서열번호 6으로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고,
    서열번호 7로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 C이고,
    서열번호 8로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T이고,
    서열번호 9로 표시되는 폴리뉴클레오티드에서 301번째 염기의 위치에 대응되는 상기 DNA의 염기가 T인 경우, 상기 이탈리안 라이그라스가 IR605 품종인 것으로 식별하는 이탈리안 라이그라스 IR605 품종 식별 방법.
  8. 제6 항에 있어서,
    상기 이탈리안 라이그라스의 품종은 코위너(Kowinner), 코스피드(Kospeed), 그린콜(Green Call), 그린콜(Green Call) 2호, IR601, IR602, IR603, IR605, IR901, 그린팜(Green Farm), 그린팜(Green Farm) 2호, 그린팜(Green Farm) 3호, 코윈어리(Kowinearly), 애스(AE), 화산 101호, 화산 102호, 화산 104호, 헤르쿨레스(HC), 코윈마스터(Kowinmaster), 코그린(Kogreen), 플로리다(Florida), 빌켄(Billiken), 및 리오(Rio) 중 어느 하나인 이탈리안 라이그라스 IR605 품종 식별 방법.
  9. 서열번호 1 및 서열번호 3 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(single nucleotide polymorphism, SNP) 마커를 검출할 수 있는 제제를 포함하는 이탈리안 라이그라스 IR605 품종 식별용 조성물.
  10. 서열번호 2 내지 9의 염기서열로 이루어진 폴리뉴클레오티드에 있어서, 각각의 염기서열 중 서열번호의 301번째 염기의 단일염기다형성(single nucleotide polymorphism, SNP) 마커를 검출할 수 있는 제제를 포함하는 이탈리안 라이그라스 IR605 품종 식별용 조성물.
KR1020220064924A 2022-05-26 2022-05-26 이탈리안 라이그라스 ir605 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 ir605 품종 식별 방법 KR20230165037A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220064924A KR20230165037A (ko) 2022-05-26 2022-05-26 이탈리안 라이그라스 ir605 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 ir605 품종 식별 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220064924A KR20230165037A (ko) 2022-05-26 2022-05-26 이탈리안 라이그라스 ir605 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 ir605 품종 식별 방법

Publications (1)

Publication Number Publication Date
KR20230165037A true KR20230165037A (ko) 2023-12-05

Family

ID=89157349

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220064924A KR20230165037A (ko) 2022-05-26 2022-05-26 이탈리안 라이그라스 ir605 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 ir605 품종 식별 방법

Country Status (1)

Country Link
KR (1) KR20230165037A (ko)

Similar Documents

Publication Publication Date Title
WO2016197258A1 (en) Methods and compositions for cannabis characterization
KR101493980B1 (ko) 벼 품종인식을 위한 Indel 마커
KR20190086426A (ko) 향미 품종 판별용 프라이머 세트 및 이의 용도
KR20180077873A (ko) 수박 분자마커이용여교잡 선발용 snp 마커
KR102235298B1 (ko) 토마토 황화잎말림 바이러스 저항성 판별용 마커 및 이를 이용한 판별 방법
BRPI0614050A2 (pt) métodos para peneiramento de polimorfismos de hibridização especìficos de gene (gshps) e seus usos no mapeamento genético e desenvolvimento de marcador
KR101914275B1 (ko) 향미 품종 판별용 프라이머 세트 및 이의 용도
KR102458440B1 (ko) 고추 역병 저항성 판별용 프라이머 세트 및 이를 이용한 고추 역병 저항성 판별 방법
US10172305B2 (en) Diagnostic molecular markers for seed lot purity traits in soybeans
KR20230165037A (ko) 이탈리안 라이그라스 ir605 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 ir605 품종 식별 방법
KR20230165039A (ko) 이탈리안 라이그라스 hs104 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 hs104 품종 식별 방법
KR20230165042A (ko) 이탈리안 라이그라스 극조생종 및 조생종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 극조생종 및 조생종 식별 방법
KR20230165040A (ko) 이탈리안 라이그라스 kw 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 kw 품종 식별 방법
KR20230165041A (ko) 이탈리안 라이그라스 국내외 대표 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 국내외 대표 품종 식별 방법
KR20230165038A (ko) 이탈리안 라이그라스 gf 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 gf 품종 식별 방법
KR20230165043A (ko) 이탈리안 라이그라스 숙기별 대표 품종 식별용 snp 마커 및 이를 이용한 이탈리안 라이그라스 숙기별 대표 품종 식별 방법
KR101802585B1 (ko) 향미 품종 판별용 프라이머 세트 및 이의 용도
KR102077963B1 (ko) 향미 품종 판별용 프라이머 세트 및 이의 용도
KR102001786B1 (ko) 향미 품종 판별용 프라이머 세트 및 이의 용도
KR102145629B1 (ko) 국내 자포니카 벼 품종의 유전자 연관지도 작성용 kasp 마커 세트
KR101432279B1 (ko) 캡시컴 안늄의 종내집단을 이용한 ssr 마커 및 유전자 연관지도
KR101854896B1 (ko) 토종견 품종 확인용 단일염기다형성 마커 및 이의 용도
KR102572418B1 (ko) 양파 잿빛곰팡이 저항성 형질을 예측 또는 진단하기 위한 단일염기다형성(snp) 마커 조성물 및 이를 이용한 예측 또는 진단 방법
KR102530346B1 (ko) 홍해삼 식별용 유전자 마커를 이용한 친자확인방법
KR102530342B1 (ko) 홍해삼 식별용 유전자 마커 및 이를 이용한 친자확인방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal