KR101908720B1 - 유전체상 블록을 이용한 유전자좌 탐색방법 - Google Patents

유전체상 블록을 이용한 유전자좌 탐색방법 Download PDF

Info

Publication number
KR101908720B1
KR101908720B1 KR1020150158247A KR20150158247A KR101908720B1 KR 101908720 B1 KR101908720 B1 KR 101908720B1 KR 1020150158247 A KR1020150158247 A KR 1020150158247A KR 20150158247 A KR20150158247 A KR 20150158247A KR 101908720 B1 KR101908720 B1 KR 101908720B1
Authority
KR
South Korea
Prior art keywords
block
varieties
blocks
genome
locus
Prior art date
Application number
KR1020150158247A
Other languages
English (en)
Other versions
KR20170055607A (ko
Inventor
김율호
박향미
이유영
김수정
손황배
정진철
서종택
권기범
Original Assignee
대한민국
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국 filed Critical 대한민국
Priority to KR1020150158247A priority Critical patent/KR101908720B1/ko
Publication of KR20170055607A publication Critical patent/KR20170055607A/ko
Application granted granted Critical
Publication of KR101908720B1 publication Critical patent/KR101908720B1/ko

Links

Images

Classifications

    • G06F19/22
    • G06F19/24

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 블록을 사용하여 품종간 동일하거나 차이나는 블록을 제거하는 방법을 수행하여 특정 표현형을 발현하는 유전자 또는 유전자좌를 탐색하는 방법에 관한 것이다.
본 발명은 유전체 전체 영역에서 분석을 수행하는 전장유전체연관분석(Genome-Wide Association Study, GWAS)과 달리 유전체를 구간별 블록단위로 구분하여 비교분석 함에 따라 소요되는 시간과 비용을 최소로 줄일 수 있으며 반복 서열 및 유전체중복영역으로 인한 오류의 발생을 최소화 할 수 있다.

Description

유전체상 블록을 이용한 유전자좌 탐색방법 {A locus search method using a block on genome}
본 발명은 블록을 사용하여 특정 표현형을 발현하는 유전자 또는 유전자좌를 탐색하는 방법에 관한 것이다.
특정 표현형(phenotype)을 발현하는 유전자(gene) 또는 유전자좌(locus)을 찾기 위해 품종 및 유전자원의 유전자형(genotype)을 직접 비교 분석하는 방법을 연관분석(association study)라 한다. 유전체 전체 영역에서 이러한 분석을 수행하는 것을 전장유전체연관분석(Genome-Wide Association Study, GWAS)라 한다.
콩 유전체는 약 1억 개의 염기서열로 이루어져 있으며, 품종간 보통 약 100만개 이상의 염기서열의 차이가 있다. 따라서 두 개 품종을 비교하기 위해서는 100만개 이상의 단일염기다형성(SNP)을 상호 비교해야 한다.
특정 표현형을 결정하는 유전자(gene) 또는 유전자좌(locus)을 정확히 찾기 위해서는 충분한 숫자의 염기서열 차이를 하나하나 통계적으로 분석해야 하는 어려움이 있다.
수백만~수천만개의 염기서열 차이를 비교해야 하기 때문에 계산 시간이 오래 걸리고 긍정오류(false positive) 가 많이 발생하는 문제점이 있다.
하지만 유전체를 구간별로 나누고, 나누어진 구간별 블록단위로 비교분석할 수 있다면 만개 이내의 블록으로 비교가 가능하여 분석에 소요되는 시간과 비용을 줄일 수 있고 반복서열 및 유전체 중복영역으로 인한 오류의 발생을 최소화할 수 있다.
이에 본 발명자들은 유전체를 구간별로 나눈 블록을 이용하여 특정형질을 나타내는 유전자 또는 유전자좌를 찾는 방법을 완성하게 되었다.
1. Variation block-based genomics method for crop plants. Kim et al. BMC Genomics 2014, 15:477
본 발명의 목적은 블록을 이용한 특정 표현형질을 나타내는 유전자 또는 유전자좌를 탐색하는 방법을 제공하기 위한 것이다.
본 발명은
(A) 표준유전체 품종과 다른 품종의 유전체를 해독하는 단계;
(B) 상기 해독된 유전체에서 단일염기변이(Single Nucleotide Variation) 밀집영역 분석을 통하여 블록(Block)을 지정하는 단계;
(C) 상기 (B)단계에서 지정된 각각의 블록을 정렬한 후, 표준유전체 품종의 블록을 기준으로 품종간 블록의 염기서열 비교를 통해 블록 타입(Type)을 결정하는 단계; 및
(D) 상기 (C)단계에서 결정된 블록 타입을 품종간 비교하는 단계;
를 포함하는 식물의 표현형질 관련 유전자 또는 유전자좌 탐색방법을 제공한다.
본 발명에서 용어, "표준유전체"는 본 발명의 품종 판별함에 있어 기준이 되는 작물의 품종의 유전체를 의미한다. 바람직하게는 블록의 타입을 결정하는데 기준이 되는 품종의 유전체를 의미한다. 더욱 바람직하게는 콩의 경우 윌리엄스82(W82)의 유전체가 될 수 있으나, 이에 제한되는 것은 아니며 다른 품종을 표준염색체 품종으로 할 수 있다.
본 발명에서 용어, "유전체 해독"은 유전자의 염기서열을 해석하고 유전정보를 분석하는 것을 의미한다. 바람직하게는 유전자의 염기서열을 해석하는 것만을 의미한다. 유전자의 염기서열 분석은 시판되고 있는 염기서열 분석기를 이용할 수 있다. 바람직하게는 일루미나(Illumina)사의 하이식2000(HiSeq2000) 염기서열해독기(sequencer)를 사용할 수 있다.
본 발명에서 용어, "단일염기변이(Single Nucleotide Variation)"는 "SNP(single nucleotide polymorphism)"라고도 하며, 이는 단일 염기에서의 다형성(polymorphism)을 의미한다. 즉, 어느 집단에 있어 전체 게놈(genomome)에 있는 일부 염기가 염색체 마다 다른 경우가 존재하는 것을 말하며, 통상적으로 단일염기변이는 300 내지 1000개의 염기에 하나 정도 존재하는 것으로 알려져 있으나, 이에 제한되는 것은 아니다.
상기 (B)단계의 단일염기변이(Single Nucleotide Variation) 밀집영역 분석이라 함은 분석하고자 하는 품종의 염기서열 정보를 10kb 단위로 표준유전체와 비교하면서 단일염기변이(SNV)를 검출하여 단일염기변이가 밀집된 영역을 찾는 것을 의미한다. 바람직하게는 표준유전체 유전체 정보와 차이를 보이는 단일염기변이(SNV) 수가 10kb 당 4개 이상일 때, 단일염기변이 밀집영역으로 봄이 타당하다.
본 발명에서 용어, "블록"은 유전자 또는 염색체의 변화가 일어난 곳을 의미하는 "변이블록? 과 염색체의 변화가 없는 "공통 영역"을 포함하는 의미이다. 본 발명에서는 "변이블록"을 DMB(Dense mutation block)로 표시하기도 한다. 즉, 품종간의 유전자의 차이가 존재하는 영역을 의미할 수 있고, 본 발명에서는 단일염기변이(SNV)가 밀집한 영역을 의미할 수 있다. 보다 구체적으로, 본 발명에서는 표준유전체 유전체 정보와 차이를 보이는 단일염기변이(SNV) 수가 10kb 당 4개 이상일 때 이를 "변이블록"이라 규정한다.
그리고 상기 (B) 단계의 지정된 블록의 갯수는 염색체당 200개 내지 400개 인 것을 특징으로 하고 바람직하게는 300개 인 것을 특징으로 하는 식물의 표현형질 관련 유전자 또는 유전자좌 탐색방법일 수 있다.
상기 (C)단계의 유전체 비교를 통해서 블록 타입을 결정하는 단계는 유전체 해독을 통해서 지정된 블록간의 염기서열을 비교하여 블록 타입을 결정한다. 염기서열이 동일한 경우 동일한 블록 타입으로, 염기서열이 상이한 경우 다른 블록 타입으로 본다. 블록 타입을 비교하는 방법도 블록간의 염기서열을 비교하는 방법에 의한다.
또한, 상기 (D) 단계는 블록의 타입과 한쪽 표현형이 일치하는 경우,
(ㄱ) 표현형에 따라 품종을 구분하는 단계;
(ㄴ) 유전자가 발현되지 않은 표현형질을 가진 품종을 기준 품종으로 하고 나머지 품종은 대상 품종으로 결정하는 단계;
(ㄷ) 기준 품종 중 한 품종과 표현형이 다른 대상품종들의 블록 타입을 비교하여 일치하는 블록을 제거하는 단계;
(ㄹ) 표현형이 동일한 기준 품종간의 블록 타입을 비교하여 차이나는 블록을 제거하는 단계; 및
(ㅁ) (ㄹ)단계를 반복 수행하여 최종적으로 남은 블록으로부터 유전자좌를 결정하는 단계;
를 포함하는 것을 특징으로 하는 식물의 표현형질 관련 유전자 또는 유전자좌 탐색방법일 수 있다.
또한, 상기 (D) 단계는 블록의 타입과 표현형이 완전히 일치하는 경우,
(ㄱ) 표현형에 따라 기준품종과 대상품종으로 구분하는 단계;
(ㄴ) 기준 품종 중 한 품종과 표현형이 다른 대상품종들의 블록 타입을 비교하여 일치하는 블록을 제거하는 단계;
(ㄷ) 표현형이 동일한 기준 품종간의 블록 타입을 비교하여 차이나는 블록을 제거하는 단계; 및
(ㄹ) (ㄷ)단계를 반복 수행하여 최종적으로 남은 블록으로부터 유전자좌를 결정하는 단계;
를 포함하는 것을 특징으로 하는 식물의 표현형질 관련 유전자 또는 유전자좌 탐색방법일 수 있다.
본 발명에서 용어, "기준 품종" 은 본 발명의 품종을 표현형에 따라 구분함에 있어 기준이 되는 표현형을 가진 작물의 품종을 의미하고 "대상 품종"은 반대의 표현형을 가진 작물의 품종을 의미한다. 일례로 콩의 꽃색 표현형이 흰색 또는 붉은색이 있는 경우, 이중 하나인 흰색의 표현형을 가진 하나의 콩 품종을 기준 품종으로 하고 나머지 붉은색의 표현형을 가진 콩 품종을 대상 품종으로 할 수 있다, 그러나 이에 제한되는 것은 아니다.
바람직하게는 상기 식물은 콩인 것을 특징으로 한다. 그러나 콩으로 제한되는 것은 아니다.
본 발명인 블록을 이용한 표현형질관련 유전자 또는 유전자좌 탐색방법은 유전체를 변이영역을 포함하는 블록과 그렇지 않은 공통영역으로 지정하고 블록단위로 표현형이 다른 품종의 유전체를 비교 분석이 가능하므로 적은 수의 품종으로도 유전자좌 탐색을 할 수 있고 분석에 소요되는 시간과 비용을 줄일 수 있고 반복서열 및 유전체 중복영역으로 인한 요류의 발생을 최소화 할 수 있는 효과가 있다. 또한 본 발명인 블록을 지정하여 유전자좌를 탐색하는 방법은 블록 타입과 표현형과의 일치 정도를 눈으로 직접 확인이 가능하므로 유전체 해독 결과가 정확한지 여부를 검정하는 지표로 사용될 수 있다.
도 1은 본 발명의 표현형 관련 유전자좌 탐색과정의 개념도이다.
도 2는 블록 타입과 한쪽 표현형이 일치하는 경우 유전자좌 탐색방법에 관한 것이다. 블록 타입이 같은 경우는 같은 색으로 표시하고 블록 타입이 다른 경우는 다른 색으로 표시하였다.
도 3은 블록 타입과 표현형이 일치하는 경우에 유전자좌 탐색방법에 관한 것이다. 블록 타입이 같은 경우는 같은 색으로 표시하고 블록 타입이 다른 경우는 다른 색으로 표시하였다.
도 4는 블록을 이용한 제색 표현형 관련 유전자좌 탐색과정 및 결과이다.
도 5은 제색 표현형 관련 유전자 탐색을 위한 SNP를 이용한 GWAS 분석결과이다.
도 6는 블록을 이용한 모용색 표현형 관련 유전자좌 탐색과정 및 결과이다.
도 7는 모용색 표현형 관련 유전자 탬색을 위한 SNP를 이용한 GWAS 분석결과이다.
도 8은 블록을 이용한 꽃색 표현형 관련 유전자좌 탐색과정 및 결과이다.
도 9은 기준 품종 및 대상 품종 선택에 따른 유전자좌 탐색 결과를 비교한 것이다.
도 10은 꽃색 표현형 관련 유전자 탐색을 위한 SNP를 이용한 GWAS 분석결과이다.
도 11은 블록을 이용한 잎모양 표현형 관련 유전자좌 탐색과정 및 결과이다.
도 12는 잎모양 표현형 관련 유전자 탐색을 위한 SNP를 이용한 GWAS 분석결과이다.
이하, 본 발명의 이해를 돕기 위하여 실시예를 들어 상세하게 설명하기로 한다. 다만 하기의 실시예는 본 발명의 내용을 예시하는 것일 뿐 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 본 발명의 실시예는 당업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해 제공되는 것이다.
< 실시예 >
실시예 1. 블록의 결정(도 1)
표준유전체 품종과 대상 품종의 유전체 해독을 위한 DNA 추출을 위하여 당업계에 알려진 24개의 콩 품종(표 1)을 각각 파종상자에 파종 후 15일된 어린잎으로부터 조직을 채취하여 (Saghai Maroof et al. 1984, Proc. Natl . Acad Sci . USA 81:8014-8019)의 방법으로 수행하였다. -70℃에서 동결 보존한 콩 잎을 막자사발에 넣어서 즉시 20 ㎖의 액체질소로 냉각하면서 분말 상태로 분쇄하였다. 이 시료에 5 내지 10 ㎖의 CTAB(cetyl trimethyl ammonium bromide)을 가하여 더욱 곱게 분쇄한 후 15 ㎖ 원심분리 튜브에 넣은 뒤 60℃ 수조에 2시간 이상 진탕하였다. Chloroform/isoamyl alcohol(24:1) 용액 10 ㎖을 각각의 샘플에 첨가한 후, 손으로 뒤집어 주면서 섞은 뒤 3200 rpm, 4℃에서 15분 정도 원심분리 하였다. 상층액을 새 튜브에 옮긴 뒤 10 ㎕(10 ㎎/㎖) RNase A를 넣어 두었다. 30분 후에 아이소프로판올을 2/3 정도 넣고 섞어주어 DNA를 침전시켰다. 침전된 펠럿(pellet)을 꺼내어서 70℃ 에탄올, 10 mM NH4OAc20㎖에 첨가하였으며, 그 상태로 밤샘(overnight)시킨 후, DNA pellet을 말려서 10 mM NH4OAc,0.25MEDTA를 1㎖ 첨가하였다. 추출한 DNA는 λDNA(100 ng/㎕)와 함께 1% 아가로스 겔에서 확인하였고, 20 ng/㎕로 정량하여 실험에 사용하였다.
이후 염색체 염기서열 해독을 위해 추출된 각 품종 DNA을 대상으로 DNA 라이브러리를 제작하고 일루미나(Illumina)사의 하이식2000(HiSeq2000) 염기서열해독기(sequencer)에서 표준 프로토콜(protocol)에 따라 각 품종의 염기서열을 해독하였다. 그 결과로 생산된 101-bp 또는 104-bp의 단편서열(read)을 생물정보분석에 사용하였다(표 1). 생물정보분석을 위한 레프런스 게놈으로는 Gmax109 soybean reference genome (Schmutz et al. Nature 2010, 463(7278):178183.)을 사용하여 BWA algorithm (Li and Durbin, 2009) ver. 0.5.9.으로 분석하였다.
Figure 112015109955931-pat00001
상기 해독된 유전체에서 단일염기변이(SNV) 밀집영역 분석을 통하여 변이블록을 탐색하였다. 상기 변이블록을 탐색하는 방법은 분석하고자 하는 품종의 염기서열 정보를 10kb 단위로 표준유전체와 비교하면서 단일염기변이(SNV)를 검출하였다. 이 때 표준유전체 유전체 정보와 차이를 보이는 단일염기변이(SNV) 수가 10kb 당 4개 이상일 때, 본 발명에서는 이를 "변이블록"이라 명명하였다.
구체적으로, 바로 옆에 인접한 변이블록이 90kb 간격 내에 있을 경우, 이를 합쳐서 하나의 변이블록으로 표시할 수 있다. 또한 블록 이외의 영역은 변이가 없는 "공통 영역"으로 표시하며, 이웃한 공통 영역이 30kb 간격 내에 있을 때 동일 영역으로 표시할 수 있다. 상기와 같은 내용은 용이한 시각화를 위하여, 염색체 상 표시를 변이블록은 회색박스로, 공통영역은 하얀색으로 표시할 수 있으며, 이에 제한되는 것은 아니다.
상기 해독 유전체 정보를 바탕으로 단일염기변이(SNV) 밀집영역 분석을 통해 블록을 지정한 결과, 20개 염색체를 대상으로 분석하였을 때 모두 6,147개의 블록이 지정되었고, 염색체별로는 8번 염색체에서 가장 많은 374개의 블록이 지정된 반면, 16번 염색체에서는 212개로 가장 적게 지정되었다(표 2). 그 중 1번 염색체의 경우, 24개 콩 품종 해독을 통해 289개 블록이 지정 되었다(표 2).
Figure 112015109955931-pat00002
실시예 2. 블록을 이용한 특정 표현형질 관련 유전자좌 탐색 방법
<2-1> 블록 타입과 한쪽 표현형이 일치하는 경우(도 2)
1. 표현형에 따라 흰색과 붉은색 품종으로 구분한다
(흰색: 품종 1, 3, 4)/ (붉은색: 품종 2, 5, 6, 7, 8)
2. 유전자가 발현되지 않은 표현형인 흰색을 나타내는 품종 1의 블록을 기준으로 붉은색 형질의 품종 2, 5, 6, 7, 8의 블록 타입과 한 개라도 일치는 블록은 모두 빼고 차이나는 블록만을 남긴다. (도 2에서 품종1의 b1-b7 블록을 대상으로 품종2, 5, 6, 7, 8의 블록 타입을 비교하여 블록 타입이 하나라도 일치하는 경우 제외한다. 예를 들어 품종 1의 b1을 품종 2, 5, 6, 7, 8의 b1과 비교하였을 때, 품종 5, 8의 b1이 일치하여 제외된다. 이러한 방식으로 나머지 블록을 비교해간다. 그 결과로 b1, b2, b3, b4, b5, b7 블록은 제외되고 최종으로 b6가 남는다.)
3. 남은 b6과 흰색 형질을 보이는 다른 품종(품종 3, 4)과의 연관 여부를 확인하여 유전자좌를 확정한다
<2-2> 블록 타입과 표현형이 일치하는 경우(도 3)
1. 표현형에 따라 흰색과 갈색 품종으로 구분한다.
(흰색: 품종 1, 6, 7, 8)/ (갈색: 품종 2, 3, 4, 5)
2. 흰색을 나타내는 품종 1의 블록을 대상으로 갈색을 보이는 품종 2, 3, 4, 5의 블록 타입과 한 개라도 일치하는 블록은 모두 빼고 차이나는 블록만을 남긴다. (도 3에서 품종 1의 b1-b7 블록을 대상으로 품종2, 3, 4, 5의 블록 타입을 비교하여 블록 타입이 하나라도 일치하는 경우 제외한다. 예를 들어 품종 1의 b1을 품종 2, 3, 4, 5의 b1과 비교하였을 때, 품종 2와 5의 b1이 일치하여 제외된다. 이러한 방식으로 나머지 블록을 비교해간다. 그 결과로 b1, b2, b4, b5, b6, b7 블록은 제외되고 최종으로 b3가 남는다.)
3. b3와 흰색을 나타내는 다른 품종(품종 6, 7, 8)의 연관 정도를 재확인하여 유전자좌를 확정한다.
실시예 3. 블록을 이용한 콩의 제색( hilum color) 표현형 관련 유전자좌 탐색
제색 표현형이 갈색인 W82, BU, SPD2, SG, DP, JSP, SMNM, SW, KG, PDK, BC, SDBK의 12품종과 표현형이 노란색인 HK, SR, DW, JYK, JP2, TK, JDBM, KKSR, CBB의 8품종을 사용하였다.
실시예 1에서 지정된 6,147개의 블록을 사용하여 실시예 2-1과 같이 품종간 블록 타입을 비교하여 동일하거나 차이나는 블록을 제거하는 방식을 통해서 유전자좌 탐색을 수행하였다.
구체적으로 유전자가 발현하지 않은 노란색 표현형 품종(HK)의 블록을 기준으로 갈색 형질의 콩(12품종) 블록을 비교하여 블록 타입이 한 개라도 일치하는 블록은 모두 제외시켰다. 그 결과 6,147개의 블록에서 991개가 남았다. 남은 991개는 다시 노란색 콩 품종(SR)의 블록과 비교하는데 이때는 동일한 표현형을 나타내는 품종간의 연관 여부를 확인하기 위하여 블록 타입이 동일한 블록을 남기는 방법(차이나는 블록을 제거)으로 수행하여 53개의 블록을 탐색하였다. 노란색 표현형질을 가지는 다른 품종과 상기 과정을 계속 진행하여 최종으로 2개의 블록을 성공적으로 탐색하였다. 탐색된 2개의 블록에 기존에 알려진 제색관련 유전자좌가 있어 이 방법을 사용하여 정확히 탐색할 수 있음을 확인할 수 있었다(도 4).
< 비교예 > SNP 를 이용한 Genome-Wide Association Study( GWAS )분석을 통한 제색 표현형질 관련 유전자좌 탐색
실시예 1을 통하여 확인된 SNP(표1)를 이용한 유전형과 표현형의 연관분석에 PLINK 프로그램 (http://pngu.mgh.harvard.edu/~purcell/plink/)의 Fisher's exact test 모델을 사용였다.
그 결과, Gm03, Gm08, Gm09, Gm13, Gm16, Gm18 등 여러 영역에서 연관성이 있는 SNP가 탐색되어 블록를 활용하였을 때보다 훨씬 많은 수의 영역이 제색과 연관성이 있는 것으로 분석되었다. 따라서 블록을 활용한 방법이 SNP를 이용한 GWAS 분석방법보다 더 정확하고 효과적으로 유전자좌를 탐색할 수 있음을 확인하였다(도 5).
실시예 4. 블록을 이용한 콩의 모용색 (pubescence color) 표현형 관련 유전자좌 탐색
모용색 표현형이 갈색인 W82, SPD2, DP, PDK의 4품종과 표현형이 흰색인 BU, SG, HK, SR, DW, J나, JYK, JP2, TK, SMNM, SW, KG의 12품종을 사용하였다.
실시예 1에서 지정된 6,147개의 블록을 사용하여 실시예 2-1과 같이 품종간 블록 타입을 비교하여 동일하거나 차이나는 블록을 제거하는 방식을 통해서 유전자좌 탐색을 수행하였다.
유전자가 발현하지 않은 흰색 표현형 품종(BU)의 블록을 기준으로 갈색 형질의 콩(4품종) 블록을 비교하여 블록 타입이 한 개라도 일치하는 블록은 모두 제외시켰다. 그 결과 6,147개의 블록에서 1,008개가 남았다. 남은 1,008개는 다시 흰색 콩 품종(SG)의 블록과 비교하는데 이때는 동일한 표현형을 나타내는 품종간의 연관 여부를 확인하기 위하여 블록 타입이 동일한 블록을 남기는 방법(차이나는 블록을 제거)으로 수행하여 496개의 블록을 탐색하였다. 흰색 표현형질을 가지는 다른 품종과 상기 과정을 계속 진행하여 최종으로 1개의 블록을 성공적으로 탐색하였다. 탐색된 1개의 블록에 기존에 알려진 모용색관련 유전자좌가 있어 이 방법을 사용하여 정확히 탐색할 수 있음을 확인할 수 있었다(도 6).
< 비교예 > SNP 를 이용한 GWAS 분석을 통한 모용색 표현형질 관련 유전자좌 탐색
실시예 1을 통하여 확인된 SNP(표1)를 이용한 유전형과 표현형의 연관분석에 PLINK 프로그램 (http://pngu.mgh.harvard.edu/~purcell/plink/)의 Fisher's exact test 모델을 사용였다.
그 결과 Gm06 영역에서 강한 연관성을 나타내는 SNP가 탐색되어 블록을 활용한 방법과 일치하는 경향을 보였으나, Gm02, Gm03, Gm13, Gm15, Gm19 영역에서도 연관성이 있는 SNP가 있는 것으로 분석되었다. 따라서 블록을 활용한 방법이 SNP를 이용한 GWAS 분석방법보다 더 정확하고 효과적으로 유전자좌를 탐색할 수 있음을 확인하였다(도 7).
실시예 5. 블록을 이용한 콩의 꽃색 (flower color) 표현형 관련 유전자좌 탐색
꽃색 표현형이 붉은색인 BU, SG, SR, JSK, JYK, JP2, SW 의 7품종과 표현형이 흰색인 W82, SPD2, DP, SDBK, CBB, DW, SH 의 7품종을 사용하였다.
실시예 1에서 지정된 6,147개의 블록을 사용하여 실시예 2-1과 같이 품종간 블록 타입을 비교하여 동일하거나 차이나는 블록을 제거하는 방식을 통해서 유전자좌 탐색을 수행하였다.
유전자가 발현하지 않은 흰색 표현형 품종(W82)의 블록를 기준으로 붉은색 형질의 콩(7품종) 블록을 비교하여 블록 타입이 한 개라도 일치하는 블록은 모두 제외시켰다. 그 결과 6,147개의 블록에서 294개가 남았다. 남은 294개는 다시 흰색 콩 품종(SPD2)의 블록과 비교하는데 이때는 동일한 표현형을 나타내는 품종간의 연관 여부를 확인하기 위하여 블록 타입이 동일한 블록을 남기는 방법(차이나는 블록을 제거)으로 수행하여 116개의 블록을 탐색하였다. 흰색 표현형질을 가지는 다른 품종과 상기 과정을 계속 진행하여 최종으로 1개의 블록을 성공적으로 탐색하였다. 탐색된 1개의 블록에 기존에 알려진 꽃색 관련 유전자좌가 있어 이 방법을 사용하여 정확히 탐색할 수 있음을 확인할 수 있었다(도 8).
그러나 상기의 방법과 달리 붉은색 표현형 품종의 블록을 기준으로 흰색표현형 형질의 콩(7품종) 블록을 비교하여 유전자좌 탐색한 결과는 최종적으로 블록이 남지 않았다. 즉, 유전자좌를 찾을 수 없었다(도 9).
이것은 꽃색 표현형은 흰색의 경우 색을 결정하는 유전자가 전혀 발현되지 않아 블록 타입이 한종류이지만 붉은색은 유전자의 발현정도에 따라 붉은색의 정도가 다를 수 있어 이럴 경우에 블록 타입이 한종 이상일 가능성이 높기 때문인 것으로 판단 되었다. 따라서 유전자가 발현되지 않은 쪽 형질을 가진 품종의 블록을 기준으로 비교분석을 진행하여야 함을 확인할 수 있었다.
< 비교예 > SNP 를 이용한 GWAS 분석을 통한 꽃색 표현형질 관련 유전자좌 탐색
실시예 1을 통하여 확인된 SNP(표1)를 이용한 유전형과 표현형의 연관분석에 PLINK 프로그램 (http://pngu.mgh.harvard.edu/~purcell/plink/)의 Fisher's exact test 모델을 사용였다.
그 결과 Gm03과 Gm19 영역에서 꽃색과 연관성이 높은 SNP가 있는 것으로 분석되었다. 꽃색 관련 유전자좌가 있는 Gm13 영역에서도 연관성이 있는 SNP가 탐색되었으나 블록를 활용한 방법에서 탐색된 블록보다는 명확하지는 않았다. 따라서 블록을 활용한 방법이 SNP를 이용한 GWAS 분석방법보다 더 정확하고 효과적으로 유전자좌를 탐색할 수 있음을 확인하였다(도 10).
실시예 6. 블록을 이용한 콩의 잎모양 (leaf shape) 표현형 관련 유전자좌 탐색
잎모양 표현형이 넓은잎인 W82, DP, HK, TK, DW, BU, SPD2, SG, SR, SH, JSK, JP2, CJ3, KG, SDBK, BC, PDK, JDBM, KKSR, CBB의 20품종과 표현형이 좁은잎인 JYK, SMNM, SW, AP 의 4품종을 사용하였다.
실시예 1에서 지정된 6,147개의 블록을 사용하여 실시예 2-1과 같이 품종간 블록 타입을 비교하여 동일하거나 차이나는 블록을 제거하는 방식을 통해서 유전자좌 탐색을 수행하였다.
유전자가 발현하지 않은 좁은잎 표현형 품종(JYK)의 블록를 기준으로 넓은잎 형질의 콩(20품종) 블록을 비교하여 블록 타입이 한 개라도 일치하는 블록은 모두 제외시켰다. 그 결과 6,147개의 블록에서 5개가 남았다. 남은 5개는 다시 좁은잎 콩 품종(SMNM)의 블록과 비교하는데 이때는 동일한 표현형을 나타내는 품종간의 연관 여부를 확인하기 위하여 블록 타입이 동일한 블록을 남기는 방법(차이나는 블록을 제거)으로 수행하여 4개의 블록을 탐색하였다. 좁은잎 표현형질을 가지는 다른 품종과 상기 과정을 계속 진행하여 최종으로 4개의 블록을 성공적으로 탐색하였다. 이와 같은 결과는 사용된 좁은잎 콩 품종 수가 적어 충분한 분석이 되지 않았기 때문인 것으로 판단되며, 4개의 블록중 하나에서 잎모양 관련 유전자좌가 있음을 확인하였다(도 11).
< 비교예 > SNP 를 이용한 GWAS 분석을 통한 잎모양 표현형질 관련 유전자좌 탐색
실시예 1을 통하여 확인된 SNP(표1)를 이용한 유전형과 표현형의 연관분석에 PLINK 프로그램 (http://pngu.mgh.harvard.edu/~purcell/plink/)의 Fisher's exact test 모델을 사용였다.
그 결과 Gm02, Gm04, Gm05, Gm06, Gm07, Gm11, Gm13, Gm15, Gm17, Gm19, Gm20 등 여러 영역에서 연관성이 있는 SNP가 탐색되어 블록를 활용하였을 때보다 훨씬 많은 수의 영역이 잎모양과 연관성이 있는 것으로 분석되었다 또한 Gm17에서 강한 연관성을 SNP들이 있는 것으로 분석되어 잎모양을 결정하는 유전자좌가 있는 Gm20번과는 차이를 보였다. 따라서 블록를 활용한 방법이 SNP를 이용한 GWAS 분석방법보다 더 정확하고 효과적으로 유전자좌를 탐색할 수 있음을 나타낸다(도 12).

Claims (5)

  1. (A) 표준유전체 품종과 다른 품종의 유전체를 해독하는 단계;
    (B) 상기 해독된 유전체에서 단일염기변이(Single Nucleotide Variation) 밀집영역 분석을 통하여 염색체당 200 내지 400개의 블록(Block)을 지정하는 단계;
    (C) 상기 (B)단계에서 지정된 각각의 블록을 정렬한 후, 표준유전체 품종의 블록을 기준으로 품종간 블록의 염기서열 비교를 통해 블록 타입(Type)을 결정하는 단계; 및
    (D) 상기 (C)단계에서 결정된 블록 타입을 품종간 비교하는 단계;
    를 포함하는 식물의 표현형질 관련 유전자 또는 유전자좌 탐색방법으로,
    상기 비교하는 단계(단계 (D))는,
    (ㄱ) 표현형에 따라 품종을 구분하는 단계;
    (ㄴ) 유전자가 발현되지 않은 표현형질을 가진 품종을 기준 품종으로 하고 나머지 품종은 대상 품종으로 결정하는 단계;
    (ㄷ) 기준 품종 중 한 품종과 표현형이 다른 대상품종들의 블록 타입을 비교하여 일치하는 블록을 제거하는 단계;
    (ㄹ) 표현형이 동일한 기준 품종간의 블록 타입을 비교하여 차이나는 블록을 제거하는 단계; 및
    (ㅁ) (ㄹ)단계를 반복 수행하여 최종적으로 남은 블록으로부터 유전자좌를 결정하는 단계; 를 포함하는 것을 특징으로 하는 식물의 표현형질 관련 유전자 또는 유전자좌 탐색방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제 1항에 있어서,
    상기 식물은 콩인 것을 특징으로 하는 식물의 표현형질 관련 유전자 또는 유전자좌 탐색방법.
KR1020150158247A 2015-11-11 2015-11-11 유전체상 블록을 이용한 유전자좌 탐색방법 KR101908720B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150158247A KR101908720B1 (ko) 2015-11-11 2015-11-11 유전체상 블록을 이용한 유전자좌 탐색방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150158247A KR101908720B1 (ko) 2015-11-11 2015-11-11 유전체상 블록을 이용한 유전자좌 탐색방법

Publications (2)

Publication Number Publication Date
KR20170055607A KR20170055607A (ko) 2017-05-22
KR101908720B1 true KR101908720B1 (ko) 2018-10-18

Family

ID=59050118

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150158247A KR101908720B1 (ko) 2015-11-11 2015-11-11 유전체상 블록을 이용한 유전자좌 탐색방법

Country Status (1)

Country Link
KR (1) KR101908720B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200027720A (ko) 2018-09-05 2020-03-13 대한민국(농촌진흥청장) 유전적 거리에 대한 패널티를 적용한 변이 블록 구분 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101493982B1 (ko) 2013-09-26 2015-02-23 대한민국 품종인식 코드화 시스템 및 이를 이용한 코드화 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101493982B1 (ko) 2013-09-26 2015-02-23 대한민국 품종인식 코드화 시스템 및 이를 이용한 코드화 방법

Also Published As

Publication number Publication date
KR20170055607A (ko) 2017-05-22

Similar Documents

Publication Publication Date Title
Balsalobre et al. GBS-based single dosage markers for linkage and QTL mapping allow gene mining for yield-related traits in sugarcane
Lobaton et al. Resequencing of common bean identifies regions of inter–gene pool introgression and provides comprehensive resources for molecular breeding
Anderson et al. Transposable elements contribute to dynamic genome content in maize
Roach et al. Population sequencing reveals clonal diversity and ancestral inbreeding in the grapevine cultivar Chardonnay
Zhebentyayeva et al. Genetic characterization of worldwide Prunus domestica (plum) germplasm using sequence-based genotyping
Lemmon et al. The role of cis regulatory evolution in maize domestication
Schlötterer et al. Sequencing pools of individuals—mining genome-wide polymorphism data without big funding
JP5960917B1 (ja) 水稲全ゲノム育種チップ及びその応用
Lucas et al. Cowpea–soybean synteny clarified through an improved genetic map
Slade et al. TILLING moves beyond functional genomics into crop improvement
Wang et al. A global analysis of QTLs for expression variations in rice shoots at the early seedling stage
Geng et al. Rapid identification of candidate genes for seed weight using the SLAF-Seq method in Brassica napus
Yang et al. Target SSR-Seq: a novel SSR genotyping technology associate with perfect SSRs in genetic analysis of cucumber varieties
Xu et al. Whole-genome resequencing: changing the paradigms of SNP detection, molecular mapping and gene discovery
Yonemaru et al. Genomic regions involved in yield potential detected by genome-wide association analysis in Japanese high-yielding rice cultivars
CN110621785B (zh) 基于三代捕获测序对二倍体基因组单倍体分型的方法和装置
Müller et al. An operational SNP panel integrated to SSR marker for the assessment of genetic diversity and population structure of the common bean
CN109337997B (zh) 一种山茶属多态性叶绿体基因组微卫星分子标记引物及筛选和甄别近缘种的方法
Liao et al. Repetitive DNA sequence detection and its role in the human genome
Coulton et al. Examining the effects of temperature on recombination in wheat
Miculan et al. A forward genetics approach integrating genome‐wide association study and expression quantitative trait locus mapping to dissect leaf development in maize (Zea mays)
CN108018359B (zh) 一种用于鉴定樱桃谷鸭的分子标记及其应用
Busconi et al. Epigenetic variability among saffron crocus (Crocus sativus L.) accessions characterized by different phenotypes
Pereira et al. Patterns of DNA methylation changes in elite Eucalyptus clones across contrasting environments
Lyu et al. Pan-genome analysis sheds light on structural variation-based dissection of agronomic traits in melon crops

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant