WO2013191400A1

WO2013191400A1 - 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법

Info

Publication number: WO2013191400A1
Application number: PCT/KR2013/005055
Authority: WO
Inventors: 황승용; 김지훈; 이원선
Original assignee: (주)지노첵
Priority date: 2012-06-19
Filing date: 2013-06-10
Publication date: 2013-12-27
Also published as: KR20130142523A; KR101406720B1

Abstract

본 발명은 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법과, 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 새로운 표적 유전자의 유전자형 분석방법을 제공한다.

Description

차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법

본 발명은 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것으로서, 보다 상세하게는 수백에서 수천만에 이르는 대량 시료에 대한 유전자형 분석을 짧은 시간 내에 정확하게 할 수 있는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것이다.

또한, 본 발명은 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것이다.

특히, 본 발명은 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR (short tandem repeat)의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성(single nucleotide polymorphism; SNP)을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것이다.

추가로, 본 발명은 차세대 염기서열 분석법에 있어서 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제를 방지하는 새로운 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 관한 것이다.

최근 차세대 염기서열 분석법(Next Generation Sequencing: NGS)이 대중화되면서 많은 사람들의 관심을 받고 있다. 차세대 염기서열 분석법을 이용한 기술은 비약적으로 발전하고 있고, 이를 이용한 유전자형 분석 가격은 저렴해지고 있다.

차세대 염기서열 분석법을 구현하는 차세대 게놈 시퀀서(NGS; Next Generation Sequencer)로 대표적인 것으로는 로슈(Roche)/454, 일루미나(Illumina)/Solexa 및 라이프 테크놀로지스(ABI)의 SOLiD가 있다. 로슈/454와 SOLiD는 고체상의 지지체나 비드 상의 DNA에 주형이 상보적으로 결합된 상태에서 에멀젼 PCR (Emulsion PCR; emPCR)을 수행하여 분석대상 시료 내의 주형을 증폭하는 방식을 채택하고 있다(Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January 2010). 로슈/454의 최신형 모델로 GS FLX 티타늄 시퀀서(GS FLX Titanium sequencer)와, 이를 소형화한 GS 쥬니어 티타늄 시퀀서(GS Junior Titanium sequencer)가 있으며, 이들 장비는 7시간에 8,000만개 서열의 판독이 가능하다. 이러한 기술 발전으로 종래에는 막대한 검사 비용으로 인해 연구용으로만 사용되던 차세대 염기서열 분석법을 의료용 임상 검사에서 활용할 수 있게 되었다.

차세대 염기서열 분석법은 1회의 장비 작동으로 8천만개에서 30억개 염기쌍의 염기서열 정보를 얻을 수 있는 반면에, 전술한 바와 같은 장비를 1주일에 1~2회만 운용해도 그 자료량은 엄청난 분량이 되어 생물정보 분야에서 정보 처리 속도와 염기서열 데이터 통합이라는 문제를 새롭게 부각시키게 되었다. 즉, 차세대 염기서열 분석법으로부터 나오는 염기서열 변이 정보는 너무 방대한 양이므로 사용자가 일일이 검색하기는 불가능하다. 또한, 차세대 염기서열 분석법을 이용하여 생성된 대용량의 염기서열 데이터에서 서열의 길이는 종래의 생거(Sanger) 방법으로 생성한 염기서열 데이터에 비하여 현저하게 짧은 문제점이 있다. 즉, 차세대 염기서열 분석법은 이러한 문제로 인해 짧은 서열들을 모아서 레퍼런스(reference)가 없는 새로운 게놈 염기서열 구성하거나, 동일종 또는 비슷한 종의 서열을 참고로 하여 게놈 염기서열을 구성하는 과정이 필요한 단점이 있다. 뿐만아니라, 로슈(Roche)/454 기반의 차세대 염기서열 분석용 시퀀서는 사전에 증폭되어 준비된 주형인 앰플리콘(amplicon)을 에멀젼 PCR 과정에서 고체상의 지지체나 비드 상에 결합된 DNA에 상보적으로 어닐링한 후 증폭시키는데 이때 주형 만이 증폭되어는 것이 아니라 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제가 있다.

한편, 최근 국내 먹거리에 대한 안전성은 사회적 문제로 대두되고 있으며, 식품의 안전성 관리를 위해 식품의 제조, 유통 및 판매의 이력추적제의 도입이 검토되고 있다. 그런데, 먹거리의 안전성을 위해 구축된 쇠고기와 같은 식품 이력추적제에서 가장 큰 문제점은 소의 도축당시 원래 개체에게 주어지는 이력추적제용 번호가 가공 후에도 안전하게 유지되어야 하나 가공상의 실수, 유통 및 판매 과정에서의 실수 및 고의적인 의도로 다른 육류의 개체식별번호로 바뀔 수 있다는 것이다. 이러한 문제를 감안하여, 쇠고기의 경우 수입육을 국내산으로 둔갑시키는 것을 방지하기 위해 쇠고기이력추적제에서 DNA 동일성 검사를 도입하여 실시하고 있다. 현재 DNA 동일성 검사는 마이크로새틀라이트(microsatellite; MS) DNA의 유전적 특징을 이용하여 개체식별을 하는 방식을 이용하고 있다.

참고로, 마이크로새틀라이트 DNA는 1~5개의 SSR(simple sequence repeat)로서 대부분의 진핵생물의 게놈에 골고루 분포되어 있고, 여러 가지 마커(genetic marker)가 유전분석, 예를 들어 동물의 계통분류, 유전적 유연관계 분석에 이용되고 있다. 마이크로새틀라이트 DNA는 전체 게놈에 고르게 분포되어 있고 그 수는 100,000개에 이른다고 알려져 있는데, STR(short tandem repeat)의 반복개수가 개체 간 변이를 나타낸다. 예를 들어, 특정 마이크로새틀라이트 DNA 마커에 대해 부계 쪽에서 12개의 반복과 19개의 반복의 유전자형을 갖고 있고 모계 쪽에서 18개의 반복과 15개의 반복을 가지고 있다면 1차 자손은 12개의 반복과 15개의 반복을 가질 수 있다. 그런데, 현재 쇠고기이력추적제에서 사용되는 마이크로새틀라이트 분석은 조건(기기, 시약, 실험자 등)에 따라 결과가 일정치 않아 사후에 한우개체인식 분석을 할 경우 결과가 부정확할 가능성이 존재하며, 검사과정에서 모세관 전기영동 방식을 이용하기 때문에 대량시료를 분석하기에 적합하지 않은 단점이 있다. 이러한 이유로 쇠고기의 경우, 2011년 약 270만두가 사육되고 있으나, 도축되는 약 70~100만두에 대한 시료보관 후 검사가 필요한 시료(년간 약 1만~2만)를 선정하여 선정된 개체의 검사만이 이루어지고 있다. 그러나, 이러한 검사 시스템에서 개체식별번호와 맞지 않은 개체가 발견되는 경우, 잘못된 개체에 대한 원 개체식별번호를 찾을 수 없기 때문에 정확한 오류의 원인을 찾을 수가 없다. 따라서, 전체 시료에 대한 전수 검사를 수행하여 데이터베이스화하는 것이 필요하며, 이를 위해 대량 시료를 짧은 시간 내에 정확하면서 저렴하게 분석할 수 있는 방법의 제공이 필요하다.

이와 관련하여 대한민국 등록특허공보 제10-0816476호는 한우의 경제형질과 연관된 마이크로새틀라이트 DNA 프라이머에 대해 개시하고 있고, 대한민국 등록특허공보 제10-0901817호는 한우 생산이력체계 구축용 프라이머 세트 및 이를 이용한 한우 개체 판별방법을 개시하고 있으며, 대한민국 등록특허공보 제10-1008941호는 멀티플렉싱 피씨알에 의한 한우와 수입우의 판별방법 및 이에 사용되는 프라이머를 개시하고 있다. 그러나, 이러한 종래기술들은 전술한 바와 같이 마이크로새틀라이트 DNA의 여러 마커에 대해 멀티플렉싱 PCR을 수행하고 증폭 산물에 대해 모세관 전기영동을 수행한 후 피크 값을 검출하여 STR 반복개수를 확인함으로써 한우 품종을 확인하는 방법으로서, 대량 시료 분석에는 적합하지 않고 피크 값의 부정확성에 기인한 STR 분석의 오류 문제를 근원적으로 갖고 있다. 따라서, 쇠고기이력추적과 같이 대량 시료에 대한 마이크로새틀라이트 분석이 필요한 분야에 있어서는 차세대 염기서열 분석법을 이용하여 대량 시료의 마이크로새틀라이트의 마커 유전자의 염기서열을 동시에 분석함으로써, 종래기술의 분석 결과 오류에 따른 문제점을 해결하는 동시에 마커 유전자의 STR 분석을 짧은 시간 내에 정확하게 할 수 있는 기술의 제공이 요구되고 있다고 할 수 있다.

본 발명의 목적은 수백에서 수천만에 이르는 대량 시료에 대한 유전자형 분석을 짧은 시간 내에 정확하게 할 수 있는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법을 제공하는 것이다.

또한, 본 발명의 목적은 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법을 제공하는 것이다.

특히, 본 발명의 목적은 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR (short tandem repeat)의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성(single nucleotide polymorphism; SNP)을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법을 제공하는 것이다.

추가로, 본 발명의 목적은 차세대 염기서열 분석법에 있어서 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제를 방지하는 새로운 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법을 제공하는 것이다.

상기한 기술적 과제를 해결하고 상기한 발명의 목적에 부합되도록 예의 연구를 거듭한 결과, 본 발명자들은 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법과, 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 새로운 표적 유전자의 유전자형 분석방법을 완성하기에 이르렀다.

우선, 본 발명의 명세서에서 사용되는 용어를 설명하면 다음과 같다.

본 발명의 명세서에서 사용되는 "차세대 염기서열 분석법"이란 짧은 시간 내에 분석대상이 되는 시료에 대해 대량의 염기서열의 판독이 가능하고 대량의 염기서열 데이터를 생성할 수 있는 신개념의 염기서열 분석 기술로서, 예를 들어 로슈/454, 일루미나(Illumina)/Solexa 및 SOLiD와 같은 장비를 이용한 이용한 염기서열 분석기술 등을 들 수 있다(Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January 2010).

본 발명의 명세서에서 사용되는 "표적 유전자"라는 용어는 분석대상이 되는 시료 내의 유전자들 중 유전자형 분석에 유용한 변이가 존재하는 유전자로서, 예를 들어 유전자 감식이나 개체 식별에 사용되는 마커 유전자, 특정 질환의 진단에 사용되는 마커 유전자, 유전학적으로 의미가 있는 돌연변이를 갖는 유전자, STR (short tandem repeat)을 갖는 유전자 및 단일염기다형성을 갖는 유전자 등을 들 수 있다.

또한, 본 발명의 명세서에서 사용되는 "에멀젼 PCR(emPCR")이란 분석대상이 되는 시료 내의 유전자들의 DNA 라이브러리를 각각의 주형 별로 공간적으로 분리하고 오일 방울(droplet) 내의 에멀젼 상태에서 증폭함으로써 단일 주형에 대한 클로날 증폭(clonal amplification)을 수행하는 기술로서, 오일 내에 한쪽 방향 PCR 프라이머(정방향 프라이머 또는 역방향 프라이머)가 결합된 비드와 PCR 증폭 시약(DNA 중합 효소, dNTP 등 포함)을 적하시킴으로써 단일 주형을 포획한 하나의 비드와 PCR 증폭 시약이 포함된 에멀젼을 만든 후 PCR 증폭을 수행하는 기술을 의미한다. 이러한 에멀젼 PCR에서는 오일 방울에 포함된 비드 상에 한쪽 방향 프라이머가 결합되어 고정된 상태이기 때문에 증폭 후 비드의 표면에는 단일 주형이 증폭된 상태로 결합하여 존재하게 되고 이러한 비드를 회수하면 추후 수행되는 시퀀싱 작업을 수행할 수 있다.

추가로, 본 발명의 명세서에서 사용되는 "젤 추출(gel extraction)"이란 DNA 또는 RNA를 젤에 로딩한 후 여러 밴드가 나타날 때 원하는 밴드만을 잘라내고, 그 안에 들어 있는 표적 DNA 또는 RNA를 정제하는 방법을 의미한다.

한편, 본 발명의 실시예에서 설명되는 마이크로새틀라이트 마커는 표적 유전자의 예시로서 이해되어야 하며, 본 발명의 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법과, 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법은 다양한 개체 또는 시료와, 다양한 표적 유전자에 대한 유전자형 분석에 적용가능한 기반기술로서 이해되어야 할 것이다.

본 발명은 하기 구조식 1을 갖는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법을 제공한다:

구조식 1

상기 구조식 1에서 X는 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자에 특이적인 유전자 서열과는 상동성이 없는 비상동성의 프라이머 서열로 구성하고, Y는 모든 시료에 대한 상기 표적 유전자의 유전자형을 동시에 분석할 때 각각의 시료를 식별해 주는 MID (Multiflex identifier) 서열로 구성하며, Z는 상기 표적 유전자에 특이적인 유전자 서열과 상보적으로 결합하는 표적 유전자 특이적인 프라이머 서열로 구성하는 것을 특징으로 한다.

상기 구조식 1에서 n은 분석대상이 되는 시료의 개수와 일치하는 정수로서 2와 같거나 2보다 큰 정수이고, m은 표적 유전자의 개수와 일치하는 정수로서 1과 같거나 1보다 큰 정수이다.

본 발명의 일실시예의 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법에 있어서, 상기 구조식 1의 융합 프라이머가 정방향 융합 프라이머이면 이와 쌍을 이루는 역방향 융합 프라이머, 그리고 상기 구조식 1의 융합 프라이머가 역방향 융합 프라이머이면 이와 쌍을 이루는 정방향 융합 프라이머는 하기 구조식 2를 갖는 것을 특징으로 한다:

구조식 2

상기 구조식 2에서 X', Y 및 Z'의 정의는 상기 구조식 1의 X, Y 및 Z와 동일하고, 상기 구조식 2의 n 및 m 값도 상기 구조식 1의 n 및 m 값과 동일하다.

본 발명의 일실시예의 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법에 있어서, 상기 구조식 1 및/또는 상기 구조식 2의 융합 프라이머의 길이는 50 b.p. 내지 70 b.p. (base pair)의 범위인 것이 바람직하다.

또한, 상기 구조식 1 및/또는 상기 구조식 2에서 Y는 서열번호 1 내지 서열번호 132로 구성된 군으로부터 선택된 MID 서열일 수 있으며, 이 경우 n값은 132가 된다. 그러나, 본 발명은 이에 제한되는 것이 아니며 시료를 식별해 줄 수 있는 10 b.p. 내지 20 b.p. 길이의 짧은 서열이라면 본 발명에 적용가능한 것임은 물론이다.

본 발명의 일실시예의 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법에 있어서, 상기 표적 유전자는 STR (short tandem repeat) 및/또는 단일염기다형성 부위를 포함할 수 있다.

본 발명의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법은,

(a) 하기 구조식 1의 정방향 융합 프라이머 및 이에 대응하는 하기 구조식 2의 역방향 융합 프라이머 쌍을 준비하는 단계와,

구조식 1

구조식 2

(상기 구조식 1 및 상기 구조식 2에서 X, X'는 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자에 특이적인 유전자 서열과는 상동성이 없는 비상동성의 프라이머 서열로 구성하고, Y는 모든 시료에 대한 상기 표적 유전자의 유전자형을 동시에 분석할 때 각각의 시료를 식별해 주는 MID (Multiflex identifier) 서열로 구성하며, Z, Z'는 상기 표적 유전자에 특이적인 유전자 서열과 상보적으로 결합하는 표적 유전자 특이적인 프라이머 서열로 구성하고, n은 분석대상이 되는 시료의 개수와 일치하는 정수로서 2와 같거나 2보다 큰 정수이며, m은 표적 유전자의 개수와 일치하는 정수로서 1과 같거나 1보다 큰 정수임)

(b) 상기 (a) 단계에서 준비된 융합 프라이머 쌍을 이용하여 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자를 증폭하여 각 시료 별로 상기 적어도 하나의 표적 유전자에 대한 PCR 증폭산물을 수득하는 단계와,

(c) 상기 (b) 단계에서 소모되지 않은 융합 프라이머들과 이들로부터 생성된 프라이머 이량체들을 제거하기 위해 상기 수득된 PCR 증폭산물에 대해 젤 추출을 수행하여 정제하는 단계와,

(d) 상기 (c) 단계에서 정제된 PCR 증폭산물을 주형으로 하여 에멀젼 PCR (emPCR)을 수행하는 단계와,

(e) 상기 (d) 단계에서 수득된 에멀젼 PCR 증폭산물에 대한 시퀀싱 결과로부터 각 시료 별로 상기 적어도 하나의 표적 유전자의 서열을 결정하는 단계와,

(f) 상기 (e) 단계에서 결정된 상기 적어도 하나의 표적 유전자의 서열로부터 각 시료 별로 표적 유전자의 유전자형을 분석하는 단계를 포함한다.

본 발명의 일실시예의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 있어서, 상기 표적 유전자는 STR (short tandem repeat) 및/또는 단일염기다형성 부위를 포함하고, 상기 (f) 단계에서는 STR (short tandem repeat)의 반복 개수를 확인하고 STR의 전후에 존재하는 단일염기다형성 존재 여부를 확인하는 것을 특징으로 한다.

본 발명의 일실시예의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 있어서, 상기 구조식 1 및/또는 상기 구조식 2의 융합 프라이머의 길이는 50 b.p. 내지 70 b.p.의 범위인 것이 바람직하다.

또한, 본 발명의 일실시예의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 있어서, 상기 구조식 1 및/또는 상기 구조식 2에서 Y는 서열번호 1 내지 서열번호 132로 구성된 군으로부터 선택된 MID 서열일 수 있으며, 이 경우 n값은 132가 된다. 그러나, 본 발명은 이에 제한되는 것이 아니며 시료를 식별해 줄 수 있는 10 b.p. 내지 20 b.p. 길이의 짧은 서열이라면 본 발명에 적용가능한 것임은 물론이다.

한편, 본 발명에 있어서, 상기 에멀젼 PCR에서 사용되는 비드 상에 결합된 한쪽 방향의 프라이머는 상기 구조식 1의 X 또는 상기 구조식 2의 X'와 동일하거나 상보적인 서열을 가질 수 있다. 또한, 상기 에멀젼 PCR 증폭산물에 대한 시퀀싱에서 사용되는 시퀀싱 프라이머는 상기 구조식 1의 X 또는 상기 구조식 2의 X'와 동일하거나 상보적인 서열을 가질 수 있다.

본 발명에 따르면, 한 번의 실험으로 다수의 시료에 대한 표적 유전자의 유전자형 분석을 수행하면서도 유전자형 분석결과와 각각의 시료의 매칭의 오류가 없도록 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법을 제공할 수 있으며 수백에서 수천만에 이르는 대량 시료에 대한 유전자형 분석을 짧은 시간 내에 정확하게 할 수 있다.

또한, 본 발명에 따르면 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR (short tandem repeat)의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성(single nucleotide polymorphism; SNP)을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 장점이 있다.

추가로, 본 발명에 따르면 차세대 염기서열 분석법에 있어서 앰플리콘(amplicon)의 준비과정에서 소모되지 않은 프라이머들의 이량체들이 증폭되어 시퀀싱 결과에 악영향을 미치는 문제를 방지할 수 있다.

도 1은 소(MID 1)의 개체 식별에 이용되는 마이크로새틀라이트 마커인 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53를 각각 특이적으로 증폭하기 위한 11개 쌍의 융합 프라이머 쌍의 서열을 도시하는 도면이다.

도 2는 소(MID 2)의 개체 식별에 이용되는 마이크로새틀라이트 마커인 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53를 각각 특이적으로 증폭하기 위한 11개 쌍의 융합 프라이머 쌍의 서열을 도시하는 도면이다.

도 3은 도 1 및 도 2의 융합 프라이머 쌍을 이용하여 멀티플렉스 PCR 증폭을 수행한 후 증폭 산물에 대한 전기영동 결과 사진(왼쪽)과, 각각의 융합 프라이머 쌍을 사용한 경우 정상적으로 PCR 증폭산물이 생성된 것을 나타내는 전기영동결과 사진(오른쪽)이다.

도 4는 본 발명의 실시예 3의 시료 라이브러리 정량 결과 그래프로서 Agilent 2100 바이오애널라이저(Agilent 2100 Bioanalyzer)를 이용하여 측정한 결과 그래프이다.

도 5는 본 발명의 실시예 5에서 TGLA227 마커에 대해 100% 일치도로 레퍼런스 염기서열과 시퀀싱된 각각의 판독 데이터를 정렬한 결과(좌측)와, 이와 같이 정렬된 그룹의 각각의 판독 데이터들의 분포를 정리한 도표 및 그래프(우측)이다.

도 6은 본 발명의 차세대 염기서열 분석법을 이용하여 BM1824, BM2113, ETH10, ETH225, SPS115 및 TGLA53 마커에 대한 STR의 반복개수(*표시 박스) 및 반복 서열의 앞뒤에 위치하는 개체간 단일염기다형성(**표시 박스)을 확인한 것을 나타내는 도면이다.

이하, 본 발명의 실시예에 기초하여 보다 상세하게 기술한다. 본 발명의 하기 실시예는 본 발명을 구체화하기 위한 것일 뿐 본 발명의 권리범위를 제한하거나 한정하는 것이 아님은 물론이다. 본 발명의 상세한 설명 및 실시예로부터 본 발명이 속하는 기술분야의 전문가가 용이하게 유추할 수 있는 것은 본 발명의 권리범위에 속하는 것으로 해석된다. 본 발명에 인용된 참고문헌들은 본 발명에 참고로서 통합된다.

실시예

이하에서 설명되는 실시예들에서는 소의 개체 식별에 이용되는 마이크로새틀라이트 마커인 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53에 대한 각 개체별 융합 프라이머쌍의 설계, 이러한 융합 프라이머쌍 및 차세대 염기서열 분석법을 이용하여 상기 마커들에 대한 각 개체별 시퀀싱 작업의 수행 그리고 시퀀싱 결과 분석 작업이 수행되었다. 그러나, 이는 본 발명의 설명의 편의를 위한 예시로서 이해되어야 하며 본 발명은 이밖에도 다양한 개체 또는 시료와, 다양한 표적 유전자에 대한 유전자형 분석에 적용가능한 기반기술로서 이해되어야 할 것이다.

실시예 1: 시료의 사전 증폭 (앰플리콘의 준비)

당업계에서 일반적으로 소의 개체 식별에 이용되는 마이크로새틀라이트 마커인 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53를 각각 특이적으로 증폭하기 위한 11개 쌍의 융합 프라이머 쌍(정방향 융합 프라이머 및 역방향 융합 프라이머 쌍)을 도 1 및 도 2에 도시된 바와 같이 각 개체 별(MID 1 및 MID 2)로 설계하여 준비하였다.

예를 들어, MID 1의 경우 서열번호 133 및 134의 융합 프라이머 쌍, 서열번호 135 및 136의 융합 프라이머 쌍, 서열번호 137 및 138의 융합 프라이머 쌍, 서열번호 139 및 140의 융합 프라이머 쌍, 서열번호 141 및 142의 융합 프라이머 쌍, 서열번호 143 및 144의 융합 프라이머 쌍, 서열번호 145 및 146의 융합 프라이머 쌍, 서열번호 147 및 148의 융합 프라이머 쌍, 서열번호 149 및 150의 융합 프라이머 쌍, 서열번호 151 및 152의 융합 프라이머 쌍 및 서열번호 153 및 154의 융합 프라이머 쌍을 준비하였다.

그리고, MID 2의 경우에는 서열번호 155 및 156의 융합 프라이머 쌍, 서열번호 157 및 158의 융합 프라이머 쌍, 서열번호 159 및 160의 융합 프라이머 쌍, 서열번호 161 및 162의 융합 프라이머 쌍, 서열번호 163 및 164의 융합 프라이머 쌍, 서열번호 165 및 166의 융합 프라이머 쌍, 서열번호 167 및 168의 융합 프라이머 쌍, 서열번호 169 및 170의 융합 프라이머 쌍, 서열번호 171 및 172의 융합 프라이머 쌍, 서열번호 173 및 174의 융합 프라이머 쌍 및 서열번호 175 및 176의 융합 프라이머 쌍을 준비하였다.

각 융합 프라이머 쌍은 "어댑터 프라이머 서열 부분 또는 시퀀싱 프라이머 서열 부분"과, 대량 개체(시료)의 마이크로새틀라이트 마커의 동시분석시 개체(시료) 식별을 위한 "바코드(barcode) 서열 또는 MID(Multiflex identifier) 서열"과, 마이크로새틀라이트 마커의 STR 부분을 포함하는 "STR 마커 특이적인 프라이머 서열 부분"을 포함하도록 설계되었다.

시중에서 입수가능한 호주산 쇠고기(MID 1)와 한우 쇠고기(MID 2)로부터 각각 추출된 gDNA에 대해 10개 쌍의 융합 프라이머 쌍을 함께 사용하여 아래의 표 1 및 표 2와 같은 멀티플렉스 PCR 반응 조건 및 조성에 따라 증폭반응을 수행하였다. 참고로, MID 1에 대한 융합 프라이머 쌍 중 서열번호 143 및 144의 융합 프라이머 쌍과, MID 2에 대한 융합 프라이머 쌍 중 서열번호 165 및 166의 융합 프라이머 쌍은 사용하지 않았다. 한편, 수득된 멀티플렉스 PCR 증폭산물은 추후 진행되는 차세대 염기서열 분석법의 에멀젼 PCR에서 주형으로 사용된다.

또한, 전술한 바와 같은 멀티플렉스 PCR 증폭이 정상적으로 수행되었는지 여부를 확인하기 위해 전기영동을 수행하여 밴드를 확인한 결과, 정상적으로 증폭산물이 생성되었음을 확인하였고(도 3의 좌측 전기영동결과 사진), 각 개체(MID 1 및 MID 2)로부터 각각 추출된 gDNA에 대해 전술한 바와 같은 10개 쌍의 융합 프라이머 쌍 중 각각의 융합 프라이머 쌍을 사용하여 PCR 증폭을 수행한 후 각각의 융합 프라이머 쌍에 해당되는 PCR 증폭산물이 생성되었는지 여부를 전기영동을 수행하여 확인한 결과, 각각의 융합 프라이머 쌍으로부터도 정상적으로 증폭산물이 생성되었음을 확인하였다(도 3의 우측 전기영동결과 사진).

표 1: PCR 반응조건

표 2: PCR 반응조성

참고로, 상기 표 2에 표시된 PCR 증폭용 프리믹스는 PCR 증폭 키트 제조사로부터 상업적으로 입수가능한 것으로서 예를 들어, PCR 버퍼, dNTP, TaKaRa Ex Taq ^TM으로 이루어진 것이다.

실시예 2: PCR 증폭산물의 젤 추출

실시예 1에서 수득된 PCR 증폭산물(앰플리콘)을 종래와 같이 차세대 염기서열 분석법에 사용되는 장비인 GS 쥬니어 티타늄 시퀀서(GS Junior Titanium sequencer)의 AMPure라는 키트로만 정제하게 되면, 앰플리콘 뿐만아니라 실시예 1의 PCR 반응에서 소모되지 않은 융합 프라이머들과 이들로부터 생성된 프라이머 이량체들도 함께 정제되는 문제가 발생함을 본 발명자들은 확인하였다. 이와 같이 앰플리콘을 주형으로 사용하기 위해 사전에 멀티플렉스 PCR을 수행하는 경우 앰플리콘 뿐만아니라 프라이머들의 이량체들이 생성되고, 이러한 프라이머 이량체들은 추후 수행되는 emPCR 과정에서 증폭되어 시퀀싱 결과에 악영향을 미치는 것을 확인하였다.

따라서, 이러한 문제점을 해결하기 위해 본 발명자들은 예의 연구를 거듭한 결과, 다음과 같은 젤 추출(gel extraction) 과정을 수행함으로써 융합 프라이머들 중 소모되지 않은 프라이머들의 이량체들이 증폭되는 문제와 이로 인한 시퀀싱 결과의 악영향 문제를 해결하였다. 실시예 1의 멀티플렉스 PCR 증폭반응 후 앰플리콘에 해당하는 증폭산물 만을 순수하게 분리하기 위하여 젤 추출 과정(gel extraction)을 진행하였다. 그리고, 이를 위해 마이크로원심분리를 이용한 QIAquick 젤 추출 키트(QIAquick Gel Extraction Kit using microcentrifuge) (Cat. no. 28704)를 사용하였다.

우선, 전기영동을 수행한 아가로즈 젤(Agarose gel)에서 원하는 DNA 절편을 잘라내어 50℃에서 젤을 녹인 후 이소프로판올을 혼합하였다. 그리고, QIAquick 젤 추출 키트의 제조사가 제공하는 완충용액, 스핀 컬럼(spin column) 및 수집 튜브(collection tube)를 이용하여 원심분리를 수행한 후 제조사가 제공하는 완충용액과 에탄올(96%~100%)이 함유된 세척용 버퍼로 세척과정을 수행하였다. 그런 다음, 용출 버퍼(elution buffer) (제조사가 제공하는 용출 버퍼 또는 H₂O)를 이용하여 인큐베이션을 수행한 후 정제된 DNA를 얻어 정제된 앰플리콘 시료를 준비하였다. 준비된 시료는 사용하기 전까지 -20℃에서 보관하였다.

실시예 3: 시료 라이브러리 정량(Library Quantitation)

실시예 2의 젤 추출(Gel extraction) 과정을 통해 분리 정제된 DNA 앰플리콘시료의 정량을 위해서 다음의 과정을 수행하였다.

젤-다이 믹스(Gel-dye mix)를 사용하기 전에 상온에서 30분간 온도평형을 유지한 후 칩 프라이밍 스테이션(chip priming station)에 새로운 고감도 DNA 칩(High sensitivity DNA chip)을 위치시켰다. 그리고 젤-다이 믹스(gel-dye mix)를 처음 지정된 위치에 분주하였다.

플런저(plunger)를 1㎖에 위치시킨 후 칩 프라임 스테이션을 닫았다. 플런저를 클립(clip)이 있는 위치까지 내린 후 클립(clip)을 이용하여 고정하였다. 60초간 기다린 후 클립(clip)을 개방하였다. 그리고 나서 5초간 더 기다린 후 플런저를 1㎖에 위치시켰다.

칩 프라이밍 스테이션을 개방하고 나머지 지정된 위치에 젤-다이 믹스를 분주하였다. 마커(marker)를 모든 시료(sample)와 래더 웰(ladder well)에 분주하여 비어있는 웰(well)이 없도록 하였다. 그리고 나서 고감도 DNA 래더(High sensitivity DNA ladder)를 지정된 위치에 분주하였고, 11개 시료의 각각의 웰에 시료(sample) 또는 마커(marker)를 분주하였다.

그런 다음, 칩(chip)을 IKA 볼텍스 믹서(IKA vortex mixer)에 위치시키고 2400 rpm에서 1분 동안 반응시켰다. Agilent 2100 바이오애널라이저(Agilent 2100 Bioanalyzer)를 이용하여 5분 안에 측정을 시작하였다. 측정 결과는 도 4에 도시된 바와 같다.

실시예 4: 에멀젼 PCR (emPCR) 증폭 과정 수행

차세대 염기서열 분석법에 사용되는 장비인 GS 쥬니어 티타늄 시퀀서가 제공하는 emPCR 시약, GS 쥬니어 티타늄 emPCR 오일 및 브레이킹 키트(Breaking Kit)를 이용하여 다음과 같이 emPCR 증폭을 수행하였다.

(1) 시약 및 에멀젼 오일 준비

키트 내용물을 개봉하여 모든 시약은 볼텍싱한 후 사용하였다. 엔자임 믹스(Enzyme Mix)와 PPiase(peptidyl-prolyl isomerase) 튜브는 -15℃ ~ -25℃에서 보관하였다. 볼텍싱한 제조사 키트의 첨가제(Additive)는 55℃에서 5분간 용해시키고 용해가 되지 않는 물질이 있을 경우 원심분리한 후 상층액만을 이용하였다. 엔자임(enzyme)은 -15℃ ~ -25℃에서 보관하였고, 다른 내용물은 상온에서 보관하였다. 제조사 키트의 Mock Mix와 Molecular Biology Grade Water를 혼합하여 1× Mock Mix를 만든 다음, 이를 에멀젼 오일(emulsion oil)과 혼합하였다. 그리고 이러한 에멀젼 오일 혼합물을, 410 ㎕의 Molecular Biology Grade Water, 515 ㎕의 첨가제(Additive), 270 ㎕의 증폭 믹스(Amp Mix), 80 ㎕의 증폭 프라이머(Amp Primer), 70 ㎕의 엔자임 믹스(Enzyme Mix) 및 2 ㎕의 PPiase가 혼합된 라이브 증폭 믹스(Live Amp Mix)와 혼합한 후 얼음에서 보관하였다.

(2) 시료 DNA 라이브러리 포획

세척 버퍼와 Molecular Biology Grade Water를 혼합하여 1× 세척 버퍼를 만들었다. 그리고 포획 비드(Capture bead)를 준비하고, 이를 앞서 만들어 놓은 1× 세척 버퍼로 세척하였다. 그리고, 실시예 1 및 실시예 2를 통해 수득된 앰플리콘, 즉 시료 DNA 라이브러리 중 사용될 DNA 라이브러리의 양을 포획 비드를 기준으로 계산하고 계산된 양 만큼의 DNA 라이브러리를 포획 비드에 혼합하여 앰플리콘이 주형으로서 포획 비드 상의 DNA에 의해 포획되도록 하였다. 참고로, 포획 비드 상의 DNA는 실시예 1에서 설명한 융합 프라이머의 어댑터 프라이머 서열 부분(또는 시퀀싱 프라이머 서열 부분)에 대응한다.

(3) 에멀션화(Emulsification)

상기 (2)번 과정에서 준비한 포획 비드가 들어있는 튜브에 상기 (1)번 과정에서 준비한 라이브 증폭 믹스(Live Amp Mix)의 에멀젼 오일 혼합물을 첨가한 후 포획 비드와 에멀젼 오일 혼합물을 잘 섞어주어 에멀션화시켰다.

(4) 증폭

상기 (3)번 과정에서 준비된 에멀션화된 혼합 용액을 8-스트립 캡 튜브(eight 8-strip cap tubes) 또는 96-웰 플레이트 (~64 웰 정도)에 100 ㎕씩 용액이 마르지 않는 범위에서 천천히 분주하고 캡(cap)을 이용하여 밀봉한 후 8-스트립 캡 튜브 또는 96-웰 플레이트를 PCR 장치(thermocycler) 내에 위치시키고 PCR 증폭을 수행하였다. 즉, 94℃에서 4분(1사이클), 94℃에서 30초(50사이클), 58℃에서 4.5분, 68℃에서 30초, 10℃에서 반응종료의 과정을 반복수행하였으며, 전체 증폭을 위해서는 최대 6시간 정도가 소요되었다.

(5) DNA-비드 회수 (Bead Recovery)

8-스트립 캡 튜브(eight 8-strip cap tubes) 또는 96-웰 플레이트 (~64 웰 정도)에서 증폭된 에멀젼 혼합물을 모아 한 곳에 보관하였다. 100 ㎕의 이소프로판올을 각각의 웰 분주하여 웰에 남아 있는 에멀젼 혼합물을 완전히 수집하였다. 이소프로판올, 에탄올 및 인핸싱 버퍼(enhancing buffer)와 원심분리를 이용하여 펠릿(pellet)을 남기는 방식으로 세척하고 세척이 끝난 DNA-비드는 튜브에 옮겼다.

(6) DNA-비드 현탁액

125 ㎕의 NaOH (10N)와 9.875㎖ Molecular Biology Grade Water를 혼합하여 멜팅 용액(Melt Solution)을 만들고 이를 DNA-비드 현탁액 튜브에 옮긴 후 2분 동안 상온에서 반응시켰다. 그런 다음, 반응물을 원심분리하여 상층액을 제거하고 45 ㎕의 어닐링 버퍼(Annealing Buffer)와 25 ㎕ 인리치 프라이머(Enrich Primer)를 혼합한 후 65℃에서 5분간 반응시키고 이후에 2분간 얼음에서 반응시켰다.

인핸싱 버퍼(Enhancing Buffer)를 이용하여 상기 DNA-비드 현탁 튜브(인리치먼트 튜브)를 세척한 후 펠릿을 인핸싱 버퍼(Enhancing Buffer)에 녹여 다음 실험까지 보관하였다.

인리치먼트 비드들(Enrichment Beads)이 충분히 섞이게 한 후 MPC(Magnetic Particle Concentrator)에 위치시켜 인리치먼트 비드 펠릿(Enrichment Beads pellet)을 만든 후 비드가 마르지 않도록 상층액을 제거하고 인핸싱 버퍼(Enhancing Buffer)를 첨가하였다. 수득된 비드들을 다시 MPC에 위치시켜 펠릿을 만든 후 비드가 마르지 않도록 상층액을 제거하고 인핸싱 버퍼(Enhancing Buffer)를 첨가하여 섞어주었다.

세척된 인리치먼트 비드들을 앞서 준비한 인리치먼트 튜브에 섞어주었다. 그리고, LabQuake를 이용하여 상온에서 5분간 회전시키며 반응시킨 후 상기 인리치먼트 튜브를 MPC에 위치시켜 펠릿을 생성한 다음, 상층액을 제거하고 갈색의 인리치먼트 비드들이 마르지 않도록 유지하였다. 그런 다음, 하얀색의 DNA-비드가 나오지 않을 때까지 계속적으로 세척한 후, MPC에서 인리치먼트 튜브를 분리하고 인리치먼트 튜브에 멜팅 용액(Melt Solution)을 첨가하였다.

인리치먼트 튜브를 MPC에 다시 위치시켜 펠릿이 생성되도록 하였고 상층액을 새로운 1.7 ㎖ 튜브에 옮겼다. 700 ㎕의 멜팅 용액(Melt Solution)을 원래의 인리치먼트 튜브에 첨가하여 충분히 섞어준 후 인리치먼트 튜브를 다시 한 번 MPC에 위치시켜 펠릿을 생성시켰다. 상층액을 인리치먼트 튜브에 같이 모아 주었다.

MPC에서 분리된 인리치먼트 튜브를 원심분리하여 상층액을 제거한 후 어닐링 버퍼(Annealing Buffer)를 첨가한 다음 원심분리하여 상층액을 제거하는 세척 과정을 수행하였다. 세척 과정 완료 후 인리치먼트 튜브에 어널링 버퍼(Annealing Buffer)를 첨가하여 섞어주었다.

(7) 시퀀싱 프라이머 어닐링

GS 쥬니어 티타늄 시퀀서가 제공하는 시퀀싱 프라이머를 상기 (6)번 과정에서 준비된 인리치먼트 튜브에 첨가하여 섞어준 후 65℃에서 5분간 반응시키고 이후에 2분간 얼음에서 반응시켰다. 참고로, 시퀀싱 프라이머는 실시예 1에서 설명한 융합 프라이머의 어댑터 프라이머 서열 부분(또는 시퀀싱 프라이머 서열 부분)과 동일한 서열을 갖거나 상보적인 서열을 가질 수 있다.

그리고 나서, 인리치먼트 튜브에 어닐링 버퍼(Annealing Buffer)를 첨가하고 충분히 섞어준 후 원심분리하여 상층액을 제거하였다. 다시 어닐링 버퍼(Annealing Buffer)를 첨가하고 충분히 섞어준 후 원심분리하여 상층액을 제거하였다.

시퀀싱을 위해서는 500,000개 정도의 비드들이 필요하기 때문에 GS 쥬니어 비드 카운터(GS Junior Bead Counter)를 이용하여 비드의 개수를 측정하였다. 이를 위해 인리치먼트 튜브를 GS 쥬니어 비드 카운터 바닥의 구멍에 위치시켰다. 눈의 위치를 GS 쥬니어 비드 카운터의 창의 왼쪽에 고정하여 창에서 보이는 비드의 높이를 측정하여 비드를 계수하였다. 한편, 시퀀싱을 위해 준비된 시료는 2℃ ~ 8℃에서 약 2주간 보관 가능하다.

실시예 5: 시퀀싱 (Sequencing) 및 결과 분석

GS 쥬니어 티타늄 시퀀싱 키트(GS Junior Titanium Sequencing Kit)를 이용하여 GS 쥬니어 티타늄 시퀀싱 장비(GS Junior Titanium Sequencing machine)의 지정된 순서 (Sequencing Method Manual, GS Junior Titanium Series)를 따라 시퀀싱을 수행하였다. 이러한 GS 쥬니어 티타늄 시퀀서의 시퀀싱은 파이로 시퀀싱(pyrosequencing) 방법을 이용하여 수행될 수 있다(Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January. 2010).

상기와 같이 수행된 시퀀싱 결과로부터 얻은 각 개체(MID 1 및 MID 2)의 염기서열 데이터(sequence reads)를 전술한 바와 같은 BM1824, BM2113, ETH10, ETH225, ETH3, INRA23, SPS115, TGLA122, TGLA126, TGLA227 및 TGLA53의 마이크로새틀라이트 마커들에 대한 레퍼런스 염기서열(reference sequence)과 비교하는 작업인 매핑 작업을 수행하였다. 한편, 실제 분석에서는 각 개체 간의 일치도를 분석하는 것이기 때문에 레퍼런스 염기서열을 이용하지 않고 각 개체의 마이크로새틀라이트 마커들에 대한 시퀀싱 결과를 직접 비교하여 일치도를 확인하는 방식을 채택할 수도 있다.

본 실시예에서는 일부 마커의 경우(INRA23, TGLA126) 레퍼런스 염기서열 정보가 공개되어 있지 않아 상기 시퀀싱 결과와 마커의 레퍼런스 염기서열과의 매핑을 수행하지 않았고, 나머지 9개의 마커에 대해서만 레퍼런스 염기서열과의 매핑을 수행하였다. 즉, 본 실시예에서는 BM1824(서열번호 177), BM2113(서열번호 178), ETH10(서열번호 179), ETH225(서열번호 180), ETH3(서열번호 181), SPS115(서열번호 182), TGLA122(서열번호 183), TGLA227(서열번호 184) 및 TGLA53(서열번호 185)의 9개 마커에 대한 레퍼런스 염기서열과, 전술한 바와 같은 시퀀싱 결과로부터 얻은 각 개체(MID 1 및 MID 2)의 상기 9개 마커들에 대한 염기서열 데이터들을 정렬시켜 매핑을 진행하였다.

예시로서, 레퍼런스 염기서열과의 80% 일치도 및 100% 일치도로 매핑을 수행하였는데, 그 결과 TGLA53 마커에 대한 매핑 결과가 나오지 않았으며 100% 일치도로 매핑을 할 경우 MID-1 개체에 대한 매핑 실험결과가 나오지 않았다. 반면에, 80%의 일치도로 매핑을 수행하면 MID 1 및 MID 2 개체 모두에 대해 아래와 표 3 및 표 4와 같은 매핑 결과를 얻을 수 있었다.

표 3

100% 일치도 매핑 결과 (MID-1 시료의 경우)

Marker	Consensus length	Total read count	Average coverage	Reference length	비고
BM1824_#1	180	549	253.42	180	*
BM2113_#2	97	88	38.59	153	.
ETH10_#3	135	122	48.40	224	.
ETH225_#4	143	3016	2,379.42	149	*
ETH3_#5	123	2809	1,386.45	122	.
SPS115_#7	225	288	157.00	245	*
TGLA122_#8	142	135	69.83	142	.
TGLA227_#10	92	4043	2,597.79	90	*
TGLA53_#11	0	0	0.0	155	.

표 4

100% 일치도 매핑 결과 (MID-2 시료의 경우)

Marker	Consensus length	Total read count	Average coverage	Reference length	비고
BM1824_#1	180	685	311.16	180	*
BM2113_#2	98	113	56.30	153	.
ETH10_#3	207	179	73.37	224	.
ETH225_#4	146	7245	5,550.64	149	*
ETH3_#5	122	4602	2,208.02	122	*
SPS115_#7	231	1176	633.63	245	*
TGLA122_#8	141	50	27.48	142	.
TGLA227_#10	92	1899	1,256.50	90	*
TGLA53_#11	102	1	0.67	155	.

한편, TGLA227 마커에 대해 100% 일치도로 레퍼런스 염기서열과 시퀀싱된 각각의 판독 데이터를 정렬하면 도 5의 좌측의 결과가 도출되었고, 이와 같이 정렬된 그룹의 각각의 판독 데이터들의 분포를 정리하면 도 5의 우측과 같은 결과가 얻어졌다.

또한, 전술한 바와 같은 본 발명의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 따르면, 마이크로새틀라이트 마커들에 대해 각 개체 별로 얻은 서열데이터로부터는 STR(short tandem repeat)의 반복개수를 확인할 수 있을 뿐만아니라 반복 서열의 앞뒤에 위치하는 개체간 단일염기다형성(SNP)도 확인할 수 있다. 즉, 도 6에 도시된 바와 같이, BM1824, BM2113, ETH10, ETH225, SPS115 및 TGLA53 마커에 대한 본 발명의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법에 따른 서열분석 결과로부터는 STR의 반복개수(*표시 박스)를 확인할 수 있을 뿐만아니라 반복 서열의 앞뒤에 위치하는 개체간 단일염기다형성(**표시 박스)도 확인할 수 있다.

따라서, 본 발명의 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법은 한 번의 실험으로 대량 시료에 대한 특정 표적 유전자, 예를 들어 마커 유전자의 STR의 반복 개수를 확인하면서도 동시에 STR의 전후에 존재하는 단일염기다형성을 확인할 수 있고 이를 통해 새로운 마커 유전자의 발굴을 가능하게 하는 장점이 있다.

이상 본 발명을 상기 실시예를 들어 설명하였으나, 본 발명은 이에 제한되는 것이 아니다. 당업자라면 본 발명의 취지 및 범위를 벗어나지 않고 수정, 변경을 할 수 있으며 이러한 수정과 변경 또한 본 발명에 속하는 것임을 알 수 있을 것이다.

Claims

하기 구조식 1을 갖는 융합 프라이머 설계방법으로서,

구조식 1

상기 구조식 1에서 X는 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자에 특이적인 유전자 서열과는 상동성이 없는 비상동성의 프라이머 서열로 구성하고,

Y는 모든 시료에 대한 상기 표적 유전자의 유전자형을 동시에 분석할 때 각각의 시료를 식별해 주는 MID (Multiflex identifier) 서열로 구성하며,

Z는 상기 표적 유전자에 특이적인 유전자 서열과 상보적으로 결합하는 표적 유전자 특이적인 프라이머 서열로 구성하고,

n은 분석대상이 되는 시료의 개수와 일치하는 정수로서 2와 같거나 2보다 큰 정수이며, m은 표적 유전자의 개수와 일치하는 정수로서 1과 같거나 1보다 큰 정수인 것을 특징으로 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법.
제1항에 있어서,

상기 구조식 1의 융합 프라이머가 정방향 융합 프라이머이면 이와 쌍을 이루는 역방향 융합 프라이머가 하기 구조식 2를 갖고, 상기 구조식 1의 융합 프라이머가 역방향 융합 프라이머이면 이와 쌍을 이루는 정방향 융합 프라이머가 하기 구조식 2를 갖는 것을 특징으로 하고,

구조식 2

상기 구조식 2에서 X', Y 및 Z'의 정의는 상기 구조식 1의 X, Y 및 Z와 동일하며, 상기 구조식 2의 n 및 m 값도 상기 구조식 1의 n 및 m 값과 동일한 것을 특징으로 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법.
제1항 또는 제2항에 있어서,

상기 구조식 1 또는 상기 구조식 2의 융합 프라이머의 길이는 50 b.p. 내지 70 b.p.의 범위인 것을 특징으로 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법.
제1항 또는 제2항에 있어서,

상기 구조식 1 또는 상기 구조식 2에서 Y는 서열번호 1 내지 서열번호 132로 구성된 군으로부터 선택된 MID 서열인 것을 특징으로 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법.
제1항 또는 제2항에 있어서,

상기 표적 유전자는 STR (short tandem repeat), 단일염기다형성 부위, 또는 STR 및 단일염기다형성 부위 모두를 포함하는 것을 특징으로 하는 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법.
(a) 하기 구조식 1의 정방향 융합 프라이머 및 이에 대응하는 하기 구조식 2의 역방향 융합 프라이머 쌍을 준비하는 단계와,

구조식 1

구조식 2

(상기 구조식 1 및 상기 구조식 2에서 X, X'는 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자에 특이적인 유전자 서열과는 상동성이 없는 비상동성의 프라이머 서열로 구성하고, Y는 모든 시료에 대한 상기 표적 유전자의 유전자형을 동시에 분석할 때 각각의 시료를 식별해 주는 MID (Multiflex identifier) 서열로 구성하며, Z, Z'는 상기 표적 유전자에 특이적인 유전자 서열과 상보적으로 결합하는 표적 유전자 특이적인 프라이머 서열로 구성하고, n은 분석대상이 되는 시료의 개수와 일치하는 정수로서 2와 같거나 2보다 큰 정수이며, m은 표적 유전자의 개수와 일치하는 정수로서 1과 같거나 1보다 큰 정수임)

(b) 상기 (a) 단계에서 준비된 융합 프라이머 쌍을 이용하여 분석대상이 되는 모든 시료 내에 존재하는 적어도 하나의 표적 유전자를 증폭하여 각 시료 별로 상기 적어도 하나의 표적 유전자에 대한 PCR 증폭산물을 수득하는 단계와,

(c) 상기 (b) 단계에서 소모되지 않은 융합 프라이머들과 이들로부터 생성된 프라이머 이량체들을 제거하기 위해 상기 수득된 PCR 증폭산물에 대해 젤 추출을 수행하여 정제하는 단계와,

(d) 상기 (c) 단계에서 정제된 PCR 증폭산물을 주형으로 하여 에멀젼 PCR (emPCR)을 수행하는 단계와,

(e) 상기 (d) 단계에서 수득된 에멀젼 PCR 증폭산물에 대한 시퀀싱 결과로부터 각 시료 별로 상기 적어도 하나의 표적 유전자의 서열을 결정하는 단계와,

(f) 상기 (e) 단계에서 결정된 상기 적어도 하나의 표적 유전자의 서열로부터 각 시료 별로 표적 유전자의 유전자형을 분석하는 단계를 포함하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
제6항에 있어서,

상기 표적 유전자는 STR (short tandem repeat) 및 단일염기다형성 부위를 포함하고, 상기 (f) 단계에서는 STR (short tandem repeat)의 반복 개수를 확인하고 STR의 전후에 존재하는 단일염기다형성 존재 여부를 확인하는 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
제6항 또는 제7항에 있어서,

상기 융합 프라이머의 길이는 50 b.p. 내지 70 b.p.의 범위인 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
제6항 또는 제7항에 있어서,

Y는 서열번호 1 내지 서열번호 132로 구성된 군으로부터 선택된 MID 서열인 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
제6항 또는 제7항에 있어서,

상기 에멀젼 PCR에서 사용되는 비드 상에 결합된 한쪽 방향의 프라이머는 상기 구조식 1의 X 또는 상기 구조식 2의 X'와 동일하거나 상보적인 서열을 갖는 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.
제6항 또는 제7항에 있어서,

상기 에멀젼 PCR 증폭산물에 대한 시퀀싱에서 사용되는 시퀀싱 프라이머는 상기 구조식 1의 X 또는 상기 구조식 2의 X'와 동일하거나 상보적인 서열을 갖는 것을 특징으로 하는 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법.