KR20160024139A - 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법 - Google Patents

차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법 Download PDF

Info

Publication number
KR20160024139A
KR20160024139A KR1020140110592A KR20140110592A KR20160024139A KR 20160024139 A KR20160024139 A KR 20160024139A KR 1020140110592 A KR1020140110592 A KR 1020140110592A KR 20140110592 A KR20140110592 A KR 20140110592A KR 20160024139 A KR20160024139 A KR 20160024139A
Authority
KR
South Korea
Prior art keywords
str
seq
nos
markers
sample
Prior art date
Application number
KR1020140110592A
Other languages
English (en)
Inventor
한면수
최동호
홍승범
곽경돈
문상옥
연종필
황승용
임세리
Original Assignee
바이오코아 주식회사
대한민국(관리부서: 행정자치부 국립과학수사연구원장)
대한민국(관리부서: 행정자치부 국립과학수사연구원장)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 바이오코아 주식회사, 대한민국(관리부서: 행정자치부 국립과학수사연구원장), 대한민국(관리부서: 행정자치부 국립과학수사연구원장) filed Critical 바이오코아 주식회사
Priority to KR1020140110592A priority Critical patent/KR20160024139A/ko
Publication of KR20160024139A publication Critical patent/KR20160024139A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커인 CODIS(Combined DNA Index System) STR 마커에 대한 새로운 유전자형 분석방법으로서, 상기 STR 마커들의 대립유전자 반복 횟수 및 유전자형을 정확히 분석할 수 있고 STR 내의 변이까지도 분석할 수 있는 유전자형 분석방법 및 이를 이용한 개인식별 방법을 제공한다. 본 발명의 방법은 기존의 분석 방법에 비하여 다양한 STR 마커를 한 번에 확인할 수 있고 STR 유전자형의 분포가 다른 특정 STR 마커에서의 희귀 대립 유전자의 검출이 가능하고, 개인식별용 유전자 마커의 STR 반복 횟수 및 STR 유전자형을 빠르고 정확히 분석할 수 있으며 STR 내의 변이까지도 분석할 수 있다. 또한, 본 발명의 방법은 범죄 사건이나 대형참사 발생 시에 유전정보가 들어있는 혼합시료, 감식이 어려운 손상된 시료 또는 미량의 시료에서의 분석에도 적합하다.

Description

차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법 {Method for analyzing genotype of human identifying markers based on next generation sequencing and personal identification method using the same}
본 발명은 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법에 관한 것으로서, 보다 상세하게는 차세대 염기서열 분석법으로부터 얻어진 개인식별용 마커(STR; short tandem repeat)의 유전자좌에 대한 염기서열 데이터의 분석을 통해 그 유전자형을 결정하기 위한 대립유전자의 반복 횟수와 동일 유전자형의 변이형을 정확하고 효과적으로 분석하는 방법 및 이를 이용한 개인식별 방법에 관한 것이다.
구체적으로, 본 발명은 차세대 염기서열 분석법을 기반으로 한 범죄 현장에서 얻어진 미량 혹은 손상된 시료에서 얻어진 개인의 DNA를 감식하여 보다 정확한 유전정보를 얻을 수 있으면서도 신속하고 정확하게 개인식별용 STR 유전자 마커의 대립유전자 반복 횟수 및 유전자형을 정확히 분석할 수 있고 STR 마커 내의 변이까지도 분석할 수 있는 유전자형 분석방법 및 이를 이용한 개인식별 방법에 관한 것이다.
또한, 본 발명은 차세대 염기서열 분석법을 기반으로 기존의 PCR 및 전기영동방법을 이용한 분석 방법들에 비하여 다양한 STR 유전자 마커의 염기서열을 동시에 확인할 수 있어 이들의 유전자형의 분포가 다른 특정 STR 유전자 마커에서의 희귀한 대립유전자의 검출 및 확인이 정확하게 가능하며, 범죄 사건이나 대량참사 발생 시에 유전정보가 들어있는 시료나 정확한 DNA감식이 어려운 손상된 시료 또는 미량의 DNA시료에서의 분석도 가능한 유전자형 분석방법 및 이를 이용한 개인식별 방법에 관한 것이다.
범죄수사를 지원하는 법과학은 분자유전학적 기반 지식과 분석기법의 급속적인 발달로 인하여 빠른 속도로 발전해 왔다. 법과학 분야에서의 분자유전학적인 분석은 범죄 현장에서 채취하는 증거시료에서 얻은 DNA를 대상으로 한 개인의 신원확인 분석이 대부분을 차지하고 있다. DNA감식에 의한 개인신원확인은 사람의 DNA 중에서 지문처럼 개인마다 다른 부위를 분석하여 그 차이를 분석할 수 있는데, 법과학 분야에서는 PCR을 기반으로 하여 염색체의 특정 DNA 부위(상염색체 및 성염색체 상의 STR 마커)를 증폭하여 분석하는 방법, 미토콘드리아 DNA 염기서열 분석 방법 등을 사용하여 개인의 신원확인 분석을 수행하고 있다.
STR 마커의 대립유전자는 개인의 특성에 따라 핵심 반복 단위의 반복수가 서로 다르게 존재하고, 개인마다 특정한 고유의 값을 가지기 때문에 법과학에서는 주로 상염색체에 있는 STR 마커에서 얻어지는 유전자형에 의한 개인의 신원확인이 중요한 분석방법으로 제시되고 있다. 즉, STR 마커의 부위는 일정한 염기서열이 연속적으로 반복되는 횟수에 따라 개인에 따라 그 다양성이 존재하기 때문에 반복되는 염기 서열의 차이를 확인하여 대립유전자의 분자생물학적 변이를 규명할 수 있는 DNA감식의 핵심 기술로의 이용이 가능하다. STR은 2개 내지 7개의 반복되는 염기서열로서 적게는 1회, 많게는 수십 회까지 반복되는 형태의 다형성 마커로서 개인마다 다양한 반복수를 가지고 있다. 예를 들어, 특정 STR 부위에 대해 부계 쪽에서 12 회의 반복과 19 회가 반복된 유전자형을 갖고 있고 모계 쪽에서 15 회의 반복과 18 회의 반복된 유전자형을 가지고 있다면, 이로부터 태어난 1대 자손은 12 회의 반복과 15 회 또는 18 회의 반복을 가질 수 있고, 19 회의 반복과 15 회 또는 18 회의 반복성을 지니게 된다.
그러나 기존의 STR 유전자 마커를 이용한 개인식별 방법은 몇 가지 극복해야 할 문제점을 가지고 있다. 예를 들어, 현재까지 개발된 STR 마커에 대한 다중 PCR 증폭(multiplex PCR amplification) 및 전기영동법들은 수많은 유전자좌(loci) 중에서 최대 20여 개 마커의 분석만 가능하게 할 수 있다는 한계점을 가지고 있으며, 인종 별로 STR 마커의 유전자형의 분포가 다르고 희귀 대립유전자가 존재하기 때문에 이를 보완할 수 있는 차세대 STR 유전자 마커 개발이 필요하다. 즉, 현재까지 개발된 STR 유전자 마커를 검출할 수 있는 개인식별 키트의 개발 및 이용은 안정적인 단계의 산업으로 정착되었지만, STR 유전자 마커가 지니는 높은 돌연변이율로 인한 단점을 보완할 수 있는 다양하고 보다 확장된 유효한 STR 마커의 선정이 요구되고 있으며, 이를 위해 희귀 대립유전자(rare allele)가 포함된 대규모 STR 데이터베이스를 통한 광범위한 선별과정에 대한 요구가 증가하고 있다. 최근에 널리 사용 중인 개인식별 키트의 경우 PCR에 의한 증폭 산물을 확인하는 기법으로서 아가로스 겔 전기영동 또는 변성 아크릴아마이드 겔 전기영동 후 PCR 증폭 산물을 염색하여 확인하는 방법, 형광 표지가 된 증폭 산물을 전기영동으로 확인하는 방법, 실시간 유전자 증폭을 통해 확인하는 방법 등이 있으나, 오류가 허용되지 않는 DNA감식에서 사용하기에는 일부 방법의 경우, 해상도가 떨어지는 단점이 있으며, 장시간이 소요되기 때문에 이를 해결하기 위한 신속하고 간편한 분석 방법이 필요한 실정이다.
현재 법과학 분야에서는 중합효소연쇄반응(PCR; polymerase chain reaction)으로 얻어진 증폭 산물을 모세관 전기영동(CE; Capillary Electrophoresis) 방법으로 분리하여 STR 마커가 지닌 대립유전자의 반복 횟수에 따라 가지고 있는 반복염기의 길이의 차이(횟수)를 조사하고 이에 따라 STR 유전자형을 분석하는 방법을 사용하고 있다. 그러나 이 역시 염기서열 분석 과정에 장시간이 소요되고, 증폭 산물의 염기서열을 직접 확인할 수 없을 뿐 아니라 유전자형에서의 정확한 돌연변이를 검출하거나 동일한 대립유전자의 정확한 반복 수의 염기서열 차이를 확인하기에 어려움이 있으며, 사용 가능한 특정 유전자 마커의 수의 제한과 증폭 산물의 크기에서 제한이 있다는 문제점이 있다.
즉, 종래의 모세관 전기영동 방법을 이용한 STR 유전자 마커의 분석 과정은 희귀 대립유전자(rare allele) 및 인식되지 않은 대립유전자(null allele)의 출현으로 일치적합 가능성(matching probability)을 계산하는 과정에서 혼선이 종종 발생하는 문제점과 비교적 짧은 DNA 조각만을 분석할 수 있으며 변이가 있는 대립유전자는 별도로 생거 시퀀싱(sanger sequencing) 방법으로 확인해야 한다는 단점이 있는 것이다. 특히, 종래의 모세관 전기영동 방법을 이용한 STR 유전자 마커의 분석 결과는 STR의 크기에 근거한 유전자형 분석 결과이기 때문에 단순히 STR 반복 횟수가 같더라도 반복 서열 안에서 염기서열 하나의 차이로 인하여 대립유전자의 양상이 달라지게 하는 변이를 확인할 수 없는 한계가 있다. 뿐만 아니라 DNA가 다양한 환경에 노출되어 있거나 오래된 시료의 DNA는 손상되거나 그 양이 적기 때문에 DNA 증폭이 어려워 분석할 수 없는 경우가 많다.
따라서, 본 발명이 속한 기술 분야에서는 보다 확장된 STR 마커의 선정을 위하여 희귀한 유전자형이 포함된 STR 데이터베이스를 마련하고 인종 특이적, 비특이적인 대립유전자를 포함한 대규모의 STR 데이터베이스 정보의 이용이 필수적으로 요구되고 있으며, 범죄 과학 수사 연구에서 미량 혹은 손상된 시료에서 DNA를 감식하여 올바른 유전정보를 얻을 수 있으면서도 신속하게 STR 마커의 대립유전자 각각의 반복수를 정확히 분석할 수 있고 STR 마커 내의 변이까지도 분석할 수 있는 새로운 기술의 제공이 요구되고 있다.
대한민국 등록특허공보 제10-1406720호 (2014.06.13)
Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January. 2010 (2010년 1월 공개)
본 발명의 목적은 차세대 염기서열 분석법으로부터 얻어진 개인식별용 STR 유전자 마커에 대한 염기서열 데이터의 분석을 통해 STR 마커의 유전자형을 결정하기 위해 대립유전자의 반복 횟수 및 유전자형의 돌연변이를 정확하고 효과적으로 분석하는 방법 및 이를 이용한 개인식별 방법을 제공하는데 있다.
구체적으로, 본 발명의 목적은 차세대 염기서열 분석법을 기반으로 범죄 과학 수사 연구에서 미량 혹은 손상된 시료에서 얻은 DNA를 감식하여 올바른 유전정보를 얻을 수 있으면서도 신속하고 정확하게 개인식별용 STR 마커의 대립유전자 반복 횟수 및 STR 유전자형을 정확히 분석할 수 있고 STR 마커내의 변이까지도 분석할 수 있는 유전자형 분석방법 및 이를 이용한 개인식별 방법을 제공하는데 있다.
또한, 본 발명의 목적은 차세대 염기서열 분석법을 기반으로 기존의 분석 방법들에 비하여 다양한 STR 마커를 한 번에 확인할 수 있고 STR 마커의 유전자형 분포가 다른 특정 STR 마커에서의 희귀 대립유전자의 검출이 가능하며, 범죄 사건이나 대량참사 발생 시에 유전정보가 들어있는 혼합시료, 감식이 어려운 손상된 시료 또는 미량의 시료에서의 분석도 가능한 유전자형 분석방법 및 이를 이용한 개인식별 방법을 제공코자 하는데 있다.
상기한 기술적 과제를 해결하기 위해, 본 발명은 차세대 염기서열 분석법(NGS; Next Generation Sequencing)을 개인식별에 적용하여, 기존의 분석 방법에 비하여 다양한 STR 유전자 마커가 지닌 반복 염기서열을 한 번에 확인할 수 있고 STR 대립유전자형의 분포가 다른 특정 STR 마커에서의 희귀 대립유전자의 검출이 가능하며, 미량의 시료인 1 ng의 DNA에서의 분석도 가능한 유전자형 분석방법 및 이를 이용한 개인 신원확인 방법을 제공한다.
또한, 본 발명은 차세대 염기서열 분석법을 기반으로 하는 전세계 통용의 STR 개인식별용 마커인 CODIS(Combined DNA Index System) 유전자 마커 (CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, FGA, TH01, TPOX, vWA, AMEL 등)에 대한 새로운 유전자형 분석방법으로서, 상기 STR 마커들의 대립유전자 반복횟수 및 STR 유전자형을 정확히 분석할 수 있고 STR 마커 내의 변이까지도 분석할 수 있는 유전자형 분석방법 및 이를 이용한 개인 신원확인 방법을 제공한다. 상기 유전자 마커 중 AMEL(Amelogenin)은 엄밀히 말하면 개인식별용 STR 마커가 아니고 성별 특이적인 분석을 위한 유전자 마커이다.
우선, 본 발명의 명세서에서 사용되는 용어를 설명하면 다음과 같다. 본 발명의 명세서에서 사용되는 "차세대 염기서열 분석법"이란 짧은 시간 내에 분석대상이 되는 DNA시료에 대해 대량의 염기서열의 판독이 가능하고 대량의 DNA염기서열 데이터를 생성할 수 있는 신개념의 염기서열 분석 기술로서, 예를 들어 로슈/454, 일루미나(Illumina)/Solexa, 라이프 테크놀로지스(ABI)의 SOLiD, 소형 시퀀서인 아이언 토렌트(Ion Torrent)와 같은 장비를 이용한 염기서열 분석기술 등을 들 수 있다(Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January 2010). "차세대 염기서열 분석법"은 대용량의 유전체 데이터를 생산하기 위한 방법으로서, 유전체 서열을 조각내어 빠르고 정확하게 서열을 읽어내는 기술을 자동화하였고, 1세대 염기서열 분석 기법인 생거 시퀀싱(Sanger sequencing) 방법을 채택하고 있으며 염기서열 결정 후 얻어진 대량의 염기서열의 정보는 표준 유전체(reference genome)와 비교하여 분석함으로써 유전체 해독에 소요되는 비용과 시간을 기존의 방법에 비하여 획기적으로 줄일 수 있다.
본 발명의 명세서에서 사용되는 "마커 또는 유전자 마커" 라는 용어는 분석대상이 되는 시료 내의 유전자들 중 유전자형 분석에 유용한 변이가 존재하는 유전자로서, 예를 들어 DNA 감식이나 개인 식별에 사용되는 CODIS 마커, 특정 질환의 진단에 사용되는 유전자 마커, 유전학적으로 의미가 있는 돌연변이를 갖는 유전자 등을 들 수 있다. 그리고 STR(short tandem repeat) 대립유전자란 예를 들어 개인식별에 사용될 수 있는 특정 염기서열의 반복 단위인 STR(short tandem repeat)의 반복 횟수가 특정수인 유전자를 의미한다. 예를 들어, STR 마커의 대립유전자 반복 횟수가 16 회일 때 대립유전자 16(allele 16)으로 표시할 수 있다.
또한, 본 발명의 명세서에서 사용되는 "에멀젼 PCR(emPCR")이란 분석대상이 되는 시료 내의 유전자들의 DNA 라이브러리, 즉 앰플리콘 라이브러리를 각각의 주형 별로 공간적으로 분리하고 오일 방울(droplet) 내의 에멀젼 상태에서 증폭함으로써 단일 주형에 대한 클로날 증폭(clonal amplification)을 수행하는 기술로서, 오일 내에 한쪽 방향 PCR 프라이머(정방향 프라이머 또는 역방향 프라이머) 또는 어댑터 서열이 결합된 비드와 PCR 증폭 시약(DNA 중합 효소, dNTP 등 포함)을 적하시킴으로써 단일 주형을 포획한 하나의 비드와 PCR 증폭 시약이 포함된 에멀젼을 만든 후 PCR 증폭을 수행하는 기술을 의미한다. 이러한 에멀젼 PCR에서는 오일 방울에 포함된 비드 상에 한쪽 방향 프라이머 또는 어댑터 서열이 결합되어 고정된 상태이기 때문에 증폭 후 비드의 표면에는 단일 주형이 증폭된 상태로 결합하여 존재하게 되고 이러한 비드를 회수하면 추후 수행되는 시퀀싱 작업을 수행할 수 있다.
또한, 본 발명의 명세서에서 사용되는 "리드(read)"라는 용어는 앰플리콘에 대한 시퀀싱 과정에 의해 서열이 결정된 서열조각을 의미하고, "커버리지(coverage)"는 레퍼런스 서열에 리드를 정렬하여 레퍼런스 서열의 각 염기 서열위치에 매핑된 리드의 개수이며, 레퍼런스 서열은 게놈 프로젝트 등에 의해 이미 알려진 서열을 의미한다.
본 발명의 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법은,
(a) 개인식별용 STR (short tandem repeat) 유전자 마커인 CODIS(Combined DNA Index System)의 CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, FGA, TH01, TPOX 및 vWA를 각각 특이적으로 증폭하는 서열번호 1 및 2의 프라이머 쌍, 서열번호 3 및 4의 프라이머 쌍, 서열번호 5 및 6의 프라이머쌍, 서열번호 7 및 8의 프라이머 쌍, 서열번호 9 및 10의 프라이머 쌍, 서열번호 11 및 12의 프라이머 쌍, 서열번호 13 및 14의 프라이머 쌍, 서열번호 15 및 16의 프라이머 쌍, 서열번호 17 및 18의 프라이머 쌍, 서열번호 19 및 20의 프라이머 쌍, 서열번호 21 및 22의 프라이머 쌍, 및 서열번호 23 및 24의 프라이머 쌍을 준비하는 단계와,
(b) 분석대상이 되는 시료 내에 존재하는 상기 개인식별용 STR 유전자 마커 각각을 상기 (a) 단계에서 준비된 각각의 프라이머 쌍을 이용하여 증폭하여 상기 개인식별용 STR 유전자 마커 각각에 대한 PCR 증폭산물을 수득하는 단계와,
(c) 상기 (b) 단계에서 수득된 PCR 증폭산물을 주형으로 하여 에멀젼 PCR(emPCR)을 수행하는 단계와,
(d) 상기 개인식별용 STR 유전자 마커 각각의 전체 레퍼런스 서열에서 각각의 STR(short tandem repeat) 대립유전자 부위를 선정하여, 상기 개인식별용 STR 유전자 마커 모두에 대해 STR이 시작되는 위치와 끝나는 위치 정보를 포함하는 기준 STR 서열 데이터로서 생성하는 단계와,
(e) 상기 (c) 단계의 에멀젼 PCR 증폭산물에 대한 시퀀싱에 의해 얻어진 염기서열 데이터들로부터, 상기 (d) 단계에서 생성된 기준 STR 서열 데이터에 매칭되는 반복 서열과 반복 길이 데이터를 판독하여 STR 반복 횟수 및 STR 유전자형을 결정하는 단계를 포함한다.
본 발명의 일실시예의 유전자형 분석방법은, 상기 (e) 단계에서 결정된 STR 유전자형과 관련된 STR 내의 염기서열을 결정하여 STR 내의 변이 여부를 판별하는 (f) 단계를 더 포함할 수 있다. 이때, (f) 단계에서 상기 STR 유전자형과 관련된 STR 내의 염기서열을 결정한 결과, 적어도 2 종류의 반복된 염기서열을 가지는 것으로 확인된 경우 STR 내에 변이가 존재하는 것으로 결정할 수 있다.
본 발명의 일실시예의 유전자형 분석방법에 있어서, 상기 기준 STR 서열 데이터는 각각의 개인식별용 STR 유전자 마커가 위치하는 염색체 이름 및 각각의 개인식별용 STR 유전자 마커의 이름 중 적어도 하나, 개인식별용 STR 유전자 마커 각각의 서열에서 STR이 시작되는 위치와 끝나는 위치 정보, 시퀀싱 리드(sequencing read)가 시작된 위치로부터 STR이 시작되는 위치까지의 길이, STR이 끝나는 위치로부터 시퀀싱 리드(sequencing read)가 끝나는 위치까지의 길이 및 STR 반복 단위의 염기 개수 정보를 포함하도록 구성될 수 있다. 이와 같이 구성된 기준 STR 서열 데이터를 이용하면 다양한 STR 마커의 반복 횟수 부위의 염기서열을 한 번에 확인할 수 있으며, 개인식별용 STR 마커가 지니는 대립유전자 반복 횟수 및 유전자형을 빠르고 정확히 분석할 수 있고 STR 마커 내의 변이까지도 분석할 수 있는 장점이 있다.
본 발명의 일실시예의 유전자형 분석방법은, 상기 (a) 단계에서 성별 분석을 위한 유전자 마커 AMEL(Amelogenin)를 특이적으로 증폭하는 서열번호 25 및 26의 프라이머 쌍을 추가로 준비하고, 상기 서열번호 25 및 26의 프라이머 쌍을 이용하여 증폭된 유전자 마커 AMEL의 PCR 증폭산물에 대해 서열분석을 수행하여 XX형인지 XY형인지를 판별하는 단계를 추가로 포함할 수 있다. 이 경우, 유전자 마커 AMEL로부터의 성염색체 대립유전자형이 XX형이면 여성으로, XY형이면 남성으로 판별할 수 있다.
본 발명의 일실시예의 유전자형 분석방법에서, 상기 시료는 적어도 2개의 DNA 시료가 혼합된 시료이고, 혼합된 시료 중 하나의 시료에서의 미량 DNA에 대해서도 상기 개인식별용 STR 유전자 마커 각각에 대한 유전자형 분석을 수행할 수 있는 것을 특징으로 한다.
본 발명의 개인식별 방법은, 전술한 바와 같은 차세대 염기서열 분석법을 기반으로 하는 개인식별용 STR 유전자 마커에 대한 유전자형 분석방법을 수행하는 단계와, 상기 유전자형 분석방법을 수행하여 얻어진 개인 신원관련 데이터를 데이터베이스에 사전 등록된 개인의 신원관련 데이터와 비교하여 검사대상이 되는 시료의 신원을 확인하는 단계를 포함한다.
본 발명에 따르면 차세대 염기서열 분석법으로부터 얻어진 개인식별용 유전자 마커에 대한 염기서열 데이터의 분석을 통해 STR 마커의 유전자형을 결정하고, 대립유전자의 반복 횟수 및 STR 유전자형의 돌연변이를 정확하고 효과적으로 분석할 수 있다.
구체적으로, 종래의 모세관 전기영동을 이용한 염기서열 분석 방법은 비교적 짧은 DNA 조각만을 분석할 수 있으며 변이가 있는 대립유전자는 별도로 생거 시퀀싱(sanger sequencing) 방법으로 확인해야 한다는 단점이 있는 반면에, 본 발명의 방법은 차세대 염기서열 분석법으로부터 얻어진 개인식별용 유전자 마커에 대한 염기서열 데이터가 확보되면 개인식별용 유전자 마커의 대립유전자 반복 횟수 및 STR 유전자형을 빠르고 정확히 분석할 수 있고 STR 마커내의 변이까지도 분석할 수 있는 장점이 있다.
또한, 본 발명의 방법은 기존의 분석 방법에 비하여 다양한 STR 마커가 지니는 염기서열을 한 번에 확인할 수 있고 STR 마커의 유전자형 분포가 다른 특정 STR 마커에서의 희귀 대립유전자의 검출이 가능하고, 범죄 사건이나 대량참사 발생 시에 유전정보가 들어 있는 혼합시료, 감식이 어려운 손상된 시료 또는 미량의 시료에서의 분석도 가능하다.
추가로, 상용되고 있는 AmpFlSTR Identifier 및 AmpFlSTR Y filer PCR 키트 등을 이용한 종래의 분석 과정은 희귀 대립유전자(rare allele) 및 인식되지 않은 대립유전자(null allele)의 출현으로 일치적합 가능성(matching probability)을 산출하는 과정에서 혼선이 종종 발생하는 반면에, 본 발명의 방법은 대용량의 병렬 염기서열 분석을 통하여 전체 유전자의 염기서열을 확인할 수 있기 때문에 희귀 대립유전자(rare allele) 및 인식되지 않은 대립유전자(null allele)의 검출이 가능하다.
도 1은 표 1의 프라이머 쌍 각각을 이용하여 사람의 개인식별용 유전자 마커에 대해 PCR 증폭을 수행하고 증폭 산물에 대한 전기영동을 수행한 후 결과 사진으로서, 각 유전자 마커의 PCR 증폭산물이 정상적으로 생성된 것을 나타내는 전기영동결과 사진이다.
도 2는 4개의 시료에 대해 수행된 PGM(Personal Genome Analyzer) 시퀀싱에 의해 시퀀싱 데이터를 얻은 후, 이를 HID_STR_Genotyper 플러그인을 이용하여 각 시료별로 전체 커버리지에 대한 D3S1358 대립유전자 16(반복 횟수)의 리드 개수를 분석하고 이를 도시한 그래프이다.
도 3a 및 도 3b는 HID_STR_Genotyper 플러그인의 선택 화면 및 설치 후의 사용자 인터페이스를 도시한 도면이다.
이하, 본 발명의 실시예에 기초하여 보다 상세하게 기술한다. 본 발명의 하기 실시예는 본 발명을 구체화하기 위한 것일 뿐 본 발명의 권리범위를 제한하거나 한정하는 것이 아님은 물론이다. 본 발명의 상세한 설명 및 실시예로부터 본 발명이 속하는 기술분야의 전문가가 용이하게 유추할 수 있는 것은 본 발명의 권리범위에 속하는 것으로 해석된다. 본 발명에 인용된 참고문헌들은 본 발명에 참고로서 통합된다.
실시예
이하에서 설명되는 실시예들에서는 기존의 중합효소 연쇄반응을 이용한 STR 분석법을 대체하여 본 발명의 일실시예의 방법이 적용되는 소형 시퀀서(Ion torrent)의 플러그인을 사용함으로써 1 ng의 미량 시료에서 개인식별용 STR 마커의 대립유전자 차이를 확인할 수 있었다. 아래 실시예들에서는 소형 시퀀서인 아이언 토렌트(Ion Torrent)에 제공되는 PGM(Personal Genome Analyzer)에 의해 얻어진 시퀀싱 데이터를 HID-STR-Genotyper 플러그인에서 처리하여 개인식별용 CODIS 마커에 대한 STR 유전자형을 분석하였다. 한편, 아래 실시예들에서 사용되는 "리드"라는 용어는 실시예 2와 같은 시퀀싱 과정에 의해 서열이 결정된 서열조각을 의미하고, 커버리지는 참조(reference) 서열에 리드를 정렬하여 레퍼런스 서열의 각 염기 서열 위치에 매핑된 리드의 개수이며, 참조 서열은 게놈 프로젝트 등에 의해 이미 알려진 서열을 의미한다.
실시예 1: 시료의 사전 증폭 (앰플리콘의 준비)
22800M 대조군 DNA, NIST(National Institute of Standards and Technology)의 SRM(Standrad reference materials) 2391b 유전자들, 남녀 각 2명의 한국인 지원자를 무작위로 선택하여 표본으로 지정하였다. QIAamp DNA Blood Mini Kit(Qiagen, 독일)을 이용하여 한국인 남녀의 각각의 혈액으로부터 게놈 DNA(gDNA)를 추출하였다. gDNA의 분리를 위해, 1.5 mL 마이크로 원심분리튜브에 혈액 200 ㎕, 프로테아제(protease) K 25 ㎕ 및 완충용액 200 ㎕를 혼합하였고, 10분간 70℃에서 반응시킨 후 무수에탄올을 넣어 DNA를 침전시켰다. 이와 같이 얻어진 반응액을 QIAamp 스핀컬럼(spin column)을 이용하여 정제한 후, 완충 용액으로 2회 세척하였다. 그리고 나서, 70 ℃에서 예열한 완충용액 50 ㎕로 용해하여 gDNA를 얻었고, 이를 -20℃에 보관하였다. 추출한 각 gDNA에 대해서는 아가로스 겔 전기영동으로 DNA의 존재 여부를 확인하였고, 큐비트(Qubit) dsDNA HS 어세이 키트(Assay Kit)와 큐비트(Qubit) 2.0 플루오로미터(Flourometer; Life Technologies, 미국)를 사용하여 gDNA의 양을 측정하였다. 법과학 분야에서 널리 알려져 있고 미국 연방수사국 및 유럽 등 많은 나라에서 범죄 수사에 사용되고 있는 사람의 개인식별용 CODIS(Combined DNA Index System) 유전자 마커(CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, FGA, TH01, TPOX, vWA, AMEL)를 각각 특이적으로 증폭하기 위한 13 개 쌍의 프라이머 쌍(정방향 프라이머 및 역방향 프라이머 쌍)을 다음 표 1에 도시된 바와 같이 설계하여 준비하였다. 상기 프라이머들은 (주)바이오닉스(대한민국 서울시 구로구 소재)에 의뢰하여 제작하였다. 참고로, 본 발명의 아래 실시예들에서는 CODIS 유전자 마커의 D21S11에 대한 분석은 실시하지 않았다.
[표 1] 개인식별용 유전자 마커인 CODIS 마커 PCR 증폭을 위한 프라이머 쌍
Figure pat00001
-20 ℃에 보관되어 있는 gDNA를 1 ng을 사용하여 PCR을 시행하였다. PCR 반응을 위한 마스터 믹스(예를 들어, PCR 버퍼, dNTP, DNA 폴리머라아제 등으로 이루어진 것)로서 솔젠트(주)(대한민국 대전광역시 소재)의 2X 멀티플렉스 PCR 스마트믹스를 사용하였고, gDNA는 상기 표 1에 도시된 바와 같은 정방향 프라이머(5 pM)와 역방향 프라이머(5 pM)의 각 쌍을 사용하여 증폭하였다. 증폭은 95 ℃에서 30초 간의 변성, 58 ℃에서 30초 간의 어닐링 및 68℃에서 1분 간의 신장을 40회 반복하여 수행되었다. 이와 같은 PCR에 의해 얻어진 증폭 산물인 앰플리콘(Amplicon)에 대해 3 % TBE 아가로스 겔에서 100 V로 40분 간 전기영동을 수행한 후, Gel Doc 2000(Bio-Rad Laboratiories, 미국)를 사용하여 각 앰플리콘의 크기를 확인하였다. 추출된 gDNA에 대해 상기 각각의 프라이머 쌍을 사용하여 PCR 증폭을 수행한 결과, 해당 유전자 마커에 대한 증폭산물이 정상적으로 생성되었음을 확인하였다(도 1 참조).
실시예 2: 에멀젼 PCR (emPCR) 증폭 과정 수행
상기 실시예 1에서 1 ng의 gDNA로부터 증폭된 앰플리콘의 농도는 큐비트(Qubit) dsDNA HS 어세이 키트(Assay Kit)와 큐비트 플루오로미터(Qubit Flourometer)(Invitrogen, 미국)로 측정하였다. 각 CODIS 마커의 앰플리콘에 대한 농도를 계산하였고, 증폭된 앰플리콘들을 통합한 후 아젠코트(AgenCourt) AMPureXP 시약(Beckman Coulter, 미국)을 이용하여 1.8배의 PCR 용량으로 정제하였다. Agilent 2100 바이오애널라이저(Agilent 2100 Bioanalyzer)의 고감도 DNA 키트(Agilent Technologies, 미국)를 사용하여, 통합한 앰플리콘의 100 내지 500 bp 크기에서 농도를 측정하였다.
통합된 짧은 앰플리콘은 100 ng의 농도로 엔드 리페어(End-repair) 방법과 아이언 플러스 플래그먼트 라이브러리 키트(Ion Plus Fragment Library Kit) 및 해당 매뉴얼(Life Technologies, 미국; Catalog Number 4471252, Publication Number MAN0006846, Revison A.0)에 따라 처리되었다. 또한, 각 시료 별로 아이언 익스프레스 DNA 바코딩 키트(Ion Xpress DNA bar coding kit)(Life Technologies, 미국; Catalog Number 4471250)를 사용하여 해당 시료의 앰플리콘들에 "바코드(barcode) 서열"이 부착되었다. 각 시료 별로 통합되고 해당 시료 식별을 위한 바코드 서열이 부착된 앰플리콘들로 이루어진 라이브러리는 저농도의 TE 버퍼 용액으로 1:10 희석 한 후 Agilent 2100 바이오애널라이저(Agilent 2100 Bioanalyzer)의 고감도 DNA 키트(Agilent Technologies, 미국)를 사용하여 180 내지 475 bp의 크기에서 몰농도[pmol/L]를 측정하였다. 앞에서 나타낸 바와 같이 각 시료 별로 통합되고 해당 시료의 바코드 서열이 부착된 앰플리콘들로 이루어진 라이브러리 8 pM에 대한 에멀션 PCR(emPCR)이 아이언 PGM 템플리트 OT2 400 키트(Ion PGM Template OT2 400 Kit)(Life Technologies, 미국; Catalog Number 4479878) 및 해당 매뉴얼(Ion PGM Template OT2 400 Kit, Publication Number MAN 0007218, Revision 3.0)에 따라 수행하였다. 템플리트-양성의 ISP(Ion Sphere Particles)를 50℃에서 2분간 반응시킨 후, 다이나비즈 마이원스트렙타비딘 C1 비드(DynaBeads MyOne Streptavidin C1 Bead)(Life Technologies, 미국)로 ISP를 인리치먼트(Enrichment)하였다.
PGM(Personal Genome Analyzer) 시퀀싱은 Ion 318 칩 키트 v2(Life Technologies, 미국; Catalog Number 4484354) 및 Ion PGM 시퀀싱 400 키트(Life Technologies, 미국; Catalog Number 4482002)와, 해당 매뉴얼(Ion PGM Sequencing 400 Kit, Publication Number MAN0007242, Revision 2.0)을 이용하여 수행하였다.
한편, 전술한 Ion PGM 시퀀싱 400 키트 및 Ion 318 칩 키트를 이용한 PGM(Personal Genome Analyzer) 시퀀싱 기술은 생거 시퀀싱 방법을 이용한 반도체 기술 기반의 시퀀싱 기술로서, 반도체 칩의 작은 구멍(well)에서 DNA 합성이 일어나면서 나타나는 pH의 변화를 직접 반도체에서 신호로 잡아내는 원리에 의해 4시간 이내에 해독이 가능한 매우 빠른 시퀀싱 플랫폼이다. 또한, PGM(Personal Genome Analyzer) 시퀀싱 기술은 여러 시료의 반응을 동시에 수행할 수 있는 멀티플렉싱 시퀀싱 능력이 있으며, 1 ng 이하 미량의 시료로도 단시간에 적은 비용으로 염기서열 분석을 정확하게 수행할 수 있다. 본 실시예에서는 PGM 시퀀싱을 사용하여 앰플리콘에 대한 염기서열 데이터를 얻었으나, 본 발명은 이 분야에 알려진 다른 시퀀싱 방법, 예를 들어 파이로 시퀀싱(pyrosequencing) 등을 사용하여 앰플리콘에 대한 염기서열 데이터를 얻을 수 있는 것은 물론이다.
실시예 3: 개인식별용 유전자 마커의 짧은 앰플리콘에 대한 염기서열 데이터 분석용 소프트웨어의 실행
상기 실시예 2에서 수행된 PGM(Personal Genome Analyzer) 시퀀싱에 의해 얻어진 짧은 앰플리콘의 염기서열 데이터들이 모아지고, 이들에 대한 분석은 Ion Torrent Suite 4.0.2 소프트웨어를 이용하여 수행하였다. Ion Torrent Suite 4.0.2 소프트웨어를 이용하여 NCBI의 hg19 레퍼런스(reference) 서열에 대한 정렬을 수행하고 각 시료에 대한 시퀀싱 데이터를 종합한 결과, 평균 165 bp의 리드 길이(read length)를 얻었고, 총 1,753,864개의 리드를 얻었으며, 최종적으로 285 M의 염기를 얻었다. 각 시료 별 결과는 하기 표 2와 같다.
[표 2]
Figure pat00002
또한, 상기 실시예 2에서 수행된 PGM(Personal Genome Analyzer) 시퀀싱에 의해 얻어진 짧은 앰플리콘의 시퀀싱 데이터를 바탕으로 한 각 시료 별 개인식별용 유전자 마커의 STR 분석은 아이언 토렌트(Ion Torrent)의 아이언 커뮤니티(Ion Community) 웹사이트 http://ioncommunity.lifetechnologies.com에서 HID_STR_Genotyper Torrent Browser Plugin(version 2.1)으로 분석하였다(도 3a 및 도3b 참조). 상기 웹사이트에서는 Torrent Suite 소프트웨어 플러그인 개발자들이 쉽고 빠르게 분석할 수 있는 다양한 추가 분석 프로그램을 배포하고 있다. 도 3a에 도시한 바와 같은 플러그인 선택 메뉴에서 사용자가 HID_STR_Genotyper 플러그인을 선택하여 설치하면 도 3b와 같은 ID_STR_Genotyper 플러그인 사용자 인터페이스가 제공된다. HID_STR_Genotyper 플러그인은 실시예 2에서 수행된 PGM(Personal Genome Analyzer) 시퀀싱에 의해 얻어진 염기서열 데이터들을 Torrent Browser에서 쉽고 빠르게 원스탑으로 위치시켜 STR 분석을 가능하게 하는 플러그인이다. 즉, HID_STR_Genotyper 플러그인은 실시예 2에서 수행된 PGM(Personal Genome Analyzer) 시퀀싱에 의해 얻어진 데이터들로부터 개인식별용 유전자 마커의 STR 부위에서의 반복 서열과 반복 길이 데이터를 불러내어 분석을 수행할 수 있도록 설계된 플러그인이다. Torrent browser에서 바로 HID_STR_Genotyper 플러그인의 인스톨이 가능하다. 본 실시예에서는 개인식별용 유전자 마커의 서열에서 특정 STR 대립유전자 부위를 선택하여 디지인한 패널 파일(Panel file)을 HID_STR_Genotyper 플러그인을 통하여 처리함으로써 STR 부위에서 가장 빈번하게 나타나는 대립유전자를 찾아낼 수 있고, STR의 생성 길이와 서열을 바탕으로 한 히스토그램 뿐만 아니라 상호 보완된 커버리지 도표로 데이터 분석이 가능하다.
본 실시예에서는 개인식별용 CODIS STR유전자 마커 정보와 DNA 기증자의 성별을 결정하는데 사용되는 성염색체 마커인 AMEL 마커 정보를 기초로 하여, 개인식별용 유전자 마커가 위치하는 염색체 이름, 해당 유전자 마커의 서열에서 STR 부위가 시작되는 좌표와 끝나는 좌표, 해당 유전자 마커의 이름 및 STR 부위를 플랭킹하는 염기의 수 등을 기록한 STR 플러그인 분석에 요구되는 파일(이하, BED 파일이라 함)을 하기 표 3과 같이 생성하였다.
STR 플러그인 분석에 요구되는 BED 파일
track name="STR_10plex" description="STR_10plexlocifile" type=bedDetail
chr5 149455886 149455937 CSF1PO 15;15;4
chr3 45582231 45582294 D3S1358 15;15;4
chr5 123111250 123111293 D5S818 25;15;4
chr7 83789542 83789593 D7S820 25;15;4
chr8 125907107 125907158 D8S1179 15;15;4
chr13 82722160 82722203 D13S317 15;15;4
chr16 86386308 86386351 D16S539 15;15;4
chr18 60948900 60948971 D18S51 25;25;4
chr4 155508888 155508975 FGA 25;15;4
chr11 2192319 2192346 TH01 25;15;4
chr2 1493425 1493456 TPOX 15;15;4
chr12 6093143 6093210 vWA 25;15;4
chrX 11315050 11315050 AMEL_X 25;25;1
chrY 6737935 6737935 AMEL_Y 25;25;1
그리고, HID_STR_Genotyper 플러그인 환경설정에서 표 3과 같이 생성된 BED파일을 입력하고 최소 커버리지 문턱치(minimum coverage threshold)를 0.3으로 설정한 후, HID_STR_Genotyper 플러그인 분석을 수행하였다. BED 파일의 각 레코드에는 개인식별용 유전자 마커가 위치하는 염색체 이름, 해당 유전자 마커의 서열에서 STR 부위가 시작되는 좌표와 끝나는 좌표, 해당 유전자 마커의 이름이 차례대로 들어간다. BED 파일의 마지막 열에는 세미콜론(;)으로 3개의 필드(field)를 구분하여 숫자가 들어가는데, 해당 유전자 마커의 서열에서 PCR용 프라이머 쌍을 디자인한 부위를 기준으로 하여 '왼쪽 STR까지의 길이; 오른쪽 STR까지의 길이; 반복 단위의 염기 개수'로 나타낸다.
특정 STR 대립유전자는 염색체 상의 특정한 위치에 존재하고 STR은 개개인의 특성에 따라 반복 횟수의 차이가 생기기 때문에, NCBI의 hg19 레퍼런스(reference) 서열을 기준으로 하여 BED 파일을 디자인한다면, HID_STR_Genotyper 플러그인을 사용하여 원하는 STR 부위의 위치를 찾아 다양한 STR 대립유전자의 분석이 가능하다.
즉, 개인식별용 유전자 마커가 위치하는 염색체 이름, 해당 유전자 마커의 서열에서 STR 부위가 시작되는 좌표와 끝나는 좌표, 해당 유전자 마커의 이름, 시퀀싱 리드(sequencing read)가 시작된 부위로부터 STR이 시작되는 부분까지의 길이, STR이 끝나는 부위로부터 시퀀싱 리드(sequencing read)가 끝나는 부분까지의 길이를 지정하여 BED 파일을 생성한다면, HID_STR_Genotyper 플러그인을 사용하여 다양한 STR 대립유전자의 분석이 가능하다.
실시예 4: 종래 기술과의 비교 및 본 발명의 방법의 특성 확인
실시예 1에서 준비된 15개의 시료에 대해 실시예 3에 따른 플러그인 분석 결과, 전체 리드 중 표 3의 BED 파일에 매핑된 리드는 평균 40.6%였다. 또한, SRM 2391b을 비롯한 실시예 1에서 준비된 각 시료에 대한 전체 리드와 매핑된 리드의 수는 아래 표 4에 나타내었다(표 4).
[표 4] 각 시료별 전체 리드 수 및 BED 파일에 매핑된 리드 수
Figure pat00003
한편, 본 발명의 실시예 2 및 실시예 3에 따라 각 시료 별로 분석된 CODIS 유전자 마커(CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, FGA, TH01, TPOX, vWA, AMEL)의 유전자형과, 실시예 1에서 준비된 15 개의 시료에 대해 멀티플렉스 PCR을 수행한 후 본 분야에 널리 사용되고 있는 모세관 전기영동법을 이용한 분석 방법(AmpFISTR Identifier 및 AmpFISTR Y filer PCR 키트 이용)에 의해 분석된 CODIS 유전자 마커의 유전자형을 비교하였다. 그 결과 15 개의 시료에서 사람의 개인식별용 유전자 마커 모두에 대해 동일한 결과를 얻을 수 있었고, 이로부터 본 발명의 방법이 유효한 방법인 것을 확인할 수 있었다(아래 표 5-1, 표 5-2 및 표 5-3 참조).
[표 5-1]
Figure pat00004

[표 5-2]
Figure pat00005

[표 5-3]
Figure pat00006
또한, 본 실시예에서는 HID_STR_Genotyper 플러그인 분석을 통해 각 시료 별로 CODIS 마커(CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, FGA, TH01, TPOX, vWA, AMEL)의 STR 유전자형을 확인할 수 있을 뿐 만 아니라 IGV (Integrative Genomics Viewer)와 링크하여 IGV 브라우저를 통해 반복염기서열의 전체 서열을 확인하여 각 STR 대립유전자에서의 변이를 쉽게 찾아낼 수 있다. 종래의 모세관 전기영동법을 이용한 분석 방법은 단일 염기다형성(SNP), 삽입, 결실 등과 같은 개개인에서 차이를 보일 수 있는 염기서열의 변이를 반영하지 못하지만, HID_STR_Genotyper 플러그인을 활용한 본 발명의 방법에서는 STR마커의 대립유전자에서의 변이를 쉽게 확인할 수 있고, 또한 많은 바코드를 인지할 수 있어 한 번에 여러 개 시료의 대립유전자를 비교할 수 있다. 즉, HID_STR_Genotyper 플러그인을 활용한 본 발명의 방법에 따르면 커버리지 플롯(coverage plot) 분석을 통하여 레퍼런스 서열에 정렬된 STR의 전체 커버리지, STR 대립유전자의 길이와 리드의 수, 전체의 염기서열 등을 알 수 있다.
또한, 인간의 염색체 내에는 STR 외에 단일 염기 다형성과 관련하여 대립유전자의 수가 매우 많지만, 본 발명의 방법에 따르면 이러한 다형성의 일부는 반복 서열의 전후를 PCR로 증폭하여 PCR 산물의 길이 다형성으로 검출하는 방법에 의해 확인이 가능하고 단일 염기의 변이는 생거 시퀀싱에 의해 확인이 가능하다. 본 발명의 방법에 따르면, STR이 존재하는 반복서열의 전후를 PCR로 증폭하여 차세대 염기서열 분석법에 의해 염기 서열 데이터를 얻은 다음, 특정 대립유전자의 부위를 선택하고 패널 파일을 디자인하여 HID_STR_Genotyper 플러그인을 통하여 STR 유전자형 분석 과정을 수행할 수 있다.
즉, 본 발명의 방법은 HID_STR_Genotyper 플러그인을 통하여 처리함으로써 STR 부위에서 가장 빈번하게 나타나는 대립유전자를 찾아낼 수 있고, STR의 생성 길이와 서열을 바탕으로 한 히스토그램 뿐만 아니라 상호 보완된 커버리지 도표로 데이터 분석이 가능하다. 이러한 분석 결과가 하기 표 6 및 도 2에 도시되어 있다.
[표 6]
Figure pat00007
상기 표 6에 도시된 바와 같이, 4개의 시료 중 Female 1 시료에서 D3S1358 대립유전자 16(반복 횟수)의 염기서열 중 변이(A→G)가 있는 것을 알 수 있었다(서열번호 29 참조). Female1 시료에서는 STR 대립유전자 16의 경우 총 3665개의 커버리지 중에서 다른 시료들과는 하나의 염기서열이 다른 1634개의 리드를 얻었으며(서열번호 29 참조), 다른 시료들과 동일한 1359개의 리드를 얻었다(서열번호 30 참조).
도 2에는 이러한 결과를 각 시료별로 전체 커버리지에 대한 대립유전자의 리드 개수의 막대 그래프로서 도시하고 있다. 한편, Male 1, Male 2, Female 2의 시료들에서는 D3S1358 대립유전자 16(반복 횟수)의 염기서열이 동일한 것을 확인하였다(서열번호 27, 서열번호 28 및 서열번호 31 참조).
상기 표 6 및 도 2에 도시된 바와 같이, Female1 시료의 경우 D3S1358의 STR대립유전자가 16번 반복된 염기서열을 2종류 가지는데 하나는 TCTA[TCTG]2[TCTA]13의 염기서열을 가지며, 다른 하나는 TCTA[TCTG]3[TCTA]12의 염기서열을 가지는 것을 확인할 수 있었다. 즉, 다른 시료의 분석에서는 총 커버리지에 대해 16번 반복된 염기서열의 카운트의 차이가 없는 반면에, Female 1의 시료 분석에서는 총 커버리지 에 대해 16번 반복된 염기서열이 두 종류인 것을 도 2의 유전자형 분포를 통해 용이하게 알 수 있었다. 이 외에도 NIST(National Institute of Standards and Technology)에서 제공하는 STR 염기 서열을 토대로 한 염기서열 분석 결과를 통해 반복 서열의 구조와 대립 유전자 변이를 확인할 수 있다.
이러한 관점에서, 본 발명의 방법은 개인식별용 유전자 마커의 대립유전자 반복 횟수 및 STR 유전자형을 빠르고 정확히 분석할 수 있고 STR 내의 변이까지도 분석할 수 있으며, 기존의 분석 방법에 비하여 다양한 STR 마커를 한 번에 확인할 수 있고 STR 유전자형의 분포가 다른 특정 STR 마커에서의 희귀 대립 유전자의 검출이 가능한 장점이 있다고 할 수 있다. 뿐만 아니라, 본 발명의 방법은 극한 조건의 감정물로부터 DNA 감식의 활용도를 높이기 위하여 다양한 위험 요소에서 초래되어 불순물이 섞여있는 시료나 외부의 위험요인에 노출되어 손상된 시료, 오래된 시료 등에서의 미량의 DNA를 사용한 개인 신원 확인에 적합한 기술이라고 할 수 있다.
또한, 본 발명의 방법은 범죄 현장에서 빈번하게 나타나는 손상된 시료나 유골과 같은 미량의 DNA를 가진 시료에서도 개인식별이 가능한 CODIS 유전자 마커와 성별 식별이 가능한 AMEL(Amelogenin) 유전자의 STR 대립유전자를 확인할 수 있고, 전술한 바와 같은 플러그인을 활용하여 BED 파일을 생성하는 과정에 CODIS 유전자 마커뿐 만 아니라 원하는 유전자좌의 정보를 입력하면 다양한 유전자좌를 분석할 수 있다. 따라서, CODIS 유전자 마커에 포함되어 있는 기본적인 STR 마커 뿐만 아니라 범죄와의 연관성이 있는 특정 유전자 마커의 발굴 및 분석이 가능할 것으로 기대된다.
이상 본 발명을 상기 실시예를 들어 설명하였으나, 본 발명은 이에 제한되는 것이 아니다. 당업자라면 본 발명의 취지 및 범위를 벗어나지 않고 수정, 변경을 할 수 있으며 이러한 수정과 변경 또한 본 발명에 속하는 것임을 알 수 있을 것이다.
<110> GENOCHECK CO., LTD. Republic of Korea(National Forensic Service Director Ministry of Public Administration and Security) <120> Method for analyzing genotype of human identifying markers based on next generation sequencing and personal identification method using the same <130> P14-0029KR <160> 31 <170> KopatentIn 1.71 <210> 1 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> CSF1PO forward primer <400> 1 ccggaggtaa aggtgtctta aagt 24 <210> 2 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> CSF1PO reverse primer <400> 2 atttcctgtg tcagaccctg tt 22 <210> 3 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> D3S1358 forward primer <400> 3 actgcagtcc aatctgggt 19 <210> 4 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> D3S1358 reverse primer <400> 4 atgaaatcaa cagaggcttg c 21 <210> 5 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> D5S818 forward primer <400> 5 ggtgattttc ctctttggta tcc 23 <210> 6 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> D5S818 reverse primer <400> 6 agccacagtt tacaacattt gtatct 26 <210> 7 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> D7S820 forward primer <400> 7 atgttggtca ggctgactat g 21 <210> 8 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> D7S820 reverse primer <400> 8 gattccacat ttatcctcat tgac 24 <210> 9 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> D8S1179 forward primer <400> 9 attgcaactt atatgtattt ttgtatttca tg 32 <210> 10 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> D8S1179 reverse primer <400> 10 accaaattgt gttcatgagt atagtttc 28 <210> 11 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> D13S317 forward primer <400> 11 attacagaag tctgggatgt ggagga 26 <210> 12 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> D13S317 reverse primer <400> 12 ggcagcccaa aaagacaga 19 <210> 13 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> D16S539 forward primer <400> 13 gggggtctaa gagcttgtaa aaag 24 <210> 14 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> D16S539 reverse primer <400> 14 gtttgtgtgt gcatctgtaa gcatgtatc 29 <210> 15 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> D18S51 forward primer <400> 15 ttcttgagcc cagaaggtta 20 <210> 16 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> D18S51 reverse primer <400> 16 attctaccag caacaacaca aataaac 27 <210> 17 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> FGA forward primer <400> 17 ggctgcaggg cataacatta 20 <210> 18 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> FGA reverse primer <400> 18 attctatgac tttgcgcttc agga 24 <210> 19 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> TH01 forward primer <400> 19 gtgattccca ttggcctgtt c 21 <210> 20 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> TH01 reverse primer <400> 20 attcctgtgg gctgaaaagc tc 22 <210> 21 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> TPOX forward primer <400> 21 gcacagaaca ggcacttagg 20 <210> 22 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> TPOX reverse primer <400> 22 cgctcaaacg tgaggttg 18 <210> 23 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> vWA forward primer <400> 23 gccctagtgg atgataagaa taatcagtat gtg 33 <210> 24 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> vWA reverse primer <400> 24 ggacagatga taaatacata ggatggatgg 30 <210> 25 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> AMEL forward primer <400> 25 ccctgggctc tgtaaagaa 19 <210> 26 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> AMEL reverse primer <400> 26 atcagagctt aaactgggaa gctg 24 <210> 27 <211> 64 <212> DNA <213> Homo sapiens Male1 allele 16 <400> 27 tctatctgtc tgtctatcta tctatctatc tatctatcta tctatctatc tatctatcta 60 tcta 64 <210> 28 <211> 64 <212> DNA <213> Homo sapiens Male2 allele 16 <400> 28 tctatctgtc tgtctatcta tctatctatc tatctatcta tctatctatc tatctatcta 60 tcta 64 <210> 29 <211> 64 <212> DNA <213> Homo sapiens Female1 allele 16' <400> 29 tctatctgtc tgtctgtcta tctatctatc tatctatcta tctatctatc tatctatcta 60 tcta 64 <210> 30 <211> 64 <212> DNA <213> Homo sapiens Female1 allele 16 <400> 30 tctatctgtc tgtctatcta tctatctatc tatctatcta tctatctatc tatctatcta 60 tcta 64 <210> 31 <211> 64 <212> DNA <213> Homo sapiens Female2 allele 16 <400> 31 tctatctgtc tgtctatcta tctatctatc tatctatcta tctatctatc tatctatcta 60 tcta 64

Claims (7)

  1. (a) 개인식별용 STR (short tandem repeat) 유전자 마커인 CODIS(Combined DNA Index System)의 CSF1PO, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, FGA, TH01, TPOX 및 vWA를 각각 특이적으로 증폭하는 서열번호 1 및 2의 프라이머 쌍, 서열번호 3 및 4의 프라이머 쌍, 서열번호 5 및 6의 프라이머쌍, 서열번호 7 및 8의 프라이머 쌍, 서열번호 9 및 10의 프라이머 쌍, 서열번호 11 및 12의 프라이머 쌍, 서열번호 13 및 14의 프라이머 쌍, 서열번호 15 및 16의 프라이머 쌍, 서열번호 17 및 18의 프라이머 쌍, 서열번호 19 및 20의 프라이머 쌍, 서열번호 21 및 22의 프라이머 쌍, 및 서열번호 23 및 24의 프라이머 쌍을 준비하는 단계와,
    (b) 분석대상이 되는 시료 내에 존재하는 상기 개인식별용 STR 유전자 마커 각각을 상기 (a) 단계에서 준비된 각각의 프라이머 쌍을 이용하여 증폭하여 상기 개인식별용 STR 유전자 마커 각각에 대한 PCR 증폭산물을 수득하는 단계와,
    (c) 상기 (b) 단계에서 수득된 PCR 증폭산물을 주형으로 하여 에멀젼 PCR(emPCR)을 수행하는 단계와,
    (d) 상기 개인식별용 STR 유전자 마커 각각의 전체 레퍼런스 서열에서 각각의 STR(short tandem repeat) 대립유전자 부위를 선정하여, 상기 개인식별용 STR 유전자 마커 모두에 대해 STR이 시작되는 위치와 끝나는 위치 정보를 포함하는 기준 STR 서열 데이터로서 생성하는 단계와,
    (e) 상기 (c) 단계의 에멀젼 PCR 증폭산물에 대한 시퀀싱에 의해 얻어진 염기서열 데이터들로부터, 상기 (d) 단계에서 생성된 기준 STR 서열 데이터에 매칭되는 반복 서열과 반복 길이 데이터를 판독하여 STR 반복 횟수 및 STR 유전자형을 결정하는 단계를 포함하는 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법.
  2. 제1항에 있어서,
    상기 (e) 단계에서 결정된 STR 유전자형과 관련된 STR 내의 염기서열을 결정하여 STR 내의 변이 여부를 판별하는 (f) 단계를 더 포함하는 유전자형 분석방법.
  3. 제1항에 있어서,
    상기 기준 STR 서열 데이터는 각각의 개인식별용 STR 유전자 마커가 위치하는 염색체 이름 및 각각의 개인식별용 STR 유전자 마커의 이름 중 적어도 하나, 시퀀싱 리드(sequencing read)가 시작된 위치로부터 STR이 시작되는 위치까지의 길이 및 STR이 끝나는 위치로부터 시퀀싱 리드(sequencing read)가 끝나는 위치까지의 길이 정보를 추가로 포함하는 유전자형 분석방법.
  4. 제3항에 있어서,
    상기 기준 STR 서열 데이터는 STR 반복 단위의 염기 개수의 정보를 추가로 포함하는 유전자형 분석방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 (a) 단계에서 성별 분석을 위한 유전자 마커인 AMEL(Amelogenin)를 특이적으로 증폭하는 서열번호 25 및 26의 프라이머 쌍을 추가로 준비하고, 상기 서열번호 25 및 26의 프라이머 쌍을 이용하여 증폭된 AMEL의 PCR 증폭산물에 대해 서열분석을 수행하여 XX형인지 XY형인지를 판별하는 단계를 추가로 포함하는 유전자형 분석방법.
  6. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 시료는 적어도 2개의 DNA 시료가 혼합된 혼합시료이고, 혼합된 시료 중 하나의 시료에서의 미량 DNA에 대해서도 상기 개인식별용 STR 유전자 마커 각각에 대한 유전자형 분석을 수행할 수 있는 것을 특징으로 하는 유전자형 분석방법.
  7. 제1항 내지 제4항 중 어느 한 항에 정의된 차세대 염기서열 분석법을 기반으로 하는 개인식별용 STR 유전자 마커에 대한 유전자형 분석방법을 수행하는 단계와,
    상기 유전자형 분석방법을 수행하여 얻어진 개인신원 관련 데이터를 데이터베이스에 사전 등록된 개인식별 관련 데이터와 비교하여 검사대상이 되는 시료의 신원을 확인하는 단계를 포함하는 개인식별 방법.
KR1020140110592A 2014-08-25 2014-08-25 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법 KR20160024139A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140110592A KR20160024139A (ko) 2014-08-25 2014-08-25 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140110592A KR20160024139A (ko) 2014-08-25 2014-08-25 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법

Publications (1)

Publication Number Publication Date
KR20160024139A true KR20160024139A (ko) 2016-03-04

Family

ID=55535852

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140110592A KR20160024139A (ko) 2014-08-25 2014-08-25 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법

Country Status (1)

Country Link
KR (1) KR20160024139A (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020054271A (ja) * 2018-10-01 2020-04-09 日本ソフトウェアマネジメント株式会社 分解されたdnaで個体識別可能なdna鑑定方法
KR20210000662A (ko) * 2019-06-25 2021-01-05 대한민국(관리부서: 행정안전부 국립과학수사연구원장) 상염색체 str 좌위를 포함한 ngs 패널 및 다중증폭 시스템
KR20220062197A (ko) 2020-11-06 2022-05-16 동국대학교 산학협력단 인지 기능 평가 시스템 및 인지 기능 평가 방법
KR20230115018A (ko) 2022-01-26 2023-08-02 대한민국(관리부서: 행정안전부 국립과학수사연구원장) 과학 수사를 위한 지리적 프로파일 정보 제공 방법 및 지리적 프로파일 정보
CN117238368A (zh) * 2023-11-15 2023-12-15 北京齐碳科技有限公司 分子遗传标记分型方法和装置、生物个体识别方法和装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101406720B1 (ko) 2012-06-19 2014-06-13 (주)지노첵 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101406720B1 (ko) 2012-06-19 2014-06-13 (주)지노첵 차세대 염기서열 분석법을 위한 융합 프라이머의 설계방법 그리고 이러한 융합 프라이머 및 차세대 염기서열 분석법을 이용한 표적 유전자의 유전자형 분석방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Michael L. Metzker, Aapplications of next-generation sequencing; Sequencing technologies the next generation, Nature Reviews Genetics, Vol.11, pp31-46, January. 2010 (2010년 1월 공개)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020054271A (ja) * 2018-10-01 2020-04-09 日本ソフトウェアマネジメント株式会社 分解されたdnaで個体識別可能なdna鑑定方法
KR20210000662A (ko) * 2019-06-25 2021-01-05 대한민국(관리부서: 행정안전부 국립과학수사연구원장) 상염색체 str 좌위를 포함한 ngs 패널 및 다중증폭 시스템
KR20220062197A (ko) 2020-11-06 2022-05-16 동국대학교 산학협력단 인지 기능 평가 시스템 및 인지 기능 평가 방법
KR20230115018A (ko) 2022-01-26 2023-08-02 대한민국(관리부서: 행정안전부 국립과학수사연구원장) 과학 수사를 위한 지리적 프로파일 정보 제공 방법 및 지리적 프로파일 정보
CN117238368A (zh) * 2023-11-15 2023-12-15 北京齐碳科技有限公司 分子遗传标记分型方法和装置、生物个体识别方法和装置
CN117238368B (zh) * 2023-11-15 2024-03-15 北京齐碳科技有限公司 分子遗传标记分型方法和装置、生物个体识别方法和装置

Similar Documents

Publication Publication Date Title
Alvarez-Cubero et al. Next generation sequencing: an application in forensic sciences?
Devesse et al. Concordance of the ForenSeq™ system and characterisation of sequence-specific autosomal STR alleles across two major population groups
CN105779636B (zh) 用于扩增人乳腺癌易感基因brca1和brca2编码序列的pcr引物及应用
CN107177670B (zh) 一种高通量检测帕金森病致病基因突变的方法
US11193175B2 (en) Normalizing tumor mutation burden
KR20160024139A (ko) 차세대 염기서열 분석법을 기반으로 하는 개인식별용 유전자 마커에 대한 유전자형 분석방법 및 이를 이용한 개인식별 방법
KR20170012390A (ko) 시퀀싱 공정
Larson et al. A clinician’s guide to bioinformatics for next-generation sequencing
Tytgat et al. Nanopore sequencing of a forensic combined STR and SNP multiplex
CN106399496B (zh) 高通量检测str遗传标记的建库试剂盒
JP2020512000A5 (ko)
Al-Eitan et al. Investigation of the forensic GlobalFiler loci in the genetically isolated Circassian subpopulation in Jordan
Zeng et al. Investigation of the STR loci noise distributions of PowerSeq Auto System
Wang et al. Forensic nanopore sequencing of microhaplotype markers using QitanTech’s QNome
Zascavage et al. Deep-sequencing technologies and potential applications in forensic DNA testing
US20240141425A1 (en) Correcting for deamination-induced sequence errors
AU2020228058A1 (en) Computational modeling of loss of function based on allelic frequency
CN105316320B (zh) Dna标签、pcr引物及其应用
CN105296471B (zh) Dna标签、pcr引物及其应用
Cliften Base calling, read mapping, and coverage analysis
Mitsui et al. Multiplexed resequencing analysis to identify rare variants in pooled DNA with barcode indexing using next-generation sequencer
Jones et al. Population data for 21 autosomal short tandem repeat markers in the Arabic population of the United Arab Emirates
JP2023526441A (ja) 複合遺伝子バリアントの検出およびフェージングのための方法およびシステム
KR101977976B1 (ko) 앰플리콘 기반 차세대 염기서열 분석기법에서 프라이머 서열을 제거하여 분석의 정확도를 높이는 방법
KR101967879B1 (ko) 핵산 서열분석에서 uid 핵산 서열의 순결도를 측정하는 방법

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E601 Decision to refuse application