KR101667526B1 - 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법 - Google Patents

차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법 Download PDF

Info

Publication number
KR101667526B1
KR101667526B1 KR1020150189817A KR20150189817A KR101667526B1 KR 101667526 B1 KR101667526 B1 KR 101667526B1 KR 1020150189817 A KR1020150189817 A KR 1020150189817A KR 20150189817 A KR20150189817 A KR 20150189817A KR 101667526 B1 KR101667526 B1 KR 101667526B1
Authority
KR
South Korea
Prior art keywords
genetic locus
primer
final concentration
complementarily
primers
Prior art date
Application number
KR1020150189817A
Other languages
English (en)
Inventor
신경진
김은혜
이은영
이승환
박수정
김혜연
Original Assignee
대한민국
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국 filed Critical 대한민국
Priority to KR1020150189817A priority Critical patent/KR101667526B1/ko
Application granted granted Critical
Publication of KR101667526B1 publication Critical patent/KR101667526B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • G06F19/22
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/143Concentration of primer or probe
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 NGS 기반(next generation sequencing-based) 인간 객체(human subject)의 상염색체 STR 분석방법 및 이에 최적화된 멀티플렉스 PCR 시스템을 제공한다. 특히, NGS 분석에서 가장 복잡하고 시간이 많이 소요되는 NGS라이브러리 생성단계를 2단계로 간소화 하였고, 프라이머의 구성과 농도를 최적화하여 균일한 read count를 얻을 수 있다. 본 발명에서 구축된 멀티플렉스 PCR 시스템과 PCR 기반의 NGS 라이브러리 생성기법을 이용한 법과학 마커의 분석법은 법과학 실무에서 현재의 CE 기반의 STR 분석법으로 분석에 어려움이 따르는 시료의 분석에 유용하게 적용될 수 있다.

Description

차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 STR 분석방법{Method for Extended Autosomal STR Analysing Human Subject of Analytes using a Next Generation Sequencing Technology}
본 발명은 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 STR 분석방법에 관한 것이다.
짧은연쇄반복(Short tandem repeat, STR)은 사람 DNA 내에 존재하는 특정 염기서열이 반복되는 부분으로 이는 사람마다 반복단위(repeat unit)의 반복수가 다르기 때문에 개인식별과 혈연관계의 확인에 사용되고 있다. 현재 국내 범죄자 DNA 데이터베이스는 기본적으로 13개 CODIS (Combined DNA Index System) STR 마커를 분석하여 구축되고 있으나, 분해된 시료의 분석이나 다양한 가족관계의 확인 및 DNA 데이터베이스를 이용한 혈연관계의 추정 등에서 유전자검사 식별력을 높이기 위하여 추가 상염색체 STR 분석이 요구된다.
유럽에서 핵심 STR을 확장한 것에 이어 최근에 미국의 Core Loci Working Group에서도 20개의 STR 마커를 사용하는 것을 권고하고 있으며, 이러한 확장 상염색체 STR을 분석할 수 있는 한국형 검사 키트도 개발되어 있다. 법과학 영역에서는 사용하는 전기영동(Capillary Electrophoresis; CE) 분석법은 형광을 부착한 프라이머를 사용하여 PCR 증폭된 STR 증폭산물에 레이저를 주사하여 PCR 산물의 크기를 간편하고 빠르게 분석할 수 있지만 분석 가능한 STR의 수가 제한되고 STR의 염기서열 변이를 확인할 수 없는 단점이 있다. CE 분석법의 단점을 보완하거나 대체하기 위한 접근법으로 법과학 영역에서도 NGS 기술을 이용한 STR을 분석하고자 하는 시도가 있어왔고, 본 발명자들도 NGS 분석법에 최적화된 멀티플렉스 PCR 시스템을 구축하여 혼합시료 분석에 적용한 연구 결과를 보고한 바 있다. NGS 분석법은 STR 영역에서 나타나는 길이 변이와 염기서열 변이를 동시에 분석할 수 있고, NGS 장비에서 한 번에 읽을 수 있는 염기서열의 길이 한도 내에서 증폭산물의 크기를 중첩하여 배치할 수 있기 때문에 작은 크기의 증폭산물을 생성할 수 있는 장점이 있으므로, NGS 분석법에 최적화된 확장 상염색체 STR 분석 체계를 선도적으로 개발하고 그 효용성을 평가해 보는 것이 필요한 상황이다.
이에 본 발명에서는 NGS 분석법에 최적화된 확장 상염색체 STR 증폭용 멀티플렉스 PCR 시스템을 구축하여 한국인에서 관찰되는 확장 상염색체 STR의 반복단위 내부 및 주변 영역의 염기서열 변이를 조사하여 집단유전학적 자료를 제시하고자 하였다.
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조로 삽입되어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된다.
본 발명자들은 현재 법의학적 유전자 분석 방법에 활용되는 NGS (next generation sequencing) 기술을 이용하여, NGS를 이용한 STR 유전자형 분석방법 및 이에 최적화된 확장 상염색체 STR 증폭용 멀티플렉스 PCR 시스템을 개발하고자 예의 연구 노력하였다. 그 결과, 25개 STR 마커의 NGS 자료의 분석을 통해 STR 대립유전자형, 대립유전자의 반복구조, 염기서열변이를 분석하여 인간 객체(human subject)의 상염색체를 정확하고 효과적으로 분석하는 방법을 고안하였다. 특히, 본 발명자들은 2단계 PCR로 이루어진 NGS 라이브러리 생성기법으로 NGS 라이브러리 생성과정을 간소화하였으며, 각 마커 증폭에 최적화된 프라이머 조합 및 프라이머 농도 조절을 통하여 NGS run 결과에서 각 마커별로 비교적 고른 coverage를 얻을 수 있음을 확인함으로써 본 발명을 완성하게 되었다.
따라서, 본 발명의 목적은 NGS 기반(next generation sequencing-based) 인간 객체(human subject)의 상염색체 STR (short tandem repeat) 분석방법을 제공하는 데 있다.
본 발명의 다른 목적은 NGS 기반(next generation sequencing-based) 확장 상염색체 STR (short tandem repeat) 분석용 멀티플렉스 유전자 증폭 키트를 제공하는 데 있다.
본 발명의 다른 목적 및 이점은 하기의 발명의 상세한 설명, 청구범위 및 도면에 의해 보다 명확하게 된다.
본 발명의 일 양태에 따르면, 본 발명은 다음의 단계를 포함하는 NGS 기반(next generation sequencing-based) 인간 객체(human subject)의 상염색체 STR (short tandem repeat) 분석방법을 제공한다:
(a) 인간 객체 DNA 시료의 아멜로제닌(amelogenin), TPOX (Human thyroid peroxidase gene), TH01 (Human thyroid peroxidase gene), CSF1PO (Human c-fms proto-oncogene for CSF-1 receptor gene), D8S1179, D5S818, vWA (von Willebrand factor A), D21S11, D18S51, D3S1358, D13S317, FGA (Human fibrinogen alpha chain), D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, D2S441, D12S391, D22S1045, D1S1656, D10S1248, D6S1043 및 DYS391의 유전좌위에 상보적으로 결합하는 각각의 프라이머를 이용하여 증폭을 실시하는 단계; 및
(b) 상기 단계(a)의 멀티플렉스 증폭 산물을 이용하여 상기 유전좌위의 대립유전자형을 결정하여, 상기 인간 객체를 유전자로 감식하는 단계.
를 포함하는 멀티플렉스 유전자 증폭을 이용한 분석대상의 인간 객체의 유전자 감식 방법.
본 발명자들은 NGS를 이용한 STR 유전자형 분석방법 및 이에 최적화된 확장 상염색체 STR 증폭용 멀티플렉스 PCR 시스템을 개발하고자 예의 연구 노력한 결과, 25개 STR 마커의 NGS 자료의 분석을 통해 STR 대립유전자형, 대립유전자의 반복구조, 염기서열변이를 분석하여 인간 객체(human subject)의 상염색체를 정확하고 효과적으로 분석하는 방법을 고안하였다. 특히, 2단계 PCR로 이루어진 NGS 라이브러리 생성기법으로 NGS 라이브러리 생성과정을 간소화하였으며, 각 마커 증폭에 최적화된 프라이머 조합 및 프라이머 농도 조절을 통하여 NGS run 결과에서 각 마커별로 비교적 고른 coverage를 얻을 수 있음을 확인하였다.
보다 상세하게는, 본 발명에서는 최근 확장된 20개 상염색체 Short tandem repeat (STR)을 포함한 법과학 마커를 동시에 분석할 수 있는 차세대 염기서열분석(next generation sequencing; NGS)법을 구축하고자 총 25개 법과학 마커(Amelogenin, TPOX, TH01, CSF1PO, D8S1179, D5S818, vWA, D21S11, D18S51, D3S1358, D13S317, FGA, D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, D2S441, D12S391, D22S1045, D1S1656, D10S1248, D6S1043 및 DYS391)를 대상으로 77 bp ~ 217 bp 크기의 증폭산물을 생성하는 새로운 멀티플렉스 PCR 시스템을 구축하였다. 또한 2단계 PCR로 이루어진 NGS 라이브러리 생성기법으로 NGS 라이브러리 생성과정을 간소화하였다. 각 마커 증폭에 최적화된 프라이머 조합의 선정과 프라이머 농도 조절을 통하여 NGS run 결과에서 각 마커별로 비교적 고른 coverage를 얻을 수 있었으며, NGS 자료 분석을 수행하여 각 STR 유전자의 대립유전자형을 결정하여 기존의 CE 결과와 비교한 결과 일부 D2S441 9 allele의 유전자형에서만 차이가 나타나는 것을 확인하였다. 한편, 새로 구축된 멀티플렉스 PCR 시스템과 PCR 기반의 NGS 라이브러리 생성기법을 이용하여 한국인 시료를 대상으로 NGS를 수행하여 160개 시료에 대한 NGS 자료를 확보하였으며, STR 반복단위 내부와 주변 영역에서 관찰된 염기서열을 조사하여 집단유전학적 통계량을 산출한 결과 NGS 분석법으로 얻은 세분화된 STR 유전자형은 CE 분석법 보다 많은 정보를 제공하여 STR의 식별력을 증대시킴을 확인할 수 있었다.
본 명세서에서, 용어 'STR'은 인간 게놈(genome) 내의 어떤 형질 등의 유전정보를 담고 있지 않은 인트론(intron) 내에 널리 분포한 것으로 알려진 반복염기서열(tandem repeat sequence)로서 유전자 감정의 마커(marker)로서 범세계적으로 유용하게 사용되고 있다. 인간의 게놈에서 많은 유전좌위가 다형성의 STR 부위를 함유하고 있다. STR 좌위는 길이가 2 내지 7개의 염기쌍인 짧은 반복 서열 요소로 구성되어 있는데, 인간의 게놈에는 매 15 kb마다 한 번씩, 2백 만개의 삼량체 및 사량체 STR이 존재하는 것으로 추정된다. 특정 좌위에서의 짧은 반복 배열 단위의 수가 변함에 따라, 이 좌위에서의 DNA 길이가 각 대립 형질(allele) 및 각 개인에 따라 변하게 된다. STR 좌위는 이 반복 배열의 측부에 동정되어 있는 특정 프라이머 서열을 이용하여 폴리머라제 연쇄 반응법(PCR)을 통해 증폭시킬 수 있다.
본 발명의 분석대상인 DNA 시료는 혈액, 정액, 질 세포, 모발, 타액, 소변, 구강세포, 태반세포 또는 태아세포를 포함하는 양수 및 이의 혼합물을 포함하는 군으로부터 선택되는 조직으로부터 분리된 DNA 시료이며, 이에 한정되지 않는다.
상기 DNA 시료는 DNA를 포함하는 생물학적 시료(biological sample)이다. 한편, 상기 DNA 시료는 단일-소스(single-source) 시료 또는 2 이상 소스의 혼합 시료(mixture)로 구성될 수 있다. 상기 DNA 시료는 당업계에 공지된 통상적인 방법을 통해 수득할 수 있다. 예컨대, 상기 조직에 DNA 용해 완충액(예컨대, tris-HCl, EDTA, EGTA, SDS, 디옥시콜레이트(deoxycholate), 및 트리톤X (tritonX) 및/또는 NP-40을 포함)를 처리하여 DNA를 분리한다.
본 발명의 방법에는 생물학적 시료에서 분리된 DNA를 적용할 수 있지만. 상기 생물학적 시료를 직접 이용하여 핵산분자가 관여하는 직접 PCR(Direct Polymerase Chain Reaction)을 실시할 수도 있다(대한민국 등록특허 10-0746372 참조).
상기 유전좌위 중 아멜로제닌 유전좌위는 인간의 성별을 식별하기 위하여 사용되는 성염색체 상의 유전좌위이다. 아멜로제닌 좌위는 남성 DNA에 존재하는 Y 염색체 상의 좌위를 확인하는 경우 HUMAMELY로서 여성 DNA에 존재하는 X 염색체 상의 좌위를 확인하는 경우 HUMAMELX로서 확인된다.
이하, 본 발명의 유전자 감식 방법에 대하여 단계별로 상세하게 설명한다:
단계 (a): 멀티플렉스 증폭 단계
우선, 분석대상인 DNA 시료의 아멜로제닌, TPOX, TH01, CSF1PO, D8S1179, D5S818, vWA, D21S11, D18S51, D3S1358, D13S317, FGA, D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, D2S441, D12S391, D22S1045, D1S1656, D10S1248, D6S1043 및 DYS391 유전좌위에 결합하는 각각의 프라이머를 이용하여 멀티플렉스 증폭을 실시한다.
본 명세서에 기술된 용어“증폭”은 핵산 분자를 증폭하는 반응을 의미한다. 다양한 증폭 반응들이 당업계에 보고 되어 있으며, 이는 중합효소 연쇄반응(이하 PCR이라 한다)(미국 특허 제4,683,195, 4,683,202, 및 4,800,159호), 역전사-중합효소 연쇄반응(이하 RT-PCR로 표기한다)(Sambrook 등, Molecular Cloning. A Laboratory Manual, 3rd ed. Cold Spring Harbor Press(2001)), Miller, H. I.(WO 89/06700) 및 Davey, C. 등(EP 329,822)의 방법, 리가아제 연쇄 반응(ligase chain reaction; LCR)(17, 18), Gap-LCR(WO 90/01069), 복구 연쇄 반응(repair chain reaction; EP 439,182), 전사-중재 증폭(transcription-mediated amplification; TMA)(19) (WO 88/10315), 자가 유지 염기서열 복제(self sustained sequence replication)(20)(WO 90/06995), 타깃 폴리뉴클레오티드 염기서열의 선택적 증폭(selective amplification of target polynucleotide sequences)(미국 특허 제6,410,276호), 컨센서스 서열 프라이밍 중합효소 연쇄 반응(consensus sequence primed polymerase chain reaction; CP-PCR)(미국 특허 제4,437,975호), 임의적 프라이밍 중합효소 연쇄 반응(arbitrarily primed polymerase chain reaction; AP-PCR)(미국 특허 제5,413,909호 및 제5,861,245호), 핵산 염기서열 기반 증폭(nucleic acid sequence based amplification; NASBA)(미국 특허 제5,130,238호, 제5,409,818호, 제5,554,517호, 및 제6,063,603호), 가닥 치환 증폭(strand displacement amplification) 및 고리-중재 항온성 증폭(loop-mediated isothermal amplification; LAMP)을 포함하나, 이에 한정되지는 않는다. 사용 가능한 다른 증폭 방법들은 미국특허 제5,242,794, 5,494,810, 4,988,617호 및 미국 특허 제09/854,317호에 기술되어 있다.
PCR은 가장 잘 알려진 핵산 증폭 방법으로, 그의 많은 변형과 응용들이 개발되어 있다. 예를 들어, PCR의 특이성 또는 민감성을 증진시키기 위해 전통적인 PCR 절차를 변형시켜 터치다운(touchdown) PCR, 핫 스타트(hot start) PCR, 네스티드(nested) PCR 및 부스터(booster) PCR이 개발되었다. 또한, 멀티플렉스(multiplex) PCR, 인덱싱(indexing) PCR, 실시간(real-time) PCR, 분별 디스플레이 PCR(differential display PCR, D-PCR), cDNA 말단의 신속 증폭(rapid amplification of cDNA ends, RACE), 인버스 PCR (inverse polymerase chain reaction: IPCR), 벡토레트(vectorette) PCR, 및 TAIL-PCR(thermal asymmetric interlaced PCR)이 특정한 응용을 위해 개발되었다. PCR에 대한 자세한 내용은 McPherson, M.J., 및 Moller, S.G. PCR. BIOS Scientific Publishers, Springer-Verlag New York Berlin Heidelberg, N.Y. (2000)에 기재되어 있으며, 그의 교시사항은 본 명세서에 참조로 삽입된다. 인덱싱(indexing PCR)은 Nextera®sample preparation kit (Illumina Inc., SanDiego, CA, USA)에서 사용되는 인덱스 프라이머 정보와 PCR 방법을 차용하여 DNA를 바코딩하는 방법이다 (도 2 참조).
본 발명의 일 구현예에 따르면, 본 발명에서 상기 멀티플렉스 증폭은 멀티플렉스 PCR(Polymerase Chain Reaction) 증폭, 또는 직접(direct) 멀티플렉스 PCR 증폭이다.
본 발명은 상기 DNA 시료의 아멜로제닌, TPOX, TH01, CSF1PO, D8S1179, D5S818, vWA, D21S11, D18S51, D3S1358, D13S317, FGA, D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, D2S441, D12S391, D22S1045, D1S1656, D10S1248, D6S1043 및 DYS391 유전좌위에 상보적으로 결합하는 각각의 프라이머를 이용하여 멀티플렉스 증폭을 실시한다.
본 발명에서 사용되는 프라이머는 형광염료 또는 별도의 어댑터 서열이 부착되어 사용될 수 있다. 본 발명의 일 구현예에 따르면, 본 발명에서 사용되는 프라이머는 어댑터(adaptor)를 부착한 프라이머이다. 프라이머 서열에 어댑터(adapter)를 부착한 프라이머를 사용하면, DNA 단편에 효소반응으로 어댑터를 붙이는 복잡한 기존의 방법을 한 번의 PCR 과정으로 간소화 할 수 있다. 본 발명자들은 표 1의 '프라이머 서열 + 어댑터 서열'로 구성된 프라이머 세트를 준비하여 각각의 PCR 증폭산물을 생성하도록 하였으며, PCR로 증폭되는 타겟 부위의 크기는 최종적으로 77 bp - 217 bp가 되도록 설계하였다(도 1 참조). 또한, 상기 프라이머는 (ⅰ) 프라이머 서열이 STR 반복 부위(repeat region)와 중첩(overlapping)되지 않거나; (ⅱ) 프라이머 결합부위(binding area)에 1% 이상 빈도의 단일염기다형성(single nucleotide polymorphism, SNP)이 존재하지 않도록 설계하였다.
본 발명에서는 상기 프라이머 세트를 이용하여 2단계 PCR을 통해 NGS 분석을 위한 라이브러리(library)를 제작한다. 본 발명의 일 구현예에 따르면, NGS 라이브러리는 상기 단계 (a)에서 생성되며 다음의 2단계 멀티플렉스 증폭으로 실시된다:
(a-1) 인간 객체 DNA 시료의 아멜로제닌, TPOX, TH01, CSF1PO, D8S1179, D5S818, vWA, D21S11, D18S51, D3S1358, D13S317, FGA, D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, D2S441, D12S391, D22S1045, D1S1656, D10S1248, D6S1043, 및 DYS391 유전좌위에 상보적으로 결합하는 각각의 프라이머를 이용하여 1차 멀티플렉스 PCR 증폭을 실시하는 단계; 및
(a-2) 상기 1차 멀리플렉스 증폭의 생성물 및 상기 프라이머를 이용하여 2차 인덱싱 PCR 증폭을 실시하는 단계.
상기 단계 (a-1)의 멀티플렉스 유전자 증폭은 55-63℃의 어닐링(annealing) 온도 조건을 갖고, 본 발명의 다른 구현예에 따르면, 상기 멀티플렉스 PCR 증폭은 57-61℃의 어닐링 온도 조건을 가지며, 본 발명의 특정 구현예에 따르면, 상기 멀티플렉스 PCR 증폭은 59℃의 어닐링 온도 조건을 갖는다. 상기 단계 (a-1)의 멀티플렉스 PCR 증폭은 PCR을 실시하는 데 적정한 싸이클 수가 요구된다. 본 발명의 일 구현예에 따르면, 상기 멀티플렉스 PCR 증폭은 27-31 싸이클, 28-30 싸이클 또는 29 싸이클로 실시한다. 한편, 단계 (a-1)의 멀티플렉스 PCR 증폭에 사용되는 프라이머 최종 농도는 표 1과 같다.
상기 단계 (a-2)의 인덱싱 PCR 증폭은 55-63℃의 어닐링(annealing) 온도 조건을 갖고, 본 발명의 다른 구현예에 따르면, 상기 인덱싱 PCR 증폭은 57-61℃의 어닐링 온도 조건을 가지며, 본 발명의 특정 구현예에 따르면, 상기 인덱싱 PCR 증폭은 59℃의 어닐링 온도 조건을 갖는다. 상기 단계 (a-2)의 인덱싱 PCR 증폭은 PCR을 실시하는 데 적정한 싸이클 수가 요구된다. 본 발명의 일 구현예에 따르면, 상기 인덱싱 PCR 증폭은 13-17 싸이클, 14-16 싸이클 또는 15 싸이클로 실시한다.
본 발명의 일 구현예에 따르면, 상기 단계 (a)의 상기 아멜로제닌 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제1서열 및 제2서열이고; 상기 TPOX 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제3서열 및 제4서열이며; 상기 TH01 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제5서열 및 제6서열이고; 상기 CSF1PO 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제7서열 및 제8서열이며; 상기 D8S1179 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제9서열 및 제10서열이고; 상기 D5S818 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제11서열 및 제12서열이며; 상기 vWA 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제13서열 및 제14서열이고; 상기 D21S11 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제15서열 및 제16서열이며; 상기 D18S51 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제17서열 및 제18서열이고; 상기 D3S1358 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제19서열 및 제20서열이며; 상기 D13S317 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제21서열 및 제22서열이고, 상기 FGA 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제23서열 및 제24서열이며; 상기 D16S539 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제25서열 및 제26서열이고; 상기 D7S820 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제27서열 및 제28서열이며; 상기 D2S1338 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제29서열 및 제30서열이고; 상기 D19S433 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제31서열 및 제32서열이며; 상기 Penta D 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제33서열 및 제34서열이며; 상기 Penta E 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제35서열 및 제36서열이며; 상기 DYS391 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제37서열 및 제38서열이며; 상기 D2S441 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제39서열 및 제40서열이며; 상기 D12S391 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제41서열 및 제42서열이며; 상기 D22S1045유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제43서열 및 제44서열이며; 상기 D1S1656 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제45서열 및 제46서열이며; 상기 D10S1248 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제47서열 및 제48서열이며; 상기 D6S1043 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제49서열 및 제50서열이다.
본 발명의 유전자 감식 방법에 이용되는 프라이머는 피크 균형을 맞추기 위한 최적의 배합비를 갖는다.
본 발명의 일 구현예에 따르면, 상기 단계 (a)의 상기 아멜로제닌 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 갖고, 상기 TPOX 유전좌위에 상보적으로 결합하는 프라이머는 0.01-0.4 μM의 최종농도를 가지며, 상기 TH01 유전좌위에 상보적으로 결합하는 프라이머는 0.01-0.4 μM의 최종농도를 갖고, 상기 CSF1PO 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 가지며, 상기 D8S1179 유전좌위에 상보적으로 결합하는 프라이머는 0.8-1.2 μM의 최종농도를 갖고, 상기 D5S818 유전좌위에 상보적으로 결합하는 프라이머는 0.2-0.6 μM의 최종농도를 갖고; 상기 vWA 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D21S11 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 갖고; 상기 D18S51 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 가지며; 상기 D3S1358 유전좌위에 상보적으로 결합하는 프라이머는 0.1-0.5 μM의 최종농도를 갖고; 상기 D13S317유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 FGA 유전좌위에 상보적으로 결합하는 프라이머는 1.8-2.2 μM의 최종농도를 갖고; 상기 D16S539 유전좌위에 상보적으로 결합하는 프라이머는 0.02-0.42 μM의 최종농도를 가지며; 상기 D7S820 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 갖고; 상기 D2S1338 유전좌위에 상보적으로 결합하는 프라이머는 0.6-1.0 μM의 최종농도를 가지며; 상기 D19S433 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 가지며, 상기 Penta D 유전좌위에 상보적으로 결합하는 프라이머는 1.8-2.2 μM의 최종농도를 가지며; 상기 Penta E 유전좌위에 상보적으로 결합하는 프라이머는 1.3-1.7 μM의 최종농도를 가지며; 상기 DYS391 유전좌위에 상보적으로 결합하는 프라이머는 1.0-1.4 μM의 최종농도를 가지며; 상기 D2S441 유전좌위에 상보적으로 결합하는 프라이머는 0.4-0.8 μM의 최종농도를 가지며; 상기 D12S391 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D22S1045 유전좌위에 상보적으로 결합하는 프라이머는 1.3-1.7 μM의 최종농도를 가지며; 상기 D1S1656 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D10S1248 유전좌위에 상보적으로 결합하는 프라이머는 0.25-0.65 μM의 최종농도를 가지며; 상기 D6S1043 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 가진다.
본 발명의 다른 구현예에 따르면, 본 발명의 다른 구현예에 따르면, 상기 단계 (a)의 상기 아멜로제닌 유전좌위에 상보적으로 결합하는 프라이머는 0.4-0.6 μM의 최종농도를 갖고, 상기 TPOX 유전좌위에 상보적으로 결합하는 프라이머는 0.1-0.3 μM의 최종농도를 가지며, 상기 TH01 유전좌위에 상보적으로 결합하는 프라이머는 0.1-0.3 μM의 최종농도를 갖고, 상기 CSF1PO 유전좌위에 상보적으로 결합하는 프라이머는 0.8-1.0 μM의 최종농도를 가지며, 상기 D8S1179 유전좌위에 상보적으로 결합하는 프라이머는 0.9-1.1 μM의 최종농도를 갖고, 상기 D5S818 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.5 μM의 최종농도를 갖고; 상기 vWA 유전좌위에 상보적으로 결합하는 프라이머는 0.6-0.8 μM의 최종농도를 가지며; 상기 D21S11 유전좌위에 상보적으로 결합하는 프라이머는 0.4-0.6 μM의 최종농도를 갖고; 상기 D18S51 유전좌위에 상보적으로 결합하는 프라이머는 0.8-1.0 μM의 최종농도를 가지며; 상기 D3S1358 유전좌위에 상보적으로 결합하는 프라이머는 0.2-0.4 μM의 최종농도를 갖고; 상기 D13S317유전좌위에 상보적으로 결합하는 프라이머는 0.6-0.8 μM의 최종농도를 가지며; 상기 FGA 유전좌위에 상보적으로 결합하는 프라이머는 1.9-2.1 μM의 최종농도를 갖고; 상기 D16S539 유전좌위에 상보적으로 결합하는 프라이머는 0.12-0.32 μM의 최종농도를 가지며; 상기 D7S820 유전좌위에 상보적으로 결합하는 프라이머는 0.8-1.0 μM의 최종농도를 갖고; 상기 D2S1338 유전좌위에 상보적으로 결합하는 프라이머는 0.7-0.9 μM의 최종농도를 가지며; 상기 D19S433 유전좌위에 상보적으로 결합하는 프라이머는 0.4-0.6 μM의 최종농도를 가지며, 상기 Penta D 유전좌위에 상보적으로 결합하는 프라이머는 1.9-2.1 μM의 최종농도를 가지며; 상기 Penta E 유전좌위에 상보적으로 결합하는 프라이머는 1.4-1.6 μM의 최종농도를 가지며; 상기 DYS391 유전좌위에 상보적으로 결합하는 프라이머는 1.1-1.3 μM의 최종농도를 가지며; 상기 D2S441 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.7 μM의 최종농도를 가지며; 상기 D12S391 유전좌위에 상보적으로 결합하는 프라이머는 0.6-0.8 μM의 최종농도를 가지며; 상기 D22S1045 유전좌위에 상보적으로 결합하는 프라이머는 1.4-1.6 μM의 최종농도를 가지며; 상기 D1S1656 유전좌위에 상보적으로 결합하는 프라이머는 0.6-0.8 μM의 최종농도를 가지며; 상기 D10S1248 유전좌위에 상보적으로 결합하는 프라이머는 0.35-0.55 μM의 최종농도를 가지며; 상기 D6S1043 유전좌위에 상보적으로 결합하는 프라이머는 0.4-0.6 μM의 최종농도를 가진다.
상기 단계 (a)에서 프라이머를 이용하여 생성된 라이브러리를 정제한 후 NGS 분석을 실시한다.
단계 (b): 유전자 감식 단계
이어, 상기 단계 (a)의 멀티플렉스 증폭 산물을 이용하여 상기 유전좌위의 대립유전자형을 결정하여, 상기 인간 객체를 유전자로 감식한다.
본 발명의 일 구현예에 따르면, 상기 멀티플렉스 증폭 산물에서 증폭된 각각의 STR 대립유전자의 염기서열을 레퍼런스 서열(reference sequence)과 비교/평가하여 실시하며, 상기 STR 대립유전자에서의 coverage 값으로서 각 STR 유전좌에서의 대립유전자형을 결정한다.
상기 비교/평가는 STR 대립유전자의 염기서열을 레퍼런스 서열(reference sequence)과 얼라인(alignment)하여 각 STR 대립유전자에서의 coverage 값을 산출하는 단계를 포함한다.
본 발명에서 레퍼런스 서열(reference sequence)은 본 발명에서 사용한 25개 마커에 대한 정보로서, STRbase (http://www.cstl.nist.gov/biotech/strbase)로부터 현재까지 알려진 STR 대립유전자의 반복단위와 이들의 서열 정보 및 human genome GRCh37/hg19 서열에 표시된 각 STR의 5´ 및 3´ 주변부 서열 (flanking region sequence) 정보를 수집하여 제작하였다. 기본적으로 하나의 STR은 5' 주변부 서열, STR 영역의 서열, 3' 주변부 서열의 순서로 구성된다. STR 반복단위 주변부 서열의 길이가 500 bp - 550 bp가 되도록 하면서 STR 5´ 주변부 서열, STR 반복단위 영역의 서열, STR 3´ 주변부 서열을 각 대립유전자별로 Microsoft®Excel®의 매크로 기능을 이용하여 조합한다.
본 발명의 일 구현예에 따르면, 상기 레퍼런스 서열은 상기 대립유전자의 STR 영역의 서열, 상기 STR 영역의 5' 주변부 서열 및 상기 STR 영역의 3' 주변부 서열을 포함한다.
본 발명의 상기 레퍼런스 서열은 다양한 반복 횟수의 STR(Short Tandem Repeat)를 갖는 분획들로 구성되므로, 멀티플렉스 증폭 산물의 정확한 크기 및 서열을 분석하여 정확한 대립유전자를 평가하는데 이용된다. 상기 레퍼런스 서열은 상술한 방법 뿐 아니라 당업계에 공지된 통상적인 방법을 통해 수득할 수 있다.
이러한 유전좌위의 대립 형질들은 증폭된 부위 내에 함유되어 있는 대립유전자의 반복구조 또는 염기 서열변이(sequence variation)에 따라 세분화된다. 즉, 본 발명의 분석방법은 NGS 기반 상염색체 STR 분석방법으로서 STR 대립유전자의 유전자형, 반복구조 결정 및 염기서열변이의 관찰이 가능하여, (ⅰ) 한 유전좌에서 서로 다른 시료 간에 다른 반복구조를 보이는 경우, 및 (ⅲ) STR 영역의 반복구조는 같지만, 주변부 서열에서 염기서열변이가 관찰된 경우 등을 관찰할 수 있다. 이러한 경우들은 NGS를 이용한 염기서열 기반의 분석은 기존의 CE를 통해 확인된 STR 대립유전자가 더욱 더 세분될 수 있음을 시사한다.
본 발명의 일 구현예에 따르면, 본 발명의 분석방법은 NGS 분석결과로부터 STR 대립유전자형 외에, 부가적으로 대립유전자의 반복구조 또는 염기 서열변이(sequence variation)를 동정하는 단계를 추가적으로 실시할 수 있다.
본 발명의 상기 멀티플렉스 증폭 산물은 50 bp - 600 bp의 크기를 갖는다. 작은 증폭산물은 극소량의 주형 또는 분해된 시료의 증폭에 유리함을 줄 수 있어 검출 감도를 향상시킨다. 본 발명의 일 구현예에 따르면, 상기 멀티플렉스 증폭 산물은 약 200 bp - 400 bp 범위이다 (도 3 참조).
본 발명의 유전자 감식 방법은 법과학적 타이핑(Forensic typing) 또는 신원확인의 용도를 갖는다.
획득한 자료의 NGS 데이터 분석은 기본적으로 Warshauer 등 [1]이 법과학 영역에서 주로 사용되는 STR 대립유전자형을 결정하기 위해 개발한 STRait Razor 프로그램을 사용하여 NGS 분석 결과를 확인할 수 있으며, 예전 연구에서 사용한 BWA program [2], Bowtie 2 program [3] 및 SAMtools [4]를 이용한 NGS 자료 분석도 병행하여 STR 유전자형과 염기서열 변이를 조사하였다.
각 STR 대립유전자형에 대한 coverage 값은 참조서열 정보에 따라 전체 STR 영역의 서열을 가지고 있는 정렬된 리드 수로 계산하였다. 또한 각 STR 대립유전자에 대한 염기서열을 바탕으로 한 반복단위와 염기서열 변이 확인은 Integrative Genomics Viewer [5] 프로그램을 이용하여 알 수 있다.
한편, 상기 단계 (b) 이후에, 본 발명의 방법에 의해 결정된 STR의 대립유전자형의 정확성을 판단하기 위하여 CE 분석법을 이용한 STR의 대랍유전자형과 비교하는 단계를 추가적으로 실시할 수 있다. 예컨대, Kplex-23 system (BioQuest) 과 Euplex-13 system (BioQuest)를 이용하여 제조사의 지시에 따라 중합효소연쇄반응을 수행 한 후 ABI PRISM®3130xl Genetic Analyzer (Applied Biosystems)를 이용하여 분석가능하다. ABI GeneMapper®ID software version 3.7 (Applied Biosystems)을 이용하여 대립유전자형을 결정하여 CE 분석법으로 얻어진 STR 대립유전자형과 NGS 분석법으로 얻어진 STR 대립유전자형의 결과가 일치하는지 비교하여 판단한다.
본 발명의 또 다른 양태에 따르면, 아멜로제닌(amelogenin), TPOX (Human thyroid peroxidase gene), TH01 (Human thyroid peroxidase gene), CSF1PO (Human c-fms proto-oncogene for CSF-1 receptor gene), D8S1179, D5S818, vWA (von Willebrand factor A), D21S11, D18S51, D3S1358, D13S317, FGA (Human fibrinogen alpha chain), D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, D2S441, D12S391, D22S1045, D1S1656, D10S1248, D6S1043 및 DYS391 유전좌위에 상보적으로 결합하는 각각의 프라이머를 포함하는 NGS 기반(next generation sequencing-based) 확장 상염색체 STR (short tandem repeat) 분석용 멀티플렉스 유전자 증폭 키트를 제공한다.
본 발명의 키트는 상술한 멀티플렉스 유전자 증폭을 이용한 분석대상의 인간 객체(human subject)의 상염색체 STR 분석 방법을 이용하기 때문에, 이 둘 사이에 공통된 내용은 본 명세서의 과도한 복잡성을 피하기 위하여, 그 기재를 생략한다.
본 발명의 특징 및 이점을 요약하면 다음과 같다:
(a) 본 발명은 20개 이상의 global STR 유전자형을 동시에 분석할 수 있는 NGS 기반(next generation sequencing-based) 인간 객체(human subject)의 상염색체 STR 분석방법 및 이에 최적화된 멀티플렉스 PCR 시스템을 제공한다.
(b) 특히, NGS분석에서 가장 복잡하고 시간이 많이 소요되는 NGS라이브러리 생성단계를 2단계로 간소화 하였고, 프라이머의 구성과 농도를 최적화하여 균일한 read count를 얻을 수 있다.
(c) 본 연구에서 구축된 멀티플렉스 PCR 시스템과 PCR 기반의 NGS 라이브러리 생성기법을 이용한 법과학 마커의 분석법은 법과학 실무에서 현재의 CE 기반의 STR 분석법으로 분석에 어려움이 따르는 시료의 분석에 유용하게 적용될 수 있다.
도 1은 새롭게 구축된 멀티플렉스 PCR 시스템에 포함된 25개 법과학 마커의 증폭산물 크기 분포를 나타낸다.
도 2는 2단계 PCR로 생성되는 NGS 라이브러리를 나타낸다.
도 3은 Bioanalyzer에서 확인한 25개 법과학 마커에 대한 NGS 라이브러리의 모식도이다.
도 4는 NGS 자료 분석에서 관찰된 25개 법과학 마커별 coverage의 상대적 비교자료이다. 본 발명의 분석방법은 프라이머의 구성과 농도를 최적화하여 고른 read count를 얻을 수 있다는 장점이 있다. 일반적으로 가장 작은 read count 대비 가장 큰 read count 는 약 5배 정도 차이가 나지만, 본 발명에서는 가장 작은 read count 2.33 대비 가장 큰 read count 7.65 였고, 따라서 약 3배 정도로 균일한 read count를 얻을 수 있었다.
도 5는 단일시료에서 STR 대립유전자형을 결정하기 위한 20%의 threshold 적용 예를 나타낸다.
도 6은 본 연구에서 수행된 NGS 자료 분석의 순서도를 나타낸다.
도 7은 Kplex-23 system을 이용한 CE 분석 결과의 예를 나타낸다.
도 8은 Euplex-13 system을 이용한 CE 분석 결과의 예를 나타낸다.
도 9는 D2S441에서 확인한 CE와 NGS 결과의 차이를 나타낸다.
도 10는 D1S1656의 반복단위 주변 영역에서 확인된 염기서열 변이를 나타낸다.
도 11은 D5S818의 반복단위 주변 영역에서 확인된 염기서열 변이를 나타낸다.
도 12는 D7S820의 반복단위 주변 영역에서 확인된 염기서열 변이를 나타낸다.
도 13은 D13S317의 반복단위 주변 영역에서 확인된 염기서열 변이를 나타낸다.
도 14는 D16S539의 반복단위 주변 영역에서 확인된 염기서열 변이를 나타낸다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 당업계에서 통상의 지식을 가진 자에 있어서 자명할 것이다.
실시예
연구방법 및 결과
1. 한국인 시료의 추출 및 정량
DNA 시료는 혈연관계가 없는 한국인 160 명을 표본으로 무작위로 선정하고, 이들로부터 멸균된 면봉으로 구강 내 협점막을 5-6회 긁어 상피세포를 채취하였다. 시료는 QIAamp®DNA Mini Kit (Qiagen)을 이용하여 제조사의 지시에 따라 DNA를 추출하였다. 추출된 DNA 시료는 NanoDrop 1000 spectrophotometer (Thermo Fisher scientific)를 이용하여 정량을 측정한 후 최종농도 1 ng/μl가 되도록 하여 준비하였다. 본 연구과제의 내용은 연세대학교 세브란스 병원의 기관생명윤리위원회의 심의를 받았다.
2. 분석 대상 STR marker의 선정
본 연구에서의 분석 대상 STR은 미국의 Core Loci Working Group에서 확장하는 것을 권고하는 20개 STR(TPOX, TH01, CSF1PO, D8S1179, D5S818, vWA, D21S11, D18S51, D3S1358, D13S317, FGA, D16S539, D7S820, D2S1338, D19S433, D2S441, D12S391, D22S1045, D1S1656, D10S1248)을 기본적으로 포함하도록 선정하였다(Forensic Science International: Genetics, Volume 17, Pages 33-34, 2015). 이들 마커에 법유전학 검사에서 흔히 분석되는 5개 마커 (Amelogenin, Penta D, Penta E, D6S1043 및 DYS391)를 추가하여 총 25개를 분석 대상으로 하였다. 연구 대상 STR의 대립유전자에 대한 정보는 STRBase (http://www.cstl.nist.gov/biotech/strbase)를 참고하였다.
3. NGS 분석에 최적화 된 새로운 확장된 멀티플렉스 PCR 시스템 구축
기본적으로 전년도에 구축된 18개 상염색체 마커 분석용 멀티플렉스 PCR 시스템의 효율성을 증대하기 위하여 일부 프라이머를 교체한 후 새로운 마커를 추가하여 멀티플렉스 PCR 시스템을 구축하였다. 새로 추가된 마커에 대한 DNA 염기서열 정보는 UCSC genome browser (http://genome. ucsc.edu/)에서 수집하였다. 각 마커를 증폭하기 위한 PCR 프라이머는 수집된 염기서열 정보를 바탕으로 Primer3 (http://frodo.wi.mit.edu/primer3 /input.htm) 상에 내정된 조건을 기본적으로 충족하면서, 증폭산물의 크기는 최종적으로 77 bp - 217 bp가 되도록 설계하였다(도 1 그림 4-2). 프라이머는 STR 반복단위와 중첩되는 않는 범위에서 STR 반복단위에 가장 근접하고, 프라이머 부착부위에 1% 이상 빈도의 단일염기다형성(single nucleotide polymorphism, SNP)이 존재하는 않도록 하였다. Primer3로 설계된 다수의 후보 프라이머를 대상으로 PCR 증폭에서 프라이머 간 간섭이 없는 최적의 프라이머 조합과 전기영동에서 STR 유전좌위 간 peak 높이 균형이 유지되는 프라이머 농도를 결정하였고 이들의 최종 농도는 표 1에 나타내었다.
25개 법과학 마커를 증폭하기 위한 PCR 프라이머의 최종 농도
Locus F/R 최종농도 (μM)
Amelogenin F181-NT1 / R262-NT2 0.50
TPOX F109-NT1 / R198-NT2 0.20
TH01 F117-NT1 / R216-NT2 0.20
CSF1PO F191-NT1 / R295-NT2 0.90
D8S1179 F153-NT1 / R272-NT2 1.00
D5S818 F160-NT1 / R280-NT2 0.40
vWA F078-NT1 / R226-NT2 0.70
D21S11 F161-NT1 / R341-NT2 0.50
D18S51 F197-NT1 / R356-NT2 0.90
D3S1358 F138-NT1 / R266-NT2 0.30
D13S317 F174-NT1 / R284-NT2 0.70
FGA F144-NT1 / R304-NT2 2.00
D16S539 F120-NT1 / R225m-NT2 0.22
D7S820 F171-NT1 / R344-NT2 0.90
D2S1338 F128-NT1 / R273-NT2 0.80
D19S433 F053-NT1 / R203-NT2 0.50
Penta D F092-NT1 / R276-NT2 2.00
Penta E F203-NT1 /R303-NT2 1.50
DYS391 F166-NT1 / R286-NT2 1.20
D2S441 F061-NT1 / R155-NT2 0.60
D12S391 F172-NT1 / R309-NT2 0.70
D22S1045 F065-NT1 / R174-NT2 1.50
D1S1656 F123-NT1 / R277-NT2 0.70
D10S1248 F035-NT1 / R138-NT2 0.45
D6S1043 F117-NT1 / R227-NT2 0.50
4. Nextera indexing PCR 방법을 적용한 라이브러리 생성
기존 TruSeq library preparation kit (Illumina)를 사용하여 라이브러리를 생성하는 방법을 간소화하고자 Nextera XT library preparation kit에서 사용한 indexing PCR 방법을 차용하여 2단계 PCR을 통한 라이브러리 제작법을 구축하였다 (도 2). 이를 위해 기존의 타겟 서열을 증폭하기 위해 고안된 forward, reverse primer의 5‘ 부위에 각각 33 ~ 34 bp의 adapter 서열을 추가한 Nextera primer를 고안하였다 (표 2). 본 어댑터(adapter) 서열에 상보적으로 결합하는 인덱스 프라이머를 사용한 2차 PCR을 수행하여 바코드된 라이브러리를 생성하였다 (도 2 참조).
25개 법과학 마커를 증폭하기 위한 Nextera primer 서열(대문자로 표시한 서열은 어댑터 서열이고, 소문자로 표시한 서열은 STR 특정 서열을 나타냄).
- Locus F/R
1 Amelogenin F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGcctttgaagtggtaccagagcat
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGgcatgcctaatattttcagggaataa
2 TPOX F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGgcacagaacaggcacttagg
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGtccttgtcagcgtttatttgc
3 TH01 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGgattcccattggcctgttc
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGcaggtcacagggaacacaga
4 CSF1PO F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGactgccttcatagatagaagat
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGgaccctgttctaagtacttcct
5 D8S1179 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGggcctggcaacttatatgtattt
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGgattattttcactgtggggaa
6 D5S818 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGtgattttcctctttggtatcctt
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGcaacatttgtatctttatctgtatcct
7 vWA F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGagccctagtggatgataagaa
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGtgataaatacataggatggatgg
8 D21S11 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGaattccccaagtgaattgcc
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGaataggaggtagatagactggat
9 D18S51 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGgttgctactatttcttttctttttctc
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGgccactgcacttcactctga
10 D3S1358 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGcccactgcagtccaatctg
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGatcaacagaggcttgcatgt
11 D13S317 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGtctgacccatctaacgccta
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGagacagaaagatagatagatgattga
12 FGA F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGctgtaaccaaaataaaattaggca
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGtgtctgtaattgccagcaaaa
13 D16S539 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGatacagacagacagacaggtg
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGagcatgtatctatcatccatctc
14 D7S820 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGtgatagaacacttgtcatagtttagaa
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGctcattgacagaattgcacca
15 D2S1338 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGtggaaacagaaatggcttgg
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGagttattcagtaagttaaaggattgc
16 D19S433 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGgcaaaaagctataattgtaccac
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGaaaaatcttctctctttcttcctctc
17 Penta D F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGtggaaggtcgaagctgaagt
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGtgattctctttttttccccttc
18 Penta E F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGggcgactgagcaagactca
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGtggaaagaattctcttatttggg
19 DYS391 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGttcaatcatacacccatatctgtc
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGtgcaagcaattgccatagag
20 D2S441 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGgaactgtggctcatctatgaaaa
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGaagtggctgtggtgttatgat
21 D12S391 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGccagagagaaagaatcaacagg
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGttcctctaataaatcccctctc
22 D22S1045 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGtttccccgatgatagtagtct
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGgatcacgcgaatgtatgattg
23 D1S1656 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGctgtgttgctcaagggtcaa
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGgagaaatagaatcactagggaacca
24 D10S1248 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGaatgaattgaacaaatgagtgagt
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGggaacaactctggttgtattgtct
25 D6S1043 F: TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGcaaggatgggtggatcaatag
R: GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGattgtatgagccacttccca
도 2 에서 ①과 같이 1차 멀티플렉스 PCR 증폭을 위한 혼합물에는 표 1의 최종 농도에 해당하는 프라이머와 1 ng의 주형 DNA 및 5.0 U AmpliTaq Gold DNA Polymerase Applied Biosystems)가 포함되도록 하였고, 2.0 μl의 Gold ST*R 10X Buffer (Promega)를 추가하였다. 혼합물의 최종 부피는 멸균된 3차 증류수로 20 μl가 되도록 맞추어 첨가한 후 잘 섞어 주었다. PCR 전 혼합물은 Veriti®96-Well Thermal Cycler (Applied Biosystems)에 장착하여, 95℃에서 11분간 변성시키고 94℃에서 20초, 59℃에서 1분, 72℃에서 30초의 조건으로 29회 중합반응 후 최종적으로 72℃에서 7분간 반응시킨 후 4℃에 잠시 보관하였다. 생성된 1차 PCR 생성물을 1/100로 멸균된 3차 증류수로 희석한 후에 2차로 indexing PCR 증폭을 수행하였다.
이어 도 2에서 ②과 같이 2차 indexing PCR 증폭을 수행하고자 혼합물에는 Illumina사의 Nextera XT index kit version 2를 사용하여 Index 1, 2 각각 2.0 μl 와 1/100로 희석된 1차 반응생성물 및 2.0 U AmpliTaq Gold DNA Polymerase (Applied Biosystems)가 포함되도록 하였고, 2.0 μl의 Gold ST*R 10X Buffer (Promega)를 추가하였다. 혼합물의 최종 부피는 멸균된 3차 증류수로 20 μl가 되도록 맞추어 첨가한 후 잘 섞어 주었다. Indexing PCR 전 혼합물은 Veriti®96-Well Thermal Cycler (Applied Biosystems)에 장착하여, 95℃에서 15분간 변성시키고 94℃에서 20초, 59℃에서 30초, 72℃에서 30초의 조건으로 15회 중합반응 후 최종적으로 72℃에서 7분간 반응시킨 후 4℃에 잠시 보관하였다.
앞서 선정된 프라이머를 이용하여 인덱싱 PCR 수행 시 프라이머 간 간섭현상이 나타나지 않고 균일하게 증폭산물이 생성되는지 확인하기 위한 방법으로 forward 혹은 reverse index primer 중 하나에 형광을 붙여 증폭한 후 통상의 방법에 따라 ABI PRISM®3130xl Genetic Analyzer (Applied Biosystems)를 이용하여 분석하였다. NGS 분석을 위해 증폭산물을 생성할 때에는 형광이 없는 일반 인덱스 프라이머 사용하였다.
5. 라이브러리의 정제 및 Quality control
각 시료를 대상으로 생성된 NGS 라이브러리를 AMPure Beads (Beckman Coulter)를 사용하여 제조사의 지시대로 정제하였고, 이때 사용되는 bead와 정제할 라이브러리의 비율은 1.2:1 (v/v)로 하였다. 정제된 NGS 라이브러리의 농도는 KAPA Library Quantification kit (KAPA Biosystems)를 이용하여 제조사의 지시에 따라 정량하였다.
생성된 NGS 라이브러리를 10 nM로 희석하여 동량으로 최종 pooling한 후 2100 Bioanalyzer (Agilent Technologies)을 이용하여 NGS 라이브러리 상태를 확인하였다.
6. NGS run 수행
최종 생성된 NGS 라이브러리를 MiSeq Reagent Kit v2 or v3 (Illumina)을 사용하여 Illumina의 MiSeq™ 장비에서 250 bp read, paired-end 방법으로 랩지노믹스(한국)에 의뢰하여 NGS run을 수행하였다.
7. STR 대립유전자형 결정 및 자료 분석
NGS 분석에서 생성되는 대량의 염기서열 정보를 효율적으로 분석하기 위하여 전년도에 제작된 18개 마커에 대한 참조서열(reference sequence) 자료에 새로 추가된 7 마커에 대한 참조서열을 전년도 방법에 따라 추가로 제작하였다. STRbase (http://www.cstl.nist.gov/biotech/strbase)로부터 현재까지 알려진 STR 대립유전자의 반복단위와 이들의 서열 정보 및 human genome GRCh37/hg19 서열에 표시된 각 STR의 5´ 및 3´ 주변부 서열 (flanking region sequence) 정보를 수집하였다. 이들을 바탕으로 어떠한 프라이머 조합을 통해 얻어진 NGS 리드도 참조서열과의 정렬이 가능하도록 STR 반복단위 주변부 서열의 길이가 500-550 bp가 되도록 하면서 STR 5´ 주변부 서열, STR 반복단위 영역의 서열, STR 3´ 주변부 서열을 각 대립유전자별로 Microsoft®Excel®의 매크로 기능을 이용하여 조합하였다.
획득한 자료의 NGS 데이터 분석은 기본적으로 Warshauer 등 [1]이 법과학 영역에서 주로 사용되는 STR 대립유전자형을 결정하기 위해 개발한 STRait Razor 프로그램을 사용하여 NGS 분석 결과를 우선적으로 확인하였으며, 예전 연구에서 사용한 BWA program [2], Bowtie 2 program [3] 및 SAMtools [4]을 이용한 NGS 자료 분석도 병행하여 STR 유전자형과 염기서열 변이를 조사하였다.
각 STR 대립유전자형에 대한 coverage 값은 참조서열 정보에 따라 전체 STR 영역의 서열을 가지고 있는 정렬된 리드 수로 계산하였다. 또한 각 STR 대립유전자에 대한 염기서열을 바탕으로 한 반복단위와 염기서열 변이 확인은 Integrative Genomics Viewer [5] 프로그램을 이용하였다.
NGS 분석법으로 결정된 STR의 대립유전자형을 기존의 CE 분석법을 이용한 STR의 대립유전자형을 비교하기 위하여 Kplex-23 system (BioQuest) 과 Euplex-13 system (BioQuest)를 이용하여 제조사의 지시에 따라 중합효소연쇄반응을 수행 한 후 ABI PRISM®3130xl Genetic Analyzer (Applied Biosystems)를 이용하여 분석하였다. ABI GeneMapper®ID software version 3.7 (Applied Biosystems)을 이용하여 대립유전자형을 결정하여 CE 분석법으로 얻어진 STR 대립유전자형과 NGS 분석법으로 얻어진 STR 대립유전자형의 결과가 일치하는지 비교하였다.
8. 집단유전학적 통계분석
집단유전학적 통계량은 관측이형접합도(observed heterozygosity: Hobs), 기대이형접합도 (expected heterozygosity: Hexp), 개체식별력(power of discrimination: PD), 다형정보력 (polymorphism information content: PIC) 그리고 부권배제력 (power of exclusion: PE)은 PowerStat Excel Template를 이용하여 계산하였다.
연구결과
1. 생성된 NGS 라이브러리의 Q.C 결과
생성된 NGS 라이브러리를 10 nM로 희석하여 동량으로 최종 pooling한 후 Bioanalyzer로 확인한 NGS 라이브러리는 도 3에 나타내었다. 원 증폭산물 크기에 adapter 크기인 130 bp가 더해져 결과적으로 200 bp에서 약 400 bp 사이에서 확인되었으며, 프라이머 dimer 등의 short fragment는 성공적으로 제거되었음을 확인하였다.
2. NGS sequencing 결과
MiSeq™ 장비에서 MiSeq Reagent Kit v3을 사용하여 250 bp, paired-end 방법으로 NGS run 한 결과 Quality score (Q>30)는 평균 84.7%로 나타났고, 192개 sample 기준으로 각 sample 별로 최소 135,936, 최대 498,174, 평균 261,226 리드를 얻을 수 있었다. 평균 리드 수를 바탕으로 계산한 각 마커 별 평균 coverage는 10,449이다.
이러한 자료를 바탕으로 본 연구에서 구축된 25개의 법과학 마커를 대상으로 Illumina사의 sequencing kit에 따라 얻을 수 있는 리드 수를 토대로 각 마커 별 coverage를 10000, 5000, 2000, 1000으로 할당하였을 때 분석 가능한 샘플의 수를 계산해 보면 표 3과 같다.
할당되는 coverage 당 분석 가능한 샘플의 수
locus 당 coverage Miseq reagent ver. 2 Miseq reagent ver. 3
10,000 120 200
5,000 240 400
2,000 600 1000
1,000 1200 2000
* 25개 loci를 분석할 경우
3. 각 STR 유전자 좌 별 coverage 산정
얻어진 자료들을 시료별로 sorting한 후 STRait razor를 통하여 각 마커별 coverage 수를 비교하여 보았다 (도 4). 결과적으로 가장 많은 리드수를 얻은 마커는 D6S1043이였고 가장 적은 리드 수를 얻은 마커는 D5S818였다. 최대 coverage가 최소 coverage의 3배 이내로 모든 25개 법과학 마커에서 NGS 자료를 얻을 수 있었다. 그리고 NGS 자료 분석은 얻어진 Q30이상의 리드를 대상으로 각각 STR 유전자 좌에 따라 나누었으며 각 시료 분석 시 얻어진 coverage를 기반으로 하여 정확하게 STR 유전자형을 결정 할 수 있도록 분석 기준 값은 전년도 결과에서 단일시료 분석 기준인 20%를 그대로 적용하였다 (도 5).
4. NGS 자료 분석을 통한 결과 자료의 해석
분석 대상이 되는 시료로부터 도 6과 같이 NGS 자료 분석 절차를 수행하였다. 우선 CE 분석법을 통한 STR genotyping 자료를 확보하였고, NGS run 후 얻어진 fastq 파일을 STRait Razor를 통해 분석한 후 각 마커에 대한 coverage를 산정하고 유전자형을 결정하였다. 여기서 원래 STRait Razor에 없는 마커의 정보는 새로 추가하여 NGS run에서 나타난 각 마커별 coverage와 유전자형을 비교적 간편하게 확인할 수 있다. 그리고 자체적으로 제작한 참조서열에 NGS run 자료를 BWA나 Bowtie2를 이용하여 mapping하였으며, 이때 얻어진 결과를 바탕으로 STR 반복단위 내부 및 주변 영역에 나타난 염기서열 변이를 IGV로 확인하였다.
5. NGS 분석법으로 얻은 STR 대립유전자형 확인
한국인 160명을 NGS 분석하여 결정된 대립유전자형을 기존의 CE 분석법으로 얻은 대립유전자형과 비교하였다 (도 7 및 도 8). CE 분석은 Kplex-23과 Euplex-13 (BioQuest)을 제조사의 지시대로 이용하여 분석 대상 STR의 대립유전자형을 확보하였다.
결과적으로 CE와 NGS로 얻은 160명의 STR 대립유전자형은 대부분 일치하였지만, 160개 시료 중 16개 시료의 D2S441 9 allele의 유전자형이 일치하지 않음을 확인하였다. 반복단위의 반복수만 검색하는 NGS 분석에서는 도 9와 같이 D2S441에 [TCTA]가 9번 반복되어 allele 9로 명명되지만 5' 부위에 아데닌이 삽입되어 있어 CE 분석에서는 9.1 allele로 명명되어 이러한 차이가 발생하는 것을 확인하였다.
6. STR 반복 구조 내의 염기서열 변이 확인
NGS 분석 결과로부터 STR 대립유전자형은 물론 부가적으로 얻을 수 있는 반복단위 영역 내의 염기서열 변이를 Integrative Genomics Viewer program을 이용하여 확인하였다. 결과적으로 혈연관계가 없는 한국인 시료 160개를 대상으로 염기서열 변이는 D1S1656, D2S441, D2S1338, D3S1358, D6S1043, D7S820, D8S1179, D12S391, D13S317, D21S11 그리고 vWA 에서 관찰되었다. 관찰된 염기서열변이를 NCBI dbSNP database 자료(dbSNP Build 142)를 통해 rs number를 확인하였고 이를 표 4에 나타내었다. 제작된 참조서열과 비교하여 관찰된 염기서열변이에 따라 밝혀진 STR 구조와 빈도를 표 4 - 표 15 에 차례대로 나타내었다.
한국인에서 관찰된 STR 반복단위 내부의 염기서열 변이
STR loci 염기서열변이
D1S1656 rs78443572
D2S441 rs13019438, rs10203882, rs10203882
D2S1338 rs62182233, rs6736805, rs139208613
D3S1358 rs2624663, rs71325067
D6S1043 rs11965429
D7S820 rs151180094
D8S1179 rs13265375, rs111782616
D12S391 rs367976733, rs10845519, rs6488510, rs77312049
D13S317 rs558769523
D21S11 rs13049099, rs200026324, rs13050496
CSF1PO rs566735740
vWA Non-identified SNP(A>G), rs74980505,
Non-identified SNP(G>A), rs112652289, rs216871
D1S1656에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00001
D2S441에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00002
D2S1338에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00003
D3S1358에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00004
D6S1043에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00005
D7S820에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00006
D8S1179에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00007
D13S317에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00008
D21S11에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00009
CSF1PO에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00010
vWA에서 관찰된 대립유전자형의 구조 및 빈도
Figure 112015128872075-pat00011
7. 염기서열 변이가 확인된 STR의 집단유전학적 통계량
CE 분석법과 NGS 분석으로 각각 얻은 대립유전자형의 개수를 표 16에 비교해보았다. 결론적으로 한국인 시료 160개에서 관찰된 대립유전자형 수는 D12S391은 NGS로 분석하였을 때가 CE 분석법을 수행하였을 때보다 약 3.1배 많은 대립유전자형이 관찰되었으며, 그 다음으로는 D2S1338 이였다.
한국인에서 CE와 NGS분석법으로 확인된 대립유전자형(allele) 수의 비교 (n=160)
Figure 112015128872075-pat00012
또한 CE 분석법을 수행하였을 때 관찰된 유전자형(genotype)수와 NGS 분석법을 수행하였을 때 관찰된 유전자형 수를 표 4 내지 표 17에 정리하였다. 결과적으로 한국인 시료 160개에서 관찰된 유전자형 수는 D21S11에서 CE 분석법으로 얻은 유전자형은 32개였고 NGS 분석법으로는 79개로 약 2.5배 많은 유전자형이 관찰되었다.
한국인에서 CE와 NGS분석법으로 확인된 유전자형(genotype) 수의 비교 (n=160)
Figure 112015128872075-pat00013
염기서열변이가 관찰된 12개 loci의 관측이형접합도(observed heterozygosity: Hobs), 기대이형접합도 (expected heterozygosity: Hexp), 개체식별력(power of discrimination: PD), 다형정보력 (polymorphism information content: PIC) 그리고 부권배제력 (power of exclusion: PE)을 산출하여 표 18에 나타내었다.
염기서열 변이가 관찰된 STR의 집단유전학적 통계량
Figure 112015128872075-pat00014
CE 분석법을 이용하였을 때와 NGS 분석법을 이용하였을 때 산출된 집단통계량 중 개체식별력을 비교해 본 결과 D3S1358은 CE에서 0.862, NGS에서 0.920로 +0.058로 가장 많이 증가했음을 확인하였다. 반면, D6S1043에서 CE 및 NGS 분석법으로 산출한 개체식별력은 달라지지 않음을 확인하였다.
8. STR 반복구조 주변의 염기서열 변이 확인
NGS 분석 결과로부터 STR 대립유전자형은 물론 부가적으로 얻을 수 있는 반복 구조 영역 주변의 염기서열 변이를 확인하였다 (표 19). STR 반복구조 주변의 염기서열 변이는 D1S1656, D5S818, D7S820, D13S317, D16S539에서 관찰되었다. 이들을 제작된 참조서열과 비교하였고 dbSNP Build 142 자료를 통해 확인된 염기서열 변이를 도 10 내지 도 14 에 차례대로 나타내었다.
한국인에서 관찰된 STR 반복단위 주변 영역의 염기서열 변이
STR loci 염기서열변이
D1S1656 rs4847015
D5S818 rs25768, Non-identified SNP (G>T)
D7S820 rs16887642, rs7789995
D13S317 rs9546005
D16S539 rs11642858
결론
본 연구에서는 최근 확장된 상염색체 STR 유전자를 포함하여 총 25개 법과학 마커를 동시에 분석할 수 있는 NGS 분석법을 구축하고, 한국인 시료를 대상으로 NGS 분석을 수행하여 한국인 160개 시료에서 관찰된 확장 상염색체 STR의 반복단위 내부 및 주변 영역의 서열 변이를 조사하여 집단유전학적 자료를 제시하였다.
본 연구에서는 미국의 Core Loci Working Group에서 확장하는 것을 권고하는 20개 STR(TPOX, TH01, CSF1PO, D8S1179, D5S818, vWA, D21S11, D18S51, D3S1358, D13S317, FGA, D16S539, D7S820, D2S1338, D19S433, D2S441, D12S391, D22S1045, D1S1656, D10S1248)과 법유전학 검사에서 흔히 분석되는 5개 마커 (Amelogenin, Penta D, Penta E, D6S1043 및 DYS391)를 추가하여 총 25개 법과학 마커를 대상으로 77 bp - 217 bp로 증폭산물을 동시에 생성할 수 있는 새로운 멀티플렉스 PCR 시스템을 구축하였다. 이러한 작은 크기의 증폭산물은 분해된 시료의 분석에 유용하게 적용될 수 있으며 현재 이용 가능한 대부분의 NGS platform에서 분석될 수 있다.
NGS 분석에서 가장 복잡하고 시간이 많이 소요되는 과정은 NGS 라이브러리 생성단계를 간소화하기 위하여 2단계 PCR로 이루어진 간편 NGS 라이브러리 생성기법을 제시함으로서 법과학 실무자나 연구자가 보다 수월하게 NGS를 수행할 수 있도록 하였다.
각 마커 증폭에 최적화된 프라이머 조합의 선정과 프라이머 농도 조절을 통하여 NGS run 결과에서 각 마커별로 비교적 고른 coverage를 얻을 수 있었으며, NGS 자료 분석을 수행하여 각 STR 유전자의 대립유전자형을 결정하여 기존의 CE 결과와 비교할 수 있었다. 이때 일부 D2S441 9 allele의 유전자형만 일치하지 않았는데, 이것은 D2S441 반복단위 5' 부위에 아데닌이 삽입되어 있어 차이가 발생하는 것을 확인하였다.
새로 구축된 멀티플렉스 PCR 시스템과 PCR 기반의 간편 NGS 라이브러리 생성기법을 사용하여 혈연관계가 없는 한국인 시료를 대상으로 Illuminar의 MiSeq 장비를 이용한 NGS를 수행하여 160개 시료에 대한 NGS 자료를 확보하였으며, STR 반복단위 내부와 주변 영역에서 관찰된 염기서열은 조사하여 집단유전학적 통계량을 산출한 결과 NGS 분석법으로 얻은 세분화된 STR 유전자형은 CE 분석법 보다 많은 정보를 제공하여 STR의 식별력을 증대시킴을 확인할 수 있었다.
본 연구의 주요 연구 결과를 요약하면 다음과 같다.
1. 확장된 20개 상염색체 STR 유전자를 포함하여 총 25개 법과학 마커를 동시에 증폭할 수 있는 멀티플렉스 PCR 시스템을 구축하였다.
2. NGS 라이브러리를 간편하게 생성할 수 있는 PCR 기반의 NGS 라이브러리 생성기법을 제시하였다.
3. NGS 분석에서 각 마커별로 비교적 고른 coverage를 얻었고, NGS와 CE로 분석한 한국인 시료에 대한 유전자형을 비교한 결과 일부 D2S441 9 allele만 차이가 있음을 확인하였다.
4. 160개의 한국인 시료에서 염기서열 변이가 관찰된 STR은 12개이며 D12S391, D2S1338, D21S11에서 다수 나타났다.
5. 한국인에서 관찰된 STR 염기서열 변이의 특징을 조사하였고, NGS로 분석된 세분화된 STR 유전자형을 바탕으로 집단유전학적 통계량을 산출하여 제시하였다.
결론적으로 NGS 기반의 STR 분석은 기존 CE 분석에 비해 보다 세분화된 STR 대립유전자 정보를 제공할 수 있음으로 법과학 실무에서 현재의 CE 기반의 STR 분석법으로 분석에 어려움이 따르는 시료의 분석에 유용하게 적용될 수 있을 것이다. 또한 NGS 분석 비용은 기존 CE 분석법에 소요되는 비용 수준으로 꾸준히 감소되고 있어 본 연구에서 구축된 방법과 결과를 법과학 실무에 적용한다면 국내 법과학 실무 발전과 법과학 연구 역량 증대에 기여할 수 있을 것으로 사료된다.
이상으로 본 발명의 특정한 부분을 상세히 기술하였는바, 당업계의 통상의 지식을 가진 자에게 있어서 이러한 구체적인 기술은 단지 바람직한 구현예일 뿐이며, 이에 본 발명의 범위가 제한되는 것이 아닌 점은 명백하다. 따라서 본 발명의 실질적인 범위는 첨부된 청구항과 그의 등가물에 의하여 정의된다고 할 것이다.
참고문헌
1. Warshauer DH, Lin D, Hari K, Jain R, Davis C, Larue B, et al. STRait Razor: A length-based forensic STR allele-calling tool for use with second generation sequencing data. Forensic Sci Int Genet. 2013;7:409-17.
2. Li H1, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 2009;25(14):1754-60.
3. Langmead B, Salzberg SL. Fast gapped-read alignment with Bowtie 2. Nat Methods. 2012;9:357-9.
4. Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R; 1000 Genome Project Data Processing Subgroup. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 2009;25:2078-9.
5. Robinson JT, ThorvaldsdoH, Winckler W, Guttman M, Lander ES, Getz G, et al. Integrative Genomics Viewer. Nature Biotechnology. 2011;29:246.
<110> Republic Of Korea (Supreme Public Prosecutor's Office) <120> Method for Extended Autosomal STR Analysing Human Subject of Analytes using a Next Generation Sequencing Technology <130> PN150330 <160> 50 <170> KoPatentIn 3.0 <210> 1 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Amelogenin F primer <400> 1 tcgtcggcag cgtcagatgt gtataagaga cagcctttga agtggtacca gagcat 56 <210> 2 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Amelogenin R primer <400> 2 gtctcgtggg ctcggagatg tgtataagag acaggcatgc ctaatatttt cagggaataa 60 60 <210> 3 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> TPOX F primer <400> 3 tcgtcggcag cgtcagatgt gtataagaga caggcacaga acaggcactt agg 53 <210> 4 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> TPOX R primer <400> 4 gtctcgtggg ctcggagatg tgtataagag acagtccttg tcagcgttta tttgc 55 <210> 5 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> TH01 F primer <400> 5 tcgtcggcag cgtcagatgt gtataagaga caggattccc attggcctgt tc 52 <210> 6 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> TH01 R primer <400> 6 gtctcgtggg ctcggagatg tgtataagag acagcaggtc acagggaaca caga 54 <210> 7 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> CSF1PO F primer <400> 7 tcgtcggcag cgtcagatgt gtataagaga cagactgcct tcatagatag aagat 55 <210> 8 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> CSF1PO R primer <400> 8 gtctcgtggg ctcggagatg tgtataagag acaggaccct gttctaagta cttcct 56 <210> 9 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> D8S1179 F primer <400> 9 tcgtcggcag cgtcagatgt gtataagaga cagggcctgg caacttatat gtattt 56 <210> 10 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> D8S1179 R primer <400> 10 gtctcgtggg ctcggagatg tgtataagag acaggattat tttcactgtg gggaa 55 <210> 11 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> D5S818 F primer <400> 11 tcgtcggcag cgtcagatgt gtataagaga cagtgatttt cctctttggt atcctt 56 <210> 12 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> D5S818 R primer <400> 12 gtctcgtggg ctcggagatg tgtataagag acagcaacat ttgtatcttt atctgtatcc 60 t 61 <210> 13 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> vWA F primer <400> 13 tcgtcggcag cgtcagatgt gtataagaga cagagcccta gtggatgata agaa 54 <210> 14 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> vWA R primer <400> 14 gtctcgtggg ctcggagatg tgtataagag acagtgataa atacatagga tggatgg 57 <210> 15 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> D21S11 F primer <400> 15 tcgtcggcag cgtcagatgt gtataagaga cagaattccc caagtgaatt gcc 53 <210> 16 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> D21S11 R primer <400> 16 gtctcgtggg ctcggagatg tgtataagag acagaatagg aggtagatag actggat 57 <210> 17 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> D18S51 F primer <400> 17 tcgtcggcag cgtcagatgt gtataagaga caggttgcta ctatttcttt tctttttctc 60 60 <210> 18 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> D18S51 R primer <400> 18 gtctcgtggg ctcggagatg tgtataagag acaggccact gcacttcact ctga 54 <210> 19 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> D3S1358 F primer <400> 19 tcgtcggcag cgtcagatgt gtataagaga cagcccactg cagtccaatc tg 52 <210> 20 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> D3S1358 R primer <400> 20 gtctcgtggg ctcggagatg tgtataagag acagatcaac agaggcttgc atgt 54 <210> 21 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> D13S317 F primer <400> 21 tcgtcggcag cgtcagatgt gtataagaga cagtctgacc catctaacgc cta 53 <210> 22 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> D13S317 R primer <400> 22 gtctcgtggg ctcggagatg tgtataagag acagagacag aaagatagat agatgattga 60 60 <210> 23 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> FGA F primer <400> 23 tcgtcggcag cgtcagatgt gtataagaga cagctgtaac caaaataaaa ttaggca 57 <210> 24 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> FGA R primer <400> 24 gtctcgtggg ctcggagatg tgtataagag acagtgtctg taattgccag caaaa 55 <210> 25 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> D16S539 F primer <400> 25 tcgtcggcag cgtcagatgt gtataagaga cagatacaga cagacagaca ggtg 54 <210> 26 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> D16S539 R primer <400> 26 gtctcgtggg ctcggagatg tgtataagag acagagcatg tatctatcat ccatctc 57 <210> 27 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> D7S820 F primer <400> 27 tcgtcggcag cgtcagatgt gtataagaga cagtgataga acacttgtca tagtttagaa 60 60 <210> 28 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> D7S820 R primer <400> 28 gtctcgtggg ctcggagatg tgtataagag acagctcatt gacagaattg cacca 55 <210> 29 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> D2S1338 F primer <400> 29 tcgtcggcag cgtcagatgt gtataagaga cagtggaaac agaaatggct tgg 53 <210> 30 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> D2S1338 R primer <400> 30 gtctcgtggg ctcggagatg tgtataagag acagagttat tcagtaagtt aaaggattgc 60 60 <210> 31 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> D19S433 F primer <400> 31 tcgtcggcag cgtcagatgt gtataagaga caggcaaaaa gctataattg taccac 56 <210> 32 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> D19S433 R primer <400> 32 gtctcgtggg ctcggagatg tgtataagag acagaaaaat cttctctctt tcttcctctc 60 60 <210> 33 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Penta D F primer <400> 33 tcgtcggcag cgtcagatgt gtataagaga cagtggaagg tcgaagctga agt 53 <210> 34 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Penta D R primer <400> 34 gtctcgtggg ctcggagatg tgtataagag acagtgattc tctttttttc cccttc 56 <210> 35 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Penta E F primer <400> 35 tcgtcggcag cgtcagatgt gtataagaga cagggcgact gagcaagact ca 52 <210> 36 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Penta E R primer <400> 36 gtctcgtggg ctcggagatg tgtataagag acagtggaaa gaattctctt atttggg 57 <210> 37 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> DYS391 F primer <400> 37 tcgtcggcag cgtcagatgt gtataagaga cagttcaatc atacacccat atctgtc 57 <210> 38 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> DYS391 R primer <400> 38 gtctcgtggg ctcggagatg tgtataagag acagtgcaag caattgccat agag 54 <210> 39 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> D2S441 F primer <400> 39 tcgtcggcag cgtcagatgt gtataagaga caggaactgt ggctcatcta tgaaaa 56 <210> 40 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> D2S441 R primer <400> 40 gtctcgtggg ctcggagatg tgtataagag acagaagtgg ctgtggtgtt atgat 55 <210> 41 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> D12S391 F primer <400> 41 tcgtcggcag cgtcagatgt gtataagaga cagccagaga gaaagaatca acagg 55 <210> 42 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> D12S391 R primer <400> 42 gtctcgtggg ctcggagatg tgtataagag acagttcctc taataaatcc cctctc 56 <210> 43 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> D22S1045 F primer <400> 43 tcgtcggcag cgtcagatgt gtataagaga cagtttcccc gatgatagta gtct 54 <210> 44 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> D22S1045 R primer <400> 44 gtctcgtggg ctcggagatg tgtataagag acaggatcac gcgaatgtat gattg 55 <210> 45 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> D1S1656 F primer <400> 45 tcgtcggcag cgtcagatgt gtataagaga cagctgtgtt gctcaagggt caa 53 <210> 46 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> D1S1656 R primer <400> 46 gtctcgtggg ctcggagatg tgtataagag acaggagaaa tagaatcact agggaacca 59 <210> 47 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> D10S1248 F primer <400> 47 tcgtcggcag cgtcagatgt gtataagaga cagaatgaat tgaacaaatg agtgagt 57 <210> 48 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> D10S1248 R primer <400> 48 gtctcgtggg ctcggagatg tgtataagag acagggaaca actctggttg tattgtct 58 <210> 49 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> D6S1043 F primer <400> 49 tcgtcggcag cgtcagatgt gtataagaga cagcaaggat gggtggatca atag 54 <210> 50 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> D6S1043 R primer <400> 50 gtctcgtggg ctcggagatg tgtataagag acagattgta tgagccactt ccca 54

Claims (14)

  1. 다음의 단계를 포함하는 NGS 기반(next generation sequencing-based) 인간 객체(human subject)의 상염색체 STR (short tandem repeat) 분석방법:(a) 인간 객체 DNA 시료의 아멜로제닌(amelogenin), TPOX (Human thyroid peroxidase gene), TH01, CSF1PO (Human c-fms proto-oncogene for CSF-1 receptor gene), D8S1179, D5S818, vWA (von Willebrand factor A), D21S11, D18S51, D3S1358, D13S317, FGA (Human fibrinogen alpha chain), D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, DYS391, D2S441, D12S391, D22S1045, D1S1656, D10S1248 및 D6S1043 의 유전좌위에 상보적으로 결합하는 각각의 프라이머를 이용하여 증폭을 실시하는 단계로서,
    상기 단계 (a)는 다음의 2단계 멀티플렉스 증폭으로 실시되며,
    (a-1) 인간 객체 DNA 시료의 아멜로제닌, TPOX, TH01, CSF1PO, D8S1179, D5S818, vWA, D21S11, D18S51, D3S1358, D13S317, FGA, D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, DYS391, D2S441, D12S391, D22S1045, D1S1656, D10S1248 및 D6S1043 유전좌위에 상보적으로 결합하는 각각의 프라이머를 이용하여 1차 멀티플렉스 PCR 증폭을 실시하는 단계; 및
    (a-2) 상기 단계 (a-1)의 1차 멀리플렉스 증폭의 생성물 및 상기 프라이머를 이용하여 2차 인덱싱 PCR 증폭을 실시하는 단계; 및
    (b) 상기 단계(a)의 멀티플렉스 증폭 산물을 이용하여 상기 유전좌위의 대립유전자형을 결정하여, 상기 인간 객체를 유전자로 감식하는 단계;
    를 포함하는 멀티플렉스 유전자 증폭을 이용한 분석대상의 인간 객체의 유전자 감식 방법으로서,
    상기 아멜로제닌 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제1서열 및 제2서열이고; 상기 TPOX 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제3서열 및 제4서열이며; 상기 TH01 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제5서열 및 제6서열이고; 상기 CSF1PO 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제7서열 및 제8서열이며; 상기 D8S1179 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제9서열 및 제10서열이고; 상기 D5S818 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제11서열 및 제12서열이며; 상기 vWA 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제13서열 및 제14서열이고; 상기 D21S11 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제15서열 및 제16서열이며; 상기 D18S51 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제17서열 및 제18서열이고; 상기 D3S1358 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제19서열 및 제20서열이며; 상기 D13S317 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제21서열 및 제22서열이고, 상기 FGA 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제23서열 및 제24서열이며; 상기 D16S539 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제25서열 및 제26서열이고; 상기 D7S820 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제27서열 및 제28서열이며; 상기 D2S1338 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제29서열 및 제30서열이고; 상기 D19S433 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제31서열 및 제32서열이며; 상기 Penta D 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제33서열 및 제34서열이며; 상기 Penta E 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제35서열 및 제36서열이며; 상기 DYS391 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제37서열 및 제38서열이며; 상기 D2S441 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제39서열 및 제40서열이며; 상기 D12S391 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제41서열 및 제42서열이며; 상기 D22S1045유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제43서열 및 제44서열이며; 상기 D1S1656 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제45서열 및 제46서열이며; 상기 D10S1248 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제47서열 및 제48서열이며; 상기 D6S1043 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제49서열 및 제50서열이고,
    상기 아멜로제닌 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 갖고, 상기 TPOX 유전좌위에 상보적으로 결합하는 프라이머는 0.01-0.4 μM의 최종농도를 가지며, 상기 TH01 유전좌위에 상보적으로 결합하는 프라이머는 0.01-0.4 μM의 최종농도를 갖고, 상기 CSF1PO 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 가지며, 상기 D8S1179 유전좌위에 상보적으로 결합하는 프라이머는 0.8-1.2 μM의 최종농도를 갖고, 상기 D5S818 유전좌위에 상보적으로 결합하는 프라이머는 0.2-0.6 μM의 최종농도를 갖고; 상기 vWA 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D21S11 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 갖고; 상기 D18S51 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 가지며; 상기 D3S1358 유전좌위에 상보적으로 결합하는 프라이머는 0.1-0.5 μM의 최종농도를 갖고; 상기 D13S317유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 FGA 유전좌위에 상보적으로 결합하는 프라이머는 1.8-2.2 μM의 최종농도를 갖고; 상기 D16S539 유전좌위에 상보적으로 결합하는 프라이머는 0.02-0.42 μM의 최종농도를 가지며; 상기 D7S820 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 갖고; 상기 D2S1338 유전좌위에 상보적으로 결합하는 프라이머는 0.6-1.0 μM의 최종농도를 가지며; 상기 D19S433 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 가지며, 상기 Penta D 유전좌위에 상보적으로 결합하는 프라이머는 1.8-2.2 μM의 최종농도를 가지며; 상기 Penta E 유전좌위에 상보적으로 결합하는 프라이머는 1.3-1.7 μM의 최종농도를 가지며; 상기 DYS391 유전좌위에 상보적으로 결합하는 프라이머는 1.0-1.4 μM의 최종농도를 가지며; 상기 D2S441 유전좌위에 상보적으로 결합하는 프라이머는 0.4-0.8 μM의 최종농도를 가지며; 상기 D12S391 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D22S1045 유전좌위에 상보적으로 결합하는 프라이머는 1.3-1.7 μM의 최종농도를 가지며; 상기 D1S1656 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D10S1248 유전좌위에 상보적으로 결합하는 프라이머는 0.25-0.65 μM의 최종농도를 가지며; 상기 D6S1043 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 가지는 방법.
  2. 제 1 항에 있어서, 상기 멀티플렉스 유전자 증폭은 멀티플렉스 PCR(Polymerase Chain Reaction) 증폭인 것을 특징으로 하는 방법.
  3. 삭제
  4. 제 1 항에 있어서, 상기 단계 (a-1)의 멀티플렉스 유전자 증폭은 27-31 싸이클을 갖는 것을 특징으로 하는 방법.
  5. 제 1 항에 있어서, 상기 단계 (a-2)의 인덱싱 PCR 증폭은 13-17 싸이클을 갖는 것을 특징으로 하는 방법.
  6. 제 1 항에 있어서, 상기 프라이머는 (ⅰ) 프라이머 서열이 STR 반복 부위(repeat region)와 중첩(overlapping)되지 않거나; (ⅱ) 프라이머 결합부위(binding area)에 1% 이상 빈도의 단일염기다형성(single nucleotide polymorphism, SNP)이 존재하지 않는 것을 특징으로 하는 방법.
  7. 삭제
  8. 삭제
  9. 제 1 항에 있어서, 상기 단계 (b)는 상기 멀티플렉스 증폭 산물에서 증폭된 각각의 STR 대립유전자의 염기서열을 레퍼런스 서열(reference sequence)과 비교/평가하여 실시하며, 상기 STR 대립유전자에서의 coverage 값으로서 각 STR 유전좌에서의 대립유전자형을 결정하는 것을 특징으로 하는 방법.
  10. 제 9 항에 있어서, 상기 레퍼런스 서열은 상기 대립유전자의 STR 영역의 서열, 상기 STR 영역의 5' 주변부 서열 및 상기 STR 영역의 3' 주변부 서열을 포함하는 것을 특징으로 하는 방법.
  11. 제 1 항에 있어서, 상기 분석방법은 상기 단계 (b)의 대립유전자형 결정 이후에 상기 STR 유전좌 부위에서 반복 서열의 복제수(the number of copy), 대립유전자의 반복구조 또는 염기 서열변이(sequence variation)를 동정하는 단계를 추가적으로 실시하는 것을 특징으로 하는 방법.
  12. 제 1 항에 있어서, 상기 분석 방법은 법의학적 타이핑(Forensic typing) 또는 신원확인의 용도를 갖는 것을 특징으로 하는 방법.
  13. 제 1 항에 있어서, 상기 DNA 시료는 혈액, 정액, 질 세포, 모발, 타액, 소변, 구강세포, 태반세포 또는 태아세포를 포함하는 양수 및 이의 혼합물을 포함하는 군으로부터 선택되는 조직으로부터 분리된 DNA 시료인 것을 특징으로 하는 방법.
  14. 아멜로제닌(amelogenin), TPOX (Human thyroid peroxidase gene), TH01, CSF1PO (Human c-fms proto-oncogene for CSF-1 receptor gene), D8S1179, D5S818, vWA (von Willebrand factor A), D21S11, D18S51, D3S1358, D13S317, FGA (Human fibrinogen alpha chain), D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, DYS391, D2S441, D12S391, D22S1045, D1S1656, D10S1248 및 D6S1043 유전좌위에 상보적으로 결합하는 각각의 프라이머를 포함하는 NGS 기반(next generation sequencing-based) 확장 상염색체 분석용 멀티플렉스 유전자 증폭 키트로서,
    상기 유전자 증폭은 다음의 2단계 멀티플렉스 증폭으로 실시되며,
    (a-1) 인간 객체 DNA 시료의 아멜로제닌, TPOX, TH01, CSF1PO, D8S1179, D5S818, vWA, D21S11, D18S51, D3S1358, D13S317, FGA, D16S539, D7S820, D2S1338, D19S433, Penta D, Penta E, DYS391, D2S441, D12S391, D22S1045, D1S1656, D10S1248 및 D6S1043 유전좌위에 상보적으로 결합하는 각각의 프라이머를 이용하여 1차 멀티플렉스 PCR 증폭을 실시하는 단계; 및
    (a-2) 상기 단계 (a-1)의 1차 멀리플렉스 증폭의 생성물 및 상기 프라이머를 이용하여 2차 인덱싱 PCR 증폭을 실시하는 단계,
    상기 아멜로제닌 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제1서열 및 제2서열이고; 상기 TPOX 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제3서열 및 제4서열이며; 상기 TH01 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제5서열 및 제6서열이고; 상기 CSF1PO 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제7서열 및 제8서열이며; 상기 D8S1179 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제9서열 및 제10서열이고; 상기 D5S818 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제11서열 및 제12서열이며; 상기 vWA 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제13서열 및 제14서열이고; 상기 D21S11 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제15서열 및 제16서열이며; 상기 D18S51 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제17서열 및 제18서열이고; 상기 D3S1358 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제19서열 및 제20서열이며; 상기 D13S317 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제21서열 및 제22서열이고, 상기 FGA 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제23서열 및 제24서열이며; 상기 D16S539 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제25서열 및 제26서열이고; 상기 D7S820 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제27서열 및 제28서열이며; 상기 D2S1338 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제29서열 및 제30서열이고; 상기 D19S433 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제31서열 및 제32서열이며; 상기 Penta D 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제33서열 및 제34서열이며; 상기 Penta E 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제35서열 및 제36서열이며; 상기 DYS391 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제37서열 및 제38서열이며; 상기 D2S441 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제39서열 및 제40서열이며; 상기 D12S391 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제41서열 및 제42서열이며; 상기 D22S1045유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제43서열 및 제44서열이며; 상기 D1S1656 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제45서열 및 제46서열이며; 상기 D10S1248 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제47서열 및 제48서열이며; 상기 D6S1043 유전좌위에 상보적으로 결합하는 프라이머는 서열목록 제49서열 및 제50서열이고,
    상기 아멜로제닌 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 갖고, 상기 TPOX 유전좌위에 상보적으로 결합하는 프라이머는 0.01-0.4 μM의 최종농도를 가지며, 상기 TH01 유전좌위에 상보적으로 결합하는 프라이머는 0.01-0.4 μM의 최종농도를 갖고, 상기 CSF1PO 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 가지며, 상기 D8S1179 유전좌위에 상보적으로 결합하는 프라이머는 0.8-1.2 μM의 최종농도를 갖고, 상기 D5S818 유전좌위에 상보적으로 결합하는 프라이머는 0.2-0.6 μM의 최종농도를 갖고; 상기 vWA 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D21S11 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 갖고; 상기 D18S51 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 가지며; 상기 D3S1358 유전좌위에 상보적으로 결합하는 프라이머는 0.1-0.5 μM의 최종농도를 갖고; 상기 D13S317유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 FGA 유전좌위에 상보적으로 결합하는 프라이머는 1.8-2.2 μM의 최종농도를 갖고; 상기 D16S539 유전좌위에 상보적으로 결합하는 프라이머는 0.02-0.42 μM의 최종농도를 가지며; 상기 D7S820 유전좌위에 상보적으로 결합하는 프라이머는 0.7-1.1 μM의 최종농도를 갖고; 상기 D2S1338 유전좌위에 상보적으로 결합하는 프라이머는 0.6-1.0 μM의 최종농도를 가지며; 상기 D19S433 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 가지며, 상기 Penta D 유전좌위에 상보적으로 결합하는 프라이머는 1.8-2.2 μM의 최종농도를 가지며; 상기 Penta E 유전좌위에 상보적으로 결합하는 프라이머는 1.3-1.7 μM의 최종농도를 가지며; 상기 DYS391 유전좌위에 상보적으로 결합하는 프라이머는 1.0-1.4 μM의 최종농도를 가지며; 상기 D2S441 유전좌위에 상보적으로 결합하는 프라이머는 0.4-0.8 μM의 최종농도를 가지며; 상기 D12S391 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D22S1045 유전좌위에 상보적으로 결합하는 프라이머는 1.3-1.7 μM의 최종농도를 가지며; 상기 D1S1656 유전좌위에 상보적으로 결합하는 프라이머는 0.5-0.9 μM의 최종농도를 가지며; 상기 D10S1248 유전좌위에 상보적으로 결합하는 프라이머는 0.25-0.65 μM의 최종농도를 가지며; 상기 D6S1043 유전좌위에 상보적으로 결합하는 프라이머는 0.3-0.7 μM의 최종농도를 가지는 키트.
KR1020150189817A 2015-12-30 2015-12-30 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법 KR101667526B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150189817A KR101667526B1 (ko) 2015-12-30 2015-12-30 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150189817A KR101667526B1 (ko) 2015-12-30 2015-12-30 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법

Publications (1)

Publication Number Publication Date
KR101667526B1 true KR101667526B1 (ko) 2016-10-19

Family

ID=57250418

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150189817A KR101667526B1 (ko) 2015-12-30 2015-12-30 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법

Country Status (1)

Country Link
KR (1) KR101667526B1 (ko)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101902508B1 (ko) * 2016-12-05 2018-10-02 주식회사 다우진유전자연구소 유전자감식 신속분석을 위한 20개의 Autosomal-STR 유전자 마커 및 성염색체 유전자마커를 이용한 PCR 다중증폭 시스템
KR101920872B1 (ko) 2018-02-27 2018-11-28 대한민국 차세대 염기서열분석법을 이용한 마이크로하플로타입 분석 방법
KR20190054477A (ko) * 2017-11-13 2019-05-22 순천향대학교 산학협력단 Str 마커를 포함하는 pcr용 프리믹스 조성물 및 이를 이용한 과학수사 교육용 유전자 분석 키트
WO2019132582A1 (ko) * 2017-12-28 2019-07-04 주식회사 엔젠바이오 듀얼 멀티플렉스 시스템을 이용한 인간 객체의 str 분석방법 및 이를 이용한 분석 키트
CN111269991A (zh) * 2020-03-05 2020-06-12 广州万维泰生物科技有限公司 一种针对微量、降解检材的mini-STR试剂盒
KR20210000662A (ko) * 2019-06-25 2021-01-05 대한민국(관리부서: 행정안전부 국립과학수사연구원장) 상염색체 str 좌위를 포함한 ngs 패널 및 다중증폭 시스템
KR102337267B1 (ko) * 2021-06-01 2021-12-08 주식회사 다우진유전자연구소 유전자 감식을 위한 24개의 str 유전자 마커를 이용한 pcr 다중증폭 시스템
EP3815091A4 (en) * 2018-06-29 2022-03-23 Rady Children's Hospital Research Center PROCEDURE AND SYSTEM TO ENSURE IDENTITY OF SAMPLES

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150037791A1 (en) * 2010-11-15 2015-02-05 Life Technologies Corporation Methods and kits for multiplex amplification of short tandem repeat loci
KR101533792B1 (ko) * 2015-02-24 2015-07-06 대한민국 Ngs 기반 인간 객체의 상염색체 분석방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150037791A1 (en) * 2010-11-15 2015-02-05 Life Technologies Corporation Methods and kits for multiplex amplification of short tandem repeat loci
KR101533792B1 (ko) * 2015-02-24 2015-07-06 대한민국 Ngs 기반 인간 객체의 상염색체 분석방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Ham SK., et al., Electrophoresis. Vol.35(21-22), pp.3158-3164. (2014. 10. 1. 온라인공개) *
illuminaⓡ 社의 "Targeted Next-Generation Sequencing for Forensic Genomics" 카탈로그 (2015. 2. 5.)* *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101902508B1 (ko) * 2016-12-05 2018-10-02 주식회사 다우진유전자연구소 유전자감식 신속분석을 위한 20개의 Autosomal-STR 유전자 마커 및 성염색체 유전자마커를 이용한 PCR 다중증폭 시스템
KR20190054477A (ko) * 2017-11-13 2019-05-22 순천향대학교 산학협력단 Str 마커를 포함하는 pcr용 프리믹스 조성물 및 이를 이용한 과학수사 교육용 유전자 분석 키트
KR101997134B1 (ko) 2017-11-13 2019-07-05 순천향대학교 산학협력단 Str 마커를 포함하는 pcr용 프리믹스 조성물 및 이를 이용한 과학수사 교육용 유전자 분석 키트
WO2019132582A1 (ko) * 2017-12-28 2019-07-04 주식회사 엔젠바이오 듀얼 멀티플렉스 시스템을 이용한 인간 객체의 str 분석방법 및 이를 이용한 분석 키트
KR101920872B1 (ko) 2018-02-27 2018-11-28 대한민국 차세대 염기서열분석법을 이용한 마이크로하플로타입 분석 방법
US11597972B2 (en) 2018-02-27 2023-03-07 Republic of Korea (National Forensic Service Director Ministry of Interior and Safety) Method of analyzing microhaplotype using next generation sequencing
EP3815091A4 (en) * 2018-06-29 2022-03-23 Rady Children's Hospital Research Center PROCEDURE AND SYSTEM TO ENSURE IDENTITY OF SAMPLES
KR20210000662A (ko) * 2019-06-25 2021-01-05 대한민국(관리부서: 행정안전부 국립과학수사연구원장) 상염색체 str 좌위를 포함한 ngs 패널 및 다중증폭 시스템
KR102351579B1 (ko) 2019-06-25 2022-01-17 대한민국 상염색체 str 좌위를 포함한 ngs 패널 및 다중증폭 시스템
CN111269991A (zh) * 2020-03-05 2020-06-12 广州万维泰生物科技有限公司 一种针对微量、降解检材的mini-STR试剂盒
KR102337267B1 (ko) * 2021-06-01 2021-12-08 주식회사 다우진유전자연구소 유전자 감식을 위한 24개의 str 유전자 마커를 이용한 pcr 다중증폭 시스템

Similar Documents

Publication Publication Date Title
KR101667526B1 (ko) 차세대 염기서열분석법을 이용한 인간 객체의 확장 상염색체 str 분석방법
Butler et al. Biology and genetics of new autosomal STR loci useful for forensic DNA analysis
RU2752700C2 (ru) Способы и композиции для днк-профилирования
US11913066B2 (en) SE33 mutations impacting genotype concordance
KR101533792B1 (ko) Ngs 기반 인간 객체의 상염색체 분석방법
JP6100933B2 (ja) アレリックラダー遺伝子座
WO2011032054A2 (en) Analysis of y-chromosome str markers
Brown et al. Development and validation of a novel multiplexed DNA analysis system, InnoTyper® 21
WO2017097135A1 (zh) 一种人类基因组33个基因座的复合扩增试剂盒及其应用
EP2635706A1 (en) Method for detecting the presence of a dna minor contributor in a dna mixture
Hadi et al. Genetic variation of twenty autosomal STR loci and evaluate the importance of these loci for forensic genetic purposes
US20110306505A1 (en) X-STR multiplex PCR amplification system
TW201936921A (zh) 次世代定序儀用引子以及其製造方法、使用次世代定序儀用引子之dna庫以及其製造方法,及使用dna庫之基因體dna解析方法
KR101672240B1 (ko) 인간 객체 염색체 상의 str 분석방법 및 이를 이용한 분석 키트
Al-Eitan et al. Investigation of the forensic GlobalFiler loci in the genetically isolated Circassian subpopulation in Jordan
CN110564861A (zh) 人类Y染色体STR基因座和InDel位点的荧光标记复合扩增试剂盒及其应用
KR102095017B1 (ko) Col6a6 유전자 단일염기다형성을 이용한 아토피 피부염 진단용 조성물과 검출 방법
CA3074244A1 (en) Method to confirm variants in ngs panel testing by snp genotyping
WO2021167464A1 (en) Novel y-chromosomal short tandem repeat markers for typing male individuals.
EP3209796A1 (en) Cell assay kit and method
Tyazhelova et al. Application of massive parallel sequencing technology in forensics: comparative analysis of sequencing platforms
US20240117445A1 (en) Macrohaplotypes for Forensic DNA Mixture Deconvolution
JP6245796B2 (ja) 原発性胆汁性肝硬変の発症リスク予測マーカー、プローブ、プライマー及びキット並びに原発性胆汁性肝硬変の発症リスク予測方法
CN111485024B (zh) 用于个体特征确认的引物组合、及其应用
Soldati Characterisation of apparent mismatches detected during routine short tandem repeat analysis in parentage investigations

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant