KR101915701B1 - 돌연변이 발생률의 측정 방법 - Google Patents

돌연변이 발생률의 측정 방법 Download PDF

Info

Publication number
KR101915701B1
KR101915701B1 KR1020170061225A KR20170061225A KR101915701B1 KR 101915701 B1 KR101915701 B1 KR 101915701B1 KR 1020170061225 A KR1020170061225 A KR 1020170061225A KR 20170061225 A KR20170061225 A KR 20170061225A KR 101915701 B1 KR101915701 B1 KR 101915701B1
Authority
KR
South Korea
Prior art keywords
sequence
mutation
primer
landmark
template
Prior art date
Application number
KR1020170061225A
Other languages
English (en)
Other versions
KR20170142871A (ko
Inventor
정상균
오수아
Original Assignee
한국한의학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국한의학연구원 filed Critical 한국한의학연구원
Priority to PCT/KR2017/005952 priority Critical patent/WO2017217694A2/ko
Priority to US16/310,236 priority patent/US11959131B2/en
Priority to EP17813518.2A priority patent/EP3474168B1/en
Priority to CN201780037881.6A priority patent/CN109416930B/zh
Publication of KR20170142871A publication Critical patent/KR20170142871A/ko
Application granted granted Critical
Publication of KR101915701B1 publication Critical patent/KR101915701B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • G06F19/18
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • G06F19/20
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2549/00Reactions characterised by the features used to influence the efficiency or specificity
    • C12Q2549/10Reactions characterised by the features used to influence the efficiency or specificity the purpose being that of reducing false positive or false negative signals
    • C12Q2549/119Reactions characterised by the features used to influence the efficiency or specificity the purpose being that of reducing false positive or false negative signals using nested primers

Abstract

본 발명은 차세대 염기서열 분석(Next Generation Sequencing; NGS)을 위한 라이브러리를 제조하는 단계를 포함하는 돌연변이 발생률의 측정 방법에 관한 것으로서, 약물, 방사선, 유전자 구성, 노화 및 개체가 겪는 각종 스트레스 등이 대상 시료의 돌연변이 발생에 미치는 효과를 측정할 수 있어 독성실험, 의학적 시험 및 건강의 유지관리 등과 관련된 시험, 진단, 관리 및 평가에 유용하게 사용될 수 있다.

Description

돌연변이 발생률의 측정 방법{Method for measuring mutation rate}
본 발명은 차세대 염기서열 분석(Next Generation Sequencing; NGS)을 위한 라이브러리를 제조하는 단계를 포함하는 돌연변이 발생률의 측정 방법에 관한 것이다.
돌연변이는 질병의 예측 분야 등 다양한 생명 과학분야에서 가장 주목받는 부분 중 하나이다. 특히, 전 세계적으로 급격한 고령화 사회로 진행되면서 건강에 대한 관심이 높아지는 추세이다. 따라서 삶의 질의 향상을 위한 질병의 예측 가능성을 높이기 위해 돌연변이의 발생률의 측정에 대한 연구가 활발히 이루어지고 있다.
한편, 돌연변이를 검출하기 위한 하나의 기술로서 한국공개특허 제2015-0143025호는 PNA(peptide nucleic acid)를 사용하여 필라그린 유전자의 돌연변이를 검출할 수 있음을 개시하고 있다. 또한, 표피성장인자수용체(EGFR)의 돌연변이를 검출하는데 PNA를 이용한 연구가 지속적으로 보고되고 있다(Tuberc Respir Dis 2010;69:271-278).
다만, PNA는 자연적으로 생성될 수 없고 합성으로만 제조될 수 있어 비용이 매우 비싸고 대규모 돌연변이 발생률의 측정에 사용되기 어려운 제한이 있다. 또한, PNA를 이용한 돌연변이 검출방법은 특정 유전자의 돌연변이만을 검출할 수 있을 뿐, 무작위적으로 발생한 돌연변이의 검출에 한계가 있다. 따라서, 돌연변이의 발생률의 측정을 위한 다양한 연구가 여전히 요구되는 실정이다.
이에, 본 발명자들은 대규모 돌연변이의 발생률의 측정이 가능함과 동시에 정확도가 뛰어난 돌연변이 발생률의 측정 방법을 개발하기 위해 예의 노력한 결과, 랜덤서열과 어댑터를 도입한 표적 유전자를 증폭하여 염기서열을 분석하는 단계를 포함하는, 정확도가 향상되고 무작위적으로 발생한 돌연변이의 발생률을 광범위하게 측정할 수 있는 돌연변이 발생률의 측정 방법을 개발하여 본 발명을 완성하였다.
또한 본 발명은 적용하는 유전물질을 달리함으로서 그 안에 포함된 변이형들을 측정할 수 있으며 발명의 특성에 의해 실험과정에서 유입되는 각종 노이즈에 의한 왜곡이 제거되기 때문에 보다 정확한 측정값을 제공할 수 있다. 예를 들어 미토콘드리아 DNA에서 헤테로플라스미(heteroplasmy)의 내용과 정도를 측정하거나 미생물 유전체로부터 미생물의 생태구조를 측정하는데 응용될 수 있다.
본 발명의 주된 목적은 (1) 하기 (a) 단계 내지 (c) 단계를 포함하는 차세대 염기서열 분석(Next Generation Sequencing; NGS)을 위한 라이브러리를 제조하는 제1단계: (a) 개체로부터 추출된, 랜드마크를 갖는 게놈 DNA를 각각 제한효소로 절단하고, 각 절단된 게놈 DNA의 양 말단에 서로 다른 랜덤서열을 포함하는 어댑터를 연결시켜 DNA-어댑터 연결체를 제조하는 단계; (b) 상기 (a) 단계에서 제조된 DNA-어댑터 연결체를 주형으로 하고, 상기 주형에서 랜드마크의 5' 말단에 결합하는 제1프라이머, 및 어댑터의 3' 말단에 결합하는 제2프라이머를 이용하여 PCR을 수행하여 증폭산물을 수득하는 단계; 및 (c) 상기 (b) 단계에서 제조된 증폭산물을 주형으로 하고, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 단계; (2) 상기 라이브러리에 포함되는 각 유전체 조각들의 서열을 NGS를 통하여 결정하는 제2단계; (3) 표준 게놈 서열 상의 n개의 랜드마크를 기준으로, 상기 (c) 단계에서 제조된 증폭산물들을 정렬하여, 상기 증폭산물들을 n개로 그룹화하는 제3단계; (4) 그룹을 구성하는 증폭산물들을 랜덤서열 별로 서브그룹화한 후, 서브그룹 별로 1개의 유전체 조각을 선택하여, 그룹 별로 mi 개의 유전체 조각을 선별하는 제4단계(상기 mi는 i번째 랜드마크에서 선택된 유전체 조각의 수); (5) mi개의 유전체 조각들의 염기서열을 비교하여, 각 그룹 별로 돌연변이가 배제된 1개의 대표 염기서열을 결정하는 제5단계; (6) n개 그룹의 mi개의 유전체 조각들 중 그룹의 대표 염기서열과 상이한 염기서열을 가지는 경우를 돌연변이로 판단하여, 돌연변이의 총 개수(M)를 결정하는 제6단계; 및 (7) 하기 수학식 1을 이용하여 돌연변이 발생률(AMR)을 계산하는 제7단계를 포함하는 게놈의 돌연변이 발생률의 측정 방법을 제공하는 것이다.
상기의 목적을 달성하기 위하여, 본 발명의 하나의 양태는,
(1) 하기 (a) 단계 내지 (c) 단계를 포함하는 차세대 염기서열 분석(Next Generation Sequencing; NGS)을 위한 라이브러리를 제조하는 제1단계:
(a) 개체로부터 추출된, 랜드마크를 갖는 게놈 DNA를 각각 제한효소로 절단하고, 각 절단된 게놈 DNA의 양 말단에 서로 다른 랜덤서열을 포함하는 어댑터를 연결시켜 DNA-어댑터 연결체를 제조하는 단계;
(b) 상기 (a) 단계에서 제조된 DNA-어댑터 연결체를 주형으로 하고, 상기 주형에서 랜드마크의 3' 말단에 결합하는 제1프라이머, 및 어댑터의 5' 말단에 결합하는 제2프라이머를 이용하여 PCR을 수행하여 증폭산물을 수득하는 단계; 및
(c) 상기 (b) 단계에서 제조된 증폭산물을 주형으로 하고, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 단계;
(2) 상기 라이브러리에 포함되는 각 유전체 조각들의 서열을 NGS를 통하여 결정하는 제2단계;
(3) 표준 게놈 서열 상의 n개의 랜드마크를 기준으로, 상기 (c) 단계에서 제조된 증폭산물들을 정렬하여, 상기 증폭산물들을 n개로 그룹화하는 제3단계;
(4) 그룹을 구성하는 증폭산물들을 랜덤서열 별로 서브그룹화한 후, 서브그룹 별로 1개의 유전체 조각을 선택하여, 그룹 별로 mi 개의 유전체 조각을 선별하는 제4단계(상기 mi는 i번째 랜드마크에서 선택된 유전체 조각의 수);
(5) mi개의 유전체 조각들의 염기서열을 비교하여, 각 그룹 별로 돌연변이가 배제된 1개의 대표 염기서열을 결정하는 제5단계;
(6) n개 그룹의 mi개의 유전체 조각들 중 각 그룹의 대표 염기서열과 상이한 염기서열을 가지는 경우를 돌연변이로 판단하여, 돌연변이의 총 개수(M)를 결정하는 제6단계; 및
(7) 하기 수학식 1을 이용하여 돌연변이 발생률(AMR)을 계산하는 제7단계를 포함하는 게놈의 돌연변이 발생률의 측정방법을 제공한다.
[수학식 1]
Figure 112017047092734-pat00001
(AMR은 돌연변이 발생률(accumulated mutation rate); M은 돌연변이의 총 개수; mi 는 i번째 랜드마크에서 선택된 유전체 조각의 수; li는 i번째 랜드마크의 유전체 조각 중에서 서열이 결정되어 분석된 염기의 수를 의미)
제1단계는 (a) 단계 내지 (c) 단계를 포함하는 차세대 염기서열 분석(Next Generation Sequencing; NGS)을 위한 라이브러리를 제조하는 단계를 제공한다.
본 발명에서 용어, "차세대 염기서열 분석(Next Generation Sequencing; NGS)"은 유전체의 염기서열에 대한 고속 분석 방법을 말하며, High-throughput sequencing, Massive parallel sequencing 또는 Second generation sequencing과 혼용되어 사용될 수 있다.
본 발명에서 용어, "라이브러리"는 제한효소 등으로 절단하여 얻은 유전자의 단편들의 집합을 말하며, 유전자의 단편을 벡터에 도입한 집합일 수 있으나, 이에 제한되는 것은 아니다. 구체적으로 본 발명에서 상기 라이브러리는 하기 (a) 내지 (c) 단계를 통해 제조할 수 있으며, 상기 라이브러리는 돌연변이 발생률의 측정에 사용될 수 있다.
상기 (a) 단계는 개체로부터 추출된, 랜드마크를 갖는 게놈 DNA를 각각 제한효소로 절단하고, 각 절단된 게놈 DNA의 양 말단에 서로 다른 랜덤서열을 포함하는 어댑터를 연결시켜 DNA-어댑터 연결체를 제조하는 단계를 제공한다.
본 발명에서 용어, "개체"는 돌연변이 발생률의 측정이 필요한 인간을 포함한 모든 동물을 의미할 수 있다.
상기 게놈 DNA를 개체로부터 추출하는 방법은 당업계에서 사용되는 방법을 제한없이 사용할 수 있다.
본 발명에서 용어, "랜드마크"는 게놈 DNA상의 다른 염기서열과의 구별을 위한 특정 염기서열을 말한다. 일 예로, 게놈 DNA 내에서 반복되어 나타나는 특정 염기서열일 수 있으며, 구체적으로 LINE(long interspersed nuclear element) 또는 SINE(short interspersed nuclear element) 계열의 반복 염기서열이나 특정 제한효소 인식부위와 같이 유전체 내에 반복되어 나타나는 염기서열일 수 있으나, 이에 제한되는 것은 아니며, 다른 염기서열과 구별하여 특정 부위의 돌연변이 발생률의 측정이 가능한 염기서열이면 제한없이 가능하다.
본 발명의 일 실시예에서는, 돌연변이 발생률의 측정을 위한 랜드마크로서 LINE 계열 반복서열인 L1HS 염기서열을 사용하였다.
본 발명에서 용어, "어댑터"는 랜드마크의 전체 또는 일부와 제한효소 절단부위의 염기서열을 포함하는 증폭산물을 수득하기 위해 사용되는 부분 이중나선 구조의 염기서열을 말하며, 제한효소로 절단된 게놈 DNA의 양 말단에 결합할 수 있다. 구체적으로, 상기 어댑터는 랜덤서열을 포함할 수 있다.
상기 어댑터의 일 말단은 제한효소로 절단되는 게놈 DNA 부위와 상보적으로 결합하는 서열을 포함할 수 있다.
또한, 상기 어댑터는 돌연변이 발생률을 측정하기 위한 증폭산물의 제조단계에서, PCR 수행시 프라이머의 부착이 가능한 염기서열을 포함할 수 있다.
본 발명의 일 실시예에서는, DpnⅡ 제한효소를 사용하여 인간 백혈구 세포의 유전체 DNA를 절단하였고, 상기 제한효소의 절단부위에 결합할 수 있는, 랜덤서열을 포함하는 DpnⅡ 어댑터를 절단된 게놈 DNA에 부착시켰다.
한편, 본 발명의 상기 어댑터는, 상기 랜드마크 DNA의 상보적 가닥을 모두 포획하기 위해, 5' 위치에 인산기가 결합된 것일 수 있다. 또한, 상기 상보적 DNA 가닥을 구별하기 위해, 어댑터의 상보적 결합 부위에 미스매치 뉴클레오티드 (mismatch nucleotide)를 1 개 이상 포함할 수 있다.
즉, 상기 랜드마크 DNA의 한쪽 가닥만 포획될 경우, 라이브러리 구축 단계 등의 반응에서 발생하는 화학 변이에 의한 위양성 (false positive)를 구별하기 어려우나, 이러한 화학 변이는 DNA의 상보적 가닥의 동일 위치에서 동시에 발생하기는 어려우므로, 랜드마크 DNA의 양쪽 가닥을 모두 포획할 수 있는 어댑터를 사용함으로써, 화학 변이로 인한 노이즈를 제거하고, 돌연변이 발생률을 보다 정확하게 측정할 수 있다.
또한, 어댑터간의 결합을 방지하기 위해 non-palindrom overhang을 생성하는 제한효소를 사용할 수 있다. 상기 제한효소는 BstNI, 또는 AvaII 제한효소일 수 있으나, 이에 제한되는 것은 아니다.
본 발명에서 용어, "랜덤서열"은 개체로부터 추출된 게놈 DNA의 기원을 구별하기 위해 사용되는 임의의 5 내지 11개의 뉴클레오티드를 말하며, 특정 염기서열을 포함할 수 있다. 상기 랜덤서열은 제한효소로 절단된 게놈 DNA의 양 말단에 결합할 수 있으며, 게놈 DNA의 기원마다 상이한 염기서열을 나타내 증폭산물로부터 돌연변이 발생률의 측정 시, 게놈 DNA의 기원별로 돌연변이의 발생률을 측정하는데 용이하다. 상기 랜덤서열은 상기 어댑터의 부분 이중나선 구조 중 단일 가닥에 위치할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 일 실시예에서는, 임의의 7개의 뉴클레오티드를 랜덤서열로 사용하였다.
본 발명에서 용어, "DNA-어댑터 연결체"는 상기 제한효소로 절단된 게놈 DNA와 어댑터가 연결된 구조체를 말하며, 돌연변이 발생률을 측정하기 위한 증폭의 주형으로 사용된다. 구체적으로, 상기 연결체는 랜덤서열을 포함할 수 있으며, 예를 들어 상기 랜덤서열은 게놈 DNA와 어댑터의 사이에 위치할 수 있다.
상기 (b) 단계는 상기 (a) 단계에서 제조된 DNA-어댑터 연결체를 주형으로 하고, 상기 주형에서 랜드마크의 3' 말단에 결합하는 제1프라이머, 및 어댑터의 5' 말단에 결합하는 제2프라이머를 이용하여 PCR을 수행하여 증폭산물을 수득하는 단계(b-1)를 제공한다.
상기 제1프라이머는 랜드마크의 3'말단에 결합하는 프라이머이고, 상기 제2프라이머는 어댑터의 5' 말단에 결합하는 프라이머로서, 상기 프라이머들을 사용하여 PCR을 수행시 랜드마크의 3' 부위의 염기서열을 포획하는 역할을 한다.
본 발명에서 용어, "증폭산물"은 제1프라이머, 및 제2프라이머를 이용하여 수행한 PCR의 결과물을 말하며, 랜드마크, 랜덤서열, 유전체 조각, 및 어댑터를 포함할 수 있다. 구체적으로, 상기 증폭산물은 랜드마크의 전체 또는 일부 서열을 포함하고, 어댑터의 전체 또는 일부 서열을 포함할 수 있으나, 이에 제한되는 것은 아니다.
본 발명에서 용어, "유전체 조각"은 돌연변이 발생률의 측정 대상인 게놈 DNA를 포함하는 유전체로서, 다른 게놈 DNA와의 구별을 위해 랜드마크, 및 랜덤서열에 결합할 수 있다. 구체적으로, 상기 유전체 조각은 1 이상의 염기를 포함할 수 있으며, 상기 (a) 단계에서 제한효소에 의한 게놈 DNA의 절단 부위를 전부 또는 일부 포함할 수 있다.
본 발명의 일 실시예에서는, 제한효소에 의해 절단된 게놈 DNA와 랜덤서열 및 어댑터를 포함하는 DNA-어댑터 연결체를 주형으로 하고, 상기 주형에 포함된 L1HS 랜드마크의 3' 말단에 결합하는 제1프라이머와, 어댑터의 5'말단에 결합하는 제2프라이머를 사용하여 PCR을 수행하여 증폭산물을 수득하였다.
상기 단계 (b)는 상기 제조된 증폭산물을 주형으로 하고, 상기 랜드마크의 염기서열의 전부 또는 일부에 결합하는 정방향 프라이머와 랜덤서열을 제외한 어댑터의 전부 또는 일부에 결합하는 역방향 프라이머를 이용하여 nested PCR을 수행하는 단계(b-2)를 추가로 포함할 수 있다.
본 발명에서 용어, "nested PCR"은 1차 PCR 증폭 산물을 주형으로 이용하여 원하지 않는 증폭 산물을 제거하고, 원하는 증폭 산물만을 특이적으로 선별하기 위한 PCR을 말한다. 상기 nested PCR은 원하지 않는 증폭 산물을 제거할 수 있어, 본 발명에서 돌연변이 발생률의 측정시, 정확도를 향상시킬 수 있는 효과를 나타낼 수 있다.
상기 원하지 않는 증폭산물을 제거하기 위한 nested PCR을 수행하기 위하여, 유전체 조각을 포획하는 랜드마크와 어댑터에 각각 결합하는 프라이머들을 사용할 수 있으며, 구체적으로, 상기 프라이머들 중 어느 하나는 랜드마크의 염기서열의 전부 또는 일부에 결합할 수 있고, 상기 프라이머들 중 다른 하나는 어댑터의 염기서열의 전부 또는 일부에 결합할 수 있다.
또한, 상기 프라이머들은 차세대 염기서열 분석에 적합한 염기서열이 추가된 형태의 프라이머들일 수 있으나, 이에 제한되는 것은 아니다.
상기 (c) 단계는 상기 (b) 단계에서 제조된 증폭산물을 주형으로 하고, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 단계를 제공한다.
상기 (c) 단계의 프라이머 쌍은 상기 (b) 단계에서 제조된 증폭산물의 양 말단에 결합할 수 있다. 상기 프라이머 쌍은 제1프라이머 및 주형마다 상이한 지표를 포함하는 제2프라이머로 이루어져 있어, 상기 증폭산물의 라이브러리를 구별하는데 용이하다. 구체적으로, 상기 주형마다 상이한 지표는 일반적으로 차세대 염기서열 분석에 사용되는 통상적인 지표일 수 있다. 또한, 상기 프라이머 쌍은 차세대 염기서열 분석에 적합한 염기서열이 추가된 형태의 프라이머 쌍일 수 있다.
본 발명의 일 실시예에서는, 차세대 염기서열 분석에 적합한 염기서열을 포함하는 프라이머 쌍을 사용하여 NGS용 라이브러리를 제조하였다(도 2).
제2단계는 상기 라이브러리를 구성하는 각 유전체 조각들의 서열을 NGS를 통하여 결정하는 단계를 제공한다.
본 발명에서 용어, "유전체 조각", 및 "NGS"는 상기에서 설명한 바와 동일하다.
상기 유전체 조각들의 서열은 차세대 염기서열 분석에 사용되는 염기서열 분석 장치를 사용하여 분석할 수 있으며, 상기 염기서열 분석 장치는 차세대 염기서열 분석에 통상적으로 사용하는 장치라면 제한없이 사용이 가능하다.
상기 라이브러리는 상기 (c) 단계를 통해 차세대 염기서열 분석에 적합한 염기서열이 추가된 형태일 수 있어, 차세대 염기서열 분석에 용이하다.
제3단계는 표준 게놈 서열 상의 n개의 랜드마크를 기준으로, 상기 (c) 단계에서 제조된 증폭산물들을 정렬하여, 상기 증폭산물들을 n개로 그룹화하는 단계를 제공한다.
구체적으로, 상기 제3단계는 개체에서 분리된 게놈 DNA를 포함하는 상기 (c) 단계에서 제조된 증폭산물들을 표준 게놈 서열 상에 정렬하는 단계로서, 증폭산물들의 정렬은 1개 이상의 랜드마크를 기준으로 정렬하여 랜드마크의 개수만큼 그룹화할 수 있다.
본 발명에서 용어, "표준 게놈 서열"이란 특정 개체의 일반적이거나 평균적인 게놈 서열로서, 개별 게놈 서열의 여러 종류의 유전인자 등을 비교할 때 그 기준이 되는 게놈의 염기서열을 말한다. 본 발명에서 상기 표준 게놈 서열은 돌연변이 발생률의 측정 대상인 유전체 조각과 동일한 개체의 염기서열을 사용하며, 상기 표준 게놈 서열과 유전체 조각간의 랜드마크가 동일하여 랜드마크별 돌연변이 발생률의 측정에 용이하다.
제4단계는 그룹을 구성하는 증폭산물들을 랜덤서열 별로 서브그룹화 한 후, 서브그룹별로 1개의 유전체 조각을 선택하여, 그룹 별로 mi개의 조각을 선별하는 단계를 제공하며, 상기 mi는 i번째 랜드마크에서 선택된 유전체 조각의 수를 의미한다.
구체적으로, 상기 제4단계는 상기 제3단계에서 그룹화한 각각의 그룹 내에서 랜덤서열 별로 증폭산물들을 서브그룹화하여, 서브그룹별로 1개의 유전체 조각을 선택하여, 각 그룹별로 mi 개의 유전체 조각을 선별할 수 있다.
서브그룹별로 1개의 유전체 조각을 선택하는 경우, 각 랜덤서열 별로, 서브그룹화된 증폭산물들의 합치된 염기서열과 동일한 서열을 갖는 유전체 조각을 선택할 수 있으며, 동일한 랜덤서열에서 하나의 유전체 조각이 5개 이상의 증폭산물들로부터 지지될 때, 상기 선택된 유전체 조각이 유효한 것으로 간주할 수 있다.
제5단계는 상기 mi개의 유전체 조각들의 상호간 염기서열을 비교하여, 각 그룹 별로 돌연변이가 배제된 1개의 대표 염기서열을 결정하는 단계를 제공하고, 제6단계는 n개 그룹의 mi개의 유전체 조각들 중 각 그룹의 대표 염기서열과 상이한 염기서열을 가지는 경우를 돌연변이로 판단하여, 돌연변이의 총 개수(M)를 결정하는 단계를 제공한다.
구체적으로, 동일한 랜드마크에 속하면서 서로 다른 랜덤서열에 의해 구별된 mi개의 유전체 조각들의 염기서열을 배열하여 돌연변이가 배제된 대표 염기서열을 결정하고, 상기 대표 염기서열과 유전체 조각의 서열을 비교할 수 있다. 동일한 랜드마크에 배열된 서로 다른 랜덤서열을 가진 유전체 조각이 10개 이상일 때, 서로 다른 염기를 갖는 유전체 조각이 1개 존재하는 경우 이를 돌연변이로 분류하고, 2개 이상일 경우 다형성으로 분류하여 돌연변이의 총 개수를 결정할 수 있다.
제7단계는 하기 수학식 1을 이용하여 돌연변이 발생률(AMR)을 계산하는 단계를 제공한다.
[수학식 1]
Figure 112017047092734-pat00002
상기 화학식 1에서, AMR은 돌연변이 발생률(accumulated mutation rate)을 의미하고, M은 돌연변이의 총 개수, mi 는 i번째 랜드마크에서 선택된 유전체 조각의 수, 및 li는 i번째 랜드마크의 유전체 조각 중에서 서열이 결정되어 분석된 염기의 수를 의미한다.
본 발명의 일 실시예에서는, 인간 백혈구 세포의 28개 샘플로부터 상기 제1단계 내지 제6단계를 통해 돌연변이의 총 개수를 결정하고, 상기 수학식 1을 이용하여 돌연변이 발생률을 계산한 결과, 상기 28개의 샘플에서 10만개의 염기당 0.2 내지 2.1개의 돌연변이가 나타나며, 평균적으로 0.9개의 돌연변이가 발생하는 것을 확인하였다(도 6).
본 발명은 분석 대상 시료로부터 선택적으로 포획된 유전체 조각을 주형이 구별되는 방식으로 증폭하고 각 주형별 염기서열을 비교하여 분석된 유전체 조각의 규모와 돌연변이의 발생률을 정확하게 측정할 수 있다. 이러한 방법을 통해 환경의 변화 즉, 약물, 방사선, 유전자 구성, 노화 및 개체가 겪는 각종 스트레스 등이 대상 시료의 돌연변이 발생에 미치는 효과를 측정할 수 있어 독성실험, 의학적 시험 및 건강의 유지관리 등과 관련된 시험, 진단, 관리 및 평가에 유용하게 사용될 수 있다.
도 1은 시료로부터 돌연변이의 발생률을 측정하기 위한 방법을 나타내는 모식도이다.
도 2는 랜덤서열과 어댑터를 포함하는 유전체 조각의 DNA 서열 라이브러리를 구축하는데 사용되는 주형, 및 프라이머의 종류를 나타낸 도이다.
도 3a는 유전체 조각을 증폭한 뒤 2% 아가로스 젤에 전기영동한 결과를 나타낸 사진이다.
도 3b는 유전체 조각의 DNA 서열 라이브러리를 2% 아가로스 젤에 전기영동한 결과를 나타낸 사진이다.
도 4는 NGS를 통해 얻은 염기서열에 대한 분석 결과를 나타낸 사진이다.
도 5는 유전체 조각의 염기서열 분석 결과 1개의 서로 다른 염기서열을 갖는 유전체 조각을 표시한 사진이다.
도 6은 28개 시료의 돌연변이 발생률을 측정한 결과를 나타낸 그래프이다.
이하, 실시예를 통하여 본 발명의 구성 및 효과를 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들 실시예에 의해 한정되는 것은 아니다.
실시예 1: 유전체 조각의 DNA 서열 라이브러리 구축
한국한의학연구원 KDC에 기탁된 인간 백혈구 세포의 게놈 DNA 28개의 시료를 분양받아 도 1과 같은 방법으로 유전체 조각의 DNA 서열 라이브러리를 구축하였다.
구체적으로, 시료별 200ng의 게놈 DNA를 DpnII 제한효소를 사용하여 37℃에서 2시간동안 절단한 뒤 PCR 정제 키트(PCR purification kit)로 정제한 후 30ul 완충액(elution buffer)에 용해시켰다. 절단된 각 게놈 DNA 50ng과 랜덤서열을 포함하는 서열번호 1(5'-3': GAGCAGGTGACTCTGGCTTCCTACACGACGCTCTTCCGATCTNNNNNNNCACCCACACTTGACC,)과 서열번호 1의 3'쪽에 상보적으로 결합하여 DpnII 절단부위와 결합할 수 있는 overhang을 형성하는 서열번호 2(5'-3': AATTGGTCAAGTGTGGGTG)와의 상보적 결합체인 어댑터(adaptor) 16pmole을 DNA ligase(Solgent) 400U와 1x 버퍼가 포함된 수용액에 혼합하여 1시간동안 실온에서 반응시켰다. 상기 반응을 통해 제한효소에 의한 절단부위에 상기 어댑터를 부착시킨 후 PCR 정제 키트로 정제하여 30ul 완충액에 용해시켰다. 어댑터가 부착된 상기 DNA를 PCR반응의 주형으로 사용하기 위해 각각 1ul, 2ul, 및 4ul씩 취한 뒤, L1HS의 3´부위에 결합하는 서열번호 3의 L1_C 프라이머와 어댑터를 기준으로 5' 부위에 결합하는 서열번호 4의 A_C 프라이머를 사용하여 하기 표 1의 조건으로 PCR 반응을 수행하였다. 이때 68℃, 10분간 3' 부위의 연장반응은 어댑터의 단일가닥 부위를 채우기 위한 단계로서, 이어지는 PCR 반응에서 두 가닥 모두 증폭 반응의 주형으로 사용되도록 하기 위함이며, 다른 DNA 중합효소 (DNA polymerase)를 사용하여 독립된 반응으로 시행할 수 있다.
한편, 상기 프라이머들은 표 2와 같다.
온도(℃) 시간 비고
68 10 분 3' 연장반응
95(denaturation) 20 초 20주기(cycle) 반복 수행
58(annealing) 20 초
68(extension) 2 분
68 8 분
프라이머 종류 염기서열(5'-3')
L1_C 프라이머 GGGAGATATACCTAATGCTAGATGACAC (서열번호 3)
A_C 프라이머 GAGCAGGTGACTCTGGCTT (서열번호 4)
상기 PCR 반응 결과로 얻어진 유전체 조각의 증폭산물을 이어지는 nested PCR의 주형으로 사용하기 위해 1ul를 취하고, 증폭산물의 5' 말단에 결합하는 서열번호 5의 L1_N 프라이머와 3' 말단에 결합하는 서열번호 6의 A_N 프라이머를 사용하여 상기 표 1과 동일한 조건으로 nested PCR을 수행하였다. 상기 nested PCR 결과로 얻어진 증폭산물 0.1 ul를 취하여 서열번호 7의 NGS_F 프라이머와 서열번호 8의 NGS_R 프라이머를 사용하여 상기 표 1과 동일한 조건으로 상기 증폭산물의 양 말단에 NGS(next generation sequencing)에 필요한 염기서열을 부착함으로서 NGS 용 서열 라이브러리를 구축하였다(도 2). 이때, 증폭산물의 라이브러리를 구별하기 위해 각 라이브러리 별로 NGS_F 프라이머의 지표(index)가 서로 다른 프라이머를 사용하였다. 한편, 상기 프라이머들은 표 3과 같다.
상기 증폭산물과 구축된 라이브러리를 2% 아가로스 젤에서 전기영동하여 확인한 결과, 유사한 패턴을 나타냄을 확인하여, 상기 방법을 통해 정상적으로 돌연변이 발생률을 측정하기 위한 라이브러리의 구축이 가능함을 확인하였다(도 3a, 및 3b).
프라이머 종류 염기서열(5'-3')
L1_N 프라이머 GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTTGCACATGTACCCTAAAACTTAG(서열번호 5)
A_N 프라이머 CTACACGACGCTCTTCCGAT(서열번호 6)
NGS_F 프라이머 CAAGCAGAAGACGGCATACGAGATCGTGATGTGACTGGAGTTCAGACGTGTG(서열번호 7)
NGS_R 프라이머 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(서열번호 8)
실시예 2: NGS 데이터의 분석을 통한 돌연변이 발생률의 측정
염기서열 분석 장치(HiSeq2000, 일루미나)를 사용하여 상기 실시예 1에서 구축한 라이브러리의 증폭산물들의 염기서열을 결정하였다. 상기 증폭산물들 중에서 불분명한 염기서열이 존재하지 않고, NGS에 필요한 염기서열이 부착된 증폭산물들을 선별한 후 이들을 표준 게놈 서열에 나열하고, L1HS 랜드마크에 각각 배열하여 그룹화하였다.
각 랜드마크에 배열된 증폭산물들의 분자 지표(molecular index)가 되는 랜덤서열을 추출하여 이들이 유래한 주형별로 서브그룹화하였다. 그 후, 서브그룹화된 유전체 조각들의 기원되는 합치된 염기서열을 결정하고, 상기 염기서열을 갖는 유전체 조각을 선택하였다. 이때 하나의 랜덤서열에 5개 이상의 증폭산물들이 존재할 때 합치된 염기서열이 유효한 것으로 간주하였다.
서브그룹화한 결과, 하나의 예로서 F28 시료의 DNA를 주형으로 한 증폭산물들은 총 43,559개이고, 6122개의 랜덤서열을 갖고 있으며, 상기 증폭산물들 중 27번째 L1HS의 랜드마크에 그룹화된 증폭산물들(CL_27)은 1번 염색체의 14584433부터 14584967에 이르는 535bp 크기의 + 가닥에 배열되고, 2222bp 크기의 L1HS와 -17bp 만큼 떨어져 있음을 확인하였다. 한편, 0 내지 20개의 랜덤서열 중 0으로 표시된 첫번째 랜덤서열은 'CAAAAAG' 서열로 이루어져 있으며, 상기 랜덤서열로 서브그룹화된 증폭산물들은 20개(Read_0 내지 Read_19)이고, 1로 표시된 두번째 랜덤서열은 'TGAGAAT" 서열로 이루어져 있으며, 상기 랜덤서열로 서브그룹화된 증폭산물들은 19개(Read_0 내지 Read 18)임을 확인하였다(도 4).
한편, 동일한 랜드마크에 속하면서 서로 다른 랜덤서열에 의해 정의된 유전체 조각들의 염기서열을 서로 배열하여 돌연변이가 배제된 대표 염기서열을 결정한 후, 이를 상기 선택된 유전체 조각의 염기서열과 비교하였다. 구체적으로, 동일한 랜드마크에 배열된 서로 다른 랜덤서열을 가진 유전체 조각이 10개 이상일 때, 서로 다른 염기를 가진 1개의 유전체 조각이 존재하는 경우 이를 돌연변이로 분류하였으며, 2개 이상일 경우엔 다형성으로 분류하였다. 그 결과, 하나의 예로서 1,484번째 L1HS의 랜드마크에 그룹화된 증폭산물들(CL_1484)은 11번 염색체의 49814618부터 49814732에 이르는 115bp 크기의 - 가닥에 배열되는 것으로서, 상기 증폭산물들의 서브그룹화된 유전체 조각들 중 특정 유전체 조각에서 돌연변이의 발생하였고, 구체적으로 돌연변이가 발생한 특정 염기의 위치를 파악할 수 있음을 확인하였다. 나아가, 총 8,905개의 증폭산물들의 558,026개의 염기 중에서 6개의 염기에서 돌연변이가 발생하였음을 확인하였다(도 5).
한편 상기 1,484번째 L1HS의 랜드마크에 그룹화된 증폭산물들의 구체적인 분석 결과로서, 24개의 랜덤서열에 의해 구별된 유전체 조각의 염기서열 중 15개가 대표 염기서열과 일치함을 확인(Con_15/24)하였고, 6개의 증폭산물로 구성된 8번째 랜덤서열에서 돌연변이가 발생하였음을 확인(Mut_8_(6))하였으며, 나머지는 증폭산물의 수가 5개에 미치지 못하였거나, 증폭산물 중 일부가 대표 염기서열과 일치하지 않아 분석에서 제외되었음을 확인하였다(도 5).
분석된 랜드마크 별로 서로 다른 랜덤서열을 갖는 유전체 조각의 수와 염기서열에 포함된 염기의 총 수 및 돌연변이 사건의 총 수를 산출하여 [수학식 1]을 사용하여 돌연변이 발생률을 계산하였다.
[수학식 1]
Figure 112017047092734-pat00003
(AMR은 돌연변이 발생률(accumulated mutation rate); M은 돌연변이의 총 개수; mi 는 i번째 랜드마크에서 선택된 유전체 조각의 수; li는 i번째 랜드마크에서 포획된 유전체 조각 중에서 서열이 결정되어 분석된 염기의 수를 의미)
그 결과, 28개의 시료에서 10만개의 염기당 돌연변이 발생률이 0.2 내지 2.1개의 분포를 나타내고, 평균 0.9개의 돌연변이를 갖는 것을 확인하였다(도 6). 따라서, 본 발명의 돌연변이 발생률 측정 방법을 통해 분석된 DNA의 규모와 돌연변이의 수를 정확하게 파악할 수 있음을 확인하였다.
실시예 3: 변형된 어댑터 이용에 따른 돌연변이 발생률 측정의 정확성 향상 확인
실시예 1에서 사용했던 게놈 DNA를 AvaII 제한효소로 37℃에서 2시간동안 절단한 뒤 실시예 1과 동일하게 정제하여 완충액에 용해시켰다. 어댑터의 상보적 결합부위에 미스매치 염기쌍 1개가 포함되고 5' 말단에 인산기가 결합되어 있어 Ligation 반응에 의해 포획 DNA에 부착 가능하며 AvaII 제한효소의 절단부위가 형성되도록 서열번호 1의 염기서열과 서열번호 9(5'-3': GTCGGTCAAGTGTGGGTG)을 상보적 결합시킨 어댑터를 사용하여 실시예 1과 동일한 조건과 절차를 통해서 절단된 게놈 DNA에 부착시키고 정제하여 완충액에 용해시켰다 (도 7).
어댑터가 부착된 상기 DNA를 실시예 1과 동일한 조건과 절차를 통해 PCR 증폭 및 NGS용 library를 제작하였다. 제작된 library는 실시예 2와 동일한 과정과 절차를 통해 염기서열 결정 및 염기서열 분석을 실시하였으며, 각 랜드마크 별로 랜덤서열이 동일한 염기서열들을 나열하여 어댑터의 염기서열 1과 2의 미스매치 부위의 확인을 통해 이중 나선의 상보적 관계를 확인하였다.
따라서, 상기와 같이 변형된 어댑터를 이용하여, 서로 상보적 관계에 있는 포획 DNA의 염기서열이 서로 일치하는 변이만을 유효한 돌연변이로 선발함으로서, 실험과정에서 이중 나선의 한쪽 가닥에만 발생하는 각종 위변이들을 구별할 수 있고, 결과적으로 실험과정에서 발생하는 각종 노이즈에 의한 왜곡이 제거되어 보다 정확한 측정값을 제공할 수 있음을 확인하였다.
이상의 설명으로부터, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 이와 관련하여, 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
<110> Korea Institute of Oriental Medicine <120> Method for measuring mutation rate <130> KPA160525-KR-P1 <150> 10-2016-0075211 <151> 2016-06-16 <160> 9 <170> KoPatentIn 3.0 <210> 1 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> adaptor <400> 1 gagcaggtga ctctggcttc ctacacgacg ctcttccgat ctnnnnnnnc acccacactt 60 gacc 64 <210> 2 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> adaptor <400> 2 aattggtcaa gtgtgggtg 19 <210> 3 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> L1_C primer <400> 3 gggagatata cctaatgcta gatgacac 28 <210> 4 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> A_C primer <400> 4 gagcaggtga ctctggctt 19 <210> 5 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> L1_N primer <400> 5 gtgactggag ttcagacgtg tgctcttccg atcttgcaca tgtaccctaa aacttag 57 <210> 6 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> A_N primer <400> 6 ctacacgacg ctcttccgat 20 <210> 7 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> NGS_F primer <400> 7 caagcagaag acggcatacg agatcgtgat gtgactggag ttcagacgtg tg 52 <210> 8 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> NGS_R primer <400> 8 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 9 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> adaptor <400> 9 gtcggtcaag tgtgggtg 18

Claims (5)

  1. 하기 제1단계 내지 제7단계를 포함하는 게놈의 돌연변이 발생률의 측정 방법:
    (1) 하기 (a) 단계 내지 (c) 단계를 포함하는 차세대 염기서열 분석(Next Generation Sequencing; NGS)을 위한 라이브러리를 제조하는 제1단계:
    (a) 개체로부터 추출된, 랜드마크를 갖는 게놈 DNA를 각각 제한효소로 절단하고, 각 절단된 게놈 DNA의 양 말단에 서로 다른 랜덤서열을 포함하는 어댑터를 연결시켜 DNA-어댑터 연결체를 제조하는 단계;
    (b) 상기 (a) 단계에서 제조된 DNA-어댑터 연결체를 주형으로 하고, 상기 주형에서 랜드마크의 3' 말단에 결합하는 제1프라이머, 및 어댑터의 5' 말단에 결합하는 제2프라이머를 이용하여 PCR을 수행하여 증폭산물을 수득하는 단계; 및
    (c) 상기 (b) 단계에서 제조된 증폭산물을 주형으로 하고, 상기 주형의 양 말단에 결합하는 프라이머 쌍을 이용하여 PCR을 수행하는 단계;
    (2) 상기 라이브러리에 포함되는 각 유전체 조각들의 서열을 NGS를 통하여 결정하는 제2단계;
    (3) 표준 게놈 서열 상의 n개의 랜드마크를 기준으로, 상기 (c) 단계에서 제조된 증폭산물들을 정렬하여, 상기 증폭산물들을 n개로 그룹화하는 제3단계;
    (4) 그룹을 구성하는 증폭산물들을 랜덤서열 별로 서브그룹화한 후, mi개의 서브그룹 별로 1개의 유전체 조각을 선택하여, 그룹 별로 mi 개의 유전체 조각을 선별하는 제4단계(상기 mi는 i번째 랜드마크에서 선택된 유전체 조각의 수);
    (5) mi개의 유전체 조각들의 염기서열을 비교하여, 각 그룹 별로 돌연변이가 배제된 1개의 대표 염기서열을 결정하는 제5단계;
    (6) n개 그룹의 mi개의 유전체 조각들 중 각 그룹의 대표 염기서열과 상이한 염기서열을 가지는 경우를 돌연변이로 판단하여, 돌연변이의 총 개수(M)를 결정하는 제6단계; 및
    (7) 하기 수학식 1을 이용하여 돌연변이 발생률(AMR)을 계산하는 제7단계.

    [수학식 1]
    Figure 112017047092734-pat00004

    (AMR은 돌연변이 발생률(accumulated mutation rate); M은 돌연변이의 총 개수; mi 는 i번째 랜드마크에서 선택된 유전체 조각의 수; li는 i번째 랜드마크의 유전체 조각 중에서 서열이 결정되어 분석된 염기의 수를 의미)
  2. 제1항에 있어서, 상기 (b) 단계에서,
    상기 증폭산물은 랜드마크, 어댑터, 및 1 이상의 염기를 포함하는 것인, 측정 방법.
  3. 제1항에 있어서, 상기 단계 (b)는,
    상기 제조된 증폭산물을 주형으로 하고, 상기 랜드마크의 염기서열의 전부 또는 일부에 결합하는 정방향 프라이머와 랜덤서열을 제외한 어댑터의 전부 또는 일부에 결합하는 역방향 프라이머를 이용하여 nested PCR을 수행하는 단계를 추가로 포함하는 것인, 측정 방법.
  4. 제1항에 있어서, 상기 단계(c)에서,
    상기 프라이머 쌍은 제1프라이머 및 주형마다 상이한 지표를 포함하는 제2프라이머로 이루어지는 것인, 측정 방법.
  5. 제1항에 있어서, 상기 제6단계는 mi가 10 이상일 때, 동일한 위치에서 상이한 염기를 가진 유전체 조각이 1개 존재하는 경우, 상기 염기를 돌연변이로 판단하는 것인, 측정 방법.
KR1020170061225A 2016-06-16 2017-05-17 돌연변이 발생률의 측정 방법 KR101915701B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
PCT/KR2017/005952 WO2017217694A2 (ko) 2016-06-16 2017-06-08 돌연변이 발생률의 측정 방법
US16/310,236 US11959131B2 (en) 2016-06-16 2017-06-08 Method for measuring mutation rate
EP17813518.2A EP3474168B1 (en) 2016-06-16 2017-06-08 Method for measuring mutation rate
CN201780037881.6A CN109416930B (zh) 2016-06-16 2017-06-08 突变率测量方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020160075211 2016-06-16
KR20160075211 2016-06-16

Publications (2)

Publication Number Publication Date
KR20170142871A KR20170142871A (ko) 2017-12-28
KR101915701B1 true KR101915701B1 (ko) 2018-11-07

Family

ID=60939595

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170061225A KR101915701B1 (ko) 2016-06-16 2017-05-17 돌연변이 발생률의 측정 방법

Country Status (4)

Country Link
US (1) US11959131B2 (ko)
EP (1) EP3474168B1 (ko)
KR (1) KR101915701B1 (ko)
CN (1) CN109416930B (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11869632B2 (en) 2021-12-16 2024-01-09 Genome Insight Technology, Inc. Method and system for analyzing sequences
KR20240031934A (ko) * 2022-09-01 2024-03-08 주식회사 키오믹스 다중 표적 dna의 선택적 증폭용 조성물 및 이를 이용한 증폭 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130331279A1 (en) 2011-02-24 2013-12-12 Cornell University Recurrent spop mutations in prostate cancer
US20140227705A1 (en) 2011-04-15 2014-08-14 The Johns Hopkins University Safe sequencing system
US20150024950A1 (en) 2012-02-17 2015-01-22 Fred Hutchinson Cancer Research Center Compositions and methods for accurately identifying mutations

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100642829B1 (ko) * 2002-10-18 2006-11-10 (주)진매트릭스 염기변이 분석방법
CA2804450C (en) * 2010-07-09 2022-10-11 Max Jan van Min 3-d genomic region of interest sequencing strategies
EP3564395A1 (en) 2010-12-30 2019-11-06 Foundation Medicine, Inc. Optimization of multigene analysis of tumor samples
KR101358416B1 (ko) * 2012-02-16 2014-02-11 한국과학기술원 리가제 반응과 절단효소 증폭반응을 이용한 표적 유전자 또는 이의 돌연변이 검출방법
ES2663234T3 (es) * 2012-02-27 2018-04-11 Cellular Research, Inc Composiciones y kits para recuento molecular
WO2013181170A1 (en) * 2012-05-31 2013-12-05 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
CN104745679B (zh) * 2013-12-31 2018-06-15 杭州贝瑞和康基因诊断技术有限公司 一种无创检测egfr基因突变的方法及试剂盒
CN103757013A (zh) * 2014-01-08 2014-04-30 上海大学 用于分离Ac/Ds侧翼序列的特异性接头序列及其分离方法
KR101634958B1 (ko) 2014-06-13 2016-06-30 한국생명공학연구원 필라그린 유전자 돌연변이 검출용 프로브, 키트 및 방법
WO2016118883A1 (en) * 2015-01-23 2016-07-28 Washington University Detection of rare sequence variants, methods and compositions therefor
CN105506123B (zh) * 2016-01-11 2019-01-25 浙江大学 一种检测单碱基突变的方法及应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130331279A1 (en) 2011-02-24 2013-12-12 Cornell University Recurrent spop mutations in prostate cancer
US20140227705A1 (en) 2011-04-15 2014-08-14 The Johns Hopkins University Safe sequencing system
US20150024950A1 (en) 2012-02-17 2015-01-22 Fred Hutchinson Cancer Research Center Compositions and methods for accurately identifying mutations

Also Published As

Publication number Publication date
US20200208195A1 (en) 2020-07-02
CN109416930B (zh) 2023-02-28
EP3474168A4 (en) 2020-01-15
EP3474168A2 (en) 2019-04-24
EP3474168B1 (en) 2021-04-14
CN109416930A (zh) 2019-03-01
KR20170142871A (ko) 2017-12-28
US11959131B2 (en) 2024-04-16

Similar Documents

Publication Publication Date Title
KR20160122563A (ko) 차세대 염기서열 분석기법을 이용한 장기 이식 거부 반응 예측 방법
CN102912036A (zh) 快速检测和鉴定生物物体的方法
CN108486266B (zh) 玉米叶绿体基因组的分子标记及在品种鉴定中的应用
KR101915701B1 (ko) 돌연변이 발생률의 측정 방법
CN108517368B (zh) 利用上位性解析毛白杨LncRNA Pto-CRTG及其靶基因Pto-CAD5互作关系的方法及系统
KR102087024B1 (ko) 배추의 순도 검정 및 조기 고정 계통 선발을 위한 단일염기다형성 마커 세트 및 이의 용도
KR20190027347A (ko) 분자 바코드 및 블로킹 올리고뉴클레오티드를 이용한 소량 돌연변이 증폭 및 정량 방법
KR20230095709A (ko) 배추의 종자순도 검정을 위한 kasp 마커 세트와 효율적인 마커 개발을 위한 방법
CN108517357A (zh) 一种检测心源性猝死相关scn5a基因上心源性猝死相关snp的试剂盒及其检测方法
CN111172248B (zh) 一种基于片段分析技术验证拷贝数变异的通用试剂盒
KR20220050296A (ko) 배추 계통 구분을 위한 단일 염기 다형성 기반 마커 및 이의 용도
KR102409004B1 (ko) Emdv를 특이적으로 검출하기 위한 프라이머 세트 및 이의 용도
KR102572418B1 (ko) 양파 잿빛곰팡이 저항성 형질을 예측 또는 진단하기 위한 단일염기다형성(snp) 마커 조성물 및 이를 이용한 예측 또는 진단 방법
KR20200004980A (ko) Brca 유전자 변이를 검출하기 위한 프로브와 제조 및 검출 방법
WO2017217694A2 (ko) 돌연변이 발생률의 측정 방법
CN113981126B (zh) 与控制辣椒果实Vc含量基因连锁的SNP分子标记KQ8-4472及应用和专用引物
KR102054696B1 (ko) 포도의 위단위결과 무핵 또는 유핵 특성 판별방법
JP6646120B1 (ja) 分解されたdnaで個体識別可能なdna鑑定方法
KR102164175B1 (ko) 백수오와 이엽우피소의 엽록체 게놈 서열의 완전 해독 기반 종간 구별 마커와 프라이머 세트 및 이의 용도
US20050112569A1 (en) Method of determining blood-relationship by typing str alleles on the x chromosome and dna typing kit using the same
WO2022168195A1 (ja) 遺伝情報解析システム、及び遺伝情報解析方法
KR101964146B1 (ko) 두 개의 소규모 전장유전체 정보로부터 종내 변이 구별을 위해 다형성이 있는 ssr 마커를 선발하는 방법
CN114277183A (zh) 一种5种人肠病毒的mnp标记组合、引物对组合、试剂盒及其应用
Foster et al. A multi-gene targeted capture approach to analysing plant DNA in environmental samples: A case study using coastal habitats
JP3573130B2 (ja) 高能率ゲノム走査法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant