KR102482668B1 - 고유 분자 식별자의 표지 정확도를 증진하는 방법 - Google Patents

고유 분자 식별자의 표지 정확도를 증진하는 방법 Download PDF

Info

Publication number
KR102482668B1
KR102482668B1 KR1020200029799A KR20200029799A KR102482668B1 KR 102482668 B1 KR102482668 B1 KR 102482668B1 KR 1020200029799 A KR1020200029799 A KR 1020200029799A KR 20200029799 A KR20200029799 A KR 20200029799A KR 102482668 B1 KR102482668 B1 KR 102482668B1
Authority
KR
South Korea
Prior art keywords
unique molecular
adapter
molecular identifier
nucleic acid
labeling accuracy
Prior art date
Application number
KR1020200029799A
Other languages
English (en)
Other versions
KR20210114279A (ko
Inventor
정종석
박웅양
Original Assignee
사회복지법인 삼성생명공익재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 사회복지법인 삼성생명공익재단 filed Critical 사회복지법인 삼성생명공익재단
Priority to KR1020200029799A priority Critical patent/KR102482668B1/ko
Publication of KR20210114279A publication Critical patent/KR20210114279A/ko
Application granted granted Critical
Publication of KR102482668B1 publication Critical patent/KR102482668B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B35/00ICT specially adapted for in silico combinatorial libraries of nucleic acids, proteins or peptides
    • G16B35/10Design of libraries

Abstract

고유 분자 식별자의 표지 정확도를 증진하는 방법, 고유 분자 식별자의 표지 정확도가 증진된 핵산서열 분석용 어댑터를 제조하는 방법에 관한 것이다.

Description

고유 분자 식별자의 표지 정확도를 증진하는 방법{A method for improving the labeling accuracy of Unique Molecular Identifiers}
고유 분자 식별자의 표지 정확도를 증진하는 방법, 고유 분자 식별자의 표지 정확도가 증진된 핵산서열 분석용 어댑터를 제조하는 방법에 관한 것이다.
유전체 또는 게놈(genome)이란 한 생물이 가지는 모든 유전 정보를 말한다. 어느 한 개인의 유전체의 시퀀싱(sequencing) 또는 서열분석을 위하여, DNA 칩 및 차세대 서열분석 (Next Generation Sequencing; NGS), 차차세대 서열분석(Next Next Generation Sequencing; NNGS) 등 여러 기술들이 개발되고 있다. NGS는 연구 및 진단의 목적으로 널리 활용되고 있다. NGS는 장비의 종류에 따라 다르지만, 크게 보면 시료의 채취, 라이브러리의 제작, 및 핵산 서열분석의 수행의 총 3단계로 구분할 수 있다. 핵산 서열분석 후에는 생산된 서열분석 데이터에 기초하여, 유전자 변이 여부를 검출한다.
다수의 시료를 동시에 분석하기 위하여, 하나의 핵산 서열분석 장비에 다수의 시료를 혼합하여 투입할 수 있다. 이 경우, 혼합되는 검체는 혼합 전 각 시료를 구별하여 나타낼 수 있는 표지를 가져야 한다. 상기 표지는 중합효소 연쇄 반응 중 중합효소가 야기하는 오류, 및/또는 핵산 서열분석 과정 중에서의 감지의 오류 등으로 인하여 핵산 서열분석 결과에서의 오차를 야기할 수 있는데, 이러한 오차는 변이의 검출을 저해하는 문제점이 있다. 따라서, 다수의 시료를 구별할 수 있는 표지가 분석 대상 시료에 바르게 결합하여, 해당 시료를 정확하게 표지하는 방법이 요구된다.
한국등록특허 제1977976호
고유 분자 식별자의 표지 정확도를 증진하는 방법, 고유 분자 식별자의 표지 정확도가 증진된 핵산서열 분석용 어댑터를 제조하는 방법을 제공하는 것을 목적으로 한다.
일 양태로서, 양 말단이 아데노신(Adenosine, A), 티민(Thymine, T) 및 시토신(Cytosine, C)으로 이루어진 군에서 선택된 어느 하나인 올리고뉴클레오티드 서열로 이루어진 고유 분자 식별자(Unique Molecular Identifier; UMI)를 포함하는 핵산서열 분석용 어댑터를 분석 대상 핵산에 연결(ligation)하는 단계를 포함하는, 고유 분자 식별자의 표지 정확도를 증진하는 방법을 제공한다.
상기 고유 분자 식별자는 고유 분자 색인(Unique Molecular Index)으로도 언급될 수 있는데, 개별 핵산 분자들을 서로 구별하기 위해 사용될 수 있는, 핵산 분자에서 적용된 또는 확인된 뉴클레오티드의 서열이다. 고유 분자 식별자는 분석 대상 서열들이 한 공급원 핵산 분자의 것인지 또는 다른 공급원 핵산 분자의 것인지를 측정하기 위하여 연계되는 핵산 분자와 함께 서열분석될 수 있다. 고유 분자 식별자는 통상적으로 한 샘플의 분석을 다른 샘플의 분석과 구별하기 위해 사용되는 바코드에 유사하지만, 고유 분자 식별자는 대신 많은 핵산 분자가 함께 서열분석될 때 한 공급원 핵산 분자를 다른 것들과 구별하기 위해 사용된다.
상기 고유 분자 식별자는 이를 이루고 있는 올리고뉴클레오티드 서열의 양 말단이 아데노신(A), 티민(T) 및 시토신(C)으로 이루어진 군에서 선택된 어느 하나인 것으로서, 양 말단이 구아닌(Guanine, G)이 아닌 것을 의미하는 것일 수 있는데, 도 1에서 확인할 수 있듯, 종래 알려진 고유 분자 식별자를 이용하여 표지를 수행하였으나 오표지(mis-label)된 경우 그 올리고뉴클레오티드 내 구아닌의 비율이 높은 것을 발견함에 따라, 이를 양 말단에서 제거하여 표지 정확도를 현저히 상승시키고자 하는 목적일 수 있다.
상기 어댑터는 당업계에서 핵산서열 분석에 사용되는 통상의 어댑터 구조를 갖는 것일 수 있는데, 구체적으로 도 2에 도시된 어댑터의 형태일 수 있다. 보다 구체적으로, 상기 어댑터는 Illumina 사의 고유 분자 식별자가 도입된 어댑터 구조일 수 있는데, 부분적으로 이중가닥이고 2개의 가닥에 해당하는 2개의 올리고뉴클레오타이드를 어닐링함으로써 형성되는 것일 수 있다. 상기 2개의 가닥은 서열분석 대상 핵산단편과 연결될 단부에서 2개의 올리고뉴클레오타이드가 어닐링되는 것을 허용하는 약간의 상보적인 염기쌍(예컨대 12 내지 17 bp)을 가질 수 있다. 다른 염기쌍은 2 가닥에서 상보적이지 않으며, 그 결과 2개의 돌출부를 가진 포크형상의 어댑터가 도출될 수 있다.
상기 고유 분자 식별자는 당업계에 널리 알려진 방법을 이용하여 핵산서열 분석용 어댑터 내에 포함시킬 수 있는데, 예를 들면, 중합효소, 엔도뉴클라아제, 전위효소 등을 이용한 연결 또는 전위에 의해, 물리적으로 연결 또는 결합시켜 포함시킬 수 있다.
상기 어댑터는 전체가 아데노신(A), 티민(T) 및 시토신(C)로 이루어진 군에서 선택된 어느 하나인 올리고뉴클레오티드 서열로 이루어진 고유 분자 식별자를 포함하는 것일 수 있는데, 이러한 경우, 고유 분자 식별자를 이루는 올리고뉴클레오티드 내 구아닌을 하나도 포함하지 않아, 고유 분자 식별자의 오표지의 절대량을 현저히 감소시킬 수 있다는 장점이 존재할 수 있다.
상기 고유 분자 식별자는 2 내지 40, 2 내지 35, 2 내지 30, 2 내지 25, 2 내지 20, 2 내지 15, 2 내지 10, 2 내지 6, 2 내지 5 또는 3 내지 5 뉴클레오티드 길이일 수 있고, 적절한 길이를 확보하여 표지의 정확도를 증진시킨다는 측면에서 바람직하게는 2 내지 6 또는 3 내지 5 뉴클레오티드 길이일 수 있으나, 반드시 이에 제한되는 것은 아니다.
상기 고유 분자 식별자를 포함하는 어댑터와 분석 대상 핵산을 연결(ligation)하는 단계에 있어서, 분석 대상 핵산이 포함되어 있는 라이브러리의 농도 대비 상기 고유 분자 식별자를 포함하는 어댑터의 농도를 설정하는 단계를 포함할 수 있다. 이러한 경우, 라이브러리 농도 대비 어댑터의 농도를 설정함에 따라 고유 분자 식별자의 오표지율을 조절하거나, 더욱 현저히 낮출 수 있는 효과가 있다. 구체적으로, 라이브러리의 농도 대비 어댑터의 농도를 102 내지 105, 103 내지 105, 104 내지 105, 102 내지 104 또는 103 내지 104 배로 설정할 수 있고, 바람직한 일 실시예에 따를 때, 103 내지 105 배로 설정할 수 있다.
상기 방법에 있어서, 상기 고유 분자 식별자를 포함하는 어댑터를 분석 대상 핵산시료에 연결하는 단계 후, 잔여 어댑터를 제거하는 정제(purification) 단계를 더 포함할 수 있다. 이러한 경우, 어댑터보다 더 길이가 긴 라이브러리의 정제 비율을 높여 강도(stringency)를 높일 수 있고, 고유 분자 식별자의 오표지율을 더욱 현저히 낮출 수 있는 효과가 있다. 정제 단계의 조건은 라이브러리의 농도와 어댑터의 농도를 고려하여 실시자가 적절히 설정할 수 있고, 구체적은 예시로서, 자성 비드(예를 들면, SPRI(Solid Phase Reversible Immobilization) 자성 비드)를 이용한 정제의 경우, 1.8X보다 낮게 자성의 부피 비율을 설정하거나, 정제 과정을 1 내지 5회, 1 내지 4회, 1 내지 3회 또는 2 내지 4회 실시할 수 있다. 구체적인 실시예로서, 정제 과정을 2회 실시한 경우, 1회 실시한 경우 대비 고유 분자 식별자의 오표지율이 현저히 낮음을 확인할 수 있다.
상기 핵산서열 분석은 고유 분자 식별자를 포함하는 어댑터를 사용하는 분석방법이라면 어떠한 것이든 선택할 수 있고, 특별히 제한되지 아니하며, 구체적인 예로서는 차세대 핵산 서열분석(Next Generation Sequencing)일 수 있다.
일 양태로서, 양 말단이 아데노신(A), 티민(T) 및 시토신(C)으로 이루어진 군에서 선택된 어느 하나인 올리고뉴클레오티드 서열로 이루어진 고유 분자 식별자(Unique Molecular Identifier)를 핵산서열 분석용 어댑터에 포함시키는 단계를 포함하는, 고유 분자 식별자의 표지 정확도가 증진된 핵산서열 분석용 어댑터를 제조하는 방법을 제공한다.
상기 방법은 전체가 아데노신(A), 티민(T) 및 시토신(C)로 이루어진 군에서 선택된 어느 하나인 올리고뉴클레오티드 서열로 이루어진 고유 분자 식별자를 핵산서열 분석용 어댑터에 포함시키는 단계를 포함할 수 있다.
상기 고유 분자 식별자, 이의 길이, 이를 어댑터에 포함하는 방법, 핵산서열 분석 등에 관련된 구체적인 설명은 상술한 바와 같다.
상기 방법에 의해 제조되는 핵산서열 분석용 어댑터는 특이서열을 갖도록 설계된 올리고뉴클레오티드로 이루어진 고유 분자 식별자를 포함하고 있어, 서열 분석시 표지능이 종래기술 대비 현저히 높고, 오표지율이 현저히 낮다는 장점이 있다.
일 양태로서 제공되는 고유 분자 식별자(Unique Molecular Identifier)의 표지 정확도를 증진하는 방법은, 고유 분자 식별자를 구성하는 올리고뉴클레오티드의 양 말단에 구아닌(G)을 포함하지 않아 표지의 정확도를 현저히 향상시킬 수 있다. 이로써, 고유 분자 식별자를 활용한 중복된 리드를 제거할 수 있고, 고유 분자 식별자의 본래 목적인 고유 분자를 확보하는 데에 있어 그 효율을 현저히 향상시킬 수 있다.
도 1은 고유 분자 식별자의 표지가 잘못된 경우에 있어서, 상기 고유 분자 식별자를 구성하는 올리고뉴클레오티드 서열 내 구아닌의 함량을 나타낸 것이다.
도 2는 일 양태로서 제공하는 고유 분자 식별자의 표지 정확도가 증진된 어댑터를 도식화한 것으로서, (1)은 전체에 구아닌이 없는 경우(HHHH), (2)는 양 말단에 구아닌이 없는 경우(HNNH), (3)은 양 말단에 구아닌을 포함하는 4가지 뉴클레오티드가 모두 존재할 수 있는 경우(NNNN)를 나타낸 것이다(H: 구아닌이 아닌 3개의 뉴클레오티드 중 하나, N: 구아닌을 포함하는 4가지 뉴클레오티드 중 하나).
도 3, 4는 도 2의 어댑터를 각각 이용하여 서열분석 대상 핵산시료에 표지를 수행한 후, 그 표지 정확도를 확인한 결과이다.
이하, 보다 구체적으로 설명하기 위해 실시예를 들어 상세하게 설명하기로 한다.
실시예 1. 고유 분자 식별자를 포함하는 어댑터의 제작
어닐링 버퍼(annealing buffer)로서, 1X TE (10 mM Tris pH 8.0, 1 mM EDTA) 9.9ml와 5 M NaCl 0.1ml을 혼합하여 제조하였다. 고유 분자 식별자를 포함하는 어댑터로서, 상기 어닐링 버퍼 50ul, 100uM 범용 어댑터 올리고뉴클레오티드(universal adaptor oligo) 25ul 및 100uM 고유 분자 식별자가 삽입된 어댑터 올리고뉴클레오티드(UMI embedded adaptor oligo) 25ul를 혼합하여 제조하였다. 상기 어댑터가 포함된 용액을 서포사이클러(thermocycler)를 이용하여 95C 1분, -0.1C/초 온도 기울기(gradient temperature) 조건으로 800초, 14C 종료하여 어댑터를 어닐링하였다. 최종적으로 제조된 어댑터의 서열은 하기 표 1에 나타내었다.
어댑터 서열
UMI:NNNN /5Phos/GAGAGATCGGAAGAGCACACGTCTGAACTCCAGTCACCACGNNNNATCTCGTATGCCGTCTTCTGCTTG
UMI:HNNH /5Phos/GAGAGATCGGAAGAGCACACGTCTGAACTCCAGTCACCACGNHHNATCTCGTATGCCGTCTTCTGCTTG
UMI:HHHH /5Phos/GAGAGATCGGAAGAGCACACGTCTGAACTCCAGTCACCACGHHHHATCTCGTATGCCGTCTTCTGCTTG
범용어댑터 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTGACT
실시예 2. 고유 분자 식별자의 서열 변화에 의한 표지 정확도 분석
1. 실험방법
200ng의 셀라인 genomic DNA (NA12878)를 사용하여, 양 3' 말단에 아데닐화(adenylation)를 완료한 라이브러리와, 고유 분자 식별자를 포함하는 어댑터(25μM stock)을 제조사 반응 조건에 따라(라이브러리 제작 키트: KAPA hyper library prep kit for Illumina) 하기 표 2의 반응용액을 조성하였다. 반응조건은 4C, overnight으로 설정하였고, 이 후, SPRI 비드를 이용하여 정제과정을 수행하였다.
성분 부피(μl)
A-tailing reaction product 60
Adapter stock 5
PCR-grade water 5
Ligation Buffer 30
DNA Ligase 10
Total volume 110
분석 대상 핵산으로서 사용된 합성 핵산 단편(artificial fragment)은 하기 표 3에 나타내었다. 모든 합성 핵산 단편은 인간 게놈과 매칭되는 부분의 5' 말단에 CTTC, 3' 말단에 GAAG를 포함하도록 제작하여, 이 후 raw 데이터(fastaq)에서 추출이 가능하도록 제작하였다. 추출방법으로, 해당서열의 5' 부분부터 50bp 의 시퀀스를 동일하게 가지고 있는 시퀀서를 fastq file에서 추출하였다.
Reference position Artificial fragment sequence
1 KRAS : Chr12 :

Exon number: 3
chr12:25380168-25380346
CTTCATCCTGAGAAGGGAGAAACACAGTCTGGATTATTACAGTGCACCTTTTACTTCAAAAAAGGTGTTATATACAACTCAACAACAAAAAATTCAATTTAAAAATGGGCAAAGGACTTGAAAAGACATTGTTCCTGCTCCAAAGAGAAG
2 IDH1 : Chr2

Exon number: 4 :
chr2:209113048-209113359
CTTCAATGGCTTCTCTGAAGACCGTGCCACCCAGAATATTTCGTATGGTGCCATTTGGTGATTTCCACATTTGTTTCAACTTGAACTCCTCAACCCTCTTCTCATCAGGAGTGATAGTGGCACATTTGACGCCAACATTATGCTTCGAAG
3 BRAC1 : Chr17

Exon number: 15 :

chr17:41222945-41223255
CTTCTTCTGGCTTCTCCCTGCTCACACTTTCTTCCATTGCATTATACCCAGCAGTATCAGTAGTATGAGCAGCAGCTGGACTCTGGGCAGATTCTGCAACTTTCAACTTTCAATTGGGGAACTTTCAATGCAGAGGTTGAAGATGGGAAG
4 ALK : Chr2

Exon number: 20:

chr2:29446208-29446394
CTTCACTGATGGAGGAGGTCTTGCCAGCAAAGCAGTAGTTGGGGTTGTAGTCGGTCATGATGGTCGAGGTGCGGAGCTTGCTCAGCTTGTACTCAGGGCTCTGCAGCTCCATCTGCATGGCTTGCAGCTCCTGGTGCTTCCGGCGGGAAG
5 ERBB2 : Chr17

Exon number: 6:

chr17:37864574-37864787
CTTCGCTACGTGCTCATCGCTCACAACCAAGTGAGGCAGGTCCCACTGCAGAGGCTGCGGATTGTGCGAGGCACCCAGCTCTTTGAGGACAACTATGCCCTGGCCGTGCTAGACAATGGAGACCCGCTGAACAATACCACCCCTGTGAAG
2. 실험결과
어댑터의 연결조건 및 라이브러리 정제조건 별로 'G' 시퀀스를 제거한 'HHHH' UMI 어댑터에서는 오표지된 UMI내에 'G' 시퀀스의 비율이 없는 것으로 나타났고, 부분적으로 양 끝의 'G' 시퀀스를 제거한 UMI 어댑터를 사용하였을 때는 그 비율이 NNNN의 UMI보다 낮은 것을 확인할 수 있었다. 또한, 어댑터의 연결조건 및 라이브러리 정제조건에 따라 오표지된 UMI 리드의 수가 상관성 있게 변하는 것을 관찰하였다(도 3, 4).
이를 최종적으로 오표지된 리드의 비율을 조건별로 살펴보면, 'HNNH' UMI(부분적으로 양 끝의 'G' 시퀀스 제거)를 사용하고, 라이브러리 농도 대비 1/10000배의 어댑터 농도(최종 어댑터의 농도: 136nM)로 4C 오버나이트 조건으로 연결하며, 연결 후 정제 대상 용액의 부피의 1.8X SPRI(Solid Phase Reversible Immobilization) 정제 비드 조건으로 2회 정제한 경우 UMI 시퀀스가 정확하게 표지되는 비율이 가장 높았다.
<110> SAMSUNG LIFE PUBLIC WELFARE FOUNDATION <120> A method for improving the labeling accuracy of Unique Molecular Identifiers <130> PN129687KR <160> 9 <170> KoPatentIn 3.0 <210> 1 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> UMI:NNNN <400> 1 gagagatcgg aagagcacac gtctgaactc cagtcaccac gnnnnatctc gtatgccgtc 60 ttctgcttg 69 <210> 2 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> UMI:HNNH <400> 2 gagagatcgg aagagcacac gtctgaactc cagtcaccac gnhhnatctc gtatgccgtc 60 ttctgcttg 69 <210> 3 <211> 69 <212> DNA <213> Artificial Sequence <220> <223> UMI:HHHH <400> 3 gagagatcgg aagagcacac gtctgaactc cagtcaccac ghhhhatctc gtatgccgtc 60 ttctgcttg 69 <210> 4 <211> 62 <212> DNA <213> Artificial Sequence <220> <223> Universal Adaptor <400> 4 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatctga 60 ct 62 <210> 5 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> KRAS chr12:25380168-25380346 <400> 5 cttcatcctg agaagggaga aacacagtct ggattattac agtgcacctt ttacttcaaa 60 aaaggtgtta tatacaactc aacaacaaaa aattcaattt aaaaatgggc aaaggacttg 120 aaaagacatt gttcctgctc caaagagaag 150 <210> 6 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> IDH1 chr2:209113048-209113359 <400> 6 cttcaatggc ttctctgaag accgtgccac ccagaatatt tcgtatggtg ccatttggtg 60 atttccacat ttgtttcaac ttgaactcct caaccctctt ctcatcagga gtgatagtgg 120 cacatttgac gccaacatta tgcttcgaag 150 <210> 7 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> BRAC1 chr17:41222945-41223255 <400> 7 cttcttctgg cttctccctg ctcacacttt cttccattgc attataccca gcagtatcag 60 tagtatgagc agcagctgga ctctgggcag attctgcaac tttcaacttt caattgggga 120 actttcaatg cagaggttga agatgggaag 150 <210> 8 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> ALK chr2:29446208-29446394 <400> 8 cttcactgat ggaggaggtc ttgccagcaa agcagtagtt ggggttgtag tcggtcatga 60 tggtcgaggt gcggagcttg ctcagcttgt actcagggct ctgcagctcc atctgcatgg 120 cttgcagctc ctggtgcttc cggcgggaag 150 <210> 9 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> ERBB2 chr17:37864574-37864787 <400> 9 cttcgctacg tgctcatcgc tcacaaccaa gtgaggcagg tcccactgca gaggctgcgg 60 attgtgcgag gcacccagct ctttgaggac aactatgccc tggccgtgct agacaatgga 120 gacccgctga acaataccac ccctgtgaag 150

Claims (10)

  1. 양 말단이 아데노신(A), 티민(T) 및 시토신(C)으로 이루어진 군에서 선택된 어느 하나인 올리고뉴클레오티드 서열로 이루어진 고유 분자 식별자(Unique Molecular Identifier)를 포함하는 핵산서열 분석용 어댑터를 분석 대상 핵산에 연결하는 단계를 포함하는, 고유 분자 식별자의 표지 정확도를 증진하는 방법으로서, 상기 고유 분자 식별자는 2 내지 6 뉴클레오티드 길이인 방법.
  2. 청구항 1에 있어서, 상기 어댑터는 전체가 아데노신(A), 티민(T) 및 시토신(C)로 이루어진 군에서 선택된 어느 하나인 올리고뉴클레오티드 서열로 이루어진 고유 분자 식별자를 포함하는 것인 방법.
  3. 삭제
  4. 청구항 1에 있어서, 상기 연결하는 단계는 분석 대상 핵산 대비 어댑터의 농도를 103 내지 105배로 설정 후 연결하는 단계를 포함하는 방법.
  5. 청구항 1에 있어서, 상기 연결하는 단계 후, 자성 비드를 이용한 정제 과정을 1회 내지 5회 수행하는 단계를 더 포함하는 방법.
  6. 청구항 1에 있어서, 상기 분석은 차세대 핵산 서열분석(Next Generation Sequencing)인 방법.
  7. 양 말단이 아데노신(A), 티민(T) 및 시토신(C)으로 이루어진 군에서 선택된 어느 하나인 올리고뉴클레오티드 서열로 이루어진 고유 분자 식별자(Unique Molecular Identifier)를 핵산서열 분석용 어댑터에 포함시키는 단계를 포함하는, 고유 분자 식별자의 표지 정확도가 증진된 핵산서열 분석용 어댑터를 제조하는 방법으로서,
    상기 고유 분자 식별자는 2 내지 6 뉴클레오티드 길이인 방법.
  8. 청구항 7에 있어서, 상기 방법은 전체가 아데노신(A), 티민(T) 및 시토신(C)로 이루어진 군에서 선택된 어느 하나인 올리고뉴클레오티드 서열로 이루어진 고유 분자 식별자를 핵산서열 분석용 어댑터에 포함시키는 단계를 포함하는 방법.
  9. 삭제
  10. 청구항 7에 있어서, 상기 분석은 차세대 핵산 서열분석(Next Generation Sequencing)인 방법.
KR1020200029799A 2020-03-10 2020-03-10 고유 분자 식별자의 표지 정확도를 증진하는 방법 KR102482668B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200029799A KR102482668B1 (ko) 2020-03-10 2020-03-10 고유 분자 식별자의 표지 정확도를 증진하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200029799A KR102482668B1 (ko) 2020-03-10 2020-03-10 고유 분자 식별자의 표지 정확도를 증진하는 방법

Publications (2)

Publication Number Publication Date
KR20210114279A KR20210114279A (ko) 2021-09-23
KR102482668B1 true KR102482668B1 (ko) 2022-12-29

Family

ID=77926367

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200029799A KR102482668B1 (ko) 2020-03-10 2020-03-10 고유 분자 식별자의 표지 정확도를 증진하는 방법

Country Status (1)

Country Link
KR (1) KR102482668B1 (ko)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140141982A1 (en) 2012-04-24 2014-05-22 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
JP2014513523A (ja) 2011-04-13 2014-06-05 スペイシャル トランスクリプトミクス アーベー 組織試料中の核酸の局在化された検出、又は空間的検出のための方法及び生成物
JP2019520046A (ja) * 2016-05-02 2019-07-18 セルラー リサーチ, インコーポレイテッド 正確な分子バーコーディング

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK3452591T3 (da) * 2016-05-02 2023-09-18 Encodia Inc Makromolekyleanalyse under anvendelse af nukleinsyrekodning
EP3559231B1 (en) * 2016-11-11 2022-08-17 Bio-Rad Laboratories, Inc. Methods for processing nucleic acid samples
KR101977976B1 (ko) 2017-08-10 2019-05-14 주식회사 엔젠바이오 앰플리콘 기반 차세대 염기서열 분석기법에서 프라이머 서열을 제거하여 분석의 정확도를 높이는 방법
DK3707723T3 (da) * 2017-11-06 2023-12-18 Illumina Inc Teknikker til indeksering af nukleinsyrer

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014513523A (ja) 2011-04-13 2014-06-05 スペイシャル トランスクリプトミクス アーベー 組織試料中の核酸の局在化された検出、又は空間的検出のための方法及び生成物
US20140141982A1 (en) 2012-04-24 2014-05-22 Gen9, Inc. Methods for sorting nucleic acids and multiplexed preparative in vitro cloning
JP2019520046A (ja) * 2016-05-02 2019-07-18 セルラー リサーチ, インコーポレイテッド 正確な分子バーコーディング

Also Published As

Publication number Publication date
KR20210114279A (ko) 2021-09-23

Similar Documents

Publication Publication Date Title
KR101858344B1 (ko) 바코드 서열을 포함하는 어댑터를 이용한 차세대 염기서열 분석 방법
US20180363053A1 (en) Methods of lowering the error rate of massively parallel dna sequencing using duplex consensus sequencing
CN105779636B (zh) 用于扩增人乳腺癌易感基因brca1和brca2编码序列的pcr引物及应用
JP2019523638A (ja) 遺伝子突然変異を検出するマルチポジショニングダブルタグアダプターセット、及びその調製方法と応用
JP6860662B2 (ja) キメラ生成物の同定のためのバーコードを付けられた環状ライブラリーの構築
EP3607065B1 (en) Method and kit for constructing nucleic acid library
EP2531610B1 (en) Complexitiy reduction method
KR20140024270A (ko) 종양 샘플의 다유전자 분석의 최적화
EP3885445B1 (en) Methods of attaching adapters to sample nucleic acids
KR20170133270A (ko) 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도
CN106939344A (zh) 用于二代测序的接头
CN108359723B (zh) 一种降低深度测序错误的方法
US20180291369A1 (en) Error-proof nucleic acid library construction method and kit
KR102482668B1 (ko) 고유 분자 식별자의 표지 정확도를 증진하는 방법
EP2333104A1 (en) RNA analytics method
EP3474168B1 (en) Method for measuring mutation rate
US20190218606A1 (en) Methods of reducing errors in deep sequencing
US20220364080A1 (en) Methods for dna library generation to facilitate the detection and reporting of low frequency variants
KR20220074756A (ko) Pcr 과정 동안 생성되는 가닥들의 정보를 연결하여 하나의 클러스터를 만들고, 생성된 가닥들의 생성 순서를 추적할 수 있는 방법
CN114774517A (zh) 一种人免疫组库测序的方法及试剂盒
KR102342490B1 (ko) 분자 인덱스된 바이설파이트 시퀀싱
KR101967879B1 (ko) 핵산 서열분석에서 uid 핵산 서열의 순결도를 측정하는 방법
US20210115435A1 (en) Error-proof nucleic acid library construction method
KR20220122095A (ko) 분자 바코딩 효율을 향상시키기 위한 조성물 및 이의 용도
Patent European patent

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant