KR101953663B1 - 하나의 올리고뉴클레오티드를 이용해서 올리고뉴클레오티드 풀을 생산하는 방법 - Google Patents

하나의 올리고뉴클레오티드를 이용해서 올리고뉴클레오티드 풀을 생산하는 방법 Download PDF

Info

Publication number
KR101953663B1
KR101953663B1 KR1020170028336A KR20170028336A KR101953663B1 KR 101953663 B1 KR101953663 B1 KR 101953663B1 KR 1020170028336 A KR1020170028336 A KR 1020170028336A KR 20170028336 A KR20170028336 A KR 20170028336A KR 101953663 B1 KR101953663 B1 KR 101953663B1
Authority
KR
South Korea
Prior art keywords
oligonucleotide
clone
oligonucleotides
nucleotide sequence
sequence
Prior art date
Application number
KR1020170028336A
Other languages
English (en)
Other versions
KR20170103702A (ko
Inventor
방두희
황병진
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Publication of KR20170103702A publication Critical patent/KR20170103702A/ko
Application granted granted Critical
Publication of KR101953663B1 publication Critical patent/KR101953663B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Immunology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

본 발명은 본 발명은 하나의 올리고뉴클레오티드 및 차세대 시퀀싱(next generation sequencing, NGS)을 이용하여 다양한 염기서열 조합을 갖는 올리고뉴클레오티드의 풀(pool)을 생산하는 방법에 관한 것이다. 본 발명에 따르면, 종래 비용 및 시간이 많이 소요되었던 마이크로어레이칩의 사용이 필요없고, 다양한 조합의 올리고뉴클레오티드를 얻기 위한 많은 횟수의 합성단계를 줄일 수 있어 비용 및 시간 효율적으로 올리고뉴클레오티드 풀을 생산할 수 있다. 또한, 본 발명의 방법에 의하는 경우, 올리고뉴클레오티드 풀을 생산하는 단계를 간소화 하였는바, 생산 및 활용 가능한 올리고뉴클레오티드 조합의 수를 기하급수적으로 늘릴 수 있고, 유전물질의 다양한 용도 확장을 가능하게 할 수 있다.

Description

하나의 올리고뉴클레오티드를 이용해서 올리고뉴클레오티드 풀을 생산하는 방법 {METHOD FOR GENERATING POOL CONTAINING OLIGONUCLEOTIDES FROM A OLIGONUCLEOTIDE}
본 발명은 하나의 올리고뉴클레오티드 및 차세대 시퀀싱(next generation sequencing, NGS)을 이용하여 마이크로어레이를 사용하지 않고도 다양한 염기서열 조합을 갖는 올리고뉴클레오티드의 풀(pool)을 생산하는 방법에 관한 것이다.
다양한 분야의 빅데이터가 급증하면서 디지털 보존에 많은 어려움이 따른다. 자기 및 광학을 포함한 대부분의 저장 미디어는 성능의 저하가 쉽고, 관련 사업이 빠른 속도로 성장하고 있어, 검색 및 재생 기술이 구식화되는 문제가 있다.
최근 프로그램화 할 수 있는 마이크로어레이 합성(programmable microarray synthesis)에서 칩(chip) 당 수백만 개의 올리고뉴클레오티드까지 처리량이 확대될 정도의 산업 발전에도 불구하고, 현재의 어레이를 이용한 합성방법은 다량의 올리고뉴클레오티드를 포함하는 풀을 얻기 위해서는 필요한 서열을 갖는 올리고뉴클레오티드를 여러 개 합성해야하므로 많은 비용 및 노력이 소모되기 때문에, 마이크로어레이 합성을 이용해서 여러 번의 가설 시험을 수행하는 데는 여전히 어려움이 있다. 또한, 마이크로어레이 칩을 제조하기 위해서는 DNA 염기의 동시 침전에 대한 정교한 제어가 필요하기 때문에 1마이크론 미만(sub-micron)의 크기로 DNA 마이크로어레이 칩을 제조하는 것은 매우 어려운 일 이다.
그러나, DNA 작성(writing) 분야와 달리, 혁신적인 기술과 산업 간의 경쟁으로 기본적인 시퀀싱 비용은 지난 몇 년 동안 급격히 떨어졌다. 따라서, 최첨단 DNA 작성(writing) 및 해독(reading) 사이의 처리 능력 사이의 격차가 벌어지는 것은 피할 수 없고, 이는 결과적으로 대용량 유전 물질 또는 기억 물질로 합성 DNA의 용도를 확장하는데 걸림돌이 될 수 있다. 따라서, 유전물질의 합성을 더욱 효율적이고, 경제적으로 진행할 수 있는 방안에 대한 지속적인 연구가 해결되어야 할 과제로 남아있다.
종래 복수 개의 올리고뉴클레오티드를 포함하는 풀을 생산하기 위해서는 마이크로어레이를 이용한 합성이 필요했으나, 마이크로어레이 칩 제조를 위해 많은 종류의 올리고뉴클레오티드의 합성이 필요해 시간 및 노력이 많이 소요되는 문제가 있었다. 이에 본 발명자들은 마이크로어레이 칩을 이용한 단계 수행 없이도 다양한 염기서열의 조합을 가지는 올리고뉴클레오티드들의 풀을 생산할 수 있는 새로운 패러다임을 제공한다. 또한, 본 발명의 새로운 올리고뉴클레오티드 풀을 생산하는 방법을 이용하여 DNA에 정보를 저장하는 방법 및 상기 정보를 해독하는 방법을 제공한다.
상기 종래 문제점을 해결하기 위해, 본 발명은 하나의 올리고뉴클레오티드로부터 복수 개의 클론 올리고뉴클레오티드를 합성하는 단계; 및 상기 합성된 복수 개의 클론 올리고뉴클레오티드에 대하여 차세대 시퀀싱을 수행하여 클론 올리고뉴클레오티드 각각의 전체 염기서열을 확인하는 단계;를 포함하는(여기에서, 상기 합성은 클론 올리고뉴클레오티드가 랜덤 부위를 포함하도록 수행되며, 상기 랜덤 부위는 길이가 R mer이고, A, T, C, G로 만들어 질 수 있는 염기서열 4R 개로 이루어진 군에서 선택된 어느 하나의 염기서열로 이루어진 것이다), 복수 개의 클론 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드 풀(pool)을 생산하는 방법을 제공한다.
또한, 본 발명은 하나의 올리고뉴클레오티드로부터 복수 개의 클론 올리고뉴클레오티드를 합성하는 단계; 상기 합성된 복수 개의 클론 올리고뉴클레오티드에 대하여 차세대 시퀀싱을 수행하여 클론 올리고뉴클레오티드 각각의 전체 염기서열을 확인하는 단계; 상기 전체 염기서열이 확인된 각각의 클론 올리고뉴클레오티드 랜덤 부위의 염기서열을 x-y좌표 상에 입력하여 맵핑하는 단계; 및 상기 시퀀싱 플레이트로부터 저장하고자 하는 정보를 인코딩한 염기서열과 매칭되는 염기서열을 포함하는 클론 올리고뉴클레오티드를 선택하는 단계;를 포함하는(여기에서, 상기 합성은 클론 올리고뉴클레오티드가 랜덤 부위를 포함하도록 수행되며, 상기 랜덤 부위는 길이가 R mer이고, A, T, C, G로 만들어 질 수 있는 염기서열 4R 개로 이루어진 군에서 선택된 어느 하나의 염기서열로 이루어진 것이며, 상기 랜덤 부위의 염기서열은 위치(address) 정보를 암호화하는 위치서열 및 데이터 정보를 암호화하는 데이터서열로 이루어진 것이다) DNA에 정보를 저장하는 방법을 제공한다.
또한, 본 발명은 상기 DNA 저장된 정보를 인코딩과 역방향으로 디코딩하는 단계를 포함하는 DNA에 저장된 정보를 해독하는 방법을 제공한다.
또한, 서열번호 1의 염기서열 또는 서열번호 2의 염기서열로 이루어진 올리고뉴클레오티드를 제공한다.
본 발명의 방법에 따르면, 올리고뉴클레오티드 풀을 생산하기 위해 많은 올리고뉴클레오티드를 각각 합성해야 하는 종래의 마이크로어레이 방법과 비교해서, 한 번의 합성으로 다양한 염기서열의 조합의 올리고뉴클레오티드를 생산할 수 있어, 수백~수만 회의 합성단계를 줄일 수 있고, 사용 가능한 염기서열 조합이 시퀀싱 처리량(throughput)이 증가함에 따라 기하급수적으로 증가하므로 효과적인 DNA 합성, 대용량의 유전물질 생산, 저장매체로 DNA 활용 등의 용도 확장을 가능하게 한다.
도 1은 본 발명의 일 실시예에 따른 올리고뉴클레오티드 풀을 생산하기 위한 올리고뉴클레오티드의 구조를 나타내는 계략도이다.
도 2는 본 발명의 일 실시예에 따른 올리고뉴클레오티드의 어닐링 및 익스텐션의 결과물을 전기영동으로 확인한 결과를 나타낸다.
도 3은 본 발명의 일 실시예에 올리고뉴클레오티드 풀에 포함된 복수 개의 클론 올리고뉴클레오티드의 차세대 시퀀싱 후, 리드(read) 길이 분포(A), GC 비율(B) 및 동일한 염기서열이 읽힌 횟수(C)를 분석한 그래프이다.
도 4는 본 발명의 일 실시예에 따른 시뮬레이션을 통해서 NGS 리드 수에 따라 얻어질 수 있는 클론 올리고뉴클레오티드의 염기서열의 조합에 대한 커버율을 확인한 결과이다.
도 5는 본 발명의 일 실시예에 따른 시뮬레이션을 통해서 실제 데이터를 다운 샘플링 하여, 최대의 컨텐츠를 얻기 위해 필요한 리드 수를 확인한 결과이다.
도 6은 본 발명의 일 실시예에 따른 시뮬레이션을 통해서 랜덤부위의 염기의 길이가 증가함에 따라 리드 수에 따른 염기서열의 조합을 커버할 수 있는 비율을 확인 한 결과이다.
도 7은 본 발명의 일 실시예에 따른 DNA에 정보를 저장하는 방법을 개략적으로 보여주는 도이다.
도 8은 본 발명의 일 실시예에 따른 시뮬레이션을 통해서 랜덤부위의 염기의 길이가 증가함에 따라 저장할 수 있는 정보의 확장을 확인 한 결과이다.
도 9는 본 발명의 일 실시예에 따른 인코딩된 대상정보를 8개의 튜브에 중복하여 풀을 형성(pooling)하는 방법을 보여주는 그림이다.
도 10a, 10b, 10c, 10d, 10e, 10f, 10g 및 10h는 본 발명의 일 실시예에 따른 8개 튜브 각각에 형성된 풀의 커버리지 범위를 분석한 결과로, X축은 인코딩 위치에 대한 각 내용(contents)의 커버리지를 나타내고, Y출은 각 커버리지의 수를 나타낸다.
다른 식으로 정의되지 않는 한, 본 명세서에서 사용된 모든 기술적 및 과학적 용어들은 본 발명이 속하는 기술 분야에서 숙련된 전문가에 의해서 통상적으로 이해되는 것과 동일한 의미를 갖는다. 일반적으로 본 명세서에서 사용된 명명법은 본 기술분야에서 잘 알려져 있고 통상적으로 사용되는 것이다.
본 명세서에서, 용어 "뉴클레오티드"는 단일가닥 또는 이중가닥 형태로 존재하는 DNA 또는 RNA를 의미하고, "올리고뉴클레오티드"는 상기 뉴클레오티드가 중합된 상태를 의미하는 것으로, 폴리뉴클레오티드 및 이의 유사체를 포함하는 할 수 있다. 또한, 본 명세서에서 "클론 올리고뉴클레오티드"는 올리고뉴클레오티드를 이용해서 클로닝 또는 PCR 등의 합성과정을 통해서 얻어진 결과물을 의미한다. 본 발명에서는 하나의 올리고뉴클레오티드를 이용해서 랜덤 부위를 포함하도록 합성한 결과물 일 수 있다.
본 명세서에서, 용어 "증폭 반응"은 타겟 핵산 서열을 증폭하는 반응을 의미하며, PCR(polymerase chain reaction, 중합효소연쇄반응)에 의하여 실시될 수 있다. 상기 PCR은 역전사(reverse transcription) 중합효소 연쇄반응(RT-PCR), 멀티플렉스(multiplex) PCR, 실시간(real-time) PCR, 어셈블리(Assembly) PCR, 퓨전(Fusion) PCR, 리가아제 연쇄 반응(Ligase chain reaction; LCR)을 포함하지만, 이에 한정되지는 않는다.
본 명세서에서, 용어 "프라이머(primer)"는 단일가닥의 올리고뉴클레오티드 중 하나로, 리보뉴클레오티드도 포함할 수 있으며 바람직하게는 디옥시리보뉴클레오티드 일 수 있다. 상기 프라이머는 주형(template)의 한 부위에 혼성화 또는 어닐링되어, 이중가닥 구조를 형성한다. 본 발명에서 프라이머는 NGS 시퀀싱 아답터 서열에 혼성화(hybridization) 또는 어닐링(annealing)될 수 있다. 어닐링(annealing)은 주형 핵산에 올리고뉴클레오티드 또는 핵산이 병치(apposition)되는 것을 의미하며, 상기 병치는 중합효소(polymerase)가 뉴클레오티드를 중합시켜 주형 핵산 또는 그의 일부분에 상보적인 핵산 분자를 형성하게 한다. 혼성화(hybridization)는 2개의 단일가닥 핵산이 상보적인 염기서열들의 페어링(pairing)에 의하여 이합체 구조(duplex structure)를 형성하는 것을 의미한다. 상기 프라이머는 주형에 상보적인 프라이머 연장 산물의 합성이 유도되는 조건에서 합성의 개시점으로 작용할 수 있다.
본 명세서에서, 용어 "상보적"은 어떤 특정한 혼성화 또는 어닐링 조건 하에서 상술한 뉴클레오티드 서열에 선택적으로 혼성화할 수 있을 정도의 상보성을 갖는 것을 의미한다.
본 명세서에서, 용어 "뉴클레오티드들의 조립(assembly)"은 핵산 단편을 상보적인 염기 서열을 이용하여 정렬(aligning)하고 병합(merging)하여 더 긴 핵산 단편으로 연결하는 것을 의미한다.
이하, 본 발명의 구성을 구체적으로 설명한다.
본 발명의 일 태양에 있어서, 하나의 올리고뉴클레오티드로부터 복수 개의 클론 올리고뉴클레오티드를 합성하는 단계; 및 상기 합성된 복수 개의 클론 올리고뉴클레오티드에 대하여 차세대 시퀀싱을 수행하여 클론 올리고뉴클레오티드 각각의 전체 염기서열을 확인하는 단계;를 포함하는 복수 개의 클론 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드 풀(pool)을 생산하는 방법을 제공한다.
본 발명의 올리고뉴클레오티드 풀(pool)을 생산하는 방법은, 하나의 올리고뉴클레오티드로부터, 클론 올리고뉴클레오티드가 랜덤 부위를 포함하도록 수행하여 복수 개의 클론 올리고뉴클레오티드를 합성 할 수 있다.
종래에는 다양한 염기서열의 조합을 갖는 복수 개의 클론 올리고뉴클레오티드를 합성하려면, 많은 수의 올리고뉴클레오티드를 각각 합성하여 마이크로어레이 칩을 제작하는 과정이 필수적이었다. 그러나, 이러한 방법은 다수의 올리고뉴클레오티드를 각각 합성해야 하므로 비용과 노력이 많이 소요되는 문제가 있다. 그러나, 본 발명에 따르면 하나의 올리고뉴클레오티드로부터 서로 다른 염기서열을 갖는 복 수개의 클론 올리고뉴클레오티드 서열의 합성이 가능한 바, 적게는 수 백~수 만번의 합성과정이 필요한 종래의 방법과 비교해서 효율적으로 올리고뉴클레오티드 풀을 생산 할 수 있다는 장점이 있고, 시퀀싱의 처리량(throughput)이 많아짐에 따라 DNA 분자를 활용하는 분야에서 다룰 수 있는 올리고뉴클레오티드의 수가 기하급수적으로 증가시킬 수 있다는 장점이 있다.
상기 합성은 클론 올리고뉴클레오티드가 랜덤 부위를 포함하도록 수행될 수 있다. 또한, 상기 합성 단계는 한 번만 수행하는 것 일 수 있다. 본 발명은 다양한 염기서열의 조합을 갖는 올리고뉴클레오티드를 얻기 위해서는 필요한 조합의 수만큼 올리고뉴클레티드 서열을 설계 및 합성해야하는 마이크로어레이 방법과 달리, 하나의 서열을 갖는 올리고뉴클레오티드로부터 랜덤영역을 포함하도록 한 번의 합성단계를 수행하면, 다양한 영기서열의 조합을 갖는 복수개의 클론 뉴클레오티드를 합성 할 수 있으므로, 마이크로어레이에서 요구되는 합성 단계를 현저히 줄일 수 있다.
본 발명에서 "랜덤 부위(random space)"는 A, T, C, G로 조합 가능한 임의의 염기서열로 이루어진 부위를 의미한다. 구체적으로, 시작 올리고뉴클레오티드에서 R mer 길이로 랜덤부위를 설정하고, 클론 올리고뉴클레오티드가 상기 랜덤부위를 포함하도록 합성을 수행하면, 상기 랜덤 부위의 클론 올리고뉴클레오티드의 염기서열은 A, T, C, G로 조합 가능한 모든 염기서열 중 하나로 이루어질 수 있고, 구체적으로는 A, T, C, G 만들어 질 수 있는 염기서열 4R 개로 이루어진 군에서 선택된 어느 하나의 염기서열로 이루어질 수 있다. 따라서 상기 복수 개의 클론 올리고뉴클레오티드는 서로 다른 염기서열로 이루어진 것을 둘 이상 포함하며, 서로 동일한 염기서열로 이루어진 클론 올리고큐늘레오티드가 둘 이상 존재할 수 있다.
상기 합성 단계에서 합성된 클론 올리고뉴클레오티드의 서열은 알 수 없다. 구체적으로 랜덤 부위를 제외 한 서열은 시작 올리고뉴클레오티드와 동일하나 랜덤 부위의 염기서열은 합성된 단계에서는 알 수가 없다. 따라서, 본 발명의 방법은 합성된 클론 올리고뉴클레오티드의 서열을 확인하기 위해 차세대 시퀀싱을 수행하는 단계를 포함한다.
이러한 측면에서, 상기 R은 합성하고자 하는 올리고뉴클레오티드의 길이, 클론 올리고뉴클레오티드의 개수, 차세대 시퀀싱 수행 시 리드의 수 등에 따라 다르게 설정될 수 있고, 정수일 뿐, 그 특정 길이에 한정되는 것은 아니다. 현재 개발 된 차세대 시퀀서를 이용하는 경우 R은 2 내지 20인 경우까지 커버가 가능하나, 이는 차세대 시퀀서의 처리량 등의 발전에 의하여 이에 한정되는 것은 아니다.
본 발명의 일 실시예에 있어서, 랜덤 부위의 염기서열이 8mer 내지 16mer 인 경우에 클론 올리고뉴클레오티드가 최대 4R 개의 염기서열 조합 중 얼마나 많은 종류의 염기서열을 포함하는 올리고뉴클레오티드를 얻을 수 있는지(coverage)를 실험 또는 시뮬레이션을 통해 확인 하였고, 리드수가 증가할 수록 커버되는 염기서열의 조합이 증가하는 것을 확인 하였다(도 6).
상기 랜덤 부위를 포함하도록 클론 올리고뉴클레오티드를 합성하는 방법은 종래 본 발명의 기술분야에서 통상적으로 사용되는 합성방법을 이용하여 수행할 수 있다.
상기 "복수 개의 클론 올리고뉴클레오티드"는 2개 이상의 클론 올리고뉴클레오티드를 의미하며, 상기 합성단계에서 만들어지는 클론 올리고뉴클레오티드는 바람직하게는 A, T, C, G로 조합 가능한 모든 염기서열 중에서 선택된 염기서열로 이루어진 클론 올리고뉴클레오티드들로 이루어진 군(population)일 수 있다. 클론 올리고뉴클레오티드들로 이루어진 군에는 랜덤 부위의 염기서열이 동일한 클론 올리고뉴클레오티드가 2개 이상 포함될 수 있다.
상기 하나의 올리고뉴클레오티드 다양한 염기서열의 조합을 갖는 클론 올리고뉴클레오티드의 합성을 위해 사용되는 올리고뉴클레오티드를 의미하는 것으로, 이러한 측면에서 시작 올리고뉴클레오티드와 병용적으로 사용된다. 상기 하나의 올리고뉴클레오티드는 동일한 염기서열을 갖는 올리고뉴클레오티드를 의미하는 것 일 수 있다. 상기 하나의 올리고뉴클레오티드는 클론 올리고뉴클레오티드를 합성 및 차세대 시퀀싱하는 조건, 방법 또는 사용하는 기기 등에 따라 다르게 설계하여 사용할 수 있다.
상기 하나의 올리고뉴클레오티드는 클론 올리고뉴클레오티드를 합성하는 과정에서 A, T, C 및 G 중에서 어느 하나의 염기로 합성될 수 있는 하나 이상의 N 서열을 포함할 수 있다. 따라서, 상기 N은 하나의 올리고뉴클레오티드에서 A, T, C 또는 G 일 수 있다.
상기 하나의 올리고뉴클레오티드는 전체 길이가 100mer 이상 인 것 일 수 있다. 본 발명의 올리고뉴클레오티드 길이가 100mer 이상인 경우, 차세대 시퀀싱을 통한 클론 올리고뉴클레오티드의 서열 확인 단계에서 클러스터 형성이 잘 일어나, 시퀀싱을 할 수 있다. 상기 길이는 400 mer 미만일 수 있으나, 이에 한정되는 것은 아니고, 차세대 시퀀서의 종류, 차세대 시퀀서의 처리량(throughput), 필요한 염기서열 조합의 올리고뉴클레오티드에 따라 최적의 길이로 사용할 수 있다.
상기 하나의 올리고뉴클레오티드는 차세대 시퀀싱을 통한 서열을 확인하기 위해서, 올리고뉴클레오티드의 양측 말단에 차세대 시퀀싱(next generation sequencing, NGS)을 위한 아답터 서열이 존재하는 아답터 부위(adaptor space)를 포함할 수 있다. 상기 하나의 올리고뉴클레오티드는 2 종 이상의 차세대 시퀀서에 사용할 수 있도록 아답터 서열을 2 이상 포함할 수 있다.
상기 아답터 서열이란 차세대 시퀀서가 염기서열을 인식하도록 해주는 표지서열을 의미하는 것으로, 각 기기에 적용하기 위한 아답터 서열은 각 기기의 사용방법에 따라 서로 다를 수 있다. 일 예로, 상기 아답터 서열은 Roche의 454, Illumina의 HiSeq 또는 라이프테크놀로지스(ABI)의 SOLiD 등을 포함하는 차세대 시퀀서에 적용 가능한 것이라면 제한 없이 본 발명의 뉴클레오티드에 적용하여 사용할 수 있다. 상기 차세대 시퀀서에 적용 가능한 아답터 서열은 본 발명의 기술분야에서 통상적으로 사용되는 것을 이용할 수 있다.
상기 하나의 올리고뉴클레오티드는 아답터 부위 및 랜덤 부위 외에 더미서열로 이루어진 더미 부위(dummy space)를 더 포함할 수 있다. 상기 더미부위의 염기서열은 바람직하게는 호모폴리머 4bp 이하, 더미부위 전체 염기 중 G 및 C 비율이 40% 내지 60% 일 수 있는데, 이러한 조건을 만족하는 경우 시퀀싱 수행 과정에서 오류를 줄 일 수 있어, 올리고뉴클레오티드 풀을 생산하는데 효과적이다.
또한, 상기 더미 부위는 1 내지 10mer 길이의 랜덤서열을 포함할 수 있다. 이러한 이 경우, 차세대 시퀀서 진행 시 발행하는 광크로스토크(optical crosstalk) 현상을 방지할 수 있어, 차세대 시퀀서의 효율을 높일 수 있는 장점이 있다.
상기 하나의 올리고뉴클레오티드는 서열번호 1의 염기서열 또는 서열번호 2의 염기서열로 이루진 것 일 수 있다. 상기 서열번호 1의 올리고뉴클레오티드를 이용할 경우, 클론 올리고뉴클레오티드 합성 후, 454 Junior 시스템 또는 Illumina 플랫폼 모두에 적용하여 시퀀싱이 가능하다.
본 발명의 일 실시예에서, 198 mer 길이의 서열번호 1의 올리고뉴클레오티드를 설계하고, 클론 뉴클레오티드를 랜덤하게 합성한 후, Roche의 454 Junior 시스템을 이용하여 시퀀싱하여 각 클론 올리고뉴클레오티드의 염기서열을 확인하였다.
[서열번호 1]
5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGNNNNNNNNACACTCTTTCCCTACACGACGCTCTTCCGATCTGATGCCTATGACCTGAGATGTTAGATGANNNNNNNNTTCCTGGTGTTACAGCTTCACTAGGAGAGATCGGAAGAGCACACGTCTGAACTCCAGTCACCTGAGACTGCCAAGGCACACAGGGGATAGG-3'
구체적으로 상기 서열번호 1에서 5'말단으로부터 1 내지 30 번째와 169번째 내지 198번째 위치에 각각 454 아답터 서열, 31번째부터 38번째에는 광 크로스토크(optical crosstalk) 현상을 방지하기 위한 8bp의 더미부위, 100번째 내지 107번째 위치에 8bp의 랜덤부위, 그리고 그 외 서열은 호모폴리머 4bp 이하, GC 비율이 40% 내지 60%인 더미서열을 포함하는 뉴클레오티드를 합성하여, 30bp의 리버스 프라이머(서열번호 4)를 이용하여 어닐링을 수행하였다. 그 결과물로 생성된 이중가닥 DNA를 전기영동으로 확인 하였다.
또한, 본 발명의 다른 일 실시예에서, Illumina 플랫폼에 적용할 수 있는 서열번호 2의 뉴클레오티드를 합성 하였다.
[서열번호 2]
5'-CAAGCAGAAGACGGCATACGAGATCGAGTAATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT GATGCCTATGACCTGAGATGTTAGATGANNNNNNNNTTCCTGGTGTTACAGCTTCACTAGGAGAGATCGGAAGAGCACACGAACGACGACTGAGACTGCCAAGGCACACAGGGGATAGG-3'
본 발명의 상기 클론 올리고뉴클레오티드 각각의 전체 염기서열을 확인하는 단계는 랜덤하게 합성되어, 전체 염기서열을 알 수 없는 복수 개의 클론 올리고뉴클레오티드에 대하여 차세대 시퀀싱으로 수행하는 것을 포함한다.
본 발명의 하나의 올리고뉴클레오티드를 이용해서 클론 올리고뉴클레오티드가 랜덤서열을 포함하도록 합성하는 단계를 거치면, 랜덤서열 부위의 염기서열을 알 수 없는 바, 전체 염기서열을 알 수 없는 복수 개의 클론 올리고뉴클레오티드를 얻게 된다. 이러한 전체 염기서열을 알 수 없는 각각의 클론 올리고뉴클레오티드는 차세대 시퀀싱을 통해서 각 올리고뉴클레오티드이 서열을 확인하여, 올리고뉴클레오티드 풀을 형성할 수 있다.
상기 전체 염기서열을 알 수 없는 복수 개의 클론 올리고뉴클레오티드는 차세대 시퀀싱을 통해서 램덤 부위의 염기서열이 결정되는데, 종래에는 서열을 알고 있는 다수의 올리고뉴클레오티드의 증폭 등을 통해서 다수의 클론 올리고뉴클레오티드를 합성하는 방법으로 풀(pool)을 생산하였으나, 본 발명에 의하는 경우 여러 번에 걸쳐서, 다수의 올리고뉴클레오티드를 합성할 필요 없이, 올리고뉴클레오티드를 이용하여 한 번의 합성과정으로 다양한 염기서열의 조합을 갖는 올리고뉴클레오티드 풀을 생산할 수 있는 바, 경제적으로, 시간 및 노력적으로 효율적으로 올리고뉴클레오티드 풀을 생산할 수 있다는 장점이 있다.
상기 차세대 시퀀서는 그 종류에 제한 없이 본 발명에 이용가능하고, 차세대 시퀀싱을 수행하는 방법 역시 통상적으로 본 발명의 분야에서 사용되는 방법으로 수행될 수 있다.
본 발명의 일 실시예 있어서, 8mer의 랜덤부위를 가지는 서열번호 1의 올리고뉴클레오티드를 이용하여 클론 올리고뉴클레오티드를 합성한 후, 차세대 시퀀싱을 통해서 상기 클론 올리고뉴클레오티드들의 염기서열을 확인하였다. 총 48개의 염기서열의 조합(contens) 중에서 10만 개의 리드를 시퀀싱에서 얻었을 경우 동등한(uniform) 확률로 각 클론들이 시퀀싱 된다고 가정하면, 78%정도를 얻을 수 있었고 리드수가 백만, 천만으로 늘어날 경우 각 클론들을 좀 더 균일하게 얻을 수 있음을 시뮬레이션으로 확인하였다(도 4).
본 발명의 올리고뉴클레오티드 풀(pool)을 생산하는 방법은 복수 개의 클론 올리고뉴클레오티드 중에서 원하는 염기서열로 이루어진 랜덤부위를 포함하는 클론 올리고뉴클레오티드를 선택하는 단계를 더 포함할 수 있다.
상기 "원하는 염기서열"이란 목적하는 염기서열을 의미하는 것으로, 예를 들어 합성하고자 하는 DNA 분자의 일부를 구성하는 염기서열 또는 저장매체로 이용하는 경우 대상 정보를 암호화 할 수 있는 염기서열을 의미한다. 상기 원하는 염기서열은 클론 올리고뉴클레오티드에 포함된 랜덤부위의 염기서열 일 수 있다.
본 발명에서 "선택"이란 다수의 올리고뉴클레오티드 중에서 원하는 염기서열을 포함하는 올리고뉴클레오티드를 골라서 뽑는 것을 의미하는 것으로, 회수, 추출 등의 용어와 병용하여 사용될 수 있다.
상기 선택은 본 발명의 기술분야에서 통상적으로 사용되는 올리고뉴클레오티드를 추출 또는 회수하는 방법에 의하여 수행할 수 있다. 일 예로, 레이저 또는 로봇을 이용한 선택시스템을 사용할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 일 실시예에 있어서, 필요한 데이터정보를 포함하는 뉴클레오티드를 컴퓨터상에서 검색하여, 해당 뉴클레오티드의 위치정보에 따라 레이저 시스템을 이용하여 비드와 결합된 형태로 시퀀싱 플레이트에 정렬된 올리고뉴클레오티드들 중에서, 원하는 서열 또는 원하는 정보를 가지는 올리고뉴클레오티드를 추출하는 방법으로 수행할 수 있다.
상기 레이저 시스템을 이용한 비드-뉴클레오티드 결합체의 선택은 Howon Lee et al, A high-throughput optomechanical retrieval method for sequence-verified clonal DNA from the NGS platform, Nature Communications 6, Article number: 6073 (2015)에 개시된 방법을 참고하여 수행할 수 있다.
본 발명의 다른 태양에 있어서, 하나의 올리고뉴클레오티드로부터 복수 개의 클론 올리고뉴클레오티드를 합성하는 단계; 상기 합성된 복수 개의 클론 올리고뉴클레오티드에 대하여 차세대 시퀀싱을 수행하여 클론 올리고뉴클레오티드 각각의 전체 염기서열을 확인하는 단계; 상기 전체 염기서열이 확인된 각각의 클론 올리고뉴클레오티드 랜덤 부위의 염기서열을 x-y좌표 상에 입력하여 맵핑하는 단계; 및 상기 시퀀싱 플레이트로부터 저장하고자 하는 정보를 인코딩한 염기서열과 매칭되는 염기서열을 포함하는 클론 올리고뉴클레오티드를 선택하는 단계;를 포함하는 DNA에 정보를 저장하는 방법을 제공한다.
상기 복수 개의 클론 올리고뉴클레오티드를 합성하는 단계 및 복수 개의 클론 올리고뉴클레오티드를 합성하는 단계는 앞서 설명 하였는 바, 구체적인 언급이 없는 한, 상기 기재의 내용을 준용한다.
상기 DNA에 정보를 저장하는 방법은 DNA에 저장하고자 하는 정보(대상 정보)를 A, T, C, G로 만들어 질 수 있는 염기서열로 인코딩하는 단계;를 더 포함할 수 있다.
상기 대상정보는 디지털 형태의 그림, 텍스트 등을 모두 포함하여, 그 정보의 형식, 종류에 제한을 받지 않는다. 구체적으로 정보를 구성하는 코드가 염기 코드로 변환 될 수 있으면, 해당 정보는 모두 본 발명의 방법을 이용하여 DNA에 저장될 수 있다.
본 발명의 일 실시예에서, Huffman 인코딩 방법을 이용하여 샤논(Shannon) 정보로 변환하고, 각각의 문자는 base-4 숫자(T, C, G 및 A에 대해 0, 1, 2 및 3)를 사용하여 DNA 염기 서열로 인코딩하는 방법으로 대상정보를 염기서열로 인코딩 하였다.
[예시 문장]
The human genome holds an extraordinary trove of information about human development, physiology, medicine and evolution. Here we report the results of an international collaboration to produce and make freely available a draft sequence of the human genome. We also present an initial analysis of the data, describing some of the insights that can be gleaned from the sequence.”
상기 예시문장은 유전체학의 주요 논문에서 발췌한 377 바이트(byte)의 영문텍스트로, 1569 비트의 샤논(Shannon) 정보로 변환하였다(1). 그 다음. 샤논 정보를 데이터 정보의 염기서열의 개수에 맞춰(2), 표 1의 규칙에 적용하여, 상기 숫자와 매칭되는 염기로 변환하여 인코딩 하였다. 예를 들어, 위의 텍스트에서 처음 3 단어를 사용하면 "The human genome"을 Huffman 트리를 사용하여 변환하면, 하기 (1)의 결과가 된다.
"223313233233121032301020311" (1)
다만, 여기서, 위치 인덱스와 데이터 인코딩 부분이 각각 4bp 이므로. 4로 나눌 수 없는 경우 마지막에 '0'을 추가할 수 있다. 상기 (1)에서 '0'을 하나 추가하고 7 개의 그룹(길이=28, 28/4=7)으로 코드를 분할하면 (2)의 결과가 된다.
{"2233", "1323", "3233", "1210", "3230", "1020", "3110"} (2)
그 다음 상기 (2)의 각 코드 앞에 위치 코드{'0000', '0001', '0002', '0003', '0010', '0011', '0012'}을 추가하면 하기 (3)의 결과가 된다.
"00002233", "00011323", "00023233",
"00031210", "00103230", "00111020", "00123110" (3)
대상 숫자
앞에 존재하는 염기의 종류 0 1 2 3
T C G A T
C G A T C
G A T C G
A T C G A
(3)의 코드를 표 1의 규칙에 적용하여 T, C, G 또는 A의 염기서열로 최종 변환하면 DNA 서열로 인코딩 할 수 있다. 예를 들어, 첫 번째 문자가 "T"(0)로 시작하고 후속 코드가 2이면 다음 뉴클레오티드는 "A"가 된다.
상기 본 발명의 인코딩 방법은 대상정보를 염기서열로 인코딩하는 방법 중 하나의 예를 의미하는 것이고, 본 발명은 통상적으로 사용되는 인코딩 방법 및 프로그램을 이용하여 수행 할 수 있다.
상기 "데이터 정보"는 DNA 합성 또는 DNA 정보저장에서 실제로 사용되는 의미있는 정보를 가지는 값을 의미한다.
상기 "위치(address) 정보"는 상기 데이터 정보가 대상정보 상에서 존재하는 위치(순서)를 암호화하는 값을 의미한다.
상기 DNA에 정보를 저장하는 방법에서 상기 랜덤 부위의 염기서열은 위치(address) 정보를 암호화하는 위치서열 및 데이터 정보를 암호화하는 데이터서열로 이루어진 것 일 수 있다. 대상정보의 내용을 암호화하는 데이터 정보는, 상기 데이터 정보의 대상 정보 상에서 위치(순서)를 암호화하는 위치 정보가 함께 있어, 정보의 해독이 가능하게 하게 한다.
상기 전체 염기서열이 확인된 각각의 클론 올리고뉴클레오티드 랜덤 부위의 염기서열을 x-y좌표 상에 입력하여 맵핑하는 단계는 비드와 결합된 클론 올리고뉴클레오티드의 랜덤 부위 염기서열을 확인하여 각각의 클론 올리고뉴클레오티드의 위치 및 데이터 정보를 x-y좌표 상에 입력하여 수행할 수 있다.
상기 "시퀀싱 플레이트(sequenceing plate) "는 "플로우 셀(flow cell)"이라고도 하며, 올리고뉴클레오티드가 결합할 수 있는 판을 의미한다. 상기 시퀀싱 플레이트는 표면이 격자 형태인 것 일 수 있고, 그에 따라 다수의 웰(well) 또는 셀(cell)을 포함할 수 있다. 상기 웰 또는 셀은 올리고뉴클레오티드와 결합할 수 있는 비드를 하나 이상 포함할 수 있고, 바람직하게는 하나의 웰/셀 당 하나의 비드를 포함할 수 있다.
본 발명의 방법에서 시퀀싱에 의하여 클론 올리고뉴클레오티드는 각각 하나의 비드와 결합된 상태로 시퀀싱 플레이트 상에 정렬된다. 이렇게 정렬된 클론 올리고뉴클레오티드의 랜덤부위의 서열을 맵핑하면 필요한 데이터 정보를 갖는 뉴클레오티드가 시퀀싱 플레이트의 어디에 위치하는 지 알 수 있어, 올리고뉴클레오티드 풀에서 원하는 서열을 갖는 올리고뉴클레오티드를 신속하게 선택할 수 있다.
상기 시퀀싱 플레이트에 뉴클레오티드를 정렬하는 방법 및 이를 x-y좌표값으로 변환하는 방법은 본 발명에서 통상적으로 사용되는 방법을 이용할 수 있다.
상기 DNA에 정보를 저장하는 방법은 클론 올리고뉴클레오티드를 선택하는 단계를 포함한다. 상기 단계는 시퀀싱 플레이트로부터 원하는 염기서열과 매칭되는 데이터서열을 포함하는 클론 올리고뉴클레오티드를 선택하여 수행할 수 있다.
상기 선택은 본 발명의 기술분야에서 통상적으로 사용되는 올리고뉴클레오티드의 검색 및 획수 방법에 의하여 수행할 수 있다. 일 예로, 레이저 또는 로봇을 이용한 선택시스템을 사용할 수 있으나, 이에 제한되는 것은 아니다.
본 발명의 일 실시예에 있어서, 필요한 데이터정보를 포함하는 뉴클레오티드를 컴퓨터상에서 검색하여, 해당 뉴클레오티드의 위치정보에 따라 레이저 시스템을 이용하여 비드와 결합된 형태로 시퀀싱 플레이트에 정렬된 올리고뉴클레오티드들 중에서, 원하는 서열 또는 원하는 정보를 가지는 올리고뉴클레오티드를 추출하는 방법으로 수행할 수 있다.
상기 시퀀싱 플레이트에 뉴클레오티드를 정렬하는 방법, 이를 x-y좌표값으로 변환하는 방법 및 레이저 시스템을 이용한 비드-뉴클레오티드 결합체를 선택하는 방법은 Howon Lee et al, A high-throughput optomechanical retrieval method for sequence-verified clonal DNA from the NGS platform, Nature Communications 6, Article number: 6073 ( 2015)에 개시된 방법을 참고하여 수행할 수 있다.
상기 원하는 "염기서열과 매칭되는 데이터서열"은 합성하고자 하는 DNA 분자를 구성하는데 필요한 염기서열과 동일하거나 이와 상보적인 염기서열을 의미할 수 있다. 또한, DNA에 정보를 저장하는 방법 또는 정보를 해독하는 방법에서, 원하는 염기서열과 매칭되는 데이터서열은 저장하고자 하는 정보를 A, T, C 또는 G로 이루어진 군에서 선택된 염기로 이루어진 정보로 인코딩한 서열과 동일하거나 이와 상보적인 염기서열을 의미할 수 있다.
본 발명 방법은 선택된 클론 올리고뉴클레오티드를 DNA 저장용기에 모으는(pooling) 단계;를 더 포함 할 수 있다.
상기 DNA 저장용기는 DNA 분자를 모아둘 수 있는 것을 의미하는 것으로, DNA 분자의 변성 및 손상을 방지할 수 있는 것을 사용하는 것이 바람직하나, 그 용기의 종류에 제한을 받는 것은 아니다. 일 예로, 본 발명의 일 실시예에서는 저장용기로 팔콘튜브를 이용하였다.
상기 DNA를 모으는 단계는 1개 이상의 저장용기에 뉴클레오티드를 모을 수 있다. 생성된 클론 뉴클레오티드의 바이어스에 의한 데이터정보의 손상의 오류를 최소화하기 위해서, 동일한 최종 산물을 생성할 수 있는 뉴클레오티드 풀(pool)을 2 이상 DNA 저장용기에 제조할 수 있다. 이 경우, 각 뉴클레오티드 서열에 바코드 서열을 포함하여, 각 pool을 구분할 수 있게 할 수 있다.
구체적으로 도 9를 참고하면, 동일한 데이터서열의 순서를 갖도록 클론 뉴클레오티드를 타일링한 팔콘 튜브가 존재한다. 타일링 뉴클레오티드에서, 동일한 열에 존재하는 동일한 데이터서열은 서로 다른 위치서열을 가지고 있다. 따라서, 시퀀싱을 통해 데이터서열의 염기서열을 확인할 때 N_ACAT 위치의 뉴클레오티드의 데이터 서열에 오류가 있는 경우, 2번째 튜브의 N-1_AGCT 위치의 데이터 서열을 읽으면, 시퀀싱 시에 바이어스에 의하여 나타날 수 있는 오류를 줄일 수 있다. 이러한 방법은 본 발명의 올리고뉴클레오티드 풀을 생산하는 방법에 의하여 생산된 클론 올리고뉴클레오티드를 이용하여 정보를 저장하는 방법에서 사용될 수 있으며, 중복 정보를 담은 1 이상의 저장용기를 이용하여 대상 정보의 바이어스에 의한 손상 또는 오류를 줄일 수 있다.
또한, 본 발명은 상기 DNA에 저장된 정보를 인코딩된 염기에 대응되는 숫자로 동일한 규칙을 적용하여 역방향으로 읽으면, 저장된 정보를 복원할 수 있다. 따라서 이러한 측면에서 또 다른 태양으로, DNA에 저장된 정보를 디코딩하는 단계를 포함하는 정보를 해독하는 방법을 제공한다.
이하, 본 발명을 제조예 및 실험예를 통해 상세히 설명한다. 하기 실시예 및 실험예는 본 발명을 예시하는 것일 뿐 본 발명의 범위가 이들에 한정되는 것은 아니다.
[실시예]
[제조예 1] 단일가닥 올리고뉴클레오티드 제작
도 1에 나타낸 바와 같이, 본 발명의 다양한 조합의 염기서열을 클론 올리고뉴클레오티드가 포함할 수 있도록, 8 mer의 랜덤 N 서열을 포함하고, 총 198bp의 서열로 이루어지도록 올리고뉴클레오티드를 설계하였다.
서열번호 1:
5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGNNNNNNNNACACTCTTTCCCTACACGACGCTCTTCCGATCTGATGCCTATGACCTGAGATGTTAGATGANNNNNNNNTTCCTGGTGTTACAGCTTCACTAGGAGAGATCGGAAGAGCACACGTCTGAACTCCAGTCACCTGAGACTGCCAAGGCACACAGGGGATAGG-3'
상기 서열번호1의 8bp(밑줄 쳐진 부분)의 N 서열 중 앞의 4bp는 향후 정보의 위치를 암호화할 주소 부분(위치서열)에 해당하고, 나머지 4bp는 실제 정보의 내용이 암호화될 부분(데이터서열)으로 디자인했다. 서열번호 1의 31번째부터 38번째 염기 위치의 랜덤 N 서열 8bp는 Roche 454 Junior 시스템으로 시퀀싱 진행 시 광 크로스토크(optical crosstalk)현상을 방지하고자 삽입하였다. 더미(Dummy) 서열은 향 후 N의 길이가 늘어날 경우 Illumina 플랫폼에서 적용될 경우를 고려하여 Illumina 시퀀서 어뎁터 서열 안쪽에 배치하였고, 호모폴리머(homopolymer) 4bp 이하, 총 더미서열에서 G 및 C의 비율이 40-60%가 되도록 디자인하였다. 1 내지 30 번째와 169번째 내지 198번째 위치에는 현재 플랫폼에 적용 가능한 Roche 454 Junior 시스템의 시퀀싱 어뎁터 프라이머 서열포함 시켰다.
상기 설계된 서열번호 1의 염기서열로 이루어진 올리고뉴클레오티드를 이용하여 랜덤하게 클론 올리고뉴클레오티드를 합성하였다.
[실시예1] 이중가닥 뉴클레오티드의 생성 및 이의 특성 분석
시퀀싱을 위한 라이브러리 제작을 위해, 먼저 454 리버스 프라이머(reverse primer) 1㎕(10μM) 및 8㎕의 증류수 그리고 PCR 바이어스를 줄이기 위해 서열번호 4의 리버스 프라이머 만 이용하고, 10㎕의 KAPA HiFi Hotstart ready mix(2x)를 포함하여 어닐링 및 익스텐션하여, 이중가닥 올리고뉴클레오티드를 생성하였다.
구체적인 사이클 조건: 98 ℃에서 3 분 동안 변성; 0.1 ℃/초로 어닐링 온도(60 ℃)까지 하강; 72 ℃에서 5 분 동안 최종 확장
[서열번호 3] 454 리버스 프라이머
CCTATCCCCTGTGTGCCTTGGCAGTCTCAG
그 다음, 상기의 생성된 DNA를 1.5% 아가로스 젤에서 전기 영동 하여 사이즈를 확인한 결과를 도 2에 나타내었다.
[실시예 2] 클론 올리고뉴클레오티드의 분석
실시예 1에서 얻어진 DNA를 이용하여 Roche 454 Junior 시스템(판독 길이 ~400bp)에 적용하여 시퀀싱하여 클론 서열을 얻었다(도 1 및 도 3). 그 결과 총 11,394,840bp를 얻었고, Bowtie2 버전 2.2.4(end-to-end 모드에서 97.6 %의 평균 정렬)를 사용하여 레퍼런스에 정렬 한 후, 예상 길이(138bp, 평균 88.5 %)로 판독을 필터링하고, 무작위 8 량체 염기 서열(sequence)의 조합을 더 검색하였다.
개별 클론 서열을 454 시퀀싱 플레이트에서 스나이퍼 클로닝(Sniper cloning)을 사용하여 추출하였고, 팔콘튜브에 풀(pool)을 형성한 올리고뉴클레오티드(pooled oligonucleotide)는 타일링 정보(tilling information)에 대한 특정 인덱스 시퀀스를 포함하는 프라이머(일루미나에 대한 포워드 및 리버스 NEBNext Mutiplex Oligos의 8 가지 조합, 서열번호 4 내지 서열번호 12)를 사용하여 증폭시켰다. 구체적으로 사용한 프라이머는 하기 표 2와 같고, 포워드 프라이머는 서열번호 4의 프라이머(phosphorothioate)를 모두 동일하게 사용했고, 리버스 프라이머만 다르게하여 총 8개의 프라이머 세트로 증폭을 수행했다. 그 다음, 분석을 수행하였다.
서열번호 염기서열
서열번호 4 Illumina forward primer 5'-AATGATACGGCGACCACCGAGATCTACACTATAGCCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'
(*는 포스포로시오에이트 결합을 의미)
서열번호 5 Illumina reverse primer CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG CAG TCA CTC GTG TGC TCT TCC GAT CT
서열번호 6 Illumina reverse primer CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG CAA CTG TGC GTG TGC TCT TCC GAT CT
서열번호 7 Illumina reverse primer CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG GTC AGA TGC GTG TGC TCT TCC GAT CT
서열번호 8 Illumina reverse primer CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG CTT CAT GGC GTG TGC TCT TCC GAT CT
서열번호 9 Illumina reverse primer CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG TTG GAA GGC GTG TGC TCT TCC GAT CT
서열번호 10 Illumina reverse primer CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG CAC TTG AGC GTG TGC TCT TCC GAT CT
서열번호 11 Illumina reverse primer CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG GAA CTG ACC GTG TGC TCT TCC GAT CT
서열번호 12 Illumina reverse primer CCT ATC CCC TGT GTG CCT TGG CAG TCT CAG CCT TCG AAC GTG TGC TCT TCC GAT CT
도 3에 나타낸 바와 같이, 도 3의 A 분포에서 보면 올리고뉴클레오티드의 양 끝에 있는 454 프라이머(primer) 시퀀스(60bp)를 제외한 138bp의 시퀀스가 대부분 잘 읽힌 것을 확인 할 수 있었다. 도 3의 B를 보면, G와 C의 비율은 중앙(median) 값이 49%로 분포하는 것을 확인할 수 있었고, 각 클론 올리고뉴클레오티드의 시퀀스가 몇 번씩 읽혔는지 분석해 본 결과(도 3의 C) 대부분의 시퀀스가 3번 이하로 읽힌(>80%) 경우가 대부분이었고, 20번 이상 읽힌 비율은 극히 적음을 확인하였다.
[실시예 3] 시뮬레이션에 의한 시퀀싱 결과 분석
실시예 1에서와 같이 대부분의 클론들이 3개 이하로 시퀀싱 된 것을 볼 수 있기에, 시퀀싱을 양을 다르게 하여 얼마나 많은 컨텐츠, 즉 클론의 개수를 얻을 수 있는지 시뮬레이션을 통해서 확인해 보았다.
도 4에 나타낸 바와 같이, 10만 개의 리드를 시퀀싱에서 얻었을 경우 동등한(uniform) 확률로 각 클론들이 시퀀싱 된다고 가정하면, 전체 최대(maximum) 컨텐츠 65,536(=48) 중에서 78%정도를 얻을 수 있었고, 리드(read)수가 백만, 천만으로 늘어날 경우 각 클론들을 좀 더 균일하게 얻을 수 있음을 확인하였다.
또한, 실제 데이터를 다운 샘플링 하여 모든 최대한 컨텐츠를 다 얻기 위해 필요한 시퀀싱 리드를 시뮬레이션 했을 경우, 도 5에 나타낸 바와 같이, 몬테-카를로 시뮬레이션을 통해 다운 샘플링을 10회 정도 반복한 결과 현재 시퀀싱 결과로도 충분히 포화상태에 이른 것을 확인하였다.
[실시예 4] 플랫폼의 확장 가능성 분석
실시예 3에서 현재 454 시퀀싱의 처리량(~ 15만 리드)의 경우에 랜덤 N 8bp의 올리고뉴클리오티드의 컨텐츠를 대부분 획득할 수 있는 것을 확인 하였고, 이 길이(space)가 16bp까지 증가할 때 실제 어느 정도를 획득할 수 있는지 시뮬레이션 실험을 통해서 확인하였다.
도 6과 같이 인코딩 할 수 있는 랜덤 N 영역이 증가하면서 최대로 획득 가능한 컨텐츠의 비율도 증가하는 것을 볼 수 있었다. 특히 8bp 영역의 경우 100만 리드(read) 정도만 있어도 모든 클론의 컨텐츠를 다 획득할 수 있는 것을 볼 수 있다. 하지만 만약 각 클론들이 균일하게 얻어지지 않고, 바이어스 된 분포를 가질 경우, 100만 리드로도 약 65% 정도 수준의 커버리지를 보이는 것을 확인하였다. 현재 최고 수준의 시퀀싱 스루풋인 일루미나 시퀀서의 경우 1G 리드에 가까운 아웃풋을 보여주는데 이 경우 N이 16bp까지 영역이 확장될 경우 45% 정도까지 염기서열의 조합을 커버할 수 있음을 시뮬레이션으로 확인할 수 있었다.
[실시예 5] 인코딩 및 해독을 통한 DNA의 메모리로서의 적용 가능성 확인
실제 DNA가 저장 매체로서 활용할 수 있는지, 가능성을 확인하기 위해 하기 기재된 377개의 문자(영문, 공백, 특수문자포함)를 Huffman 트리 구조 코딩방법을 사용하여, 샤논(Shannon)정보 1569 비트(bit)를 4진수로 변환하여 인코딩 하였다.
"The human genome holds an extraordinary trove of information about human development, physiology, medicine and evolution. Here we report the results of an international collaboration to produce and make freely available a draft sequence of the human genome. We also present an initial analysis of the data, describing some of the insights that can be gleaned from the sequence."
각 파일의 비트 정보는 4 비트 데이터 위치 블록(4nt)과 4 비트 데이터 블록(4nt)으로 인코딩하였다.
또한, 합성 또는 염기 서열 오류가 있는 염기가 존재하고 합성 과정이 확률적이라고 가정하여, 주소 블록 DNA 시퀀서를 슬라이딩시킴으로써 8 배(fold) 커버리지를 설계했다. 중복 된 정보를 만들기 위해 주소 염기는 그 다음 주소 블록으로 이동된다(도 9). 이러한 방법을 사용하면 시퀀스 라이브러리의 나머지를 활용 할 수 있다. 마지막으로, 4진법(0, 1, 2 및 3)으로 구성된 이러한 문자열(strings)을 단일 DNA 염기로 변환하였다.
그 다음, 서열번호 1의 뉴클레오티드를 어닐링하고, 시퀀싱 다음에, 맵핑하고, 비접촉식 레이저 펄스에 기초한 고효율의 광기계 시스템을 사용하여 454 시퀀싱 플레이트로부터 비드를 포함하는 표적 서열을 회수 하였다. 구체적으로, 맵핑된 454 시퀀싱 플레이트(칩)을 광학 검색 시스템에 놓고, 레이저 펄스를 이용해 비드-뉴클레오티드가 추출되었다. 그 다음 증폭 단계를 거쳐서, 초기 매핑에 대해 생어 시퀀싱(Sanger sequencing)으로 평가하였다.
그 다음, 시퀀스의 픽셀 정보를 비드의 물리적 위치로 매핑(시퀀싱 출력에 등록된 x, y 리드(read) 위치)이 수행된다. 이를 이용하면, 선형화 된 모터 스테이지의 도움을 받아 레이저 시스템을 사용하여 자동으로 비드를 분리 할 수 있다.
텍스트를 읽고 재구성하기 위해 튜브에 수집된 비드는 증폭되고 Illumina HiSeq 플랫폼에서 시퀀싱 되었다(도 10a, 10b, 10c, 10d, 10e, 10f, 10g 및 10h). 품질이 낮은 로우(raw) 리드(read)는 잘라내고 예상되는 올리고뉴클레오티드 길이를 조사했다. Illumina 데이터에서, 시퀀싱 에러를 거르기 위해 150bp의 페어드-엔드 리드(paired-end read)를 이용하여 두 개의 리드를 중복시켰다. 완벽한 인덱스 또는 주소 시퀀스(대개 대체 오류)를 필터링 한 후, 다수 선택 규칙을 사용하여 데이터서열의 보존 염기(consensus base)를 생성했다. 원문은 100 %의 정확도로 복구되었음을 확인 하였다.
SEQUENCE LISTING <110> University-Industry Foundation, Yonsei University <120> METHOD FOR GENERATING POOL CONTAINING OLIGONUCLEOTIDES USING ONE OLIGONUCLEOTIDE <130> P16U16C2266 <150> KR 2016-0026299 <151> 2016-03-04 <160> 12 <170> PatentIn version 3.2 <210> 1 <211> 198 <212> DNA <213> Artificial <220> <223> Aritificial oligonucleotide <220> <221> misc_feature <222> (31)..(38) <223> n is a, c, g, or t <220> <221> misc_feature <222> (100)..(107) <223> n is a, c, g, or t <400> 1 ccatctcatc cctgcgtgtc tccgactcag nnnnnnnnac actctttccc tacacgacgc 60 tcttccgatc tgatgcctat gacctgagat gttagatgan nnnnnnnttc ctggtgttac 120 agcttcacta ggagagatcg gaagagcaca cgtctgaact ccagtcacct gagactgcca 180 aggcacacag gggatagg 198 <210> 2 <211> 185 <212> DNA <213> Artificial <220> <223> Artificial oligonucleotide <220> <221> misc_feature <222> (95)..(102) <223> n is a, c, g, or t <400> 2 caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60 cgatctgatg cctatgacct gagatgttag atgannnnnn nnttcctggt gttacagctt 120 cactaggaga gatcggaaga gcacacgaac gacgactgag actgccaagg cacacagggg 180 atagg 185 <210> 3 <211> 30 <212> DNA <213> Artificial <220> <223> 454 reverse primer <400> 3 cctatcccct gtgtgccttg gcagtctcag 30 <210> 4 <211> 70 <212> DNA <213> Artificial <220> <223> Illumina forward primer <400> 4 aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 5 <211> 56 <212> DNA <213> Artificial <220> <223> Illumina reverse primer <400> 5 cctatcccct gtgtgccttg gcagtctcag cagtcactcg tgtgctcttc cgatct 56 <210> 6 <211> 56 <212> DNA <213> Artificial <220> <223> Illumina reverse primer <400> 6 cctatcccct gtgtgccttg gcagtctcag caactgtgcg tgtgctcttc cgatct 56 <210> 7 <211> 56 <212> DNA <213> Artificial <220> <223> Illumina reverse primer <400> 7 cctatcccct gtgtgccttg gcagtctcag gtcagatgcg tgtgctcttc cgatct 56 <210> 8 <211> 56 <212> DNA <213> Artificial <220> <223> Illumina reverse primer <400> 8 cctatcccct gtgtgccttg gcagtctcag cttcatggcg tgtgctcttc cgatct 56 <210> 9 <211> 56 <212> DNA <213> Artificial <220> <223> Illumina reverse primer <400> 9 cctatcccct gtgtgccttg gcagtctcag ttggaaggcg tgtgctcttc cgatct 56 <210> 10 <211> 56 <212> DNA <213> Artificial <220> <223> Illumina reverse primer <400> 10 cctatcccct gtgtgccttg gcagtctcag cacttgagcg tgtgctcttc cgatct 56 <210> 11 <211> 56 <212> DNA <213> Artificial <220> <223> Illumina reverse primer <400> 11 cctatcccct gtgtgccttg gcagtctcag gaactgaccg tgtgctcttc cgatct 56 <210> 12 <211> 56 <212> DNA <213> Artificial <220> <223> Illumina reverse primer <400> 12 cctatcccct gtgtgccttg gcagtctcag ccttcgaacg tgtgctcttc cgatct 56

Claims (10)

  1. 길이가 100mer 이상이며, 길이가 R mer인 랜덤 부위를 포함하는 하나의 시작 올리고뉴클레오티드로부터 복수 개의 클론 올리고뉴클레오티드를 합성하는 단계; 및
    클론 올리고뉴클레오티드들 중에서 원하는 염기서열로 이루어진 랜덤 부위를 포함하는 클론 올리고뉴클레오티드를 선택하기 위해 상기에서 합성된 복수 개의 클론 올리고뉴클레오티드에 대하여 차세대 시퀀싱을 수행하여 클론 올리고뉴클레오티드 각각의 전체 염기서열을 확인하는 단계;를 포함하고,
    여기에서,
    상기 합성은 클론 올리고뉴클레오티드가 랜덤 부위를 포함하도록 수행되며,
    상기 랜덤 부위는 길이가 R mer 이고, A, T, C, G로 만들어질 수 있는 염기서열 4R 개로 이루어진 군에서 선택된 어느 하나의 염기서열로 이루어진 것인, 복수 개의 클론 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드 풀(pool)을 생산하는 방법.
  2. 제1항에 있어서,
    상기 전체 염기서열이 확인된 복수 개의 클론 올리고뉴클레오티드 중에서 원하는 염기서열로 이루어진 랜덤 부위를 포함하는 클론 올리고뉴클레오티드를 선택하는 단계;를 더 포함하는 올리고뉴클레오티드 풀(pool)을 생산하는 방법.
  3. 제1항에 있어서,
    상기 생산 방법은 합성하는 단계를 한 번만 수행하는 것이고,
    상기 올리고뉴클레오티드 풀(pool)은 랜덤 부위의 염기서열이 서로 다른 클론 올리고뉴클레오티드를 2개 내지 4R 개 포함하는 것인, 올리고뉴클레오티드 풀(pool)을 생산하는 방법.
  4. 제1항에 있어서,
    상기 하나의 올리고뉴클레오티드는 양측 말단에 차세대 시퀀싱(next generation sequencing, NGS)을 위한 아답터 서열이 존재하는 아답터 부위(adaptor space)를 포함하는 것인, 올리고뉴클레오티드 풀(pool)을 생산하는 방법.
  5. 삭제
  6. 제1항에 있어서,
    상기 R은 2 내지 20의 정수 인, 올리고뉴클레오티드 풀(pool)을 생산하는 방법.
  7. 제1항에 있어서,
    상기 하나의 올리고뉴클레오티드는 서열번호 1의 염기서열 또는 서열번호 2의 염기서열로 이루진 것인, 올리고뉴클레오티드 풀(pool)을 생산하는 방법.
  8. 길이가 100mer 이상이며, 길이가 R mer인 랜덤 부위를 포함하는 하나의 시작 올리고뉴클레오티드로부터 복수 개의 클론 올리고뉴클레오티드를 합성하는 단계;
    클론 올리고뉴클레오티드들 중에서 원하는 염기서열로 이루어진 랜덤 부위를 포함하는 클론 올리고뉴클레오티드를 선택하기 위해 상기에서 합성된 복수 개의 클론 올리고뉴클레오티드에 대하여 차세대 시퀀싱을 수행하여 클론 올리고뉴클레오티드 각각의 전체 염기서열을 확인하는 단계;
    상기 전체 염기서열이 확인된 각각의 클론 올리고뉴클레오티드 랜덤 부위의 염기서열을 x-y좌표 상에 입력하여 맵핑하는 단계; 및
    시퀀싱 플레이트로부터 저장하고자 하는 정보를 인코딩한 염기서열과 매칭되는 염기서열을 포함하는 클론 올리고뉴클레오티드를 선택하는 단계;를 포함하고,
    여기에서,
    상기 합성은 클론 올리고뉴클레오티드가 랜덤 부위를 포함하도록 수행되며,
    상기 랜덤 부위는 길이가 R mer 이고, A, T, C, G로 만들어질 수 있는 염기서열 4R 개로 이루어진 군에서 선택된 어느 하나의 염기서열로 이루어진 것이며,
    상기 랜덤 부위의 염기서열은 위치(address) 정보를 암호화하는 위치서열 및 데이터 정보를 암호화하는 데이터서열로 이루어진, DNA에 정보를 저장하는 방법.
  9. 제8항에 있어서,
    DNA에 저장하고자 하는 정보(대상 정보)를 A, T, C, G로 만들어 질 수 있는 염기서열로 인코딩하는 단계;를 더 포함하는 것인, DNA에 정보를 저장하는 방법.
  10. 서열번호 1의 염기서열 또는 서열번호 2의 염기서열로 이루어진 하나의 올리고뉴클레오티드로 복수 개의 클론 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드 풀(pool)을 생산할 수 있는 올리고뉴클레오티드.
KR1020170028336A 2016-03-04 2017-03-06 하나의 올리고뉴클레오티드를 이용해서 올리고뉴클레오티드 풀을 생산하는 방법 KR101953663B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020160026299 2016-03-04
KR20160026299 2016-03-04

Publications (2)

Publication Number Publication Date
KR20170103702A KR20170103702A (ko) 2017-09-13
KR101953663B1 true KR101953663B1 (ko) 2019-03-04

Family

ID=59723982

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170028336A KR101953663B1 (ko) 2016-03-04 2017-03-06 하나의 올리고뉴클레오티드를 이용해서 올리고뉴클레오티드 풀을 생산하는 방법

Country Status (2)

Country Link
US (1) US20170253871A1 (ko)
KR (1) KR101953663B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102138864B1 (ko) * 2018-04-11 2020-07-28 경희대학교 산학협력단 Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014014991A2 (en) * 2012-07-19 2014-01-23 President And Fellows Of Harvard College Methods of storing information using nucleic acids

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140054905A (ko) * 2012-10-30 2014-05-09 충북대학교 산학협력단 당화혈색소에 특이적 앱타머 및 이를 포함하는 당화혈색소 검출용 조성물

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014014991A2 (en) * 2012-07-19 2014-01-23 President And Fellows Of Harvard College Methods of storing information using nucleic acids

Also Published As

Publication number Publication date
KR20170103702A (ko) 2017-09-13
US20170253871A1 (en) 2017-09-07

Similar Documents

Publication Publication Date Title
JP7179008B2 (ja) 核酸ベースのデータ記憶
US11379729B2 (en) Nucleic acid-based data storage
Yazdi et al. DNA-based storage: Trends and methods
US9809904B2 (en) Methods for retrieval of sequence-verified DNA constructs
CN105121664B (zh) 混合物及其相关组合物中的核酸的测序方法
KR20200071720A (ko) Dna-기반 데이터 저장
JP5801349B2 (ja) 制限断片のクローン源を識別するための方法
EP2531610B1 (en) Complexitiy reduction method
WO2011100617A2 (en) Nucleic acid, biomolecule and polymer identifier codes
US9774351B2 (en) Method and apparatus for encoding information units in code word sequences avoiding reverse complementarity
KR20190118853A (ko) Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법
JP2021518164A (ja) 核酸ベースのデータ記憶のための化学的方法
US11845982B2 (en) Key-value store that harnesses live micro-organisms to store and retrieve digital information
KR101600899B1 (ko) 초병렬적 핵산 합성법을 통한 dna 라이브러리의 동시 합성 방법
KR101953663B1 (ko) 하나의 올리고뉴클레오티드를 이용해서 올리고뉴클레오티드 풀을 생산하는 방법
EP3067809A1 (en) Method and apparatus for storing and selectively retrieving data encoded in nucleic acid molecules
EP2333104A1 (en) RNA analytics method
US8498824B2 (en) Nucleic acid sequencing using a compacted coding technique
KR20160149158A (ko) 고집적도 올리고뉴클레오티드 디자인을 통한 유전자 합성 방법
US10087484B2 (en) Method for synthesizing gene using high-depth oligonucleotide tiling
WO2023177864A1 (en) Combinatorial enumeration and search for nucleic acid-based data storage
KR20240072128A (ko) 핵산 데이터 저장을 위한 조성물, 시스템, 및 방법
CN113774121A (zh) 一种基于RNA连接标签的低样本量m6A高通量测序方法
CN110144387A (zh) 一种多重pcr方法
CN110144383A (zh) 利用多重pcr富集目标dna片段的方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant