KR20180030092A - 핵산을 사용하여 검색 가능한 정보를 저장하는 방법 - Google Patents

핵산을 사용하여 검색 가능한 정보를 저장하는 방법 Download PDF

Info

Publication number
KR20180030092A
KR20180030092A KR1020187003839A KR20187003839A KR20180030092A KR 20180030092 A KR20180030092 A KR 20180030092A KR 1020187003839 A KR1020187003839 A KR 1020187003839A KR 20187003839 A KR20187003839 A KR 20187003839A KR 20180030092 A KR20180030092 A KR 20180030092A
Authority
KR
South Korea
Prior art keywords
sequence
bit
monomer
nucleic acid
oligonucleotide
Prior art date
Application number
KR1020187003839A
Other languages
English (en)
Inventor
조지 엠. 처치
Original Assignee
프레지던트 앤드 펠로우즈 오브 하바드 칼리지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 filed Critical 프레지던트 앤드 펠로우즈 오브 하바드 칼리지
Publication of KR20180030092A publication Critical patent/KR20180030092A/ko

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0016RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising polymers
    • G06F19/18
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J19/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J19/0046Sequential or parallel reactions, e.g. for the synthesis of polypeptides or polynucleotides; Apparatus and devices for combinatorial chemistry or for making molecular arrays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F5/00Methods or arrangements for data conversion without changing the order or content of the data handled
    • G06F5/06Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor
    • G06F5/08Methods or arrangements for data conversion without changing the order or content of the data handled for changing the speed of data flow, i.e. speed regularising or timing, e.g. delay lines, FIFO buffers; over- or underrun control therefor having a sequence of storage locations, the intermediate ones not being accessible for either enqueue or dequeue operations, e.g. using a shift register
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B7/00Recording or reproducing by optical means, e.g. recording using a thermal beam of optical radiation by modifying optical properties or the physical structure, reproducing using an optical beam at lower power by sensing optical properties; Record carriers therefor
    • G11B7/24Record carriers characterised by shape, structure or physical properties, or by the selection of the material
    • G11B7/241Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B7/00Recording or reproducing by optical means, e.g. recording using a thermal beam of optical radiation by modifying optical properties or the physical structure, reproducing using an optical beam at lower power by sensing optical properties; Record carriers therefor
    • G11B7/24Record carriers characterised by shape, structure or physical properties, or by the selection of the material
    • G11B7/241Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material
    • G11B7/242Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material of recording layers
    • G11B7/244Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material of recording layers comprising organic materials only
    • G11B7/245Record carriers characterised by shape, structure or physical properties, or by the selection of the material characterised by the selection of the material of recording layers comprising organic materials only containing a polymeric component
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0019RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C7/00Arrangements for writing information into, or reading information out from, a digital store
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/00497Features relating to the solid phase supports
    • B01J2219/00527Sheets
    • B01J2219/00529DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00547Bar codes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00277Apparatus
    • B01J2219/0054Means for coding or tagging the apparatus or the reagents
    • B01J2219/00572Chemical means
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00596Solid-phase processes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00605Making arrays on substantially continuous surfaces the compounds being directly bound or immobilised to solid supports
    • B01J2219/00608DNA chips
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00583Features relative to the processes being carried out
    • B01J2219/00603Making arrays on substantially continuous surfaces
    • B01J2219/00675In-situ synthesis on the substrate
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00709Type of synthesis
    • B01J2219/00711Light-directed synthesis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00709Type of synthesis
    • B01J2219/00713Electrochemical synthesis
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J2219/00Chemical, physical or physico-chemical processes in general; Their relevant apparatus
    • B01J2219/00274Sequential or parallel reactions; Apparatus and devices for combinatorial chemistry or for making arrays; Chemical library technology
    • B01J2219/00718Type of compounds synthesised
    • B01J2219/0072Organic compounds
    • B01J2219/00722Nucleotides
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Human Computer Interaction (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Semiconductor Memories (AREA)

Abstract

뉴클레오티드와 같은 모노머를 사용하여 정보를 저장하는 방법이 제공되고, 이 방법은 정보의 포맷을 대응하는 비트 바코드를 각각 갖는 비트 스트림의 복수의 비트 시퀀스로 변환하는 단계, 염기 인코딩당 1개 비트를 사용하여 복수의 비트 시퀀스를 복수의 대응하는 올리고뉴클레오티드 시퀀스로 변환하는 단계, 복수의 반응 위치를 갖는 기판 상에 복수의 대응하는 올리고뉴클레오티드 시퀀스를 합성하는 단계, 및 합성된 복수의 대응하는 올리고뉴클레오티드 시퀀스를 저장하는 단계를 포함한다.

Description

핵산을 사용하여 검색 가능한 정보를 저장하는 방법
본 발명은 일반적으로 폴리머를 형성하는 뉴클레오티드와 같은 모노머의 시퀀스를 사용하여 정보를 인코딩하기 위해 이진 비트 (binary bit) 정보로서 뉴클레오티드와 같은 모노머를 사용하는 방법에 관한 것이다. 이 방식에서, 뉴클레오티드와 같은 모노머의 시퀀스는 텍스트 또는 이미지 또는 사운드와 같은 정보를 저장하기 위해 사용될 수 있다.
DNA는 정보 저장 매체로 간주되어 왔다. 문헌 [Bancroft et al., Science 293, 1763-1765 (2001)]을 참조한다. 문헌 [Davis, Art Journal 55, 70-74 (1996)]; [Gustafsson, Nature 458, 703 (2009)] 및 [Gibson, Science 329, 52-56 (2010)]; US 2003/0228611 및 WO2014/014991을 참조한다. 또한, US2010/0099080 및 WO2014/014991을 참조한다.
개요
본 개시내용의 실시양태는 정보 저장 매체로서 모노머를 포함하는 폴리머 시퀀스(들)를 사용하는 방법에 관한 것이다. 본 개시내용의 특정 실시양태는 정보 저장 매체로서 뉴클레오티드를 포함하는 핵산 시퀀스(들)를 사용하는 방법에 관한 것이다. 정보는 사실상 가장 작고 가장 정확하게 복제된 비트, 즉 염기쌍 자체로 인코딩된다. 일반적인 뉴클레오티드는 아데닌 ("A"), 시토신 ("C"), 구아닌 ("G") 및 티민 ("T")을 포함한다. 특정 측면에 따르면, 우라실 ("U")이 티민 대신 또는 티민에 추가하여 사용될 수 있다. 관련 기술 분야의 통상의 기술자에게 알려진 추가의 염기쌍, 예컨대 6 염기에 대한 3 염기쌍 및 12 염기에 대한 6 염기쌍이 고려된다. 아미노산은 또한 본원에서 설명되는 뉴클레오티드와 유사한 정보를 인코딩하는 폴리펩티드를 제조하는데 사용될 수 있다.
본 개시내용의 측면은 차세대 시퀀싱 및 합성 기술을 사용한 디지털 정보의 강력한 대규모 판독 및 기록 방법에 관한 것이다. 한 측면에 따르면, 텍스트 및/또는 이미지, 및/또는 사운드는 메가비트와 같은 일련의 비트로 변환된다. 한 측면에 따르면, 텍스트 및/또는 이미지 및/또는 사운드는 비트 스트림을 포함하는 메가비트로 변환된다. 이어서, 메가비트는 올리고뉴클레오티드와 같은 올리고머로서 인코딩된다. 올리고뉴클레오티드 시퀀스와 같은 올리고머 시퀀스는 설계된 후, 합성된다. 일례로서, 올리고뉴클레오티드 시퀀스는 설계된 후, 효소 및 뉴클레오티드가 적절한 반응 조건 하에서 기판 상의 원하는 부위에 위치되고 뉴클레오티드는 지지체에 부착된 기존의 뉴클레오티드에 공유 결합되는 효소적 올리고뉴클레오티드 합성 반응을 이용하여 합성된다. 올리고뉴클레오티드 시퀀스는 시약이 기판 상의 위치에 위치하는 조건 하에 일정 시간 동안 단일 뉴클레오티드를 부가할 확률을 최대화하기 위한 이러한 조건 하에서 오류 유발 (error-prone) 폴리머라제와 같은 폴리머라제를 사용하여 합성될 수 있다. 뉴클레오티드 부가의 반응 동역학을 고려하여, 하나 초과의 뉴클레오티드의 부가가 최소화되도록 위치로부터 시약을 제거하기 위해 원하는 시간에 적합한 세척이 사용될 수도 있다. 이 측면에 따르면, 시약은 적합한 반응 조건 하에서 및 예를 들어 폴리머라제의 존재 하에 뉴클레오티드가 부가에 사용될 수 있는 시간을 한정하여 액체의 펄스로서 기판 상의 위치에 부가될 수 있다. 유사하게, 세척제가 또한 특정 위치로부터 시약을 제거하기 위해 액체의 펄스로서 그 위치에 부가될 수 있다.
한 측면에 따르면, 올리고머, 예컨대 올리고뉴클레오티드는 데이터 블록 시퀀스를 포함한다. 한 측면에 따르면, 올리고머, 예컨대 올리고뉴클레오티드는 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스 (예컨대, 바코드 시퀀스)를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스 (예컨대, 바코드 시퀀스), 및 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다.
본 개시내용의 한 측면에 따르면, 염기당 1 비트가 인코딩된다. 이 측면에 따르면, 단일 메시지는 복수의 방식으로, 즉, 0에 대해 A 또는 C, 숫자 1에 대해 G 또는 T로 인코딩될 수 있다. 다른 조합, 예컨대 0에 대해 A 또는 G, 숫자 1에 대해서 C 또는 T 또는 0에 대해 A 또는 T, 숫자 1에 대해 G 또는 C가 고려된다. 다른 조합은 본원에서 논의된 바와 같이 고려된다. 한 측면에 따르면, 비트 스트림은 어드레싱된 데이터 블록으로 분할된다. 이 측면에 따르면, 기록된 정보를 나타내는 데이터 블록들의 라이브러리가 생성된다. 이러한 방식으로, 기록된 정보를 그 전체 또는 비교적 긴 핵산 시퀀스에 나타내는 단일 긴 핵산 시퀀스는 요구되지 않는다.
한 측면에 따르면, 각각의 개별 올리고뉴클레오티드의 많은 카피가 고처리량, 차세대 기술을 사용하여 합성되고, 저장되고, 시퀀싱된다. 합성 및 시퀀싱의 오류가 거의 일치하지 않기 때문에, 각각의 분자 카피는 다른 카피의 오류를 수정한다.
한 측면에 따르면, 올리고뉴클레오티드는 관련 기술 분야의 통상의 기술자에게 알려진 방법을 사용하여 시퀀싱된다. 뉴클레오티드 시퀀스를 이진 정보 비트로 번역하기 위해, 오류 유발 폴리머라제의 사용으로 인해 발생할 수 있는 특정 뉴클레오티드의 호모폴리머 런 (즉, 일련의 동일한 뉴클레오티드 또는 다른 모노머의 시퀀스)을 이진 정보 비트, 즉 0 또는 1을 할당하기 위해 단일 뉴클레오티드로서 처리한다. 특정 다른 측면에 따르면, 비트 스트림에서 인접한 0 또는 인접한 1을 구별하기 위해, 예를 들어 뉴클레오티드 A 및 T와 같은 0을 나타내는 2개의 모노머가 올리고뉴클레오티드 시퀀스의 설계에서 교대로 제시된다. 이것은 올리고뉴클레오티드 합성 동안 호모폴리머 런이 발생할 수 있는 경우에 인접한 0 또는 1을 별개의 이진 정보 비트로서 구별할 수 있게 한다. 예를 들어, 2개의 0이 비트 스트림에서 서로 인접할 때, 즉 -00-일 때, 해당 뉴클레오티드 시퀀스는 -AT- 또는 -TA-로 선택된다. 이러한 방식에서, 호모폴리머 런이 -AAATTT-와 같은 설계된 올리고뉴클레오티드 시퀀스의 합성 동안 생성된다면, 호모폴리머 런은 단일 뉴클레오티드로 해석될 것이고, -00-에 대응하는 -AT-로 판독될 것이다. 따라서, 이진 비트 스트림을 핵산 시퀀스로 인코딩하고 핵산 시퀀스를 다시 이진 비트 스트림으로 디코딩하는 것에 관한 본 개시내용의 방법은 핵산을 이진 비트 스트림으로 정확하게 디코딩할 수 있으면서 가변적인 뉴클레오티드 호모폴리머 런 길이를 허용한다.
한 측면에 따르면, 비트를 나타내는 뉴클레오티드를 사용하여 정보를 저장하는 방법이 제공되고, 이 방법은 정보의 포맷을 각각 대응하는 비트 바코드를 갖는, 비트 스트림의 복수의 비트 시퀀스로 변환하는 단계, 염기 인코딩당 1개의 비트를 사용하여 복수의 비트 시퀀스를 복수의 대응하는 올리고뉴클레오티드 시퀀스로 변환하는 단계, 성장하는 올리고뉴클레오티드 쇄에 뉴클레오티드가 부가되도록 효소 시약 및 세척제를 펄싱 및 동기화함으로써 복수의 대응하는 올리고뉴클레오티드 시퀀스를 합성하는 단계, 및 합성된 복수의 대응하는 올리고뉴클레오티드 시퀀스를 저장하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다. 한 측면에 따르면, 오류 유발 폴리머라제는 복수의 대응하는 올리고뉴클레오티드 시퀀스를 합성하는데 사용될 수 있다.
한 측면에 따르면, 정보의 포맷의 비트 시퀀스를 인코딩하는 복수의 합성된 올리고뉴클레오티드 시퀀스로부터 정보의 포맷을 검색하는 방법이 제공되고, 이 방법은 복수의 올리고뉴클레오티드 시퀀스를 증폭하는 단계, 증폭된 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 변환하는 단계, 및 비트 시퀀스를 정보의 포맷으로 변환하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다. 뉴클레오티드 시퀀스를 이진 정보 비트로 번역하기 위해, 오류 유발 폴리머라제의 사용으로 인해 발생할 수 있는 특정 뉴클레오티드의 호모폴리머 런은 이진 정보 비트, 즉 0 또는 1을 할당하기 위해 단일 뉴클레오티드로서 처리된다.
한 측면에 따르면, 정보의 포맷의 비트 시퀀스를 인코딩하는 복수의 합성된 올리고뉴클레오티드 시퀀스로부터 정보의 포맷을 액세스하는 방법이 제공되고, 이 방법은 복수의 올리고뉴클레오티드 시퀀스를 증폭하는 단계, 증폭된 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 변환하는 단계, 비트 시퀀스를 정보의 포맷으로 변환하는 단계, 및 정보의 포맷을 가시화하거나 정보의 포맷을 오디오로 만드는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다. 뉴클레오티드 시퀀스를 이진 정보 비트로 번역하기 위해, 오류 유발 폴리머라제의 사용으로 인해 발생할 수 있는 특정 뉴클레오티드의 호모폴리머 런은 이진 정보 비트, 즉 0 또는 1을 할당하기 위해 단일 뉴클레오티드로서 처리된다.
한 측면에 따르면, 뉴클레오티드를 사용하여 정보를 저장하는 방법이 제공되고, 이 방법은 정보의 포맷을 비트 스트림으로 변환하는 단계, 비트 시퀀스를 대응하는 올리고뉴클레오티드 시퀀스로 인코딩하는 단계, 예를 들어 오류 유발 폴리머라제와 같은 효소를 사용하여 하나 초과의 뉴클레오티드의 부착이 최소화되도록 시약 및 세척제를 펄싱 및 동기화함으로써 올리고뉴클레오티드 시퀀스를 합성하는 단계, 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 디코딩하는 단계, 비트 시퀀스를 비트 스트림으로 어셈블링하는 단계 및 비트 스트림을 정보의 포맷으로 변환하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다. 뉴클레오티드 시퀀스를 이진 정보 비트로 번역하기 위해, 오류 유발 폴리머라제의 사용으로 인해 발생할 수 있는 특정 뉴클레오티드의 호모폴리머 런은 이진 정보 비트, 즉 0 또는 1을 할당하기 위해 단일 뉴클레오티드로서 처리된다.
뉴클레오티드를 사용하여 정보를 저장하는 방법이 제공되고, 이 방법은 제1 정보의 포맷을 제1 비트 스트림으로 변환하는 단계, 제1 비트 시퀀스를 대응하는 올리고뉴클레오티드 시퀀스로 인코딩하는 단계, 예를 들어 오류 유발 폴리머라제를 사용하여 하나 초과의 뉴클레오티드의 부착이 최소화되도록 시약 및 세척제를 펄싱 및 동기화함으로써 올리고뉴클레오티드 시퀀스를 합성하는 단계, 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 제2 비트 시퀀스로 디코딩하는 단계, 제2 비트 시퀀스를 제2 비트 스트림으로 어셈블링하는 단계 및 제2 비트 스트림을 제2 정보의 포맷으로 변환하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다. 뉴클레오티드 시퀀스를 이진 정보 비트로 번역하기 위해, 오류 유발 폴리머라제의 사용으로 인해 발생할 수 있는 특정 뉴클레오티드의 호모폴리머 런은 이진 정보 비트, 즉 0 또는 1을 할당하기 위해 단일 뉴클레오티드로서 처리된다.
본 개시내용의 실시양태는 정보의 이진 비트로서의 뉴클레오티드와 같은 분자의 용도에 관한 것이다. 뉴클레오티드는 0 또는 1과 같은 이진 상태를 나타낼 수 있고, 0 또는 1과 같은 이진 상태의 시퀀스를 나타내는 뉴클레오티드의 시퀀스는 텍스트, 이미지, 비디오 또는 오디오 포맷을 나타낼 수 있다. 이러한 방식으로, 서면 자료, 그림, 오디오 컴포넌트 또는 오디오 리코딩을 갖는 비디오 또는 임의의 다른 표현 매체는 비트를 나타내는 핵산을 사용하여 저장될 수 있다. 특정 측면에 따르면, 저장될 정보는 예를 들어 컴퓨터 및 적절한 소프트웨어를 사용하여, 정보를 나타내는 일련의 0 및 1인, 예컨대 ASCII 코드에 따른, 이진 비트로 변환된다. 저장될 정보는 관련 기술 분야에 알려진 바와 같이 정보의 다른 코딩된 비트로 변환될 수 있음을 이해하여야 한다. 이어서, 일련의 뉴클레오티드가 예컨대 컴퓨터 및 적절한 소프트웨어를 사용하여 결정되며, 이는 0 및 1과 같은 정보의 일련의 코딩되는 비트를 나타낸다. 이어서, 일련의 뉴클레오티드가 합성되고, 저장 매체에 저장된다. 정보가 액세스될 때, 일련의 뉴클레오티드가 결정되고, 이어서 예컨대 컴퓨터 및 적절한 소프트웨어를 사용하여 일련의 0 및 1로 번역되고 이것이 이어서 예를 들어 컴퓨터 및 적절한 소프트웨어를 사용하여 정보로 번역된다. 이러한 방식에서, 본 개시내용의 측면은 정보의 저장 매체로서의, 완전히 또는 부분적으로 단일 가닥이든, 이중 가닥이든 또는 다중 가닥이든, 핵산의 용도에 관한 것이다. 한 측면에 따르면, 핵산은 규칙적 방식이든 또는 무작위 방식이든 지지체 기판 상에 포함된다.
특정 측면에 따르면, 변형된 것이든 그렇지 않은 것이든 오류 유발 주형 의존성 폴리머라제를 비제한적으로 포함하는 폴리머라제는 저장될 정보를 나타내는 이진 비트를 나타내는 원하는 뉴클레오티드 시퀀스를 갖는 뉴클레오티드 폴리머를 생성하기 위해 사용될 수 있다. 변형된 것이든 그렇지 않은 것이든 주형 비의존성 폴리머라제는 핵산을 새로이 생성하기 위해 사용할 수 있다. 한 측면에 따르면, A, T/U, C 또는 G와 같은 통상적인 뉴클레오티드가 사용된다. 한 측면에 따르면, 쇄 종결 모이어티가 결여된 뉴클레오티드가 사용된다. 한 측면에 따르면, 쇄 종결 뉴클레오티드는 뉴클레오티드 폴리머의 제조 방법에 사용되지 않는다. 이 측면에 따르면, 주형 비의존성 폴리머라제는 핵산 시퀀스를 만드는데 사용될 수 있다. 이러한 주형 비의존성 폴리머라제는 하나 초과의 뉴클레오티드를 부가하여 호모폴리머를 생성할 수 있는 오류 유발 폴리머라제일 수 있다. 본 개시내용의 특정 측면에 따르면, 호모폴리머 런은 어떤 정보의 이진 비트를 호모폴리머 런이 나타내는지 결정하기 위해 단일 뉴클레오티드로서 해석된다. 리간드에 의해 활성화되는 센서, 예컨대 광 활성화된 센서, 대사 생성물 또는 화학물질이 이러한 폴리머라제와 함께 사용될 수 있다.
핵산 폴리머는 관련 기술 분야의 통상의 기술자에게 알려진 방법을 사용하여 시퀀싱될 수 있다. 일단 핵산 시퀀스가 결정되면, 핵산 시퀀스는 일련의 이진 비트, 즉 0 및 1로 번역될 수 있고, 이들은 이어서 일련의 이진 비트에 의해 나타내어지는 정보로 번역될 수 있다.
본 개시내용의 특정 실시양태의 추가의 특징 및 이점은 실시양태 및 그의 도면에 대한 다음의 설명, 및 청구범위로부터 보다 충분히 명백해질 것이다.
본 발명의 상기 및 다른 특징 및 이점은 첨부된 도면과 함께 예시적인 실시양태에 대한 다음의 상세한 설명으로부터 보다 충분히 이해될 것이다.
도 1은 올리고뉴클레오티드가 합성될 미리 규정된 영역을 갖는 기판을 가로질러 유동하는 뉴클레오티드의 펄스를 도시하는 개략도이다.
도 2는 올리고뉴클레오티드가 합성될 미리 규정된 영역을 갖는 기판을 가로질러 유동하는 뉴클레오티드의 펄스를 도시하는 개략도이다.
도 3은 올리고뉴클레오티드가 합성될 미리 규정된 영역을 갖는 기판을 가로질러 유동하는 뉴클레오티드의 펄스를 도시하는 개략도이다.
바람직한 특정 실시양태의 상세한 설명
본 발명은 올리고머를 사용하여 정보를 저장하는 방법에 관한 것이다. 이러한 올리고머는 예를 들어 이진 비트를 나타낼 수 있는 모노머로 형성될 수 있다. 예시적인 모노머는 뉴클레오티드를 포함한다. 예시적인 올리고머는 올리고뉴클레오티드를 포함한다. 한 측면에 따르면, 정보를 인코딩하는 방법이 제공되고, 여기서 비트의 시퀀스는 모노머, 예컨대 뉴클레오티드의 시퀀스로 변환되고, 모노머의 시퀀스는 폴리머, 예컨대 올리고뉴클레오티드이다. 한 측면에 따르면, 본원에서 설명되는 방법은 올리고뉴클레오티드 합성을 위해 사용될 수 있거나 또는 상업적으로 이용가능한 또는 알려진 폴리머 또는 핵산 합성 방법이 사용될 수 있다. 한 측면에 따르면, 상업적으로 이용가능한 또는 알려진 핵산 증폭 방법이 사용된다. 한 측면에 따르면, 상업적으로 이용가능한 또는 알려진 핵산 시퀀싱 방법이 사용된다. 한 측면에 따르면, 폴리머 내에서 모노머를 확인하는 상업적으로 이용가능한 또는 알려진 방법이 사용된다.
한 측면에 따르면, 정보의 포맷, 예컨대 텍스트, 이미지, 비디오 또는 오디오 포맷, 예컨대 정보의 html 포맷, 예컨대 텍스트 및/또는 이미지를 갖는 html 북의 부분 또는 부분들은 예를 들어 컴퓨터 및 적절한 소프트웨어를 사용하여 비트, 즉 0 및 1로 변환되며, 비트 시퀀스, 즉 일반적으로 이해되는 일련의 0 및 1을 형성하기 위해 비트 바코드가 추가된다. 비트로 변환될 수 있는 정보의 다른 포맷은 관련 기술 분야의 통상의 기술자에게 알려져 있다. 한 측면에 따르면, 비트로 변환될 정보의 html 포맷의 부분은 바이트 부분으로 지칭될 수 있다. 비트 바코드는 정보의 전체 html 포맷 내에서 인코딩된 비트의 위치를 결정할 수 있다. 이어서, 비트 시퀀스는 염기 인코딩당 1개 비트 (A 또는 C = 0; T/U 또는 G = 1)를 사용하여, 예컨대 컴퓨터 및 적절한 소프트웨어에 의해 설계된 뉴클레오티드, 즉 올리고뉴클레오티드 또는 DNA 또는 RNA의 시퀀스로 변환 (인코딩)되어 대응하는 인코딩된 올리고뉴클레오티드 시퀀스를 형성하고, 즉, 올리고뉴클레오티드 시퀀스는 비트 시퀀스에 상응하거나 이를 인코딩한다.
정보의 html 포맷의 일부 또는 전체에 대응하여 복수의 비트 시퀀스가 생성된다. 따라서, 복수의 대응하는 인코딩된 올리고뉴클레오티드 시퀀스가 생성되며, 이들은 함께 라이브러리로 지칭될 수 있다. 인코딩된 올리고뉴클레오티드 시퀀스의 라이브러리는 정보의 html 포맷을 나타낸다. 한 측면에 따르면, 올리고뉴클레오티드는 비트 데이터 블록 부분, 비트 스트림에서 데이터 블록의 위치를 특정하는 비트 어드레스 부분 및 증폭 및 시퀀싱을 위한 플랭킹 공통 시퀀스를 포함한다. 예를 들어, 159개 뉴클레오티드 올리고뉴클레오티드는 96-비트 데이터 블록 (96 nt), 19-비트 어드레스 (19 nt) 및 올리고뉴클레오티드의 플랭킹 22-비트 공통 시퀀스 (22 nt)를 포함할 수 있다.
한 예시적인 측면에 따르면, 인코딩된 올리고뉴클레오티드 시퀀스는 이어서 오류 유발 폴리머라제, 예컨대 주형 비의존성 오류 유발 폴리머라제, 및 비변형될 수 있는 공통 또는 천연 핵산을 사용하여 합성된다. 이 측면에 따르면, 개시자 시퀀스 또는 프라이머는 어드레스 지정 가능 (addressable) 어레이에서와 같이 알려진 또는 무작위로 선정되는 다양한 위치에서 이산화규소 기판과 같은 기판에 부착된다. 적어도 선택된 뉴클레오티드, 주형 비의존성 폴리머라제 및 폴리머라제의 효소 활성을 위해 요구되는 다른 시약을 포함하는 시약은 개시자 시퀀스가 위치하는 기판의 하나 이상의 위치에, 폴리머라제가 하나 또는 하나 초과의 또는 복수의 뉴클레오티드를 개시자 시퀀스에 부가하여 개시자 시퀀스를 연장하는 조건 하에 적용된다. 한 측면에 따르면, 뉴클레오티드 ("dNTP")는 폴리머라제 중합 (또는 스위칭) 속도를 고려하여 알려진 시간적 및 공간적 방식 또는 폭 또는 조건의 주기적 적용 또는 파동으로 적용되거나 유동한다. 이 예시적인 방식에서, 차단기 또는 가역적 종결제는 dNTP와 함께 사용되지 않고, 그 이유는 반응 조건이 하나의 dNTP에 대한 dNTP의 효소에 의한 부가 가능성을 제한하거나 감소시키기에 충분하도록 선택되기 때문에, 즉, 반응 동역학을 고려하여 선택된 반응 조건을 사용하여 하나의 dNTP가 부가되기 때문이다. 그러나, 차단기 또는 가역적 종결제를 갖는 뉴클레오티드가 특정 실시양태에서 사용될 수 있음을 이해하여야 한다. 차단기 또는 가역적 종결제를 갖는 뉴클레오티드는 관련 기술 분야의 통상의 기술자에게 알려져 있다. 반응 조건이 허용되는 추가의 실시양태에 따르면, 공통 또는 천연 뉴클레오티드가 주형 비의존성 오류 유발 폴리머라제와 함께 사용되는 경우, 하나 초과의 dNTP가 부가되어 호모폴리머 런을 형성할 수 있다. 그러나, 본원에서 설명되는 방법의 시퀀싱 단계 동안, 각각의 호모폴리머 런은 단일 dNTP를 나타내는 것으로 해석된다. 이러한 방식에서, 본원에서 설명되는 기록 및 판독 방법은 호모폴리머 런을 가능하게 하고, 합성 방법은 오류를 유발할 수 있는 주형 비의존성 폴리머라제를 사용할 때와 같이 단지 단일 dNTP만을 부가할 필요는 없다.
또한, 본 개시내용은 동일한 이진 비트가 직렬로 존재하는 핵산을 제조할 때 단일 이진 비트를 나타내는 2개의 상이한 모노머 사이에서 교대로 발생하다. 예를 들어, 연속적으로 존재하는 2개의 0, 즉 "00"이 의도되는 경우, 대응하는 핵산에서 제1 0은 "A"를 나타내고 제2 0은 "C"를 나타낼 것이고, 따라서 오류 유발 폴리머라제에 의해 A 또는 C의 호모폴리머 런이 존재하는 경우에도, 제1 "0"과 제2 "0"은 별개의 비트로서 서로 구분될 수 있다. 4개 뉴클레오티드를 사용할 때, 한 쌍의 뉴클레오티드는 제1 이진 비트를 나타내고 나머지 쌍은 제2 이진 비트를 나타내는 것으로 이해되어야 한다. 따라서, A 및 C는 제1 이진 비트를 나타낼 수 있고, T 및 G는 제2 이진 비트를 나타낼 수 있다. 대안적으로, A 및 G는 제1 이진 비트를 나타낼 수 있고, T 및 C는 제2 이진 비트를 나타낼 수 있다. 대안적으로, A 및 T는 제1 이진 비트를 나타낼 수 있고, C 및 C는 제2 이진 비트를 나타낼 수 있다. 대안적으로, 4개 뉴클레오티드는 3개 뉴클레오티드가 0, 1 및 2를 나타내고 나머지 뉴클레오티드는 호모폴리머 런을 구별하기 위해 3개 뉴클레오티드 다음에 사용되는 "삼진 (trinary)" 데이터 시스템에서 사용될 수 있다. 예를 들어, 삼진 데이터 시스템을 사용하여 4개 뉴클레오티드를 사용할 때, A, C, T는 각각 0, 1 및 2를 나타낼 수 있고 G는 호모폴리머 런이 존재할 수 있을 경우, 예를 들어 A와 A를 구별하기 위해 A, C 또는 T 다음에 사용될 수 있다. 대안적으로, 3개 뉴클레오티드는 2개 뉴클레오티드가 각각 0 및 1을 나타낼 수 있고 제3 뉴클레오티드는 호모폴리머 런을 구별하기 위해 다음 뉴클레오티드로서 사용될 수 있는 이진 시스템을 나타내기 위해 사용될 수 있다.
폴리머라제 활성은 단일 dNTP를 넘어선 dNTP의 부가를 최소화하도록 반응 조건으로서 광화학적 또는 전기화학적 조정을 사용하여 변형될 수 있다. 이어서, 시약을 제거하기 위해 세척이 하나 이상의 위치에 적용된다. 시약을 적용하는 단계 및 세척은 원하는 핵산이 생성될 때까지 반복된다. 한 측면에 따르면, 시약은 기판 상의 하나 또는 하나 초과의 또는 복수의 위치에 연속적으로 또는 병렬로 부가될 수 있거나, 시약은 예컨대 시약을 지지체의 표면을 가로질러 유동시킴으로써 지지체의 전체 표면과 접촉할 수 있다. 한 측면에 따르면, 반응 조건은 예를 들어 개시자 시퀀스 또는 성장하는 올리고뉴클레오티드의 말단에 하나 초과의 뉴클레오티드를 부착시키는 폴리머라제의 능력을 제한하기 위해 반응 동역학 또는 폴리머라제의 활성에 기초하여 결정된다.
또한, 특정 실시양태에 따르면, 폴리머라제는 광에 기초한 방법에 대해 광 민감성으로 조절될 수 있다. 이 측면에 따르면, 광은 단일 뉴클레오티드만을 부가하도록 폴리머라제를 조정하도록 조절된다. 광은 폴리머라제, 뉴클레오티드 및 적절한 시약 및 반응 조건이 존재하는 기판의 개별 위치 또는 픽셀에 조사된다. 이러한 방식에서, 폴리머라제가 광에 의해 활성화될 때 뉴클레오티드가 개시자 시퀀스 또는 기존의 뉴클레오티드에 부가된다.
특정 측면에 따르면, 오류 유발 폴리머라제는 정보를 나타내는 올리고뉴클레오티드를 생성하기 위해 사용될 수 있다. 이러한 올리고뉴클레오티드는 오류 유발 과정을 사용하여 제조된다. 오류 유발 과정은 단일 뉴클레오티드를 부착하는 대신에 호모폴리머 런, 즉 2개 이상의 뉴클레오티드를 직렬로 연결하는 것을 포함할 수 있다. 본 개시내용에 따르면, 호모폴리머 런은 이진 비트 정보로 번역하기 위해 핵산을 시퀀싱할 때 호모폴리머의 단일 뉴클레오티드로서 처리된다.
특정 실시양태에 따르면, 주형 의존성 오류 유발 폴리머라제가 사용될 수 있다. 특정 실시양태에 따르면, 오류 유발할 수 있는 주형 의존성 폴리머라제가 사용될 수 있다. 특정 실시양태에 따르면, 주형 비의존성 RNA 폴리머라제가 사용될 수 있다.
또한, 핵산 시퀀스를 제조하는 유용한 방법은 본원에 그 전부가 참고로 포함된 문헌 ["Large-scale de novo DNA synthesis: technologies and applications," Sriram Kosuri and George M. Church, Nature Methods, May, 2014, Vol. 11, No. 5, pp. 499-507]에 개시되어 있다.
특정 측면에 따르면, 커스텀어레이, 인크. (CustomArray, Inc.)로부터 상업적으로 입수할 수 있는 커스텀어레이 시스템은 기판 상에 국소적으로 pH에 영향을 주거나 변경하거나 생성함으로써 정보를 인코딩하는 핵산 시퀀스가 저장되도록 하기 위해 사용될 수 있는 예시적인 시스템이다. 기판 상의 특정 위치에서 pH에 영향을 주거나 변경하거나 생성하기 위해 다른 방법이 사용될 수 있음을 이해하여야 한다. 커스텀어레이 시스템은 pH 구배를 사용하고, 반도체 기반 전기화학적 합성 공정을 사용하여 원하는 올리고뉴클레오티드 마이크로어레이를 합성한다. 각각의 올리고뉴클레오티드 프로브는 합성기의 컴퓨터에 의해 독립적으로 제어되는 백금 전극을 통해 합성된다. 본원에서 설명되는 방법에 따르면, 기판 상의 원하는 특정 위치에서 pH 민감성 폴리머라제를 활성화하는 pH 구배가 생성되어 원하는 특정 위치에서 수성 매질에 기존의 뉴클레오티드를 부가한다. 이 측면에 따르면, pH는 단일 뉴클레오티드만을 부가하기 위해 폴리머라제를 개시하도록 조정된다. 본원에서 설명되는 측면에 따르면, 커스텀어레이 시스템과 같은 시스템은 pH 의존성 폴리머라제, 뉴클레오티드 및 수성 매질 내의 다른 적합한 시약이 존재하는 기판 상에 국소적으로 pH에 영향을 주거나 변경하거나 생성하여, 올리고뉴클레오티드를 형성하는 방법에서 개시자 시퀀스 또는 기존의 뉴클레오티드 또는 올리고뉴클레오티드에 뉴클레오티드를 부가할 수 있다. 본원에서 설명되는 예시적인 방법은 올리고뉴클레오티드를 형성하는 방법에서 기판 상의 원하는 위치에서 기존의 개시자 시퀀스, 기존의 뉴클레오티드 또는 기존의 올리고뉴클레오티드를 부가하기 위해 TdT와 같은 주형 비의존성 폴리머라제와 같은 폴리머라제의 활성을 조정하기 위해 수성 용매 및 pH를 사용한다.
한 측면에 따르면, 유동 셀 또는 다른 채널, 예컨대 유입부 및 배출부를 갖는 미세유동 채널(들)이 시약, 예컨대 폴리머라제, 뉴클레오티드 및 다른 적절한 시약 및 세척제를 포함하는 유체를 유동 셀 내, 예컨대 반응 챔버 내의 기판 상의 특정 위치에 전달하기 위해 사용된다. 특정 측면에 따르면, 반응 조건은 기판 상의 위치를 선택적으로 활성화 및 비활성화하기 위해 선택된다. 이러한 방식에서, 기판 또는 어레이 상의 그리드 점과 같은 원하는 위치에 뉴클레오티드와 개시자 시퀀스, 기존의 뉴클레오티드 및 기존의 올리고뉴클레오티드의 공유 결합을 촉진하는 반응 조건을 제공할 수 있고, 동일한 위치에서 추가의 뉴클레오티드의 추가적인 부착을 방지하기 위한 반응 조건이 제공될 수 있다. 이어서, 뉴클레오티드의 기존의 뉴클레오티드에 대한 공유 결합을 촉진하기 위한 반응 조건은 원하는 위치에 올리고뉴클레오티드를 만드는 방법에서 동일한 위치에 제공될 수 있다.
한 측면에 따르면, 지지체의 표면이 그 위에서 성장하는 원하는 핵산을 가지면, 그 위에 핵산을 갖는 기판의 표면에 제2 기판을 첨가할 수 있고, 핵산의 제2 층을 제2 기판 상에 생성시킬 수 있다. 또한, 이 공정은 추가의 기판에 대해 반복되어, 그 위에 핵산을 갖는 많은 또는 복수의 기판층을 갖는 적층된 기판을 생성할 수 있다. 이 측면에 따르면, 기록 매체의 각 층에 올리고뉴클레오티드를 사용하여 정보를 저장하는 기록 매체가 제조될 수 있다.
이어서, 합성된 올리고뉴클레오티드는 올리고뉴클레오티드의 라이브러리를 형성하기 위해 관련 기술 분야의 통상의 기술자에게 알려진 방법을 사용하여 증폭된다. 이어서, 올리고뉴클레오티드의 라이브러리는 관련 기술 분야의 통상의 기술자에게 알려진 방법, 예를 들어 차세대 시퀀싱 방법을 사용하여 시퀀싱된다. 이어서, 시퀀싱된 올리고뉴클레오티드는 예를 들어 html 포맷의 정보에 대응하는 비트 시퀀스로 변환된다. 비트 시퀀스는 관련 기술 분야의 통상의 기술자에게 알려진 방법을 사용하여 정보의 포맷으로 변환될 수 있다. 정보의 포맷은 관련 기술 분야의 통상의 기술자에게 알려진 방법 및 장치를 사용하여 가시화되거나 디스플레이되거나, 오디오 포맷인 경우 재생될 수 있다.
본원에서 사용되는 핵산 화학, 생화학, 유전학 및 분자생물학의 용어 및 기호는 관련 기술 분야의 표준 논문 및 텍스트, 예를 들어 문헌 [Komberg and Baker, DNA Replication, Second Edition (W.H. Freeman, New York, 1992)]; [Lehninger, Biochemistry, Second Edition (Worth Publishers, New York, 1975)]; [Strachan and Read, Human Molecular Genetics, Second Edition (Wiley-Liss, New York, 1999)]; [Eckstein, editor, Oligonucleotides and Analogs: A Practical Approach (Oxford University Press, New York, 1991)]; [Gait, editor, Oligonucleotide Synthesis: A Practical Approach (IRL Press, Oxford, 1984)] 등의 용어 및 기호를 따른다.
비트
본원에서 사용되는 바와 같이, 용어 "비트"는 관련 기술 분야의 통상의 기술자에게 그의 통상적인 의미에 따라 이해되어야 한다. 용어 "비트"는 "2진수 (binary digit)"의 축소형일 수 있으며, 컴퓨팅 및 통신 분야의 기본 정보 용량을 나타낼 수 있다. "비트"는 제1 상태 또는 제2 상태, 예컨대 1 또는 0 (일 또는 영)만을 나타낸다. 표시는 2 상태 장치 (two state device)를 사용하여 다양한 시스템에서 구현될 수 있다.
핵산 및 뉴클레오티드
본원에서 사용되는 바와 같이, 용어 "핵산 분자", "핵산 시퀀스", "핵산 단편" 및 "올리고머"는 교환 가능하게 사용되며, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드, 또는 이들의 유사체를 포함하는 다양한 길이를 가질 수 있는 뉴클레오티드의 폴리머 형태를 포함하고 이로 제한되지 않는 것으로 의도된다.
일반적으로, 용어 "핵산 분자", "핵산 시퀀스", "핵산 단편", "올리고뉴클레오티드" 및 "폴리뉴클레오티드"는 교환 가능하게 사용되며, 데옥시리보뉴클레오티드 (DNA) 또는 리보뉴클레오티드 (RNA) 또는 이들의 유사체인, 다양한 길이를 가질 수 있는 뉴클레오티드의 폴리머 형태를 포함하고 이로 제한되지 않는 것으로 의도된다. 올리고뉴클레오티드는 전형적으로 다음과 같은 4개 뉴클레오티드 염기의 특정 시퀀스로 이루어진다: 아데닌 (A); 시토신 (C); 구아닌 (G); 및 티민 (T) (폴리뉴클레오티드가 RNA일 때, 티민 (T) 대신에 우라실 (U)). 특정 측면에 따르면, 데옥시뉴클레오티드 (dNTP, 예컨대 dATP, dCTP, dGTP, dTTP)가 사용될 수 있다. 특정 측면에 따르면, 리보뉴클레오티드 트리포스페이트 (rNTP)가 사용될 수 있다. 특정 측면에 따르면, 리보뉴클레오티드 디포스페이트 (rNDP)가 사용될 수 있다.
용어 "올리고뉴클레오티드 시퀀스"는 폴리뉴클레오티드 분자의 알파벳 표현이며; 다르게는, 이 용어는 폴리뉴클레오티드 분자 자체에 적용될 수 있다. 이 알파벳 표현은 중앙 처리 장치가 있는 컴퓨터의 데이터베이스에 입력할 수 있으며, 기능 유전체학 및 상동성 검색과 같은 생물정보학 응용 프로그램에 사용된다. 올리고뉴클레오티드는 하나 이상의 비-표준 뉴클레오티드(들), 뉴클레오티드 유사체(들) 및/또는 변형된 뉴클레오티드를 선택적으로 포함할 수 있다. 본 개시내용은 임의의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 및 이의 화학적 변이체, 예컨대 염기의 메틸화된, 히드록시메틸화된 또는 글루코실화된 형태 등을 고려한다. 특정 측면에 따르면, 천연 뉴클레오티드가 핵산을 제조하는 방법에 사용된다. 천연 뉴클레오티드에는 쇄 종결 모이어티가 결여된다. 또 다른 측면에 따르면, 본원에서 설명되는 핵산을 제조하는 방법은 종결 핵산을 사용하지 않거나, 종결 핵산, 예컨대 관련 기술 분야의 통상의 기술자에게 알려진 가역성 종결제가 결여된다. 상기 방법은 쇄 종결 핵산의 부재 하에 수행되거나, 핵산은 쇄 종결 핵산 이외의 다른 핵산이다.
변형된 뉴클레오티드의 예는 디아미노퓨린, S2T, 5-플루오로우라실, 5-브로모우라실, 5-클로로우라실, 5-아이오도우라실, 히포크산틴, 크산틴, 4-아세틸시토신, 5-(카르복시히드록실메틸)우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디히드로우라실, 베타-D-갈락토실쿠에오신, 이노신, N6-이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸시토신, N6-아데틴, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-만노실쿠에오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-D46-이소펜테닐아데닌, 우라실-5-옥시아세트산 (v), 와이부톡소신, 슈도우라실, 쿠에오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세트산 메틸에스테르, 우라실-5-옥시아세트산 (v), 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필)우라실, (acp3)w, 2,6-디아미노퓨린 등을 포함하고 이로 제한되지 않는다. 핵산 분자는 또한 염기 모이어티 (예를 들어, 전형적으로 상보성 뉴클레오티드와 수소 결합을 형성하기 위해 이용가능한 하나 이상의 원자에서 및/또는 전형적으로 상보성 뉴클레오티드와 수소 결합을 형성할 수 없는 하나 이상의 원자에서), 당 모이어티 또는 포스페이트 백본에서 변형될 수 있다. 핵산 분자는 또한 N-히드록시 숙신이미드 에스테르 (NHS)와 같은 아민 반응성 모이어티의 공유 부착을 허용하기 위해 아미노알릴-dUTP (aa-dUTP) 및 아미노헥실아크릴아미드-dCTP (aha-dCTP)와 같은 아민 변형기를 함유할 수 있다.
본 개시내용의 올리고뉴클레오티드에서 표준 DNA 염기쌍 또는 RNA 염기쌍의 대안은 입방㎜당 더 높은 비트 밀도, 보다 높은 안전성 (천연 독소의 의도하지 않거나 의도적인 합성에 대한 저항성), 광 프로그램된 (photo-programmed) 폴리머라제에서의 보다 쉬운 식별 또는 보다 낮은 2차 구조를 제공할 수 있다. 새로운 및/또는 증폭 합성을 위한 천연 및 돌연변이체 폴리머라제와 상용성인 상기 대체 염기쌍은 문헌 [Betz K, Malyshev DA, Lavergne T, Welte W, Diederichs K, Dwyer TJ, Ordoukhanian P, Romesberg FE, Marx A (2012) KlenTaq polymerase replicates unnatural base pairs by inducing a Watson-Crick geometry, Nature Chem. Biol. 8:612-614]에 기재되어 있다 (문헌 [YJ, Malyshev DA, Lavergne T, Ordoukhanian P, Romesberg FE. J Am Chem Soc. 2011 Dec 14;133(49):19878-88, Site-specific labeling of DNA and RNA using an efficiently replicated and transcribed class of unnatural base pairs]; [Switzer CY, Moroney SE, Benner SA. (1993) Biochemistry. 32(39):10489-96. Enzymatic recognition of the base pair between isocytidine and isoguanosine]; [Yamashige R, Kimoto M, Takezawa Y, Sato A, Mitsui T, Yokoyama S, Hirao I. Nucleic Acids Res. 2012 Mar;40(6):2793-806. Highly specific unnatural base pair systems as a third base pair for PCR amplification]; 및 [Yang Z, Chen F, Alvarado JB, Benner SA. J Am Chem Soc. 2011 Sep 28;133(38):15105-12, Amplification, mutation, and sequencing of a six-letter synthetic genetic system] 참조). 다른 비-표준 뉴클레오티드는 그 전체가 본원에 참고로 포함된 문헌 [Malyshev, D.A., et al., Nature, vol. 509, pp. 385-388 (15 May 2014)]에 기재된 바와 같이 사용될 수 있다.
아래의 6쌍 (A-T, G-C, Z-P, Ds-Px, NAM-SSICS, isoC-isoG)은 폴리머라제와 상용성이고 서로 직교형 (orthogonal) (즉, 낮은 수준의 교차 염기쌍 형성)인 것으로 밝혀졌다.
Figure pct00001
따라서, 본 개시내용의 측면은 4 염기 시스템을 사용한 2개의 상이한 염기쌍과는 대조적으로, 12 염기 시스템에 대한 6개의 상이한 염기쌍을 사용하는 것을 고려한다. 따라서, 본 개시내용의 측면은 4 염기 시스템을 사용한 2개의 상이한 염기쌍과는 대조적으로, 6 염기 시스템에 대한 3개의 상이한 염기쌍을 사용하는 것을 고려한다.
한 측면에 따르면, mRNA 비의존성 리보솜은 정보를 인코딩하는 폴리머를 합성하기 위해, 예를 들어 20개의 표준 아미노산을 사용하여 본원에서 설명되는 뉴클레오티드 펄스와 유사한 tRNA의 펄스와 함께 사용된다. 이 측면은 보다 많은 유형의 모노머, 및 보다 콤팩트한 인코딩, 즉 더 작은 평균 크기로 인한 3X 비트/g 및 20개의 표준 AA + 12개의 비표준 AA의 더 큰 다양성 (5 비트) vs 4개의 염기 (2 비트)로 인한 5/2X 비트/g을 제공한다. 이 실시양태에서, 위치당 더 많은 펄스가 필요하다 (20 또는 32 vs 4 펄스).
비-뉴클레오티드 모노머
본 개시내용의 실시양태는 비트를 나타낼 수 있고 뉴클레오티드와 관련하여 본원에서 설명되는 바와 같은 정보를 기록하기 위해 폴리머로 형성될 수 있는 다른 모노머 분자를 포함한다. 이러한 폴리머 및 그의 모노머는 모노머 및 생체폴리머, 예컨대 펩티드 및 폴리펩티드 (콜라겐 및 반코마이신과 같은), 케티드 및 폴리케티드 (지방 및 테트라시클린과 같은), 지방산 및 지질, 지방산 및 당지질, 당류 및 지질다당류, 인지질, 호르몬, 다당류 (셀룰로오스 및 전분과 같은), 테르펜 및 폴리테르펜 (콜레스테롤 및 고무), 아미노산 및 폴리아미노산 (리그닌 및 폴리알칼로이드와 같은), 피롤 및 폴리피롤 (헴 및 비타민 B12와 같은), 및 에스테르 및 폴리에스테르 (PHA, PHV와 같은)를 포함한다. 추가의 폴리머는 비-생물학적 폴리머, 예컨대 실록산 및 폴리실록산을 포함하는 선형 폴리머, 아크릴아미드 및 폴리아크릴아미드 등을 포함한다. 이러한 올리고머는 나노세공 또는 다른 폴리머 시퀀싱 장치에서 충분한 열 안정성 또는 검출 용이성을 가질 수 있다. 비-뉴클레오티드 모노머를 사용하여 폴리머를 제조하는 경우, 관련 기술 분야의 통상의 기술자에게 알려진 방법을 사용하여 상기 모노머를 확인한다.
특정 측면에 따르면, 본원에서 확인된 비-뉴클레오티드 기반 폴리머를 포함하는 폴리머는 폴리머에서 개별 모노머를 결정하기 위해 폴리머를 나노세공 또는 나노갭 또는 나노채널에 통과시킴으로써 시퀀싱될 수 있다. 간단히 설명하면, 폴리머는 전기 전도성 매질 내에 있고, 전압 차등(voltage differential)의 영향 하에 나노세공을 통과한다. 이온 전류의 계면 의존성 변화는 개별 모노머를 구별하기 위해 사용된다.
"나노세공"은 나노미터 규모의 폭을 갖는 구멍 또는 통로를 의미한다. 예시적인 나노세공은 멀티머 단백질 고리에 의해 형성된 막을 통과하는 구멍 또는 통로를 포함한다. 전형적으로, 통로의 폭은 0.2 내지 25 nm이다. 본원에서 사용되는 나노세공은 막을 통한 분자의 통과를 허용할 수 있는 막 횡단 구조를 포함할 수 있다. 나노세공의 예는 α-헤몰리신 (스타필로코쿠스 아우레우스(Staphylococcus aureus)) 및 MspA (미코박테리움 스메그마티스(Mycobacterium smegmatis))를 포함한다. 나노세공의 다른 예는 나노세공 시퀀싱을 설명하는 관련 기술 분야에서 발견되거나 세공 형성 독소, 예컨대 β-PFT 판톤-발렌틴 류코시딘 에스(Panton-Valentine leukocidin S), 에오롤리신, 및 클로스트리듐 엡실론-독소, α-PFT 시톨리신 A, 2원 PFT 탄저균 독소, 또는 뉴몰리신 또는 그라미시딘과 같은 다른 것들로서 관련 기술 분야에서 설명되는 것이다. 나노세공은 나노세공 시퀀싱 기술의 출현으로 기술적으로 및 경제적으로 중요해졌다. 나노세공 시퀀싱을 위한 방법은 예를 들어 참고로 포함된 U.S.P.N. 5,795,782에 설명된 바와 같이 관련 기술 분야에 알려져 있다. 간단히 설명하면, 나노세공 검출은 예를 들어 KCl, NaCl, NiCl, LiCl 또는 관련 기술 분야의 통상의 기술자에게 알려진 다른 이온 형성 무기 화합물을 포함하는 이온성 용액과 같은 전압-전도성 유체에 잠긴 나노세공 천공 (nanopore-perforated) 막을 포함한다. 전압은 막을 가로질러 인가되고, 전류는 나노세공을 통한 이온의 전달에 의해 발생한다. 나노세공이 폴리머, 예컨대 DNA 또는 다른 비-DNA 폴리머와 상호작용할 때, 나노세공을 통한 유동은 모노머 특유의 방식으로 조정되며, 모노머(들)의 확인을 허용하는 전류의 변화를 가져온다. 본 개시내용의 범위 내의 나노세공은 관련 기술 분야의 통상의 기술자에게 알려진 고상 비-단백질 나노세공 및 관련 기술 분야의 통상의 기술자에게 알려진 DNA 오리가미 (origami) 나노세공을 포함한다. 이러한 나노세공은 알려진 단백질 나노세공보다 더 큰 나노세공 폭을 제공하여, 복합체가 나노세공을 통과할 때 이온 전류의 변화를 검출할 정도로 충분히 민감하면서 검출을 위한 더 큰 분자의 통과를 허용한다.
"나노세공 시퀀싱"은 폴리머와 나노세공의 상호작용에 기초하여 폴리머의 성분을 결정하는 방법을 의미한다. 나노세공 시퀀싱은 폴리머와의 상호작용에 의해 개구의 크기가 변경될 때 발생하는, 나노세공을 통한 이온의 전도도 (conductance) 변화를 측정함으로써 달성될 수 있다.
나노세공 이외에, 본 개시내용은 갭의 폭이 약 수 나노미터, 예컨대 약 0.2 nm 내지 약 25 nm 또는 약 2 내지 약 5 nm인 두 전극 사이의 갭으로 관련 기술 분야에 알려져 있는 나노갭의 사용을 고려한다. 상기 갭은 나노세공의 개구를 모방하고, 폴리머가 갭 및 전극 사이를 통과하도록 허용한다. 본 개시내용의 측면은 또한 폴리머가 통과하는 나노채널에 인접하여 위치하는 나노 채널 전극의 사용을 고려한다. 관련 기술 분야의 통상의 기술자는 전기장을 통한 분자 또는 모이어티의 이동 및 전기장을 통과하는 구조를 나타내는 전기장의 왜곡의 생성을 기초로 하여 분자 또는 모이어티 확인 및 시퀀싱의 상이한 실시양태를 쉽게 예상할 수 있음을 이해하여야 한다.
핵산 합성
올리고뉴클레오티드는 말단 데옥시뉴클레오티딜 트랜스퍼라제 (TdT) 또는 오류 유발 폴리머라제를 사용하여 및/또는 본원에서 설명되는 펄스/동기화 방법을 사용하여 본원에서 설명되는 방법으로부터 제조될 수 있다. 특정 측면에 따르면, 원하는 위치에서 단일 뉴클레오티드의 결합을 촉진하는 펄스 및 동기화 파라미터는 기판, 시약, 농도, 반응 온도, 및 시약 및 세척제의 펄스를 생성하고 전달하는데 사용되는 구조의 크기에 기초하여 결정될 수 있다. 동기화는 단일 뉴클레오티드 부가만을 최적화하기 위해 효소 및 다른 반응물의 존재 하에서, 이어서 원하는 위치로부터 반응물을 희석 또는 제거함으로써 또는 원하는 위치에서 시약을 불활성화함으로써 반응 속도에 영향을 미칠 수 있는 세척시에 뉴클레오티드가 해당 위치에 유지되는 시간을 지칭한다. 특정 측면에 따르면, 주형 비의존성인 방식으로 기존의 뉴클레오티드 또는 올리고뉴클레오티드에 dNTP를 부가하기 위한 TdT의 사용을 위해 pH 및 기타 반응물 및 반응 조건을 최적화할 수 있다. 예를 들어, 그 전체가 본원에 참고로 포함된 문헌 [Ashley et al., Virology 77, 367-375 (1977)]은 dNTP 부가를 위한 특정 시약 및 반응 조건, 예컨대 개시자 크기, 2가 양이온 및 pH를 확인하고 있다. TdT는 넓은 pH 범위에 걸쳐 활성을 나타내고 최적 pH는 6.85인 것으로 보고되었다.
예시적인 특정 실시양태에서, 올리고뉴클레오티드 시퀀스는 하나 이상의 포스포르아미다이트 링커 및/또는 관련 기술 분야의 통상의 기술자에게 알려진 라이게이션 방법에 의한 시퀀싱을 사용하여 제조될 수 있다. 올리고뉴클레오티드 시퀀스는 또한 임의의 적합한 방법, 예를 들어 본원의 아래에서 설명되는 바와 같은 표준 포스포르아미다이트 방법 및 문헌 [Beaucage and Carruthers, (1981) Tetrahedron Lett. 22: 1859]에 기재된 방법 또는 문헌 [Matteucci et al. (1981) J. Am. Chem. Soc. 103:3185)]에 따른 트리에스테르 방법, 또는 시판되는 자동화 올리고뉴클레오티드 합성기 또는 관련 기술 분야에 알려진 고처리량, 고밀도 어레이 방법을 사용하는 다른 화학적 방법 (모든 목적을 위해 그 전체가 본원에 참고로 포함된 미국 특허 5,602,244, 5,574,146, 5,554,744, 5,428,148, 5,264,566, 5,141,813, 5,959,463, 4,861,571 및 4,659,774 참조)에 의해 제조될 수 있다. 미리 합성된 올리고뉴클레오티드는 또한 다양한 공급처로부터 상업적으로 입수할 수 있다.
예시적인 특정 실시양태에서, 올리고뉴클레오티드 시퀀스는 관련 기술 분야에 알려진 다양한 마이크로어레이 기술을 사용하여 제조될 수 있다. 미리 합성된 올리고뉴클레오티드 및/또는 폴리뉴클레오티드 시퀀스는 지지체에 부착되거나, 다음 문헌에 제시된 광-유도 방법, 유동 채널 및 스포팅 (spotting) 방법, 잉크젯 방법, 핀-기재 방법 및 비드-기재 방법을 사용하여 원위치에서 합성될 수 있다: [McGall et al. (1996) Proc. Natl. Acad. Sci. U.S.A. 93:13555]; [Synthetic DNA Arrays In Genetic Engineering, Vol. 20:111, Plenum Press (1998)]; [Duggan et al. (1999) Nat. Genet. S21:10; Microarrays: Making Them and Using Them In Microarray Bioinformatics, Cambridge University Press, 2003]; 미국 특허 출원 공개 2003/0068633 및 2002/0081582; 미국 특허 6,833,450, 6,830,890, 6,824,866, 6,800,439, 6,375,903 및 5,700,637; 및 PCT 출원 공개 WO 04/031399, WO 04/031351, WO 04/029586, WO 03/100012, WO 03/066212, WO 03/065038, WO 03/064699, WO 03/064027, WO 03/064026, WO 03/046223, WO 03/040410 및 WO 02/24597.
특정 측면에 따르면, 올리고뉴클레오티드 시퀀스는 관련 기술 분야의 통상의 기술자에게 알려진 잉크젯 기술, 관련 기술 분야의 통상의 기술자에게 알려진 전기화학적 기술, 관련 기술 분야의 통상의 기술자에게 알려진 미세유체 기술, 관련 기술 분야의 통상의 기술자에게 알려진 광 생성 산, 또는 관련 기술 분야의 통상의 기술자에게 알려진 광 탈보호된 모노머를 사용하여 제조될 수 있다. 이러한 기술은 고속 및 저비용, 독성 화학물질의 감소, 이동성 개선, 신생 (디지털 또는 아날로그) 합성으로 DNA 생화학 (예를 들어, 변형, 폴리머라제, 혼성화 등)을 교차배치하는 능력과 같은 올리고뉴클레오티드 제조시의 이점을 갖는다. 예를 들어, 카메라 광학 장치로부터 직접 또는 디지털 마이크로미러 디스플레이 장치 (DMD)로부터 공간적으로 패턴화된 광을 수성 화학 물질과 함께 사용할 수 있다. US2003/0228611을 참조한다. 예를 들어, 말단 데옥시뉴클레오티딜 트랜스퍼라제 (TdT) 또는 폴리(A) 폴리머라제와 같은 주형 비의존성 폴리머라제 - 대안적으로, Taq 또는 Phi29 유도체와 같은 주형 의존성 폴리머라제는 폴리머라제의 활성 부위 또는 5'→ 3' 엑소뉴클레아제 도메인 (존재하는 경우) 내로 아조벤젠 아미노산을 통합함으로써 광에 의해 프로그램 가능한 그의 기본적인 폴리머라제 기능, 염기 특이성 또는 충실도 (문헌 [Hoppmann C, Schmieder P, Heinrich N, Beyermann M. (2011) Chembiochem.12(17):2555-9. doi: 10.1002/cbic.201100578. Epub 2011 Oct 13, Photoswitchable click amino acids: light control of conformation and bioactivity] 참조)를 가질 수 있다.
광 민감성 뉴런 (광유전학)은 이온에 민감한 폴리머라제를 촉발할 수 있거나 (문헌 [Zamft B, Marblestone A, Kording K, Schmidt D, Martin-Alarcon D, Tyo K, Boyden E, Church GM(2012) Measuring Cation Dependent DNA Polymerase Fidelity Landscapes by Deep Sequencing. PLoS One, in press] 참조), 일부 적용시에 이온 플럭스 패턴 자체가 저장된 데이터 세트를 구성할 수 있다.
특정 측면에 따르면, 핵산은 전극 어레이, 종래의 카메라 광학, 현미경 광학, 평면 광학 (프레넬 또는 비드 마이크로렌즈), 만곡된 이미징 평면, 정사각형, 삼각형, 육각형 또는 기타 반복 모티프 (디지털 사진에서와 같이) 어레이 또는 아날로그 이미징 (종래의 할로겐화은 사진에서와 같이)을 사용하여 기판 상에서 제조될 수 있다. 빛이 사용되는 경우, 공간 패턴화는 DMD (디지털 마이크로 미러 장치), 다른 디지털 프로젝트 방법 또는 자연광 (아날로그) 시야를 통해 이루어질 수 있다.
특정 측면에 따르면, 핵산은 그 전체가 본원에 참고로 포함된 미국 특허 6,093,302에 개시된 바와 같은 전기화학적 고상 합성에 의해 제조될 수 있다. 이 측면에 따르면, 전기화학적으로 생성된 시약의 확산에 의한 전극 사이의 화학적 혼선 (chemical crosstalk)을 방지하기 위해 완충 또는 소거 용액과 우선적으로 접촉하는 적어도 하나의 전극을 함유하는 기판 상의 특정 위치에서의 모노머 또는 뉴클레오티드의 전기화학적 배치를 사용하여 별개의 폴리머 또는 핵산 시퀀스의 다양한 시퀀스가 제조된다.
특정 측면에 따르면, 광 생성 산은 그 전체가 본원에 참고로 포함된 문헌 [Church et al., Nature, Vol. 432, 23/30, December 2004]에 기재된 바와 같이 핵산을 합성하기 위해 사용될 수 있다.
특정 측면에 따르면, dNTP, rNTP 또는 rNDP를 제공하거나 전달하는 방법은 핵산을 제조하는데 유용하다. dNTP가 채워진 리포솜 내의 pH 민감성 바이러스 입자로부터 리파제 또는 기타 막 용해 효소의 방출은 문헌 [J Clin Microbiol. May 1988; 26(5): 804-807]에 기재되어 있다. 그로부터 NTP가 방출될 수 있는 광 구속된 (photo-caged) rNTP 또는 dNTP, 일반적으로 350 nm 광에 민감한 니트로벤질 유도체는 라이프테크놀로지스(Lifetechnologies)로부터 상업적으로 입수 가능하다. 뉴클레오티드의 소포성 또는 다른 분비를 야기하는 로포신 (rhoposin) 또는 박테리오-옵신 (bacterio-opsin) 촉발 신호 전달은 관련 기술 분야에 알려져 있다. dNTP를 전달하는 이들 방법을 사용하면, 뉴클레오티드는 제거되거나 또는 마주친 제1 프라이머-폴리머라제와 임의의 하류 사이에 격리시켜야 한다.
특정 측면에 따르면, 폴리머라제 활성을 조정하기 위해 pH 또는 광을 사용하는 방법은 핵산을 제조하는데 유용하다. 뉴클레오티드 도입을 위한 최적 pH 범위 및 가역적인 활성이 발생하는 pH 범위를 갖는 폴리머라제는 관련 기술 분야에 알려져 있다. 아조벤젠 아미노산은 문헌 [ACS Nano. 2014 May 27;8(5):4157-65]에 기재된 바와 같이 합성 펩티드 또는 변형된 tRNA를 갖는 특유한 유전자 코드를 통해 DNA 또는 RNA 폴리머라제에 통합될 수 있다. 추가의 유용한 방법은 문헌 [Nature, 500(7463) August 22, 2013]에 기재되어 있다.
폴리머라제
본 발명의 또 다른 실시양태에 따르면, 폴리머라제는 본원에서 핵산 시퀀스에 기록되는 것으로 언급되는 정보를 나타내는 핵산 분자를 제조하는데 사용되거나, 핵산은 본원에서 저장 매체로 지칭된다. 폴리머라제는 예를 들어 DNA 또는 RNA를 주형으로 사용하여 핵산 시퀀스를 생산하는 효소이다. RNA 폴리머를 생산하는 폴리머라제는 RNA 폴리머라제로 알려져 있고, DNA 폴리머를 생산하는 폴리머라제는 DNA 폴리머라제로 알려져 있다. 오류를 도입하는 폴리머라제는 관련 기술 분야에 알려져 있고, 본원에서 "오류 유발 폴리머라제"로 지칭된다. 주형 비의존성 폴리머라제는 오류 유발 폴리머라제일 수 있다. 오류 유발 폴리머라제를 사용하면 DNA 분자의 정확한 위치에 특정 염기를 도입할 수 있다. 오류 유발 폴리머라제는 비-표준 염기, 예컨대 가역적 쇄 종결 염기를 수용하거나 또는 주형을 복사하려고 시도할 때 선택적으로 부여되는 천연 또는 비변형 뉴클레오티드와 같은 상이한 뉴클레오티드를 도입할 것이다. 말단 비의존성 폴리머라제, 예컨대 DNA 뉴클레오티딜엑소트랜스퍼라제 (DNTT) 또는 말단 트랜스퍼라제로도 알려진 말단 데옥시뉴클레오티딜 트랜스퍼라제 (TdT)는 주형 없이 DNA 분자의 3' 말단에 뉴클레오티드의 부가를 촉매함으로써 핵산 가닥을 만든다. TdT의 바람직한 기판은 3'-돌출부(overhang)이지만, 이 효소는 평활 (blunt) 또는 오목형 (recessed) 3' 말단에 뉴클레오티드를 부가할 수도 있다. 코발트가 보조인자이지만, 효소는 시험관 내에서 Mg 및 Mn 투여시에 반응을 촉매한다. 핵산 개시자는 4 또는 5개 뉴클레오티드 또는 그 초과의 길이일 수 있으며, 단일 가닥 또는 이중 가닥일 수 있다. 이중 가닥 개시자는 3' 돌출부를 가질 수 있거나, 평활 말단일 수 있거나, 3' 오목형 말단을 가질 수 있다.
모든 DNA 폴리머라제처럼 TdT도 촉매 작용을 위해 2가 금속 이온을 필요로 한다. 그러나, TdT는 Co2+, Mn2+, Zn2+ 및 Mg2+와 같은 다양한 2가 양이온을 사용하는 그의 능력이 독특하다. 일반적으로, 2가 금속 이온의 존재 하에서 dATP를 사용한 프라이머 p(dA)n (여기서 n은 4 내지 50의 쇄 길이임)의 연장 속도는 Mg2+ > Zn2+ > Co2+ > Mn2+의 순서로 평가된다. 또한, 각각의 금속 이온은 뉴클레오티드 도입의 동역학에 상이한 영향을 미친다. 예를 들어, Mg2+는 dGTP 및 dATP의 우선적인 이용을 촉진하는 반면, Co2+는 피리미딘, dCTP 및 dTTP의 촉매 중합 효율을 증가시킨다. Zn2+는 Mg2+와의 반응 속도가 Zn2+의 마이크로몰 양의 첨가에 의해 자극되기 때문에 TdT에 대한 특유한 양성 이펙터로 작용한다. 이러한 향상은 Zn2+가 TdT의 구조 변화를 유도하여 촉매 효율을 높일 수 있음을 반영할 수 있다. 중합 속도는 Mg2+와 비교하여 Mn2+의 존재 하에서 더 낮고, 이것은 Mn2+가 Mg2+만큼 효율적으로 반응을 지지하지 못함을 시사한다. TdT에 대한 추가의 설명은 그 전체가 본원에 참고로 포함된 문헌 [Biochim Biophys Acta ., May 2010; 1804(5): 1151-1166]에 제시되어 있다. 또한, 뉴클레오티드 펄스 내의 Mg2+, Zn2+, Co2+ 또는 Mn2+를 뉴클레오티드 부착을 조정하기 위해 설계된 다른 양이온으로 대체할 수 있다. 예를 들어, 뉴클레오티드 펄스가 Mg++를 다른 양이온(들), 예컨대 Na+, K+, Rb+, Be++, Ca++ 또는 Sr++로 대체하면, 뉴클레오티드는 결합할 수는 있지만 도입될 수는 없기 때문에, 뉴클레오티드의 도입 여부를 조절할 수 있다. 이어서, 뉴클레오티드 또는 Mg++가 없는 (선택적) 사전 세척 펄스가 제공될 수 있거나, 뉴클레오티드가 없는 Mg++ 완충제가 제공될 수 있다.
폴리머라제에 이용가능한 뉴클레오티드를 제한함으로써, 폴리머 내로의 특정 핵산의 도입이 조절될 수 있다. 따라서, 이들 폴리머라제는 주형 시퀀스와 무관하게 뉴클레오티드를 도입할 수 있고, 따라서 새로운 핵산 시퀀스를 새롭게 생성하는데 유익하다. 오류 유발 폴리머라제와 프라이머 시퀀스의 조합은 핵산 시퀀스에 정보를 부여하기 위한 쓰기 (writing) 메커니즘으로 작용한다.
주형 비의존성 폴리머라제에 이용가능한 뉴클레오티드를 제한함으로써, 개시자 시퀀스 또는 기존의 뉴클레오티드 또는 올리고뉴클레오티드에 뉴클레오티드를 부가함으로써 연장에 의해 올리고뉴클레오티드를 생성할 수 있다. 따라서, 이들 폴리머라제는 주형 시퀀스 없이 뉴클레오티드를 도입할 수 있고, 따라서 새롭게 핵산 시퀀스를 생성하는데 유익하다.
에타-폴리머라제 (Matsuda et al. (2000) Nature 404(6781):1011-1013)는 높은 돌연변이율 (~10%) 및 4개의 모든 dNTP의 존재 하에서 3' 불일치에 대한 높은 내성, 및 하나 또는 2개의 dNTP로 제한된다면 아마도 훨씬 더 높은 내성을 갖는 폴리머라제의 예이다. 따라서, 에타-폴리머라제는 말단 데옥시뉴클레오티딜 트랜스퍼라제 (TdT)와 유사한 핵산 정보의 새로운 기록자이지만, 이 폴리머라제에 의해 생성된 생성물은 연속적으로 이중 가닥이라는 이점이 있다. 이중 가닥 DNA는 보다 덜 점착성인 2차 구조를 가지며, 단일 가닥 DNA보다 더 예측 가능한 2차 구조를 갖는다. 또한, 이중 가닥 DNA는 폴리머라제 및/또는 DNA 결합 단백질 테더(tether)에 대한 우수한 지지체로서 기능한다.
특정 측면에 따르면, 주형 의존성 또는 주형 반-의존성 오류 유발 폴리머라제가 사용될 수 있다. 특정 실시양태에 따르면, 오류 유발성이 될 수 있는 주형 의존성 폴리머라제가 사용될 수 있다. 특정 실시양태에 따르면, 주형 비의존성 RNA 폴리머라제가 사용될 수 있다. 주형 의존성 또는 주형 반-의존성 폴리머라제가 사용되는 경우, 많은 뉴클레오티드 유형의 수용을 장려하는 유니버설 염기와 주형의 임의의 조합이 사용될 수 있다. 또한, 오류 내성 양이온, 예컨대 Mn+이 사용될 수 있다. 또한, 본 개시내용은 오류 내성 폴리머라제 돌연변이체의 사용을 고려한다. 문헌 [Berger et al., Universal Bases for Hybridization, Replication and Chain Termination, Nucleic Acids Research 2000, August 1, 28 (15) pp. 2911-2914]을 참조한다.
특정 측면에 따르면, 단백질, 핵산 또는 다른 폴리머는 폴리머라제가 모노머를 폴리머에 부가하는 능력을 변경하는 방식으로 폴리머라제와 프라이머의 회합을 변경하기 위해 폴리머라제 또는 핵산 또는 다른 폴리머에 공유 결합 또는 비공유 부착될 수 있다.
특정 측면에 따르면, DNA 또는 RNA 분해 효소는 역전될 수 있고, 핵산을 만드는데 유용하다. 하나의 예는 리보-NTP를 제조하기 위한 폴리뉴클레오티드 포스포릴라제이다.
특정 측면에 따르면, 리가제가 핵산을 제조하는데 유용하다. 상기 리가제는 관련 기술 분야의 통상의 기술자에게 알려진 DNA 리가제 및 관련 기술 분야의 통상의 기술자에게 알려진 RNA 리가제를 포함한다. DNA 리가제는 박테리아 및 포유류 DNA 리가제를 포함한다. 예시적인 리가제는 T3 리가제, T4 리가제, T7 리가제, 이. 콜라이(E. coli) DNA 리가제, Taq DNA 리가제, 서클리가제 (circligase) 등을 포함한다.
특정 측면에 따르면, 지지체의 표면 상에 합성된 핵산은 예컨대 관련 기술 분야의 통상의 기술자에게 알려진 절단 가능한 링커(들)에 의해 제거될 수 있다. 핵산은 예컨대 제조 밀도보다 더 높은 밀도로 상이한 기판 상에 또는 저장 매체로서 기능할 상이한 기판 상에 위치될 수 있다. 또한, 추가의 핵산 합성을 위한 새로운 기판으로 기능하는 기판의 추가의 층이 첨가될 수 있다. 따라서, 제1 기판 상에 복수의 올리고뉴클레오티드를 생성하고, 제1 기판으로부터 복수의 올리고뉴클레오티드를 제거하고, 이를 제2 기판에 무작위 방식으로 또는 규칙적인 방식으로 원하는 밀도로 부착시킴으로써 고밀도 핵산 저장 장치를 제조하는 방법이 제공된다.
지지체 및 부착
예시적인 특정 실시양태에서, 본원에서 설명되는 하나 이상의 올리고뉴클레오티드 시퀀스는 지지체 (예를 들어, 고체 및/또는 반고체 지지체) 상에 고정된다. 특정 측면에서, 올리고뉴클레오티드 시퀀스는 본원에서 설명되는 하나 이상의 포스포르아미다이트 링커를 사용하여 지지체에 부착될 수 있다. 적합한 지지체는 슬라이드, 비드, 칩, 입자, 스트랜드, 겔, 시트, 튜브, 구체, 용기, 모세관, 패드, 슬라이스, 필름, 플레이트 등을 포함하고 이로 제한되지 않는다. 다양한 실시양태에서, 고체 지지체는 생물학적, 비생물학적, 유기, 무기 지지체 또는 이들의 임의의 조합일 수 있다. 본 발명의 지지체는 원하는 임의의 형상, 크기 또는 기하학적 구조일 수 있다. 예를 들어, 지지체는 정사각형, 직사각형, 원형, 평평한 형태, 평면, 원형, 관형, 구형 등일 수 있다. 실질적으로 평면인 지지체를 사용하는 경우, 지지체는 예를 들어 트렌치, 그루브, 웰 또는 화학적 장벽 (예를 들어, 소수성 코팅 등)으로 물리적으로 영역으로 분리될 수 있다. 지지체는 유리 (이산화규소), 금속, 세라믹, 폴리머 또는 관련 기술 분야의 통상의 기술자에게 알려진 다른 물질로 제조될 수 있다. 지지체는 고체, 반고체, 엘라스토머 또는 겔일 수 있다. 예시적인 특정 실시양태에서, 지지체는 마이크로어레이이다. 본원에서 사용되는 바와 같이, 용어 "마이크로어레이"는 한 실시양태에서 고정된 혼성화 프로브를 각각 포함하는 공간적으로 한정된 비-중첩 영역 또는 부위의 어레이가 그 위에 존재하는 실질적으로 평면인 표면을 갖는 고상 지지체를 포함하는 어레이의 유형을 지칭한다. "실질적으로 평면인"은 표면 상의 관심 특징부 또는 대상, 예컨대 프로브 부위가 표면의 위 또는 아래로 확장되고 그의 치수가 표면의 치수에 비하여 작은 부피를 차지할 수 있음을 의미한다. 예를 들어, 광섬유 번들의 표면 상에 배치된 비드는 프로브 부위의 실질적으로 평면인 표면을 생성하거나, 또는 다공성 평면 기판 상에 배치되거나 합성된 올리고뉴클레오티드는 실질적으로 평명인 표면을 생성한다. 공간적으로 한정된 부위는 그의 위치 및 그 위치에서 고정된 프로브의 종류가 알려지거나 결정 가능하다는 점에서 추가로 "어드레스 지정 가능한" 것일 수 있다.
고체 지지체는 또한 고체 및 액체 성분 둘 모두를 갖는 압축성 매트릭스와 같은 반고체 지지체를 포함할 수 있으며, 여기서 액체는 고체 매트릭스 요소 사이의 세공, 공간 또는 다른 틈을 차지한다. 바람직하게는, 반고체 지지체 물질은 폴리아크릴아미드, 셀룰로스, 폴리 디메틸 실록산, 폴리아미드 (나일론) 및 가교결합된 아가로스, -덱스트란 및 -폴리에틸렌 글리콜을 포함한다. 고체 지지체 및 반고체 지지체는 함께 또는 서로 독립적으로 사용될 수 있다.
또한, 지지체는 고정 매체를 포함할 수 있다. 본 발명에 따라 사용되는 이러한 고정 매체는 핵산 분자 침착 및 증폭에 필요한 조건 하에서 물리적으로 안정하고 화학적으로 불활성이다. 유용한 지지체 매트릭스는 PCR에 필요한 온도의 급격한 변화 및 극한의 온도를 견뎌낸다. 지지체 물질은 효소에 의한 핵산 합성을 가능하게 한다. 주어진 물질이 그렇게 허용할 것인지의 여부를 알 수 없는 경우, 본 발명에 따른 어레이 세트의 제조를 시도하기 전에 실험적으로 시험한다. 본 발명의 한 실시양태에 따르면, 지지체 구조는 반고체 (즉, 젤라틴형) 격자 또는 매트릭스를 포함하고, 여기서 격자 또는 매트릭스 요소 사이의 간극 또는 세공은 수성 또는 다른 액체 매질로 채워지며; 전형적인 세공 (또는 '체') 크기는 100 ㎛ 내지 5 ㎚이다. 매트릭스 요소 사이의 보다 큰 공간은 허용 한계 내에 있지만, 그의 고정 전에 증폭된 제품의 확산 가능성이 증가한다. 반고체 지지체는 압축 가능하다. 지지체는 그것이 인쇄 목적을 위해 평면이거나 효과적으로 되도록 제조된다. 예를 들어, 효과적으로 평면인 지지체는, 서로에 대해 롤링됨으로써 평면 또는 원통형인 다른 지지체와 접촉하기 위해 어레이의 핵산이 그의 외부 표면 상에 분포되도록 원통형일 수 있다. 마지막으로, 본 발명에 따라 사용하기 위한 지지체 물질은 관련 기술 분야의 통상의 기술자에게 알려진 수단에 의해 어레이의 핵산 특징부의 고정 (공유 연결)을 허용할 수 있다. 이러한 요건을 충족하는 물질은 유기 물질과 무기 물질 둘 다를 포함하며, 폴리아크릴아미드, 셀룰로스 및 폴리아미드 (나일론)뿐만 아니라 가교결합된 아가로스, 덱스트란 또는 폴리에틸렌 글리콜을 포함하고, 이로 제한되지 않는다.
한 실시양태는 플레이트, 슬라이드 또는 칩과 같은 유리 지지체 상의 얇은 폴리아크릴아미드 겔에 관한 것이다. 이러한 유형의 폴리아크릴아미드 시트는 다음과 같이 합성된다. 아크릴아미드와 비스-아크릴아미드는 겔에 사용되는 혼합물의 전체 비율이 폴리아크릴아미드 시트에게 요구되는 인장 특성을 부여하도록 조정될 때 요구되는 세공 크기를 생성하는 개별 폴리머 가닥 사이의 가교결합도를 산출하도록 설계된 비율로 혼합된다 (예를 들어, 38:2의 비율이 시퀀싱 겔에 전형적임). 폴리아크릴아미드 겔 캐스팅 방법은 관련 기술 분야에 잘 알려져 있고 (그 전체가 본원에 참고로 포함된 문헌 [Sambrook et al., 1989, Molecular Cloning. A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY] 참조), 통상의 기술자는 어려움 없이 상기 조정을 실시할 수 있다.
겔 시트는 2개의 단단한 표면 사이에서 캐스팅되고, 여기서 표면의 적어도 하나는 다른 하나가 제거된 후에도 부착된 상태로 유지되는 유리이다. 중합 완료 후에 제거될 캐스팅 표면은 겔 중합을 억제하지 않을 윤활제로 코팅되고; 이를 위해, 실란이 일반적으로 사용된다. 실란의 층을 흄 후드 (fume hood) 아래에서 표면 상에 펼쳐바르고, 거의 건조될 때까지 정치한다. 이어서, 에탄올로 과량의 실란을 제거한다 (닦아내거나, 작은 물체의 경우에는 광범위하게 헹궈낸다). 겔 시트와 함께 남아있는 유리 표면은 캐스팅 전에, 종종 '가교결합 실란'으로 지칭되는 γ-메타크릴옥시프로필트리메톡시실란 (Cat. No. M6514, 시그마(Sigma; 미국 미주리주 세이트루이스))으로 처리한다. 겔과 접촉할 유리 표면은 이 물질로 삼중 코팅된다. 1200 cm2와 같은 면적에 대한 각각의 처리는 25 ml의 에탄올 내의 125 ㎕의 가교결합 실란을 필요로 한다. 이 용액을 유리 표면에 펼쳐바르기 직전에, 750 ㎕의 물과 75 ㎕의 빙초산의 혼합물과 혼합하고, 격렬히 교반한다. 에탄올 용매는 코팅 사이에서 증발되도록 하고 (흄 후드 아래에서 약 5분), 마지막 코팅이 건조된 후, 과량의 가교결합 실란은 다른 지지체 플레이트가 겔 상에 '샌드위치되는 것'을 방지하기 위해 광범한 에탄올 세척을 통해 가능한 한 완전히 제거된다. 이어서, 플레이트를 조립하고, 겔을 원하는 대로 캐스팅한다.
본 발명에 따라 사용되는 겔의 크기를 결정하는 유일한 작동상 제약은 관련 기술 분야의 통상의 기술자가 이러한 겔을 캐스팅하는 물리적 능력이다. 길이가 최대 1 미터인 겔을 캐스팅하는 것은 번거롭지만, 핵산 시퀀싱 기술에 숙련된 기술자에게 잘 알려진 절차이다. 생성된 경우, 보다 큰 겔이 또한 본 발명에 따라 사용된다. 극히 작은 겔은 중합이 완료된 후에 더 큰 전체로부터 절단된다.
그의 매트릭스 내에 포획된 효소와 같은 생체 활성 물질을 갖는 폴리아크릴아미드 겔을 캐스팅하기 위한 적어도 하나의 절차가 관련 기술 분야에 알려져 있다 (그 전부가 본원에 참고로 포함된 문헌 [O'Driscoll, 1976, Methods Enzymol ., 44: 169-183] 참조). 겔 매트릭스에 살아있는 세포의 포획을 허용하는 광 가교결합성 폴리에틸렌 글리콜 수지를 사용하는 유사한 프로토콜이 또한 문헌에 보고된 바 있다 (그 전부가 본원에 참고로 포함된 문헌 [Nojima and Yamada, 1987, Methods Enzymol ., 136: 380-394] 참조). 이러한 방법은 본 발명에 따라 사용될 수 있다. 아래에서 언급되는 바와 같이, 전체 세포는 벤톤 (Benton) 및 데이비스 (Davis)의 방법 (문헌 [Maniatis et al., 1982, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY] 참조)에 따라 무손상 염색체 DNA를 펄스 필드 (pulsed-field) 겔 전기영동에 적합한 매트릭스에 전달하거나 플라크의 리프팅 전에 박테리오파지 성장을 지지할 숙주 세포의 "잔디 (lawn)"로서 기능하기 위해 일반적으로 아가로스 내에 캐스팅된다. 간단히 설명하면, 전기영동 등급의 아가로스 (예를 들어, 울트라퓨어(Ultrapure), 라이프 테크놀로지스(Life Technologies)/깁코-비알엘(Gibco-BRL)를 생리학적 (등장성) 완충제에 용해시키고, 튜브, 병 또는 플라스크에서 50℃ 내지 52℃의 온도로 평형을 이루게 한다. 이어서, 세포를 아가로스에 첨가하고, 철저히, 하지만 신속하게 혼합한 후 (병 또는 튜브 내의 경우에는 마개를 넣고 뒤집어서, 플라스크 내의 경우에는 소용돌이를 일으켜서), 혼합물을 겔 트레이에 따라내거나, 피펫으로 옮긴다. 저융점 아가로스를 사용하는 경우, 세포를 첨가하기 전에 훨씬 더 낮은 온도로 만들 수 있다 (아가로스의 농도에 따라 대략 실내 온도까지). 이것은 일부 세포 유형에 바람직하지만, 전기영동이, 생성된 핵산 풀의 분자가 지지체에 공유 부착되기 전에 세포 용해를 뒤따르는 것이라면, 냉장 하에, 예컨대 4℃ 내지 10℃의 '차가운' 방에서 수행된다.
마이크로어레이 상에 고정된 올리고뉴클레오티드는 검정 반응에서 또는 검정 반응을 통해 생성되는 핵산을 포함한다. 전형적으로, 마이크로어레이 상의 올리고뉴클레오티드 또는 폴리뉴클레오티드는 단일 가닥이며, 일반적으로 5'-말단 또는 3'-말단에 의해 고상 지지체에 공유 부착된다. 예시적인 특정 실시양태에서, 프로브는 하나 이상의 절단 가능한 링커를 통해 고정된다. 마이크로어레이에서 핵산을 함유하는 비-중첩 영역의 밀도는 일반적으로 cm2당 100 초과, 보다 일반적으로는 cm2당 1000 초과이다. 핵산 프로브와 관련된 마이크로어레이 기술은 다음의 예시적인 참고문헌에서 검토된다: [Schena, Editor, Microarrays: A Practical Approach (IRL Press, Oxford, 2000)]; [Southern, Current Opin. Chem. Biol., 2: 404-410 (1998)]; [Nature Genetics Supplement, 21:1-60 (1999)]; 및 포도어 (Fodor) 등의 미국 특허 5,424,186; 5,445,934; 및 5,744,305.
올리고뉴클레오티드를 지지체에 고정하는 방법은 관련 기술 분야에 알려져 있다 (비드: [Dressman et al. (2003) Proc. Natl. Acad. Sci. USA 100:8817], [Brenner et al. (2000) Nat. Biotech. 18:630], [Albretsen et al. (1990) Anal. Biochem. 189:40], 및 [Lang et al. Nucleic Acids Res. (1988) 16:10861]; 니트로셀룰로스: [Ranki et al. (1983) Gene 21:77]; 셀룰로스: [Goldkorn (1986) Nucleic Acids Res. 14:9171]; 폴리스티렌: [Ruth et al. (1987) Conference of Therapeutic and Diagnostic Applications of Synthetic Nucleic Acids, Cambridge U.K.]; 테플론-아크릴아미드: [Duncan et al. (1988) Anal. Biochem. 169:104]; 폴리프로필렌: [Polsky-Cynkin et al. (1985) Clin. Chem. 31:1438]; 나일론: [Van Ness et al. (1991) Nucleic Acids Res. 19:3345]; 아가로스: [Polsky-Cynkin et al., Clin. Chem. (1985) 31:1438]; 및 세파크릴: [Langdale et al. (1985) Gene 36:201]; 라텍스: [Wolf et al. (1987) Nucleic Acids Res. 15:2911]). 지지체는 핵산을 지지체에 결합시키기 위해 부착 화학 또는 폴리머, 예컨대 아미노-실란, NHS-에스테르, 클릭 화학, 폴리라이신 등으로 코팅될 수 있다.
본원에서 사용되는 바와 같이, 용어 "부착"은 공유 상호작용 및 비공유 상호작용 둘 모두를 의미한다. 공유 상호작용은 한 쌍의 전자 (즉, 단일 결합), 두 쌍의 전자 (즉, 이중 결합) 또는 세 쌍의 전자 (즉, 삼중 결합)의 공유에 의해 형성된 두 원자 또는 라디칼 사이의 화학적 연결이다. 공유 상호작용은 또한 전자쌍 상호작용 또는 전자쌍 결합으로 관련 기술 분야에 알려져 있다. 비공유 상호작용은 판 데르 바알스 상호작용, 수소 결합, 약한 화학 결합 (즉, 짧은 범위의 비공유 힘을 통한), 소수성 상호작용, 이온 결합 등을 포함하고, 이로 제한되지 않는다. 비공유 상호작용에 대한 검토는 문헌 [Alberts et al., Molecular Biology of the Cell, 3d edition, Garland Publishing, 1994]에서 볼 수 있다.
특정 측면에 따르면, 핵산 분자를 기판에 부착하거나 고정하는 것은 산화된 3-메틸 우리딘, 아크릴릴기 및 헥사에틸렌 글리콜을 포함하는 공유 링커를 사용하여 수행된다. 지지체에 대한 지향성 부착(directional attachment)에 사용하기 위한 풀의 분자에 대한 링커 시퀀스의 부착에 추가로, 제한 부위 또는 조절 요소 (예컨대, 프로모터 요소, 캡 부위 또는 번역 종결 신호)가 필요하다면 풀의 구성원과 연결된다. 링커는 또한 효소, 빛, 열, pH 완충제 및 레독스 시약과 같은 작용제에 의해 선택적으로 절단 가능한 화학 반응성 세그먼트로 설계될 수 있다. 상기 링커는 각각의 별개의 특징부에 대해 상이한 용액상 프라이머의 계내 (in situ) 고상 불활성 저장기(inactive reservoir)를 예비 제조하는데 사용될 수 있다. 링커 절단시, 프라이머는 아마도 열순환 과정으로부터의 열을 방아쇠로 사용하여 PCR용 용액 내로 방출된다.
또한, 지지체에 핵산 분자를 부착하는 것은 지지체에 공유 결합된 핵산 분자에 대한 풀의 구성원의 혼성화를 통해 수행되는 것이 고려된다.
본 발명에 따른 지지체 매트릭스에 대한 핵산 분자의 고정은 몇 가지 방법 중 임의의 방법에 의해 달성된다. 지지체에 공유 연결에 적합한 화학기를 갖는 3'-말단 태그의 사용을 통해 직접 고정, 이미 지지체에 결합된 올리고뉴클레오티드 프라이머에 대한 핵산 분자의 풀의 단일 가닥 분자의 혼성화, 또는 지지체에 공유 연결될 수 있는, 플레이팅 전 또는 후에 첨가된, 프라이머의 도입을 수반하는 지지체 상의 핵산 분자를 펼쳐바르는 것이 수행될 수 있다. 사전 고정된 프라이머가 사용되는 경우, 이들은 넓은 범위의 시퀀스 모티프 (예를 들어, 주어진 쇄 길이의 모든 가능한 멀티머, 예를 들어 헥사머), 특정 시퀀스에 상동성을 갖는 핵산 또는 특정 시퀀스 모티프에 대한 변이를 포함하는 핵산을 포획하도록 설계된다. 대안적으로, 프라이머는 링커 시퀀스와 같은 핵산 분자의 풀의 모든 구성원에 공통적인 합성 분자 특징부를 포함한다.
핵산 분자를 폴리아크릴아미드 겔 시트에 가교결합시키는 두 가지 수단에 대해 상세히 논의할 것이다. 첫 번째 (크랍코 (Khrapko) 등의 1996년의 미국 특허 5,552,270에 의해 제공됨)는 3-메틸 우리딘으로 핵산 분자를 3' 캡핑하는 것을 포함한다. 이 방법을 사용하여, 본 발명의 라이브러리의 핵산 분자는 이 변형된 염기를 그들의 3' 말단에 포함하도록 제조된다. 언급된 프로토콜에서, 두께 30 ㎛의 8% 폴리아크릴아미드 겔 (30:1, 아크릴아미드:비스-아크릴아미드) 시트를 캐스팅한 다음, 1시간 동안 실온에서 50% 히드라진에 노출시킨다. 이러한 겔은 또한 본 발명에 따라 사용된다. 매트릭스는 이어서 아래에서 설명되는 바와 같이 핵산 분자를 함유하는 용액을 흡수할 정도로 공기 건조된다. 그의 3' 말단에 3-메틸 우린딘을 포함하는 핵산 분자를 실온에서 10분 내지 1시간 동안 1 mM 과아이오드산나트륨 (NaIO4)으로 산화시키고, 8-10 부피의 아세톤 중 2% LiClO4로 침전시키고, 10 pmol/㎕의 농도로 물에 용해시킨다. 이 농도는, 핵산 분자가 그 표면을 균일하게 덮고 효율적으로 (즉, 완전히) 그에 의해 흡수되는 부피로 지지체 상에 펼쳐지면, 어레이의 핵산 분자의 밀도가 상기 논의된 범위 내에 해당하도록 조절된다. 핵산 분자를 겔 표면에 펼쳐바르고, 플레이트를 가습 챔버에 4시간 동안 배치한다. 이어서, 이를 실온에서 0.5시간 동안 건조하고, 후속 사용에 적합한 완충제 내에서 세척한다. 대안적으로, 겔을 물로 헹구고, 다시 건조하고, 필요할 때까지 -20℃에서 보관한다. 겔에 결합된 핵산의 총 수율은 80%이고, 이들 분자의 98%는 산화된 3' 기를 통해 특이적으로 연결되어 있다고 생각된다.
폴리아크릴아미드 시트에 핵산 분자를 공유 부착시키는데 사용되는 제2 가교결합 모이어티는 프라이머에 부착된 5' 아크릴릴기이다. 5' 말단에 그러한 변형된 염기를 보유하는 올리고뉴클레오티드 프라이머가 본 발명에 따라 사용될 수 있다. 특히, 이러한 올리고뉴클레오티드는 아크릴릴기가 중합 매트릭스의 필수적인 공유 결합 부분이 되도록 겔 내에 직접 캐스팅된다. 프라이머의 3' 말단은 결합되지 않은 채로 남아있어서, 풀의 핵산 분자와 자유롭게 상호작용하고 혼성화하여 그의 효소에 의한 제2 가닥 합성을 프라이밍한다.
대안적으로, 헥사에틸렌 글리콜은 나일론 또는 다른 지지체 매트릭스에 핵산 분자를 공유 연결하기 위해 사용된다 (아담스 (Adams) 및 크론 (Kron)의 1994년의 미국 특허 5,641,658). 또한, 핵산 분자는 자외광을 조사하여 나일론에 가교결합된다. 지지체가 조사되는 시간 및 자외선 원으로부터의 최적 거리는 파장 및 투과 강도의 변화로 인해 사용되는 각각의 기기에 대해 보정되지만, 혼성화 막에 대한 핵산 분자의 가교결합을 위해 특별히 설계된 하나 이상의 조사 장치는 상업적으로 입수 가능하다 (스트라타링커 (Stratalinker), 스트라타젠 (Stratagene)). 조사를 통한 가교결합 과정에서 핵산 가닥의 제한된 닉 형성 (nicking)이 발생한다는 점에 유의해야한다. 그러나, 혼성화 절차에서 사용되는 조건과 같은 조건 하에서 닉 형성의 양은 일반적으로 무시할 수 있다. 그러나, 몇몇 경우, 핵산 분자의 자외선 가교결합 방법은 닉 형성으로 인해 부적절할 수 있다. 5'- 또는 3'-말단이 아닌 위치에서 핵산 분자를 지지체에 부착시키는 것도 가능하지만, 이와 같이 가교결합된 어레이의 유용성에 대한 잠재력은 프라이머가 지지체에 결합되는 고정된 분자에 대한 올리고뉴클레오티드 프라이머의 혼성화를 상기 가교결합이 억제하지 않기 때문에 대부분 손상되지 않는다는 점에 유의해야 한다.
시약 전달 시스템
특정 측면에 따르면, 시약 및 세척제는 반응물이 원하는 시간 동안 원하는 위치에, 예를 들어, 개시자 시퀀스 또는 원하는 위치에 부착된 기존의 뉴클레오티드에 공유 결합된 dNTP에 존재하도록 펄스로서 전달된다. 선택된 뉴클레오티드 시약 액체는 어레이 상에 펄싱되거나 유동된 후, 뉴클레오티드를 포함하지 않는 완충제 또는 세척액의 펄스가 이어진다. 펄스의 지속 시간은 예를 들어, 효소 또는 기타의 반응 동역학에 의해 결정된다. 펄스의 지속 시간은 뉴클레오티드와 세척제 사이에서 상이할 수 있거나, 동일할 수 있다. 예를 들어, 0.2초 펄스가 시약 전달 및 세척제 전달 둘 모두에 효과적이다. 특정 측면에 따르면, 시약 전달 및 세척제 전달의 타이밍은 반응에 대한 뉴클레오티드의 접근 및 반응의 동역학에 대해 동기화된다.
예를 들어, 도 1, 도 2 및 도 3을 참조하면, 기판에는 원으로 표시된 예시적인 반응 위치가 제시한다. 반응 위치는 무작위로 선택된 것일 수 있거나, 규칙적인 어레이에서와 같이 미리 정의된 영역일 수 있다. 기판의 표면은 반응물이 그를 통해 유동될 수 있는 반응 영역 또는 유동 셀을 생성하도록 둘러싸일 수 있거나 또는 기판은 반응물이 그를 통해 유동될 수 있는 유동 셀 내에 위치될 수 있다. 반응 영역은 반응물이 첨가되고 기판의 표면에 접촉되고 제거될 수 있도록 유입부 및 배출부를 갖는다. 시약이 뉴클레오티드가 부가되는 원하는 위치와 접촉할 수 있도록 기판의 표면이 위치되는 반응 영역 또는 용기로 유체를 채널 또는 미세유동 채널을 통해 하나 이상의 채널을 통해 이동시키는 관련 기술 분야의 통상의 기술자에게 알려진 펌프 또는 전극 또는 다른 방법을 사용하여, 별개의 시약 또는 시약의 혼성화 또는 세척제를 전달할 수 있는 다양한 유동 셀 실시양태 또는 유동 채널 실시양태 또는 미세유동 채널 실시양태가 고려된다. 또한, 원하는 위치는 효소가 원하는 위치에서 뉴클레오티드를 부가하기 위해 활성화 또는 불활성화되거나 조절되는 특정 pH를 생성하거나 또는 상기 pH에서 일정 부피의 유체를 전달하기 위한 전극 또는 다른 장치를 포함할 수 있다.
도 1에 도시된 바와 같이, 뉴클레오티드 A를 포함하는 시약의 제1 펄스는 기판의 표면을 가로질러 유동한다. 뉴클레오티드 A는 개시자 시퀀스 또는 기존의 뉴클레오티드 또는 올리고뉴클레오티드에 뉴클레오티드 A를 효소에 의해 부가하기에 충분한 반응 조건 하에서 기판 상의 하나 이상의 원하는 위치에 부가된다. 뉴클레오티드 A를 부가한 후, 뉴클레오티드 A를 제거하기 위해 기판의 표면을 가로질러 세척제를 유동시킬 수 있다. 이어서, 뉴클레오티드 T를 포함하는 시약의 제2 펄스가 기판의 표면을 가로질러 유동한다. 뉴클레오티드 T는 개시자 시퀀스 또는 기존의 뉴클레오티드 또는 올리고뉴클레오티드에 뉴클레오티드 T를 효소에 의해 부가하기에 충분한 반응 조건 하에서 기판 상의 하나 이상의 원하는 위치에 부가된다. 뉴클레오티드 T를 부가한 후, 뉴클레오티드 T를 제거하기 위해 기판의 표면을 가로질러 세척제를 유동시킬 수 있다. 이어서, 뉴클레오티드 G를 포함하는 시약의 제3 펄스가 기판의 표면을 가로질러 유동한다. 뉴클레오티드 G는 개시자 시퀀스 또는 기존의 뉴클레오티드 또는 올리고뉴클레오티드에 뉴클레오티드 G를 효소에 의해 부가하기에 충분한 반응 조건 하에서 기판 상의 하나 이상의 원하는 위치에 부가된다. 뉴클레오티드 G를 부가한 후, 뉴클레오티드 G를 제거하기 위해 기판의 표면을 가로질러 세척제를 유동시킬 수 있다. 도 2는 뉴클레오티드 C를 포함하는 시약의 제4 펄스 및 뉴클레오티드 A를 포함하는 시약의 제5 펄스를 보여준다. 도 3은 기판의 표면을 가로질러 이동하여 반응 영역을 빠져나가는 펄스를 보여준다. 하나의 예시적인 측면에 따르면, 시약 유체 내의 뉴클레오티드를 원하는 위치에 효소에 의해 부가하기 위해 원하는 위치에서 pH 민감성 효소의 활성을 조절하도록 pH를 원하는 위치에서 조절한다. 하나의 예시적인 측면에 따르면, 시약 유체 내의 뉴클레오티드를 원하는 위치에 효소에 의해 부가하기 위해 원하는 위치에서 광 민감성 효소의 활성을 조절하도록 광이 원하는 위치에서 조절된다. 활성화 자극에 의해 효소를 활성화하는 다른 방법은 관련 기술 분야의 통상의 기술자에게 알려져 있고, 원하는 위치에서 시약 유체 내의 뉴클레오티드를 효소에 의해 부가하는데 유용하다.
한 측면에 따르면, 부피가 100 나노리터 미만인 많은 작은 액체 풀의 다중 처리를 가능하게 하는 장치가 제공된다. 2개의 평행한 평면 표면을 갖는 압반 (platen) 및 표면 장력에 의해 각각의 관통 구멍 내에 액체 샘플을 유지하도록 치수가 정해진 관통 구멍으로 이루어진 복수의 액체 샘플을 분석하기 위한 시스템이 관련 기술 분야에게 알려져 있다 (그 전부가 본원에 참고로 포함된 EP 1051259A1 (2000년 11월 15일). 샘플은 모세관 작용을 이용하여 평면 표면으로부터 추출할 수 있고, 희석되어 혼합될 수 있다. 각각의 관통 구멍은 광 방사(optical radiation)에 의해 확인할 수 있다. 이 장치, 및 그와 유사한 장치, 예컨대 진 로직 (Gene Logic)의 Flow-Thru Chip™ (그 전부가 본원에 참고로 포함된 토레스 (Torres) 등의 WO 01/45843 A2 (2001년 6월 28일))가 본원에서 설명되는 방법에서 사용될 수 있다. 각각의 챔버의 내벽은 5'-부착된 주형 핵산 시퀀스로 기능화될 수 있고, 모든 다른 필요한 시약 (예컨대, 부위 특이적 재조합효소 또는 오류 유발 폴리머라제 및 뉴클레오티드)은 액상으로 각각의 분리된 챔버 (또는 "벌집" 셀)로 전달된다.
특정 실시양태에서, 현미경 슬라이드와 같은 기판은 1) 분석물 핵산 분자의 동일한 풀이 슬라이드 상의 모든 특징부를 가로질러 균등하게 퍼지기를 원하는 경우 습윤성 표면 경계 영역에 의해, 또는 2) 각각의 특징부가 분석물 핵산 분자 및/또는 프라이머의 상이한 풀로 스포팅(spotting)되는 경우 비-습윤성 표면 경계 영역에 의해 분리될 수 있다. 상기 구조의 조합, 예컨대 각각 비-습윤성 경계에 의해 결합된 연속적인 습윤성 영역의 더 큰 군으로 세분화된 슬라이드가 가능하고, 여기서 각각의 습윤성 영역은 각각 상이한 스포팅된 프라이머를 보유하는 보다 작은 특징부로 다시 나누어진다.
또 다른 실시양태에 따르면, 연속적인 소수성 경계에 의해 분리된 작은 불연속적인 친수성 특징부를 갖는 슬라이드를 묽은 DNA 주형 분자의 수용액에 침지함으로써 단일 DNA 분자를 구획화하는 것이 또한 가능하다. 슬라이드가 제거되고 그 측면이 부드럽게 블로팅될 때, 작은 액체 비드가 친수성 특징부 위에 형성되어, 0, 1 또는 ≥2개 DNA 주형(들)을 갖는 액체의 작은 불연속적인 풀을 생성한다 (관련 기술의 설명을 위해, 그 전부가 본원에 참고로 포함된 브레난 (Brennan)의 미국 특허 6,210,894 B1 (2001년 4월 3일) 참조).
또 다른 실시양태에 따르면, 미세유동 장치는 미세 채널을 통해 시약이 혼합되고 반응이 일어나는 반응 대역으로 전달되는 하나 이상의 시약을 포함하는 하나 이상의 저장기가 제공된다. 이러한 미세유동 장치 및 이러한 미세유동 장치를 통해 유체 시약을 이동시키는 방법은 관련 기술 분야의 통상의 기술자에게 공지되어 있다.
고정된 핵산 분자는 원하는 경우, 시약 함유 용액을 집중적으로 지지체 상에 분무하는 장치 (예를 들어, 실질적으로 변형되지 않은 형태로 사용될 수 있는 상업적으로 이용가능한 임의의 잉크젯 프린터)를 사용하여 제조될 수 있다 (그 전부가 본원에 참고로 포함된 문헌 [Castellino (1997) Genome Res. 7:943-976] 참조). 이러한 방법은 현재 인사이트 파마슈티칼스 (Incyte Pharmaceuticals) 및 로제타 바이오시스템즈, 인크. (Rosetta Biosystems, Inc.)에서 실시되고 있으며, 후자는 "최소 변형된 엡손 (Epson) 잉크젯 카트리지" (엡손 아메리카, 인크. (Epson America, Inc.), 미국 캘리포니아주 토란스)를 사용한다. 잉크젯 침착 방법은 압전 효과에 의존하며, 이에 의해 관심 액체 (이 경우, 올리고뉴클레오티드 합성 시약)를 함유하는 좁은 튜브가 어댑터에 의해 둘러싸인다. 어댑터를 가로질러 흐르는 전하가 어댑터가 튜브와 상이한 속도로 팽창하고, 액체 시약의 소적이 튜브로부터 코팅된 슬라이드 또는 다른 지지체 상에 강제로 떨어지도록 유도한다.
시약은 각각의 영역이 어레이의 특징부를 형성하도록 지지체의 별개의 영역에 침착될 수 있다. 원하는 핵산 시퀀스는 관련 기술 분야에게 알려진 다른 방법에서 그러하듯이, 전체로서 침착되거나 각각의 위치에서 한 방울씩 (drop-by-drop) 합성될 수 있다. 시약의 분산 각도가 좁은 경우, 많은 특징부를 포함하는 어레이를 생성할 수 있다. 대안적으로, 분무 장치가 보다 넓은 각도로 핵산 합성 시약을 분산시키기 위해 분무 장치가 모다 넓은 범위에 초점을 맞추면, 매번 전체 지지체의 넓은 범위가 시약으로 덮이고, 각각의 구성원이 동일한 시퀀스를 갖는 어레이가 생성된다 (즉, 어레이는 단지 단일 특징부만을 갖는다).
특정 측면에 따르면, 뉴클레오티드 전구체 (dNTP/rNTP/rNDP)에 결합하는 시간 및 성장하는 프라이머 3' 말단과 공유 결합을 만드는데 소요되는 시간에 대한 상이한 분포가 고려된다. 전구체의 펄스가 짧게 유지되면, 결합할 수 있고, 공유 결합 형성 반응을 기다리는 동안 계속 진행되는 시약의 유동은 뉴클레오티드가 고갈된 완충제를 쓸고 지나간다. 제1 결합 반응은 뉴클레오티드 농도 의존성이다. X개 뉴클레오티드의 평균 길이가 목적라면, 분포는 프와송 (Poisson) 분포일 것으로 예상되며, X=1개 뉴클레오티드의 평균에 대한 이론적 최대값은 37% 수율이고, 나머지는 0, 2, 3개... 뉴클레오티드가 통합된 것이다. 이와 대조적으로, 본원에서 설명되는 펄싱 방법은 X=1에 대해 37% 초과의 수율을 유도할 수 있다.
특정 측면에 따르면, 어레이 기반의 유동 셀 기술이 표준 합성 및 시퀀싱 절차와 유사하게 사용된다. 출발 TdT 프라이머는 알려진 위치에서 평평한 이산화규소 (또는 10 마이크로미터 두께의 폴리머 층)에 결합된다. dNTP는 TdT 중합 (또는 스위칭) 속도에 따라 조정된 시간적 및 공간적 폭의 주기적인 파동으로 유동할 것이다. TdT 활성은 광 화학적으로 또는 전기화학적으로, 예컨대 원하는 위치에서 pH를 변경함킴으로써 조절된다. 올리고뉴클레오티드를 생성하는 위치는 90,000 내지 5,000,000개일 수 있다.
고 pH 또는 저 pH 사이와 같이 pH를 조절하기 위해 알려진 위치에서 산 또는 염기를 생성하는 예시적인 방법은 바람직하게는 완충 또는 소거 (scavenging) 용액과 접촉하여, 전기화학적으로 생성된 시약의 확산에 의한 전극 사이의 화학적 혼선을 방지하는 적어도 하나의 전극을 포함한다. 본원에 참고로 포함되는 미국 특허 6,093,302를 참조한다. 대안적으로, 광 생성 산을 사용하여 원하는 위치에서 pH를 조절할 수 있다. 본원에 참고로 포함된 문헌 [Tian et al., Nature, Vol. 432, 23/30 December 2004, pp. 1050-1054]을 참조한다.
폴리머라제 활성 또는 dNTP/rNTP/rNDP 접근을 조정하기 위해 pH 또는 광을 사용하는 방법은 다음에 의해 달성될 수 있다: (1) (dNTP로 채워진) 리포솜 내부의 pH-민감성 바이러스 입자로부터 리파제 (또는 다른 막-용해 효소)의 방출 (문헌 [J. Clinical Microbiology 1988 May: 26(5) 804-807] 및 [J. Control Release 2013 Nov 28; 172(1): 341-50] 참조); (2) 350 nm 광에서 작동하는 니트로벤질 유도체와 같은 광 구속된 rNTP 또는 dNTP; (3) 뉴클레오티드의 소포성 또는 다른 분비를 야기하는 로포신 또는 박테리오-옵신 촉발 신호 전달; (4) 도입을 위한 최적 pH 범위 및 가역적인 불활성이 발생하는 pH 범위를 갖는 폴리머라제; (5) DNA 또는 RNA 폴리머라제에 도입되는 아조벤젠 아미노산 (합성 펩티드 또는 변경된 tRNA를 갖는 신규 유전자 코드를 통해) (문헌 [ACS Nano 2014 May 27; 8(5): 4157-65] 참조) 및 (6) 문헌 [Konerman et al., Nature (2013), Optical Control of mammalian Endogenous Transcription]에 기재된 방법. 한 측면에 따르면, 방법 (1)-(3)을 사용하여 설명된 뉴클레오티드의 방출은 방출된 뉴클레오티드를 제거하거나 마주친 제1 프라이머-폴리머라제와 임의의 하류 사이에 격리시킬 것을 필요로 한다. 폴리머라제 조정 방법 (4)-(6)은 이러한 활동을 필요로 하지 않는다.
특정 측면에 따르면, RNA 폴리머라제 또는 DNA 또는 RNA 분해 효소의 역전 - 예를 들어, 리보-NTP에 대한 폴리뉴클레오티드 포스포릴라제 (PNP), 리가제, 예컨대 RNA 리가제, 서클리가제가 고려된다. 주형 비의존성 폴리머라제 외에, 반-의존성 폴리머라제 (오류 유발 또는 우회 폴리머라제로도 알려짐)가 고려된다. 단백질, 핵산 또는 다른 폴리머 고리는 폴리머라제에 공유 또는 비공유 부착되고, 핵산 또는 다른 폴리머 트랙을 둘러쌀 수 있고, 이에 따라서 폴리머라제와 프라이머의 회합이 보다 향상된다.
증폭
일반적으로, "증폭"은 프라이밍된 효소에 의한 합성의 반복 수행을 통해 핵산 분자의 카피를 생산하는 것을 포함한다. "계내" 증폭은 용액 내에서보다 지지체 또는 비드 상에 위치된 주형 핵산 분자를 사용하여 증폭이 일어남을 나타낸다. 계내 증폭 방법은 미국 특허 6,432,360에 기재되어 있다. 폴리머라제의 다양한 선택은 온도, 가닥 변위 (strand displacement) 및 교정 판독 (proof-reading)과 같은 상이한 특성에 기초하여 이루어진다. 증폭은 등온성일 수 있고, 문헌 [Dean et al., Comprehensive human genome amplification using multiple displacement amplification, Proc . Natl . Acad. Sci . U.S.A ., vol. 99, p. 5261-5266. 2002]; [Dean et al., Rapid amplification of plasmid and phage DNA using phi29 DNA polymerase and multiply-primed rolling circle amplification, Genome Res., vol. 11, p. 1095-1099. 2001]; [Aviel-Ronen et al., Large fragment Bst DNA polymerase for whole genome amplification of DNA formalin-fixed paraffin-embedded tissues, BMC Genomics, vol. 7, p. 312. 2006]에 기재된 바와 같은 다중 변위 증폭 (MDA)과 같은 유사한 변형으로 이루어질 수 있다. 또한, 증폭은 문헌 [Mullis et al., Specific enzymatic amplification of DNA in vitro: The polymerase chain reaction. Cold Spring Harbor Symp. Quant . Biol., vol. 51, p. 263-273. 1986]에 의해 대중화된 전통적인 폴리머라제 연쇄 반응 (PCR)과 같은 상이한 온도 방식을 통해 순환할 수 있다. 게놈 증폭에 보다 적용 가능한 변형은 문헌 [Zhang et al., Whole genome amplification from a single cell: implications for genetic analysis, Proc . Natl . Acad . Sci . U.S.A ., vol. 89, p. 5847-5851. 1992]; 및 [Telenius et al., Degenerate oligonucleotide-primed PCR: general amplification of target DNA by a single degenerate primer, Genomics, vol. 13, p. 718-725. 1992]에 기재되어 있다. 다른 방법은 문헌 [Mitra and Church, In situ localized amplification and contact replication of many individual DNA molecules, Nuc . Acid. Res., vol. 27, pages e34. 1999]에 의해 기술된 폴로니 (Polony) PCR, 문헌 [Shendure et al., Accurate multiplex polony sequencing of an evolved bacterial genome, Science, vol. 309, p. 1728-32. 2005]; 및 [Williams et al., Amplification of complex gene libraries by emulsion PCR, Nat. Methods, vol. 3, p. 545-550. 2006]에 의해 설명된 에멀젼 PCR (ePCR)을 포함한다. 임의의 증폭 방법은 RNA의 증폭을 가능하게 하기 위해, 선행적으로 역전사 단계와 조합될 수 있다. 특정 측면에 따르면, 충분한 감도를 갖는 프로브, 리포터 및 검출 시스템은 설명된 주형 비-혼성화 핵산 구조를 사용하여 단일 분자의 검출을 가능하게 하기 위해 사용될 수 있기 때문에, 증폭이 절대적으로 요구되는 것은 아니다. 시스템에서 감도를 적용하는 방법에는 여기 공급원 (예를 들어, 조명) 및 검출 (예를 들어, 광검출기, 광전자증배관)의 선택이 포함된다. 신호 수준을 적용하는 방법에는 리포터를 스태킹할 수 있는 프로브가 포함되며, 고강도 리포터 (예를 들어, 양자점)도 사용할 수 있다.
본 개시내용에서 유용한 증폭 방법은 혼성화 및 쇄 연장을 용이하게 하는 조건 하에 핵산을 핵산에 특이적으로 혼성화하는 하나 이상의 프라이머와 접촉시키는 단계를 포함할 수 있다. 핵산을 증폭하기 위한 예시적인 방법은 폴리머라제 연쇄 반응 (PCR) (예를 들어, 문헌 [Mullis et al. (1986) Cold Spring Harb . Symp . Quant . Biol . 51 Pt 1:263] 및 [Cleary et al. (2004) Nature Methods 1:241], 미국 특허 4,683,195 및 4,683,202 참조), 앵커 PCR, RACE PCR, 라이게이션 연쇄 반응 (LCR) (예를 들어, 문헌 [Landegran et al. (1988) Science 241:1077-1080]; 및 [Nakazawa et al. (1994) Proc. Natl . Acad . Sci . U.S.A . 91:360-364] 참조), 자가 유지 시퀀스 복제 (Guatelli et al. (1990) Proc . Natl . Acad . Sci . U.S.A . 87:1874), 전사 증폭 시스템 (Kwoh et al. (1989) Proc . Natl . Acad . Sci . U.S.A . 86:1173), Q-베타 복제효소 (Lizardi et al. (1988) BioTechnology 6:1197), 반복 (recursive) PCR ([Jaffe et al. (2000) J. Biol . Chem. 275:2619]; 및 [Williams et al. (2002) J. Biol . Chem . 277:7790]), 미국 특허 6,391,544, 6,365,375, 6,294,323, 6,261,797, 6,124,090 및 5,612,199에 기재된 증폭 방법, 등온 증폭 (예를 들어, 롤링 서클 증폭 (RCA), 과분지 (hyperbranched) 롤링 서클 증폭 (HRCA), 가닥 변위 증폭 (SDA), 헬리카제-의존성 증폭 (HDA), PWGA) 또는 관련 기술 분야의 통상의 기술자에게 알려진 기술을 사용하는 임의의 다른 핵산 증폭 방법을 포함한다.
예시적인 실시양태에서, 본원에서 개시되는 방법은 PCR 증폭을 이용한다. "폴리머라제 연쇄 반응" 또는 "PCR"은 DNA의 상보성 가닥을 프라이머에 의해 동시에 연장시킴으로써 특정 DNA 시퀀스를 시험관 내에서 증폭하는 반응을 나타낸다. 즉, PCR은 프라이머 결합 부위가 플랭킹하는 표적 핵산의 다중 카피 또는 복제물을 제조하기 위한 반응으로서, 다음 단계의 1회 이상의 반복을 포함한다: (i) 표적 핵산의 변성 단계, (ii) 프라이머를 프라이머 결합 부위에 어닐링하는 단계, 및 (iii) 뉴클레오시드 트리포스페이트의 존재 하에 핵산 폴리머라제에 의해 프라이머를 연장하는 단계. 대체로, 반응은 열 순환 장치의 각각의 단계에 대해 최적화된 상이한 온도를 통해 순환된다. 특정 온도, 각 단계에서의 지속 시간, 및 단계 사이의 변화율은 관련 기술 분야의 통상의 기술자에게 잘 알려진, 예를 들어 문헌 [McPherson et al., editors, PCR: A Practical Approach and PCR2: A Practical Approach (IRL Press, Oxford, 1991 and 1995, respectively)]에 예시된 많은 인자에 의해 결정된다. 예를 들어, Taq DNA 폴리머라제를 사용하는 통상적인 PCR에서, 이중 가닥 표적 핵산은 90℃ 초과의 온도에서 변성될 수 있고, 프라이머는 50-75℃의 온도에서 어닐링될 수 있고, 프라이머는 68-78℃의 온도에서 연장될 수 있다.
용어 "PCR"은 RT-PCR, 실시간 PCR, 네스티드 PCR, 정량적 PCR, 다중화된 PCR, 어셈블리 PCR 등을 포함하고 이로 제한되지 않는 반응의 유도체 형태를 포함한다. 반응 부피는 예를 들어 수백 나노리터, 예를 들어 200 nL 내지 수백 마이크로리터, 예를 들어, 200 ㎕의 범위이다. "역전사 PCR" 또는 "RT-PCR"은 표적 RNA를 상보성 단일 가닥 DNA로 전환시키고, 이 DNA는 증폭되는 역전사 반응이 선행되는 PCR을 의미한다 (예를 들어, 테코트 (Tecott) 등의 미국 특허 5,168,038 참조). "실시간 PCR"은 반응 생성물, 즉, 앰플리콘의 양이 반응이 진행됨에 따라 모니터링되는 PCR을 의미한다. 반응 생성물을 모니터링하기 위해 사용되는 검출 화학 물질에서 주로 상이한 많은 형태의 실시간 PCR이 존재한다 (예를 들어, 겔판드 (Gelfand) 등의 미국 특허 5,210,015 ("Taqman"); 위트워 (Wittwer) 등의 미국 특허 6,174,670 및 6,569,627 (인터컬레이팅 (intercalating) 염료); 티아기 (Tyagi) 등의 미국 특허 5,925,517 (분자 비콘). 실시간 PCR을 위한 검출 화학은 문헌 [Mackay et al., Nucleic Acids Research, 30:1292-1305 (2002)]에서 검토된 바 있다. "네스티드 PCR"은 제1 PCR의 앰플리콘이, 적어도 하나의 프라이머 세트가 제1 앰플리콘의 내부 위치에 결합하는 새로운 세트의 프라이머를 사용하는 제2 PCR을 위한 샘플이 되는 2단계 PCR을 의미한다. 본원에서 사용되는 바와 같이, 네스티드 증폭 반응과 관련하여 "초기 프라이머"는 제1 앰플리콘을 생성하는데 사용된 프라이머를 의미하고, "제2 프라이머"는 제2 또는 네스티드 앰플리콘을 생성하는데 사용되는 하나 이상의 프라이머를 의미한다. "다중화된 PCR"은 복수의 표적 시퀀스 (또는 단일 표적 시퀀스 및 하나 이상의 참조 시퀀스)가 동일한 반응 혼합물에서 동시에 수행되는 PCR을 의미한다 (예를 들어, [Bernard et al. (1999) Anal. Biochem., 273:221-228] (2색 실시간 PCR). 대체로, 증폭되는 각각의 시퀀스에 대해 특유한 세트의 프라이머가 사용된다. "정량적 PCR"은 샘플 또는 표본에서 하나 이상의 특정 표적 시퀀스의 풍부도를 측정하도록 설계된 PCR을 의미한다. 정량적 PCR을 위한 기술은 다음의 참고문헌에 예시된 바와 같이 관련 기술 분야의 통상의 기술자에게 잘 알려져 있다: [Freeman et al., Biotechniques, 26:112-126 (1999)]; [Becker-Andre et al., Nucleic Acids Research, 17:9437-9447 (1989)]; [Zimmerman et al., Biotechniques, 21:268-279 (1996)]; [Diviacco et al., Gene, 122:3013-3020 (1992)]; [Becker-Andre et al., Nucleic Acids Research, 17:9437-9446 (1989)] 등.
롤링 서클 증폭 (RCA) (Zhong (2001) Proc. Natl. Acad. Sci. USA 98(7):3940-3945)은 복제가 연속적이며 열 순환을 필요로 하지 않기 때문에 폴로니 증폭에 대한 대안을 나타낸다. 단지 하나의 프라이머 (또는 닉)만 있으면, 원래의 원으로부터 하나의 긴 꼬리가 시간에 비례하는 속도로 성장한다. 원형 또는 선형 핵산 주형의 등온 증폭은 또한 핵산 분자의 효소에 의한 합성이 올리고뉴클레오티드 프라이머의 부재 하에 발생하는 방법을 사용하여 타보 (Tabor) 및 리처드슨 (Richardson) (WO 00/41524)에 따라 수행될 수 있다. 대향 가닥으로부터의 제2 프라이머가 또한 포함되는 경우, 질량이 시간에 대해 초기에 기하급수적으로 증가하는 고도로 분지된 구조가 생성된다 (m=k*exp(t) 또는 적어도 m=kt2).
본원에서 설명되는 RCA 과정의 모델링은 시간, 화학물질 및 광학 패턴의 함수로서 3D 어레이에 층을 구축하는 방법을 나타낸다. 유리 슬라이드 (또는 다른 표면)의 평평한 표면 상의 균일한 층에서 복제가 시작되면, 중합 반응은 다음 nm 두께의 층에서만 발생할 수 있다. RCA에서 폴리머라제 (예를 들어, etaPol 또는 eta-유사 BstPol)의 가닥 변위 활성은 가닥 변위 DNA 합성을 개시하기 위해 닉 또는 프라이머를 필요로 한다. RCA 프라이머 중 일부가 고정되면, 과분지된 DNA 생성물은 공간 및 시간에 상당히 안정할 것이다. 메가픽셀 마이크로-미러 광학에서 의해 거친 (마이크로미터 규모, 5 Hz) 패턴을 설정할 수 있고, 보다 미세한 상세 내역 (nm, 250 Hz)은 프리 러닝 (free running) 또는 RNAPol-etaDNAPol-융합 스테퍼에 의해 제공된다. 시간 성분을 포함하고 있기 때문에, 나노 규모 기록은 마이크로미터 규모 광 패턴에 의해 반드시 "중복"되거나 제한되지는 않는다. 두께 및 그에 따른 기록 용량은 위치 및 기록에 각각 사용되는 특정 NTP 및/또는 dNTP 펄스의 시공간 정밀도에 의해 영향을 받을 것이다.
바람직한 실시양태에서, 침착된 층은 핵산에 부착된 (또는 핵산에 의해 배치된) 다양한 화학물질을 포함할 수 있다. 한 측면에서, 레독스-민감성 형광단 "측쇄"가 4개의 dNTP 각각에 대해 개발되었다. 또 다른 측면에서, 4개의 dNTP 각각의 감광성 버전은 관련 기술 분야의 통상의 기술자에게 알려진 방법을 사용하여 개발될 수 있다 (Rob Mitra, 미출판 데이터 (2000)). 또 다른 측면에서, 금속 결합기 및 와이어 (Braun (1998) Nature 391(6669):775-778), 양자점 (Michler (2000) Nature 406(6799):968-70), 양자-와이어 (Emiliani 2001) J. Microsc. 202 (Pt 1):229-240), 자성 점 (Cowburn (2000) Science 287(5457):1466-1468) 또는 굴절 점 (Yguerabide (1998) Anal. Biochem. 262(2):157-76)을 상기 방법에 의해 조립할 수 있다. 본 발명의 3D 어레이는 신호 일치 및/또는 트래픽 수준 (신경 회로에서의 학습 및 연산과 유사)에 기초한 고속 전자-광학 경로를 제공한다. RCA에서 발견되는 천연적으로 과분지된 구조는 이 방향의 제1 단계이다.
신생 폴리머는 폴리머라제 증폭의 유무에 관계없이 저장하고 판독될 수 있다. 증폭은 열 순환 또는 등온을 통해 이루어질 수 있다. 앰플리콘은 짧거나 (현재 화학 합성에 편리한 100 내지 200 mer) 또는 폴리머라제로 달성할 수 있는 최대 1 Mbp일 수 있다.
시퀀싱
도입된 뉴클레오티드 유형은 a) dNTP 용액의 순환 패턴에서 그 시점에 존재하는 특정 dNTP (또는 rNTP 또는 다른 모노머 종류)와 일치하는 광 펄스의 교차점, b) '구속된' (즉, 광-활성화 가능 또는 광-불활성화 가능) dNTP, rNTP 또는 양이온, c) 염기 특이적, 광 조절된 입체적 또는 입체형태적 선택성 (문헌 [Hoppmann C, Schmieder P, Heinrich N, Beyermann M. (2011) Chembiochem.12(17):2555-9. doi: 10.1002/cbic.201100578. Epub 2011 Oct 13. Photoswitchable click amino acids: light control of conformation and bioactivity] 참조)에 의해 결정될 수 있다. 폴리(A) 폴리머라제는 다른 rNTP와 비교하여 ATp에 대한 그의 특이성이 광 민감성 아미노산 연결 (가교결합이 있거나 없는 아조벤젠과 같이)에 의해 모방될 수 있는 입체형태적 변화에 기인하기 때문에 특히 유용하다.
본원에서 설명되는 방법은 다량의 데이터 (수십억 비트)를 생성할 수 있다. 따라서, 문헌 [Mitra (1999) Nucleic Acids Res. 27(24):e34; pp.1-6]에 개시된 것과 같은 이들 핵산 분자의 고처리 시퀀싱 방법이 유용하다. 바람직한 실시양태에서, 고처리 방법은 길이가 100 bp 미만인 PCR 앰플리콘 또는 다른 핵산 분자와 함께 사용된다. 다른 바람직한 실시양태에서, 100 bp, 110 bp, 120 bp, 130 bp, 140 bp, 150 bp, 160 bp, 170 bp, 180 bp, 190 bp, 200 bp, 250 bp, 300 bp, 350 bp, 400 bp, 450 bp, 500 bp, 550 bp, 600 bp, 650 bp, 700 bp, 750 bp, 800 bp, 850 bp, 900 bp, 950 bp, 1000 bp 또는 그 초과의 PCR 앰플리콘이 사용될 수 있다.
롤링 서클 증폭 (RCA) (Zhong (2001) Proc. Natl. Acad. Sci. USA 98(7):3940-3945)은 복제가 연속적이고 열 순환을 필요로 하지 않기 때문에 폴로니 증폭에 대한 대안을 나타낸다. 단지 하나의 프라이머 (또는 닉)만 있으면, 원래의 원으로부터 하나의 긴 꼬리가 시간에 비례하는 속도로 성장한다. 원형 또는 선형 핵산 주형의 등온 증폭은 또한 핵산 분자의 효소에 의한 합성이 올리고뉴클레오티드 프라이머의 부재 하에 발생하는 방법을 사용하여 타보 및 리처드슨 (WO 00/41524)에 따라 수행될 수 있다.
본 개시내용에서 유용한 시퀀싱 방법은 다음 문헌을 포함한다: [Shendure et al., Accurate multiplex polony sequencing of an evolved bacterial genome, Science, vol. 309, p. 1728-32. 2005]; [ Drmanac et al., Human genome sequencing using unchained base reads on self-assembling DNA nanoarrays, Science, vol. 327, p. 78-81. 2009]; [McKernan et al., Sequence and structural variation in a human genome uncovered by short-read, massively parallel ligation sequencing using two-base encoding, Genome Res., vol. 19, p. 1527-41. 2009]; [Rodrigue et al., Unlocking short read sequencing for metagenomics, PLoS One, vol. 28, e11840. 2010]; [Rothberg et al., An integrated semiconductor device enabling non-optical genome sequencing, Nature, vol. 475, p. 348-352. 2011]; [Margulies et al., Genome sequencing in microfabricated high-density picolitre reactors, Nature, vol. 437, p. 376-380. 2005]; [Rasko et al. Origins of the E. coli strain causing an outbreak of hemolytic-uremic syndrome in Germany, N. Engl . J. Med., Epub. 2011]; [Hutter et al., Labeled nucleoside triphosphates with reversibly terminating aminoalkoxyl groups, Nucleos . Nucleot . Nucl ., vol. 92, p. 879-895. 2010]; [Seo et al., Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent nucleotides, Proc . Natl . Acad . Sci . USA., Vol. 102, P. 5926-5931 (2005)]; [Olejnik et al.; Photocleavable biotin derivatives: a versatile approach for the isolation of biomolecules, Proc . Natl . Acad . Sci . U.S.A ., vol. 92, p. 7590-7594. 1995]; US 5,750,34; US 2009/0062129 및 US 2009/0191553.
본 개시내용에 따른 시퀀싱 프라이머는 표적 폴리뉴클레오티드의 알려진 결합 영역에 결합할 수 있고 본 개시내용의 올리고뉴클레오티드 프로브의 라이게이션을 용이하게 할 수 있는 것이다. 시퀀싱 프라이머는 예를 들어, DNAWorks 또는 Gene2Oligo와 같은 컴퓨터 프로그램의 도움으로 설계될 수 있다. 결합 영역의 길이는 다양할 수 있지만, 시퀀싱 프라이머를 혼성화하기에 충분히 길어야 한다. 표적 폴리뉴클레오티드는 복수의 상이한 결합 영역을 가질 수 있어서, 표적 폴리뉴클레오티드의 상이한 부분의 시퀀싱을 가능하게 한다. 시퀀싱 프라이머는 매우 안정한 이중체를 형성하여 연속적인 라이게이션 사이클 동안 혼성화 상태를 유지하도록 선택될 수 있다. 시퀀싱 프라이머는 라이게이션이 5'에서 3' 방향으로 또는 3' 방향에서 5' 방향으로 또는 두 방향 모두로 진행될 수 있도록 선택될 수 있다. 시퀀싱 프라이머는 혼성화 효율을 향상시키거나, 그의 안정성을 개선하거나, 한 말단 또는 다른 말단으로부터의 연장을 방지하기 위해 변형된 뉴클레오티드 또는 결합을 함유할 수 있다.
한 측면에 따르면, 단일 가닥 DNA 주형 (ssDNA)은 시퀀싱 프라이머와 함께 사용되기 위해 RCA에 의해 제조된다. 대안적으로, 단일 가닥 주형은 에멀젼 내의 비드 또는 나노입자에 부착되고, ePCR을 통해 증폭된다. 그 결과, 단일 증폭된 ssDNA 주형을 갖는 클론 비드가 생성된다.
여러 주형 뉴클레오티드 시퀀스를 동시에 확인하기 위해, 주형을 PBS 완충제 (pH 7.4) 내에 희석하고, 비오틴-스트레파비딘(Biotin-Strepavidin), 아지드-알킬 (예를 들어, 클릭 케미스트리 (click chemistry)), NHS-에스테르 또는 실란화 (예를 들어, 알데히드-, 에폭시-, 아미노-실란)와 같은 다양한 부착 방법을 사용하여 패턴화되거나 패턴화되지 않은 기판에 결합된다. 한 측면에 따르면, 롤로니 (rolony)는 SiO2 고체 표면과 같은 패턴화된 표면에 부착되고, 1% 아미노실란 (v/v)으로 처리되고, 일정 시간 (일반적으로 5분 내지 2시간) 동안 상호작용하게 된다. 임의의 미결합된 주형은 Wash 1 완충제를 사용하여 씻어낸다.
다음으로, 시퀀싱 프라이머를 제조하고, 시퀀싱 프라이머 혼성화 부위에 혼성화시킨다. 특정 측면에 따르면, 주형의 알려진 시퀀스에 혼성화할 수 있는 시퀀싱 프라이머를 제조할 수 있다. 대안적으로, 주형 제조 동안, 알려진 핵산 시퀀스를 갖는 어댑터는 관련 기술 분야의 통상의 기술자에게 알려지고 본원에서 설명되는 방법에 따라 라이게이션, 증폭, 전위 (transposition) 또는 재조합에 의해 미지의 핵산 시퀀스에 부가된다. 또한, 일정 수준의 축중성 (degeneracy)을 갖는 시퀀싱 프라이머를 사용하여 주형을 따른 특정 위치에 혼성화할 수 있다. 한 측면에 따르면, 프라이머 축중성은 프라이머가 주형을 따라 반무작위로 혼성화하는 것을 허용하기 위해 사용된다. 프라이머 축중성은 주형의 길이를 따라 특정 간격으로 프라이머가 혼성화하는 것을 용이하게 하기 위해 관련 기술 분야의 통상의 기술자에게 알려진 통계적 방법에 기초하여 선택된다. 이 측면에 따르면, N개 염기마다, 예컨대 100개 염기마다, 200개 염기마다, 2000개 염기마다, 100,000개 염기마다 결합을 용이하게 하는 일정한 축중성을 갖는 프라이머가 설계될 수 있다. 주형의 길이에 따른 프라이머의 결합은 프라이머의 설계 및 프라이머 설계가 주형의 길이를 따라 약 N개 염기마다 결합할 것이라는 통계적 가능성에 기초한다. 시퀀싱 프라이머 P1은 라이게이션에 의해 연장되기 때문에, 시퀀싱 프라이머의 말단 기는 전형적으로 DNA 리가제에 의해 올리고뉴클레오티드 프로브에 공유 연결될 준비가 되도록 합성된다. 라이게이션이 시퀀싱 프라이머의 5' 말단과 올리고뉴클레오티드 프로브의 3' 말단 사이에서 발생할 경우, 포스페이트기 (5'-PO4)는 시퀀싱 프라이머 상에 존재하여야 하고, 히드록실기 (3'-OH)는 올리고뉴클레오티드 프로브 상에 존재해야 하고, 그 반대도 마찬가지이다. 시퀀싱 프라이머를 시퀀싱 프라이머 혼성화 부위에 혼성화하기 위해, 5X SSPE 완충제 내에 희석된 1 μM의 시퀀싱 프라이머를 사용한다. 이어서, 혼합물은 적절한 어닐링을 촉진하기 위해 실온 초과의 온도에서 몇 분 동안 인큐베이팅한다 (일반적으로 25 내지 55℃의 온도에서 1 내지 5분).
HTML 파일의 DNA 세그먼트로의 인코딩
특정 측면에 따르면, 텍스트와 같은 정보는 HTML 포맷 (jpg 이미지가 포함된)으로 변환된 다음, 비트 형태로 판독될 수 있다. 개별 비트는 0의 경우 A 또는 C로, 1의 경우 T 또는 G로 변환된다. 비트스트림의 어드레스는 길이가 19 비트이고, 예컨대 0000000000000000001로부터 시작하여 연속적으로 넘버링된다. Bits2DNA.pl로서 확인되는 다음 프로그램이 HTML 파일을 DNA 세그먼트로 인코딩하기 위해 사용된다.
Figure pct00002
Figure pct00003
Figure pct00004
Figure pct00005
Figure pct00006
본원에 개시된 방법의 실시는 통상적인 생물학적 방법, 소프트웨어, 컴퓨터 및 컴퓨터 시스템을 사용할 수 있다. 따라서, 본원에서 설명되는 방법은 전체적으로 또는 부분적으로 컴퓨터 실행 방법일 수 있다. 본 개시내용의 방법에 이용되는 컴퓨터 소프트웨어는 본 발명의 방법의 논리 단계를 수행하기 위한 컴퓨터 실행 가능 명령어를 갖는 컴퓨터 판독 가능 매체를 포함한다. 적합한 컴퓨터 판독 가능 매체는 플로피 디스크, CD-ROM/DVD/DVD-ROM, 하드-디스크 드라이브, 플래시 메모리, ROM/RAM, 자기 테이프 및 개발될 수 있는 다른 것들을 포함하고, 이로 제한되지 않는다. 컴퓨터 실행 가능 명령어는 적합한 컴퓨터 언어 또는 여러 컴퓨터 언어의 조합으로 작성될 수 있다. 본원에서 설명되는 방법은 텍스트 또는 이미지를 이진 코드로 번역하는 것, 이진 코드를 나타내는 핵산 시퀀스를 설계하는 것, 핵산 시퀀스로부터 시퀀싱 데이터를 분석하는 것, 핵산 시퀀스 데이터를 이진 코드로 번역하는 것, 이진 코드를 텍스트 또는 이미지로 번역하는 것을 포함하는 다양한 목적을 위해 다양한 상업적으로 이용가능한 컴퓨터 및 컴퓨터 프로그램 제품 및 소프트웨어를 이용할 수 있다.
특정 방법의 실시양태
본 개시내용의 실시양태는 이진 인코딩된 폴리머를 생성하는 방법을 포함하고, 이 방법은 성장하는 폴리머 쇄를 (i) 제1 모노머 쌍의 제1 모노머 또는 제2 모노머 중 하나 또는 하나 초과, 또는 (ii) 제2 모노머 쌍의 제1 모노머 또는 제2 모노머 중 하나 또는 하나 초과의 연장 생성물로 반복적으로 연장시키는 단계이며, 여기서 연장 생성물은 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷으로부터 번역된 비트 스트림에 대응하는 이진 정보 비트를 나타내고, 제1 모노머 쌍의 제1 모노머 및 제2 모노머는 각각 제1 이진 정보 비트를 나타내며, 제2 모노머 쌍의 제1 모노머 및 제2 모노머는 각각 제2 이진 정보 비트를 나타내는 단계, 및 연장 생성물이 동일한 이진 정보 비트를 나타내고 직렬로 직접 발생할 때 주어진 모노머 쌍의 제1 모노머와 제2 모노머를 교대로 제시하는 단계이며, 여기서 이진 인코딩된 폴리머는 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 것인 단계를 포함한다. 한 측면에 따르면, 폴리머는 핵산이다. 한 측면에 따르면, 제1 모노머 쌍의 제1 모노머 또는 제2 모노머는 뉴클레오티드이다. 한 측면에 따르면, 제2 모노머 쌍의 제1 모노머 또는 제2 모노머는 뉴클레오티드이다. 한 측면에 따르면, 제1 모노머 쌍은 아데닌 (A) 및 티민 (T) 또는 우라실 (U)을 포함한다. 한 측면에 따르면, 제2 모노머 쌍은 시토신 (C) 및 구아닌 (G)을 포함한다. 한 측면에 따르면, 연장 생성물은 선택된 모노머의 부가를 촉매하는 조건 하에 효소 및 선택된 모노머를 사용하여 형성된다. 한 측면에 따르면, 연장 생성물은 선택된 모노머의 부가를 촉매하는 조건 하에서 폴리머라제 및 선택된 모노머를 사용하여 형성된다. 한 측면에 따르면, 연장 생성물은 선택된 모노머의 부가를 촉매하는 조건 하에 주형 비의존성 폴리머라제 및 선택된 모노머를 사용하여 형성된다. 한 측면에 따르면, 성장하는 폴리머 쇄는 기판에 부착된다. 한 측면에 따르면, 단계 (i) 및 (ii)로부터 형성된 복수의 성장하는 폴리머 쇄가 제공된다. 한 측면에 따르면, 단계 (i) 및 (ii)로부터 형성된 복수의 성장하는 폴리머 쇄가 제공되고, 상기 복수의 성장하는 폴리머 쇄는 기판에 부착된다. 한 측면에 따르면, 제1 모노머 쌍의 제1 모노머 또는 제2 모노머는 천연 뉴클레오티드이다. 한 측면에 따르면, 제2 모노머 쌍의 제1 모노머 또는 제2 모노머는 천연 뉴클레오티드이다. 한 측면에 따르면, 제1 및 제2 모노머 쌍은 천연 뉴클레오티드를 포함하고, 연장 생성물은 단일 뉴클레오티드 또는 하나 초과의 뉴클레오티드를 부가하기에 충분한 조건 하에 천연 뉴클레오티드의 부가를 촉매함으로써 제조된다. 한 측면에 따르면, 제1 및 제2 모노머 쌍은 천연 뉴클레오티드를 포함하고, 연장 생성물은 뉴클레오티드를 부가하기에 충분한 조건 하에 천연 뉴클레오티드의 부가를 촉매하는 뉴클레오티드 결핍 완충제로 폴리머라제 및 선택된 뉴클레오티드를 기판 상의 하나 이상의 위치에 교대로 투여함으로써 제조된다.
한 측면에 따르면, 이진 인코딩된 폴리머를 생성하는 방법이 제공되고, 이 방법은 성장하는 폴리머 쇄를 (i) 제1 모노머 쌍의 제1 모노머 또는 제2 모노머 중 하나 또는 하나 초과, 또는 (ii) 제2 모노머 쌍의 제1 모노머 또는 제2 모노머 중 하나 또는 하나 초과의 연장 생성물로 반복적으로 연장시키는 단계이며, 여기서 연장 생성물은 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷으로부터 번역된 비트 스트림에 대응하는 이진 정보 비트를 나타내고, 제1 모노머 쌍의 제1 모노머 및 제2 모노머는 각각 제1 이진 정보 비트를 나타내며, 제2 모노머 쌍의 제1 모노머 및 제2 모노머는 각각 제2 이진 정보 비트를 나타내는 단계, 및 연장 생성물이 동일한 이진 정보 비트를 나타내고 직렬로 직접 발생할 때 주어진 모노머 쌍의 제1 모노머와 제2 모노머를 교대로 제시하는 단계이며, 여기서 연장 생성물은 제1 모노머 쌍의 제1 모노머 또는 제2 모노머의 적어도 하나의 호모폴리머 또는 제2 모노머 쌍의 제1 모노머 또는 제2 모노머의 적어도 하나의 호모폴리머를 포함하고, 이진 인코딩된 폴리머는 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 것인 단계를 포함한다.
한 측면에 따르면, 이진 인코딩된 핵산을 핵산 시퀀스로부터 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 나타내는 이진 정보 비트의 시퀀스로 번역하는 방법이 제공되고, 여기서 아데닌 및 티민 또는 우라실은 제1 이진 정보 비트를 나타내고, 시토신 및 구아닌은 제2 이진 정보 비트를 나타내고, 이 방법은 핵산 시퀀스를 판독하는 단계 및 직렬일 때 아데닌 또는 하나 초과의 아데닌 각각에 제1 이진 정보 비트를 할당하고, 직렬일 때 티민 또는 하나 초과의 티민 각각에 제1 이진 정보 비트를 할당하고, 직렬일 때 우라실 또는 하나 초과의 우라실 각각에 제1 이진 정보 비트를 할당하고, 직렬일 때 시토신 또는 하나 초과의 시토신 각각에 제2 이진 정보 비트를 할당하고, 직렬일 때 구아닌 또는 하나 초과의 구아닌 각각에 제2 이진 정보 비트를 할당하는 단계를 포함하고, 여기서 핵산 시퀀스는 직렬로 존재하는 2개 이상의 아데닌, 직렬로 존재하는 2개 이상의 티민, 직렬로 존재하는 2개 이상의 우라실, 직렬로 존재하는 2개 이상의 시토신 또는 직렬로 존재하는 2개 이상의 구아닌 중 적어도 하나를 포함한다.
한 측면에 따르면, 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩 및 디코딩하는 방법이 제공되고, 이 방법은 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 비트 스트림의 복수의 비트 시퀀스로 변환하는 단계, 아데닌 또는 티민을 제1 이진 정보 비트에 할당하고 시토신 또는 구아닌을 제2 이진 정보 비트에 할당함으로써 비트 스트림의 복수의 비트 시퀀스에 대응하는 핵산 시퀀스를 설계하는 단계이며, 여기서 아데닌 또는 티민의 할당은 동일한 이진 정보 비트가 직렬로 직접 발생할 때 교대로 실시되고 시토신 또는 구아닌의 할당은 동일한 이진 정보 비트가 직렬로 직접 발생할 때 교대로 실시되는 것인 단계, 핵산 시퀀스를 합성하는 단계, 합성된 핵산 시퀀스를 저장하는 단계, 합성된 핵산 시퀀스를 판독하는 단계, 및 제1 이진 정보 비트를 아데닌 또는 티민에 할당하고 제2 이진 정보 비트를 시토신 또는 구아닌에 할당함으로써 합성된 핵산 시퀀스를 비트 스트림의 복수의 비트 시퀀스로 디코딩하는 단계를 포함한다. 한 측면에 따르면, 합성된 핵산 시퀀스는 아데닌, 티민, 시토신 또는 구아닌의 적어도 하나의 호모폴리머를 포함하고, 합성된 핵산 시퀀스의 디코딩은 제1 이진 정보 비트를 아데닌 또는 티민의 호모폴리머에 할당하거나, 제2 이진 정보 비트를 시토신 또는 구아닌의 호모폴리머에 할당하는 것을 포함한다.
한 측면에 따르면, 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 비트 스트림의 복수의 비트 시퀀스를 나타내는 핵산 시퀀스를 사용하여 정보를 기판 상에 저장하는 방법이 제공되고, 이 방법은 단일 가닥 핵산 개시자 시퀀스가 부착된 기판을 어레이 상의 영역에 제공하는 단계, 하나 이상의 위치를 주형 비의존성 폴리머라제, 선택된 천연 뉴클레오티드, 및 Co2+, Mn2+, Zn2+ 및 Mg2+ 중 하나 이상과 접촉시키는 단계, 선택된 천연 뉴클레오티드를 하나 이상의 위치에서 표적 단일 가닥 핵산 개시자 시퀀스의 3' 히드록실 말단에 부가하는 것을 촉매하는 단계, 및 기판의 알려진 위치에서 복수의 미리 결정된 시퀀스를 생성하기 위해 선택된 천연 뉴클레오티드의 부가를 촉매하는 단계를 반복하는 단계이며, 여기서 복수의 미리 결정된 시퀀스는 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 비트 스트림의 복수의 비트 시퀀스를 나타내는 것인 단계를 포함한다. 한 측면에 따르면, 촉매 및 반복 단계는 기판의 알려진 위치에서 복수의 미리 결정된 시퀀스를 생성하기 위해 기판 상의 복수의 위치에서 직렬로 수행된다. 한 측면에 따르면, 촉매 및 반복 단계는 각각 기판의 대응하는 알려진 위치에서 복수의 미리 결정된 시퀀스를 생성하고 이에 따라 대응하는 알려진 위치에서 미리 결정된 시퀀스의 어레이를 생성하기 위해 기판 상의 복수의 위치에서 동시에 수행된다. 한 측면에 따르면, 복수의 미리 결정된 시퀀스 중 하나 이상이 시퀀싱되고, 시퀀스는 이진 비트 정보로 번역되고 이것이 이어서 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷으로 번역된다. 한 측면에 따르면, 기판은 각각 대응하는 알려진 영역에서 102, 103, 104, 105, 106, 107, 108, 109, 1010개의 미리 결정된 시퀀스를 포함한다. 한 측면에 따르면, 미리 결정된 시퀀스는 100개 뉴클레오티드, 500개 뉴클레오티드 또는 1000개 뉴클레오티드를 초과한다. 한 측면에 따르면, 주형 비의존성 폴리머라제는 말단 데옥시뉴클레오티딜 트랜스퍼라제이다. 한 측면에 따르면, 천연 뉴클레오티드의 연장 생성물은 천연 뉴클레오티드의 반응 시간을 제한함으로써 생산되고, 여기서 뉴클레오티드 고갈 완충제를 첨가하여 천연 뉴클레오티드를 제거함으로써 그의 반응 시간을 제한하거나 또는 기판의 표면을 가로지르는 천연 뉴클레오티드의 펄스 유동 속도가 원하는 특정 위치에서 그의 반응 시간을 제한한다.
한 측면에 따르면, 이진 인코딩된 핵산을 핵산 시퀀스로부터 이진 정보 비트의 시퀀스로 번역하는 방법이 제공되고, 여기서 아데닌 및 티민 또는 우라실은 제1 이진 정보 비트를 나타내고, 시토신 및 구아닌은 제2 이진 정보 비트를 나타내고, 이 방법은 핵산 시퀀스를 판독하는 단계 및 직렬일 때 아데닌 또는 하나 초과의 아데닌 각각에 제1 이진 정보 비트를 할당하고, 직렬일 때 티민 또는 하나 초과의 티민 각각에 제1 이진 정보 비트를 할당하고, 직렬일 때 우라실 또는 하나 초과의 우라실 각각에 제1 이진 정보 비트를 할당하고, 직렬일 때 시토신 또는 하나 초과의 시토신 각각에 제2 이진 정보 비트를 할당하고, 직렬일 때 구아닌 또는 하나 초과의 구아닌 각각에 제2 이진 정보 비트를 할당하는 단계를 포함한다.
한 측면에 따르면, 저장된 정보를 함유하고, 기판 및 그 위에 배치된 복수의 핵산 시퀀스를 포함하는 정보 저장 장치가 제공되고, 여기서 복수의 핵산 시퀀스는 저장된 정보에 대응하는 일련의 이진 정보 비트를 인코딩하고, 아데닌 또는 일련의 아데닌, 티민 또는 일련의 티민 및 우라실 또는 일련의 우라실은 제1 이진 정보 비트를 나타내고, 시토신 또는 일련의 시토신 및 구아닌 또는 일련의 구아닌은 제2 이진 정보 비트를 나타낸다.
한 측면에 따르면, 뉴클레오티드를 사용하여 정보를 저장하는 방법이 제공되고, 이 방법은 정보의 포맷을 대응하는 비트 바코드를 각각 갖는 비트 스트림의 복수의 비트 시퀀스로 변환하는 단계, 염기 인코딩당 1개 비트를 사용하여 복수의 비트 시퀀스를 복수의 대응하는 올리고뉴클레오티드 시퀀스로 변환하는 단계, 시약 및 세척제를 복수의 반응 위치를 갖는 기판의 표면을 가로질러 펄싱 및 동기화하여 복수의 대응하는 올리고뉴클레오티드 시퀀스를 합성하는 단계, 및 합성된 복수의 대응하는 올리고뉴클레오티드 시퀀스를 저장하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다.
한 측면에 따르면, 정보의 포맷의 비트 시퀀스를 인코딩하는 복수의 합성된 올리고뉴클레오티드 시퀀스로부터 정보의 포맷을 검색하는 방법이 제공되고, 이 방법은 복수의 올리고뉴클레오티드 시퀀스를 증폭하는 단계, 증폭된 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 변환하는 단계, 및 비트 시퀀스를 정보의 포맷으로 변환하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다.
한 측면에 따르면, 정보의 포맷의 비트 시퀀스를 인코딩하는 복수의 합성된 올리고뉴클레오티드 시퀀스로부터 정보의 포맷을 액세스하는 방법이 제공되고, 이 방법은 복수의 올리고뉴클레오티드 시퀀스를 증폭하는 단계, 증폭된 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 변환하는 단계, 비트 시퀀스를 정보의 포맷으로 변환하는 단계, 및 정보의 포맷을 출력하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다.
한 측면에 따르면, 뉴클레오티드를 사용하여 정보를 저장하는 방법이 제공되고, 이 방법은 정보의 포맷을 비트 스트림으로 변환하는 단계, 비트 시퀀스를 대응하는 올리고뉴클레오티드 시퀀스로 인코딩하는 단계, 시약 및 세척제를 복수의 반응 위치를 갖는 기판의 표면을 가로질러 펄싱 및 동기화하여 올리고뉴클레오티드 시퀀스를 합성하는 단계, 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 디코딩하는 단계, 비트 시퀀스를 비트 스트림으로 어셈블링하는 단계 및 비트 스트림을 정보의 포맷으로 변환하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다.
한 측면에 따르면, 뉴클레오티드를 사용하여 정보를 저장하는 방법이 제공되고, 이 방법은 제1 정보의 포맷을 제1 비트 스트림으로 변환하는 단계, 제1 비트 시퀀스를 대응하는 올리고뉴클레오티드 시퀀스로 인코딩하는 단계, 시약 및 세척제를 복수의 반응 위치를 갖는 기판의 표면을 가로질러 펄싱 및 동기화하여 올리고뉴클레오티드 시퀀스를 합성하는 단계, 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 제2 비트 시퀀스로 디코딩하는 단계, 제2 비트 시퀀스를 제2 비트 스트림으로 어셈블링하는 단계 및 제2 비트 스트림을 제2 정보의 포맷으로 변환하는 단계를 포함한다. 한 측면에 따르면, 올리고뉴클레오티드 시퀀스는 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함한다.
본원 전체에 걸쳐 인용된 모든 참고문헌, 특허 및 공개된 특허 출원의 내용은 모든 목적을 위해 그 전체가 본원에 참고로 포함된다.
다른 실시양태
다른 실시양태는 관련 기술 분야의 통상의 기술자에게 자명할 것이다. 상기한 설명은 단지 명확성을 위해서 제공되며 단지 예시적인 것임을 이해하여야 한다. 본 발명의 사상 및 범위는 상기 예로 제한되지 않고, 이하의 청구범위에 의해 포함된다. 상기 인용된 모든 간행물 및 특허 출원은 마치 각각의 개별 간행물 또는 특허 출원이 참고로 포함된다고 구체적으로 및 개별적으로 표시된 것과 동일한 정도로 모든 목적을 위해 그 전체가 참고로 포함된다.
SEQUENCE LISTING <110> President and Fellows of Harvard College <120> METHODS FOR RETRIEVABLE INFORMATION STORAGE USING NUCLEIC ACIDS <130> 010498_00831 <140> PCT/US16/41981 <141> 2016-07-13 <150> US 62/191,982 <151> 2015-07-13 <160> 2 <170> PatentIn version 3.5 <210> 1 <211> 22 <212> DNA <213> Artificial <220> <223> forward universal sequencing and amplification primer <400> 1 ctacacgacg ctcttccgat ct 22 <210> 2 <211> 22 <212> DNA <213> Artificial <220> <223> reverse primer <400> 2 agatcggaag agcggttcag ca 22

Claims (40)

  1. 이진 인코딩된 폴리머를 생성하는 방법이며,
    성장하는 폴리머 쇄를
    (i) 제1 모노머 쌍의 제1 모노머 또는 제2 모노머 중 하나 또는 하나 초과, 또는
    (ii) 제2 모노머 쌍의 제1 모노머 또는 제2 모노머 중 하나 또는 하나 초과
    의 연장 생성물로 반복적으로 연장시키는 단계이며,
    여기서, 연장 생성물은 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷으로부터 번역된 비트 스트림에 대응하는 이진 정보 비트를 나타내고,
    제1 모노머 쌍의 제1 모노머 및 제2 모노머는 각각 제1 이진 정보 비트를 나타내고,
    제2 모노머 쌍의 제1 모노머 및 제2 모노머는 각각 제2 이진 정보 비트를 나타내는 것인 단계, 및
    연장 생성물이 동일한 이진 정보 비트를 나타내고 직렬로 직접 발생할 때 주어진 모노머 쌍의 제1 모노머와 제2 모노머를 교대로 제시하는 단계이며,
    여기서 이진 인코딩된 폴리머는 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 것인 단계
    를 포함하는, 이진 인코딩된 폴리머를 생성하는 방법.
  2. 제1항에 있어서, 폴리머가 핵산인 방법.
  3. 제1항에 있어서, 제1 모노머 쌍의 제1 모노머 또는 제2 모노머가 뉴클레오티드인 방법.
  4. 제1항에 있어서, 제2 모노머 쌍의 제1 모노머 또는 제2 모노머가 뉴클레오티드인 방법.
  5. 제1항에 있어서, 제1 모노머 쌍이 아데닌 (A) 및 티민 (T) 또는 우라실 (U)을 포함하는 것인 방법.
  6. 제1항에 있어서, 제2 모노머 쌍이 시토신 (C) 및 구아닌 (G)을 포함하는 것인 방법.
  7. 제1항에 있어서, 연장 생성물이 선택된 모노머의 부가를 촉매하는 조건 하에 효소 및 선택된 모노머를 사용하여 형성되는 것인 방법.
  8. 제1항에 있어서, 연장 생성물이 선택된 모노머의 부가를 촉매하는 조건 하에 폴리머라제 및 선택된 모노머를 사용하여 형성되는 것인 방법.
  9. 제1항에 있어서, 연장 생성물이 선택된 모노머의 부가를 촉매하는 조건 하에 주형 비의존성 폴리머라제 및 선택된 모노머를 사용하여 형성되는 것인 방법.
  10. 제1항에 있어서, 성장하는 폴리머 쇄가 기판에 부착되는 것인 방법.
  11. 제1항에 있어서, 단계 (i) 및 (ii)로부터 형성된 복수의 성장하는 폴리머 쇄를 포함하는 것인 방법.
  12. 제1항에 있어서, 단계 (i) 및 (ii)로부터 형성된 복수의 성장하는 폴리머 쇄를 포함하고, 여기서 복수의 성장하는 폴리머 쇄가 기판에 부착되는 것인 방법.
  13. 제1항에 있어서, 제1 모노머 쌍의 제1 모노머 또는 제2 모노머가 천연 뉴클레오티드인 방법.
  14. 제1항에 있어서, 제2 모노머 쌍의 제1 모노머 또는 제2 모노머가 천연 뉴클레오티드인 방법.
  15. 제1항에 있어서, 제1 및 제2 모노머 쌍이 천연 뉴클레오티드를 포함하고, 연장 생성물이 단일 뉴클레오티드 또는 하나 초과의 뉴클레오티드를 부가하기에 충분한 조건 하에 천연 뉴클레오티드의 부가를 촉매함으로써 제조되는 것인 방법.
  16. 제1항에 있어서, 제1 및 제2 모노머 쌍이 천연 뉴클레오티드를 포함하고, 연장 생성물이 뉴클레오티드를 부가하기에 충분한 조건 하에 천연 뉴클레오티드의 부가를 촉매하는 뉴클레오티드 결핍 완충제로 폴리머라제 및 선택된 뉴클레오티드를 기판 상의 하나 이상의 위치에 교대로 투여함으로써 제조되는 것인 방법.
  17. 이진 인코딩된 폴리머를 생성하는 방법이며,
    성장하는 폴리머 쇄를
    (i) 제1 모노머 쌍의 제1 모노머 또는 제2 모노머 중 하나 또는 하나 초과, 또는
    (ii) 제2 모노머 쌍의 제1 모노머 또는 제2 모노머 중 하나 또는 하나 초과
    의 연장 생성물로 반복적으로 연장시키는 단계이며,
    여기서, 연장 생성물은 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷으로부터 번역된 비트 스트림에 대응하는 이진 정보 비트를 나타내고,
    제1 모노머 쌍의 제1 모노머 및 제2 모노머는 각각 제1 이진 정보 비트를 나타내고,
    제2 모노머 쌍의 제1 모노머 및 제2 모노머는 각각 제2 이진 정보 비트를 나타내는 것인 단계, 및
    연장 생성물이 동일한 이진 정보 비트를 나타내고 직렬로 직접 발생할 때 주어진 모노머 쌍의 제1 모노머와 제2 모노머를 교대로 제시하는 단계이며,
    여기서, 연장 생성물은 제1 모노머 쌍의 제1 모노머 또는 제2 모노머의 적어도 하나의 호모폴리머 또는 제2 모노머 쌍의 제1 모노머 또는 제2 모노머의 적어도 하나의 호모폴리머를 포함하고,
    이진 인코딩된 폴리머는 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 것인 단계
    를 포함하는, 이진 인코딩된 폴리머를 생성하는 방법.
  18. 이진 인코딩된 핵산을 핵산 시퀀스로부터 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 나타내는 이진 정보 비트의 시퀀스로 번역하는 방법이며, 여기서 아데닌 및 티민 또는 우라실은 제1 이진 정보 비트를 나타내고, 시토신 및 구아닌은 제2 이진 정보 비트를 나타내고,
    핵산 시퀀스를 판독하는 단계 및
    직렬일 때 아데닌 또는 하나 초과의 아데닌 각각에 제1 이진 정보 비트를 할당하고,
    직렬일 때 티민 또는 하나 초과의 티민 각각에 제1 이진 정보 비트를 할당하고,
    직렬일 때 우라실 또는 하나 초과의 우라실 각각에 제1 이진 정보 비트를 할당하고,
    직렬일 때 시토신 또는 하나 초과의 시토신 각각에 제2 이진 정보 비트를 할당하고,
    직렬일 때 구아닌 또는 하나 초과의 구아닌 각각에 제2 이진 정보 비트를 할당하는 단계
    를 포함하고, 여기서 핵산 시퀀스는 직렬로 존재하는 2개 이상의 아데닌, 직렬로 존재하는 2개 이상의 티민, 직렬로 존재하는 2개 이상의 우라실, 직렬로 존재하는 2개 이상의 시토신 또는 직렬로 존재하는 2개 이상의 구아닌 중 적어도 하나를 포함하는 것인, 이진 인코딩된 핵산을 핵산 시퀀스로부터 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 나타내는 이진 정보 비트의 시퀀스로 번역하는 방법.
  19. 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩 및 디코딩하는 방법이며,
    텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 비트 스트림의 복수의 비트 시퀀스로 변환하는 단계,
    아데닌 또는 티민을 제1 이진 정보 비트에 할당하고 시토신 또는 구아닌을 제2 이진 정보 비트에 할당함으로써 비트 스트림의 복수의 비트 시퀀스에 대응하는 핵산 시퀀스를 설계하는 단계이며, 여기서 아데닌 또는 티민의 할당은 동일한 이진 정보 비트가 직렬로 직접 발생할 때 교대로 실시되고, 시토신 또는 구아닌의 할당은 동일한 이진 정보 비트가 직렬로 직접 발생할 때 교대로 실시되는 것인 단계,
    핵산 시퀀스를 합성하는 단계,
    합성된 핵산 시퀀스를 저장하는 단계,
    합성된 핵산 시퀀스를 판독하는 단계, 및
    제1 이진 정보 비트를 아데닌 또는 티민에 할당하고 제2 이진 정보 비트를 시토신 또는 구아닌에 할당함으로써 합성된 핵산 시퀀스를 비트 스트림의 복수의 비트 시퀀스로 디코딩하는 단계
    를 포함하는, 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩 및 디코딩하는 방법.
  20. 제19항에 있어서, 합성된 핵산 시퀀스가 아데닌, 티민, 시토신 또는 구아닌의 적어도 하나의 호모폴리머를 포함하고, 합성된 핵산 시퀀스의 디코딩이 제1 이진 정보 비트를 아데닌 또는 티민의 호모폴리머에 할당하거나, 제2 이진 정보 비트를 시토신 또는 구아닌의 호모폴리머에 할당하는 것을 포함하는 것인 방법.
  21. 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 비트 스트림의 복수의 비트 시퀀스를 나타내는 핵산 시퀀스를 사용하여 정보를 기판 상에 저장하는 방법이며,
    단일 가닥 핵산 개시자 시퀀스가 부착된 기판을 어레이 상의 영역에 제공하는 단계,
    하나 이상의 위치를 주형 비의존성 폴리머라제, 선택된 천연 뉴클레오티드, 및 Co2+, Mn2+, Zn2+ 및 Mg2+ 중 하나 이상과 접촉시키는 단계,
    선택된 천연 뉴클레오티드를 하나 이상의 위치에서 표적 단일 가닥 핵산 개시자 시퀀스의 3' 히드록실 말단에 부가하는 것을 촉매하는 단계, 및
    기판의 알려진 위치에서 복수의 미리 결정된 시퀀스를 생성하기 위해 선택된 천연 뉴클레오티드의 부가를 촉매하는 단계를 반복하는 단계이며, 여기서 복수의 미리 결정된 시퀀스는 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 비트 스트림의 복수의 비트 시퀀스를 나타내는 것인 단계
    를 포함하는, 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷을 인코딩하는 비트 스트림의 복수의 비트 시퀀스를 나타내는 핵산 시퀀스를 사용하여 정보를 기판 상에 저장하는 방법.
  22. 제21항에 있어서, 촉매 및 반복 단계가 기판의 알려진 위치에서 복수의 미리 결정된 시퀀스를 생성하기 위해 기판 상의 복수의 위치에서 직렬로 수행되는 것인 방법.
  23. 제21항에 있어서, 촉매 및 반복 단계가 각각 기판의 대응하는 알려진 위치에서 복수의 미리 결정된 시퀀스를 생성하고 이에 따라 대응하는 알려진 위치에서 미리 결정된 시퀀스의 어레이를 생성하기 위해 기판 상의 복수의 위치에서 동시에 수행되는 것인 방법.
  24. 제21항에 있어서, 복수의 미리 결정된 시퀀스 중 하나 이상이 시퀀싱되고, 시퀀스가 이진 비트 정보로 번역되고 이것이 이어서 텍스트 또는 이미지 또는 비디오 또는 오디오 포맷으로 번역되는 것인 방법.
  25. 제21항에 있어서, 기판이 각각 대응하는 알려진 영역에서 적어도 102, 103, 104, 105, 106, 107, 108, 109, 1010개의 미리 결정된 시퀀스를 포함하는 것인 방법.
  26. 제21항에 있어서, 미리 결정된 시퀀스가 100개 뉴클레오티드, 500개 뉴클레오티드 또는 1000개 뉴클레오티드를 초과하는 것인 방법.
  27. 제21항에 있어서, 주형 비의존성 폴리머라제가 말단 데옥시뉴클레오티딜 트랜스퍼라제인 방법.
  28. 제21항에 있어서, 천연 뉴클레오티드의 연장 생성물이 천연 뉴클레오티드의 반응 시간을 제한함으로써 생산되고, 여기서 뉴클레오티드 고갈 완충제를 첨가하여 천연 뉴클레오티드를 제거함으로써 그의 반응 시간을 제한하거나 또는 기판의 표면을 가로지르는 천연 뉴클레오티드의 펄스 유동 속도가 원하는 특정 위치에서 그의 반응 시간을 제한하는 것인 방법.
  29. 이진 인코딩된 핵산을 핵산 시퀀스로부터 이진 정보 비트의 시퀀스로 번역하는 방법이며, 여기서 아데닌 및 티민 또는 우라실은 제1 이진 정보 비트를 나타내고, 시토신 및 구아닌은 제2 이진 정보 비트를 나타내고,
    핵산 시퀀스를 판독하는 단계 및
    직렬일 때 아데닌 또는 하나 초과의 아데닌 각각에 제1 이진 정보 비트를 할당하고,
    직렬일 때 티민 또는 하나 초과의 티민 각각에 제1 이진 정보 비트를 할당하고,
    직렬일 때 우라실 또는 하나 초과의 우라실 각각에 제1 이진 정보 비트를 할당하고,
    직렬일 때 시토신 또는 하나 초과의 시토신 각각에 제2 이진 정보 비트를 할당하고,
    직렬일 때 구아닌 또는 하나 초과의 구아닌 각각에 제2 이진 정보 비트를 할당하는 단계
    를 포함하는, 이진 인코딩된 핵산을 핵산 시퀀스로부터 이진 정보 비트의 시퀀스로 번역하는 방법.
  30. 정보 저장 장치이며, 저장된 정보를 함유하고, 기판 및 그 위에 배치된 복수의 핵산 시퀀스를 포함하고, 여기서 복수의 핵산 시퀀스는 저장된 정보에 대응하는 일련의 이진 정보 비트를 인코딩하고, 아데닌 또는 일련의 아데닌, 티민 또는 일련의 티민 및 우라실 또는 일련의 우라실은 제1 이진 정보 비트를 나타내고, 시토신 또는 일련의 시토신 및 구아닌 또는 일련의 구아닌은 제2 이진 정보 비트를 나타내는 것인 정보 저장 장치.
  31. 뉴클레오티드를 사용하여 정보를 저장하는 방법이며, 정보의 포맷을 대응하는 비트 바코드를 각각 갖는 비트 스트림의 복수의 비트 시퀀스로 변환하는 단계, 염기 인코딩당 1개 비트를 사용하여 복수의 비트 시퀀스를 복수의 대응하는 올리고뉴클레오티드 시퀀스로 변환하는 단계, 시약 및 세척제를 복수의 반응 위치를 갖는 기판의 표면을 가로질러 펄싱 및 동기화하여 복수의 대응하는 올리고뉴클레오티드 시퀀스를 합성하는 단계, 및 합성된 복수의 대응하는 올리고뉴클레오티드 시퀀스를 저장하는 단계를 포함하는, 뉴클레오티드를 사용하여 정보를 저장하는 방법.
  32. 제31항에 있어서, 올리고뉴클레오티드 시퀀스가 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함하는 것인 방법.
  33. 정보의 포맷의 비트 시퀀스를 인코딩하는 복수의 합성된 올리고뉴클레오티드 시퀀스로부터 정보의 포맷을 검색하는 방법이며, 복수의 올리고뉴클레오티드 시퀀스를 증폭하는 단계, 증폭된 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 변환하는 단계, 및 비트 시퀀스를 정보의 포맷으로 변환하는 단계를 포함하는, 정보의 포맷의 비트 시퀀스를 인코딩하는 복수의 합성된 올리고뉴클레오티드 시퀀스로부터 정보의 포맷을 검색하는 방법.
  34. 제33항에 있어서, 올리고뉴클레오티드 시퀀스가 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함하는 것인 방법.
  35. 정보의 포맷의 비트 시퀀스를 인코딩하는 복수의 합성된 올리고뉴클레오티드 시퀀스로부터 정보의 포맷을 액세스하는 방법이며, 복수의 올리고뉴클레오티드 시퀀스를 증폭하는 단계, 증폭된 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 변환하는 단계, 비트 시퀀스를 정보의 포맷으로 변환하는 단계, 및 정보의 포맷을 출력하는 단계를 포함하는, 정보의 포맷의 비트 시퀀스를 인코딩하는 복수의 합성된 올리고뉴클레오티드 시퀀스로부터 정보의 포맷을 액세스하는 방법.
  36. 제35항에 있어서, 올리고뉴클레오티드 시퀀스가 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함하는 것인 방법.
  37. 뉴클레오티드를 사용하여 정보를 저장하는 방법이며, 정보의 포맷을 비트 스트림으로 변환하는 단계, 비트 시퀀스를 대응하는 올리고뉴클레오티드 시퀀스로 인코딩하는 단계, 시약 및 세척제를 복수의 반응 위치를 갖는 기판의 표면을 가로질러 펄싱 및 동기화하여 올리고뉴클레오티드 시퀀스를 합성하는 단계, 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 비트 시퀀스로 디코딩하는 단계, 비트 시퀀스를 비트 스트림으로 어셈블링하는 단계 및 비트 스트림을 정보의 포맷으로 변환하는 단계를 포함하는, 뉴클레오티드를 사용하여 정보를 저장하는 방법.
  38. 제37항에 있어서, 올리고뉴클레오티드 시퀀스가 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함하는 것인 방법.
  39. 뉴클레오티드를 사용하여 정보를 저장하는 방법이며, 제1 정보의 포맷을 제1 비트 스트림으로 변환하는 단계, 제1 비트 시퀀스를 대응하는 올리고뉴클레오티드 시퀀스로 인코딩하는 단계, 시약 및 세척제를 복수의 반응 위치를 갖는 기판의 표면을 가로질러 펄싱 및 동기화하여 올리고뉴클레오티드 시퀀스를 합성하는 단계, 올리고뉴클레오티드 시퀀스를 시퀀싱하는 단계, 호모폴리머 런을 단일 뉴클레오티드로서 해석함으로써 올리고뉴클레오티드 시퀀스를 제2 비트 시퀀스로 디코딩하는 단계, 제2 비트 시퀀스를 제2 비트 스트림으로 어셈블링하는 단계 및 제2 비트 스트림을 제2 정보의 포맷으로 변환하는 단계를 포함하는, 뉴클레오티드를 사용하여 정보를 저장하는 방법.
  40. 제39항에 있어서, 올리고뉴클레오티드 시퀀스가 하나 이상의 또는 모든 데이터 블록 시퀀스, 비트 스트림에서 데이터 블록의 위치를 특정하는 어드레스 시퀀스, 또는 증폭 및 시퀀싱을 위한 올리고뉴클레오티드의 각각의 말단에의 플랭킹 공통 시퀀스를 포함하는 것인 방법.
KR1020187003839A 2015-07-13 2016-07-13 핵산을 사용하여 검색 가능한 정보를 저장하는 방법 KR20180030092A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562191982P 2015-07-13 2015-07-13
US62/191,982 2015-07-13
PCT/US2016/041981 WO2017011492A1 (en) 2015-07-13 2016-07-13 Methods for retrievable information storage using nucleic acids

Publications (1)

Publication Number Publication Date
KR20180030092A true KR20180030092A (ko) 2018-03-21

Family

ID=57757482

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187003839A KR20180030092A (ko) 2015-07-13 2016-07-13 핵산을 사용하여 검색 가능한 정보를 저장하는 방법

Country Status (6)

Country Link
US (3) US9928869B2 (ko)
EP (1) EP3322812B1 (ko)
JP (2) JP6920275B2 (ko)
KR (1) KR20180030092A (ko)
CN (1) CN108026557A (ko)
WO (1) WO2017011492A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200141927A (ko) * 2019-06-10 2020-12-21 서울대학교산학협력단 교차 수렴법을 이용한 정보가 저장된 폴리머의 제조방법

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105637097A (zh) 2013-08-05 2016-06-01 特韦斯特生物科学公司 从头合成的基因文库
WO2016126882A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
WO2016172377A1 (en) 2015-04-21 2016-10-27 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
US10844373B2 (en) 2015-09-18 2020-11-24 Twist Bioscience Corporation Oligonucleic acid variant libraries and synthesis thereof
CN108698012A (zh) 2015-09-22 2018-10-23 特韦斯特生物科学公司 用于核酸合成的柔性基底
CN115920796A (zh) 2015-12-01 2023-04-07 特韦斯特生物科学公司 功能化表面及其制备
EP3500672A4 (en) 2016-08-22 2020-05-20 Twist Bioscience Corporation NOVO SYNTHESIZED NUCLEIC ACID BANKS
KR102217487B1 (ko) * 2016-09-21 2021-02-23 트위스트 바이오사이언스 코포레이션 핵산 기반 데이터 저장
EP3529400B1 (en) 2016-10-24 2021-02-17 Geneinfosec, Inc. Concealing information present within nucleic acids
US10650312B2 (en) 2016-11-16 2020-05-12 Catalog Technologies, Inc. Nucleic acid-based data storage
KR102521152B1 (ko) 2016-11-16 2023-04-13 카탈로그 테크놀로지스, 인크. 핵산-기반 데이터 저장용 시스템
KR102514213B1 (ko) 2016-12-16 2023-03-27 트위스트 바이오사이언스 코포레이션 면역 시냅스의 변이체 라이브러리 및 그의 합성
SG11201907713WA (en) 2017-02-22 2019-09-27 Twist Bioscience Corp Nucleic acid based data storage
WO2018170169A1 (en) 2017-03-15 2018-09-20 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
WO2018217689A1 (en) * 2017-05-22 2018-11-29 The Charles Stark Draper Laboratory, Inc. Modified template-independent dna polymerase
EP3630350A4 (en) * 2017-05-31 2021-03-31 Molecular Assemblies, Inc. HOMOPOLYMIC ENCODED NUCLEIC ACID STORAGE
US11612873B2 (en) * 2017-05-31 2023-03-28 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
US11174512B2 (en) 2017-05-31 2021-11-16 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
SG11201912057RA (en) 2017-06-12 2020-01-30 Twist Bioscience Corp Methods for seamless nucleic acid assembly
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
CN109300508B (zh) * 2017-07-25 2020-08-11 南京金斯瑞生物科技有限公司 一种dna数据存储编码解码方法
WO2019040871A1 (en) * 2017-08-24 2019-02-28 Miller Julian DEVICE FOR ENCODING AND STORING INFORMATION USING ARTIFICIALLY EXPANDED ALPHABETS OF NUCLEIC ACIDS AND OTHER ANALOGOUS POLYMERS
WO2019051501A1 (en) 2017-09-11 2019-03-14 Twist Bioscience Corporation PROTEINS BINDING TO GPCR AND METHODS OF SYNTHESIS
WO2019079802A1 (en) * 2017-10-20 2019-04-25 President And Fellows Of Harvard College METHODS OF HIGH-RATE ENCODING AND DECODING OF INFORMATION STORED IN DNA
JP7066840B2 (ja) 2017-10-20 2022-05-13 ツイスト バイオサイエンス コーポレーション ポリヌクレオチド合成のための加熱されたナノウェル
EP3735459A4 (en) 2018-01-04 2021-10-06 Twist Bioscience Corporation DNA-BASED DIGITAL INFORMATION STORAGE
KR20200132921A (ko) 2018-03-16 2020-11-25 카탈로그 테크놀로지스, 인크. 핵산-기반 데이터를 저장하기 위한 화학적 방법들
EP3542903A1 (en) 2018-03-22 2019-09-25 IMEC vzw Memory writing
EP3547315B1 (en) * 2018-03-26 2021-01-27 IMEC vzw Method of storing data
KR102138864B1 (ko) 2018-04-11 2020-07-28 경희대학교 산학협력단 Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법
CA3100529A1 (en) 2018-05-16 2019-11-21 Catalog Technologies, Inc. Compositions and methods for nucleic acid-based data storage
WO2019222650A1 (en) 2018-05-17 2019-11-21 The Charles Stark Draper Laboratory, Inc. Apparatus for high density information storage in molecular chains
KR20210013128A (ko) 2018-05-18 2021-02-03 트위스트 바이오사이언스 코포레이션 핵산 하이브리드화를 위한 폴리뉴클레오타이드, 시약 및 방법
US20210332351A1 (en) * 2018-07-23 2021-10-28 Dna Script Massively Parallel Enzymatic Synthesis of Nucleic Acid Strands
CN110867213B (zh) * 2018-08-28 2023-10-20 华为技术有限公司 一种dna数据的存储方法和装置
US11017170B2 (en) * 2018-09-27 2021-05-25 At&T Intellectual Property I, L.P. Encoding and storing text using DNA sequences
JP2022508024A (ja) * 2018-09-28 2022-01-19 プレジデント アンド フェローズ オブ ハーバード カレッジ 分子の混合物を使用した情報の記憶
US11197827B2 (en) * 2018-10-31 2021-12-14 Microsoft Technology Licensing, Llc Polynucleotide encapsulation and preservation using self-assembling membranes
CA3122494A1 (en) 2018-12-13 2020-06-18 Dna Script Direct oligonucleotide synthesis on cells and biomolecules
US11249941B2 (en) * 2018-12-21 2022-02-15 Palo Alto Research Center Incorporated Exabyte-scale data storage using sequence-controlled polymers
CN113766930A (zh) 2019-02-26 2021-12-07 特韦斯特生物科学公司 Glp1受体的变异核酸文库
CA3131691A1 (en) 2019-02-26 2020-09-03 Twist Bioscience Corporation Variant nucleic acid libraries for antibody optimization
WO2020185896A1 (en) * 2019-03-11 2020-09-17 President And Fellows Of Harvard College Methods for processing and storing dna encoding formats of information
US11989216B2 (en) * 2019-04-09 2024-05-21 University Of Washington Systems and methods for providing similarity-based retrieval of information stored in DNA
JP2022531790A (ja) 2019-05-09 2022-07-11 カタログ テクノロジーズ, インコーポレイテッド Dnaに基づくデータ記憶における探索、算出、および索引付けのためのデータ構造および動作
GB201907460D0 (en) 2019-05-27 2019-07-10 Vib Vzw A method of storing information in pools of nucleic acid molecules
WO2020243074A1 (en) * 2019-05-31 2020-12-03 Illumina, Inc. Obtaining information from a biological sample in a flow cell
WO2020243073A1 (en) * 2019-05-31 2020-12-03 Illumina, Inc. Systems and methods for information storage and retrieval using flow cells
CN110427786A (zh) * 2019-05-31 2019-11-08 西藏自治区人民政府驻成都办事处医院 一种用dna作为文字信息高效存储介质的方法
US11332738B2 (en) 2019-06-21 2022-05-17 Twist Bioscience Corporation Barcode-based nucleic acid sequence assembly
CN112242978B (zh) * 2019-07-18 2023-04-07 京东科技控股股份有限公司 一种处理数据的方法和装置
US11773422B2 (en) 2019-08-16 2023-10-03 Microsoft Technology Licensing, Llc Regulation of polymerase using cofactor oxidation states
EP4022300A1 (en) 2019-08-27 2022-07-06 President and Fellows of Harvard College Modifying messages stored in mixtures of molecules using thin-layer chromatography
US11795450B2 (en) 2019-09-06 2023-10-24 Microsoft Technology Licensing, Llc Array-based enzymatic oligonucleotide synthesis
US11535842B2 (en) 2019-10-11 2022-12-27 Catalog Technologies, Inc. Nucleic acid security and authentication
CN111489791B (zh) * 2020-04-07 2023-05-26 中国科学院重庆绿色智能技术研究院 固态纳米孔高密度编码dna数字存储读取方法
WO2021231493A1 (en) 2020-05-11 2021-11-18 Catalog Technologies, Inc. Programs and functions in dna-based data storage
CN114058471A (zh) * 2020-07-29 2022-02-18 东南大学 负载了dna存储数据的数据存储装置、制备方法和读数方法
CN112288089B (zh) * 2020-09-28 2022-12-20 清华大学 阵列式核酸信息存储方法及装置
US20220136021A1 (en) * 2020-10-30 2022-05-05 Microsoft Technology Licensing, Llc Spatially addressable control of polymerase activity
JP2024522217A (ja) * 2021-06-14 2024-06-11 プリムローズ バイオ、インコーポレイテッド 酵素核酸合成のための組成物および方法
CA3227373A1 (en) * 2021-07-28 2023-02-02 Eric Kool Compositions, systems, and methods for nucleic acid data storage
TW202330915A (zh) * 2021-09-29 2023-08-01 呈堯 陳 用於無模板rna合成的核酸聚合酶變體、試劑套組及方法
WO2024026084A2 (en) * 2022-07-29 2024-02-01 Arizona Board Of Regents On Behalf Of The University Of Arizona Systems and methods for storage of digital information via biopolymers

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5917031A (en) 1996-04-19 1999-06-29 Taiko Pharmaceutical Co., Ltd. Method of synthesizing polydeoxyribonucleotides
ATE347617T1 (de) 1999-05-06 2006-12-15 Sinai School Medicine Steganographie auf dna basis
US7056661B2 (en) * 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
CN100485032C (zh) 2001-05-11 2009-05-06 松下电器产业株式会社 生物分子基底,使用它的检验和诊断方法及装置
WO2003025123A2 (en) * 2001-08-28 2003-03-27 Mount Sinai School Of Medecine Dna: a medium for long-term information storage specification
GB0201966D0 (en) 2002-01-29 2002-03-13 Smartwater Ltd Improvements in or relating to security products
US20030228611A1 (en) * 2002-05-01 2003-12-11 President And Fellows Of Harvard College Nucleic acid memory device
US20040060987A1 (en) 2002-05-07 2004-04-01 Green Larry R. Digital image analysis method for enhanced and optimized signals in fluorophore detection
US20040001371A1 (en) 2002-06-26 2004-01-01 The Arizona Board Of Regents On Behalf Of The University Of Arizona Information storage and retrieval device using macromolecules as storage media
US7158892B2 (en) * 2002-06-28 2007-01-02 International Business Machines Corporation Genomic messaging system
JP4102157B2 (ja) 2002-10-17 2008-06-18 正幸 園部 生体高分子を通信媒体もしくは記録媒体とした、情報通信方法、情報記録方法、エンコーダおよびデコーダ
US20050053968A1 (en) * 2003-03-31 2005-03-10 Council Of Scientific And Industrial Research Method for storing information in DNA
US7628096B2 (en) * 2004-03-25 2009-12-08 Teleflex Corporated Pedal mount assembly
WO2007002016A2 (en) 2005-06-20 2007-01-04 Johnson & Johnson Systems and methods for product authentication
US7874489B2 (en) 2005-06-20 2011-01-25 Authentiform Technologies, Llc Product authentication
US20070113137A1 (en) * 2005-10-22 2007-05-17 Ho Seung Ryu Error Correction in Binary-encoded DNA Using Linear Feedback Shift Registers
CA2691364C (en) * 2007-06-19 2020-06-16 Stratos Genomics, Inc. High throughput nucleic acid sequencing by expansion
DE102007057802B3 (de) 2007-11-30 2009-06-10 Geneart Ag Steganographische Einbettung von Informationen in kodierenden Genen
US20110003701A1 (en) 2008-02-27 2011-01-06 454 Life Sciences Corporation System and method for improved processing of nucleic acids for production of sequencable libraries
ES2698609T3 (es) * 2012-06-01 2019-02-05 European Molecular Biology Laboratory Almacenamiento de alta capacidad de información digital en ADN
AU2013292709B2 (en) * 2012-07-19 2017-04-13 President And Fellows Of Harvard College Methods of storing information using nucleic acids

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200141927A (ko) * 2019-06-10 2020-12-21 서울대학교산학협력단 교차 수렴법을 이용한 정보가 저장된 폴리머의 제조방법

Also Published As

Publication number Publication date
US9928869B2 (en) 2018-03-27
WO2017011492A1 (en) 2017-01-19
US20170337324A1 (en) 2017-11-23
US11532380B2 (en) 2022-12-20
EP3322812A4 (en) 2020-12-23
JP2021058216A (ja) 2021-04-15
JP2018527900A (ja) 2018-09-27
US20190121936A1 (en) 2019-04-25
JP6920275B2 (ja) 2021-08-18
EP3322812B1 (en) 2022-05-18
EP3322812A1 (en) 2018-05-23
CN108026557A (zh) 2018-05-11
US10289801B2 (en) 2019-05-14
US20170017436A1 (en) 2017-01-19

Similar Documents

Publication Publication Date Title
JP6920275B2 (ja) 核酸を用いた回収可能な情報記憶のための方法
US11900191B2 (en) Methods of storing information using nucleic acids
US20200239877A1 (en) Scaffolded nucleic acid polymer particles and methods of making and using
CN109312493B (zh) 酶促核酸合成
US10774366B2 (en) Method of making polynucleotides using closed-loop verification
EP3301104B1 (en) Scaffolded nucleic acid polymer particles and methods of making and using
CN108431223A (zh) 每液滴分辨率下的多个珠
US20210207186A1 (en) Method of Making Polynucleotides Using an Anion Toroidal Vortex
WO2017189794A1 (en) Method of secure communication via nucleotide polymers