KR102622275B1 - Dna 데이터 저장을 위한 방법들 및 시스템들 - Google Patents

Dna 데이터 저장을 위한 방법들 및 시스템들 Download PDF

Info

Publication number
KR102622275B1
KR102622275B1 KR1020197023020A KR20197023020A KR102622275B1 KR 102622275 B1 KR102622275 B1 KR 102622275B1 KR 1020197023020 A KR1020197023020 A KR 1020197023020A KR 20197023020 A KR20197023020 A KR 20197023020A KR 102622275 B1 KR102622275 B1 KR 102622275B1
Authority
KR
South Korea
Prior art keywords
dna
sensor
information
molecular
data
Prior art date
Application number
KR1020197023020A
Other languages
English (en)
Other versions
KR20190116297A (ko
Inventor
배리 엘 메리먼
팀 가이저
폴 몰라
Original Assignee
로스웰 바이오테크놀로지스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 로스웰 바이오테크놀로지스 인코포레이티드 filed Critical 로스웰 바이오테크놀로지스 인코포레이티드
Publication of KR20190116297A publication Critical patent/KR20190116297A/ko
Application granted granted Critical
Publication of KR102622275B1 publication Critical patent/KR102622275B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/40Encryption of genetic data
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/305Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F)
    • C07K14/31Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Micrococcaceae (F) from Staphylococcus (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/96Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/30Electrodes, e.g. test electrodes; Half-cells
    • G01N27/327Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
    • G01N27/3271Amperometric enzyme electrodes for analytes in body fluids, e.g. glucose in blood
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/30Electrodes, e.g. test electrodes; Half-cells
    • G01N27/327Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
    • G01N27/3275Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/30Electrodes, e.g. test electrodes; Half-cells
    • G01N27/327Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
    • G01N27/3275Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction
    • G01N27/3276Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction being a hybridisation with immobilised receptors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/403Cells and electrode assemblies
    • G01N27/414Ion-sensitive or chemical field-effect transistors, i.e. ISFETS or CHEMFETS
    • G01N27/4145Ion-sensitive or chemical field-effect transistors, i.e. ISFETS or CHEMFETS specially adapted for biomolecules, e.g. gate electrode with immobilised receptors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/607Detection means characterised by use of a special device being a sensor, e.g. electrode

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Electrochemistry (AREA)
  • Bioethics (AREA)
  • Hematology (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Urology & Nephrology (AREA)
  • Nanotechnology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

다양한 실시형태들에서, 정보 저장 시스템은 정보의 세트를 인코딩하는 뉴클레오티드 서열을 합성하는 기록 디바이스; 및 해석된 뉴클레오티드 서열을 정보의 세트로 디코딩함으로써 뉴클레오티드 서열을 해석하는 판독 디바이스를 포함하며, 판독 디바이스는 분자 전자소자 센서를 포함하며, 상기 센서는 이격된 전극들의 쌍 및 각각의 전극에 부착된 분자 복합체를 포함하여 분자 전자소자 회로를 형성하며, 상기 분자 복합체는 가교 분자 및 프로브 분자를 포함하며, 상기 분자 전자소자 센서는 뉴클레오티드 서열을 해석할 때, 분자 전자소자 센서의 측정가능한 전기 파라미터에서 식별가능한 신호들을 발생시킨다.

Description

DNA 데이터 저장을 위한 방법들 및 시스템들
관련 출원들에 대한 상호 참조
본 출원은 "Methods, Apparatus and Systems for DNA Data Storage" 란 발명의 명칭으로 2017년 1월 10일에 출원된 미국 가특허출원 번호 제 62/444,656호, 및 "Molecular Electronics Sensors for DNA Data Storage" 란 발명의 명칭으로 2017년 8월 18일에 출원된 미국 가특허출원 번호 제 62/547,692호에 대한 우선권 및 이의 이익을 주장하며, 이의 개시물들이 이들 전체로 본원에 원용된다.
분야
본 개시물은 일반적으로는, 전자 데이터 저장 및 취출, 좀더 구체적으로는, DNA 서열들을 판독하기 위한 분자 센서들 및 DNA 서열-2진 변환들을 위한 인코더/디코더 알고리즘들을 포함하는 DNA 정보 저장 및 취출 시스템에 관한 것이다.
20 세기 디지털 컴퓨팅의 출현은 많은 양의 디지털 또는 2진 데이터의 아카이브 (Archival) 저장에 대한 요구를 야기하였다. 아카이브 저장은 데이터를 긴 시간 기간들, 예컨대, 수 년, 수십 년 또는 그 이상 동안, 매우 낮은 비용으로, 그리고 데이터에 재액세스할 필요가 거의 없는 방법으로, 보관하기 위한 것이다. 아카이브 저장 (storage) 시스템은 무제한적인 양의 데이터를 매우 낮은 비용으로, 예컨대 긴 시간 기간들 동안 휴면 상태를 유지할 수 있는 물리적인 저장 매체를 통해서 유지하는 능력을 특징으로 할 수도 있지만, 이러한 시스템에서의 데이터 기록 및 복구는 상대적으로 느리거나 또는 아니면 고가의 프로세스들일 수 있다. 현재까지 개발된 아카이브 디지털 데이터 저장의 지배적인 형태들은 자기 테이프, 및, 최근에는, 컴팩트 광학 디스크 (CD) 를 포함한다. 그러나, 데이터 생산이 증가함에 따라, 휠씬 더 높은 밀도, 저 비용, 및 더 길게 지속되는 아카이브 디지털 데이터 저장 시스템들에 대한 요구가 있다.
생물학에서, 생물들의 게놈 DNA 가 디지털 정보 아카이브 저장의 형태로서 기능하는 것으로 관찰되었다. 수천 내지 수백만 년 동안 연장될 수도 있는, 종의 존재의 시간척도에서, 게놈 DNA 가 사실상 종을 정의하는 유전 생물학적 정보를 저장한다. 종의 생물학, 생식 및 생존에서 구현되는 복잡한 효소적, 생화학 프로세스들은 이 정보 아카이브를 기록, 판독 및 유지하는 수단을 제공한다. 이 관찰은 아마도 DNA 의 기본적인 정보 저장용량이 좀더 일반적인 형태들의 디지털 정보의 고밀도, 장기간 아카이브 저장에 대한 기초로서 활용될 수 있다는 아이디어에 동기를 부여하였다.
DNA 를 정보 저장에 있어서 매력적이게 하는 것은 정보의 분자 스케일 저장에 기인하는 극도로 높은 정보 밀도이다. 예를 들어 이론적으로, 대략 1 ZB (제타바이트) (~1021 바이트들) 로 추정되는, 현재까지 기록된 모든 인간-발생된 디지털 정보는 단지 10 그램의 질량을 가지는, 1022 개 미만의 DNA 염기들, 또는 1 몰의 DNA 염기들의 1/60 에 기록될 수 있다. 높은 데이터 밀도에 추가하여, DNA 는 또한 매우 안정한 분자로, 실질적인 손상 없이 수천 년 동안 쉽게 지속될 수 있으며, 영구 동토층에 냉동되거나 또는 호박 내에 둘러싸인 DNA 에서 자연적으로 관찰되는 바와 같이, 수만 년, 또는 심지어 수백만 년 동안, 휠씬 더 오래 잠재적으로 지속될 수 있다.
다양한 실시형태들에서, 정보 저장 시스템이 개시된다. 다양한 양태들에서, 본 시스템은 DNA 판독 디바이스, 디지털 데이터 인코딩/디코딩 알고리즘, 및 DNA 기록 디바이스를 포함하며, 이들 3개의 엘리먼트들의 특성들은 다양한 비용 메트릭들을 최소화하거나 또는 감소시키고 전체 시스템 성능을 증가시키도록 공동-최적화된다. 다양한 양태들에서, 공동-최적화는 DNA 판독 및 기록에서 에러들을 균형잡거나, 회피하거나, 또는 정정하는 것을 통해서, 시스템의 에러 레이트를 감소시키는 것을 포함할 수도 있다. 다른 경우, 공동-최적화는 예컨대, 더 느린 속도 DNA 서열 모티프들의 사용을 회피함으로써, 및/또는 시스템의 빠른 동작으로부터 발생하는 에러들을 보상하기 위해 에러 정정/회피를 이용함으로써, 시스템에서 DNA 판독 또는 기록 시간을 감소시키는 것을 포함할 수도 있다.
본 개시물의 다양한 실시형태들에서, DNA 데이터 판독기가 DNA 데이터 저장 시스템에서의 사용을 위해 제공된다. 특히, 단일 DNA 분자 내에서 적절하게 인코딩된 디지털 정보를 추출할 수 있는 분자 센서가 제공된다. 특정의 양태들에서, 이러한 센서들은 대규모 DNA 데이터 저장 시스템들에 요구되는 고처리량, 저-비용, 빠른 데이터 추출 능력을 제공할 수 있는 고-밀도 칩-기반 포맷일 수도 있다. 다양한 예들에서, DNA 분자들에 저장된 디지털 데이터를 판독하기 위한 센서는 개개의 인코딩된 DNA 분자들을 직접 프로세싱하므로, DNA 또는 클론 개체군들의 복제본들을 만드는 것과 같은, 복잡한 샘플 제조가 요구되지 않는다. 시스템의 다양한 양태들에서, 데이터는 DNA 를 복제하는 표준 방법들에 의해 복제될 수 없는 디지털 데이터 저장에 유익한 특징들로 합성되는 합성 DNA 또는 DNA 유사체들에 직접 저장된다.
DNA 데이터 저장 시스템의 다양한 실시형태들에서, 회수된 데이터는 천연 DNA 에 추가하여 매우 다양한 DNA 유사체들 또는 변형된 DNA 분자들에 저장될 수도 있으며, 이는 데이터 기록 시스템들 및 더욱 효과적인 데이터 저장 시스템들의 더 큰 선택들을 제공한다. 시스템의 다양한 양태들에서, DNA 분자에 인코딩된 정보를 추출하는데 요구되는 시간이 예컨대, 초 단위로 짧으며, 이는 근본적으로 데이터 복구에 짧은 소요 시간들을 가능하게 한다. 다양한 양태들에서, 시스템은 큰 범위의 DNA 분자 길이들에 걸쳐서, 예컨대, 10 개의 염기들 만큼 짧은 길이들로부터, 100 개의 염기들, 1000 개의 염기들, 및 수만 개 이상의 염기들까지, 잘 수행할 수도 있다. 이 능력은 DNA 기록/합성 기술의 선택에서 더 큰 유연성을 제공하며, 디지털 정보를 판독할 때에 길이 제약들을 만족시키기 위해 판독 전에 DNA 샘플들을 추가로 준비할 필요성을 제거한다.
본 개시물의 다양한 양태들에서, DNA 서열 판독을 위한 분자 센서는 고 스케일러블, 저비용, CMOS 칩 포맷으로 배치될 수 있어, 효율적인 대량 제조, 및 저비용 시스템들 및 기구들, 및 DNA 에 저장된 디지털 데이터를 판독할 때에 전체적으로 저렴한 비용들을 제공한다. 다양한 양태들에서, DNA 데이터로부터 엑사바이트-스케일 디지털 데이터를 판독하도록 요구되는 시스템들 및 디바이스들은, 국소적으로 현장 데이터 센터들에 실현가능하고 강건한 배치를 지원하고 고 스케일러블 클라우드-기반 아카이브 데이터 저장 서비스들을 지원하기 위해, 고도로 컴팩트하고 에너지 효율적이다.
다양한 양태들에서, 본 개시물에 따라서 DNA 에 저장된 데이터의 판독은 속도, 처리량 및 비용에 있어서, 자기 테이프 또는 광학 디스크들과 같은 종래의 아카이브 저장 포맷들로 아카이브된 데이터를 판독할 때의 성능을 초과한다. 본 DNA 데이터 저장 시스템의 이점은 실현가능한 엑사바이트 스케일 저장, 및 제타바이트 스케일 저장이 가능한 DNA 디지털 데이터 저장 시스템들에 대한 보완 기술을 제공한다는 점이다.
다양한 실시형태들에서, DNA 아카이브 저장 시스템의 DNA 기록 디바이스는 분자 전자소자 센서 디바이스들을 더 포함하는 CMOS 칩을 포함한다. 다른 경우, DNA 기록 디바이스는 픽셀 전극들 상의 전압/전류 지향 합성 부위들을 포함하는 CMOS 칩이다.
다양한 실시형태들에서, DNA 저장 아카이브 시스템에 적용되는 바와 같은, 분자 생물학 절차들을 통한 복제, 부가, 표적화된 결실, 표적화된 판독, 및 탐색과 같은, 아카이브 동작들의 양태들이 본원에서 개시된다.
다양한 실시형태들에서, 정보 저장 시스템은 정보의 세트를 인코딩하는 뉴클레오티드 서열을 합성하는 기록 디바이스; 및 해석된 뉴클레오티드 서열을 정보의 세트로 디코딩함으로써 뉴클레오티드 서열을 해석하는 판독 디바이스를 포함하며, 상기 판독 디바이스는 분자 전자소자 센서를 포함하며, 상기 센서는 이격된 전극들의 쌍 및 각각의 전극에 부착된 분자 복합체를 포함하여 분자 전자소자 회로를 형성하며, 상기 분자 복합체는 가교 분자 및 프로브 분자를 포함하며, 상기 분자 전자소자 센서는 뉴클레오티드 서열을 해석할 때, 분자 전자소자 센서의 측정가능한 전기 파라미터에서 식별가능한 신호들을 발생시킨다.
다양한 양태들에서, 정보의 세트는 2진 데이터를 포함한다. 특정의 양태들에서, 뉴클레오티드 서열은 DNA 서열을 포함한다. 예를 들어, 시스템은 DNA 분자들의 형태로 2진 데이터 저장을 제공하며, 취출이 필요할 때 아카이브된 데이터의 추출을 제공한다.
다양한 실시형태들에서, 시스템은 DNA 서열 내 에러 검출 방식들 또는 에러 정정 방식들 중 적어도 하나를 더 포함한다. 특정의 양태들에서, 에러 검출 방식들은 반복 코드, 패리티 비트들, 검사합들, 순환 중복 검사들, 암호 해시 함수들 및 해밍 코드들 중에서 선택되며, 에러 정정 방식들은 자동 반복 요청, 컨볼루셔널 코드들, 블록 코드들, 하이브리드 자동 반복 요청 및 Reed-Solomon 코드들 중에서 선택된다.
다양한 실시형태들에서, 시스템의 기록 디바이스는 DNA 합성을 위한 액추에이터 픽셀들의 CMOS 칩 기반 어레이를 포함하며, 액추에이터 픽셀들은 포스포라미다이트 또는 라이게이션 화학 반응들을 포함하는 DNA 합성 반응 내에서 전압/전류 또는 광-매개 디프로텍션 (deprotection) 을 유도한다.
다양한 실시형태들에서, 프로브 분자는 폴리머라제 효소를 포함하며, 센서의 측정가능한 전기 파라미터는 폴리머라제 효소의 효소 활성에 의해 조절된다. 폴리머라제 효소는 천연 폴리머라제 효소 또는 클레노브 (Klenow), Phi29, TAQ, BST, T7, 또는 역전사 효소 중에서 선택된 유전적으로 조작된 폴리머라제 효소를 포함할 수도 있다.
다양한 실시형태들에서, 시스템의 판독 디바이스는 버퍼 용액, 측정가능한 전기 파라미터를 측정하기 위한 동작 파라미터들, 및 폴리머라제에 의해 프로세싱될 때, 버퍼 용액 및 동작 파라미터들에 의해 제공되는 조건들에서 수행될 때 측정가능한 전기 파라미터에서 식별가능한 신호들을 발생시키는 DNA 주형 분자의 2개 이상의 서열 세그먼트들을 더 포함한다. 특정의 양태들에서, 버퍼 용액은 변형된 dNTP들을 포함한다. 다양한 양태들에서, 식별가능한 신호들을 발생시키는 DNA 주형 분자의 서열 세그먼트들은 상이한 DNA 염기들, 변형된 DNA 염기들, DNA 염기 유사체들, 다중 염기 서열들 또는 모티프들, 또는 DNA 염기들의 동종중합체 런들 중 임의의 하나 또는 조합을 포함한다.
다양한 실시형태들에서, 센서의 측정가능한 전기 파라미터는 이격된 전극들 사이에 그리고 분자 복합체를 통한 소스-드레인 전류를 포함한다. 분자 전자소자 센서는 측정가능한 전기 파라미터의 측정을 수행하는 픽셀 회로부를 지원하고 복수의 분자 전자소자 센서들을 더 포함하는 CMOS 센서 어레이 칩의 부분일 수도 있다.
다양한 실시형태들에서, 분자 전자소자 센서는 이격된 전극들에 인접한 게이트 전극을 더 포함한다. 다양한 양태들에서, 시스템 내 센서의 가교 분자는 2중 가닥 DNA 올리고머, 단백질 알파 나선, 그래핀 나노리본, 탄소 나노튜브, 항체, 또는 항체의 Fab 아암을 포함한다.
다양한 실시형태들에서, 뉴클레오티드 서열로 인코딩된 정보의 세트를 해석하는 방법이 개시된다. 본 방법은 정보의 세트와 관련하여, 분자 전자소자 센서의 측정가능한 전기 파라미터에서 식별가능한 신호들을 발생시킬 수 있는 분자 전자소자 센서로 뉴클레오티드 서열을 공급하는 단계; 식별가능한 신호들을 발생시키는 단계; 및 식별가능한 신호들을 정보의 세트로 변환하는 단계를 포함하며, 분자 전자소자 센서는 이격된 전극들의 쌍 및 각각의 전극에 부착된 분자 복합체를 포함하여 분자 전자소자 회로를 형성하며, 분자 복합체는 가교 분자 및 프로브 분자를 포함한다. 다양한 양태들에서, 정보의 세트는 2진 데이터를 포함한다. 특정의 양태들에서, 뉴클레오티드 서열은 DNA 서열을 포함한다.
다양한 실시형태들에서, 정보의 세트를 뉴클레오티드 서열로 인코딩하는 방법이 개시된다. 본 방법은 정보의 세트를 제공하는 단계; 인코딩 방식을 이용하여, 정보의 세트를, 분자 전자소자 센서의 측정가능한 전기 파라미터에서 식별가능한 신호들을 발생시킬 수 있는 하나 이상의 미리 결정된 뉴클레오티드들로 변환하는 단계; 및 하나 이상의 뉴클레오티드들을 뉴클레오티드 서열로 어셈블리하는 단계를 포함한다. 다양한 양태들에서, 식별가능한 신호들을 발생시킬 수 있는 하나 이상의 미리 결정된 뉴클레오티드들은 동일한 뉴클레오티드들의 변이체와 비교하여 2차 구조 형성에 저항성인 뉴클레오티드들을 포함한다.
다양한 실시형태들에서, 정보의 세트를 뉴클레오티드 서열로 변환하는 것은 (본원에서 "BES" 로서 표시된) 2진 인코딩 방식의 사용을 포함한다. 다양한 예들에서, BES 는 BES1, BES2, BES3, BES4, BES5 및 BES6 중 임의의 하나 이상을 포함한다.
다양한 실시형태들에서, 본 방법에서의 분자 전자소자 센서는 이격된 전극들의 쌍 및 각각의 전극에 부착된 분자 복합체를 포함하여 분자 전자소자 회로를 형성하며, 상기 분자 복합체는 가교 분자 및 프로브 분자를 포함하며, 분자 전자소자 센서는 뉴클레오티드 서열을 해석할 때, 분자 전자소자 센서의 측정가능한 전기 파라미터에서 식별가능한 신호들을 발생시킨다. 다양한 양태들에서, 본 방법에서의 정보의 세트는 2진 데이터를 포함한다.
도 1 은 DNA 정보 저장 시스템의 일 실시형태의 엘리먼트들을 예시한다.
도 2 는 1차 DNA 저장 시스템 정보 단계들 및 프로세스들의 일반적인 도면이다.
도 3 은 완전한 프로세스 대 DNA 를 판독 및 기록할 때에 에러들이 도입되는 프로세스를 개략적으로 나타냄으로써 에러 보상에 대한 필요성을 예시한다.
도 4 는 이상적인 에러 보상의 일 실시형태를 예시한다.
도 5 는 DNA 정보 저장 시스템에서 에러들의 비용에 민감한 (cost-conscious) 관리를 예시한다.
도 6 은 이상적인 에러 인식 시스템을 예시한다.
도 7 은 2-웨이 에러 보상의 일 예를 예시한다.
도 8 은 일반적인 비용 감소/최적화를 위한 2-웨이 비용 보상의 일 예를 예시한다.
도 9 는 비용-최적화된 인코딩 시스템의 예시적인 인자들을 예시한다.
도 10a 는 센서 분자 복합체와의 상호작용 분자들의 상호작용을 감지하는 분자 전자 감지 회로의 기본적인 컨셉을 예시한다.
도 10b 는 합성 DNA 분자들로 인코딩된 데이터에 대한 판독기로서 사용되는 폴리머라제-기반 분자 센서의 일 실시형태를 예시한다.
도 11 은 폴리머라제가 전극들에 걸쳐 있는 가교 분자에 컨쥬게이션된 (conjugated), 도 10b 의 폴리머라제-기반 센서의 일 실시형태를 예시한다.
도 12 는 폴리머라제가 전류 경로에 직접 컨쥬게이션되고 2개의 아암 분자들이 전극들에의 접속을 제공하는, 센서 회로의 일 실시형태를 예시한다.
도 13 은 폴리머라제가 아암 또는 가교 분자들 없이 전극들에 직접 컨쥬게이션되는, 센서의 일 실시형태를 예시한다.
도 14 는 하나의 특정의 폴리머라제 분자, 대장균 폴리머라제 I 의 클레노브 절편 (Klenow Fragment) 의 3D 상세 단백질 구조를 나타낸다.
도 15 는 대장균 폴리머라제 I 의 클레노브 절편이 전극들 사이의 간극에 걸쳐 있는 가교 분자에 컨쥬게이션된, 분자 전자 센서의 일 실시형태를 예시한다.
도 16 은 대장균 폴리머라제 I 의 클레노브 절편이 폴리머라제를 전극들에 링크하는 2개의 아암 분자들의 사용을 통해서 전류 경로에 직접 컨쥬게이션된, 분자 전자 센서의 일 실시형태를 예시한다.
도 17 은 대장균 폴리머라제 I 의 클레노브 절편이 아암 또는 가교 분자들 없이, 전류 경로에 직접, 그리고, 금속 전극들에 직접 컨쥬게이션된, 분자 전자 센서의 일 실시형태를 예시한다.
도 18 은 본 DNA 데이터 저장 시스템의 다양한 양태들에서의 DNA 판독기 디바이스로서 사용가능한 분자 센서의 일 실시형태를 예시한다.
도 19 는 CMOS 픽셀 어레이의 픽셀들 상으로 사후-프로세싱된 분자 센서를 포함하는 DNA 서열에 대한 분자 센서들 상에서의 전기 측정들을 위한 테스트 셋-업의 개략도를 예시한다.
도 20 은 센서들에서 가교 결합을 위한 금 금속 도트 콘택들을 갖는 전극들의 3개의 전자 현미경 (EM) 이미지들을 (증가하는 해상도에서) 개시한다.
도 21 은 도 18 의 센서로 DNA 혼입 신호들을 측정함으로써 얻은, 전류 (pA) 대 시간 (sec) 플롯들을 나타낸다.
도 22 는 폴리머라제가 주형 DNA 를 프로세싱함에 따라 각각의 염기로부터 향상된 신호들을 발생시켜, 변형된 dNTP들을 혼입시키는, 이 경우에는, 4개의 식별가능한 신호 특징들을 발생시키는 변형된 dNTP들의 사용을 예시한다.
도 23 은 2진 비트들 0/1 을 주형 DNA 로 인코딩하는 수단을 제공하는 혼입의 2개의 식별가능한 신호들을 발생시키기 위한 2개의 변형된 dNTP들, 여기서는, 변형된 dATP (A*) 및 dCTP (C*) 의 사용을 예시한다.
도 24 는 2진 비트들 0/1 을 주형 DNA 로 인코딩하는 수단을 제공하는 2개의 식별가능한 신호들을 발생시키기 위한 2개의 상이한 서열 모티프들, 여기서는, 동종중합체들 AA 및 CCC 의 사용을 예시한다. 이 경우, AA 및 CCC 는 정보 인코딩 및 복구에 사용될 수 있는 2개의 식별가능한 서열 모티프들을 제공한다. 따라서, 대신에, 식별가능한 서열 모티프들에 의존함으로써, DNA 서열의 단일 염기 해상도 없이도, 유용한 정보 인코딩 및 판독이 가능하다.
도 25 는 폴리 A 및 폴리 C 의 특정의 서열 모티프들이 0/1 2진 데이터를 인코딩하는데 사용가능한 식별가능한 신호들을 발생시키는 도 18 의 센서의 일 실시형태에 의해 발생된 실제 실험 데이터를 나타낸다.
도 26a 는 2진 비트들 0/1 을 주형 DNA 로 인코딩하는 방법을 제공하는 2개의 식별가능한 신호들을 발생시키기 위한 2개의 상이한 서열 모티프들, 즉, GATT 및 ACA 의 사용을 예시한다.
도 26b 는 3-상태 인코딩으로 디지털 데이터를 인코딩하는 수단을 제공하는 3개의 식별가능한 신호들을 발생시키기 위한 3개의 상이한 서열 모티프들, 여기서는, GATT, ACA 및 AGG 의 사용을 예시한다.
도 26c 는 표준 dNTP들을 가진 폴리머라제로 프로세싱될 때, 2 상태 인코딩, 예를 들어, 도 17 에서와 같은, BES4 로 디지털 데이터를 인코딩하는 수단을 제공하는 2 개의 식별가능한 신호들을 발생시키기 위한, 인코딩 DNA 가 염기 유사체들, 표준 변형된 염기들 X 및 Y로 합성되는 일 실시형태를 예시한다.
도 26d 는 표준 dNTP들을 가진 폴리머라제에 의해 프로세싱될 때, 디지털 데이터를 예를 들어, 도 29 에 방식 "BES5" 로 나타낸 바와 같은, 8 상태 인코딩으로 인코딩하는 수단을 제공하는, 8 개의 식별가능한 신호들을 발생시키기 위한, 인코딩 DNA 가 8 개의 상이한 염기들 및 염기 유사체들, 표준 A, C, G, T, 및 변형된 염기들 X, Y, Z, W 로 합성되는 일 실시형태를 예시한다.
도 27a 는 주형들이 센서의 폴리머라제와의 결합을 위해 적절히 프라이밍된 형태로 제시될 수 있도록 DNA 를 정보-인코딩할 때에 사용될 수 있는 상이한 프라이머 구성체들 (constructs) 을 개시한다.
도 27b 는 폴리머라제-기반 센서가 동일한 DNA 데이터 페이로드를 여러 번 조사가능하게 하는 DNA 주형 가닥 아키텍쳐들의 실시형태들을 개시한다.
도 28 은 물리적인 DNA 구조가 DNA 데이터 저장 분자의 논리 구조에 어떻게 관련되는지를 개략적으로 예시한다.
도 29 는 디지털 데이터와 인코딩 DNA 서열들 사이의 1차 변환들과 함께, 데이터 페이로드를 DNA 서열로서 나타내는 2진 인코딩 방식들 ("BES") 의 예들을 포함하여, 2진 데이터 페이로드를 DNA 서열로 인코딩하는데 사용가능한 2진 데이터 인코딩 방식들의 다양한 실시형태들을 개시한다.
도 30a 는 개별 DNA 판독기 센서들을 칩 상에 대규모 병렬 어레이들의 형태로 배치하는데 사용가능한 제조 스택의 일 실시형태를 예시한다.
도 30b 는 하이-레벨 CMOS 칩 픽셀 어레이의 일 실시형태 및 어레이 내 분자 전자소자 센서 회로 픽셀의 세부 사항들을 예시한다.
도 31 은 도 30 의 픽셀 회로에 대한 회로 개략도 및 시뮬레이트된 측정을 나타낸다.
도 32 는 주석이 달린 칩 설계 레이아웃 파일 및 비교를 위한 대응하는 완성된 칩의 광학 현미경 이미지의 일 실시형태를 예시한다.
도 33 은 폴리머라제 분자 복합체를 제자리에 갖는 나노 전극들 및 픽셀을 나타내는 확장된 해상도 SEM 이미지들의 삽입도들을 포함하여, 도 32 의 제조된 칩의 SEM 이미지들을 나타낸다.
도 34 는 DNA 데이터를 칩-기반 DNA 판독기 센서들로 판독하기 위한 완전한 시스템의 개략도를 나타낸다.
도 35 는 도 34 의 다수의 DNA 판독 시스템이 데이터 판독기 서버를 제공하기 위해 집성된 클라우드-기반 DNA 데이터 아카이브 저장 시스템의 일 실시형태의 개략도를 나타낸다.
도 36 은 DNA 를 프로세싱하는 동안 나노포어 이온 전류에서 식별가능한 신호 특징들을 발생시키는, 나노포어 이온 전류 센서로 폴리머라제가 복합체화되는 (complexed) DNA 데이터 판독기 센서의 대안적인 실시형태를 예시한다.
도 37 은 폴리머라제가 나노포어에 직접 컨쥬게이션되고 dNTP들이 혼입 동안 기공 이온 전류와 상호작용하여 이를 변경시키는 기들에 의해 변형되는, 나노포어 이온 전류 센서로 폴리머라제가 복합체화되는 DNA 데이터 판독기 센서의 일 실시형태를 나타낸다.
도 38 은 탄소 나노튜브를 통과하는 측정된 전류에서 식별가능한 신호 특징들을 발생시키는, 양 및 음의 전극들에 폴리머라제가 걸쳐 있는 탄소 나노튜브 분자 와이어로 복합체화되는 DNA 데이터 판독기 센서의 일 실시형태를 예시한다.
도 39 는 DNA 특징들에 대응하는 식별가능한 광학 신호들을 발생시키는, 단면으로 나타낸, 단일 폴리머라제로 복합체화된 제로 모드 도파관 센서의 일 실시형태를 예시한다.
다양한 실시형태들에서, DNA 분자들을 디지털 정보 저장의 범용 수단으로서 이용하는 DNA 데이터 저장 시스템이 개시된다. 특정의 양태들에서, 디지털 정보 저장을 위한 시스템은 DNA 판독 디바이스, 정보 인코더/디코더 알고리즘, 및 DNA 기록 디바이스를 포함한다. 다른 양태들에서, 이들 3개의 엘리먼트들 및 이들의 공동-최적화의 상호관계가 개시된다.
다양한 실시형태들에서, DNA 데이터 저장 시스템을 위한 데이터 판독기가 개시된다. 다양한 양태들에서, DNA 판독 디바이스는 단일 DNA 분자로부터 정보를 추출하는 센서를 포함한다. 센서는 칩-기반 포맷으로 배치될 수도 있다. 다양한 예들에서, 이러한 칩-기반 센서 디바이스를 지원하는 데이터 판독 시스템들이 개시된다.
정의들
본원에서 사용된 바와 같이, 용어 "DNA" 는 예컨대, 뉴클레오티드 포스포라미다이트 화학 반응, 라이게이션 화학 반응 또는 다른 합성 유기 방법론들에 의해 이루어지는 생물학적 DNA 분자들 및 합성 버전들 양자를 지칭한다. DNA 는, 본원에서 사용할 때, 또한 염기들, 당, 및/또는 백본에 대한 화학적 변형들을 포함하는 분자들, 예컨대, 핵산 생화학 분야의 당업자에게 공지된 분자들을 지칭한다. 이들은 메틸화된 염기들, 아데닐화된 염기들, 다른 후생 유전적으로 표시된 염기들, 및 비-표준 또는 범용 염기들, 예컨대 이노신 또는 3-니트로피롤, 또는 다른 뉴클레오티드 유사체들, 또는 리보염기들, 또는 염기성 부위들, 또는 손상된 부위들을 포함하지만, 이에 한정되지 않는다. DNA 는 또한 생화학적으로 유사한 RNA 분자 및 이의 합성 및 변형된 형태들을 포함하여, 펩티드 핵산들 (PNA), 로킹된 (locked) 핵산들 (LNA) 등과 같은, DNA 유사체들을 광범위하게 지칭한다. 모든 이들 생화학적으로 밀접하게 관련된 형태들은 본원에서 DNA 데이터 저장 시스템에 사용되는 데이터 저장 분자의 상황에서, 용어 DNA 의 사용에 의해 암시된다. 또, 본원에서 용어 DNA 는 단일 가닥 형태들, 이중 나선 또는 이중 가닥 형태들, 하이브리드 듀플렉스 형태들, 미스매치된 또는 비-표준 염기 쌍들을 포함하는 형태들, 트리플렉스 형태들와 같은 비-표준 나선형 형태들, 및 부분적으로 이중 가닥인 분자들, 예컨대 올리고 프라이머에 결합된 단일-가닥 DNA, 또는 헤어핀 2차 구조를 가진 분자를 포함한다. 일반적으로 본원에서 사용된 바와 같이, 용어 DNA 는 상보 가닥을 합성하는데 폴리머라제 효소에 대한 주형으로서 작용할 수 있는 단일-가닥 성분을 포함하는 분자를 지칭한다.
GATTACA 와 같은, 본원에서 기재된 바와 같은 DNA 서열들은 달리 명시되지 않는 한, 5' 내지 3' 배향의 DNA 를 지칭한다. 예를 들어, 본원에서 기재된 바와 같은 GATTACA 는 단일 가닥 DNA 분자 5'-G-A-T-T-A-C-A-3' 을 나타낸다. 일반적으로, 본원에서 사용되는 규약은 분자 생물학의 분야에서 사용되는 기록된 DNA 서열들에 대한 표준 규약을 따른다.
본원에서 사용된 바와 같이, 용어 "폴리머라제" 는 주형 DNA 또는 RNA 가닥에 대해, DNA 또는 DNA 유사체들, 또는 RNA 또는 RNA 유사체들을 혼입시킴으로써, 뉴클레오티드 사슬의 형성을 촉매하는 효소를 지칭한다. 용어 폴리머라제는 DNA 폴리머라제들의 야생-형 및 돌연변이 형태들, 예컨대 클레노브, 대장균 Pol I, Bst, Taq, Phi29, 및 T7, RNA 폴리머라제들의 야생-형 및 돌연변이 형태들, 예컨대 T7 및 RNA Pol I, 및 DNA 를 발생시키기 위해 RNA 주형 상에서 작동하는 야생-형 및 돌연변이체 역전사 효소들, 예컨대 AMV 및 MMLV 를 포함하지만 이에 한정되지 않는다.
본원에서 사용된 바와 같이, 용어 "dNTP" 는 DNA 의 생합성에 사용되는 표준적인, 자연 발생 뉴클레오시드 트리포스페이트들 (즉, dATP, dCTP, dGTP, 및 dTTP), 및 염기 변형들, 당 변형들, 또는 포스페이트 기 변형들, 예컨대 알파-티올 변형 또는 감마 포스페이트 변형들, 또는 테트라-, 펜타-, 헥사- 또는 더 긴 포스페이트 사슬 형태들, 또는 사슬 내 베타, 감마 또는 고차 포스페이트들과 같은, 포스페이트들 중 임의의 포스페이트에 컨쥬게이션된 추가적인 기들을 갖는 전술한 것들 중 임의의 것을 운반하는 것들을 포함하여, 이들의 천연 또는 합성 유사체들 또는 변형된 형태들 양자를 지칭한다. 일반적으로, 본원에서 사용할 때, "dNTP" 는 프라이머를 연장함에 따라 폴리머라제 효소에 의해 혼입될 수 있거나, 또는 이러한 효소의 활성 포켓에 진입하여 혼입을 위한 시험 후보로서 일시적으로 관여하는 임의의 뉴클레오시드 트리포스페이트 유사체 또는 변형된 형태를 지칭한다.
본원에서 사용된 바와 같이, "버퍼", "버퍼 용액" 및 "시약 용액" 은 폴리머라제 센서가 동작하고 공급된 주형들로부터 신호들을 발생시킬 수 있는 환경을 제공하는 용액을 지칭한다. 다양한 실시형태들에서, 용액은 수성이다. 버퍼, 버퍼 용액 또는 시약 용액은 염들, pH 버퍼들, 2 가 양이온들, 세척제들, 차단제들, 용매들, 주형 프라이머 올리고들, 폴리머라제와 복합체화하는 단백질들, 및 폴리머라제 기질들 (예컨대, dNTP들, dNTP들의 유사체들 또는 변형된 형태들, 및 DNA 기질들 또는 주형들) 과 같은 성분들을 포함할 수도 있다.
본원에서 사용된 바와 같이, "2진 데이터" 또는 "디지털 데이터" 는 표준 2진 코드, 또는 염기 2 {0,1} 알파벳을 이용하여 인코딩되는 데이터, 16진 염기 16 알파벳을 이용하여 인코딩되는 데이터, 염기 10 {0-9} 알파벳을 이용하여 인코딩되는 데이터, ASCII 문자들을 이용하여 인코딩되는 데이터, 또는 심볼들 또는 캐릭터들의 임의의 다른 별개의 알파벳을 이용하여 선형 인코딩 방식으로 인코딩되는 데이터를 지칭한다.
본원에서 사용된 바와 같이, "디지털 데이터 인코딩된 포맷" 은 DNA 에 정보를 인코딩하는데 사용되는 DNA 서열 특징들의 1차 변환, 또는 이러한 분류된 DNA 특징들의 등가 논리 스트링으로부터 유래된 일련의 2진 숫자들, 또는 다른 심볼 숫자들 또는 캐릭터들을 지칭한다. 일부 실시형태들에서, DNA 로서 아카이브될 정보는 2진으로 변환될 수도 있거나, 또는 처음에 2진 데이터로서 존재한 후, 이 데이터는 에러 정정 및 어셈블리 정보와 함께, 식별가능한 DNA 서열 특징들에 의해 제공되는 코드로 직접 변환되는 포맷으로 추가로 인코딩될 수도 있다. 이 후자 연관은 정보의 1차 인코딩 포맷이다. 어셈블리 및 에러 정정 절차들의 적용은 다시 소스 정보를 복구하는 것으로의 추가적인, 2차 레벨의 디코딩이다.
본원에서 사용된 바와 같이, "식별가능한 DNA 서열 특징들" 은 센서 폴리머라제에 의해 프로세싱될 때, 정보를 인코딩하는데 사용될 수 있는 별개의 신호들을 발생시키는 이들 데이터-인코딩 DNA 분자의 특징들을 의미한다. 이러한 특징들은 예를 들어, 상이한 염기들, 상이한 변형된 염기들 또는 염기 유사체들, 상이한 서열들 또는 서열 모티프들, 또는 센서 폴리머라제에 의해 프로세싱될 때 식별가능한 신호들을 발생시키는 특징들을 달성하기 위한, 이들의 조합들일 수도 있다.
본원에서 사용된 바와 같이, "DNA 서열 모티프" 는 이러한 문자 서열들의 특정의 세트 중 임의의 멤버를 나타내는 특정의 문자 서열 또는 패턴 양자를 지칭한다. 예를 들어, 다음은 특정의 문자 서열들: GATTACA, TAC, 또는 C 인 서열 모티프들이다. 이에 반해, 다음은 패턴들인 시퀀스스 모티프들이다: G[A/T]A 는 서열들 {GAA, GTA} 의 명시적인 세트를 나타내는 패턴이고, G[2-5] 는 서열들 {GG, GGG, GGGG, GGGGG} 의 세트를 지칭하는 패턴이다. 모티프의 명백한 설명에서의 서열들의 명시적인 세트, 이들과 같은 잠시 이러한 패턴 속기 표기법들은 이러한 세트들을 기술하는 일반적인 컴팩트한 방법들이다. 이들과 같은 모티프 서열들은 천연 DNA 염기들을 기술할 수도 있거나, 또는 다양한 상황들에서, 변형된 염기들을 기술할 수도 있다. 다양한 상황들에서, 모티프 서열들은 주형 DNA 분자의 서열을 기술할 수도 있고/있거나, 주형을 보완하는 분자 상의 서열을 기술할 수도 있다.
본원에서 사용된 바와 같이, "식별가능한 신호들을 갖는 서열 모티프들" 은, 패턴들의 경우들에서, 명시적인 서열들의 제 1 세트를 나타내는 제 1 모티프 패턴이 존재하고 상기 서열들 중 임의의 서열이 제 1 신호를 발생하고, 그리고 명시적인 서열들의 제 2 세트를 나타내는 제 2 모티프 패턴이 존재하고 상기 서열들 중 임의의 서열이 제 2 신호를 발생하고, 제 1 신호가 제 2 신호와 식별가능하다는 것을 의미한다. 예를 들어, 모티프 G[A/T]A 및 모티프 G[3-5] 가 식별가능한 신호들을 발생하면, 세트 {GAA, GTA} 중 임의의 것이 제 1 신호를 발생시키고 세트 {GGG,GGGG,GGGGG} 중 임의의 것이 제 1 신호와 식별가능한 제 2 신호를 발생시킨다는 것을 의미한다.
본원에서 사용된 바와 같이, "식별가능한 신호들" 은 차이가 특정의 용도를 위해 레버리지될 수 있도록, 센서로부터의 다른 전기 신호와, 정량적으로 (예컨대, 피크 진폭, 신호 지속기간 등) 또는 정성적으로 (예컨대, 피크 형상 등) 뚜렷하게 상이한, 센서로부터의 하나의 전기 신호를 지칭한다. 비한정적인 예에서, 동작 분자 센서로부터의 2개의 전류 피크들 대 시간은 이들의 진폭들에서 약 1 x 10-10 Amp 이상의 차이가 있으면 식별가능하다. 이 차이는 2개의 피크들을 2개의 별개의 2진 비트 판독치들, 예컨대, 0 및 1 로서 이용하기에 충분하다. 일부의 경우, 제 1 피크는 양의 진폭, 예컨대, 약 1 x 10-10 Amp 내지 약 20 x 10-10 Amp 진폭을 가질 수도 있으며, 반면 제 2 피크는 음의 진폭, 예컨대, 약 0 Amp 내지 약 -5 x 10-10 Amp 진폭을 가질 수도 있어, 이들 피크들을 뚜렷하게 상이하게 만들며 상이한 2진 비트들, 즉, 0 또는 1 을 인코딩하는데 사용가능하게 만든다.
본원에서 사용된 바와 같이, "데이터-인코딩 DNA 분자", 또는 "DNA 데이터 인코딩 분자" 는 DNA 로 데이터를 인코딩하기 위해 합성된 분자, 또는 이러한 분자들로부터 유래된 복제본들 또는 다른 DNA 를 지칭한다.
본원에서 사용된 바와 같이, "DNA 로부터의 데이터를 판독하는 것" 은 정보를 DNA 분자로 인코딩하는데 사용된 DNA 분자 특징들에 대응하는 식별가능한 신호들을 측정하는 임의의 방법을 지칭한다.
본원에서 사용된 바와 같이, 전극들은 전극들의 개별 쌍에서 2개의 전극들 사이에 나노 규모-사이즈의 간극을 갖는 나노-규모 전도성 금속 엘리먼트들을 지칭하며, 일부 실시형태들에서, 매립된 또는 "후면" 게이트, 또는 측면 게이트일 수도 있는 간극 영역에 용량성으로 커플링된 게이트 전극을 포함한다. 전극들은 일부 상황들에서 "소스" 및 "드레인" 전극들로서, 또는 "양의" 및 "음의" 전극들로서 지칭될 수도 있으며, 이러한 용어들은 전자공학에서 일반적이다. 나노-스케일 전극들은 전극들의 쌍에서의 각각의 전극 사이의 간극 폭을 1 nm-100 nm 범위로 가질 것이며, 다른 중요 치수들, 예컨대 폭 및 높이 및 길이를, 또한 이 범위로 가질 것이다. 이러한 나노-전극들은 예를 들어, 금속들, 또는 반도체들, 또는 이러한 물질들의 조합과 같은, 전도율 및 기계적 안정성을 제공하는 다양한 물질들을 포함할 수도 있다. 전극들용 금속들의 예들은 티타늄 및 크롬을 포함한다.
저장된 데이터를 아카이브하고 이후 액세스하는데 사용가능한, 본 개시물에 따른 DNA 데이터 저장 시스템의 일반적인 양태들이 다양한 도면들을 참조하여 개시된다.
도 1 은 본 개시물에 따른 DNA 정보 저장 시스템의 일 실시형태를 예시한다. 이 예는 저장 동안 DNA 물질을 처리하고 유지하는데 사용되고 저장된 아카이브 상에서의 동작들, 예컨대 복제를 실행하는 물리 시스템을 포함하는 DNA 저장 시스템의 주요 엘리먼트들을 나타낸다. 외부 컴퓨터는 시스템의 하이 레벨 제어, 저장을 위한 정보 공급, 및 추출된 정보 수신을 제공한다. 정보는 DNA 서열들로서 인코딩되어, 합성되고, 저장되고, 그후 판독되고, 디코딩되고 출력된다. 게다가, 이러한 시스템은 DNA 아카이브 물질 샘플들의 물리적인 I/O 도 또한 가능하다.
도 2 는 (도 2 에 화살표들로 도시된) 하나의 형태로부터 다른 형태로 전환하는 1차 동작들과 함께, (도 2 에 박스들로서 도시된) 전체 시스템에 존재하는 정보의 주요 단계들을 포함하는, 1차 DNA 저장 시스템 정보 단계들 및 프로세스들을 예시한다.
본 개시물의 다양한 양태들에서, DNA 정보 저장 시스템은 (a) 인코더/디코더; DNA 기록 디바이스; 및 DNA 판독 디바이스를 포함한다.
인코더/디코더: 다양한 양태들에서, 인코더/디코더는 2개의 기능들을 갖는 알고리즘을 포함하며: 인코더 부분은 주어진 디지털/2진 정보를 DNA 기록기에의 입력들인 특정 DNA 서열들의 세트로 변환한다. 디코더 부분은 DNA 판독기에 의해 제공되는 유형의 주어진 DNA 서열들의 세트를, 디지털 정보로 다시 변환한다.
DNA 기록 디바이스: 다양한 양태들에서, DNA 기록 디바이스는 주어진 DNA 서열들의 세트를 취하여 이들 서열들로부터 DNA 분자들을 합성하는 임의의 디바이스를 포함한다 (예컨대: Kosuri 및 Church, "Large Scale de novo DNA synthesis: technologies and applications. Nature Methods, 11: 499-509, 2014 참조). DNA 분자들을 합성하는 방법들 및 디바이스들의 비한정적인 예들은 Agilent Technologies 및 Twist BioScience 에 의해 제공되는 상업적 기술을 포함한다. 각각의 원하는 서열에 대해, 그 서열을 나타내는 다수의 DNA 분자들이 발생된다. 발생된 다수의 분자들은 각각의 원하는 서열에 대해 10, 100, 1000, 수백만 또는 심지어 수십억 개의 DNA 분자들의 복제본들의 범위들에 있을 수 있다. 모든 원하는 서열들을 나타내는 이들 복제본들 모두는 분자들의 하나의 마스터 풀로 풀링될 수도 있다. 이러한 DNA 기록 시스템들은 전형적으로 기록이 완벽하지 않으며, 만약 N 개의 분자들이 주어진 입력 서열을 나타내도록 합성되면, 이들의 모두가 원하는 서열을 실제로 실현할 수는 없다. 예를 들어, 이들은 잘못된 결실들, 삽입들, 또는 부정확한 또는 물리적으로 손상된 염기들을 포함할 수도 있다.
DNA 판독 디바이스: 다양한 양태들에서, DNA 판독 디바이스는 DNA 분자들의 풀을 취하여 이 풀로부터 샘플링되거나 또는 선택된 분자들에 대해 측정된 DNA 서열들의 세트를 발생시키는 디바이스이다. 이러한 판독기들은 실제로 단지 시스템에 도입된 DNA 분자들의 작은 부분만을 조사하므로, 단지 작은 분획만이 실제 판독 시도를 경험할 것이다. 또한, 이러한 DNA 판독 디바이스들은, 전형적으로, 프로세싱되는 주어진 DNA 분자가 전체 정확도로 판독되지 않을 수도 있으며, 따라서 판독에 존재하는 에러들이 있을 수도 있다. 그 결과, 또한, 측정된 서열 출력들이 다양한 형태들의 신뢰도 추정들 및 누락된 데이터 표시자들을 포함하는 것이 전형적이다. 예를 들어, 측정 서열에서의 각각의 문자에 대해, 다른 DNA 문자 옵션들에 비해 신뢰 확률 또는 정확한 확률들이 있을 수도 있으며, 그리고 문자의 신원 (identity) 이 알려져 있지 않다는 것을 표시하는 누락된 데이터 표시자들이 있을 수도 있거나, 또는 판독의 부분을 나타내는 상이한 확률들을 갖는 선택적인 서열 후보자들의 세트가 있을 수도 있다.
개시한 바와 같은, 본 개시물에 따른 DNA 데이터 저장 시스템의 3개의 주요 엘리먼트들은 아래에서 추가로 상세하게 설명되는 바와 같이, 특정의 역할들 및 상호관계들을 갖는다.
주요 엘리먼트들 간 관계, 및 인코더/디코더의 주요 역할:
정보 인코더/디코더는 정보 저장/취출 프로세스의 비용의 일부 전체 측정치를 최소화하거나 또는 감소시키기 위해, DNA 기록기 및 DNA 판독기 디바이스들의 특성들에 기초하여 선택된다. 시스템 비용의 하나의 주요 구성요소는 취출된 정보에서의 전체 에러 레이트이다. 에러들 및 비용들이 도 3 내지 도 9 에 도식적으로 예시된다.
일반적으로, DNA 기록기 디바이스는 기록 에러들을 도입할 수 있으며, DNA 판독 디바이스는 판독 에러들을 발생시킬 수 있으며, 따라서, 시스템에서 정보를 저장한 후 이후 이를 취출하는 프로세스는 잠재적으로 취출된 정보에서 에러 레이트를 초래한다. 도 3 에 도식적으로 예시된 바와 같이, 시스템에서의 에러들을 보상할 필요가 있다. 도 3 은 정보를 인코딩한 후 정보의 디코딩은 주로 DNA 의 판독 및 기록에서의 물리화학적 에러들로 인해, 달리 일반적으로 원래 정보를 반환하지 않을 것이기 때문에, 에러 정정, 에러 회피, 또는 일부 유형의 에러 보상에 대한 필요성을 예시한다. 인코더/디코더 알고리즘은 DNA 판독기 및 DNA 기록기의 에러 특성들 및 경향들에 기초하여, 이 에러 레이트를 최소화하거나 또는 감소시키도록 선택될 수 있다. 이들 실시형태들이 도 3 내지 도 6 에 예시된다.
도 4 는 이상적인 에러 보상의 일 실시형태를 예시한다. 이상적인 에러 보상은 합성기 및 서열분석기 기술들의 에러 모드들을 인식하는 에러 보상 방식이다. 에러들은 에러 발생을 회피하는 것을 통해서, 그리고 DNA 판독 및 DNA 기록 시스템들 양자의 에러 모드들의 지식을 이용한 에러들의 검출 및 정정의 조합을 통해서, 그리고 또한 판독 및 기록 시스템들에 의해 발생된 기록된 및 판독된 DNA 서열들에 대한 경험적 품질 스코어들에 반영된, 관측된 데이터 불확정성에 기초하여, 감소되고/되거나 보상된다.
도 5 는 DNA 정보 저장 시스템에서의 에러들의 비용에 민감한 관리를 예시한다. 일반적으로, 특정의 DNA 서열들은 예를 들어, 에러 레이트, 요구된 시간, 시약 소비, 금융 비용, 등에 관련된 비용 함수에 기초하여, 본질적으로 더 큰 비용을 가질 수 있다. 본 개시물의 다양한 양태들에서, 판독 및 기록 기술들과 연관된 비용들이 고려되고, 일반적으로 비용들을 최소화하는 인코딩/디코딩 방식을 이용함으로써 (예컨대, 높은 비용, 에러 취약 (error prone), 느린 합성 또는 DNA 모티프들을 느리게 판독하는 것을 회피함으로써) 감소되거나 또는 최적화된다.
다양한 실시형태들에서, 뉴클레오티드들은 분자들을 형성하는 기록 프로세스에서의 이들의 합성의 용이성, 합성된 분자들에서 2차 구조를 형성하는 경향의 감소, 및/또는 데이터 디코딩 프로세스 동안 판독의 용이성에 기초하여, 뉴클레오티드 서열들에의 혼입을 위해 우선적으로 선택될 수 있다. 다양한 양태들에서, 불량 기록 모티프들 및 불량 판독 모티프들이 뉴클레오티드 서열들에의 혼입을 위한 뉴클레오티드들의 선택에서 회피되며, 그 뉴클레오티드 서열이 인코딩된 정보를 디코딩하기 위해 판독될 때 상호 식별가능한 신호들을 발생시키는 뉴클레오티드 서열에서의 세그먼트들을 혼입시키는 것에 초점을 둔다. 예를 들어, 뉴클레오티드 서열을 판독할 때에, A 및 T 가 상호 식별가능하며, C 및 G 가 상호 식별가능하며, A, C 및 G 가 상호 식별가능하며, AAA 및 TT 가 상호 식별가능하며, A, GG 및 ATA 가 상호 식별가능하고, C, G, AAA, TTTT, GTGTG 가 상호 식별가능하다. 이들, 및 다수의 다른 세트들의 뉴클레오티드 및 뉴클레오티드 세그먼트들은 판독기에 상호 식별가능한 신호들을 제공하며, 따라서, 정보의 세트를 뉴클레오티드 서열로 인코딩할 때 뉴클레오티드 서열에의 혼입을 위해 고려될 수 있다.
추가적으로, 기록하기 어려운 뉴클레오티드 세그먼트들이 존재하며, 따라서 정보의 세트를 뉴클레오티드 서열로 인코딩할 때 회피되어야 한다. 다양한 실시형태들에서, 뉴클레오티드 서열로의 정보의 세트의 인코딩은 정보의 세트를 판독하기 어렵고 기록하기 어려운 특징들을 회피하는 방법으로 정의하기 위해 에러 정정 인코딩과 함께, 2진 0/1, 3진 (trinary) 0/1/2 또는 4진 (quad) 0/1/2/3 코드, 등에 대응할 수도 있는 바와 같은, 인코딩 심볼들로서의 나머지 식별가능한 특징 세트들 중 하나의 사용을 포함한다. 이러한 방법으로, 정보 저장 시스템의 전체 성능이 향상된다.
다양한 실시형태들에서, 저장 정보를 뉴클레오티드 서열로 저장하고 뉴클레오티드 서열에서 저장된 정보를 취출하는 방법들이 개시된다. 다양한 양태들에서, 본 방법은 (a) 주어진 염기들의 서열에 대응하는 DNA 분자들을 합성하는 것과 같은, 뉴클레오티드 서열들을 합성하는 시스템을 포함한다. 설명한 바와 같이, 주어진 염기 서열은 2진 정보와 같은 주어진 정보의 세트를 인코딩하는 뉴클레오티드들 및 뉴클레오티드 세그먼트들의 사려깊은 선택을 통해서 결정될 수도 있다. 다양한 양태들에서, 본 방법은 (b) 뉴클레오티드 서열로부터, 예컨대 DNA 가닥으로부터 신호들을 판독하는 시스템을 포함하며, 뉴클레오티드 서열은 이러한 세트 {X, Y, Z...} 에 의해, 분자 내에서 발생하는 서열 세그먼트들 X, Y, Z... 의 각각이 판독기에 의해 프로세싱될 때 식별가능한 신호들을 발생시키도록, 식별가능한 서열 세그먼트들의 컬렉션을 포함한다. 다른 예들에서, 본 방법은 (c) 합성 프로세스에서 부정확하게 기록되거나, 합성 프로세스에서 너무 느리게 혼입되거나, 합성된 분자에서 2차 구조를 발생시키거나, 또는 합성 프로세스에서 사용하기에 너무 비싼 이들의 경향에 기초하여, 바람직하지 않은 뉴클레오티드들 및 뉴클레오티드 세그먼트들을 식별하는 단계를 포함한다. 다양한 실시형태들에서, 본 방법은 (d) 정보가 분자로부터 디코딩될 때 부정확하게 판독되거나, 정보가 디코딩될 때 너무 느리게 판독되는 등의 이들의 경향에 기초하여, 바람직하지 않은 뉴클레오티드 및 뉴클레오티드 세그먼트들을 식별하는 단계를 포함한다. 다양한 양태들에서, 본 방법은 에러 검출 및/또는 정정 코딩 방식에 의존하여, 그리고, 상기 (b) 의 특징 세트들 중 하나가 인코딩의 심볼 알파벳으로서 사용되고 이 특징 세트가 상기 (c) 및 (d) 에서 묘사된 바람직하지 않은 특징들 중 임의의 특징을 이용하지 않기로 선택되는 인코딩 방법을 이용하여, 정보의 세트를 DNA 분자로 인코딩하는 단계; 및 예를 들어, DNA 분자로 이전에 인코딩된 정보를 취출하기 위해 상기 (b) 의 판독 방법을 이용하는 단계를 포함하는 합성 방법을 이용하는 단계를 포함한다.
다양한 실시형태들에서, DNA 분자와 같은 뉴클레오티드 서열에서의 식별가능한 특징들은 개개의 염기들을 포함할 수도 있다. 불량 판독 특징들은 개개의 특정의 염기들을 포함할 수도 있다. 불량 기록 특징들은 또한 개개의 특정의 염기들을 포함할 수도 있으며, 인코딩 방식은 입력 정보 스트링 상에 에러 정정 2진 코드를 이용하는 것에 대응하며, 2진 심볼들 0 및 1 이 x 및 y 로 변환되어 DNA 인코딩을 달성한다.
도 6 은 DNA 합성기 및 서열분석기 기술들에 고유한 에러 모드들을 인식하는 에러 보상 방식을 포함하는 이상적인 에러 인식 시스템을 예시한다.
도 7 은 2-웨이 에러 보상의 일 예를 예시한다. 도면의 좌측 부분은 이러한 구체적인 예에서 발생된 에러들을 나타내고, 도면의 우측 부분은 문제가 있는 DNA 서열 모티프들, 즉, T 및 C 염기들을 갖지 않는 입력 서열을 발생시키는 에러-보상 인코딩/디코딩 방식에 의한 이들 에러들의 회피를 나타낸다. 도 7 의 이 예시된 예에서, DNA 기록기는 종종 T 를 삭제하는 경향을 가지며, DNA 판독기는 종종 C 를 T 로서 판독하는 경향을 갖는다. 이 예에서, T 및 C 에 의한 인코딩의 사용은 인입하는 인코딩된 데이터 서열 GATTACA 가 GATATA 로서 판독되는 것과 같은 에러들을 초래할 수 있으며, 여기서, 하나의 T 가 기록에서 삭제되었으며, C T 판독 에러가 발생하였다). 그러나, 데이터의 이상적인 인코딩이 "T" 또는 "C" 를 갖지 않으면, 예컨대, 모든 2진 0/1 데이터를 A=0, G=1 의 2진 DNA 코드로 간단히 그리고 직접 인코딩하는 경우에, 데이터의 저장 및 취출에서 에러들이 발생되지 않을 것이다.
따라서, 일반적으로, 에러들을 감소시키기 위해, 디지털 데이터 인코딩/디코딩 알고리즘은 DNA 기록기 및 DNA 판독기의 실제 에러 모드들이 주어지면, 에러 생성을 최소화하기 위해 선택된 에러 검출 및 에러 정정 코드들을 포함할 수 있다. 이들 코드들은 에러 모드들의 사전 지식, 즉, 기록기 및 판독기의 특정의 에러들에 대한 경향의 이점으로 고안될 수 있다.
다양한 실시형태들에서, 에러 정정 코드들은 단일 뉴클레오티드 서열 내에 상주한다. 예를 들어, 2진 데이터의 하나의 세그먼트는 DNA 측에서 에러 정정 및/또는 검출 방식들을 사용하여 하나의 DNA 서열로 인코딩된다. 이러한 방식들은 또한 중복 저장을 통한 에러 정정과 유사한, 정보의 다른 레벨의 중복 인코딩을 제공하기 위해, 2진 데이터의 하나의 세그먼트를 다수의 DNA 서열들로 인코딩하는 것을 수반할 수도 있다. 에러 검출 방식들은 반복 코드, 패리티 비트들, 검사합들, 순환 중복 검사들, 암호 해시 함수들, 및 에러 정정 코드들, 예컨대 해밍 코드들을 포함하지만, 이에 한정되지 않는다. 에러 정정 방식들은 자동 반복 요청, 에러 정정 코드, 예컨대 컨볼루셔널 코드들 및 블록 코드들, 하이브리드 자동 반복 요청, 및 Reed-Solomon 코드들을 포함하지만, 이에 한정되지 않는다.
다양한 실시형태들에서, 인입하는 디지털 데이터가 길이 N 의 2진 단어들로서 고려되는, 최적 또는 고도로 효율적인 에러 정정 인코딩을 고안하는 방법은, 2진 단어들보다 더 많은 가능한 DNA 단어들이 있도록 (즉, 4M >> 2N) 길이 M 의 모든 DNA 단어들의 공간을 제공하는 단계; 및 이들 DNA 코드 워드들의 각각이 주어진 단어에 대한 가능성있는 DNA 기록 에러들의 세트로 확장되고 그후 그 세트가 가능성있는 판독 에러들 단어들의 세트에 의해 추가로 확장될 때, 이들 결과적인 2N 의 DNA 단어들의 세트들이 높은 확률로 분리되어 유지하도록, 2N 의 2진 정보 단어들을 인코딩하기 위한 코드 워드들로서 사용할 2N 의 DNA 단어들의 서브세트를 선택하는 단계를 포함한다. 이러한 경우, 판독기에 의해 판독되는 임의의 단어는 매우 높은 확률로 이상적인 인코딩된 DNA 단어에 적절히 연관될 수 있다. 이 방법은 정보의 에러 정정과 에러 회피 인코딩의 조합을 구성한다. 게다가, 디코딩 알고리즘은 또한 인코딩 방식에 대한 최대 우도/최고 신뢰 디코딩을 선택하기 위해, 판독기에 의해 공급되는 신뢰 또는 가능성 (odds) 정보를 자연스럽게 이용할 것이다.
전체 DNA 데이터 저장 시스템 비용들을 최적화하는 다른 주요 양태는 데이터를 기록하는데 요구되는 시간이다. 예를 들어, 다수의 실시형태들에서의 임계 시간 비용은 데이터를 기록하는 시간 비용일 수도 있다. 다양한 실시형태들에서, 특정의 느린 합성 (slow-to-synthesize) 염기들 및 서열 모티프들의 기록이 전체 기록 시간을 단축하기 위해 회피된다. 다른 양태들에서, 예컨대, 더 높은 전체 기록 에러 레이트를 수용하면서, 다수의 병렬 합성 반응들에서 하나의 염기를 기록하는 일부 주기적 프로세스의 각각의 화학 사이클에 소요되는 시간을 감소시킴으로써, 기록이 더 빨라진다.
이와 유사하게, 판독을 위해, 더 빠른 판독 프로세스가 채용될 수도 있으며, 상충관계는 더 높은 판독 에러들의 레이트이다. 다양한 예들에서, 동종중합체 런들과 같이 빠른 레이트로 판독하기 어려운 인코딩에서 특정의 유형들의 서열들의 도입을 회피함으로써, 더 빠른 판독 프로세스가 에러의 증가 없이 채용된다. 어느 경우에나, 정보 인코딩/디코딩 알고리즘은 더 빠른 판독/기록을 허용하지만 중복 에러 모드들이 회피되거나, 또는 인코딩/디코딩 내에서 처리되는, 느린 판독/기록 서열 모티프들을 회피하는 이들 선택들로 공동-최적화될 수 있다.
비용 최적화의 이들 실시형태들이 도 8 및 도 9 에 예시된다. 도 8 은 일반적인 비용 감소/최적화를 위한 2-웨이 비용 보상의 일 예를 예시한다. 이 예에서, 높은 비용 합성 T, 및 에러 모드 둘다 모두가 존재하며 이로 인해 C 가 T 로 된다고 판독한다. 도 8 의 실시형태에서, 합성 비용들 및 에러들 양자를 감소시키는, 일반적인 비용-최적화 결과에 대한 에러 보상은 비용이 높은 DNA 모티프들 T, 및 C 를 회피하는 인코딩의 사용을 포함한다. 도 9 는 비용 최적화된 인코딩 시스템의 예시적인 인자들을 예시한다. DNA 판독 및 기록 시스템들의 인코딩/디코딩 알고리즘 및 성능 파라미터 섹션을 공동-최적화할 때 DNA 기록기 및 판독기의 금융 비용, 속도 및 에러 레이트들이 고려된다. 기록기 및 판독기의 성능 파라미터들은 DNA 서열 뿐만 아니라 이들 시스템들의 다른 조정가능한/선택가능한 파라미터들에 의존하며, 이들 파라미터들 뿐만 아니라, 알고리즘 선택 및 파라미터들은 이들 비용들을 감소시키거나 또는 최소화하도록 공동-최적화된다.
일반적으로, 에러 레이트들, 속도, 시약들 또는 성분들의 금융 비용들, 시스템의 강건성 또는 고장 사이의 시간, 등을 포함하여, 정보 저장/취출 프로세스의 "비용" 의 전체 측정에서 다양한 인자들이 존재한다. 게다가, 이들 판독기 및 기록기의 특성들은 동작 파라미터들 (예컨대, 일부 반응을 완료하는데 허용되는 시간, 사용된 화학 시약들의 순도, 동작 온도, 등) 에 따라, 일반적으로 가변적이다.
다양한 실시형태들에서, 인코더/디코더 알고리즘의 선택, 인코더/디코더 알고리즘의 제어 파라미터 세팅들, 및 기록기 및 판독기 시스템들의 제어 파라미터 세팅들은 일부 글로벌 비용 함수 또는 비용 함수들의 컬렉션을 감소시키거나 또는 최소화하기 위해, 공동-선택되고/되거나 공동-최적화된다 (도 9 참조). 이러한 방법으로, 시스템의 "비용" 성능이 더 높은 비용 동작 시나리오들의 회피 또는 완화를 통해서, 크게 감소될 수 있다.
DNA 판독 디바이스의 최적화
본원에서의 DNA 정보 저장 시스템의 다양한 실시형태들에서, DNA 판독 디바이스는 저장된 DNA 정보를 판독하는 전체 레이트가 대규모 아카이브 정보 취출에서의 실용적인 사용을 위해 충분히 빠르고 충분히 큰 볼륨일 수 있도록, 각각의 특정의 DNA 분자로부터 염기들을 고속으로 판독하는 것이 가능한 대규모 병렬 DNA 서열분석 디바이스를 포함한다. 염기들을 판독하는 레이트는 저장된 DNA 분자들의 길이에 관련된, 데이터 취출에 대한 최소 시간을 설정한다.
다양한 실시형태들에서, 분자 전자소자 센서는 DNA 로서 저장된 디지털 데이터에 대한 판독기를 제공하는 방법으로, 단일 DNA 분자들로부터 정보를 추출한다. 도 10a 는 센서 분자 복합체가 전기 회로를 완성하며 전기 회로 파라미터, 예컨대 전류 "i" 가 시간 ("t") 에 대해 측정되어 신호를 제공하는 분자 전자 감지 회로의 기본 컨셉을 예시하며, 여기서, 신호에서의 변형들은 센서의 환경에서의 상호작용 분자들과의 센서 분자 복합체의 상호작용들에 대응한다. 도 10a 에 예시된 바와 같이, 분자 전자소자 센서는 단일 분자, 또는 적은 개수의 분자들의 복합체가 나노-스케일 전극들의 쌍 사이의 간극에 걸쳐 있는 완전한 전기 회로를 형성하고 전자 파라미터가 이 단일 분자 또는 복합체에 의해 조절되며, 그리고 이 파라미터가 환경 내 표적 분자들과 상호작용하는 단일 분자 또는 복합체를 표시 ("감지") 하는 신호로서 측정되는 회로를 포함한다. 다양한 실시형태들에서, 예컨대, 도 10a 에 나타낸 바와 같이, 측정된 파라미터는 시간에 대한 전극들을 통과하는 전류이며, 분자 복합체는 전극들에 대한 특정의 부착 지점들과 제자리에 컨쥬게이션된다.
도 10b 는 DNA 판독기 디바이스로서 본원에서 사용하기 위한 폴리머라제-기반 분자 전자소자 센서의 일 실시형태를 예시한다. 폴리머라제를 포함하는 도 10b 에 예시된 바와 같은 센서는 별개의 DNA 분자 특징들 (도면에 "Feat. 1", "Feat. 2" 등으로 약칭됨) 로부터 식별가능한 신호들을 발생시킨다. 이러한 특징들은 정보를, 결과적으로 센서를 통해서 판독될 수 있는 합성 DNA 분자들로 인코딩하는데 사용될 수 있다.
다양한 실시형태들에서, 개별 센서 회로의 분자 복합체는 표적 DNA 분자와 결합하여 DNA 주형을 프로세싱함에 따라 전기 신호들을 발생시키는 단일 폴리머라제 효소 분자를 포함한다. 적합한 조건들 하에서, 이러한 폴리머라제는 신호 트레이스에서 2개의 상이한 피크 형상들로 도 11 에 예시된 바와 같은, 주형 DNA 분자의 특정의 뚜렷한 특징들에 대응하는 식별가능한 전기 신호 특징들을 발생시킬 것이다. 이러한 식별가능한 신호 특징들은 따라서 아래에 설명된, 도 29 의 인코딩 방식들과 같은 매우 다양한 인코딩 방식들을 통해서 정보를 합성 DNA 분자들로 인코딩하는데 사용될 수 있으며, 따라서 이러한 센서는 이렇게 인코딩된 데이터를 판독기에 제공한다.
도 11 은 폴리머라제 분자가 전극들의 쌍에서의 2개의 전극들 사이의 회로를 완성하는 가교 분자에 컨쥬게이션되는 일 실시형태를 예시한다. 전극들 사이의 전류는 측정된 전기 파라미터이다. 폴리머라제가 적합한 버퍼 용액 및 dNTP들의 존재 하에서, 프라이밍된, 단일-가닥 DNA 분자와 같은 적합한 주형과 결합할 때, 상보 가닥을 합성할 때에 폴리머라제의 활성은 효소 활성의 상세한 동력학에 관련된 측정된 신호들에서의 교란들을 초래한다. 이 경우, 전극들을 통과하는 전류 대 시간의 플롯은 프로세싱 중인 DNA 분자의 구조적 특징들에 대응하는 식별가능한 특징들 (예컨대, 진폭 변형들) 을 가진 신호를 제공한다.
도 12 는 폴리머라제를 전류 경로의 필수 부분으로 만들기 위해, 폴리머라제가 2개의 "아암" 분자들을 이용하여 전극들의 쌍에서의 전극들에 배선되는 센서 회로의 일 실시형태를 예시한다.
도 13 은 아암들이 없고 폴리머라제가 2개의 전극들에 직접 컨쥬게이션되는 센서 회로의 다른 실시형태를 나타낸다. 다양한 실시형태들에서, 폴리머라제에 컨쥬게이션되고 전극들에 컨쥬게이션된 분자 복합체는 다양한 컨쥬게이션 기들 및 컨쥬게이션 반응들의 고도로 특이적이고 효율적인 화학 작용에 의해 구동되는, 일련의 하나 이상의 분자 자가-어셈블리 프로세스들을 통해서 형성된다.
도 14 는 하나의 특정의 폴리머라제, 즉 대장균 폴리머라제 I 의 클레노브 (또는, 큰) 절편의 분자 구조의 3D 표현들을 나타낸다.
도 15 및 도 16 은 대장균 폴리머라제 I 의 클레노브 (또는, 큰) 절편이 (전극들 사이의 굵은 막대로 표시된) 추상 (abstract) 분자 가교 분자에 컨쥬게이션되거나, 또는 각각 2개의 추상 아암 분자들의 사용을 통해서 회로에 직접 컨쥬게이션된 분자 센서 회로의 실시형태들을 예시한다. 도 17 은 대장균 폴리머라제 I 의 클레노브 절편이 아암 또는 가교 분자들의 사용 없이 전류 경로에 직접 그리고 금속 전극들에 직접 컨쥬게이션된 분자 전자 센서의 일 실시형태를 예시한다.
도 18 은 DNA 데이터 정보체계에 대한 DNA 판독기 디바이스로서 본원에서 사용되는, 작업 센서 (200) 의 일 실시형태를 자세하게 예시한다. 분자 센서 구조 (200) 는 티타늄 또는 크롬을 포함하는 2개의 전극들 (201 및 202) 을 포함한다. 전극들 (201 및 202) 은 회로에서 소스 및 드레인 전극들을 포함할 수도 있다. 전극들 (201 및 202) 은 약 10 nm 의 나노갭 만큼 분리된다. 다른 간극 거리들은 다른 길이들의 생체분자 가교들을 수용하도록 요구될 수도 있다. 이 예에서, 가교 분자 (203) 는 각각의 금속 전극 (201 및 202) 상에 제공된 금 콘택들 (206 및 207) 에의 가교 분자 (203) 의 커플링을 위해 3' 및 5' 말단들 양자에서 티올 기들 (204 및 205) 을 갖는, 약 20 nm 길이 (예컨대, 60 개의 염기들; 6 회 나선형 권회) 의 이중 가닥 DNA 올리고머 분자를 포함한다. DNA 올리고머의 말단들과 금 콘택 지점들 사이의 결합들은 금에 결합하는 DNA 가교 분자의 5' 말단들 상의 티올 기들로부터 입수가능한 황-금 결합들을 포함한다. 이 센서에서의 프로브 분자는 결국, 합성 DNA 올리고 (203) 에서의 비오틴화된 뉴클레오티드를 통해서 결합 부위 (214) 에 커플링되는 폴리머라제 상의 비오틴화된 부위를 이용하여, 스트렙타아비딘 단백질 (212) 에 대한 공유 결합 (211) 에 화학적으로 가교된 대장균 폴리머라제 I 분자 (210) 의 클레노브 절편을 포함한다. 동작 시, 센서 (200) 는 폴리머라제 (210) 에 의해 프로세싱되는 DNA 가닥 (220) 을 더 포함한다. 도면은 분자들 및 원자들의 상대적인 사이즈들을 근사한다.
본원에서 사용하기 위한 분자 전자소자 센서의 다양한 실시형태들에서, 폴리머라제는 클레노브, Taq, Bst, Phi29 또는 T7 의 천연 또는 돌연변이체 유형일 수도 있거나, 또는 역전사 효소일 수도 있다. 다양한 실시형태들에서, 돌연변이화된 폴리머라제 형태들은 폴리머라제에의 특정의 컨쥬게이션 부위들의 도입을 통해서, 가교 분자, 아암 분자 또는 전극들에의 폴리머라제의 부위 특이적 컨쥬게이션을 가능하게 할 것이다. 재조합 방법들 또는 합성 생물학의 방법들에 의해 단백질로 조작된 이러한 컨쥬게이션 부위들은 다양한 실시형태들에서, 시스테인, 알데히드 태그 부위 (예컨대, 펩티드 모티프 CxPxR), 테트라시스테인 모티프 (예컨대, 펩티드 모티프 CCPGCC), 또는 p-아세틸페닐알라닌을 도입하기 위한 확장된 유전 코드의 사용을 통하는 것과 같은 비천연 또는 비-표준 아미노산 (NSAA) 부위, 또는 5-브로모우리딘을 이용한 RNA- 또는 DNA-단백질 크로스-링크의 사용을 통하는 것과 같은 비천연 크로스-링크가능한 아미노산을 포함할 수도 있다 (예컨대, Gott, J.M., 등., Biochemistry, 30 (25), pp 6290-6295 (1991) 참조).
가교 분자들 또는 아암 분자들은 다양한 실시형태들에서, 2중 가닥 DNA, 다른 DNA 듀플렉스 구조들, 예컨대 DNA-PNA 또는 DNA-LNA 또는 DNA-RNA 듀플렉스 하이브리드들, 펩티드들, 단백질 알파-나선 구조들, 항체들 또는 항체 Fab 도메인들, 그래핀 나노리본들 또는 탄소 나노튜브들, 또는 분자 전자소자의 당업자들에게 알려져 있는 다양한 분자 와이어들 또는 전도성 분자들 중 임의의 다른 것들을 포함할 수도 있다. 이러한 분자들에의 폴리머라제의 컨쥬게이션들, 또는 이러한 전극들에의 분자들의 컨쥬게이션들은 컨쥬게이션 화학의 당업자들에게 알려져 있는 다양한 종류의 컨쥬게이션 방법들, 예컨대 비오틴-아비딘 커플링들, 티올-금 커플링들, 시스테인-말레이미드 커플링들, 금 또는 물질 결합 펩티드들, 클릭 화학 커플링, Spy-SpyCatcher 단백질 상호작용 커플링, 항체-항원 결합 (예컨대, 플래그 펩티드 태그/안티-플래그 항체 시스템) 등에 의할 수도 있다. 전극들에의 커플링은 물질 결합 펩티드들을 통하거나, 또는 아지드 또는 아민 기들와 같은 컨쥬게이션을 위한 적합한 관능기들을 제공하기 위해 전극 표면 상에의 SAM (자기-어셈블리-단일층) 또는 다른 표면 유도체화의 사용을 통할 수도 있다. 전극들은 전기 전도성 구조들을 포함하며, 이는 임의의 금속, 예컨대 금, 은, 백금, 팔라듐, 알루미늄, 크롬, 또는 티타늄, 이러한 금속들의 임의의 조합인 층들, 예컨대 크롬 상의 금, 또는 반도체들, 예컨대 도핑된 실리콘, 또는 다른 실시형태들에서, 콘택 지점이 전극에의 분자 복합체의 화학적 자기-어셈블리를 유도하는 부위가 되는, 제 2 물질을 포함하는 지지체 상의 제 1 물질의 콘택 지점을 포함할 수도 있다.
다양한 실시형태들에서, 도 18 에 예시된 센서와 같은, 센서에서 측정된 전기 파라미터들은 일반적으로 센서가 활성인 동안 측정가능한 센서 회로의 임의의 전기 특성일 수 있다. 일 실시형태에서, 파라미터는 고정된 또는 가변적인 전압이 전극들 사이에 인가될 때, 연속적으로 또는 이산 시간들에서 샘플링되는, 시간에 대한, 전극들을 통과하는 전류이다. 다양한 실시형태들에서, 게이트 전극은 측정 동안 고정된 또는 가변적인 게이트 전압을 인가하는, 매립된 게이트 또는 후면 게이트와 같은 분자 구조에 용량성으로 커플링된다. 다양한 다른 실시형태들에서, 측정된 파라미터는 시간에 대해 연속적으로 측정되거나 또는 주기적으로 샘플링된, 2개의 전극들 사이의 저항, 컨덕턴스, 또는 임피던스일 수도 있다. 다양한 양태들에서, 측정된 파라미터는 전극들 사이의 전압을 포함한다. 게이트 전극이 있으면, 측정된 파라미터는 게이트 전압일 수 있다.
다양한 실시형태들에서, 도 18 의 센서와 같은, 분자 전자소자 센서에서의 측정된 파라미터는 커패시턴스, 또는 회로에 커플링된 커패시터 상에 축적된 전하 또는 전압의 양을 포함할 수도 있다. 측정은 측정 프로세스가 I-V 또는 C-V 곡선을 캡쳐하는 것을 포함하는, 전압 분광법 측정일 수 있다. 측정은 주파수 응답 측정일 수 있다. 모든 이러한 측정들에서, 모든 이러한 측정된 파라미터들에 대해, 게이트 전극이 측정 동안 분자 복합체 근처에서 고정된 또는 가변적인 게이트 전압을 인가하는 실시형태들이 있다. 이러한 게이트는 전형적으로 마이크론 거리 내에, 다양한 실시형태들에서는, 분자 복합체의 200 nm 거리 내에 물리적으로 위치될 것이다. 전기 측정들에 대해, 일부 실시형태들에서, 센서와 접촉하는 용액 내에 Ag/AgCl 기준 전극, 또는 백금 전극과 같은 기준 전극이 존재하고, 용액을 안정하거나 관측된 전위로 유지하고 전기 측정들을 더 잘 정의되거나 또는 제어되게 하기 위해 접지와 같은 외부 전위로 유지될 것이다. 게다가, 전기 파라미터 측정을 수행할 때, 다양한 다른 전기 파라미터들은 규정된 값들에서 고정되어 유지되거나, 또는 예를 들어, 소스-드레인 전극 전압, 게이트 전극이 있으면 게이트 전압, 또는 소스-드레인 전류와 같은, 규정된 패턴으로 변화될 수도 있다.
DNA 분자의 식별가능한 특징들을 측정하는데 도 18 에 예시된 센서와 같은 센서의 사용은 DNA 주형들을 발생시키고 임의의 배경 잡음보다 위의 강하고 식별가능한 신호들 (즉, 높은 신호-대-잡음비, 또는 "SNR") 을 발생시키기 위해, 폴리머라제가 활성화시킬 폴리머라제에 대해 적합한 물리적 및 화학적 조건들을 유지하여야 한다. 이를 달성하기 위해, 폴리머라제는 수성 버퍼 용액에 존재할 수도 있다. 다양한 실시형태들에서, 버퍼 용액은 염들, 예컨대 Nalco 또는 KCl, pH 버퍼들, 트리스-HCl, 다가 양이온 보조인자들, Mg, Mn, Ca, Co, Zn, Ni, Fe 또는 Cu, 또는 다른 이온들, Tween 과 같은 계면활성제들, EDTA 와 같은 킬레이트제들, DTT 또는 TCEP 와 같은 환원제들, 베타인 또는 DMSO 와 같은 용매들, PEG 와 같은 부피 농축제들, 및 분자 생물학 애플리케이션들에서 폴리머라제 효소들에 대해 사용되고 분자 생물학 분야의 당업자에게 알려져 있는 버퍼들의 전형적인 임의의 다른 성분의 임의의 조합을 포함할 수도 있다. 센서 신호들은 또한 특정의 범위의 pH 또는 온도로, 또는 특정의 이온 강도로 유지되는 이러한 버퍼들에 의해 향상될 수도 있다. 다양한 실시형태들에서, 이온 강도는 예를 들어, 약 0.3 nm 내지 약 100 nm 의 범위, 특정의 실시형태들에서는, 약 1 nm 내지 약 10 nm 의 범위일 수도 있는, 전기 신호 생성에 양호한 용액 내 Debye 길이 (전하 스크리닝 거리) 를 획득하도록 선택될 수도 있다. 더 큰 Debye 길이들을 갖도록 제형화된 이러한 버퍼들은 PCR 과 같은 표준 분자 생물학 절차들에서 정해진 순서로 사용되는 버퍼 농도들에 비해 10, 100, 1000, 100,000 또는 100 만배 만큼 더 희석되거나 더 낮은 이온 강도를 가질 수도 있다. 또한, 버퍼 조성물들, 농도들 및 조건들 (예를 들어, pH, 온도, 또는 이온 강도) 은 또한 DNA 분자들에 저장된 데이터를 판독하는 상황에서 센서의 신호-대-잡음비 (SNR), 신호 발생의 전체 레이트, 또는 정보 생산의 전체 레이트를 순조롭게 증가시키기 위해 효소 동력학을 변경하도록 선택되거나 또는 최적화될 수도 있다. 이는 이들 방법들에 의해 폴리머라제 활성을 느리게 하거나 또는 빠르게 하거나, 또는 폴리머라제의 충실도 또는 정확도를 변경하는 것을 포함할 수도 있다. 이 최적의 버퍼 선택 프로세스는 모든 이러한 파라미터 변형들의 매트릭스로부터 시험 조건들을 선택하는 단계, 예컨대, 식별가능한 특징들의 식별, 또는 주형을 프로세싱할 때 특징 식별의 과속과 관련된 성능 지수를 실험으로 측정하는 단계, 및 최적의 파라미터 조합들을 추론하기 위해, 통계 실험 설계 (DOE) 방법들에 적용되는 탐색 전략들과 같은, 다양한 탐색 전략들을 이용하는 단계로 구성된다.
DNA 분자의 식별가능한 특징들을 측정하는데 도 18 의 센서와 같은 센서의 사용은 폴리머라제가 주형 단일-가닥 DNA 분자 상에 프로세스적으로 작용하여 상보 가닥을 합성할 수 있도록, 폴리머라제에 dNTP들의 공급이 제공되어야 한다. 표준 또는 천연 dNTP들은 dATP, dCTP, dGTP, 및 dTTP 이며, 이는 효소가 이들 상에서 기질들로서 작용하도록 요구되는 형태로, DNA 가닥에의 중합을 위해, A, C, G, 및 T 염기 단량체들을 제공한다. 천연 또는 돌연변이인, 폴리머라제 효소들은 또한 식별가능한 신호들의 발생을 향상시키거나 또는 가능하게 할 수도 있는, 이들 천연 dNTP들의 유사체들, 또는 변형된 형태들을 수용할 수도 있다.
본원에서의 DNA 판독의 다양한 양태들에서, 시스템이 대표적인 현재 차세대, 광학 염료-표지링된 종결부위 서열분석기들에서와 같이, 1 염기 / 10 분의 속도로 DNA 분자를 판독하면, 300 개의 염기 DNA 분자를 판독하는 것은 판독을 위해 샘플을 준비하는데 요구되는 임의의 시간에 더해서, 적어도 3,000 분 (50 시간) 을 소요한다. 이러한 상대적으로 느린 시스템들은 따라서 5 시간 내에 판독될 수 있는 30 염기 판독들과 같은, 더 많은 수의 더 짧은 판독들로 정보를 저장하는 것을 선호한다. 그러나, 이는 더 많은 수의 전체 판독들을 필요로 하므로, 시스템은 이러한 서열분석기들에서의 경우와 같이, 수십억 이상의 이러한 판독들을 지원해야 한다. 현재 세대의 광학 대규모 병렬 서열분석기들은 6-분 사이클 당 DNA 의 30억개의 문자들, 또는 대략 분 당 10억 비트들, 또는 초 당 2 MB 의 등가량을 판독하지만, 100 개의 염기 DNA 단어들로서 저장된 데이터에 있어, 이는 또한 600 분 (5 시간) 을 필요로 할 것이다. 전형적인 책이 1 MB 의 텍스트 데이터를 포함할 수도 있기 때문에, 실현가능한 영역 내에서, 이것은 상대적으로 낮은 데이터 판독의 레이트로 볼 수 있다. 전체 레이트는 실현가능하지만, 기본 시간 당 느린 속도는 단일 책의 데이터를 판독하는데 매우 비효율적으로 만들며, 이상적으로는 5 시간 동안 동시에 36,000 권의 책들의 대량 판독에 적합하다. 따라서, 또한 이 현재의 능력에서의 스케일러빌리티의 부족, 그리고 또한 판독 디바이스의 높은 자본 비용 (현재 $100,000 내지 $1,000,000 범위의 광학 DNA 서열분석기들 비용) 이 있다. 더 중요하게는, 이러한 현재의 시스템들 상에서, 인간 게놈의 DNA 가치, 1000억개의 염기들을 서열분석하는 비용은 대략 $1,000 이며, 이는 정보를 판독하는 비용이 200 기가-비트들 당 $1,000, 또는 GB 당 $40 임을 의미한다. 이는 10,000 GB 당 $1, 또는 GB 당 $0.0001 로, 400,000배 더 적은 자기 테이프 저장 또는 CD들로부터 정보를 판독하는 비용보다 근본적으로 더 높다. 따라서, DNA 를 판독하는 비용은 다른 이점들을 고려하지 않고, 대규모, 장기 아카이브 저장에 매력적이게 만들기 위해서는, 수십배의 크기 만큼, 심지어 1,000,000배 만큼 감소되어야 한다. 이러한 향상들은 최초 상업적 서열분석기들이 제조된 이후 이미 발생된 서열분석의 비용들에서 백만 배 감소로 입증된 바와 같이, 실제로 가능할 수도 있다.
다양한 실시형태에서, 본 시스템의 DNA 판독기는 현재 가용 광학 차세대 서열분석 기구들에 비해, 실질적으로 더 낮은 기구 자본 비용들, 및 더 높은 당-염기 판독 속도, 및 런 당 판독들의 총 수에서의 더 큰 스케일러빌리티를 포함한다. 다양한 양태들에서, 본원에서 사용하기 위한 판독 디바이스는 속도 및 스케일러빌리티를 증가시키고 자본 비용들을 감소시키기 위해 CMOS 칩 센서 어레이 디바이스에 기초한다. 이러한 디바이스의 실시형태는 CMOS 센서 어레이 디바이스를 포함하며, 각각의 센서 픽셀은 요구되는, PCR 과 같은, 임의의 분자 증폭 또는 복제 없이 DNA 의 단일 분자를 판독할 수 있는 분자 전자 센서를 포함한다. 다양한 실시형태들에서, CMOS 칩은 스케일러블 픽셀 어레이를 포함하며, 각각의 픽셀은 분자 전자 센서를 포함하며, 이러한 센서는 효소가 DNA 주형 분자를 프로세싱함에 따라 전류 (또는, 관련된 전기 파라미터들, 예컨대 전압, 컨덕턴스, 등) 의 서열-관련 조절들을 발생하도록 구성된, 가교 분자 및 폴리머라제 효소를 포함한다.
본 DNA 데이터 저장 시스템에서 DNA 판독기 디바이스로서 사용가능한 예시적인 분자 센서 및 칩 조합이 도 18, 도 19, 도 30a, 도 30b, 및 도 31-33 에 도시된다. 설명한 바와 같이, 도 18 은 금속 전극 상의 금 콘택들에의 커플링을 위한 5' 말단들 양자에서의 티올 기들과 함께, 약 20 nm 길이 (~60 염기들) 를 갖는 2중 가닥 DNA 의 가교를 더 포함하는 가교 및 프로브 분자 구조를 포함하는 예시적인 분자 센서를 예시한다. 도 18 의 실시형태는 DNA 로 이루어진 분자 와이어에 커플링된 폴리머라제 효소를 포함하며, 이는 폴리머라제 효소가 프라이밍된 DNA 주형을 프로세싱함에 따라 서열-관련된 신호들을 발생시킬 수 있는 센서를 형성하기 위해 나노-전극 쌍에 연결된다.
도 19 에 예시된 바와 같이, 이러한 나노-센서는 CMOS 센서 픽셀 어레이의 픽셀들 상으로 사후-프로세싱함으로써 배치될 수 있으며, 이는 병렬로 동작하는 다수의 센서들로부터 이들 신호들을 발생시키는데 필요한 모든 지원 측정, 판독 및 제어 회로부를 더 포함한다. 도 19 는 분자 센서들 내 다양한 전기적 컴포넌트들 및 접속들의 일 실시형태를 예시한다. 도면의 상부 부분에, 전극-기판 구조 (300) 의 단면이, 전압들을 인가하고 센서의 가교 분자를 통해서 전류들을 측정하기 위한 분석기 (301) 에의 부착과 함께, 예시된다. 도면의 하부 부분에, 브릿징 회로들에 사용가능한 전극 어레이 (302) 의 사시도가 예시된다. 전극들의 각각의 쌍은 제 1 금속 (예컨대, "금속-1"), 및 전극들을 분리하는 간극 근처 각각의 전극 단부에서의 제 2 금속 (예컨대, "금속-2") 의 콘택 도트 또는 아일랜드를 포함한다. 다양한 예들에서, 금속-1 및 금속-2 는 동일한 금속 또는 상이한 금속들을 포함할 수도 있다. 다른 양태들에서, 콘택 도트들은 상이한 금속을 포함하는 금속 전극들 상부의 금 (Au) 아일랜드들이다. 다양한 실험들에서, 콘택 도트들은 예컨대, 티올-금 결합을 통한, 전극 쌍들 사이의 각각의 간극 상에 걸친 단일 가교 분자의 자기-어셈블리를 지원하는 금 (Au) 비드들 또는 금 (Au)-코팅된 전극 팁들을 포함한다.
도 20 은 DNA 센서들에서의 가교 결합을 위한 금 금속 도트 콘택들을 포함하는 전극들의 전자 현미경사진 (EM) 이미지들을 나타낸다. 이 예에서, 전극들은 실리콘 기판 상에 있으며, e-빔 리소그래피를 통해서 제조되었다. 도 20 의 좌측 부분에 금 도트 콘택들을 가진 티타늄 전극들의 어레이가 도시된다. 도 20 의 중간에, 확대 EM 은 금 도트 콘택들 및 약 15 nm 금-대-금 간격과 함께 약 7 nm 의 전극 간극을 나타낸다. 도 20 의 우측에, 확대 EM 은 전극들의 팁들에 위치된 대략 10 nm 사이즈의 금 도트들을 나타낸다.
도 21 은 도 18 의 센서로 DNA 혼입 신호들을 측정함으로써 얻어진 전류 대 시간 플롯들을 개시한다. 플롯들은 혼입 및 중합을 위해 다양한 프라이밍된, 단일 가닥 DNA 서열분석 주형들 및 dNTP들이 공급되고 있는 센서로부터 유래하는 전류 신호들을 나타낸다. 각 경우에, 주요 신호 스파이크들은 별개의 혼입 이벤트들로부터의 신호들을 나타내며, 여기서, 폴리머라제 효소는 다른 염기를 연장 가닥에 추가한다. 도 21 의 좌상단에서, 주형은 20개의 T 염기들이고; 상부 우측에서, 주형은 20 개의 G 염기들이고; 하부 좌측에서, 주형은 20 개의 A 염기들이고; 하부 우측에서, 주형은 20 개의 C 염기들이다. 대략 관측된 혼입의 레이트는, 레이트 제한 인자들 (예컨대, 낮은 dNTP 농도) 로 인해 초 당 ~1 염기의 낮은 레이트를 제외하고는, 표준 효소 동역학과 일치하는, 초 당 약 10 내지 20 개의 염기들이다.
도 22 는 dNTP들의 변형된 형태들을 이용하여 식별가능한 신호들을 발생시키는 원리를 예시하며, 모든 4 개의 dNTP들이 주형 DNA 의 4개의 염기들로부터 4 개의 식별가능한 신호들을 발생시키는 별개의 변형들을 갖는 예를 나타낸다. 다수의 이러한 변형된 형태들은 핵산 생화학 분야의 당업자에게 널리 알려져 있으며, 이러한 모든 형태들은 다양한 실시형태들에서 신호 발생을 가능하게 할 수도 있다. 이는 염기, 당, 또는 포스페이트 기에 대한 변형을 갖는 dNTP들을 포함한다. 예를 들어, dNTP들의 일반적인 변형 형태들은 분자 상의 다양한 부위들에서의 디아자-, 티오-, 브로모- 및 요오드- 변형들, 또는 다양한 부위들에서의 금속 이온들 또는 상이한 동위원소들의 혼입, 다양한 부위들에서의 다양한 염료 분자들의 혼입, 또는 다양한 부위들의 메틸화, 또는 다양한 부위들의 비오티닐화를 포함한다. 다양한 변경들은 천연 트리-포스페이트를 지나서, 테트라-, 펜타-, 헥사-, 헵타- 또는 그 이상의 (4 이상, 최대 11 이상) 포스페이트들과 같은 길이들까지의 연장된 포스페이트 사슬을 갖는 형태들을 포함한다. 변형의 다른 예들은 혼입 동안 절단되는 포스페이트 사슬의 말단 포스페이트, 또는 포스페이트들 중 임의의 포스페이트 (사슬 내 알파-포스페이트 또는 첫번째를 제외한 모두) 에 첨가된 화학기를 포함한다. 폴리머라제들은 이러한 기들에 대해 내성이 강하며, 이들의 존재에서 하이 레벨의 활성을 유지한다. 따라서, 이러한 기들은 식별가능한 신호들을 형성하는 것을 돕는 변형된 dNTP들에 대해 큰 용량을 제공한다. 다양한 실시형태들에서, 이러한 기들은 상이한 전하 상태들, 또는 상이한 사이즈들, 또는 상이한 정도의 소수성을 가질 수도 있으며, 이는 상이한 신호들을 발생시키는 것을 도울 수도 있거나, 또는 이러한 추가된 기들은 식별가능한 신호들을 발생시키기 위해 가교 분자 상 또는 폴리머라제 또는 주형 DNA 상의 부위들과 선택적으로 상호작용할 수도 있다. 도 22 는 주형의 4개의 염기들에 대한 식별가능한 혼입 신호들을 발생시키기 위한, 포스페이트 사슬에의 이러한 기들의 추가를 예시한다.
도 23 은 주형 DNA 의 개별 상보적 표준 염기들 T 및 G 에 대한 이들의 혼입에 기인한 2개의 식별가능한 신호들을 제공하기 위한, 2개의 별개의 변형된 dNTP들, 즉, A* 로 표시된 변형된 dATP, 및 C* 으로 표시된 변형된 dCTP 의 사용을 예시한다. 2개의 변형된 dNTP들의 사용은 2진 비트들 0/1 을 주형 DNA 로 인코딩하는 방법을 제공한다. 따라서, DNA 주형의 T 및 G 특징들은 식별가능한 신호들을 발생시키며, 이 센서에 의해 판독가능한 정보를 인코딩하는데 사용될 수 있다.
도 24 는 2진 비트들 0/1 을 주형 DNA 로 인코딩하는 수단을 제공하는 2개의 식별가능한 신호들을 발생시키기 위한, 2개의 상이한 서열 모티프들, 여기서는, 동종중합체들 AA 및 CCC 의 사용을 예시한다. 이 경우, AA 및 CCC 는 정보 인코딩 및 복구를 위해 사용될 수 있는 2개의 식별가능한 서열 모티프들을 제공한다. 따라서, 대신, 식별가능한 서열 모티프들에 의존함으로써, 심지어 DNA 서열들의 단일 염기 해상도 없이도, 유용한 정보 인코딩 및 판독이 가능하다.
도 25 는 특정의 서열 모티프들이 0/1 2진 데이터를 인코딩하는데 사용가능한 신호들을 발생시킨 도 18 의 센서로부터 얻은 실험 데이터를 나타낸다. 도 18 의 센서는 DNA 가교에 컨쥬게이션된 클레노브 폴리머라제를 포함하며, 이는 실험 주형 DNA 에서의 인코딩 DNA 서열 모티프들 20A, 3C 및 30A 로부터 식별가능한 신호들을 발생시킨다. 이러한 신호들은 표준 1X 클레노브 버퍼 및 상대적으로 높은 농도의 dTTP, (10μM), 및 100배 낮은 농도의 다른 dNTP들과 함께, 도 18 의 센서를 이용하여 발생되었다. 다른 dNTP들의 더 낮은 농도, 특히 낮은 dGTP 농도는 농도-제한된 혼입의 레이트를 통해서 CCC 영역으로부터의 식별가능한 신호를 용이하게 한다. 그 결과, 폴리-A 트랙이 높은 스파이크 신호 특징을 갖고 폴리-C 트랙이 낮은 트로프 신호 특징을 가지므로, 이는 용이하게 식별가능하다. 피크들 및 트로프는 0/1 2진 데이터를 예시된 간단한 방법으로 인코딩하는데 사용가능하며, 0 은 폴리-A 트랙에 의해 인코딩되고 수 초 지속기간을 갖는 높은 피크 신호들로부터 판독되며, 1 은 CCC 트랙에 의해 인코딩되고 수 초 지속기간을 갖는 낮은 트로프 특징들로부터 판독된다.
도 26a 는 2개의 상이한 서열 모티프들, GATT 및 ACA 이, 2진 비트들 0/1 을 주형 DNA 를 인코딩하는 방법을 제공하는 2개의 식별가능한 신호들을 발생시키는 2진 인코딩의 일 실시형태를 예시한다.
도 26b 는 3개의 상이한 서열 모티프들, GATT, ACA 및 AGG 가, 디지털 데이터를 3-상태 인코딩으로 인코딩하는 방법을 제공하는 3개의 식별가능한 신호들을 발생시키는 2진 인코딩의 다른 실시형태를 예시한다.
DNA 분자의 식별가능한 특징들을 측정하는데 본 개시물의 센서들의 사용은 연관된 신호들을 발생시키는 과정에서, 프라이밍된, 단일-가닥 주형 DNA 분자들이 폴리머라제에 상보 가닥의 중합을 위한 기질로서 제공될 것을 필요로 한다. 합성 DNA 분자들에 정보를 인코딩하는 상황에서, 이들 주형 분자들은 전체적으로 화학적으로 합성될 수도 있으며, 따라서, 다양한 실시형태들에 대해 식별가능한 신호들의 발생을 가능하게 하거나 또는 향상시키는데 사용될 수도 있는 천연 DNA 의 것들 이상의 화학적 또는 구조적 변형들 또는 특성들이 제공될 수 있다. 폴리머라제, 천연 또는 조작된 돌연변이체는 기질로서 DNA 의 아주 많은 이러한 변형된 또는 유사한 형태들을 수용할 수 있으며, 이들 중 다수는 분자 생물학 분야의 당업자에게 널리 알려져 있다. 주형 DNA 에의 이러한 변형들의 사용은 식별가능한 신호들을 갖는 특징들을 생성하는데 사용될 수 있다. 도 26c 는 주형 DNA 가 2개의 염기 유사체들, X 및 Y, A 및 C 의 유사체들로부터 합성되는 경우를 나타낸다. 제공된 dNTP들은 표준 dATP 및 dCTP 이며, 주형 내 변형된 염기들 X 및 Y 에 대해 혼입될 때 향상된, 식별가능한 신호들을 발생시킨다. 따라서, X 및 Y 유사체들을 이용하여 합성된 DNA 주형이 이 센서로 판독될 수 있는 정보를 인코딩하는데 사용될 수 있다. 도 26d 는 표준 dNTP들이 상보적 방식으로 이들에 혼입할 때 8 개의 식별가능한 신호들을 발생시키기 위해, 인코딩 DNA 가 8 개의 상이한 염기들 및 염기 유사체들, 즉 4개의 표준 염기들 A, C, G, T, 및 각각 이들의 변형된 염기 유사체들 X, Y, Z, W 와 합성되는 이의 추가적인 확장을 나타낸다. 따라서, 이들 8 개의 염기들 및 유사체들 A, C, G, T, X, Y, Z, W 로부터 합성된 주형 DNA 는 8 개의 식별가능한 신호들을 제공하며, 따라서, 8 상태 인코딩 (도 29 에 나타낸 바와 같은, 방식 BES5) 에 사용될 수 있다.
다양한 실시형태들에서, 주형으로서 폴리머라제에 제공되는 DNA 는 폴리머라제에 대한 개시 부위로서 작용하기 위한 일부 유형의 프라이밍된 (이중 가닥/단일 가닥 전이) 부위를 포함한다. 디지털 데이터를 DNA 에 저장하기 위해, 다양한 실시형태들에서, 이 프라이밍은 인코딩 분자로 사전-어셈블리될 것이며, 따라서 DNA 주형 분자들을 프라이밍하는데 추가적인 샘플 준비가 불필요하다. 도 27a 및 도 27b 는 DNA 데이터 저장 분자들이 사전-어셈블리된 범용 프라이밍 구조를 갖는 실시형태들을 나타낸다.
도 27a 는 저장 주형들에 사용가능한 프라이머 구성의 4개의 실시형태들을 개시한다. 이들은 예시에서 내림 차순으로 포함된다: (1) 주형에 혼성화된 (hybridized) 올리고 프라이머를 갖는, 프라이밍된 가닥; (2) 안정성을 위해 가닥에 가교-결합된 프라이머; (3) DNA 또는 다른 링커 분자, 예컨대 PEG 중합체 링커의 헤어핀 벤드를 갖는, 헤어핀 프라이머; 및 (4) 제자리에 가교-결합된 헤어핀 프라이머. 도 27b 는 폴리머라제-기반 센서가 동일한 데이터 페이로드를 조사가능하게 하는 가닥 아키텍처의 실시형태들을 개시한다. 이들 4개의 실시형태들의 추가적인 고려사항들이 본원에서 상세하게 설명된다.
다양한 실시형태들에서, 프라이머 구성체들은 다음 중 임의의 것을 포함한다:
(1) 높은 융점 또는 높은 GC 함량, 또는 PNA 또는 LNA 와 같은 보다 안정되게 혼성화된 형태를 선택적으로 가지는, 예컨대, 천연 DNA 의 사전-혼성화된 범용 프라이머 올리고;
(2) 제자리에 공유 결합되거나 또는 아니면 강하게 화학적으로 커플링되어, 프라이머가 제자리에 있지 않을 가능성이 크게 감소된, 추가적인 가교-결합된 염기들 (예컨대, 브로모데옥시우리딘) 로 변형된 프라이머 올리고;
(3) 분자가 우선적으로 자기-프라이밍되도록, DNA 주형의 부분으로서의 헤어핀 프라이머로서, 여기서 헤어핀 프라이머는 DNA, 또는 예컨대, 높은 융점 또는 높은 GC 함량, 또는 PNA 또는 LNA 와 같은 보다 안정되게 혼성화된 유사체를 갖는, DNA 일 수 있는, 혼성화 올리고 부분에 부착된 헤어핀 벤드를 가능하게 하는 (다양한 예들에서, DNA, 또는 대안 가요성 분자, 예컨대 PEG 중합체 가닥 또는 다중 탄소 링커, 예컨대 C3, C6, 또는 더 긴 링커인) 헤어핀 루프로 전체적으로 구성될 수도 있는, 헤어핀 프라이머;
(4) 혼성화 올리고가 제자리에 공유 결합되거나 또는 아니면 강하게 화학적으로 커플링되어, 프라이머가 제자리에 있지 않을 가능성이 크게 감소된 추가적인 가교-결합된 염기들로 변형된, 헤어핀 프라이머. 다양한 실시형태들에서, 할로겐화된 티오피리미딘들 및 브로모데옥시우리딘들 (예컨대, 티미딘에 대한 치환체로서의 5'-브로모-2'-데옥시우리딘) 은 UV 광에의 노출로 이들을 DNA, RNA 또는 단백질들로 가교결합하기 위해 올리고뉴클레오티드들에 혼입될 수 있는 광반응성 할로겐화 염기들이다. 다양한 예들에서, 가교는 308 nm 의 파장의 광으로 최대로 효율적이다. 예컨대, Cleaver, J.E., Biophys. J., 8, 775-91 (1968); Zeng, Y., 등, Nucleic Acids Res., 34(22), 6521-29 (2006); 및 Brem, H., 등, J. of Photochemistry and Photobiology B: Biology, 145, 216-223 (2015) 을 참조한다.
DNA 주형에서의 2차 구조가 폴리머라제의 프로세스적 작용을 방해할 수 있기 때문에, DNA 데이터 판독기 센서들에 사용되는 DNA 데이터 인코딩 주형 분자들 내 2차 구조를 감소시키거나, 회피하거나, 또는 제거하는데 유리할 수도 있다. 2차 구조 간섭을 감소시키는 다수의 방법들이 분자 생물학 분야의 당업자에게 알려져 있다. 2차 구조를 감소시키거나, 회피하거나 또는 제거하기 위한 방법은 Phi29 또는 Bst 또는 T7, 이들의 천연 또는 돌연변이 형태들과 같은, 강한 2차 구조 치환 능력들을 소유하는 폴리머라제들을 이용하는 단계; 버퍼에 용매들, 예컨대 베타인, DMSO, 에틸렌 글리콜 또는 1,2-프로판디올을 첨가하는 단계; 버퍼의 염 농도를 감소시키는 단계; 용액의 온도를 증가시키는 단계; 및 단일 가닥 결합 단백질 또는 축퇴 (degenerate) 결합 올리고들을 첨가하여 단일 가닥을 따라서 혼성화하는 단계를 포함하지만 이에 한정되지 않는다. 이들과 같은 방법들은 2차 구조 간섭을 인코딩 DNA 를 프로세싱하는 폴리머라제로 감소시키고 적합한 신호들을 발생시키는 유익한 효과를 가질 수 있다.
본 개시물에 따른 DNA 데이터 판독을 위한 원치 않는 2차 구조를 감소시키는데 이용가능한 추가적인 방법들은 합성 화학에 의해 생성되는 DNA 분자들에 특성들을 첨가하는 단계를 포함한다. 예를 들어, 본 개시물의 일부 실시형태들에서, DNA 분자 자체를 인코딩하는 데이터는 예컨대, G:C 염기 짝짓기를 약화시키는 G 대신 디아자-G (7-디아자-2′- 데옥시구아노신) 을 이용하여, 또는 백본을 강화하여 2차 구조를 감소시키는 가닥 내 로킹된 핵산 (LNA) 을 이용함으로써, 2차 구조를 감소시키는 염기 유사체들로부터 합성될 수 있다. 이러한 효과들을 가진 다양한 이러한 유사체들이 핵산 화학 분야의 당업자에게 알려져 있다.
DNA 데이터 인코딩 방식이 주형 서열을 결정하고 따라서 2차 구조가 되기 쉬운 서열들을 회피하는 인코딩 방식을 선택할 가능성이 있기 때문에, DNA 데이터 판독 센서에 대한 원치않는 2차 구조를 감소시키기 위해 추가적인 방법들이 본 개시물에서 이용가능하다. 따라서 이러한 2차 구조 회피 ("SSA") 인코딩 방식들이 본 개시물의 유익한 양태이다. 일반적으로, 식별가능한 신호 서열 특징들을 인코딩 엘리먼트들로서 이용하는 본원에서 설명된 바와 같은 인코딩 방식들에 대해, (예컨대, 도 29 에 예시된) 인코딩 규칙들의 선택에 옵션들이 존재하는 한, 모든 이러한 대안적인 방식들이 고려될 수 있으며, 더 적은 (또는, 가장 적은) 2차 구조를 발생하는 방식들이 사용하기에 유리할 것이다. 대안적인 방식들은 특정의 디지털 데이터 페이로드에 대해, 또는 인코딩될 이러한 데이터 페이로드들의 대표 모집단에 걸쳐서 통계적으로 평가된다.
예를 들어, 센서가 3개의 식별가능한 신호 서열 특징들: AAAAA, TTTTT, 및 CCCCC 을 제공하는 실시형태에서 SSA 인코딩의 중요성이 예시된다. 모든 3개의 특징들이 동일한 가닥에서 (또는, 다른 스트랜드들 상에서) 인코딩에 사용되면, AAAAA 및 TTTTT 인코딩 엘리먼트들이 상보적이어서, 가닥 내에서 또는 DNA 가닥들 사이에서, 혼성화하여 2차 구조를 초래할 가능성이 높다. 따라서, 데이터가 0 -> AAAAA 및 1 -> CCCCC 인, 즉, TTTTT 의 사용을 완전히 무시하는 방식에 의해 전체적으로 대신 인코딩되면, 모든 이러한 전위 2차 구조가 회피된다. 따라서, 이 인코딩 (또는, 다른 SSA 선택, 0 -> TTTTT 및 1 -> CCCCC) 은 심지어 3개의 가용 인코딩 엘리먼트들 중 하나를 포기함으로써 정보 밀도가 감소되더라도, 자기-상보적 서열들을 이용하는 방식보다 바람직하다. 따라서, 일반적으로, SSA 코드들은 인코딩 옵션들이 있고 DNA 2차 구조가 형성될 가능성이 있을 때 사용될 수 있다. 이 실시형태에 나타낸 바와 같이, DNA 2차 구조를 감소시키기 위한 바람직한 SSA 코드들은 식별가능한 신호 상태들에 대해 이론적으로 가능한 것보다 정보 밀도가 더 적을 수도 있다. 그러나, 이러한 상충관계는 DNA 2차 구조에 관련된 데이터 손실을 회피함으로써, 정보 밀도의 순 이득, 또는 관련된 전체 비용 또는 속도 향상들을 초래할 수 있다.
다양한 실시형태들에서, 2차 구조를 감소시키기 위한 방법들은 단일 가닥을 보호하기 위한 결합 올리고들의 사용을 포함하며, 여기서 올리고들은 인코딩 특징들에 우선적으로 결합하는 서열 또는 서열 구성으로 선택된다. 이러한 결합 올리고들은 단일 가닥 및 일반적인 축퇴 올리고들을 더욱 효과적으로 보호할 수도 있다. 예를 들어, 3개의 식별가능한 신호 서열 특징들 AAAAA, TTTTT, 및 CCCCC 로 위에서 설명된 경우에, 모든 3개가 인코딩 특징들으로 사용될 수 있으며, 이들은 주형을 올리고들 TTTTT, AAAAA, 및 GGGGG 에, 또는 DNA 대신, RNA, LNA 또는 PNA 형태들과 같은, 이들의 향상된 결합 유사체들에 결합함으로써, 단일 가닥 형태로 보호될 수 있다. 따라서, 인코딩 특징들에 우선적으로 결합하는 결합 올리고들의 사용은 원치 않는 2차 구조 효과들을 완화시키는 다른 수단이지만, 이러한 결합 올리고들은 올리고들 자체가 방해하지 않도록 가닥-치환 폴리머라제들, 예컨대 클레노브, Bst 또는 Phi29 의 천연 또는 돌연변이 형태들로 사용되어야 한다. 2차 구조를 회피하기 위한 추가적인 방법은 폴리머라제 개시를 위한 프라이머 부위에서 틈 또는 간극을 갖는, 주로 이중 가닥 형태로, 그리고 분자의 나머지는 DNA 분자가 분자들 내 또는 분자들 사이에, 단일-가닥 상호작용들로 인해 2차 구조 없이, 용액 내에서 실질적으로 듀플렉스 형태로 존재하도록, (헤어핀 벤드가 있거나 없이) 도 27b 에서 제 2 가닥에 의해 예시된 바와 같이 듀플렉스 형태로 정보 인코딩 DNA 를 준비하는 것이다.
다양한 실시형태들에서, 동족 분자 센서에 의한 판독을 위한 정보를 인코딩하는데 사용되는 DNA 분자들은 인코딩 및 디코딩 프로세스들 뿐만 아니라 판독 프로세스를 용이하게 하는 아키텍처로 준비될 수 있다. DNA 아키텍처의 다양한 실시형태들이 도 28 에 예시된다. (도면의 상부에) 디지털 데이터 저장 시스템에서 사용하기 위한 정보 인코딩 분자의 논리적 형태들과 함께, 프라이밍된 단일-가닥 DNA 주형의 대표적인 물리적 형태가 예시된다. 예시적인 형태들은 정보 코딩 DNA 분자들, (예컨대, "프라이머" 로서 표시된, 사전-프라이밍된 또는 자기-프라이밍된) 프라이머, ("L-버퍼" 및 "R-버퍼" 으로서 나타낸) 좌측 및 우측 버퍼 세그먼트들 및 데이터 페이로드 세그먼트 ("데이터 페이로드") 의 조작을 용이하게 하기 위해, ("L 어댑터" 및 "R 어댑터" 로 나타낸) 좌측 및 우측 어댑터들을 포함할 수도 있다.
도 28 을 계속 참조하면, 어댑터들은 예를 들어, 저장된 데이터를 복제하는데 사용되는 범용 증폭 프로세스들을 위한 프라이머들을 포함할 수도 있거나, 또는 풀로부터의 분자들의 표적화된 선택을 위해, 혼성 캡쳐 부위들 또는 다른 선택적 결합 표적들을 포함할 수도 있다. 다양한 실시형태들에서, 프라이머 세그먼트는 프라이머 표적/구조를 포함하며, L-버퍼 세그먼트는 인코딩된 서열 및 패리티 비트들와 같은 관련된 에러 정정 서열을 저장하는 정보를 포함하는 데이터 페이로드 세그먼트 전에, 판독기를 위한 신호 교정 서열, 또는 버퍼링 (buffering) 서열을 포함할 수도 있다. 다양한 양태들에서, R-버퍼는 추가적인 교정 서열 뿐만 아니라, 데이터를 판독할 때 폴리머라제 효소가 주형의 말단에 너무 가까워지는 것을 방지하는 버퍼 서열을 포함할 수도 있다. 다양한 실시형태들에서, L-어댑터 및 R-어댑터는 PCR 증폭, 또는 혼성 기반 선택을 위한 외측 프라이밍 인용들을 위한, 또는 캐리어로서의 숙주 유기체 게놈으로의 삽입을 포함한 이러한 삽입을 위한 주변 캐리어 DNA 를 나타내는, 어댑터들과 같은, 연관된 DNA 세그먼트의 저장 또는 조작과 관련된 서열 엘리먼트들일 수도 있다. 다양한 실시형태들에서, 어댑터들은 예를 들어, 살아있는 숙주 게놈들에, 예컨대 박테리아 플라스미드들 또는 생물들의 다른 게놈 성분들에 저장된 DNA 데이터 분자들의 경우, 주변 또는 캐리어 DNA 를 포함할 수도 있다.
도 28 를 추가로 참조하면, L-버퍼 및 R-버퍼 세그먼트들은 폴리머라제 결합 풋프린트, 또는 데이터 페이로드 영역으로부터 유래하는 신호들을 해석하는 것을 돕기 위해 사용되는 다양한 교정 또는 개시 서열들을 지원하는 DNA 세그먼트들을 포함할 수도 있다. 이들 버퍼 세그먼트들은 고유한 분자들을 구별하거나, 또는 동일한 기원의 단일 분자로부터 유래된 복제 분자들을 식별하는데 사용되는 분자 바코드 서열들을 포함할 수도 있다. DNA 올리고 합성에서의 당업자에게 알려져 있는, 하나의 이러한 바코딩의 방법은 예를 들어, 합성 단계들을 특정의 염기들 대신 축퇴 염기들의 혼합물들로 수행함으로써 이루어지는, 전형적으로 1 내지 20 개의 염기들 길이인 짧은 무작위 N-mer 서열의 첨가를 포함한다.
도 28 을 계속 참조하면, DNA 논리 구조들은 특정의 데이터가 인코딩된 데이터 페이로드 세그먼트를 포함한다. 다양한 실시형태들에서, 데이터 페이로드 세그먼트는 저장 방법에 대한 메타데이터와 함께 저장되는 실제 1차 디지털 데이터를 포함하며, 이는 더 긴 스트링들에의 이러한 정보 절편들의 적합한 어셈블리에 관련된 데이터, 및/또는 패리티 비트들, 검사 합들, 또는 다른 이러한 정보 오버헤드와 같은, 에러 검출 및 정정에 관련된 데이터를 포함할 수도 있다.
다양한 실시형태들에서, 데이터 페이로드 DNA 구조는 도 29 에 예시된 바와 같이, 2진 데이터와 같은 소스 디지털 데이터 페이로드에 적용되는 센서-특정의 정보 인코딩 방식에 기인한다. 이 시나리오에서, DNA 로서 저장되는 최초의 디지털 데이터는 전형적으로 전자 2진 데이터 (1/0 비트들) 로서의 사전 표현을 가질 것이다. 인코딩의 다양한 실시형태들에서, 이 최초의 데이터는 (i) 세그먼트들로 분할되고, (ii) 리어셈블리 데이터에 의해 증대되고, 그리고 (iii) DNA 데이터 저장에 적합한 에러 정정 인코딩들에 의해 변환되어, 도 29 의 예들에 예시된 바와 같이 실제 2진 데이터 페이로드 세그먼트들을 발생시킬 것이다. 이들 실제 2진 데이터 페이로드 세그먼트들은 그후 DNA 물리적인 저장 분자들의 후속 합성에서 사용가능한 DNA 페이로드 서열들로의 변환을 필요로 한다. 다양한 실시형태들에서, 1차 변환이 예를 들어, 도 29 에 나타낸 바와 같은 2진 인코딩 방식들 ("BES") 에 의해 수행된다. 이들 인코딩 방식들은 2진과 같은, 디지털 데이터 포맷으로부터 DNA 분자 서열 포맷으로의 1차 변환을 제공한다.
어느 BES 가 적합한지는 도 11 에 예시된 바와 같은, 센서의 식별가능한 신호 특징 세트들에 직접 관련된다. 도 29 는 예시적인 2진 데이터 페이로드, 즉 도면의 상단에 나타낸 32-비트 단어를 이용한 이러한 여러 1차 인코딩들을 예시한다. 나타낸 예시적인 2진 인코딩 방식들 (BES) 은 다음과 같다:
BES1: 이들 특징들을 식별할 수 있는 판독기 센서와의 사용 (예컨대, 도 22) 을 위한, 4개의 표준 DNA 문자들로의 4개의 2 비트들 (하나의 DNA 문자 당 2개의 2진 비트들) 의 표준 인코딩;
BES2: 이들을 식별할 수 있는 (예컨대, 도 23 에서 T 와 G 사이를 식별하는) 판독기 센서와의 사용을 위한, 2개의 염기들로의 2개의 2진 숫자들 (하나의 DNA 문자 당 하나의 2진 비트) 의 인코딩;
BES3: 이들 특징들을 식별할 수 있는 (예컨대, 도 24 에서 AA 와 CCC 사이를 식별하는) 판독기 센서와의 사용을 위해 2개의 2진 상태들을 인코딩하기 위해 2개의 2진 숫자들을 염기들의 2개의 런들 AA 및 CCC (DNA 문자들 당 하나의 2진 비트의 하나의 런) 로 인코딩하는 것;
BES4: 주형 내 이들 변형된 염기들을 식별할 수 있는 (예컨대, 도 26c 에서 X 및 Y 를 식별하는) 판독기 센서와의 사용을 위해, 2개의 변형된 염기들 X, Y 로 이루어지는 DNA 분자들 (하나의 변형된 염기 당 하나의 2진 비트) 을 이용하여, 2개의 2진 상태들을 인코딩하는 것;
BES5: 모든 8개의 염기 특징들 사이를 식별할 수 있는 (예컨대, 도 26d 에서 A, C, G, T, X, Y, Z, 및 W 사이를 식별가능한) 센서와의 사용을 위해, 4 개의 천연 염기들 및 4 개의 변형된 염기들로 이루어지는 DNA 분자들을 이용하여, 8개의 가능한 1/0 3-비트 상태들 (데이터의 하나의 DNA 염기 또는 변형된 염기 당 3-비트들) 을 인코딩하는 것; 및
BES6: 이들 모티프들의 신호들을 식별할 수 있는 (예컨대, 도 26a 에서 GATT 와 ACA 사이를 식별하는) 판독기 센서와의 사용을 위해, 2개의 DNA 서열 모티프들을 이용하여, 2개의 2진 상태들 (하나의 DNA 서열 모티프 당 하나의 2진 비트) 을 인코딩하는 것.
도 29 의 예들에서 볼 수 있는 바와 같이, 멀티-비트 인코딩 방식들 BES1 및 BES5 에 대한 2진 데이터 페이로드의 인코딩은 2진으로부터 DNA 서열로 전달할 때 인코딩 스트링의 길이를 단축시키지만, 다중 염기 인코딩 방식들 BES3 및 BES6 은 인코딩 시 인코딩 스트링의 길이를 증가시킨다. 합성된 DNA 정보 인코딩 분자들의 길이를 감소시키는 것이 높은 우선순위일 때, 예컨대, 예를 들어, 기록 기술에 대한 올리고 길이에 대해 실질적인 한계들이 있을 때, 더 짧은 서열들을 발생시키는 코드 방식들이 바람직하다. 또한, 도 29 의 예들에서 볼 수 있는 바와 같이, BES2 및 BES4 방식들은 2진으로부터 DNA 서열로 전달할 때에 인코딩 스트링의 길이를 유지한다. 도 29 를 추가로 참조하면, 도면의 하부 부분은 (도면의 상단에서의) 예시적인 2진 데이터 페이로드 단어를 인코딩 방식들 BES1, BES2, BES3 및 BES5 로 변환할 때 얻어지는 DNA 서열들을 개시한다.
본원에서 사용하기 위한 2진 인코딩 방식들은 도 29 에 개시된 예들에 한정되지 않으며, 도 29 에 나타낸 것에 대한 다수의 변형예들 또는 유사한 인코딩 방식들이 또한 이들 예들에, 예컨대, 사용된 문자들을 치환하거나, 또는 서열분석 모티프들의 길이들, 서열 모티프들의 조성물, 및/또는 변형된 또는 유사 염기들의 선택을 변경함으로써, 내재되어 있다. 또한, 모든 이러한 인코딩 방식들이 인코딩 특징들의 신호들을 식별할 수 있는 동족 센서를 가지며 따라서 특징들을 식별할 때에 BES 의 선택들이 센서의 특성들에 직접 관련된다는 것을 알 수 있다. 또한, 도 29 의 예들이 1, 2 또는 4 비트들의 비트 인코딩들을 설명할 때 편의성을 위해, 2, 4 또는 8 개의 식별가능한 특징들을 갖는 경우들을 예시하지만, 2진 데이터의 인코딩들이 도 26b 의 센서에서와 같은 3 개의 식별가능한 특징들과 같은, 임의 개수의 식별가능한 신호 특징들에 기초하여 이루어질 수 있음을 알 수 있다.
다양한 실시형태들에서, 010011100010 와 같은 2진 데이터로서의 정보는 3개의 상태들 A, B, C 를 이용하여 인코딩될 수도 있으며, 여기서, 0 은 A 로 인코딩되고, 1 은 B 로 인코딩되고, 00 은 00 이 발생할 때마다 (즉, 00 을 AA 로서 인코딩하지 않기 위해) C 로서 인코딩된다. 이 방식에 따라서, 2진 단어 010011100010 은 인코딩된 형태 ABCBBBCABA 와 같다. 이와 유사하게, 16진, 10진, ASCII, 등과 같은, 2진 이외의 디지털 데이터 포맷들 또는 알파벳들은 도 29 에 예시된 방식들과 같은 유사한 방식들에 의해 동일하게 인코딩될 수 있다. 이러한 방법들은 컴퓨터 과학 분야의 당업자에게 널리 알려져 있다. Lempel-Ziv 인코딩과 같은, 최적의 정보 밀도의 관점에서 나타낸 것들보다 보다 복잡한 방식들은 데이터를 하나의 알파벳으로부터 다른 알파벳으로 고도로 효율적으로 변환하여 압축할 수 있다.
일반적으로, 2진 또는 다른 디지털 데이터 페이로드 스트링 또는 스트링들의 컬렉션을 DNA 서열 스트링 또는 이러한 스트링들의 컬렉션으로 변환하기 위해, 컴퓨터 과학에서 널리 공지된 방법들과 같은, 무손실 및 손실 인코딩 또는 압축의 많은 방법들이 도 29 의 예들을 일반화하는, 식별가능한 특징 DNA 세그먼트들의 스트링들로서의 DNA 서열 데이터 페이로드들로의 입력 디지털 데이터 페이로드들의 1차 변환을 위한 방식들을 고안하는데 사용될 수 있다. 이러한 더 넓은 상황에서, 도 29 에 예시된 BES 방식들은 표준 염기들, 변형된 염기들, 또는 서열 모티프들 또는 런들과 같은, 데이터 인코딩을 위한 알파벳의 심볼들이 될 수 있는 특징 엘리먼트들의 유형을 예시하며 이러한 엘리먼트들은 동족 판독기 센서를 가져야 한다.
예시적인 실시형태에서, 센서는 본원에서 "a", "b", 및 "c" 로서 각각 표시된, 센서 모티프들 CCC, AA, 및 G 사이를 식별하며, 2진 데이터 스트링은 무손실 또는 손실 데이터 인코딩 또는 압축 방식에 따라서 이들 심볼들로 스트링 "aabcacb" 로서 인코딩된다. 이 실시형태에서, 스트링 aabcacb 는 DNA 서열들 CCC, CCC, AA, G, CCC, G, 및 AA 로 직접 변환될 것이다. 이들 세그먼트들은 그후 DNA 데이터 페이로드 서열, 이 경우, CCCCCCAAGCCCGAA 로 직접 변환될 수 있다.
특정의 변형예들에서, 식별가능한 신호 특징들 사이에 삽입된 "구두점" 서열들이 있을 수 있는데, 이는 식별가능한 특징들을 변경하지는 않지만 DNA 합성 화학의 특수 특성들 또는 제약들을 수용하거나, 신호 특징들 사이의 추가된 시간 분리에 대한 스페이서들을 제공하거나, 또는 DNA 분자의 2차 구조를 향상시키는 것과 같은 이점들을 제공할 수도 있다. 예를 들어, T 가 이러한 구두점 서열이면, 상기 예에서의 DNA 인코딩 서열은 TCCCTCCCTAATGTCCCTGTAAT 이 될 것이다 (즉, 구두점 "T" 가 서열 세그먼트들 CCC, CCC, AA, G, CCC, G, 및 AA 의 각각 사이에 삽입된다). 일반적으로, 이러한 구두점 서열들 또는 필러 서열들의 삽입은 디지털 데이터 페이로드로부터 합성될 DNA 인코딩 서열로 변환하는 프로세스의 부분일 수도 있다.
본 개시물의 다양한 양태들에서, 관심 DNA 데이터 페이로드는 DNA 저장로부터의 디지털 데이터의 보다 강건한 복구를 제공하기 위해 폴리머라제 센서에 의해 여러번 프로세싱된다. 다른 양태들에서, 이러한 페이로드들의 평균 컬렉션은 여러번 일부 예상된 횟수로 프로세싱된다. 이들 예들은 다수의 관측들을 집계함으로써 인코딩 식별가능한 특징들의 더 정확한 추정으로부터 이점을 얻는다. 다중 프로세싱은 또한 기본 푸아송 샘플링 통계적 다양성을 극복하여 높은 신뢰도로, 관심 데이터 페이로드가 적어도 한번, 또는 적어도 일부 바람직한 최소의 횟수로 샘플링되고 관측되도록 보장하는 이점을 갖는다.
다양한 실시형태들에서, 이러한 반복 질의들의 횟수는 1 내지 약 1000배의 범위, 또는 약 10 내지 100배의 범위이다. 이러한 다수의 관측들은 다음을 포함할 수도 있다: (i) 폴리머라제 센서에 의한 동일한 물리적인 DNA 분자의 관측들, 및/또는 (ii) 동일한 데이터 페이로드를 반송하는 다수의, 물리적으로 별개의 DNA 분자들을 프로세싱하는 하나 이상의 폴리머라제 센서들. 후자의 경우에, 동일한 데이터 페이로드를 가진 이러한 다수의, 물리적으로 별개의 DNA 분자들은 동일한 벌크 합성 반응에 의해 발생된 DNA 분자들, 동일한 데이터 페이로드를 표적화하는 별개의 합성 반응들로부터 얻어진 분자들, 또는 PCR, T7 증폭, 롤링 서클 증폭, 또는 분자 생물학 분야의 당업자에게 알려진 복제의 다른 형태들과 같은, 증폭 또는 복제 방법들을 적용함으로써 발생된 복제 분자들일 수도 있다. 이러한 다수의 관측들의 집계는 평균화 또는 투표, 최대 우도 추정, 베이지안 추정, 은닉 Markov 방법들, 그래프 이론 또는 최적화 방법들, 또는 심층 학습 신경망 방법들과 같은 다수의 방법들을 통해서 이루어질 수도 있다.
본 개시물의 다양한 양태들에서, 분자 생물학 방법들은 폴리머라제 센서가 동일한 DNA 분자 데이터 페이로드를 여러 번 조사가능하게 한다. 주형 아키텍쳐들의 3개의 이러한 실시형태들이 도 27b 에 도시된다. 하나의 이러한 방법은 예컨대, 말단들의 라이게이션을 통해서, 분자를 원형화하고 (상부 도면), 원 둘레에서 여러 번 프로세스를 반복할 수 있는 가닥 치환 폴리머라제를 이용함으로써, 동일한 분자의 다수의 판독들을 발생시키는 것이다. 다른 방법은 헤어핀 듀플렉스를 가지고 (중간 도면), 그리고, 하부 가닥을 프로세싱하고, 헤어핀 특징 둘레를 감싸고, 그리고 일부 실시형태들에서, 또한 하부 가닥 식별가능한 신호들에 관련된 식별가능한 신호들을 제공할 수도 있는 상보적 서열을 포함하는 분자의 상부 가닥을 프로세싱하는 가닥 치환 폴리머라제를 이용하는 것이다. 도 27b 의 하부도에 예시된, 하나의 다른 실시형태는 프로세스적 (processive) 효소가 동일한 데이터 페이로드의 다수의 인스턴스들을 통해서 프로세싱하도록 한번 이상 반복된 데이터 페이로드의 탠덤 반복으로 주형 분자를 구성하는 것이다.
본 개시물의 다양한 실시형태들에서, DNA 에 저장된 디지털 데이터는 예컨대, 대규모 자기 테이프 저장 시스템들에서 가능한 것 처럼, 디지털 데이터의 복구를 위해 초 당 1 기가바이트에 근접하는 높은 레이트로 판독된다. 폴리머라제 효소의 최대 프로세싱 속도가 유형에 따라서 초 당 100-1000 염기들의 범위이기 때문에, 폴리머라제-기반 센서의 비트 복구 레이트가 비교할만한 속도에 제한된다. 따라서, 다양한 실시형태들에서, 수백만개의 센서들이 원하는 데이터 판독 용량을 달성하기 위해 비용 효과적인 포맷으로 배치된다.
다양한 실시형태들에서, 다수의 개별 분자 센서들이 본원에서 CMOS 칩 상에 대규모 센서 어레이로 배치되며, 이는 가장 비용-효과적인, 반도체 칩 제조 프로세스이다. 도 30a 는 칩 상에 분자 센서들의 대규모 병렬 어레이를 생성하는데 사용가능한 제조 스택의 일 실시형태를 예시한다. 이 예에서, 센서 측정 회로부는 CMOS 칩 상에 스케일러블 픽셀 어레이로서 배치되며, 나노-스케일 리소그래피 프로세스는 나노-전극들을 제조하는데 사용되며, 용액 내에서의, 분자 자가-어셈블리 화학 반응들은 분자 복합체를 센서 어레이의 각각의 나노-전극 상에 확립하기 위해 사용된다. 이 제조 스택의 결과는 도 30a 의 저부에 나타낸 완성된 DNA 판독기 센서 어레이 칩이다. 다양한 실시형태들에서, 나노 규모 리소그래피가 CMOS 칩 제조의 경제성을 레버리지하기 위해, 28 nm, 22 nm, 20 nm, 16 nm, 14 nm, 10 nm, 7 nm 또는 5 nm 노드들과 같은, 고분해능 CMOS 노드를 이용하여 이루어진다. 이에 반해, 픽셀 전자 기술은 180 nm, 130 nm, 90 nm, 65 nm, 40 nm, 32 nm 또는 28 nm 와 같은, 혼합된 신호 디바이스들에 더 적합한 더 거친 노드에서 이루어질 수도 있다. 대안적으로, 나노-전극들은 e-빔 리소그래피, 나노-임프린트 리소그래피, 이온 빔 리소그래피, 또는 극 UV 또는 심 UV 리소그래피, 다수의 패터닝, 또는 위상 시프팅 마스크들의 임의의 조합들과 같은 포토리소그래피의 진보된 방법들과 같은, 나노제조의 당업자에게 알려져 있는 다양한 다른 제조 방법들 중 임의의 방법에 의해 제조될 수도 있다.
도 30b 는 연관된 전력 및 제어 회로부 및 주요 블록들, 예컨대 바이어스, 아날로그-대-디지털 변환기들, 및 타이밍과 함께, 센서 픽셀들의 스케일러블 어레이를 포함하는 DNA 서열분석 칩을 위한 하이-레벨 CMOS 칩 픽셀 어레이 아키텍처의 일 실시형태를 (도면의 좌측면에) 예시한다. 도면 내 삽입도는 작은 가교된 구조로서 개별 센서 픽셀을, 그리고 이 개별 전자 센서가 센서 픽셀들의 어레이에 위치되는 장소를 나타낸다. 도 30b 는 또한 어레이 내 분자 전자소자 센서 회로 픽셀의 일 실시형태의 세부 사항들을 (도면의 우측면에) 예시한다. 도 30b 에 예시된 바와 같이, 센서 픽셀은 증폭기, 리셋 스위치, 및 소스, 게이트 및 드레인 전압들, 및 결과들의 판독치를 공급하는 회로부를 포함한다. 다양한 실시형태들에서, 단일 픽셀 회로부는 트랜스-임피던스 전류 증폭기, 전압-바이어스 가능 소스, 리셋 스위치들을 포함한다. 도 31 은 10 pA 전류를 측정하는데 사용될 때 전압 신호 대 시간을 나타내는 도면의 우측면에의 시뮬레이션 결과들, 및 플롯으로 표시된 바와 같이 주기적으로 인가된 리셋과 함께, 픽셀 증폭기의 회로 개략도의 일 실시형태를 도면의 좌측면에 자세하게 나타낸다. 이 실시형태는 회로 컴포넌트들 및 파라미터들 (트랜지스터, 저항기들, 커패시터들, 등) 의 하나의 비한정적인 선택을 예시한다.
도 32 는 주석이 달린 칩 설계 레이아웃 파일 및 비교를 위한 대응하는 완성된 칩의 일 실시형태를 예시한다. 도 32 의 좌측에는, 256 개의 픽셀들을 갖는 도 30b 의 CMOS 픽셀 어레이를 포함하는 칩 설계용 렌더링된 레이아웃 (GDS) 파일의 주석이 달린 이미지가 있으며, 칩의 바이어스, 어레이 및 디코더 영역들의 로케이션을 나타내기 위해 주석이 달려 있다. 도 32 의 우측에는, TSMC Inc. 반도체 파운드리 (산호세, CA) 에서 TSMC 180 nm CMOS 프로세스로 패시베이션 층 없이 제조된, 최종 설계에 기초한 대응하는 완성된 칩의 광학 현미경 이미지이다.
도 33 은 도 32 의 완성된 CMOS 칩의 SEM 이미지들을, 나노 전극들 및 전극들 사이의 제자리에 있는 폴리머라제 분자 복합체를 포함하는 판독기 시스템을 위한 80 μm 픽셀을 추가로 나타내는 고해상도 이미지들과 함께, 나타낸다. 도 33 의 좌측에는, 상부 패시베이션 층 및 노출된 평탄화된 금속 6 층이 없는, CMOS 칩의 SEM 이미지이다. 중간의 더 높은 해상도 이미지는 80 μm 픽셀의 서브-광학 표면 특징들, 특히 나노 전극들이 사후-CMOS 나노제조 프로세싱 단계들에 의해 퇴적되고 도 30b 의 우측 부분에 나타낸 바와 같은 증폭기 회로에 전기적으로 접속된 노출된 비아들 (소스, 게이트, 및 드레인) 을 명확히 나타낸다. 도 33 에서의 최우측 SEM 이미지는 제자리에 분자 복합체를 갖는 이격된 나노 전극들의 e-빔 리소그래피 제조된 쌍을 나타낸다. 도 33 의 우하측에서의 스케치는 금 도트로 표지링된 폴리머라제 분자 복합체를 포함하는 분자 전자소자 센서의 예시이다.
DNA 판독기 디바이스의 다양한 실시형태들에서, 나노-스케일 제조 기술들과 함께 CMOS 칩 디바이스의 사용은, 궁극적으로 휠씬 저렴한 비용, 높은 처리량, 빠르고, 스케일러블 시스템을 야기한다. 예를 들어, 이와 같은 센서들은 DNA 주형들을 초 당 10 이상의 염기들의 레이트로, 현재의 광학 서열분석기들보다 100 배 이상 더 빠르게 프로세싱할 수 있다. CMOS 칩 기술의 사용은 반도체 산업의 거대한 기반구조를 레버리지하는 대량-생산가능한 포맷으로 스케일러빌리티 및 낮은 시스템 비용을 보장한다. 언급한 바와 같이, DNA 센서에 존재할 수도 있거나, 또는 (예컨대, 더 낮은 시간 해상도에서 효소 또는 버퍼 또는 온도 또는 환경 인자들, 또는 샘플 데이터를 수정함으로써) 더 빠른 판독 속도로 발생할 수도 있는 모든 에러 모드들 또는 정확도 한계들이 설명된 전체 인코더/디코더-판독기-기록기 프레임워크에서 보상될 수 있다.
본 개시물의 다양한 실시형태들에서, 본원에서 사용하기 위한 DNA 판독기 칩은 적어도 1,000,000 개의 센서들, 적어도 10,000,000 개의 센서들, 적어도 100,000,000 개의 센서들, 또는 적어도 10억개의 센서들을 포함한다. 10 kHz 의 전형적인 센서 데이터 샘플링 레이트로 인식하고 측정 당 1 바이트를 기록하면, 100,000,000 개의 센서 칩은 원시 신호 데이터를 초 당 1 테라바이트 (TB) 의 레이트로 발생한다. 얼마나 많은 센서들이 단일 칩 상에서 바람직한지를 고려할 때, 하나의 중요 고려사항은 바람직한 디지털 데이터 판독 레이트들과 비교한, 이러한 칩이 DNA 에 저장된 디지털 데이터를 디코딩할 수 있는 레이트이다. 예를 들어, 초 당 최대 약 1 기가바이트의 레이트로 디지털 데이터를 판독하는 것이 바람직하다. DNA 로서 인코딩된 디지털 데이터의 각각의 비트는, 이 정보를 저장하는데 사용된 신호 사용의 특징을 고려할 때, 복구하기 위해 다수의 신호 측정들을 필요로 할 것이므로, 측정된 신호에 대한 이 원시 신호 데이터 생산 속도가 인코딩된 디지털 데이터의 복구 레이트보다 휠신 더 높을 것이라는 점에 유의한다. 예를 들어, 도 11 에서와 같은 신호 특징들의 경우 처럼, 1 비트의 저장된 디지털 데이터를 복구하는데 10 번의 신호 측정들이 요구되면, 1 비트의 저장된 디지털 데이터를 복구하기 위해, 각각의 측정은 8-비트 바이트, 즉, 80 비트들의 신호 데이터이다. 따라서, 디지털 데이터 판독 레이트들은 센서 원시 신호 데이터 획득 레이트보다 대략 100배 더 느릴 것으로 예상된다. 이러한 이유로, 1 기가바이트/sec 의 바람직한 디지털 데이터 판독 레이트를 달성하는 것은 사용가능한 원시 신호 데이터의 거의 0.1 TB/sec 를 필요로 할 것이다. 또, 단일 칩 내 모든 센서들이 사용가능한 데이터를 생성할 수 있는 것이 아니라면, DNA 로서 저장된 데이터로부터의 원하는 최종 디지털 데이터 복구 레이트들에 기초하여, 원시 데이터의 최대 1 TB/sec 를 발생시키는 칩들에 대한 요구가 바람직하다. 다양한 실시형태들에서, 이러한 복구 레이트들은 100,000,000 개의 센서 픽셀 칩에 대응한다.
본 개시물의 다양한 실시형태들에서, 다수의 칩들이 원하는 시스템-레벨 디지털 데이터 판독 레이트들을 달성하기 위해 판독기 시스템 내에 배치된다. 도 30a 의 DNA 데이터 판독기 칩은 다양한 실시형태들에서, DNA 에 저장된 디지털 데이터를 판독하기 위한 완전한 시스템의 부분으로서 배치된다. 완전한 시스템의 일 실시형태의 특징들이 도 34 에 예시된다. 다양한 양태들에서, 그리고 도 34 를 참조하면, 완전한 디지털 데이터 판독 시스템은 단일 칩의 한계들을 넘어서 데이터 판독 처리량을 제공하기 위해, 다수의 칩들의 어레이에 대한 스테이징 영역을 갖는 마더보드를 포함한다. 이러한 칩들은 유동 셀들에, 센서 시스템 액체 시약들의 추가 및 제거를 제어하는 유체공학 액체 처리 시스템과 함께, 개별적으로 하우징된다. 게다가, 유체공학 시스템은 데이터 저장소 소스로부터 발생하는 DNA 인코딩 데이터를 용액 형태로 수신한다. 다양한 양태들에서, 마더보드는 원시 신호 데이터를 매우 높은 레이트들, 예컨대, 1 TB/sec 초과, 10 TB/sec 초과, 또는 100 TB/sec 초과로 수신하고 감소시킬 수 있는, 1차 신호 프로세서로서 표시된, 적합한 제 1 스테이지 데이터 프로세싱 유닛을 더 포함한다. 이 1차 프로세서는 FPGA, GPU, 또는 DSP 디바이스, 또는 커스텀 신호 프로세싱 칩 중 하나, 다수, 또는 조합들을 포함할 수도 있으며, 이는 선택적으로 프로세싱 파이프라인을 위한 유사한 이러한 신호 프로세서들의 스테이지들이 뒤따를 수도 있다. 이 1차 파이프라인의 데이터 출력은 전형적으로 솔리드 스테이트 드라이브와 같은 고속 데이터 저장 버퍼로 전송되며, 여기로부터의 데이터는 CPU-기반 서브-시스템에서 추가적인 프로세싱 또는 디코딩을 경험하며, 이로부터 데이터가 저 속도 대용량 저장 버퍼, 예컨대 하드 드라이브 또는 솔리드 스테이트 드라이브 또는 이러한 드라이브들의 어레이로 버퍼된다. 거기로부터, 목적지로의 디코딩된 데이터의 후속 전송을 처리하는 보조 데이터 전송 컴퓨터 서브-시스템로 전송된다. 모든 이들 시스템 동작들은 이들 기능 유닛들 및 프로세스들의 상호작용을 모니터링, 조정 및 제어하는 보조 제어 컴퓨터의 하이-레벨 제어 하에 있다.
다양한 실시형태들에서, 판독기 시스템 내 칩들은 1회용이며 특정의 듀티 사이클, 예컨대 24 시간 내지 48 시간 이후 교체될 수도 있다. 다른 실시형태들에서, 칩들은 이러한 사용 구간 이후 제자리에 재조정될 수도 있으며, 이에 의해, 분자 복합체, 어쩌면 컨쥬게이션 기들이 제거된 후, 심각한 화학적 용액 노출들을 통해서 새로운 이러한 컴포넌트들로 대체된다. 제거 프로세스는 전극들에 인가되는 증가된 전압들, 전극들에 인가되는 교류 전압, 또는 전압 스윕과 같은, 구동 제거를 구동하기 위해 전극들에 인가되는 전압들을 이용하는 것을 포함할 수도 있다. 프로세스는 또한 높은 몰농도 우레아, 또는 구아니딘 또는 다른 카오트로픽제들, 프로테아제들, 예컨대 단백분해효소 K, 산들, 예컨대 HCl, 염기들, 예컨대 KOH 또는 NaOH, 또는 이러한 제안들을 위한 분자 생물학 및 생화학 분야에 널리 공지된 다른 제제들과 같은 기들을 변성, 용해 또는 해리, 또는 아니면 제거하는 화학물질들의 사용을 포함할 수도 있다. 이 프로세스는 또한 분자 복합체 내 광-절단성 기들 또는 컨쥬게이션 기들과 함께, 상승된 온도 또는 광과 같은, 제거를 구동하기 위해 적용된 온도 또는 광의 사용을 포함할 수도 있다.
도 35 는 도 34 에 예시된 바와 같은, 완전한 판독기 시스템이 특정 실시형태들에서, 전체 아카이브 저장 및 취출 시스템의 클라우드 DNA 판독기 서버를 제공하기 위해 집성 포맷으로 배치되는, 클라우드 기반 DNA 데이터 아카이브 저장 시스템의 일 실시형태를 예시한다. 도 35 의 시스템은 (도면의 좌상단에 도시된) 표준 저장 포맷을 갖는 클라우드 컴퓨터 시스템을 포함한다. 예컨대 표준 클라우드 컴퓨터 시스템은 나타낸 바와 같은 DNA 아카이브 데이터 저장 능력을 포함한다. 다양한 양태들에서, 클라우드-기반 DNA 합성 시스템은 클라우드 컴퓨터로부터 2진 데이터를 수신하여 물리적인 데이터 인코딩 DNA 분자들을 발생시킬 수 있다. 이 서버는 데이터를 인코딩하는 물리적인 DNA 분자들이 건조된 또는 동결건조 형태로, 또는 용액으로, 주변 온도, 냉각된 온도, 또는 냉동으로 저장되는 (도면의 하부 우측에 도시된) DNA 데이터 저장 아카이브에 출력 분자들을 저장한다. 데이터가 취출될 때, 아카이브로부터의 DNA 의 샘플이 DNA 데이터 판독기 서버로 제공되고, 이는 다시 디코딩된 2진 데이터를 1차 클라우드 컴퓨터 시스템으로 출력한다. 이 DNA 데이터 판독기 서버는 특정 실시형태들에서, 다시 1차 클라우드 저장 시스템의 원래 데이터 포맷으로의 DNA 유래된 데이터의 최종 디코딩을 수행하는 추가적인 컴퓨터들과 조합하여, 이러한 도 34 에 나타낸 바와 같은, 다수의 DNA 판독기 칩-기반 시스템들에 의해, 구동된다.
다양한 실시형태들에서, 분자 전자소자 센서는 도 36 에 예시된 구성을 포함한다. 이 경우, 기본적인 전자 측정들이 막의 양 측면 상의 전극들, 막에 국재된 기공, 및 기공의 양면 상에 있는 수용액 상으로 구성된 나노포어 이온성 전류 센서로 이루어진다. 이 실시형태에서, 기공은 (파선 화살표 및 "i" 로 표시된) 이온성 전류의 통과를 조절한다. 기공은 천연 또는 돌연변이화된 생물학적 단백질 나노포어를 포함할 수도 있으며, 막은 지질 막, 또는 이의 합성 유사체를 포함할 수도 있다. 기공은 또한 고체 상태 기공을 포함할 수도 있으며, 막은 SiN, 또는 테프론과 같은 고체 물질로 이루어지는 박막을 포함한다. 기공은 동일한 극성, 또는, 예시된 바와 같이, 대향 극성의 전극들을 가질 수도 있다. 도 36 에 나타낸 바와 같이, 폴리머라제 분자는 막을 통해서 기공의 부분으로서 매립된 적은 개수의 분자들을 포함하는 분자 복합체의 부분으로서 그리고 폴리머라제에의 컨쥬게이션을 제공하기 위해, 기공과 추가로 복합체화된다. 폴리머라제가 DNA 주형을 프로세싱함에 따라, 기공을 통한 이온성 전류가 이 활성에 의해 조절되어, 별개의 서열 특징들에 대응하는 식별가능한 신호 특징들을 발생시킨다. 나노-전기 측정의 상이한 기하학적 구조를 제외하고는, 달리, 고려사항들은 본원에서 이미 검토된 것들과 동일하다. 즉, 폴리머라제-기반 DNS 디지털 데이터 판독기의 나노-기공 전류 센서 버전들은 본원에서 유사하게 사용된다.
다양한 실시형태들에서, 분자 전자소자 센서는 도 37 에 나타낸 구성을 포함하며, 폴리머라제는 기공에 직접 그리고 특이적으로 컨쥬게이션되며, 변형된 dNTP들이 DNA 서열 특징들로부터 식별가능한 신호들을 발생시키는데 사용되며, 이는 나노-전극 센서에 대한 도 23 의 상황과 비교할만한 상황이다. 나노포어 센서에서 신호들을 발생시키기 위해, 이러한 dNTP 변형들은 dNTP 의 γ-포스페이트 상의 기들을 포함할 수도 있으며, 이는 dNTP 가 폴리머라제에 의해 혼입을 경험하는 동안 기공을 차단함으로써, 전류 억제 특징들을 초래할 수 있다. 다양한 실시형태들에서, 이러한 변형들은 트리-포스페이트 사슬을 4, 5, 6 또는 최대 12 포스페이트들까지 연장하는 것, 및 폴리머라제 혼입에 의해 제거되는 2 이상의 위치에서 말단 포스페이트 기들, 또는 기들을 포스페이트들 중 임의의 포스페이트에 첨가하는 것을 포함하며, 이러한 기들은 PEG 중합체들 또는 DNA 중합체들을 포함하는 것과 같이, 기공에 들어가서 기공을 차단할 수도 있는 중합체들을 포함한다. 기공에의 폴리머라제 컨쥬게이션은 분자 테더, 또는 Spy-SpyCatcher 단백질-기반 컨쥬게이션 시스템, 또는 기타 등등과 같은, 가능한 컨쥬게이션 화학들 중 임의의 하나를 포함할 수도 있다. 도 36 및 도 37 에 표시된 나노포어 센서 실시형태들에 있어서, 도 10b 의 상황에서 위에서 개시된 본 개시물의 모든 양태들은 또한 DNA 분자들에 저장된 디지털 데이터를 판독하기 위한 나노포어 이온 전류 센서-기반 센서, 및 관련된 유익한 양태들, 인코딩 방식들, 칩 포맷들, 시스템들 및 클라우드 기반 DNA 디지털 데이터 저장 시스템들을 제공하기 위해, 이 경우에도 적용된다.
도 15 에 개념적으로 예시된, 도 10b 의 분자 전자 센서의 일 실시형태는 (도 15 에 굵은 수평 바로 표시되며, 양극과 음극 사이의 간극을 가교하는) 가교 분자로서 탄소 나노튜브를 포함한다. 이 실시형태가 도 38 에 예시된다. 다양한 양태들에서, 탄소 나노튜브 가교는 단일 또는 다중 벽 탄소 나노튜브를 포함하며, 다수의 가능한 컨쥬게이션 화학들 중 임의의 컨쥬게이션 화학을 이용하여 특정의 부위에서 폴리머라제 분자에 컨쥬게이션된다. 이러한 컨쥬게이션은 예를 들어, 나노튜브에 나노튜브 상의 피렌의 π-적층을 통해서 부착되는 피렌 링커를 포함할 수도 있거나, 또는 탄소 나노튜브 상에 존재하는 결함 부위에의 부착을 포함할 수도 있다. 이 경우, 탄소 나노튜브 분자 와이어를 통과하는 전류는 도 10a 에 나타낸 바와 같이 주위 환경에서 고도로 민감한 다른 분자들인 것으로 알려져 있다. 또한, 탄소 나노튜브를 통과하는 전류는 폴리머라제 효소들을 포함한, 그 나노튜브에 적절하게 컨쥬게이션된 효소 분자의 활성에 민감한 것으로 알려져 있다. 이 특정의 실시형태에 있어서, 위에서 개시된 모든 본 개시물의 양태들은 관련된 유익한 양태들, 인코딩 방식들, 칩 포맷들, 시스템들 및 클라우드 기반 DNA 디지털 데이터 저장 시스템들을 포함하여, DNA 분자들에 저장된 디지털 데이터를 판독하기 위한 탄소 나노튜브 기반 센서를 제공하기 위해, 이 경우에 적용된다.
광학 신호들을 발생시키는 대안적인 센서는 도 39 에 예시된 센서와 같은, 제로 모드 도파관 센서이다. 이러한 센서는 내부 전반사 모드에서, 얇은 기판에 인가되는 여기 필드의 소멸 구역에서, 금속성 웰의 저부에 컨쥬게이션된, 나타낸 바와 같은 단일 폴리머라제를 포함할 수도 있다. 폴리머라제에는 절단가능한 포스페이트 기 상에 염료 표지들을 갖는 dNTP들 및 프라이밍된 주형이 제공된다. 이러한 dNTP 가 혼입될 때, 염료 표지는 소멸 필드에 유지되며, 대응하는 염료 에너지 스펙트럼 또는 칼라의 광자들을 방출하도록 자극된다. 그 결과는, 적합한 조건들 하에서, 이러한 센서는 표시된 바와 같은 식별가능한 광학 신호들을 발생시킬 수도 있으며 이는 디지털 정보를 DNA 분자들로 인코딩하는데 사용될 수 있다는 것이다. 여기서, 식별가능한 신호들은 상이한 에너지 분포, 또는 칼라의 광자 방출들, 또는 상이한 식별가능한 스펙트럼들, 또는 스펙트럼들의 상이한 지속기간 또는 강도 또는 형상 대 시간을 갖는 방출들, 또는 식별가능한 특징들을 초래하는 이러한 요소들의 임의의 조합일 수도 있다. 도 39 에 표시된 이 제로 모드 도파관 센서 실시형태에 있어서, 도 10b 의 상황에서 위에서 개시된 모든 본 개시물의 양태들은 또한 DNA 분자들에 저장된 디지털 데이터를 판독하기 위한 제로 모드 도파관-기반 센서, 및 관련된 유익한 양태들, 인코딩 방식들, 칩 포맷들 (이 경우, 이미지 센서 칩들과 같은 광학 센서 칩들) 을 제공하기 위해 이 경우에도 적용되며, 시스템들 및 클라우드 기반 DNA 디지털 데이터 저장 시스템들이 이러한 센서에 적용될 수도 있다.
DNA 기록 디바이스의 최적화
다양한 실시형태들에서, 본 개시물의 DNA 정보 저장 시스템은 다수의 합성된 분자들에 매립된 각각의 원하는 서열, 및 합성의 레이트, 또는 염기 당 시간으로, DNA 정보를 기록하는 전체 레이트가 대규모 아카이브 정보 저장에 실제로 사용하기에 충분히 빠르고 충분한 양이 되도록 가능한 한 빠르게, 다수의 DNA 서열들을 합성된 분자들로서 병렬로 기록할 수 있는 DNA 기록 디바이스를 더 포함한다.
전형적인 포스포라미다이트 화학 사이클에 기초한 현재의 상업적 DNA 합성은 상대적으로 느리며, 대략 30 분 당 염기 첨가를 필요로 한다. 30 분 염기 추가 사이클의 대부분은 연장되는 올리고뉴클레오티드 사슬의 원위 말단 상의 5'-OH 의 산-매개 디프로텍션이다. 이들 산 조건들에의 초기 서열들의 장기간 노출은 또한 탈-푸린화를 통해서 서열 에러의 주요한 소스를 생성한다. 이 방법은 또한 고가의 기구 상의 384 웰-플레이트들에서 수행되는 상대적으로 낮은 병렬성 (parallelism) 으로 고통을 받는다. 프로세스는 또한 단계적 합성에서의 효율 수율 한계들로 인해 최대 수백 염기들 길이의 서열들을 만드는 것에 제한된다. 따라서, 이 방법은 적은 개수 (1 내지 천개) 의 상대적으로 짧은 (< ~200 염기) DNA 서열들 각각을 대량으로 만드는데 가장 적합하다.
더 높은 처리량 상업적 DNA 합성 시스템들이 DNA 마이크로어레이들의 현장 합성을 지원하기 위해 개발되었다. 이러한 시스템들은 사실상 현장 합성된 DNA 의 마이크로-스팟들의 큰 어레이를 프린트하여, 스팟들에 걸쳐서 고도로 병렬적인 방법으로 한번에 하나의 염기를 첨가한다. 예를 들어, Agilent 잉크-제트-기반 DNA 올리고 어레이 프린터는 유리 현미경 슬라이드 상에 최대 1,000,000 개의 DNA 스팟들의 어레이를 프린트할 수 있으며, 각각의 스팟은 대략 20 마이크론 직경이고 직사각형 스팟들의 어레이에 대해 30-마이크론 스팟-대-스팟 피치이다. 합성 반응은 대략 시간 당 1 염기로 여전히 상대적으로 느리며, DNA 길이는 최대 ~100 염기들의 실현가능한 길이들로, 전형적인 웰-플레이트 합성보다 더 제한된다. 그럼에도 불구하고, 이와 같은 시스템들은 완성된 어레이에 대해 수백 달러의 비용으로 수 일내에 DNA 서열의 총 ~100,000,000 개의 문자들 (~25 MB) 을 합성할 수 있지만---기록 기구가 상용화되지 않을 정도로 높은 자본 비용 및 복잡성을 가지며, 이러한 DNA 어레이들의 제조가 제한된 용량을 갖는 중앙집중화된 공장 포맷으로 이루어진다. 더욱이, 스팟들/어레이의 측면에서 이 기술의 미래 업스케일링은 그 점근 한계 (asymptotic limit) 에 자체 도달하였을 수도 있는 기존 잉크-제트 기술을 레버리지한다는 점을 고려하면, 점근 한계에 이미 있을 수도 있다.
따라서, 대규모 아카이브 DNA 저장에 있어서, DNA 기록 디바이스의 실질적으로 저 비용들, 더 빠른 속도, 및 더 적은 자본 비용이 매우 바람직하다. 특히, 저장 기록 비용은 MB 당 $10 에 여전히 가까우며, 이는 자기 테이프 저장 기록에 대해 추정된 GB 당 $0.02 보다 (500,000배 이상) 휠씬 높다. 따라서, DNA 를 기록하는 비용들은 일반적인 장기 저장 애플리케이션들을 실현가능하게, 바람직하게는 수십배의 크기, 바람직하게는 1,000,000배로 만들기 위해 극적으로 삭감시켜야 한다.
이 목표를 달성하기 위해, 그리고 본 개시물의 특정의 실시형태들에서, 본원에서 사용하기 위한 DNA 기록 시스템은 DNA 합성을 위한 액추에이터들의 CMOS-칩 기반 어레이를 포함한다. DNA 기록기는 액추에이터 특정의 전압/전류 또는 광 매개된 5'-OH 디프로텍션을 지시하는 액추에이터 픽셀들의 어레이를 갖는 CMOS 칩으로 구성되며, 이에 의해 새로운 전압 또는 광 민감한 보호 기들이 탈-푸린화 에러들 없이 더 빠른 디프로텍션 동력학을 가능하게 한다. 다양한 양태들에서, 칩은 수백만에서 최대 수십억 개의 액추에이터 픽셀들을 포함한다. 이러한 픽셀들은 나노 전극 및/또는 선택가능한 광원을 포함할 수도 있으며, 그 주위에서 DNA 합성이 일어난다. 이 전극에 인가되는 전압, 또는 그에 공급되는 전류, 또는 국부적인 광 액추에이션은, 일련의 A, C, G, T, … 사이클릭 첨가 반응들이 칩 전반에 걸쳐서 전역적으로 일어남에 따라, 각각의 5'-OH 디프로텍션 반응을 제어할 것이며, 각각의 픽셀은 각각의 사이클 동안 전압 또는 전류 또는 광을 통해서, 공급된 염기의 첨가 또는 비첨가를 제어한다.
CMOS 칩 스케일링의 사용은 표준, 저비용, 대량 생산 칩 상에 수십억 개의 이러한 합성 부위들을 궁극적으로 제공하는 능력을 지원한다. 국부적인 전압/광 액추에이션은 또한 합성 화학을 가속시키고 ~30 분으로부터 초까지 사이클 시간을 단축시키는데 사용될 수 있다. 액추에이터 전극들은 예를 들어, 비-전형적인 포스포라미다이트 합성 화학을 조절하는 수단으로서 전압-발생된 산들을 제공하기 위해, 전압 또는 전류를 다른 유용한 전기화학 국부 환경 변화들로 변환하는 화학적 층들로 유도될 수도 있다. 다른 양태들에서, 전압/전류는 염기 추가를 물리적으로 방해하거나 또는 허용하는, 합성이 일어나는 국소 중합체/분자 매트릭스 구조의 입체형태 또는 입체적 또는 기계적 변화를 조절할 수도 있다. 특히, 이러한 시스템의 일 실시형태는 성장하는 DNA 올리고들을 함유하고 염기 첨가 반응들을 물리적으로 선택적으로 제어하기 위해 개폐하도록 구동될 수 있는 각각의 부위에 마이크로- 또는 나노-웰들 또는 용기들을 가질 수 있다. 첨가된 염기들은 또한 프로세스를 지시하고 제어하기 위해 전압 또는 광의 사용을 용이하게 하는 전하 또는 다른 변형들을 포함할 수도 있다. CMOS 칩 스케일링 및 포스포라미다이트 합성 사이클의 전압 또는 전류 또는 광-지향 합성 증강 (synthesis augmentation) 을 통해서, 스케일에서의 큰 증가들, 및 합성을 수행하는데 사용되는 프로세스 및 기구의 비용의 감소의 가능성이 있다. 각각의 부위로서 주어진 픽셀에 대한 각각의 표적 서열의 다수의 표본들 (exemplars) 로 구성된, 완성된 DNA 절편들은 서포트 사후-합성 (support post-synthesis) 으로부터 방출되고 용액에 모여 물리적인 아카이브를 형성할 수 있다.
이 및 다른 DNA 기록기 실시형태들의 상황에서, 인코딩/디코딩 알고리즘의 선택은 시스템 비용들, 특히 시간 비용들을 최소화활 수도 있다. 예를 들어, 탈인산화는 느린 프로세스이며, 염기들 및 서열들 중 일부 (예컨대, 푸린 대 아민, G 및 C 의 동종의 런들) 는 화학적 또는 2차 구조 효과로 인해 합성하기가 더 어렵다. 이는 탈인산화를 완료로 유도하지 않고, 더 많은 에러를 희생하여 시간을 절약하고, 그리고 또한 인코딩된 서열에서 특정의 염기 조성물들의 사용을 회피하여 (예컨대, 인코딩 시에, 푸린들을 사용하지 않거나, 또는 G, 등의 런들을 사용하지 않고) 주요한 추가된 에러 부담 없이 더 빠른 화학적 프로세싱을 가능하게 하는 옵션을 제시한다. 이렇게 하여 합성 반응이 가속화될 수 있으며, 인코딩/디코딩 알고리즘이 에러 정정 또는 에러 회피 인코딩의 관점에서 보상할 수 있다. 높은 에러 서열 모드들을 회피하는 것 이외에도, 표준 오차 정정 코드 알고리즘들은 DNA 서열에서 극도로 높은 에러의 레이트들, 심지어 최대 50% 이상의 극단적인 에러 레이트들을 정정할 수 있다. 다양한 양태들에서, 인코딩/디코딩은 전체 시스템 성능을 최적화하고/하거나, 금융 비용의 시간과 같은 일부 관심 비용 측정으로 전체 시스템 비용을 감소시키기 위해, DNA 판독기 및 DNA 기록기의 특성들과 공동-최적화된다.
DNA 저장 아카이브 동작들의 최적화
특정의 양태들에서, DNA 정보 저장 시스템은 DNA 저장 아카이브를 더 포함한다. DNA 정보 저장 시스템의 다양한 실시형태들에서, 신규한 방법들이 저장 아카이브들을 관리하는 것에 관련된 바람직한 동작들을 달성하기 위해 제공된다. 본 시스템의 다양한 실시형태들에서, 다음 유형들의 동작들이 수행될 수도 있다:
아카이브의 복제본을 생성한다;
데이터를 아카이브에 부가한다;
아카이브로부터 표적 볼륨을 판독한다;
아카이브로부터 볼륨을 삭제한다; 또는
아카이브를 탐색한다.
다양한 실시형태들에서, DNA 아카이브는 DNA 분자들의 풀을 포함하며, 각각의 원하는 DNA 서열은 다수의 분자 표본들로 표현된다. 이 DNA 분자들의 풀은 건조 상태로, 또는 낮은 온도로 유지되거나 또는 저장 상태에서 동결되는 것과 같은 용액 상으로 저장될 수도 있다. 특정의 예들에서, 아카이브는 이들 동작들을 수행하기 위해 호환가능한 버퍼 용액 내에서 일시적으로 최대 동작 온도들까지 상승될 수 있다. 이들 동작들은 물리적인 저장 시스템에 의해 효율적으로 수행될 것이며, 이는 냉동기들, 냉장고들, 및 튜브들의 처리를 자동화, 액체 처리, 반응들을 수행하는 것, 및 물리적인 아카이브 물질을 유지하고 조작하는 것에 관련된 다른 절차들을 포함할 수도 있다.
다양한 실시형태들에서, DNA 저장 아카이브에서의 저장-관련 동작들은 다음과 같이 달성될 수 있다:
복제: 아카이브를 복제하는 것은 원료 용액의 분취액을 취하거나, 또는, 고갈 없이 복제하기 위해, 분자 인코딩 증폭 프라이머 부위들에 포함시킴으로써, 분취액을 복제본으로서 취하기 전에, 선형 또는 지수함수 증폭 반응들로, 아카이브를 프라이밍하여 증폭하는 것을 포함할 수도 있다.
부가: 데이터를 아카이브에 부가하거나 또는 아카이브들을 병합하는 것은 추가적인 DNA 또는 아카이브 물질을 풀링 (pooling) 하여 혼합함으로써 달성될 수 있다.
표적화된 판독/삭제: 아카이브 내 개별 "볼륨들" 에 대한 작업은 DNA 분자들 서열-특이적 올리고 결합 부위들로 인코딩함으로써 수행될 수 있으며, 각각의 볼륨에 대한 상이한 식별자/결합 서열이 이렇게 액세스가능하게 된다. 그 후, 특정의 볼륨을 판독하기 위해, 혼성-기반 캡쳐가 단지 원하는 결합 서열들을 갖는 DNA 절편들만을 선택하기 위해 사용될 수 있다. 볼륨의 삭제는 주어진 결합 서열을 갖는 모든 DNA 절편들을 제거하기 위해 감산 (subtractive)-혼성 프로세스들에 의해 수행될 수 있다. 다른 실시형태에서, 삭제는 올리고-지향 DNA 절단/분해, 특히 표적 분자들의 올리고-결합 지향성 (directed) 파괴를 위해 Cleavase, DICER 또는 CRISPER 를 이용하는 효소 방법들을 이용함으로써 수행될 수 있다. 또한, 다른 실시형태에서, 프라이머 결합과 뒤이은 합성 또는 라이게이션 반응이 예컨대, 스트렙타아비딘 칼럼에 의해 제거되는 비오틴화된 엘리먼트들을 통해서 선택적 파괴 또는 제거를 가능하게 하는 염기들 또는 올리고들을 혼입시키는데 사용될 수도 있다. 볼륨 식별자들은 또한 DNA 를 뉴클레오티드 변형들로 합성함으로써 추가될 수 있으며, 따라서 관련된 결합 표적들은 DNA-서열 특이적 혼성 그 자체를 통하지 않고, 합성에 사용된 염기들 상의 다른 변형들이다. 예를 들어, 비오틴화된 염기들, 또는 다양한 합텐 변형들, 등을 갖는 염기들의 사용은 합성에 의도적으로 도입된 이들 변형들에 대한 대응하는 상호작용 파트너들을 통해서 DNA 의 서브세트들을 결함시키거나 또는 조작하는 선택적 능력을 유사하게 제공한다.
탐색: 리터럴 입력 스트링에 대한 아카이브의 탐색은 관심 탐색 스트링 또는 스트링들을 DNA 형태로 인코딩하고, 원하는 DNA 서열들에 대한 상보적 형태 또는 관련된 프라이머들을 합성하고, 그리고 혼성 또는 PCR 증폭을 이용하여, DNA 절편들의 복합체 풀 내 서열 세그먼트의 존재를 확인하기 위해 분자 생물학의 당업자들에 의해 사용되는 이러한 표준 분석시험들에 따라서, 이들 원하는 서열 절편들의 존재에 대한 아카이브를 분석함으로써, 달성될 수 있다. 탐색은 존재 유무를 보고할 수 있거나, 또는 완전한 판독을 위해 탐색 스트링을 포함하는 연관된 절편들을 찾아낼 수 있다.

Claims (24)

  1. 정보 저장 시스템으로서,
    정보의 세트를 인코딩하는 뉴클레오티드 서열을 기록하는 기록 디바이스; 및
    상기 뉴클레오티드 서열을 상기 정보의 세트로 디코딩함으로써 상기 뉴클레오티드 서열을 해석하기 위한 판독 디바이스를 포함하며,
    상기 판독 디바이스는 분자 전자소자 센서를 포함하며, 상기 센서는 이격된 전극들의 쌍 및 각각의 전극에 부착된 분자 복합체를 포함하여 분자 전자소자 회로를 형성하며, 상기 분자 복합체는 가교 분자 및 프로브 분자를 포함하며,
    상기 분자 전자소자 센서는 상기 뉴클레오티드 서열을 해석할 때 상기 분자 전자소자 센서의 측정가능한 전기 파라미터에서 식별가능한 신호들을 발생시키는, 정보 저장 시스템.
  2. 제 1 항에 있어서,
    상기 정보의 세트는 2진인, 정보 저장 시스템.
  3. 제 1 항에 있어서,
    상기 뉴클레오티드 서열은 DNA 서열을 포함하는, 정보 저장 시스템.
  4. 제 3 항에 있어서,
    상기 DNA 서열 내에 에러들을 최소화하기 위한 에러 검출 방식들 또는 에러 정정 방식들 중 적어도 하나를 더 포함하는, 정보 저장 시스템.
  5. 제 4 항에 있어서,
    상기 에러 검출 방식들은 반복 코드, 패리티 비트들, 검사합들, 순환 중복 검사들, 암호 해시 함수들 및 해밍 코드들 중에서 선택되며, 상기 에러 정정 방식들은 자동 반복 요청, 컨볼루셔널 코드들, 블록 코드들, 하이브리드 자동 반복 요청 및 Reed-Solomon 코드들 중에서 선택되는, 정보 저장 시스템.
  6. 제 1 항에 있어서,
    상기 기록 디바이스는 DNA 합성을 위한 액추에이터 픽셀들의 CMOS 칩 기반 어레이를 포함하며, 상기 액추에이터 픽셀들은 포스포라미다이트 또는 라이게이션 화학 반응들을 포함하는 DNA 합성 반응 내에서 전압/전류 또는 광-매개 디프로텍션을 지시하는, 정보 저장 시스템.
  7. 제 1 항에 있어서,
    상기 프로브 분자는 폴리머라제 효소를 포함하며, 상기 센서의 상기 측정가능한 전기 파라미터는 상기 폴리머라제 효소의 효소 활성에 의해 조절되는, 정보 저장 시스템.
  8. 제 7 항에 있어서,
    상기 폴리머라제 효소는 클레노브, Phi29, TAQ, BST, T7, 또는 역전사 효소 중에서 선택된 유전적으로 조작된 폴리머라제 효소 또는 천연 폴리머라제 효소를 포함하는, 정보 저장 시스템.
  9. 제 7 항에 있어서,
    상기 판독 디바이스는 버퍼 용액, 상기 측정가능한 전기 파라미터를 측정하기 위한 동작 파라미터들, 및 상기 폴리머라제에 의해 프로세싱되는 경우, 상기 버퍼 용액 및 상기 동작 파라미터들에 의해 제공되는 조건들에서 수행될 때 상기 측정가능한 전기 파라미터에서 상기 식별가능한 신호들을 발생시키는 DNA 주형 분자의 2개 이상의 서열 세그먼트들을 더 포함하는, 정보 저장 시스템.
  10. 제 9 항에 있어서,
    상기 버퍼 용액은 변형된 dNTP들을 포함하는, 정보 저장 시스템.
  11. 제 9 항에 있어서,
    상기 식별가능한 신호들을 발생시키는 상기 DNA 주형 분자의 상기 서열 세그먼트들은 상이한 DNA 염기들, 변형된 DNA 염기들, DNA 염기 유사체들, 다중 염기 서열들 또는 모티프들, 또는 DNA 염기들의 동종중합체 런들 (runs) 중 임의의 하나 또는 조합을 포함하는, 정보 저장 시스템.
  12. 제 1 항에 있어서,
    상기 센서의 상기 측정가능한 전기 파라미터는 상기 이격된 전극들 사이 그리고 상기 분자 복합체를 통한 소스-드레인 전류를 포함하는, 정보 저장 시스템.
  13. 제 1 항에 있어서,
    상기 분자 전자소자 센서는 상기 측정가능한 전기 파라미터의 측정을 수행하는 픽셀 회로부를 지원하고 복수의 분자 전자소자 센서들을 더 포함하는 CMOS 센서 어레이 칩의 부분인, 정보 저장 시스템.
  14. 제 1 항에 있어서,
    상기 분자 전자소자 센서는 상기 이격된 전극들에 인접한 게이트 전극을 더 포함하는, 정보 저장 시스템.
  15. 제 1 항에 있어서,
    상기 가교 분자는 2중 가닥 DNA 올리고머, 단백질 알파 나선, 그래핀 나노리본, 탄소 나노튜브, 항체, 또는 항체의 Fab 아암을 포함하는, 정보 저장 시스템.
  16. 폴리뉴클레오티드 분자의 뉴클레오티드 서열에서 인코딩된 정보의 세트를 해석하는 방법으로서,
    상기 폴리뉴클레오티드 분자를 상기 정보의 세트와 관련하여, 분자 전자소자 센서의 측정가능한 전기 파라미터에서 식별가능한 신호들을 발생시킬 수 있는 분자 전자소자 센서로 공급하는 단계;
    상기 식별가능한 신호들을 발생시키는 단계; 및
    상기 식별가능한 신호들을 상기 정보의 세트로 변환하는 단계를 포함하며,
    상기 분자 전자소자 센서는 이격된 전극들의 쌍 및 각각의 전극에 부착된 분자 복합체를 포함하여 분자 전자소자 회로를 형성하며, 상기 분자 복합체는 가교 분자 및 프로브 분자를 포함하는, 폴리뉴클레오티드 분자의 뉴클레오티드 서열에서 인코딩된 정보의 세트를 해석하는 방법.
  17. 제 16 항에 있어서,
    상기 정보의 세트는 2진인, 폴리뉴클레오티드 분자의 뉴클레오티드 서열에서 인코딩된 정보의 세트를 해석하는 방법.
  18. 제 16 항에 있어서,
    상기 뉴클레오티드 서열은 DNA 서열을 포함하는, 폴리뉴클레오티드 분자의 뉴클레오티드 서열에서 인코딩된 정보의 세트를 해석하는 방법.
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
KR1020197023020A 2017-01-10 2018-01-10 Dna 데이터 저장을 위한 방법들 및 시스템들 KR102622275B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762444656P 2017-01-10 2017-01-10
US62/444,656 2017-01-10
US201762547692P 2017-08-18 2017-08-18
US62/547,692 2017-08-18
PCT/US2018/013140 WO2018132457A1 (en) 2017-01-10 2018-01-10 Methods and systems for dna data storage

Publications (2)

Publication Number Publication Date
KR20190116297A KR20190116297A (ko) 2019-10-14
KR102622275B1 true KR102622275B1 (ko) 2024-01-05

Family

ID=62839566

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197023020A KR102622275B1 (ko) 2017-01-10 2018-01-10 Dna 데이터 저장을 위한 방법들 및 시스템들

Country Status (6)

Country Link
US (2) US10902939B2 (ko)
EP (1) EP3568407A4 (ko)
KR (1) KR102622275B1 (ko)
CN (1) CN110431148A (ko)
CA (1) CA3052062A1 (ko)
WO (1) WO2018132457A1 (ko)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109328301B (zh) 2016-01-28 2021-03-12 罗斯韦尔生物技术股份有限公司 大规模并行dna测序装置
US11624725B2 (en) 2016-01-28 2023-04-11 Roswell Blotechnologies, Inc. Methods and apparatus for measuring analytes using polymerase in large scale molecular electronics sensor arrays
KR20180104159A (ko) 2016-02-09 2018-09-19 로스웰 바이오테크놀로지스 인코포레이티드 전자 비표지 dna 및 게놈 시퀀싱
US10597767B2 (en) 2016-02-22 2020-03-24 Roswell Biotechnologies, Inc. Nanoparticle fabrication
US9829456B1 (en) 2016-07-26 2017-11-28 Roswell Biotechnologies, Inc. Method of making a multi-electrode structure usable in molecular sensing devices
US11177019B2 (en) * 2016-08-30 2021-11-16 Tsinghua University Method for biologically storing and restoring data
GB2563105B (en) 2016-11-16 2022-10-19 Catalog Tech Inc Nucleic acid-based data storage
US10650312B2 (en) 2016-11-16 2020-05-12 Catalog Technologies, Inc. Nucleic acid-based data storage
WO2018132457A1 (en) 2017-01-10 2018-07-19 Roswell Biotechnologies, Inc. Methods and systems for dna data storage
CA3052140A1 (en) 2017-01-19 2018-07-26 Roswell Biotechnologies, Inc. Solid state sequencing devices comprising two dimensional layer materials
US10508296B2 (en) 2017-04-25 2019-12-17 Roswell Biotechnologies, Inc. Enzymatic circuits for molecular sensors
EP3615685A4 (en) 2017-04-25 2021-01-20 Roswell Biotechnologies, Inc ENZYMATIC CIRCUITS FOR MOLECULAR SENSORS
EP3622086A4 (en) 2017-05-09 2021-04-21 Roswell Biotechnologies, Inc LINK PROBE CIRCUITS FOR MOLECULAR SENSORS
US10982276B2 (en) 2017-05-31 2021-04-20 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
US11174512B2 (en) 2017-05-31 2021-11-16 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
US11612873B2 (en) 2017-05-31 2023-03-28 Molecular Assemblies, Inc. Homopolymer encoded nucleic acid memory
CN111373049A (zh) * 2017-08-30 2020-07-03 罗斯威尔生命技术公司 用于dna数据存储的进行性酶分子电子传感器
US10810495B2 (en) * 2017-09-20 2020-10-20 University Of Wyoming Methods for data encoding in DNA and genetically modified organism authentication
WO2019075100A1 (en) 2017-10-10 2019-04-18 Roswell Biotechnologies, Inc. METHODS, APPARATUS AND SYSTEMS FOR STORING DNA DATA WITHOUT AMPLIFICATION
EP3766077A4 (en) 2018-03-16 2021-12-08 Catalog Technologies, Inc. CHEMICAL PROCESSES FOR DATA STORAGE BASED ON NUCLEIC ACIDS
KR102138864B1 (ko) * 2018-04-11 2020-07-28 경희대학교 산학협력단 Dna 디지털 데이터 저장 장치 및 저장 방법, 그리고 디코딩 방법
KR20210029147A (ko) 2018-05-16 2021-03-15 카탈로그 테크놀로지스, 인크. 핵산-기반 데이터를 저장하기 위한 조성물 및 방법
US11221966B2 (en) * 2018-06-05 2022-01-11 Arizona Board Of Regents On Behalf Of The University Of Arizona Method and system for biological information pattern storage and readout
KR20210053292A (ko) * 2018-08-03 2021-05-11 카탈로그 테크놀로지스, 인크. 오류 방지 기능을 갖춘 핵산 기반 데이터 저장 및 판독 시스템 및 방법
US11621345B2 (en) * 2018-08-14 2023-04-04 Pawan Tyagi Systems and methods of fabricating gate electrode on trenched bottom electrode based molecular spintronics device
WO2020132935A1 (zh) * 2018-12-26 2020-07-02 深圳华大生命科学研究院 一种定点编辑存储有数据的核酸序列的方法及装置
KR20210126028A (ko) * 2019-01-30 2021-10-19 아리조나 보드 오브 리젠츠 온 비하프 오브 아리조나 스테이트 유니버시티 생체 전자 회로, 시스템 및 이들을 제조하고 사용하기 위한 방법
CN114641578A (zh) * 2019-03-01 2022-06-17 通用测序技术公司 用于生物聚合物鉴定的装置和方法
KR20220017409A (ko) 2019-05-09 2022-02-11 카탈로그 테크놀로지스, 인크. Dna 기반 데이터 저장소에서 검색, 컴퓨팅 및 인덱싱하기 위한 데이터 구조 및 동작
GB201907460D0 (en) 2019-05-27 2019-07-10 Vib Vzw A method of storing information in pools of nucleic acid molecules
US11710538B2 (en) * 2019-06-07 2023-07-25 Microsoft Technology Licensing, Llc Efficient polymer synthesis
JP2022537381A (ja) * 2019-06-20 2022-08-25 アリゾナ・ボード・オブ・リージェンツ・オン・ビハーフ・オブ・アリゾナ・ステイト・ユニバーシティー 核酸配列の直接電気的読み出し
CA3157804A1 (en) 2019-10-11 2021-04-15 Catalog Technologies, Inc. Nucleic acid security and authentication
WO2021105974A1 (en) * 2019-11-27 2021-06-03 Technion Research And Development Foundation Ltd. Molecular data storage systems and methods
CN111091876B (zh) * 2019-12-16 2024-05-17 中国科学院深圳先进技术研究院 一种dna存储方法、系统及电子设备
AU2021228647A1 (en) 2020-02-28 2022-09-22 Arizona Board Of Regents On Behalf Of Arizona State University Methods for sequencing biopolymers
CN111681290B (zh) * 2020-04-21 2023-08-15 华中科技大学鄂州工业技术研究院 一种基于dna编码技术的图片存储方法
CA3183416A1 (en) 2020-05-11 2021-11-18 Catalog Technologies, Inc. Programs and functions in dna-based data storage
FR3110177A1 (fr) * 2020-05-15 2021-11-19 Université De Bretagne Sud procédé et dispositif de décodage de données stockées dans un système de stockage à base d'ADN
CN111724841B (zh) * 2020-06-04 2022-06-10 中国科学院上海微系统与信息技术研究所 一种基于生物蛋白的信息存储方法
CN112288089B (zh) * 2020-09-28 2022-12-20 清华大学 阵列式核酸信息存储方法及装置
WO2022120626A1 (zh) * 2020-12-09 2022-06-16 中国科学院深圳先进技术研究院 基于dna的数据存储方法、数据恢复方法、装置及终端设备
CN113096742B (zh) * 2021-04-14 2022-06-14 湖南科技大学 一种dna信息存储并行寻址写入方法及系统
WO2022266398A1 (en) * 2021-06-16 2022-12-22 Roswell Biotechnologies, Inc. Method, system and apparatus for single molecule measurements of binding kinetic and enzyme activities using molecular electronic sensors
WO2024076044A1 (ko) * 2022-10-06 2024-04-11 이근우 Dna 인코딩 및 디코딩 방법 및 장치
CN115409174B (zh) * 2022-11-01 2023-03-31 之江实验室 一种基于dram存内计算的碱基序列过滤方法与装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016210386A1 (en) 2015-06-25 2016-12-29 Roswell Biotechnologies, Inc Biomolecular sensors and methods

Family Cites Families (250)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0233981Y2 (ko) 1986-05-13 1990-09-12
US5082627A (en) 1987-05-01 1992-01-21 Biotronic Systems Corporation Three dimensional binding site array for interfering with an electrical field
US5486449A (en) 1989-02-07 1996-01-23 Rohm Co., Ltd. Photomask, photoresist and photolithography for a monolithic IC
GB2244135B (en) 1990-05-04 1994-07-13 Gen Electric Co Plc Sensor devices
US6051380A (en) 1993-11-01 2000-04-18 Nanogen, Inc. Methods and procedures for molecular biological analysis and diagnostics
IL103674A0 (en) 1991-11-19 1993-04-04 Houston Advanced Res Center Method and apparatus for molecule detection
US5414588A (en) 1993-09-20 1995-05-09 The Regents Of The University Of California High performance capacitors using nano-structure multilayer materials fabrication
US5366140A (en) 1993-09-30 1994-11-22 Minnesota Mining And Manufacturing Company Patterned array of uniform metal microbeads
US5871918A (en) 1996-06-20 1999-02-16 The University Of North Carolina At Chapel Hill Electrochemical detection of nucleic acid hybridization
US5583359A (en) 1995-03-03 1996-12-10 Northern Telecom Limited Capacitor structure for an integrated circuit
US6673533B1 (en) 1995-03-10 2004-01-06 Meso Scale Technologies, Llc. Multi-array multi-specific electrochemiluminescence testing
US5639507A (en) 1995-05-03 1997-06-17 Avx Corporation Method of making a planar multi-layer capacitor
US6440662B1 (en) 1995-12-01 2002-08-27 Innogenetics N.V. Impedimetric detection system and method of production thereof
US6033582A (en) 1996-01-22 2000-03-07 Etex Corporation Surface modification of medical implants
US5881184A (en) 1996-05-22 1999-03-09 Eastman Kodak Company Active pixel sensor with single pixel reset
US6506564B1 (en) 1996-07-29 2003-01-14 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US6202471B1 (en) 1997-10-10 2001-03-20 Nanomaterials Research Corporation Low-cost multilaminate sensors
US6110354A (en) 1996-11-01 2000-08-29 University Of Washington Microband electrode arrays
US5767687A (en) 1996-11-29 1998-06-16 Geist; Jon Surface-capacitor type condensable-vapor sensor
US6706473B1 (en) 1996-12-06 2004-03-16 Nanogen, Inc. Systems and devices for photoelectrophoretic transport and hybridization of oligonucleotides
US7169272B2 (en) 1997-04-30 2007-01-30 Board Of Trustees Of The University Of Arkansas Microfabricated recessed disk microelectrodes: characterization in static and convective solutions
US5982018A (en) 1997-05-23 1999-11-09 Micron Technology, Inc. Thin film capacitor coupons for memory modules and multi-chip modules
FR2764386B1 (fr) 1997-06-06 1999-07-16 Commissariat Energie Atomique Support d'electrodes comportant au moins une electrode recouverte par un depot et systeme de lecture de ce support
JP2000033712A (ja) 1997-09-30 2000-02-02 Seiko Epson Corp マイクロセンサーデバイス作成方法及びそれを用いた液体機能評価方法
US6123819A (en) 1997-11-12 2000-09-26 Protiveris, Inc. Nanoelectrode arrays
US6537747B1 (en) * 1998-02-03 2003-03-25 Lucent Technologies Inc. Data transmission using DNA oligomers
US6060023A (en) 1998-03-31 2000-05-09 Motorola, Inc. Molecular sensing apparatus
WO1999064580A1 (en) 1998-06-10 1999-12-16 Georgia Tech Research Corporation Microneedle devices and methods of manufacture and use thereof
WO2000020643A1 (en) 1998-10-05 2000-04-13 Mosaic Technologies Reverse displacement assay for detection of nucleic acid sequences
US6094335A (en) 1998-10-09 2000-07-25 Advanced Micro Devices, Inc. Vertical parallel plate capacitor
AU2640099A (en) 1999-02-25 2000-09-14 Seiko Epson Corporation Structure member excellent in water-repellency and manufacturing method thereof
US6517669B2 (en) 1999-02-26 2003-02-11 Micron Technology, Inc. Apparatus and method of detecting endpoint of a dielectric etch
AU773978B2 (en) 1999-04-07 2004-06-10 Dennis Michael Connolly High resolution DNA detection methods and devices
DE19916921A1 (de) 1999-04-14 2000-10-19 Fraunhofer Ges Forschung Elektrisches Sensorarray
US7122152B2 (en) 1999-05-10 2006-10-17 University Of Florida Spatiotemporal and geometric optimization of sensor arrays for detecting analytes fluids
DE60040205D1 (de) 1999-10-20 2008-10-23 Shigeori Takenaka Gen-detektionschip, sensor und nachweisverfahren
DE19960076C2 (de) 1999-12-13 2002-12-05 November Ag Molekulare Medizin Verfahren und Vorrichtung zum Nachweis und zur Quantifizierung von Biomolekülen
US20020090649A1 (en) 1999-12-15 2002-07-11 Tony Chan High density column and row addressable electrode arrays
DE10015818A1 (de) 2000-03-30 2001-10-18 Infineon Technologies Ag Biosensor und Verfahren zum Ermitteln makromolekularer Biopolymere mit einem Biosensor
EP1283900A4 (en) 2000-04-17 2006-02-08 Purdue Research Foundation BIOSENSOR AND ASSOCIATED METHOD
CA2407973C (en) 2000-05-03 2011-06-07 Jen-Jr Gau Biological identification system with integrated sensor chip
FR2811316B1 (fr) 2000-07-06 2003-01-10 Saint Gobain Substrat texture transparent et procedes pour l'obtenir
US6670131B2 (en) 2000-11-30 2003-12-30 Kabushiki Kaisha Toshiba Nucleic acid detection method and apparatus, and vessel for detecting nucleic acid
NL1016779C2 (nl) 2000-12-02 2002-06-04 Cornelis Johannes Maria V Rijn Matrijs, werkwijze voor het vervaardigen van precisieproducten met behulp van een matrijs, alsmede precisieproducten, in het bijzonder microzeven en membraanfilters, vervaardigd met een dergelijke matrijs.
DE10063739B4 (de) 2000-12-21 2009-04-02 Ferro Gmbh Substrate mit selbstreinigender Oberfläche, Verfahren zu deren Herstellung und deren Verwendung
US6958216B2 (en) 2001-01-10 2005-10-25 The Trustees Of Boston College DNA-bridged carbon nanotube arrays
US6749731B2 (en) 2001-01-31 2004-06-15 Kyocera Corporation Gene detection chip and detection device
US7189435B2 (en) 2001-03-14 2007-03-13 University Of Massachusetts Nanofabrication
DE10113550A1 (de) 2001-03-20 2002-10-02 Infineon Technologies Ag Verfahren zum Erfassen von makromolekularen Biopolymeren mittels einer Elektrodenanordnung
US20040023253A1 (en) 2001-06-11 2004-02-05 Sandeep Kunwar Device structure for closely spaced electrodes
CA2450109A1 (en) 2001-06-11 2003-05-22 Genorx, Inc. Electronic detection of biological molecules using thin layers
US6824974B2 (en) 2001-06-11 2004-11-30 Genorx, Inc. Electronic detection of biological molecules using thin layers
US7297494B2 (en) 2001-06-25 2007-11-20 Georgia Tech Research Corporation Activatable probes and methods for in vivo gene detection
JP2005514909A (ja) 2001-07-12 2005-05-26 メルク エンド カムパニー インコーポレーテッド 真核生物細胞の電場による刺激
US6483125B1 (en) 2001-07-13 2002-11-19 North Carolina State University Single electron transistors in which the thickness of an insulating layer defines spacing between electrodes
US20030040000A1 (en) 2001-08-08 2003-02-27 Connolly Dennis M. Methods for attaching nucleic acid molecules to electrically conductive surfaces
US6861224B2 (en) 2001-11-02 2005-03-01 Fujitsu Limited Protein detecting device
WO2004042070A2 (en) 2002-05-14 2004-05-21 Nanosphere, Inc. Electrical detection of dna hybridization and specific binding events
US20030224387A1 (en) 2002-05-22 2003-12-04 Sandeep Kunwar Association of molecules with electrodes of an array of electrodes
WO2003105251A2 (en) 2002-06-05 2003-12-18 Reveo, Inc. Layered electrochemical cell and manufacturing method therefor
EP1376111A1 (en) 2002-06-24 2004-01-02 Universite Catholique De Louvain Method and device for high sensitivity detection of the presence of DNA and other probes
DE20321777U1 (de) 2002-07-02 2009-12-31 Panasonic Corp., Kadoma Biosensor, Biosensorchip und Biosensoreinrichtung
US6755423B2 (en) 2002-07-17 2004-06-29 Li Jiun Chiu Tool coupling device for changeable tool members
US7470533B2 (en) 2002-12-20 2008-12-30 Acea Biosciences Impedance based devices and methods for use in assays
DE10242560A1 (de) 2002-09-13 2004-03-25 Creavis Gesellschaft Für Technologie Und Innovation Mbh Herstellung von selbstreinigenden Oberflächen auf textilen Beschichtungen
US20040063100A1 (en) 2002-09-30 2004-04-01 Wang Chung Lin Nanoneedle chips and the production thereof
DE10247679A1 (de) 2002-10-12 2004-04-22 Fujitsu Ltd., Kawasaki Halbleitergrundstruktur für Molekularelektronik und Molekularelektronik-basierte Biosensorik
US7183055B2 (en) 2002-11-01 2007-02-27 Wisconsin Alumni Research Foundation Direct radio-frequency detection of nucleotide hybridization at microelectrodes
WO2004099307A2 (en) 2003-02-07 2004-11-18 Wisconsin Alumni Research Foundation Nanocylinder-modified surfaces
US7172917B2 (en) 2003-04-17 2007-02-06 Robert Bosch Gmbh Method of making a nanogap for variable capacitive elements, and device having a nanogap
CA2522866A1 (en) 2003-04-28 2005-01-20 Nanosys, Inc. Super-hydrophobic surfaces, methods of their construction and uses therefor
WO2004096986A2 (en) 2003-04-29 2004-11-11 Integrated Nano-Technologies, Llc Method for quantitative detection of nucleic acid molecules
JP4059181B2 (ja) 2003-09-29 2008-03-12 株式会社村田製作所 多端子型積層セラミック電子部品の製造方法
JP2005109269A (ja) 2003-09-30 2005-04-21 Hitachi Ltd 半導体放射線検出器及び半導体放射線撮像装置
US7132298B2 (en) 2003-10-07 2006-11-07 Hewlett-Packard Development Company, L.P. Fabrication of nano-object array
AU2004316286A1 (en) 2003-11-20 2005-09-09 Biowarn, Llc Methodology and apparatus for the detection of biological substances
WO2005108612A2 (en) 2003-11-28 2005-11-17 Genorx, Inc. Nanoscale biosensor device, system and technique
ES2340378T3 (es) 2003-12-16 2010-06-02 Dynabyte Informationssysteme Gmbh Dispositivo de cartucho para el analisis de sangre.
DE10359173B4 (de) 2003-12-17 2006-11-09 Robert Bosch Gmbh Messvorrichtung mit mehreren auf einem Substrat angeordneten potentiometrischen Elektrodenpaaren
US7451381B2 (en) 2004-02-03 2008-11-11 Phonex Broadband Corporation Reliable method and system for efficiently transporting dynamic data across a network
US20050247573A1 (en) 2004-03-23 2005-11-10 Hideaki Nakamura Biosensors
US8354066B2 (en) 2004-03-24 2013-01-15 Technion Research & Development Foundation Ltd. Artificial receptors
US20050221473A1 (en) 2004-03-30 2005-10-06 Intel Corporation Sensor array integrated circuits
US20060019273A1 (en) 2004-05-12 2006-01-26 Connolly Dennis M Detection card for analyzing a sample for a target nucleic acid molecule, and uses thereof
US7385295B2 (en) 2004-06-24 2008-06-10 California Institute Of Technology Fabrication of nano-gap electrode arrays by the construction and selective chemical etching of nano-crosswire stacks
US7265019B2 (en) 2004-06-30 2007-09-04 International Business Machines Corporation Elastomeric CMOS based micro electromechanical varactor
US7258731B2 (en) 2004-07-27 2007-08-21 Ut Battelle, Llc Composite, nanostructured, super-hydrophobic material
US7150904B2 (en) 2004-07-27 2006-12-19 Ut-Battelle, Llc Composite, ordered material having sharp surface features
US7655275B2 (en) 2004-08-02 2010-02-02 Hewlett-Packard Delopment Company, L.P. Methods of controlling flow
US20060029808A1 (en) 2004-08-06 2006-02-09 Lei Zhai Superhydrophobic coatings
DE602004016496D1 (de) 2004-08-31 2008-10-23 St Microelectronics Srl Verfahren zur Herstellung einer Wirtsstruktur für nanometergroße Elemente
EP1630882B1 (en) 2004-08-31 2012-05-02 STMicroelectronics S.r.l. Nanometric structure and corresponding manufacturing method
DE102004042729B4 (de) 2004-09-03 2018-02-01 Robert Bosch Gmbh Bio-Chip mit einem Elektrodenarray auf einem Substrat
US20070048748A1 (en) 2004-09-24 2007-03-01 Li-Cor, Inc. Mutant polymerases for sequencing and genotyping
US7507320B2 (en) 2004-10-09 2009-03-24 Academia Sinica Single-atom tip and preparation method thereof
KR20090027254A (ko) 2004-10-14 2009-03-16 가부시끼가이샤 도시바 Fet-기반의 핵산 검출 센서
US7541004B2 (en) 2004-11-12 2009-06-02 Predict, Inc. MEMS-based sensor for lubricant analysis
WO2007008246A2 (en) 2004-11-12 2007-01-18 The Board Of Trustees Of The Leland Stanford Junior University Charge perturbation detection system for dna and other molecules
DE102004060738B4 (de) 2004-12-15 2008-07-03 Forschungszentrum Jülich GmbH Verfahren zum strukturierten Aufbringen von Molekülen auf eine Leiterbahn
US8039368B2 (en) 2005-03-21 2011-10-18 The Trustees Of The University Of Pennsylvania Nanogaps: methods and devices containing same
WO2006102905A1 (en) 2005-03-31 2006-10-05 Gregersen Enterprises 2005 Aps Apparatus and method for a global model of hollow internal organs including the determination of cross-sectional areas and volume in internal hollow organs and wall properties
US7985451B2 (en) 2005-04-01 2011-07-26 Clemson University Method of manufacturing ultrahydrophobic substrates
WO2006130535A2 (en) 2005-06-02 2006-12-07 Michigan State University Methods to increase dynamic range and improve quantitative analysis in rapid biosensors
US7417418B1 (en) 2005-06-14 2008-08-26 Ayliffe Harold E Thin film sensor
WO2007053242A2 (en) 2005-09-19 2007-05-10 Wayne State University Transparent hydrophobic article having self-cleaning and liquid repellant features and method of fabricating same
FR2893266B1 (fr) 2005-11-14 2007-12-21 Commissariat Energie Atomique Produit superhydrophile ou superhydrophobe, procede pour sa realisation et utilisation de ce produit
KR100757389B1 (ko) 2005-12-06 2007-09-11 한국전자통신연구원 나노갭 전극을 갖는 센서 및 그 제조 방법
WO2007120312A2 (en) 2005-12-15 2007-10-25 The Trustees Of Columbia University In The City Of New York Sensing devices from molecular electronic devices
US8706219B2 (en) 2005-12-22 2014-04-22 Board Of Regents, The University Of Texas System Method and apparatus for monitoring an organ of a patient
US7649198B2 (en) 2005-12-28 2010-01-19 Industrial Technology Research Institute Nano-array and fabrication method thereof
US20070207487A1 (en) 2006-01-25 2007-09-06 Emig Christopher J Photoelectrochemical synthesis of high density combinatorial polymer arrays
WO2007102960A2 (en) 2006-01-30 2007-09-13 Ashland Licensing And Intellectual Property Llc Hydrophobic self-cleaning coating compositions
US20070184247A1 (en) 2006-02-03 2007-08-09 Simpson John T Transparent, super-hydrophobic, disordered composite material
WO2007107844A1 (en) 2006-03-17 2007-09-27 Element Six Limited Microelectrode array
US20090011222A1 (en) 2006-03-27 2009-01-08 Georgia Tech Research Corporation Superhydrophobic surface and method for forming same
US20070227300A1 (en) 2006-03-31 2007-10-04 Quantumsphere, Inc. Compositions of nanometal particles containing a metal or alloy and platinum particles for use in fuel cells
US20070231542A1 (en) 2006-04-03 2007-10-04 General Electric Company Articles having low wettability and high light transmission
GB2437328A (en) 2006-04-10 2007-10-24 Cambridge Display Tech Ltd Electric devices and methods of manufacture
GB0607205D0 (en) 2006-04-10 2006-05-17 Diagnoswiss Sa Miniaturised biosensor with optimized anperimetric detection
US20090162927A1 (en) 2006-05-31 2009-06-25 Yeda Research And Development Company Ltd. Nanotubes and nanowires based electronic devices and method of fabrication thereof
JP2008026109A (ja) 2006-07-20 2008-02-07 Fujifilm Corp 微細構造体及びその製造方法、センサデバイス及びラマン分光用デバイス
US8394590B2 (en) 2006-08-02 2013-03-12 California Institute Of Technology Capture agents and related methods and systems for detecting and/or sorting targets
WO2008020813A1 (en) 2006-08-16 2008-02-21 Agency For Science, Technology And Research Method of electrically detecting a biological analyte molecule
ITTO20060774A1 (it) 2006-10-27 2008-04-28 St Microelectronics Srl Sensore microelettromeccanico avente molteplici valori di fondo scala e di sensibilita'
JP4986138B2 (ja) 2006-11-15 2012-07-25 独立行政法人産業技術総合研究所 反射防止構造を有する光学素子用成形型の製造方法
EP2092322B1 (en) 2006-12-14 2016-02-17 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale fet arrays
GB0625070D0 (en) 2006-12-15 2007-01-24 Imp Innovations Ltd Characterization of molecules
KR100854486B1 (ko) 2007-04-05 2008-08-26 한국기계연구원 초발수 표면 제조 방법
AT505495A1 (de) 2007-07-04 2009-01-15 Arc Austrian Res Centers Gmbh Verfahren zur identifizierung und quantifizierung von organischen und biochemischen substanzen
US8278188B2 (en) 2007-07-19 2012-10-02 University of Pittsburgh—of the Commonwealth System of Higher Education Manipulation, detection, and assay of small scale biological particles
EP3540436B1 (en) 2007-09-12 2023-11-01 President And Fellows Of Harvard College High-resolution molecular sensor
WO2009041917A1 (en) 2007-09-28 2009-04-02 Agency For Science, Technology And Research Method of electrically detecting a nucleic acid molecule
US8927464B2 (en) 2007-11-29 2015-01-06 President And Fellows Of Harvard College Assembly and deposition of materials using a superhydrophobic surface structure
WO2009082706A1 (en) 2007-12-21 2009-07-02 The Trustees Of Columbia University In The City Of New York Active cmos sensor array for electrochemical biomolecular detection
US8372585B2 (en) 2007-12-31 2013-02-12 Intel Corporation Electronic sensing for nucleic acid sequencing
US8304273B2 (en) 2008-01-24 2012-11-06 Massachusetts Institute Of Technology Insulated nanogap devices and methods of use thereof
US8183648B2 (en) 2008-01-25 2012-05-22 Ut-Battelle, Llc Nanoscopic electrode molecular probes
CN101231287B (zh) 2008-02-22 2011-09-14 东南大学 外场诱导电极中排列纳米颗粒制备生物传感器的方法
US20090297913A1 (en) 2008-03-25 2009-12-03 The University Of Georgia Research Foundation, Inc. Nanostructure-Enhanced stereo-electrodes for fuel cells and biosensors
CN102066929B (zh) 2008-06-19 2016-03-23 普乐喜金生物技术股份有限公司 多维流体传感器以及相关的检测器和方法
US7970332B2 (en) 2008-06-30 2011-06-28 Xerox Corporation Oil less fusing using nano/micro textured fusing surfaces
WO2010044932A2 (en) 2008-07-11 2010-04-22 Cornell University Nanofluidic channels with integrated charge sensors and methods based thereon
WO2010022107A2 (en) 2008-08-18 2010-02-25 The Regents Of The University Of California Nanostructured superhydrophobic, superoleophobic and/or superomniphobic coatings, methods for fabrication, and applications thereof
US20100044212A1 (en) 2008-08-21 2010-02-25 Snu R&Db Foundation Vertically standing ionic polymer-metal composite
WO2010025547A1 (en) 2008-09-02 2010-03-11 The Governing Council Of The University Of Toronto Nanostructured microelectrodes and biosensing devices incorporating the same
US20100132771A1 (en) 2008-10-06 2010-06-03 The Regents Of The University Of California 3D Carbon Nanotubes Membrane as a Solar Energy Absorbing Layer
US8614466B2 (en) 2008-11-18 2013-12-24 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Semiconductor for measuring biological interactions
US8563240B2 (en) 2008-12-31 2013-10-22 Intel Corporation Nucleic acid sequencing and electronic detection
US20100206367A1 (en) 2009-02-18 2010-08-19 Korea Institute Of Industrial Technology Method for fabricating silicon nano wire, solar cell including silicon nano wire and method for fabricating solar cell
WO2010120809A1 (en) 2009-04-14 2010-10-21 Nanoink, Inc. Conducting lines, nanoparticles, inks, and patterning
CN102301227A (zh) 2009-04-27 2011-12-28 夏普株式会社 化学传感器
US20100285272A1 (en) 2009-05-06 2010-11-11 Shari Elizabeth Koval Multi-length scale textured glass substrates for anti-fingerprinting
US8313633B2 (en) 2009-07-28 2012-11-20 Polestar Technologies, Inc. Molecular imprinted nanosensors and process for producing same
US8911972B2 (en) 2009-12-16 2014-12-16 Pacific Biosciences Of California, Inc. Sequencing methods using enzyme conformation
KR20110104245A (ko) 2010-03-16 2011-09-22 주식회사 나노플랫폼 Fet 기반 바이오센서, 이의 제조방법, 및 이를 이용하는 표적 물질 검출방법
US8940663B2 (en) 2010-04-07 2015-01-27 Board Of Regents, The University Of Texas System Nano-scale biosensors
US20110311853A1 (en) 2010-06-17 2011-12-22 Lsi Corporation Electrochemical cell system and apparatus to provide energy to a portable electronic device
US9353412B2 (en) 2010-06-18 2016-05-31 Illumina, Inc. Conformational probes and methods for sequencing nucleic acids
KR101136534B1 (ko) 2010-09-07 2012-04-17 한국기계연구원 프로브 카드 및 이의 제조 방법
US9231133B2 (en) 2010-09-10 2016-01-05 International Business Machines Corporation Nanowires formed by employing solder nanodots
WO2012037118A2 (en) 2010-09-14 2012-03-22 The General Hospital Corporation Nanoporous metal multiple electrode array and method of making same
EP2625526B1 (en) 2010-10-04 2017-03-15 Genapsys Inc. Systems and methods for automated reusable parallel biological reactions
US10024819B2 (en) 2010-10-21 2018-07-17 The Regents Of The University Of California Microfluidics with wirelessly powered electronic circuits
GB2485559A (en) 2010-11-18 2012-05-23 Univ Plymouth Graphene based electronic device
US20120258881A1 (en) 2010-11-22 2012-10-11 The University Of Chicago Methods and/or Use of Oligonucleotide Conjugates for Assays and Microscopy/Imaging Detections
WO2012083249A2 (en) 2010-12-17 2012-06-21 The Trustees Of Columbia University In The City Of New York Dna sequencing by synthesis using modified nucleotides and nanopore detection
WO2012087352A2 (en) 2010-12-20 2012-06-28 The Regents Of The University Of California Superhydrophobic and superoleophobic nanosurfaces
KR101749045B1 (ko) 2010-12-31 2017-06-20 시락 게엠베하 인터내셔날 고정확도 분석물 측정을 위한 시스템 및 방법
US9608101B2 (en) 2011-01-04 2017-03-28 Ecole Polytechnique Federale De Lausanne (Epfl) Semiconductor device
TW201231948A (en) 2011-01-26 2012-08-01 zhi-yu Zhao Method for forming frozen biological test strip for electron microscope and device thereof
US8652768B1 (en) 2011-01-31 2014-02-18 Sandia Corporation Nanopatterns by phase separation of patterned mixed polymer monolayers
EP2492674A1 (en) 2011-02-28 2012-08-29 Lexogen GmbH Biosensor array formed by junctions of functionalized electrodes
EP2492673A1 (en) 2011-02-28 2012-08-29 Lexogen GmbH Biosensor array formed by junctions of functionalized electrodes
CN103597094B (zh) 2011-04-19 2015-12-23 香港科技大学 利用电活性水解探针(e-tag探针)监测实时聚合酶链式反应(pcr)的方法和装置
WO2012146377A1 (de) 2011-04-27 2012-11-01 Dmitry Cherkasov Methoden und komponenten zur detektion von nukleinsäureketten
KR101548771B1 (ko) 2011-06-23 2015-09-01 삼성전기주식회사 칩 타입 적층 커패시터
KR102023754B1 (ko) 2011-07-27 2019-09-20 더 보오드 오브 트러스티스 오브 더 유니버시티 오브 일리노이즈 생체분자 특성규명용 나노포어 센서
KR102006277B1 (ko) 2011-08-04 2019-08-01 닛산 가가쿠 가부시키가이샤 축합계 폴리머를 가지는 euv 리소그래피용 레지스트 하층막 형성조성물
US8685858B2 (en) 2011-08-30 2014-04-01 International Business Machines Corporation Formation of metal nanospheres and microspheres
CN103975237A (zh) 2011-09-19 2014-08-06 犹他大学研究基金会 用于化合物探测的多模平台
US9347900B2 (en) 2011-10-14 2016-05-24 Pacific Biosciences Of California, Inc. Real-time redox sequencing
US20130108956A1 (en) 2011-11-01 2013-05-02 Az Electronic Materials Usa Corp. Nanocomposite positive photosensitive composition and use thereof
US9322798B2 (en) 2011-12-15 2016-04-26 Intel Corporation Diamond electrode nanogap transducers
EP4108782B1 (en) 2011-12-22 2023-06-07 President and Fellows of Harvard College Compositions and methods for analyte detection
US20130183492A1 (en) 2012-01-17 2013-07-18 Snu R&Db Foundation Metal nanoparticles on substrate and method of forming the same
US20130214875A1 (en) 2012-02-16 2013-08-22 Elwha Llc Graphene sheet and nanomechanical resonator
US20130239349A1 (en) 2012-03-14 2013-09-19 Palo Alto Research Center Incorporated Self-powered manual toothbrush with sensors
DK2836609T4 (da) 2012-04-09 2022-09-05 Envirologix Inc Sammensætninger og fremgangsmåder til kvantificering af en nucleinsyresekvens i en prøve
US9393590B2 (en) 2012-04-16 2016-07-19 Temple University—Of the Commonwealth System of Higher Education Self-assembly of small structures
WO2013165588A1 (en) 2012-05-01 2013-11-07 Life Technologies Corporation Methods for analysis of dna fragments
CN102706940B (zh) 2012-06-15 2014-05-14 湖南大学 可用于检测水体中痕量汞的电化学传感器及其制备方法和应用
US9551682B2 (en) 2012-06-29 2017-01-24 Intel Corporation High throughput biochemical detection using single molecule fingerprinting arrays
EP3741847A1 (en) 2012-07-19 2020-11-25 Oxford Nanopore Technologies Limited Modified helicases
US8741688B2 (en) 2012-07-24 2014-06-03 Micron Technology, Inc. Methods of forming a metal chalcogenide material
CN104703700B (zh) 2012-08-06 2018-01-12 康特姆斯集团有限公司 用于核酸测序的方法和试剂盒
TWI492384B (zh) 2012-08-17 2015-07-11 Univ Nat Chiao Tung 蛋白質電晶體裝置
TWI514566B (zh) 2012-09-19 2015-12-21 Univ Nat Chiao Tung 半導體生物奈米線裝置及其製作方法
EP2909601B1 (en) 2012-10-16 2019-09-11 Abbott Laboratories Method of increasing the debye length on a sensor surface within a sample solution and corresponding computer readable strorage medium
JP2015537378A (ja) 2012-10-26 2015-12-24 リサーチ トライアングル インスティテュート 溶液プロセスによる量子ドットを利用した中間帯半導体、ヘテロ接合、及び光電子デバイス、並びに関連する方法
US20150293025A1 (en) 2012-12-18 2015-10-15 Toray Industries Inc. Metal dot substrate and method of manufacturing metal dot substrate
US20140218637A1 (en) 2013-02-06 2014-08-07 Nanchang O-Film Tech. Co., Ltd. Conductive film, manufacturing method thereof, and touch screen including the conducting film
CN103187119B (zh) 2013-02-06 2014-08-06 南昌欧菲光科技有限公司 导电膜及其制备方法以及包含该导电膜的触摸屏
US9040363B2 (en) 2013-03-20 2015-05-26 International Business Machines Corporation FinFET with reduced capacitance
FR3003751A1 (fr) 2013-03-27 2014-10-03 Jacques Geloen Dispositif de visualisation de saturation pour protection de l'incontinence urofecale.
WO2014182630A1 (en) * 2013-05-06 2014-11-13 Pacific Biosciences Of California , Inc. Real-time electronic sequencing
US8901621B1 (en) 2013-06-18 2014-12-02 International Business Machines Corporation Nanochannel process and structure for bio-detection
US9182369B2 (en) 2013-06-19 2015-11-10 Globalfoundries Inc. Manufacturable sub-3 nanometer palladium gap devices for fixed electrode tunneling recognition
TW201502276A (zh) 2013-07-09 2015-01-16 Univ Nat Chiao Tung 單分子無標定核酸定序方法
DE102013012145A1 (de) 2013-07-20 2015-01-22 Borros Arneth Protein-Transistor auf Anti-Silizium Antikörper Basis
US20150049332A1 (en) 2013-07-30 2015-02-19 The Curators Of The University Of Missouri Gold nanoisland arrays
EP3047282B1 (en) 2013-09-18 2019-05-15 Quantum Biosystems Inc. Biomolecule sequencing devices, systems and methods
US20160284811A1 (en) 2013-11-04 2016-09-29 Massachusetts Institute Of Technology Electronics including graphene-based hybrid structures
JP6673843B2 (ja) 2013-11-17 2020-03-25 クアンタム−エスアイ インコーポレイテッドQuantum−Si Incorporated 分子をプローブし、検出し、分析するための光学システム及びアッセイ・チップ
WO2015086654A1 (en) 2013-12-12 2015-06-18 Altra Tech Limited A capacitive sensor and method of use
US9472396B2 (en) 2014-04-15 2016-10-18 University Of Central Florida Research Foundation, Inc. Plasma treated semiconductor dichalcogenide materials and devices therefrom
CN106471359A (zh) 2014-04-28 2017-03-01 量子生物有限公司 纳米间隙电极装置和系统及其形成方法
EP2947779A1 (en) * 2014-05-23 2015-11-25 Thomson Licensing Method and apparatus for storing information units in nucleic acid molecules and nucleic acid storage system
AU2015271824B2 (en) 2014-06-03 2020-12-03 Illumina, Inc. Compositions, systems, and methods for detecting events using tethers anchored to or adjacent to nanopores
JP2017522046A (ja) 2014-06-06 2017-08-10 ソルスティス バイオロジクス,リミティッド 生物可逆的および生物不可逆的基を有するポリヌクレオチド構築物
CA2955356C (en) 2014-07-15 2024-01-02 Illumina, Inc. Biochemically activated electronic device
GB2528682A (en) 2014-07-28 2016-02-03 Isis Innovation Plasmonic filter
US9859513B2 (en) 2014-11-25 2018-01-02 University Of Kentucky Research Foundation Integrated multi-terminal devices consisting of carbon nanotube, few-layer graphene nanogaps and few-layer graphene nanoribbons having crystallographically controlled interfaces
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
RU2721965C2 (ru) 2014-12-18 2020-05-25 Дзе Риджентс Оф Дзе Юниверсити Оф Калифорния Обнаружение изменений конформации полимеразы нуклеиновых кислот с помощью нанотрубки
US20160187282A1 (en) 2014-12-26 2016-06-30 Intel Corporation Device for single molecule detection and fabrication methods thereof
US9306164B1 (en) 2015-01-30 2016-04-05 International Business Machines Corporation Electrode pair fabrication using directed self assembly of diblock copolymers
FR3035220A1 (fr) 2015-04-20 2016-10-21 Commissariat Energie Atomique " dispositif electronique de mesure d'au moins une caracteristique electrique d'un objet "
CN114703264A (zh) 2015-06-03 2022-07-05 亿明达股份有限公司 使用锚定至邻近纳米孔的聚合酶的系链对多核苷酸测序的组合物、系统和方法
US10125391B2 (en) 2015-08-06 2018-11-13 Pacific Biosciences Of California, Inc. Single molecule nanoFET sequencing systems and methods
WO2017041056A1 (en) 2015-09-02 2017-03-09 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
EP3347366A1 (en) 2015-09-10 2018-07-18 H. Hoffnabb-La Roche Ag Polypeptide tagged nucleotides and use thereof in nucleic acid sequencing by nanopore detection
JP2018533935A (ja) 2015-10-08 2018-11-22 クオンタムバイオシステムズ株式会社 核酸配列決定の装置、システム、及び方法
JP7109785B2 (ja) 2016-01-14 2022-08-01 ロズウェル バイオテクノロジーズ,インコーポレイテッド 分子センサーおよび関連方法
CN109328301B (zh) 2016-01-28 2021-03-12 罗斯韦尔生物技术股份有限公司 大规模并行dna测序装置
US11624725B2 (en) 2016-01-28 2023-04-11 Roswell Blotechnologies, Inc. Methods and apparatus for measuring analytes using polymerase in large scale molecular electronics sensor arrays
KR20180104159A (ko) 2016-02-09 2018-09-19 로스웰 바이오테크놀로지스 인코포레이티드 전자 비표지 dna 및 게놈 시퀀싱
US10597767B2 (en) 2016-02-22 2020-03-24 Roswell Biotechnologies, Inc. Nanoparticle fabrication
WO2017151680A2 (en) 2016-02-29 2017-09-08 Dodo Omnidata, Inc. Methods, compositions, and devices for information storage
WO2017184677A1 (en) * 2016-04-21 2017-10-26 President And Fellows Of Harvard College Method and system of nanopore-based information encoding
AU2017267505A1 (en) 2016-05-19 2019-01-17 Dragon Medical Development Limited Guidewire apparatus and method for multiple parameter analysis of Coronary stenosis
WO2018011632A1 (en) 2016-07-15 2018-01-18 Dragon Medical Development Limited Multi-spline, multi-electrode catheter and method of use for mapping of internal organs
US9829456B1 (en) 2016-07-26 2017-11-28 Roswell Biotechnologies, Inc. Method of making a multi-electrode structure usable in molecular sensing devices
KR102526825B1 (ko) 2016-08-01 2023-04-27 로스웰 바이오테크놀로지스 인코포레이티드 분자 전자 센서용 개질된 뉴클레오티드 트리포스페이트
US20190376925A1 (en) 2016-11-22 2019-12-12 Roswell Biotechnologies, Inc. Nucleic acid sequencing device containing graphene
WO2018132457A1 (en) 2017-01-10 2018-07-19 Roswell Biotechnologies, Inc. Methods and systems for dna data storage
CA3052140A1 (en) 2017-01-19 2018-07-26 Roswell Biotechnologies, Inc. Solid state sequencing devices comprising two dimensional layer materials
EP3615685A4 (en) 2017-04-25 2021-01-20 Roswell Biotechnologies, Inc ENZYMATIC CIRCUITS FOR MOLECULAR SENSORS
US10508296B2 (en) 2017-04-25 2019-12-17 Roswell Biotechnologies, Inc. Enzymatic circuits for molecular sensors
EP3622086A4 (en) 2017-05-09 2021-04-21 Roswell Biotechnologies, Inc LINK PROBE CIRCUITS FOR MOLECULAR SENSORS
CN111373049A (zh) 2017-08-30 2020-07-03 罗斯威尔生命技术公司 用于dna数据存储的进行性酶分子电子传感器

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016210386A1 (en) 2015-06-25 2016-12-29 Roswell Biotechnologies, Inc Biomolecular sensors and methods

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Biomed Res Int. vol.2016, pp.8072463(2016)
Nature Methods, vol.11, pp.499-507(2014)
Nature, vol.494, pp.77-80(2013)
Science, vol.337(6102), pp.1628(2012)*

Also Published As

Publication number Publication date
EP3568407A4 (en) 2020-12-23
US10902939B2 (en) 2021-01-26
US20190355442A1 (en) 2019-11-21
KR20190116297A (ko) 2019-10-14
CN110431148A (zh) 2019-11-08
CA3052062A1 (en) 2018-07-19
EP3568407A1 (en) 2019-11-20
US20210225461A1 (en) 2021-07-22
WO2018132457A1 (en) 2018-07-19

Similar Documents

Publication Publication Date Title
KR102622275B1 (ko) Dna 데이터 저장을 위한 방법들 및 시스템들
US11100404B2 (en) Methods, apparatus and systems for amplification-free DNA data storage
US20220390407A1 (en) Processive enzyme molecular electronic sensors for dna data storage
Ceze et al. Molecular digital data storage using DNA
Doricchi et al. Emerging approaches to DNA data storage: challenges and prospects
Yim et al. Robust direct digital-to-biological data storage in living cells
US20180211001A1 (en) Trace reconstruction from noisy polynucleotide sequencer reads
Xu et al. Uncertainties in synthetic DNA-based data storage
KR20200071720A (ko) Dna-기반 데이터 저장
US20210098081A1 (en) Flexible decoding in dna data storage based on redundancy codes
US20230317164A1 (en) Systems and methods for writing by sequencing of nucleic acids
US20230377649A1 (en) Systems And Methods For Digital Information Decoding And Data Storage In Hybrid Macromolecules
WO2020040861A1 (en) Trace reconstruction from reads with indeterminant errors
Raza et al. An outlook on the current challenges and opportunities in DNA data storage
US20240026471A1 (en) Molecular electronic sensors for multiplex genetic analysis using dna reporter tags
Akash et al. How to make DNA data storage more applicable
Lavenier DNA Storage: Synthesis and Sequencing Semiconductor Technologies
US20210350879A1 (en) Dna canvas for information storage and nanofabrication
CN112703256A (zh) 用于测定聚合物序列的方法
WO2023168085A1 (en) Dna microarrays and component level sequencing for nucleic acid-based data storage and processing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant