KR20240101595A - 연속 서열분석에 관한 방법 및 조성물 - Google Patents

연속 서열분석에 관한 방법 및 조성물 Download PDF

Info

Publication number
KR20240101595A
KR20240101595A KR1020247016284A KR20247016284A KR20240101595A KR 20240101595 A KR20240101595 A KR 20240101595A KR 1020247016284 A KR1020247016284 A KR 1020247016284A KR 20247016284 A KR20247016284 A KR 20247016284A KR 20240101595 A KR20240101595 A KR 20240101595A
Authority
KR
South Korea
Prior art keywords
examples
polynucleotides
polynucleotide
loci
sequencing
Prior art date
Application number
KR1020247016284A
Other languages
English (en)
Inventor
제레미 라키
윌리엄 반야이
Original Assignee
트위스트 바이오사이언스 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 트위스트 바이오사이언스 코포레이션 filed Critical 트위스트 바이오사이언스 코포레이션
Publication of KR20240101595A publication Critical patent/KR20240101595A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/30Oligonucleotides characterised by their secondary structure
    • C12Q2525/301Hairpin oligonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/507Detection characterised by immobilisation to a surface characterised by the density of the capture oligonucleotide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/60Detection means characterised by use of a special device
    • C12Q2565/631Detection means characterised by use of a special device being a biochannel or pore
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

폴리뉴클레오티드 서열분석을 위한 조성물, 장치, 시스템 및 방법이 본원에 제공된다. 연속 서열분석을 위한 표면을 포함하는 장치가 추가로 제공된다. 본원에 기술된 조성물, 장치, 시스템 및 방법은 생체분자 기반 정보의 향상된 저장, 밀도 및 검색을 제공한다.

Description

연속 서열분석에 관한 방법 및 조성물
본원은 2021년 10월 18일에 출원된 미국 가출원 번호 제63/256,866호의 이익을 주장하며, 이는 그 전체 내용이 참고로 포함된다.
생체분자(예: 핵산)는 연구, 의학, 및 정보 저장 분야에 적용된다. 그러나, 생체분자 서열분석을 위해서는 고밀도, 확장 가능, 자동화, 고도로 정확하고 효율적인 시스템이 필요하다.
본원에서는 폴리뉴클레오티드 서열분석 방법으로, a) 복수의 폴리뉴클레오티드를 적어도 하나의 프라이머 및 적어도 하나의 폴리머라제와 접촉시켜 복수의 3원 복합체를 형성하는 단계; b) 폴리뉴클레오티드의 하나 이상의 염기를 검출하는 단계로, 여기서 검출은 복수의 3원 복합체가 표면에 결합될 때 발생되는 단계; c) 표면에서 3원 복합체를 제거하는 단계; 및 d) 단계 a-c를 반복하여 폴리뉴클레오티드의 서열을 분석하는 단계를 포함하는 방법이 제공된다. 단계 c)가 표면을 세척하는 것을 포함하는 방법이 본원에 추가로 제공된다. 세척이 표면을 용매, 열, 소분자, 핵산, 또는 단백질 중 하나 이상과 접촉시키는 것을 포함하는 방법이 본원에 추가로 제공된다. 소분자가 제2 모이어티에 접합되도록 구성된 제1 모이어티를 포함하는 것인 방법이 본원에 추가로 제공된다. 접합이 친핵체/카르보닐; 아지드/포스핀; 1,4 마이클 첨가, 1,3-쌍극성 고리 첨가, 역전자 수요 고리 첨가; 올레핀 복분해; 또는 교차 결합 반응을 포함하는 것인 방법이 본원에 추가로 제공된다. 소분자가 비오틴, 알킨, 아지드, 테트라진, 알켄, 알킨, 카르보닐, 마이클 수용체/공여체, 또는 항원을 포함하는 것인 방법이 본원에 추가로 제공된다. 용매가 유기 용매를 포함하는 것인 방법이 본원에서 추가로 제공된다. 유기 용매가 MeCN, 메탄올, 에탄올, 2-프로판올, 아세톤, DMF, 포름아미드, THF, 또는 DMSO를 포함하는 것인 방법이 본원에 추가로 제공된다. 유기 용매를 가열하는 방법이 본원에 추가로 제공된다. 단백질이 프로테이나제 또는 뉴클레아제를 포함하는 것인 방법이 본원에 추가로 제공된다. 또한, 프로테이나제가 아미노펩티다제를 포함하는 것인 방법이 본원에 제공된다. 아미노펩티다제가 프로테이나제 K, N-말단 아미노펩티다제, C-말단 아미노펩티다제, 키모트립신, 트립신, 펩신, 또는 LysC를 포함하는 것인 방법이 본원에 추가로 제공된다. 단백질이 스트렙트아비딘을 포함하는 것인 방법이 본원에 추가로 제공된다. 또한, 폴리머라제가 Phi29 폴리머라제 또는 이의 변이체를 포함하는 것인 방법이 본원에 제공된다. 단계 a)에서 폴리머라제가 표면에 결합되는 것인 방법이 본원에 추가로 제공된다. 단계 a)에서 폴리머라제가 표면에 결합되지 않은 것인 방법이 본원에 추가로 제공된다. 복수의 폴리뉴클레오티드가 적어도 100,000개의 고유한 폴리뉴클레오티드를 포함하는 것인 방법이 본원에 추가로 제공된다. 복수의 폴리뉴클레오티드의 길이가 50 내지 30,000개 염기인 방법이 본원에 추가로 제공된다. 검출이 고유한 파장, 형광 수명, 또는 전류 또는 전압 변화를 사용하여 염기를 식별하는 것을 포함하는 것인 방법이 본원에 추가로 제공된다. 검출이 합성에 의한 서열분석 및 나노포어 검출 중 하나 이상을 포함하는 것인 방법이 본원에 추가로 제공된다. 검출이 FRET를 포함하는 것인 방법이 본원에 추가로 제공된다. 검출이 3원 복합체를 적어도 하나의 뉴클레오티드와 접촉시키는 것을 포함하는 것인 방법이 본원에 추가로 제공된다. 뉴클레오티드가 표지를 포함하는 것인 방법이 본원에 추가로 제공된다. 표지가 발광 표지를 포함하는 것인 방법이 본원에 추가로 제공된다. 발광 표지가 염료인 방법이 본원에 추가로 제공된다. 폴리머라제가 양자점에 부착되는 방법이 본원에 추가로 제공된다. 단계 a)에서 복수의 폴리뉴클레오티드가 표면에 결합되는 방법이 본원에 추가로 제공된다. 검출이 전자기 에너지에 의한 여기를 포함하는 것인 방법이 본원에 추가로 제공된다. 검출이 레이저를 이용한 여기를 포함하는 것인 방법이 본원에 추가로 제공된다. 레이저가 펄스되는 방법이 본원에 추가로 제공된다. 복수의 폴리뉴클레오티드가 헤어핀 어댑터를 포함하는 것인 방법이 본원에 추가로 제공된다. 복수의 폴리뉴클레오티드가 원형인 방법이 본원에 추가로 제공된다. 단계 a-c가 적어도 3회 반복되는 방법이 본원에 추가로 제공된다. 단계 a-c가 적어도 20회 반복되는 방법이 본원에 추가로 제공된다. 단계 a-c가 10분 이내에 발생하는 방법이 본원에 추가로 제공된다. 단계 c가 5분 이내에 발생하는 방법이 본원에 추가로 제공된다.
폴리뉴클레오티드 서열분석 방법으로, a) 표면 상의 복수의 폴리뉴클레오티드를 서열분석하는 단계로, 여기서 표면은 단일 분자 서열분석을 위한 복수의 유전자좌를 포함하는 것인 단계 ; b) 상기 표면에서 폴리뉴클레오티드를 제거하는 단계; 및 c) 단계 a-b를 반복하여 폴리뉴클레오티드를 서열분석하는 단계를 포함하며, 여기서 적어도 1 메가바이트의 서열분석 데이터가 표면 상의 복수의 유전자좌 중 150,000개 이하의 유전자좌로부터 1시간 이내에 획득되는 방법이 본원에 제공된다. 적어도 1 기가바이트의 서열분석 데이터가 표면 상의 복수의 유전자좌 중 150,000개 이하의 유전자좌로부터 1시간 이내에 획득되는 방법이 본원에 추가로 제공된다. 적어도 1 테라바이트의 서열분석 데이터가 표면 상의 복수의 유전자좌 중 150,000개 이하의 유전자좌로부터 1시간 이내에 획득하는 방법이 본원에 추가로 제공된다. 1 메가바이트 내지 1 제타바이트의 서열분석 데이터가 표면 상의 복수의 유전자좌 중 150,000개 이하의 유전자좌로부터 1시간 이내에 획득하는 방법이 본원에 추가로 제공된다. 복수의 폴리뉴클레오티드가 적어도 1Gb의 디지털 정보를 인코딩하는 방법이 본원에 추가로 제공된다.
디지털 정보 항목을 인코딩하는 방법으로, a) 정보 항목을 디지털 서열로 제공하는 단계; b) 디지털 서열을 핵산 서열로 인코딩하는 단계; 및 c) 본원에 기술된 복수의 폴리뉴클레오티드를 생성하는 단계를 포함하는 방법이 본원에 제공된다.
디지털 정보 항목을 디코딩하는 방법으로, 본원에 기술된 방법을 사용하여 복수의 폴리뉴클레오티드의 핵산 서열을 얻는 단계; 상기 핵산 서열을 하나 이상의 디지털 서열로 디코딩하는 단계; 및 상기 하나 이상의 디지털 서열을 사용하여 디지털 정보 항목을 판독하는 단계를 포함하는 방법이 본원에 제공된다.
핵산 서열분석용 장치로서, 복수의 유전자좌를 포함하는 표면을 포함하는 고체 지지체; 유전자좌의 적어도 일부를 덮고 있는 결합 모이어티로, 결합 모이어티는 하나 이상의 폴리뉴클레오티드, 폴리머라제, 프라이머, 및 이들의 임의 조합의 복합체에 결합하도록 구성되고, 표면은 재사용 가능한 것인 결합 모이어티; 및 폴리머라제에 의해 첨가된 하나 이상의 염기의 정체를 식별하도록 구성되어 있는 검출기를 포함하는 장치가 본원에 제공된다. 결합 모이어티를 제거하지 않고 표면을 재사용할 수 있는 장치가 본원에 추가로 제공된다. 화학적 변형 없이 표면을 재사용할 수 있는 장치가 본원에 추가로 제공된다. 장치가 ㎟당 적어도 100,000개의 유전자좌를 포함하는 장치가 본원에 추가로 제공된다. 장치가 ㎟당 적어도 1,000,000개의 유전자좌를 포함하는 장치가 본원에 추가로 제공된다. 장치가 ㎟당 적어도 100,000 내지 10억개의 유전자좌를 포함하는 장치가 본원에 추가로 제공된다. 프라이머의 길이가 15 내지 50개 염기인 장치가 본원에 추가로 제공된다. 표면이 복수의 웰 또는 채널을 포함하는 것인 장치가 본원에 추가로 제공된다. 웰 또는 채널이 10 내지 200 ㎚의 가장 긴 선형 치수를 갖는 것인 장치가 본원에 추가로 제공된다. 하나 이상의 나노포어를 추가로 포함하는 장치가 본원에 추가로 제공된다. 표면이 실질적으로 평평한 표면인 장치가 본원에 추가로 제공된다. 고체 지지체가 유리, 실리콘, 또는 이들의 조합을 포함하는 것인 장치가 본원에 추가로 제공된다. 표면이 여기에 부착된 복수의 폴리머라제를 포함하는 것인 장치가 본원에 추가로 제공된다. 표면이 여기에 부착된 복수의 폴리뉴클레오티드를 포함하는 것인 장치가 본원에 추가로 제공된다. 표면이 2개 이상의 폴리뉴클레오티드, 폴리머라제, 또는 프라이머를 포함하는 복합체를 포함하는 것인 장치가 본원에 추가로 제공된다. 유전자좌의 적어도 1%가 폴리머라제, 폴리뉴클레오티드, 프라이머, 또는 이들의 임의의 조합의 복합체를 포함하는 것인 장치가 본원에 추가로 제공된다. 유전자좌의 적어도 30%가 폴리머라제, 폴리뉴클레오티드, 프라이머, 또는 이들의 임의의 조합의 복합체를 포함하는 것인 장치가 본원에 추가로 제공된다. 복합체가 공유 결합을 통해 부착되는 장치가 본원에 추가로 제공된다. 복합체가 비공유 결합을 통해 부착되는 장치가 본원에 추가로 제공된다. 복합체가 친화성 상호작용, 단백질, 올리고뉴클레오티드, 또는 열 방출성 연결을 통해 부착되는 장치가 본원에 추가로 제공된다. 친화성 상호작용이 스트렙트아비딘-비오틴을 포함하는 것인 장치가 본원에 추가로 제공된다. 친화성 상호작용이 항체-항원 결합을 포함하는 것인 장치가 본원에 추가로 제공된다. 친화성 상호작용이 단백질-단백질 상호작용을 포함하는 것인 장치가 본원에 추가로 제공된다. 유체 인터페이스를 추가로 포함하는 장치가 본원에 추가로 제공된다. 유동 셀을 추가로 포함하는 장치가 본원에 추가로 제공된다. 장치가 유전자좌당 적어도 하나의 검출기를 포함하는 장치가 본원에 추가로 제공된다. 검출기가 복수의 제로 모드 도파관을 포함하는 것인 장치가 본원에 추가로 제공된다. 검출기가 가시 파장, UV 파장, 또는 이들의 조합을 측정하도록 구성된 장치가 본원에 추가로 제공된다. 검출기가 형광을 측정하도록 구성된 장치가 본원에 추가로 제공된다. 검출기가 전압 또는 전류의 변화를 측정하도록 구성된 장치가 본원에 추가로 제공된다. 폴리뉴클레오티드 합성 장치를 추가로 포함하는 장치가 본원에 추가로 제공된다.
본원에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함되도록 구체적이고 개별적으로 표시된 것과 동일한 정도로 참조로 본원에 포함된다.
본 발명의 신규한 특징은 첨부된 청구범위에서 구체적으로 설명된다. 본 발명의 특징과 이점에 대한 더 나은 이해는 본 발명의 원리가 활용되는 예시적인 실시양태를 설명하는 다음의 상세한 설명과 첨부 도면을 참조하여 얻어질 것이다.
도 1은 서열분석 전 폴리뉴클레오티드 합성 및 제조를 위한 계획의 비제한적인 예를 예시한다.
도 2는 재사용 가능한 서열분석 칩을 사용하는 경우의, 폴리뉴클레오티드 서열분석 계획의 비제한적인 예를 예시한다.
도 3a-3c는 각각의 지점, 채널 또는 웰을 갖는 유연한 구조의 확대를 도시한다.
도 4a는 활성 영역과 유체 인터페이스를 포함하는 고체 지지체의 개략도이며;
도 4b는 고체 지지체 어레이의 예의 전면이다. 일부 경우에 이러한 어레이는 본원에 기술된 바와 같이 수천 또는 수백만 개의 폴리뉴클레오티드 합성 장치를 포함할 수 있으며;
도 4c는 고체 지지체 어레이의 예의 뒷면이다.
도 5는 랙형 장비의 예이다. 이러한 장비는 수백 또는 수천 개의 고체 지지제 어레이를 포함할 수 있다.
도 6은 컴퓨터 시스템의 예를 도시한다.
도 7은 컴퓨터 시스템의 아키텍처를 예시하는 블록도이다.
도 8은 복수의 컴퓨터 시스템, 복수의 휴대폰 및 개인 데이터 보조기, 그리고 NAS(Network Attached Storage)를 통합하도록 구성된 네트워크를 보여주는 다이어그램이다.
도 9는 공유 가상 주소 메모리 공간을 사용하는 다중 프로세서 컴퓨터 시스템의 블록도이다.
생성되고 저장되는 정보의 양이 기하급수적으로 증가함에 따라 더 큰 용량의 저장 시스템에 대한 필요성이 존재한다. DNA 분자와 같은 생체분자는 전통적인 2진 정보 인코딩와 달리, 시간 경과에 따른 안정성과 4비트 정보 인코딩에 대한 용량으로 인해 부분적으로 정보 저장에 적합한 호스트를 제공한다. 본원에서는 연속적인 작업 흐름을 사용하여 핵산 판독 속도와 효율성을 높이는 장치와 방법이 제공된다. 단일 분자 서열분석을 위해 표면을 재사용하거나 재활용하기 위한 장치 및 방법이 본원에 추가로 제공된다.
정의
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 이들 발명이 속하는 기술분야의 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
본 개시내용에 걸쳐, 수치적 특징은 범위 형식으로 제시된다. 범위 형식의 설명은 단지 편의와 간결성을 위한 것이며 임의의 실시양태의 범위에 대한 융통성 없는 제한으로 해석되어서는 안된다는 점을 이해해야 한다. 따라서, 범위에 대한 설명은 문맥상 명백하게 달리 명시하지 않는 한, 가능한 모든 하위 범위뿐만 아니라 그 범위 내에서 하한 단위의 10분의 1까지의 개별 수치를 구체적으로 개시한 것으로 간주되어야 한다. 예를 들어, 1 내지 6과 같은 범위에 대한 기술은 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등, 뿐만 아니라 해당 범위 내의 개별 값, 예를 들면 1.1, 2, 2.3, 5, 및 5.9와 같은 하위 범위를 구체적으로 개시한 것으로 간주되어야 한다. 이는 범위의 폭에 관계없이 적용된다. 이들 사이의 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있으며, 또한 언급된 범위에서 구체적으로 배제된 임의의 한계에 따라 본 발명 내에 포함된다. 언급된 범위가 한계 중 하나 또는 둘 다를 포함하는 경우, 문맥에서 달리 명시하지 않는 한, 포함된 한계 중 하나 또는 둘 모두를 제외하는 범위도 본 발명에 포함된다.
본원에서 사용된 용어는 단지 특정한 실시양태를 설명하기 위해 사용된 것이며, 임의의 실시양태를 한정하려는 의도는 아니다. 본원에서 사용된 단수형 "a", "an" 및 "the"는 문맥상 명백하게 달리 나타내지 않는 한 복수형도 포함하도록 의도된다. 본원에 사용된 "포함하다" 및/또는 "포함하는"이라는 용어는 언급된 특징, 정수, 단계, 동작, 요소, 및/또는 구성요소의 존재를 지정하지만, 하나 이상의 다른 특징, 정수, 단계, 동작, 요소, 구성요소, 및/또는 이의 그룹의 존재 또는 추가를 배제하지는 않는다는 것이 추가로 이해될 것이다. 본원에 사용된 바와 같이, "및/또는"이라는 용어는 연관된 나열된 항목 중 하나 이상의 임의의 및 모든 조합을 포함한다.
구체적으로 언급되지 않거나 문맥상 명백하지 않는 한, 본원에 숫자 또는 숫자 범위와 관련하여 사용된 용어 "약"은 명시된 숫자 및 숫자의 +/- 10%, 또는 범위에 대해 나열된 값에 대해 나열된 하한 및 나열된 상한보다 숫자의 10% 미만 및 10% 높은 것을 의미하는 것으로 이해된다.
본원에 사용된 용어 "미리 선택된 서열", "미리 정의된 서열" 또는 "미리 결정된 서열"은 상호교환적으로 사용된다. 이 용어는 중합체의 순서가 알려져 있고 중합체의 합성 또는 조립 전에 선택된다는 것을 의미한다. 특히, 본 발명의 다양한 양태는 주로 핵산 분자의 제조와 관련하여 본원에 기재되어 있으며, 폴리뉴클레오티드의 서열은 핵산 분자의 합성 또는 조립 전에 알려져 있고 선택된다.
본원에 사용되는 용어 "기호"는 일반적으로 디지털 정보 단위의 표현을 지칭한다. 디지털 정보는 하나 이상의 기호로 분할되거나 번역될 수 있다. 실시예에서, 기호는 비트일 수 있고 비트는 숫자 값을 가질 수 있다. 일부 실시예에서 기호는 '0' 또는 '1'의 값을 가질 수 있다. 일부 실시예에서, 디지털 정보는 기호의 서열 또는 기호의 문자열로 표현될 수 있다. 일부 실시예에서, 기호의 서열 또는 기호의 문자열은 2진 데이터를 포함할 수 있다.
합성(예를 들어, 드노보 합성 또는 화학적 합성) 폴리뉴클레오티드의 생산 및 서열분석을 위한 방법 및 조성물이 본원에 제공된다. 폴리뉴클레오티드는 올리고뉴클레오티드 또는 올리고로도 지칭될 수 있다. 본원에 기술된 폴리뉴클레오티드 서열은 달리 명시되지 않는 한 DNA 또는 RNA를 포함할 수 있다.
연속 서열분석
본원에 기술된 방법을 사용하여 서열분석된 폴리뉴클레오티드는 합성된 폴리뉴클레오티드의 서열을 판독하고 서열을 2진 코드와 같이 컴퓨터에 의해 판독 가능한 하나 이상의 기호를 포함하는 코드로 전환함으로써 해석될 수 있는 데이터를 인코딩한다. 일부 경우에, 서열에 조립이 필요하며, 조립 단계는 핵산 서열 단계 또는 디지털 서열 단계에서 발생할 수 있다. 일부 경우에, 서열분석은 서열 내 개별 염기의 차별적 식별/검출을 포함한다. 일부 경우에, 서열분석이 장치의 개별 분자에 대해 수행된다.
본원에서는 본원에 기술된 장치에 통합될 수 있는 서열분석 시스템이 제공된다. 다양한 서열분석 방법이 관련 기술 분야에 잘 알려져 있으며, 샘플 폴리뉴클레오티드에서 염기의 정체가 확인/서열분석되는 "염기 호출"을 포함한다. 일부 경우에, 본원에 기술된 방법, 장치, 조성물 및 시스템을 사용하여 합성된 폴리뉴클레오티드는 합성 표면으로부터 절단된 후 서열분석된다. 일부 경우에, 서열분석은 폴리뉴클레오티드 합성 동안 또는 이와 동시에 발생하며, 여기서 염기 호출은 뉴클레오시드 단량체가 성장하는 폴리뉴클레오티드 사슬로 확장된 직후 또는 이전에 발생한다. 염기 호출 방법에는 전류/전압(예: AC 또는 DC) 측정, 형광 측정, 또는 주형 가닥으로의 염기의 폴리머라제 촉매된 첨가(또는 일시적 결합)에 의해 생성된 기타 측정이 포함된다. 일부 경우에, 합성 표면 또는 서열분석 표면은 폴리머라제와 같은 효소를 포함한다. 일부 경우에, 이러한 효소가 전극이나 합성 또는 서열분석 표면에 묶여 있다. 일부 경우에, 합성 또는 서열분석 표면은 복수의 유전자좌(예: 배열 지점) 또는 웰(예: 나노포어)을 포함한다. 서열분석 후, 일부 경우에, 하나 이상의 폴리머라제, 프라이머, 또는 샘플 폴리뉴클레오티드가 장치 표면에서 제거되고, 동일한 장치 표면을 사용하여 제2 서열분석 주기를 촉진하기 위해 새로운 구성요소가 추가된다. 일부 경우에, 이 과정을 여러 번 반복하여 많은 수의 샘플 폴리뉴클레오티드를 서열분석한다.
구조물 위에서 직접 및/또는 구조물(예를 들어, 고체 지지체)로부터 제거한 후에 저장된 폴리뉴클레오티드의 서열을 분석하기 위한 장치를 포함하는 검출 시스템이 본원에 제공된다. 일부 경우에, 상기 장치는 하나 이상의 표면, 유체 인터페이스, 및 검출기를 포함한다. 일부 경우에, 신호가 폴리뉴클레오티드의 존재의 지표이다. 일부 경우에, 신호는 폴리뉴클레오티드의 서열의 지표이다(예: 형광 신호). 일부 예에서, 검출 시스템은 폴리뉴클레오티드 서열분석 장치, 폴리뉴클레오티드 서열과 관련된 데이터의 저장 및 검색을 위한 데이터베이스, 폴리뉴클레오티드 서열의 DNA 코드를 하나 이상의 기호(예: 2진 코드)로 전환하기 위한 소프트웨어, 2진 코드를 판독하기 위한 컴퓨터, 또는 이들의 임의의 조합을 포함하는 컴퓨터 시스템을 포함한다. 일부 경우에, 본원에 기술된 것은 하나 이상의 고체 지지체, 유전자좌의 적어도 일부를 덮는 결합 모이어티, 및 검출기를 포함한다. 일부 경우에, 유전자좌 중 적어도 일부는 단일 샘플 폴리뉴클레오티드를 포함한다. 일부 경우에, 고체 지지체는 표면을 포함한다. 일부 경우에, 표면은 복수의 유전자좌를 포함한다. 일부 경우에, 결합 모이어티는 하나 이상의 폴리뉴클레오티드, 폴리머라제, 프라이머, 및 이들의 임의 조합의 복합체를 결합하도록 구성된다. 일부 경우에, 검출기는 폴리머라제에 의해 첨가된 하나 이상의 염기의 정체를 식별하도록 구성된다. 일부 경우에, 표면은 재사용할 수 있다.
본원에 기술된 장치는 하나 이상의 검출기를 포함할 수 있다. 일부 예에서, 검출기가 전자기 방사선원을 포함한다. 일부 예에서, 전자기 방사선원이 가시광선, 적외선, 또는 UV 파장의 광을 생성하도록 구성된다. 일부 경우에, 장치는 하나 이상의 제로 모드 도파관을 포함한다. 일부 경우에, 장치는 하나 이상의 나노포어를 포함한다.
본원에 설명된 장치는 유연한 표면을 포함하는 구조를 포함할 수 있다. 구조가 유연한 재료의 릴-투-릴 테이프인 경우, 검출 시스템은 검출 위치를 통해 구조를 유지하고 전진시키는 장치와 섹션이 검출 위치에 있을 때 테이프의 섹션으로부터 기원하는 신호를 검출하기 위하여 검출 위치에 근접하게 배치된 검출기를 포함한다. 일부 경우에, 연속 테이프 상의 폴리뉴클레오티드 내에 인코딩된 정보는 테이프가 컴퓨터에 작동 가능하게 연결된 검출기를 통해 연속적으로 전달될 때 컴퓨터에 의해 판독된다.
폴리뉴클레오티드 서열분석 방법이 본원에 제공된다. 일부 경우에, 본원에 기술된 방법은 (a) 복수의 폴리뉴클레오티드를 적어도 하나의 프라이머 및 적어도 하나의 폴리머라제와 접촉시켜 복수의 3원 복합체를 형성하는 단계; (b) 폴리뉴클레오티드의 하나 이상의 염기를 검출하는 단계로, 여기서 검출은 복수의 3원 복합체가 표면에 결합될 때 발생하는 단계; (c) 표면에서 3원 복합체를 제거하는 단계; 및 (d) 단계 a-c를 반복하여 폴리뉴클레오티드의 서열을 서열분석하는 단계를 포함한다. 일부 경우에, 상기 방법은 표면을 세척하는 것을 포함한다. 서열분석 전에, 비제한적인 예에서 예시된 바와 같이, 도 1에 예시된 계획을 통해 폴리뉴클레오티드가 합성되고 서열분석을 위해 준비된다. 폴리뉴클레오티드는 본원에 기술된 방법을 사용하여 합성 표면(101)에서 합성된다. DNA 합성(102)이 수행되어, 합성 표면(103) 상에 복수의 폴리뉴클레오티드가 생성된다. 합성된 폴리뉴클레오티드는 표면(104)으로부터 제거되어 예를 들어 미세원심분리 튜브 또는 다른 적합한 매체 또는 용기에 수집된다. 일부 예에서, 유리 폴리뉴클레오티드(105)를 함유하는 미세원심분리 튜브는 폴리뉴클레오티드를 보존하는 데 적합한 완충액을 함유한다. 일부 예에서, 폴리뉴클레오티드는 원형이다. 일부 예에서, 폴리뉴클레오티드는 헤어핀 어댑터를 포함한다. 일부 예에서, 폴리뉴클레오티드가 합성 표면에서 증폭되거나 합성 칩에서 제거된 후에 증폭된다. 프라이머(107) 및 폴리머라제 효소(109)도 폴리뉴클레오티드와 접촉된다. 일부 예에서, 프라이머(107)은 다음 단계(106)에 폴리뉴클레오티드에 첨가되어 프라이머와 폴리뉴클레오티드 복합체(108)이 생성된다. 일부 예에서, 프라이머(107)은 10개 염기쌍, 20개 염기쌍, 30개 염기쌍, 40개 염기쌍, 50개 염기쌍, 또는 60개 염기쌍 이하이다. 추가 경우에, 폴리머라제 효소(109)는 추가 단계(110)에서 미세원심분리 튜브에 첨가되어 복수의 3원 복합체(111)을 생성한다. 일부 예에서, 폴리머라제 효소(109)는 결합 모이어티일 수 있는 제1 모이어티를 포함한다. 일부 예에서, 폴리머라제 효소(109)의 제1 모이어티는 비오틴을 포함한다. 일부 예에서, 폴리머라제 효소(109)의 제1 모이어티는 단백질 사슬을 포함한다. 일부 예에서, 폴리머라제 효소(109)의 제1 모이어티는 올리고뉴클레오티드를 포함한다. 일부 예에서, 폴리머라제 효소(109)는 비제한적인 예로서 박테리오파지 phi29(Φ29) 폴리머라제, 유전적으로 변형된 phi29(Φ29)DNA 폴리머라제, 종결인자 DNA 폴리머라제, DNA 폴리머라제 I의 Klenow 단편, 파지 M2 DNA 폴리머라제, 파지 phiPRD1 DNA 폴리머라제, Bst DNA 폴리머라제, exo(-)Bca DNA 폴리머라제, Bsu DNA 폴리머라제, VentR DNA 폴리머라제(예: VentR(exo-) DNA 폴리머라제), Deep Vent DNA 폴리머라제(예: Deep Vent(exo-) DNA 폴리머라제), IsoPol DNA 폴리머라제, DNA 폴리머라제 I, T5 DNA 폴리머라제, 시쿼나제(Sequenase), T7 DNA 폴리머라제, T7-시쿼나제, T7 gp5 DNA 폴리머라제, PRDI DNA 폴리머라제, 또는 T4 DNA 폴리머라제를 포함한다. 일부 예에서, 추가적인 가닥 치환 핵산 폴리머라제도 본원에 설명된 방법과 호환성이다. 가닥 치환 복제를 수행하는 주어진 폴리머라제의 능력은 예를 들어 가닥 치환 복제 분석에서 폴리머라제를 사용하여 결정될 수 있다. 일부 예에서, 이러한 분석은 사용되는 효소의 최적 활성에 적합한 온도에서 수행되는데, 예를 들어 phi29 DNA 폴리머라제의 경우 32℃, exo(-) Bst DNA 폴리머라제의 경우 46℃ 내지 64℃, 또는 고열성 유기체의 효소의 경우 약 60℃ 내지 70℃에서 수행된다. 일부 예에서, 폴리머라제를 선택하는 또 다른 유용한 분석법은 프라이머 블록 분석법이다. 일부 예에서, 폴리머라제는 C1, C2, P4-XL, P5-C3, 또는 P6-C4(Pacific Biosciences)를 포함한다.
구조물의 표면으로부터 폴리뉴클레오티드를 추출 및/또는 증폭시킨 후, 적합한 서열분석 기술을 사용하여 폴리뉴클레오티드를 서열분석할 수 있다. 일부 예에서, 폴리뉴클레오티드 서열은 구조물의 표면(본원에서는 반응 부위라고도 함)의 기판에서 또는 구조물의 피처(예: 나노웰, 마이크로웰, 나노포어 등) 내에서 판독된다. 일부 예에서, 구조물이 금속 필름을 포함한다. 일부 예에서, 구조물은 도 2에 도시된 바와 같은 단일 분자 서열분석 칩(203)이다. 일부 예에서, 폴리뉴클레오티드는 선택적으로 더 긴 핵산으로 조립된 후 서열분석된다. 폴리뉴클레오티드 3원 복합체 라이브러리(201)은 복수의 3원 복합체(111)로부터 생성되며, 이는 서열분석될 단일 분자 서열분석 칩(203)에 부하(예를 들어, 고정화)된다. 일부 예에서, 폴리뉴클레오티드 3원 복합체 라이브러리(201)은 적어도 100,000, 100만, 1000만, 5000만, 1억, 2억, 5억, 또는 적어도 7억 5000만 개의 고유한 폴리뉴클레오티드를 포함한다. 일부 예에서, 폴리뉴클레오티드 3원 복합체 라이브러리(201)은 약 1-750, 1-500, 1-250, 1-100, 또는 1-1천만 개의 고유한 폴리뉴클레오티드를 포함한다. 일부 예에서, 폴리뉴클레오티드 3원 복합체 라이브러리(201)은 100,000개, 100만개, 1천만개, 5천만개, 1억개, 2억개, 5억개, 또는 적어도 7억 5천만개 이하의 고유한 폴리뉴클레오티드를 포함한다. 단일 분자 서열분석 칩(203)은 3원 복합체 라이브러리(201)에 3원 복합체를 고정하기 위한 유전자좌를 포함한다. 일부 예에서, 단일 분자 서열분석 칩(203)은 적어도 50,000, 100,000, 200,000, 500,000, 750,000, 100만, 200만, 5백만개, 8백만개, 1천만개, 또는 적어도 2천만개의 유전자좌를 포함한다. 일부 예에서, 단일 분자 서열분석 칩(203)은 80,000 내지 2000만 개, 100만 내지 2000만 개, 100만 내지 1000만 개, 또는 500만 내지 2000만 개의 유전자좌를 포함한다. 일부 예에서, 단일 분자 서열분석 칩(203)은 50,000개, 100,000개, 200,000개, 500,000개, 750,000개, 1백만 개, 2백만 개, 5백만 개, 8백만 개, 1천만 개 이하, 또는 2천만 개 이하의 유전자좌를 포함한다.
본원에 설명된 구성요소(예: 기판)은 표면에 부착되거나 고정될 수 있다. 일부 예에서, 기판(예를 들어, 폴리뉴클레오티드, 폴리머라제, 프라이머, 또는 이들의 임의 조합의 복합체)은 물질을 포함하고/하거나 부착용 기판과의 커플링 반응을 촉진하는 물질로 코팅된 반응 부위의 표면에 고정된다. 이러한 경우, 기판 표면 또는 표면의 선택된 부위 또는 영역의 하나 이상의 화학적 및/또는 물리적 특성을 변경하기 위한 추가 또는 감산 프로세스에 의해 기판 표면을 화학적으로 및/또는 물리적으로 변경하는 표면 변형이 사용될 수 있다. 예를 들어, 표면 변형에는 (1) 표면의 습윤 특성 변경, (2) 표면 기능화, 예를 들어 표면 작용기를 제공, 변형 또는 대체, (3) 표면 탈기능화, 예를 들어 표면 작용기 제거, (4) 예를 들어, 에칭 등을 통해 표면의 화학적 조성 변경, (5) 표면 거칠기 증가 또는 감소, (6) 표면에 코팅 제공, 예를 들어 표면의 습윤 특성이 서로 다른 습윤 특성을 나타내는 코팅을 제공, 및/또는 (7) 표면에 미립자를 침착시키는 것이 포함된다. 일부 예에서, 구조물의 표면은 선택적으로 기능화되어 구조물에 2개 이상의 별개의 영역을 생성하며, 여기서 적어도 하나의 영역은 동일한 구조의 다른 영역과 다른 표면 또는 화학적 특성을 갖는다. 이러한 특성에는 표면 에너지, 화학적 종결, 화학적 모이어티의 표면 농도 등이 포함되지만 이에 제한되지 않는다. 일부 예에서, 기능성 물질의 혼합물을 사용하여 표면을 변형할 수도 있다. 기판 고정화 목적을 포함하여 반응 부위의 표면은 본원에 추가로 설명된 방법을 사용하여 제조될 수 있다. 일부 예에서, 서열분석 후 표면은 기판으로 다시 고정된다.
서열분석 칩에 대한 폴리뉴클레오티드의 고정화는 반응 부위에서 예를 들어 기판(예를 들어, 핵산 주형, 예로서 DNA, RNA 또는 이들의 하이브리드, 유사체 및 모방체, 또는 키나제에 대한 표적 분자)에 부착된 효소(예를 들어, 폴리머라제, 전사효소, 키나제 등)를 사용하여 링커 모이어티 또는 테더를 통해 공유 또는 비공유 상호작용을 통해 달성될 수 있다. 일부 예에서, 폴리뉴클레오티드 또는 기타 구성요소를 서열분석 칩에 고정하기 위해 접합 화학이 사용된다. 일부 예에서, 접합 화학은 친핵체/카르보닐; 아지드/포스핀; 1,4 마이클 첨가, 1,3-쌍극성 고리 첨가, 역전자 수요 고리 첨가; 올레핀 복분해; 또는 교차 결합 반응을 포함한다.
대안적인 예에서, 폴리뉴클레오티드 또는 프라이머를 포함하는 기판은 반응 부위에 직접 부착된다(예를 들어, 효소를 통하지 않고). 일부 경우에, 반응 부위는 단일 분자 서열분석 칩(203)의 표면이거나 광학적 구속물(예: 마이크로웰, 나노웰, 나노포어 등) 내에 있다. 핵산 또는 폴리머라제를 고체 지지체에 부착하기 위한 결합 모이어티의 비제한적인 예에는 아미드 또는 아미노 결합, 카르바메이트 결합, 이황화 결합, 에스테르 결합, 기능화된 말레이미드 결합, 히드라존 결합, (N)-기능화된 티오우레아, 티올에스테르 결합, 스트렙트아비딘 또는 아비딘/비오틴 결합, 또는 이들의 조합이 포함된다. 일부 예에서, 하나 이상의 반응 성분에 결합하는 항체가 결합 모이어티로 사용된다. 일부 예에서, 실릴 모이어티를 사용하여 유리와 같은 반응 부위의 기판에 직접 핵산을 부착한다. 일부 예에서, 핵산 주형(예: 폴리뉴클레오티드)이 반응 부위에 직접 부착된다. 일부 예에서, 주형과 하이브리드화할 수 있는 반응 부위에 상보적 영역을 포함하는 프라이머를 부착시켜, 모니터링에 적합한 위치에 고정시킴으로써 핵산 주형(예: 폴리뉴클레오티드)을 반응 부위에 고정시킨다. 대안적인 예에서, 핵산 주형(예를 들어, 폴리뉴클레오티드)은 본원에 설명된 폴리머라제를 통해 반응 부위에 고정시킨다.
본원에 기술된 사이토킨 펩티드에 통합된 링커, 접합 모이어티, 및 비천연 아미노산을 접합시키기 위해 다양한 접합 반응이 사용된다. 이러한 접합 반응은 종종 "생체직교" 반응과 같은 수성 조건과 호환된다. 일부 예에서, 접합 반응은 촉매, 빛, 또는 링커, 접합 모이어티, 또는 비천연 아미노산에서 발견되는 반응성 화학기와 같은 화학 시약에 의해 매개된다. 일부 예에서, 접합 반응이 효소에 의해 매개된다. 일부 예에서, 본원에 사용된 접합 반응은 문헌: Gong, Y., Pan, L. Tett. Lett. 2015, 56, 2123에 기술되어 있다. 일부 예에서, 본원에 사용된 접합 반응은 문헌: Chen, X.; Wu. Y-W. Org. Biomol. Chem. 2016, 14, 5417에 기술되어 있다.
본원에 기술된 일부 예에서, 접합 반응은 케톤 또는 알데히드와 친핵체의 반응을 포함한다. 일부 예에서, 접합 반응은 케톤과 아미노옥시기의 반응을 통해 옥심을 형성하는 것을 포함한다. 일부 예에서, 접합 반응은 케톤과 아릴 또는 헤테로아릴 아민기와 반응하여 이민을 형성하는 것을 포함한다. 일부 예에서, 접합 반응은 알데히드와 아릴 또는 헤테로아릴 아민기와의 반응을 통해 이민을 형성하는 것을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 옥심을 통해 부착된 링커 또는 접합 모이어티를 포함하는 사이토킨 펩티드를 생성한다. 일부 예에서, 접합 반응은 알데히드 또는 케톤과 트립타민 친핵체의 픽텟-스펭글러(Pictet-Spengler) 반응을 포함한다. 어떤 예에서, 접합 반응은 히드라지노-픽텟-스펭글러(hydrazino-Pictet-Spengler) 반응을 포함한다. 어떤 예에서, 접합 반응은 픽텟-스펭글러 결찰을 포함한다.
본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 아지드와 포스핀의 스타우딩거 결찰 반응(Staudinger ligation)을 포함한다. 일부 예에서, 포스핀은 아릴 포스핀이다. 일부 예에서, 아릴 포스핀은 오르토 에스테르기를 포함한다. 일부 예에서, 포스핀은 메틸 2-(디페닐포스판일)벤조에이트 구조를 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 아릴아미드를 통해 부착된 링커 또는 접합 모이어티를 포함하는 사이토킨 펩티드를 생성한다. 일부 예에서, 본원에 기술된 접합 반응은 아미드를 통해 부착된 링커 또는 접합 모이어티를 포함하는 사이토킨 펩티드를 생성한다.
본원에 기재된 일부 예에서, 본원에 기재된 접합 반응은 1,3-쌍극성 고리첨가 반응을 포함한다. 일부 예에서, 1,3-쌍극성 고리첨가 반응은 아지드와 포스핀의 반응("클릭" 반응)을 포함한다. 일부 예에서, 접합 반응이 구리에 의해 촉매된다. 일부 예에서, 본원에 기술된 접합 반응은 트리아졸을 통해 부착된 링커 또는 접합 모이어티를 포함하는 사이토킨 펩티드를 생성한다. 일부 예에서, 본원에 기술된 접합 반응은 아지드와 변형된 올레핀의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 아지드와 변형된 알킨의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 아지드와 시클로알킨, 예를 들어 OCT, DIFO, DIFBO, DIBO, BARAC, TMTH, 또는 기타 변형된 시클로알킨과의 반응을 포함하며, 이의 구조는 문헌: Gong, Y., Pan, L. Tett. Lett 2015, 56, 2123에 나타나 있다. 일부 예에서, 1,3-쌍극성 고리첨가 반응은 빛("광클릭")에 의해 촉매된다. 일부 예에서, 본원에 기술된 접합 반응은 말단 알릴기와 테트라졸 및 빛의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 말단 알키닐기와 테트라졸 및 빛의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 O-알릴 아미노산과 테트라진 및 빛의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 O-알릴 티로신과 테트라진 및 빛의 반응을 포함한다.
본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 디엔 및 친디엔체를 포함하는 역전자 수요 고리화첨가 반응을 포함한다. 일부 예에서, 디엔은 테트라진을 포함한다. 일부 예에서, 친디엔체는 알켄을 포함한다. 일부 예에서, 친디엔체는 알킨을 포함한다. 일부 예에서, 알킨은 변형된 알킨이다. 일부 예에서, 알켄은 변형된 디엔이다. 일부 예에서, 알킨은 트랜스시클로옥틴이다. 일부 예에서, 알킨은 시클로옥텐이다. 일부 예에서, 알켄은 시클로프로펜이다. 일부 예에서, 알켄은 플루오로시클로프로펜이다. 일부 예에서, 본원에 기술된 접합 반응은 고리에 2개의 질소 원자를 포함하는 6원 고리 헤테로사이클을 통해 링커 또는 접합 모이어티에 부착된 사이토킨 펩티드의 형성을 초래한다.
본원에 기재된 일부 예에서, 본원에 기재된 접합 반응은 올레핀 복분해 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 알켄 및 알킨과 루테늄 촉매의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 2개의 알켄과 루테늄 촉매의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 2개의 알킨과 루테늄 촉매의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 알켄 또는 알킨과 루테늄 촉매 및 알릴기를 포함하는 아미노산의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 알켄 또는 알킨과 루테늄 촉매 및 알릴 술파이드 또는 셀레나이드를 포함하는 아미노산의 반응을 포함한다. 일부 예에서, 루테늄 촉매가 호베다 그룹(Hoveda-Grubbs) 2세대 촉매이다. 일부 예에서, 올레핀 복분해 반응은 하나 이상의 변형된 알켄 또는 알킨의 반응을 포함한다.
본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 교차-커플링 반응을 포함한다. 일부 예에서, 교차 커플링 반응은 이리듐, 금, 루테늄, 로듐, 팔라듐, 니켈, 백금, 또는 기타 전이 금속 촉매와 같은 전이 금속 촉매 및 하나 이상의 리간드를 포함한다. 일부 예에서, 전이 금속 촉매가 수용성이다. 본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 스즈키-미야우라(Suzuki-Muyaura) 교차 커플링 반응을 포함한다. 본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 아릴 할라이드(또는 트리플레이트 또는 토실레이트), 아릴 또는 알케닐 보론산, 및 팔라듐 촉매의 반응을 포함한다. 본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 소노가시라(Sonogashira) 교차 커플링 반응을 포함한다. 본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 아릴 할라이드(또는 트리플레이트 또는 토실레이트), 알킨, 및 팔라듐 촉매의 반응을 포함한다. 일부 예에서, 교차 커플링 반응으로 인해 링커 또는 접합 모이어티가 탄소-탄소 결합을 통해 사이토킨 펩티드에 부착된다.
본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 접합 전 반응기의 탈보호 또는 "케이징 해제" 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 빛에 의한 반응기의 케이징 해제에 이어 접합 반응을 포함한다. 일부 예에서, 반응기는 하나 이상의 니트로기를 포함하는 아르알킬 모이어티로 보호된다. 일부 예에서, 반응기의 케이징 해제로 인해 유리 아민, 황화물, 또는 기타 반응기가 생성된다. 일부 예에서, 본원에 기술된 접합 반응은 전이 금속 촉매를 사용하여 반응기를 케이징 해제한 후 접합 반응을 포함한다. 일부 예에서, 전이금속 촉매는 팔라듐 및 하나 이상의 리간드를 포함한다. 일부 예에서, 반응기는 알릴 모이어티로 보호된다. 일부 예에서, 반응기는 알릴 카르바메이트로 보호된다. 일부 예에서, 반응기는 프로파르길릭 모이어티로 보호된다. 일부 예에서, 반응기는 프로파르길 카르바메이트로 보호된다. 일부 예에서, 반응기는 친디엔체로 보호되는데, 여기서 디엔(예: 테트라진)에 노출되면 반응기가 탈보호된다.
본원에 기술된 일부 예에서, 본원에 기술된 접합 반응은 리간드 지시된 반응을 포함하며, 여기서 리간드(선택적으로 반응기에 부착된)는 반응기와 사이토킨 펩티드 사이의 접합 부위를 촉진한다. 일부 예에서, 리간드는 사이토킨 펩티드와 반응기와의 반응 동안 또는 후에 절단된다. 일부 예에서, 사이토킨 펩티드의 접합 부위는 천연 아미노산이다. 일부 예에서, 사이토킨 펩티드의 접합 부위는 라이신, 시스테인 또는 세린이다. 일부 예에서, 사이토킨 펩티드의 접합 부위는 본원에 기술된 비천연 아미노산이다. 일부 예에서, 반응기는 전자가 부족한 아릴 또는 헤테로아릴기와 같은 이탈기를 포함한다. 일부 예에서, 반응기는 사이토킨 펩티드에 의해 대체되는 전자가 부족한 알킬기와 같은 이탈기를 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 라디칼 포획제와 라디칼 종의 반응을 포함한다. 일부 예에서, 본원에 기술된 접합 반응은 산화성 라디칼 첨가 반응을 포함한다. 일부 예에서, 라디칼 포획제가 아릴아민이다. 일부 예에서, 라디칼 종은 티로실 라디칼이다. 일부 예에서, 루테늄 촉매(예: [Ru(bpy)3])와 빛에 의해 라디칼 종이 생성된다.
효소 반응은 본원에 기술된 접합 반응을 위해 선택적으로 사용된다. 예시적인 효소적 접합에는 SortA 매개 접합, TGs 매개 접합, 또는 FGE 매개 접합이 포함된다. 일부 예에서, 본원에 기술된 접합 반응은 말단 1-아미노-2-티오기와 티오에스테르의 천연 단백질 결찰(NPL)에 의해 아미드 결합을 형성하는 것을 포함한다.
링커 또는 접합 모이어티를 사이토킨 펩티드와 반응시키기 위한 다양한 접합 반응이 본원에 기재되어 있으며, 여기서 상기 반응은 사이토킨 펩티드 내의 천연("표준") 아미노산과 함께 발생한다. 일부 예에서, 천연 아미노산이 야생형 서열에서 발견되는 접합 위치에서 발견되거나, 대안적으로 위치가 돌연변이되었다. 일부 예에서, 접합 반응은 시스테인 잔기에서 이황화 결합을 형성하는 것을 포함한다. 일부 예에서, 접합 반응은 시스테인 또는 라이신의 1,4 마이클 첨가 반응을 포함한다. 일부 예에서, 접합 반응은 시스테인의 시아노벤조티아졸 결찰을 포함한다. 일부 예에서, 접합 반응은 1,3-디클로로-2-프로피온온과 같은 아세톤 모이어티와의 가교결합을 포함한다. 일부 예에서, 접합 반응은 시스테인과 O-메시틸렌술포닐히드록실아민의 반응에 의해 형성된 데히드로알라닌에 대한 1,4 마이클 첨가를 포함한다. 일부 예에서, 접합 반응은 티로신과 트리아졸린디온(TAD), 또는 TAD 유도체의 반응을 포함한다. 일부 예에서, 접합 반응은 트립토판과 로듐 카르베노이드의 반응을 포함한다.
일부 예에서, 폴리머라제는 3원 복합체를 단일 분자 서열분석 칩(203)에 직접 묶는 데 사용되는 제1 모이어티를 포함한다. 일부 예에서, 결합 분자는 제1 모이어티에 부착되며, 이는 3원 복합체를 단일 분자 서열분석 칩(203)에 묶는 데 사용된다. 추가의 경우에, 단일 분자 서열분석 칩(203)은 이의 반응 부위에 복수의 제2 모이어티를 포함한다. 일부 예에서, 제2 모이어티는 비오틴이다. 일부 예에서, 제2 모이어티는 단백질이다. 일부 예에서, 제2 모이어티는 올리고뉴클레오티드이다. 일부 예에서, 복수의 제2 모이어티는 폴리뉴클레오티드, 폴리머라제, 프라이머, 또는 이들의 조합을 통해, 3원 복합체를 단일 분자 서열분석 칩(203)에 묶는 데 사용된다. 추가의 경우, 복수의 제2 모이어티는 제1 모이어티에 부착된 결합 분자에 부착되거나, 제1 모이어티에 직접 부착된다(예를 들어, 결합 분자 없이). 일부 예에서, 제1 모이어티와 제2 모이어티는 동일한 모이어티이다. 대안적인 예에서, 제1 모이어티와 제2 모이어티는 서로 다른 모이어티이다. 일부 예에서, 단일 분자 서열분석 칩(203)은 샘플 폴리뉴클레오티드를 수용할 수 있을 만큼 "부하"되거나 채워진다. 일부 예에서, 하나 이상의 유전자좌는 각각 단일 분자 샘플 폴리뉴클레오티드를 포함한다. 일부 예에서, 단일 분자 서열분석 칩(203)은 약 1%, 2%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 또는 70% 용량으로 부하된다. 일부 예에서, 단일 분자 서열분석 칩(203)은 약 33%, 약 50%, 또는 약 66% 용량으로 부하된다. 일부 예에서, 단일 분자 서열분석 칩(203)은 1%, 2%, 5%, 10%, 20%, 30%, 40%, 50%, 60% 또는 70% 용량 이하로 부하된다. 일부 예에서, 단일 분자 서열분석 칩(203)은 약 1~50%, 2~50%, 5~50%, 5~25%, 5~10%, 10~50%, 약 10~40% 용량, 약 10~30% 용량, 약 20~40% 용량, 약 20~30% 용량, 약 30~40% 용량, 또는 약 30~50% 용량으로 부하된다. 일부 예에서, 단일 분자 서열분석 칩(203)은 미리 결정된 분포에 따라 어레이로 부하된다. 일부 예에서, 단일 분자 서열분석 칩(203)은 포아송 분포 또는 정규 분포에 따라 부하된다.
이제 부하된 단일 분자 서열분석 칩(203)에 있는 폴리뉴클레오티드는 서열분석되어(204), 서열분석 동안 통합된 뉴클레오티드에 고유한 출력 신호(205)를 생성한다. 출력 신호는 서열 상보성을 통해 폴리뉴클레오티드의 서열을 결정하는 데 사용된다. 일부 예에서, 서열분석되는 폴리뉴클레오티드는 30,000, 20,000, 10,000, 5,000, 1000, 500개 이하, 또는 250개 이하의 염기를 포함한다. 일부 예에서, 서열분석되는 폴리뉴클레오티드는 적어도 30,000, 20,000, 10,000, 5,000, 1000, 500, 또는 적어도 250개의 염기를 포함한다. 서열분석 칩 상의 폴리뉴클레오티드가 서열분석되면, 3원 복합체는 세척 단계(207)를 통해 제거된다(206). 일부 예에서, 부하되지 않은 단일 분자 서열분석 칩(208)의 표면은 세척 단계(207) 후에 다시 기능화될 필요가 없다. 일부 예에서, 복수의 제2 모이어티는 세척 단계(207) 후에 부하되지 않은(또는 적어도 부분적으로 부하되지 않은) 단일 분자 서열분석 칩(208)에 묶인 상태로 유지된다. 일부 예에서, 세척 단계(207)는 하나 이상의 유기 용매(들), 열, 또는 효소를 포함한다. 일부 예에서, 유기 용매(들)는 MeCN, 메탄올, 에탄올, 2-프로판올, 아세톤, DMF, DMSO, 포름아미드, THF, 또는 이들의 임의의 조합을 포함한다. 일부 예에서, 효소는 프로테이나제이다. 일부 예에서, 프로테이나제는 아미노펩티다제를 포함한다. 일부 예에서, 아미노펩티다제는 프로테이나제 K, N-말단 아미노펩티다제, C-말단 아미노펩티다제, 키모트립신, 트립신, 펩신, 또는 LysC를 포함한다. 일부 예에서, 프로테이나제는 프로테이나제 K이다. 일부 예에서, 세척 단계(207)는 스트렙트아비딘 또는 아비딘/비오틴 결합을 파괴하기 위해 비오틴을 포함하는 액체를 사용하는 것을 포함한다. 일부 경우에, 세척 단계(207)는 1분, 2분, 3분, 4분, 5분, 6분, 7분, 8분, 9분, 또는 10분 이하가 소요된다. 일부 예에서, 세척 단계(207)는 약 1 내지 10분, 약 1 내지 7분, 약 1 내지 5분, 약 1 내지 2분, 약 2 내지 6분, 약 3 내지 4분, 약 5 내지 6분, 5 내지 10분, 또는 7 내지 10분이 소요된다. 일부 예에서, 폴리뉴클레오티드 3원 복합체 라이브러리(201)를 서열분석하고 단일 분자 서열분석 칩(203)을 세척하는 전체 주기는 5분, 6분, 7분, 8분, 9분, 10분, 11분, 12분, 13분, 14분, 15분, 18분, 20분, 25분, 또는 30분을 넘지 않는다. 세척은 세척이 1회, 2회, 3회, 4회, 5회, 8회, 10회, 12회, 15회, 20회, 25회, 30회, 50회, 또는 100회 반복되도록 세척 조건과 반복적으로 접촉하는 것을 포함할 수 있다. 세척은 세척이 적어도 1회, 2회, 3회, 4회, 5회, 8회, 10회, 12회, 15회, 20회, 25회, 30회, 50회, 또는 적어도 100회 반복되도록 세척 조건과 반복적으로 접촉시키는 것을 포함할 수 있다. 일부 예에서, 제거된 3원 복합체가 복구된다. 대안적 예에서, 제거된 3원 복합체가 복구되지 않는다. 도 2를 참조하면, 모든 3원 복합체가 세척 단계(207)에서 제거되면, 부하되지 않은 단일 분자 서열분석 칩(208)은 새로운 3원 복합체 라이브러리로 다시 부하된다(209). 일부 예에서, 부하되지 않은 단일 분자 서열분석 칩(208)의 표면은 다시 부하되기 전에 컨디셔닝된다. 일부 예에서, 부하되지 않은 단일 분자 서열분석 칩(208)의 표면은 다시 부하되기 전에 컨디셔닝되지 않는다. 일부 예에서, 컨디셔닝은 배싱(bathing), 베이킹, 세정, 에칭, 세척, 또는 표면을 후속 폴리뉴클레오티드 서열분석에 적합한 조건으로 재조정하는 것을 포함한다. 새로운 3원 복합체 라이브러리(209)가 서열분석을 위해 다시 부하되면, 본원에 설명된 서열분석 단계가 반복된다. 표면이 재사용되는 횟수와 재사용을 위해 표면을 재활용/준비하는 방법은 후속 적용에 따라 다르다. 재사용을 위해 준비된 표면은 일부 예에서, 적어도 1회, 2회, 3회, 5회, 10회, 20회, 50회, 100회, 1,000회 이상 재사용된다. 일부 예에서, 남은 "수명" 또는 표면이 재사용에 적합한 횟수를 측정하거나 예측한다. 일부 예에서, 서열분석 방법은 (a) 복수의 폴리뉴클레오티드를 적어도 하나의 프라이머 및 적어도 하나의 폴리머라제와 접촉시켜 복수의 3원 복합체를 형성하는 단계; (b) 폴리뉴클레오티드의 하나 이상의 염기를 검출하는 단계로, 여기서 검출은 복수의 3원 복합체가 표면에 결합될 때 발생하는 단계; (c) 표면에서 3원 복합체를 제거하는 단계; 및 (d) 단계 a-c를 반복하여 폴리뉴클레오티드의 서열을 서열분석하는 단계를 포함하며, 여기서 상기 방법은 적어도 하나의 세척 단계를 포함한다.
장치 표면에 새로운 구성성분(예: 프라이머, 폴리머라제, 샘플 폴리뉴클레오티드)가 다시 부하되기 전에 임의의 수의 판독물이 획득될 수 있다. 일부 예에서, 장치가 다시 부하되기 전에 적어도 1천만, 5천만, 1억, 10억, 100억, 1000억, 또는 적어도 2000억개의 판독물이 획득된다. 일부 예에서, 판독물은 핵산 서열 데이터의 세그먼트를 포함한다. 일부 예에서, 판독물 길이가 적어도 10, 50, 75, 100, 125, 150, 200, 250, 500, 1000, 2000, 5000, 또는 적어도 10,000개의 염기이다. 일부 예에서, 판독물은 인실리코에서 더 큰 연속 서열(예: 콘티그(contigs))로 조립된다. 일부 예에서, 콘티그는 염색체, 게놈, 데이터 파일, 또는 기타 단위와 같은 더 큰 그룹으로 인실리코로 조립된다. 일부 예에서, 하나 이상의 인덱스를 사용하여 판독물이 조립된다. 일부 예에서, 하나 이상의 인덱스는 핵산 서열에 인코딩된 디지털 정보의 위치 또는 주소를 나타낸다.
본원에 기술된 서열분석 방법은 폴리뉴클레오티드를 서열분석하기 위한 발광 마커의 사용을 포함할 수 있다. 일부 예에서, 반응 혼합물의 각 뉴클레오티드, A, T, C 및 G가 고유한 발광 마커로 표지된다. 발광 마커의 예에는 효소, 형광 분자, 형광단, 형광 염료, 형광 스테인, 염료(예: 유기 염료 또는 비유기 염료), 형광 단백질(예: 고유 또는 비고유), 비-형광 태그(예: SERS(표면 강화 라만 산란) 입자), 산란 금속 나노 입자(예: 금 또는 은), 발색단 조합(예: 단일 또는 다중 구성요소의 FRET(형광 공명 에너지 전달) 표지), 양자 점, 또는 이들의 조합이 포함되지만 이에 제한되지 않는다. 일부 예에서, 각각의 고유한 발광 마커는 방출 파장, 방출의 시간적 특성(예를 들어, 방출 붕괴 기간), 및/또는 여기 에너지에 대한 반응(예를 들어, 여기 광자를 흡수할 확률)과 같은 방출 특성이 다양하다. 일부 경우에, 각 발광 마커의 방출 특성 중 임의의 어느 하나의 차이로 서로 구별될 수 있다. 일부 예에서, 방출된 발광의 시간 변화(예를 들어, 형광 수명)의 측정은 발광 마커를 구별하는 데 사용된다. 일부 예에서, 발광 마커는 링커를 통해 뉴클레오티드, 예를 들어 뉴클레오티드의 말단 포스페이트에 부착된다. 링커의 예로는 예를 들어 천연 또는 변형된 뉴클레오티드의 말단 포스페이트에서 포스페이트 에스테르, 티오에스테르, 포스포르아미데이트 또는 알킬 포스포네이트 결합를 형성하는데 적합할 수 있는, 적어도 하나 또는 복수의 히드록실기, 술프히드릴기, 아미노기 또는 할로알킬기가 있지만 이에 제한되지 않는다. 폴리뉴클레오티드, 프라이머, 또는 폴리머라제는 일부 경우에, 제로 모드 도파관을 형성하는 서열분석 칩의 웰에 묶여 있다. 일부 예에서, 웰(예: 나노웰)은 직경이 있는 원통형이다. 일부 예에서, 제로 모드 도파관은 웰을 통한 전파 광학 모드를 지원하지 않는 단일 금속층으로 형성된다. 일부 예에서, 칩의 각 웰에는 약 하나의 샘플(예: 하나의 폴리뉴클레오티드)이 포함되어 있다. 고유한 발광 마커를 가진 새로운 뉴클레오티드는 폴리머라제와 프라이머를 통해 폴리뉴클레오티드 서열에 연속적으로 통합된다. 각 통합된 뉴클레오티드와 관련된 고유한 발광 마커는 통합 중 또는 통합 후에 적어도 하나의 적절한 여기원(예: 레이저와 같은 광원)으로 여기된다. 일부 예에서, 여기원이 여기를 유도하는 전자기 에너지를 생성한다. 일부 예에서, 적어도 하나의 여기원으로부터의 여기 에너지가 펄스화된다. 일부 예에서, 적어도 하나의 여기원이 하나 이상의 여기 에너지를 생성한다. 발광 마커로부터의 방출은 이후에 검출되고 통합된 특정 뉴클레오티드에 기인한다. 검출된 발광 마커의 수집으로부터 얻은 서열은 서열 상보성을 통해 폴리뉴클레오티드의 서열을 결정하는 데 사용된다. 발광 마커를 검출한 후, 새로 통합된 뉴클레오티드에서 발광 마커를 분리하기 위해 링커를 절단한다. 일부 예에서, 발광 마커가 말단 포스페이트에 부착되고 폴리머라제와 같은 중합반응 효소가 발광 마커를 절단하는 데 사용된다.
본원에 기술된 추가 서열분석 방법은 폴리뉴클레오티드를 서열분석하기 위한 전자장치의 사용을 포함할 수 있다. 그러한 경우, 분자 전자 센서를 사용하여 폴리뉴클레오티드 서열의 뉴클레오티드 패턴에 따라 구별 가능한 신호를 생성한다. 분자 전자 센서는 서로 떨어져 있는 한 쌍의 전극을 포함한다. 분자 복합체가 각 전극에 부착되어 분자 전자 회로를 형성한다. 일부 예에서, 분자 복합체는 가교 분자와 프로브 분자를 포함한다. 가교 분자의 비제한적인 예로는 그라펜 나노리본, 항체, 탄소 나노튜브, 항체의 Fab 암(arm), 이중 가닥 DNA 올리고머, 단백질 알파 나선, 또는 이들의 조합이 있다. 일부 예에서, 프로브 분자는 활성을 통해 측정 가능한 전기적 매개변수를 조절하는 폴리머라제이다. 일부 경우에, 측정 가능한 전기적 매개변수는 분자 복합체를 통과하는 전극 사이의 전류를 포함하며, 이는 정량적으로(예: 피크 진폭, 신호 지속 시간 등) 및/또는 정성적으로(예: 피크 모양) 뉴클레오티드 패턴을 구별하는데 사용된다. 측정된 구별 가능한 전기적 매개변수는 폴리뉴클레오티드 서열과 관련된 2진 데이터로 전환된다.
본원에 기술된 추가 서열분석 방법은 합성에 의한 나노포어 서열분석(SBS)의 사용을 포함할 수 있다. 그러한 경우, 효소(예를 들어, 폴리머라제)를 사용하여 표적 서열 주형에 상보적인 폴리뉴클레오티드 서열을 합성한다. 동시에, 성장하는 가닥에 첨가된 각각의 뉴클레오티드의 정체는 폴리머라제 활성 부위에 인접한 나노포어를 통한 전류 흐름(예: AC 또는 DC)을 모니터링하여 결정된다. 첨가된 각 뉴클레오티드에는 태그가 부착되어 있으며, 이를 사용하여 나노포어를 통해 흐르는 전류의 식별 가능한 변화를 생성한다. 태그의 예에는 폴리에틸렌-글리콜(PEG) 올리고머, 유기 염료 모이어티, 올리고뉴클레오티드(천연 및/또는 비천연 유사체 단량체 단위 포함), 폴리펩티드(천연 및/또는 비천연 유사체 단량체 단위 포함), 올리고머 모이어티, 또는 이들의 임의의 조합이 포함되지만 이에 제한되지 않는다. 일부 예에서, 태그는 나노포어를 통한 식별 가능한 전류 차단(예: "전류 차단")을 제공하기에 충분한 시간(예: "체류 시간") 동안 나노포어에 존재한다. 전류 차단을 사용하여 태그와 관련된 특정 뉴클레오티드를 식별하여 태그를 다른 태그된 뉴클레오티드와 구별한다.
추가적인 컴퓨터 통합 방법이 본원에 기술된 서열분석 방법과 함께 사용될 수 있다. 일부 예에서, 기계 학습(ML)을 포함하는 알고리즘을 사용하여 폴리뉴클레오티드에 첨가된 뉴클레오시드 단량체에 전류/전압을 연관시킨다. 일부 경우에, ML을 포함하는 알고리즘은 폴리뉴클레오티드에 첨가된 뉴클레오시드 단량체에 전류/전압을 연관시키기 위해 훈련 데이터로 훈련될 수 있다. 일부 경우에, 알고리즘은 분류 및/또는 클러스터링을 위한 기존 ML 알고리즘(예: K-평균 클러스터링, 평균 이동 클러스터링, DBSCAN(잡음이 있는 애플리케이션의 밀도 기반 공간 클러스터링), EM(기대 최대화) 클러스터링, 응집 계층적 클러스터링, 로지스틱 회귀, Naive Bayes, K-최근접 이웃, 랜덤 포레스트 또는 의사결정 트리, 그래디언트 부스팅, 지원 벡터 머신(SVM), 또는 이들의 조합)을 포함한다.
일부 경우에, 알고리즘은 하나 이상의 신경망과 같은 층을 포함하는 학습 알고리즘을 포함한다. 신경망은 입력 데이터를 전환하거나 번역하는 등의 기능을 수행할 수 있는 네트워크의 연결된 노드를 포함할 수 있다. 일부 예에서, 특정 노드의 출력은 다른 노드에 입력으로 전달될 수 있다. 일부 실시양태에서, 네트워크의 노드는 입력 유닛, 숨겨진 유닛, 출력 유닛, 또는 이들의 조합을 포함할 수 있다. 일부 경우에, 입력 노드는 하나 이상의 숨겨진 유닛에 연결될 수 있다. 일부 경우에, 하나 이상의 숨겨진 유닛이 출력 유닛에 연결될 수 있다. 노드는 입력을 받아들일 수 있고 활성화 함수에 기초하여 출력을 생성할 수 있다. 일부 실시양태에서, 입력 또는 출력은 텐서, 행렬, 벡터, 배열 또는 스칼라일 수 있다. 일부 실시양태에서, 활성화 함수는 정류 선형 유닛(Rectified Linear Unit) 활성화 함수, 시그모이드 활성화 함수, 또는 쌍곡탄젠트 활성화 함수일 수 있다. 일부 실시양태에서, 활성화 함수는 소프트맥스 활성화 함수일 수 있다. 노드들 사이의 연결은 주어진 노드에 대한 입력 데이터를 조정하기 위한(예를 들어, 입력 데이터를 활성화하거나 입력 데이터를 비활성화하기 위해) 가중치를 더 포함할 수 있다. 일부 실시양태에서, 가중치는 신경망에 의해 학습될 수 있다. 일부 실시양태에서, 신경망은 경사 기반 최적화를 사용하여 훈련될 수 있다. 일부 경우에, 경사 기반 최적화가 하나 이상의 손실 함수로 구성될 수 있다. 일부 예에서, 경사 기반 최적화는 공액 경사 하강, 확률적 경사 하강, 또는 이들의 변형(예를 들어, 적응형 모멘트 추정(Adam))일 수 있다. 추가 예에서, 경사 기반 최적화의 경사는 역전파를 사용하여 계산될 수 있다. 일부 실시예에서, 노드는 네트워크(예를 들어, 그래프 신경망)를 생성하기 위해 그래프로 구성될 수 있습니다. 일부 실시양태에서, 노드는 네트워크(예를 들어, 순방향 신경망(feed forward neural networks), CNN(콘볼루션 신경망: Convolutional Neural Network), RNN(순환 신경망: Recurrent Neural Network) 등)를 생성하기 위해 하나 이상의 층으로 구성될 수 있다. 일부 경우에, 신경망이 하나 이상의 층으로 구성된 심층 신경망일 수도 있다.
일부 경우에, 신경망은 하나 이상의 순환 층을 포함할 수 있다. 일부 예에서, 하나 이상의 순환 층은 순차적 데이터 분류 및 클러스터링을 수행할 수 있는 하나 이상의 LSTM(장단기 메모리: Long Short-Term Memory) 층 또는 GRU(게이트 순환 유닛: Gated Recurrent Unit)일 수 있다. 일부 실시양태에서, 신경망은 하나 이상의 콘볼루션 층을 포함할 수 있다. 입력과 출력은 데이터 세트의 변수나 속성(예: 특징)을 나타내는 텐서일 수 있으며, 이를 특징 맵(또는 활성화 맵)이라고 할 수 있다. 일부 경우에, 콘볼루션은 1차원(1D) 콘볼루션, 2차원(2D) 콘볼루션, 3차원(3D) 콘볼루션, 또는 이들의 임의의 조합일 수 있다. 추가 경우에, 콘볼루션은 1D 전치 콘볼루션, 2D 전치 콘볼루션, 3D 전치 콘볼루션, 또는 이들의 임의의 조합일 수 있다. 일부 예에서, 1차원 콘볼루션 층은 병렬 콘볼루션을 통해 시계열을 분류할 수 있으므로 시계열 데이터에 적합할 수 있다. 일부 예에서, 폴리뉴클레오티드에 첨가된 뉴클레오시드 단량체에 대한 전류/전압을 분석하기 위해 콘볼루션 층을 사용할 수 있다.
신경망의 층은 콘볼루션 층 이전 또는 이후에 하나 이상의 풀링층을 추가로 포함할 수 있다. 하나 이상의 풀링층은 행렬의 영역을 요약하는 필터를 사용하여 특징 맵의 차원성을 줄일 수 있다. 이는 출력 수를 다운샘플링하여 신경망에 필요한 매개변수와 컴퓨터를 이용하는 리소스를 줄일 수 있다. 일부 실시양태에서, 하나 이상의 풀링층은 최대 풀링, 최소 풀링, 평균 풀링, 전역 풀링, 놈 풀링, 또는 이들의 조합일 수 있다. 최대 풀링은 행렬 영역의 최대값만 취하여 데이터의 차원성을 줄일 수 있으며, 이는 중요한 특징을 포착하는 데 도움이 된다. 일부 실시양태에서, 하나 이상의 풀링층은 1차원(1D), 2차원(2D), 3차원(3D), 또는 이들의 임의의 조합일 수 있다. 신경망은 다음 층으로 전달될 입력을 평탄화할 수 있는 하나 이상의 평탄화 층을 추가로 포함할 수 있다. 일부 경우에, 입력을 1차원 배열로 줄여서 평면화할 수도 있다. 평탄화된 입력은 대상의 분류(예를 들어, 폴리뉴클레오티드에 첨가된 뉴클레오시드 단량체에 대한 전류/전압의 분류 등)를 출력하는 데 사용될 수 있다. 신경망은 하나 이상의 드롭아웃 층을 추가로 포함할 수 있다. 드롭아웃 층은 신경망 훈련 중에 사용될 수 있다(예: 2진 또는 다중 클래스 분류 수행). 하나 이상의 드롭아웃 층은 특정 가중치를 무작위로 0으로 설정할 수 있으며, 이는 특징 맵의 해당 요소를 0으로 설정하여 신경망이 과적합되는 것을 방지할 수 있다. 신경망은 완전 연결된 네트워크를 구성하는 하나 이상의 밀집(dense)층을 추가로 포함할 수 있다. 밀집층에서, 완전 연결된 네트워크를 통해 정보를 전달하여 대상의 예측 분류를 생성하고, 오류를 계산할 수 있다. 일부 실시양태에서, 오류는 예측을 개선하기 위해 역전파될 수 있다. 하나 이상의 밀집층은 숫자 벡터를 확률 벡터로 전환할 수 있는 소프트맥스(Softmax) 활성화 함수를 포함할 수 있다. 이러한 확률은 이후에 폴리뉴클레오티드에 첨가된 뉴클레오시드 단량체에 대한 전류 및/또는 전압의 분류와 같은 분류에 사용될 수 있다.
핵산 기반 정보 저장
본원에서는 핵산 기반 정보(데이터) 저장을 위한 장치, 구성요소, 시스템 및 방법이 제공된다. 제1 단계에서, 정보 항목(예: 컴퓨터에서 처리하기 위한 2진 코드의 디지털 정보)을 인코딩하는 디지털 서열이 수신된다. 디지털 서열을 하나 이상의 기호(예: 2진 코드)에서 핵산 서열로 전환하기 위해 암호화 체계가 적용된다. 하나의 예에서, 핵산 확장을 위한 표면 물질, 핵산 확장을 위한 유전자좌(일명, 배열 지점)에 대한 설계, 및 핵산 합성을 위한 시약이 선택된다. 구조물의 표면은 핵산 합성을 위해 준비된다. 그런 다음 디노보 폴리뉴클레오티드 합성이 수행된다. 또 다른 예에서, 디지털 서열은 사전 합성된 핵산 세트로 표시된다. 일부 예에서, 사전 합성된 핵산이 서로 부착되어 정보 항목을 나타내는 더 큰 핵산을 형성한다. 일부 예에서, 리가제나 증폭(예: PCR)을 통해 부착이 수행된다. 합성된 폴리뉴클레오티드는 전체 또는 일부가 저장되어 후속 방출에 이용될 수 있다. 일단 방출되면, 전체 또는 부분적으로 폴리뉴클레오티드는 본원에 기술된 방법을 사용하여 서열분석되고, 디코딩되어 핵산 서열을 디지털 서열로 다시 전환하게 된다. 그런 다음 디지털 서열을 조합하여 원래 정보 항목에 대해 인코딩하는 정렬을 얻는다. 일부 예에서, 디지털 정보가 유기체의 자연 발생 게놈에서 얻은 유전 정보를 포함하지 않는다.
디지털 정보를 인코딩하는 핵산은 오류 정정 구성요소를 포함할 수 있다. 일부 예에서, 오류 정정 구성요소는 RS(Reed-Solomon) 코드, LDPC 코드, 폴라 코드(polar code), 터보 코드와 같은 오류 정정 코드를 포함한다. 일부 예에서, 오류 정정 코드가 디지털 데이터를 분산시켜 여러 폴리뉴클레오티드에 저장된다. 일부 예에서, 데이터를 복수의 폴리뉴클레오티드에 분산시키면 삭제(예: 손실된 올리고)를 수정하기 위한 중복성이 구축된다. 일부 에에서, 오류가 있는 경우 디지털 정보를 복구할 수 있다. 일부 예에서, 오류 정정 구성요소가 패리티 염기를 포함한다. 일부 예에서, 오류 정정 구성요소가 인덱스 서열을 포함한다. 일부 예에서, 인덱스 서열이 핵산에 인코딩된 디지털 정보의 위치나 주소를 정의한다. 일부 에에서, 인덱스 서열이 디지털 정보의 소스를 정의한다. 일부 예에서, 디지털 정보를 인코딩하는 핵산이 동일한 라이브러리 또는 세트에 있는 하나 이상의 핵산과의 중첩을 포함한다. 일부 예에서, 오류 정정 구성요소가 중첩 또는 중복 영역을 포함한다. 일부 예에서, 오류를 줄이기 위해 서열분석된 핵산에 알고리즘이 적용된다. 일부 예에서, 오류 수정 알고리즘은 공동 서열분석, HEDGES(Hash Encoded, Decoded by Greedy Exhaustive Search), 또는 기타 방법을 포함한다.
디지털 정보를 인코딩하는 핵산은 다른 매체에 저장될 수 있다. 일부 예에서, 핵산이 본질적으로 건조되거나 동결건조된 분말로 저장된다. 일부 예에서, 핵산이 완충액에 저장된다. 일부 예에서, 핵산이 칩, 웨이퍼, 또는 기타 실리콘 고체 지지체에 저장된다. 일부 예에서, 핵산은 플라스미드나 게놈과 같은 유기체(또는 유기체 집단) 내부에 저장된다.
정보 항목
선택적으로, 본원에 개시된 데이터 저장 프로세스의 초기 단계에는 초기 코드 형태로 하나 이상의 정보 항목을 얻거나 수신하는 것이 포함된다. 정보 항목에는 텍스트, 오디오 및 시각적 정보가 포함되나 이에 제한되지 않는다. 정보 항목의 예시적 소스에는 서적, 정기 간행물, 전자 데이터베이스, 의료 기록, 편지, 양식, 음성 녹음, 동물 녹음, 생물학적 프로필, 방송, 영화, 짧은 비디오, 이메일, 부기 전화 기록, 인터넷 활동 기록, 그림, 회화, 인쇄물, 사진, 픽셀화된 그래픽, 및 소프트웨어 코드가 포함되나 이에 제한되지 않는다. 정보 항목에 대한 예시적인 생물학적 프로필 소스에는 유전자 라이브러리, 게놈, 유전자 발현 데이터, 및 단백질 활성 데이터가 포함되나 이에 제한되지 않는다. 정보 항목의 예시적인 형식에는 .txt, .PDF, .doc, .docx, .ppt, .pptx, .xls, .xlsx, .rtf, .jpg, .gif, .psd, .bmp, .tiff, .png 및 .mpeg이 포함되나 이에 제한되지 않는다. 일부 예에서, 디지털 정보는 자기 매체, 플래시 메모리, 클라우드 저장소, 또는 저장된 핵산으로부터 얻는다. 디지털 형식으로 정보 항목을 인코딩하는 개별 파일 크기 또는 정보 항목을 인코딩하는 복수 파일의 양은 최대 1024바이트(1KB와 동일), 1024KB(1MB와 동일), 1024MB(1GB와 동일), 1024GB(1TB와 동일), 1024TB(1PB와 동일), 1 엑사바이트, 1 제타바이트, 1 요타바이트, 1 제노타바이트 이상을 포함하나 이에 제한되지 않는다. 일부 예에서, 디지털 정보의 양이 적어도 1GB(기가바이트)이다. 일부 예에서, 디지털 정보의 양이 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 기가바이트 이상이다. 일부 예에서, 디지털 정보의 양이 적어도 1 테라바이트(TB)이다. 일부 예에서, 디지털 정보의 양이 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 테라바이트 이상이다. 일부 예에서, 디지털 정보의 양이 적어도 1 페타바이트(PB)이다. 일부 예에서, 디지털 정보의 양이 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 페타바이트 이상이다. 일부 예에서, 디지털 정보의 양이 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 제타바이트 이상이다. 일부 예에서, 디지털 정보에 유기체로부터 획득한 게놈 데이터가 포함되어 있지 않다. 일부 예에서, 염기당 2비트, 염기당 3비트(예: Huffman), 쉼표 인코딩(등온 용융 온도를 갖는 6개 코돈의 판독 프레임, 교대 코드, 쉼표 없는 코드, 완전 유전자 코드(가변 코돈 길이) 또는 다른 인코딩 방법이 사용된다. 일부 예에서, 디지털 정보는 키를 사용하여 추가로 암호화되거나 스테가노그래피를 사용하여 숨긴다.
본원에 설명된 장치 및 방법은 핵산에 저장된 디지털 정보에 대한 서열분석 또는 "판독" 속도를 증가시킬 수 있다. 일부 예에서, 15분, 20분, 25분, 30분, 35분, 40분, 또는 1시간 이내에 1Mb의 데이터가 수집된다. 일부 예에서, 24시간 이내에 적어도 1, 2, 3, 4, 5, 7, 10, 12, 15, 20, 25, 또는 적어도 30 테라바이트의 데이터가 판독된다. 일부 예에서, 1Gb의 데이터가 15분, 20분, 25분, 30분, 35분, 40분, 또는 1시간 이내에 수집된다. 일부 예에서, 24시간 이내에 적어도 1, 2, 3, 4, 5, 7, 10, 12, 15, 20, 25 또는 적어도 30 테라바이트의 데이터가 판독된다. 일부 예에서, 1-50, 1-30, 1-20, 1-15, 1-10, 1-5, 5-20, 5-30, 10-50, 10-25, 20-30, 또는 20-50 테라바이트의 데이터가 24시간 이내에 판독된다. 일부 예에서, 피치 거리(독립적으로 판독 가능한 유전자좌 사이의 거리)가 100, 75, 50, 25, 20, 15, 10, 5, 2 또는 1 마이크론 이하인 장치에서 적어도 1, 2, 3, 4, 5, 7, 10, 12, 15, 20, 25 또는 적어도 30 테라바이트의 데이터가 24시간 이내에 판독된다. 일부 예에서, 피치 거리가 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 75, 50, 25, 20, 15 또는 10 ㎚ 이하인 장치에서 적어도 1, 2, 3, 4, 5, 7, 10, 12, 15, 20, 25 또는 적어도 30 테라바이트의 데이터가 24시간 이내에 판독된다. 일부 예에서, 피치 거리(독립적으로 판독 가능한 유전자좌 사이의 거리)가 100, 75, 50, 25, 20, 15, 10, 5, 2 또는 1 마이크론 이하인 장치에서 적어도 1, 2, 3, 4, 5, 7, 10, 12, 15, 20, 25 또는 적어도 30 페타바이트의 데이터가 24시간 이내에 판독된다. 일부 예에서, 피치 거리(독립적으로 판독 가능한 유전자좌 사이의 거리)가 100, 75, 50, 25, 20, 15, 10, 5, 2 또는 1 마이크론 이하인 장치에서 적어도 1, 2, 3, 4, 5, 7, 10, 12, 15, 20, 25 또는 적어도 30 제타바이트의 데이터가 24시간 이내에 판독된다.
본원에 설명된 장치 및 방법은 핵산에 저장된 디지털 정보에 대한 서열분석 또는 "판독" 충실도를 증가시킬 수 있다. 일부 예에서, 디지털 정보가 10%, 5%, 4%, 3%, 2%, 1.5%, 1%, 0.5%, 0.2%, 0.1%, 0.01%, 0.001%, 또는 0.0001% 이하의 오류율(염기당)로 복구된다. 일부 예에서, 디지털 정보가 0.0001-0.001%, 0.0001-0.01%, 0.001-1%, 0.001-2%, 0.1-2%, 0.1-1%, 0.1-5%, 0.1-2%, 또는 0.01-2%의 오류율(염기당)로 복구된다. 일부 예에서, 디지털 정보가 오류 수정 알고리즘으로 처리하기 전에는 10%, 5%, 4%, 3%, 2%, 1.5%, 1%, 0.5%, 0.2%, 0.1%, 0.01%, 0.001%, 또는 0.0001% 이하의 오류율(염기당)로 복구된다.
폴리뉴클레오티드는 디지털 정보를 인코딩하는 미리 결정된 서열의 넓은 영역에 집합적으로 포괄할 수 있도록 설계될 수 있다. 일부 예에서, 합성된 폴리뉴클레오티드를 연결하기 위한 결찰 반응을 통해 더 큰 폴리뉴클레오티드가 생성된다. 결찰 반응의 한 예는 폴리머라제 사슬 조립(PCA)이다. 일부 예에서, 폴리뉴클레오티드의 적어도 일부는 범용 프라이머 결합을 위한 기판인 첨부된 영역을 포함하도록 설계된다. PCA 반응의 경우, 사전합성된 폴리뉴클레오티드는 서로 중첩되는 부분을 포함한다(예: 중첩되는 서열을 갖는 4개, 20개, 40개 이상의 염기). 폴리머라제 주기 동안, 폴리뉴클레오티드는 상보적인 단편과 어니얼링된 다음 폴리머라제에 의해 채워진다. 따라서 각 주기는 폴리뉴클레오티드가 서로를 찾는지에 따라 무작위로 다양한 단편의 길이를 증가시킨다. 단편들 사이의 상보성은 이중 가닥 DNA의 완전한 넓은 범위를 형성할 수 있도록 한다. 일부 경우에는 PCA 반응이 완료된 후, 불일치 복구 검출 효소를 사용하여 오류 수정 단계를 수행하여 서열의 불일치를 제거한다. 표적 서열의 더 큰 단편이 생성되면, 이들은 증폭될 수 있다. 예를 들어, 일부 경우에는 5' 및 3' 말단 어댑터 서열을 포함하는 표적 서열이 어댑터 서열에 하이브리드화되는 변형된 프라이머를 포함하는 폴리머라제 연쇄 반응(PCR)에서 증폭된다. 일부 경우에, 변형된 프라이머는 하나 이상의 우라실 염기를 포함한다. 변형된 프라이머를 사용하면 변형된 염기 및/또는 단편에서 변형된 염기쌍을 절단하는 효소에 의해 남겨진 갭을 표적화하는 데 중점을 둔 효소 반응을 통해 프라이머를 제거할 수 있다. 남은 것은 어댑터 서열의 잔재가 부족한 이중 가닥 증폭 산물이다. 이러한 방식으로, 다중 증폭 산물이 동일한 프라이머 세트와 병행하여 생성되어 이중 가닥 DNA의 서로 다른 단편을 생성할 수 있다. 폴리뉴클레오티드 및/또는 조립된 산물에 대해 오류 수정이 수행될 수 있다. 오류 정정을 위한 예시적인 전략은 오류를 정정하기 위한 중첩 확장 PCR에 의한 부위 지정 돌연변이 유발을 포함하며, 이는 선택적으로 2 라운드 이상의 클로닝 및 서열분석과 결합된다. 특정 예에서, 불일치, 돌출 및 작은 루프, 화학적으로 변경된 염기 및/또는 기타 이종 이중가닥을 갖는 이중 가닥 핵산은 올바르게 합성된 핵산 집단에서 선택적으로 제거된다. 일부 예에서, 이중 가닥 핵산 내의 불일치하거나 짝을 이루지 않은 염기를 인식하고 이에 결합하는 단백질/효소를 사용하여 오류 정정을 수행하여 단일 또는 이중 가닥 절단을 생성하거나 가닥 전달 전위 이벤트를 시작한다. 오류 정정을 위한 단백질/효소의 비제한적인 예에는 엔도뉴클레아제(T7 엔도뉴클레아제 I, E. coli 엔도뉴클레아제 V, T4 엔도뉴클레아제 VII, 녹두 뉴클레아제, Cel1, E. coli 엔도뉴클레아제 IV, UVDE), 제한 효소, 글리코실라제, 리보뉴클레아제, 불일치 복구 효소, 레솔베이즈(resolbase), 헬리카제, 리가제, 불일치에 특이적인 항체, 및 이들의 변이체가 포함된다. 특이적 오류 수정 효소의 예에는 T4 엔도뉴클레아제 7, T7 엔도뉴클레아제 1, S1, 녹두 엔도뉴클레아제, MutY, MutS, MutH, MutL, 클리바제(cleavase), CELI, 및 HINF1이 포함된다. 일부 경우에는 DNA 불일치 결합 단백질 MutS(Thermus aquaticus)를 사용하여 합성된 산물 집단에서 실패한 산물을 제거한다. 일부 경우에는 코렉타제(Correctase)라는 효소를 사용하여 오류 수정이 수행된다. 일부 경우에는 이종이중가닥 DNA에 대한 알려지거나 알려지지 않은 돌연변이와 다형성을 검사하는 불일치 특이적 DNA 엔도뉴클레아제인 SURVEYOR 엔도뉴클레아제(Transgenomic)를 사용하여 오류 수정이 수행된다.
디지털 정보는 복수의 폴리뉴클레오티드에 저장될 수 있다. 일부 예에서, 복수의 폴리뉴클레오티드는 약 10,000, 20,000, 50,000, 70,000, 100,000, 120,000, 150,000, 또는 200,000개의 고유한 폴리뉴클레오티드를 포함한다. 일부 예에서, 복수의 폴리뉴클레오티드는 적어도 약 10,000, 20,000, 50,000, 70,000, 100,000, 120,000, 150,000 또는 200,000개의 고유한 폴리뉴클레오티드를 포함한다. 일부 예에서, 복수의 폴리뉴클레오티드는 길이가 약 10, 50, 100, 200, 300, 500, 700, 1,000, 5,000, 10,000, 15,000, 20,000, 25,000, 30,000, 35,000, 40,000, 또는 50,000개 염기이다. 일부 예에서, 복수의 폴리뉴클레오티드는 길이가 적어도 약 10, 50, 100, 200, 300, 500, 700, 1,000, 5,000, 10,000, 15,000, 20,000, 25,000, 30,000, 35,000, 40,000 또는 50,000개 염기이다. 일부 예에서, 복수의 폴리뉴클레오티드는 길이가 최대 약 10, 50, 100, 200, 300, 500, 700, 1,000, 5,000, 10,000, 15,000, 20,000, 25,000, 30,000, 35,000, 40,000 또는 50,000개 염기이다.
폴리뉴클레오티드 서열분석을 위한 구조물
폴리뉴클레오티드 서열분석을 위한 강성 또는 유연성 구조물이 본원에서 제공된다. 강성 구조물의 경우, 폴리뉴클레오티드 라이브러리 생성을 위한 구조물을 갖는 장치가 본원에서 제공된다. 일부 예에서, 구조물이 플레이트를 포함한다. 일부 예에서, 구조물이 웰(예: 나노웰)이 있는 플레이트를 포함한다. 일부 예에서, 구조물이 복수의 유전자좌를 포함하는 표면을 갖는 고체 지지체를 포함한다. 일부 경우에는, 복수의 유전자좌가 구조물 위에 펼처져 있는 어레이로 배열된다. 일부 경우에는 고체 지지체가 유리 및/또는 실리콘을 포함한다. 일부 경우에는 부착 모이어티가 적어도 유전자좌의 일부를 덮고 있다. 일부 예에서, 부착 모이어티는 본원에 기술된 방법을 사용하여 하나 이상의 폴리뉴클레오티드, 폴리머라제, 프라이머, 및 이들의 임의 조합의 복합체에 결합하도록 구성된다. 일부 경우에는 표면을 재사용할 수 있다. 일부 경우에는 재사용하기 전에 표면을 세척, 처리 및/또는 컨디셔닝한다. 일부 경우에는 부착 모이어티를 제거하고/하거나 화학적으로 변형하지 않고도 표면을 재사용할 수 있다. 일부 경우에, 구조물은 본원에 기술된 방법을 사용하여 폴리머라제에 의해 첨가된 하나 이상의 염기의 정체를 식별하도록 구성된 검출기를 포함한다. 일부 경우에, 검출기는 복수의 광학 검출기를 포함한다. 일부 경우에, 검출기는 복수의 제로 모드 도파관을 포함한다. 일부 경우에, 검출기는 광학 검출기, 전기 검출기, 또는 이들의 조합을 포함한다. 일부 예에서, 광학 검출기는 다양한 강도 및/또는 파장을 측정하도록 구성된다. 일부 예에서, 광학 검출기는 가시광선 및/또는 UV광을 측정하도록 구성된다. 일부 예에서, 광학 검출기는 형광을 측정하도록 구성된다. 일부 예에서, 전기 검출기는 전압 또는 전류의 변화를 측정하도록 구성된다. 일부 경우에는 구조물이 유동 셀을 포함한다. 일부 경우에는 유동 셀 내에서 액체가 계속해서 흐른다. 일부 예에서, 유동 셀에 흐르는 액체는 뉴클레오티드 또는 뉴클레오티드를 포함하는 분자(예를 들어 폴리뉴클레오티드 또는 핵산, 예를 들어 DNA, RNA, 이들의 하이브리드, 유사체 및 모방체)를 포함한다. 일부 예에서, 구조물은 폴리뉴클레오티드 서열분석 외에 폴리뉴클레오티드 합성을 위해 사용될 수 있다.
도 3a-3c는 폴리뉴클레오티드 서열분석을 위한 구조물상에 위치한 유전자좌의 확대를 보여준다. 구조물(3601)의 일부에 있는 각 유전자좌는 실질적으로 평면형 지점(3603)(예: 플랫), 채널(3605), 또는 웰(3607)일 수 있다. 일부 예에서, 유전자좌는 구조물의 각 유전자좌가 약 10 ㎛의 폭과 약 21 ㎛의 각 구조물의 중심 사이의 거리를 갖도록 어레이로 배열된다. 일부 예에서, 구조물의 각 유전자좌는 약 1 ㎛의 폭과 약 2 ㎛의 각 구조물의 중심 사이의 거리를 갖는다. 일부 예에서, 구조물의 각 유전자좌는 약 0.1 ㎛의 폭과 약 0.2 ㎛의 각 구조물의 중심 사이의 거리를 갖는다. 유전자좌는 원형, 직사각형, 점점 가늘어지는 모양 또는 둥근 모양을 포함할 수 있지만 이에 제한되지 않는다. 일부 예에서, 구조물이 유연하다. 대안적으로 또는 조합하여, 구조물이 강성이다. 일부 예에서, 강성 구조물은 폴리뉴클레오티드 서열분석을 위한 유전자좌를 포함한다. 일부 예에서, 강성 구조물은 폴리뉴클레오티드 서열분석을 위한 실질적으로 평면형 영역, 채널 또는 웰을 포함한다.
본원에 기술된 웰은 임의의 크기 또는 치수를 포함할 수 있다. 일부 예에서, 본원에 설명된 웰은 1 대 0.01의 폭 대 깊이(또는 높이) 비율을 가지며, 여기서 폭은 웰의 가장 좁은 세그먼트에서의 폭을 측정한 것이다. 일부 예에서, 본원에 설명된 웰은 0.5 대 0.01의 폭 대 깊이(또는 높이) 비율을 가지며, 여기서 폭은 웰의 가장 좁은 세그먼트에서의 폭을 측정한 것이다. 일부 예에서, 본원에 설명된 웰은 약 0.01, 0.05, 0.1, 0.15, 0.16, 0.2, 0.5 또는 1의 폭 대 깊이(또는 높이) 비율을 갖는다. 본원에서는 폴리뉴클레오티드 서열분석을 위한 복수의 별개의 유전자좌를 포함하는 구조물이 제공된다. 폴리뉴클레오티드 서열분석을 위한 유전자좌의 예시적인 구조물는 제한없이, 실질적으로 평면형 영역, 채널, 웰 또는 돌출부가 포함한다. 본원에 기술된 구조물은 복수의 클러스터를 포함할 수 있으며, 각 클러스터는 복수의 웰, 유전자좌 또는 채널을 포함한다. 대안적으로, 본원에 기술된 것은 웰, 유전자좌 또는 채널의 균질한 배열을 포함할 수 있다. 본원에 제공된 구조물은 약 5 ㎛ 내지 약 500 ㎛, 약 5 ㎛ 내지 약 400 ㎛, 약 5 ㎛ 내지 약 300 ㎛, 약 5 ㎛ 내지 약 200 ㎛, 약 5 ㎛ 내지 약 200 ㎛, 약 5 ㎛ 내지 약 100 ㎛, 약 5 ㎛ 내지 약 50 ㎛, 또는 약 10 ㎛ 내지 약 50 ㎛의 높이 또는 깊이를 갖는 웰을 포함할 수 있다. 일부 예에서, 웰의 높이가 100 ㎛ 미만, 80 ㎛ 미만, 60 ㎛ 미만, 40 ㎛ 미만 또는 20 ㎛ 미만이다. 일부 예에서, 웰의 높이가 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500 ㎛ 이상이다. 일부 예에서, 웰의 높이 또는 깊이가 적어도 10, 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 ㎚ 이상이다. 일부 예에서, 웰의 높이 또는 깊이가 약 10 ㎚ 내지 약 1000 ㎚, 약 25 ㎚ 내지 약 900 ㎚, 약 50 ㎚ 내지 약 800 ㎚, 약 75 ㎚ 내지 약 700 ㎚, 약 100 ㎚ 내지 약 600 ㎚, 또는 약 200 ㎚ 내지 약 500 ㎚ 범위이다. 일부 예에서, 웰의 높이 또는 깊이는 약 50 ㎚ 내지 약 1 ㎛ 범위이다. 일부 예에서, 웰의 높이는 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 700, 800, 900 또는 약 1000 ㎚이다.
본원에 제공된 폴리뉴클레오티드 서열분석을 위한 구조물은 채널을 포함할 수 있다. 상기 채널은 1 대 0.01의 폭 대 깊이(또는 높이) 비율을 가질 수 있으며, 여기서 폭은 채널의 가장 좁은 세그먼트에서의 폭을 측정한 것이다. 일부 예에서, 본원에 설명된 채널은 0.5 대 0.01의 폭 대 깊이(또는 높이) 비율을 가질 수 있으며, 여기서 폭은 채널의 가장 좁은 세그먼트에서의 폭을 측정한 것이다. 일부 예에서, 본원에 설명된 채널은 약 0.01, 0.05, 0.1, 0.15, 0.16, 0.2, 0.5, 또는 1의 폭 대 깊이(또는 높이) 비율을 갖는다.
복수의 별개의 유전자좌를 포함하는 폴리뉴클레오티드 서열분석을 위한 구조물이 본원에 기술되어 있다. 상기 구조물은 제한 없이, 폴리뉴클레오티드 합성을 위한 실질적으로 평면형 영역, 채널, 돌출부 또는 웰을 포함한다. 일부 예에서, 본원에 설명된 제공되는 구조물은 복수의 채널을 포함하며, 여기서 채널의 높이 또는 깊이는 약 5 ㎛ 내지 약 500 ㎛, 약 5 ㎛ 내지 약 400 ㎛, 약 5 ㎛ 내지 약 300 ㎛, 약 5 ㎛ 내지 약 200 ㎛, 약 5 ㎛ 내지 약 100 ㎛, 약 5 ㎛ 내지 약 50 ㎛, 또는 약 10 ㎛ 내지 약 50 ㎛이다. 일부 경우에, 채널의 높이는 100 ㎛ 미만, 80 ㎛ 미만, 60 ㎛ 미만, 40 ㎛ 미만 또는 20 ㎛ 미만이다. 일부 경우에, 채널의 높이가 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500 ㎛ 이상이다. 일부 경우에, 채널의 높이 또는 깊이가 적어도 10, 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 ㎚ 이상이다. 일부 경우에, 채널의 높이 또는 깊이는 약 10 ㎚ 내지 약 1000 ㎚, 약 25 ㎚ 내지 약 900 ㎚, 약 50 ㎚ 내지 약 800 ㎚, 약 75 ㎚ 내지 약 700 ㎚, 약 100 ㎚ 내지 약 600 ㎚, 또는 약 200 ㎚ 내지 약 500 ㎚의 범위이다. 본원에 설명된 채널은 표면에 클러스터로 또는 균일한 장으로 배열될 수 있다.
본원에 설명된 폴리뉴클레오티드 서열분석을 위한 구조물 표면의 유전자좌의 폭은 약 0.1 ㎛ 내지 약 500 ㎛, 약 0.5 ㎛ 내지 약 500 ㎛, 약 1 ㎛ 내지 약 200 ㎛, 약 1 ㎛ 내지 약 100 ㎛, 약 5 ㎛ 내지 약 100 ㎛, 또는 약 0.1 ㎛ 내지 약 100 ㎛, 예를 들어 약 90 ㎛, 80 ㎛, 70 ㎛, 60 ㎛, 50 ㎛, 40 ㎛, 30 ㎛, 20 ㎛, 10 ㎛, 5 ㎛, 1 ㎛ 또는 0.5 ㎛일 수 있다. 일부 예에서, 유전자좌의 폭은 약 100 ㎛, 90 ㎛, 80 ㎛, 70 ㎛, 60 ㎛, 50 ㎛, 40 ㎛, 30 ㎛, 20 ㎛ 또는 10 ㎛ 미만이다. 일부 예에서, 유전자좌의 폭은 적어도 10, 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 ㎚ 이상이다. 일부 예에서, 유전자좌의 폭은 약 10 ㎚ 내지 약 1000 ㎚, 약 25 ㎚ 내지 약 900 ㎚, 약 50 ㎚ 내지 약 800 ㎚, 약 75 ㎚ 내지 약 700 ㎚, 약 100 ㎚ 내지 약 600 ㎚, 또는 약 200 ㎚ 내지 약 500 ㎚의 범위이다. 일부 예에서, 유전자좌의 폭은 약 50 ㎚ 내지 약 1000 ㎚ 범위이다. 일부 예에서, 2개의 인접한 유전자좌의 중심 사이의 거리는 약 0.1 ㎛ 내지 약 500 ㎛, 0.5 ㎛ 내지 약 500 ㎛, 약 1 ㎛ 내지 약 200 ㎛, 약 1 ㎛ 내지 약 100 ㎛, 약 5 ㎛ 내지 약 200 ㎛, 약 5 ㎛ 내지 약 100 ㎛, 약 5 ㎛ 내지 약 50 ㎛, 또는 약 5 ㎛ 내지 약 30 ㎛, 예를 들어 약 20 ㎛이다. 일부 예에서, 유전자좌의 전체 폭은 약 5 ㎛, 10 ㎛, 20 ㎛, 30 ㎛, 40 ㎛, 50 ㎛, 60 ㎛, 70 ㎛, 80 ㎛, 90 ㎛, 또는 100 ㎛이다. 일부 예에서, 유전자좌의 전체 폭은 약 1 ㎛ 내지 100 ㎛, 30 ㎛ 내지 100 ㎛, 또는 50 ㎛ 내지 70 ㎛이다. 일부 예에서, 2개의 인접한 유전자좌의 중심 사이의 거리는 약 0.5 ㎛ 내지 약 2 ㎛, 0.5 ㎛ 내지 약 2 ㎛, 약 0.75 ㎛ 내지 약 2 ㎛, 약 1 ㎛ 내지 약 2 ㎛, 약 0.2 ㎛ 내지 약 1 ㎛, 약 0.5 ㎛ 내지 약 1.5 ㎛, 약 0.5 ㎛ 내지 약 0.8 ㎛, 또는 약 0.5 ㎛ 내지 약 1 ㎛, 예를 들어 약 1 ㎛이다. 일부 예에서, 유전자좌의 전체 폭은 약 50 ㎚, 0.1 ㎛, 0.2 ㎛, 0.3 ㎛, 0.4 ㎛, 0.5 ㎛, 0.6 ㎛, 0.7 ㎛, 0.8 ㎛, 0.9 ㎛, 1 ㎛, 1.1 ㎛, 1.2 ㎛, 1.3 ㎛, 1.4 ㎛, 또는 1.5 ㎛이다. 일부 예에서, 유전자좌의 전체 폭은 약 0.5 ㎛ 내지 2 ㎛, 0.75 ㎛ 내지 1 ㎛, 또는 0.9 ㎛ 내지 2 ㎛이다. 일부 예에서, 유전자좌가 실질적으로 평면형이다.
복수의 별개의 유전자좌를 포함하는 폴리뉴클레오티드 서열분석을 위한 구조물이 본원에 기술되어 있다. 상기 구조물은 제한 없이 폴리뉴클레오티드 합성을 위한 실질적으로 평면형 영역, 채널, 돌출부 또는 웰을 포함한다. 일부 예에서, 본원에 기술된 복수의 채널을 포함하는 구조물이 제공되며, 여기서 채널의 높이 또는 깊이는 약 5 ㎚ 내지 약 500 ㎚, 약 5 ㎚ 내지 약 400 ㎚, 약 5 ㎚ 내지 약 300 ㎚, 약 5 ㎚ 내지 약 200 ㎚, 약 5 ㎚ 내지 약 100 ㎚, 약 5 ㎚ 내지 약 50 ㎚, 또는 약 10 ㎚ 내지 약 50 ㎚이다. 일부 경우에는 채널의 높이가 100 ㎚ 미만, 80 ㎚ 미만, 60 ㎚ 미만, 40 ㎚ 미만 또는 20 ㎚ 미만이다. 일부 경우에는 채널 높이가 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500 ㎚ 이상이다. 일부 경우에는 채널의 높이 또는 깊이가 적어도 10, 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 ㎚ 이상이다. 일부 경우에, 채널의 높이 또는 깊이는 약 10 ㎚ 내지 약 1000 ㎚, 약 25 ㎚ 내지 약 900 ㎚, 약 50 ㎚ 내지 약 800 ㎚, 약 75 ㎚ 내지 약 700 ㎚, 약 100 ㎚ 내지 약 600 ㎚, 또는 약 200 ㎚ 내지 약 500 ㎚의 범위에 있다. 본원에 기술된 채널은 표면에 클러스터로 또는 균일한 장으로 배열될 수 있다.
본원에 기술된 폴리뉴클레오티드 서열분석을 위한 구조물 표면의 유전자좌의 폭은 약 0.1 ㎚ 내지 약 500 ㎚, 약 0.5 ㎚ 내지 약 500 ㎚, 약 1 ㎚ 내지 약 200 ㎚, 약 1 ㎚ 내지 약 100 ㎚, 약 5 ㎚ 내지 약 100 ㎚, 또는 약 0.1 ㎚ 내지 약 100 ㎚, 예를 들어 약 90 ㎚, 80 ㎚, 70 ㎚, 60 ㎚, 50 ㎚, 40 ㎚, 30 ㎚, 20 ㎚, 10 ㎚, 5 ㎚, 1 ㎚ 또는 0.5 ㎚일 수 있다. 일부 예에서, 유전자좌의 폭은 약 100 ㎚, 90 ㎚, 80 ㎚, 70 ㎚, 60 ㎚, 50 ㎚, 40 ㎚, 30 ㎚, 20 ㎚ 또는 10 ㎚ 미만이다. 일부 예에서, 유전자좌의 폭은 적어도 10, 25, 50, 75, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 또는 1000 ㎚ 이상이다. 일부 예에서, 유전자좌의 폭은 약 10 ㎚ 내지 약 1000 ㎚, 약 25 ㎚ 내지 약 900 ㎚, 약 50 ㎚ 내지 약 800 ㎚, 약 75 ㎚ 내지 약 700 ㎚, 약 100 ㎚ 내지 약 600 ㎚, 또는 약 200 ㎚ 내지 약 500 ㎚의 범위에 있다. 일부 예에서, 유전자좌의 폭은 약 50 ㎚ 내지 약 1000 ㎚ 범위에 있다. 일부 예에서, 2개의 인접한 유전자좌의 중심 사이의 거리는 약 0.1 ㎚ 내지 약 500 ㎚, 0.5 ㎚ 내지 약 500 ㎚, 약 1 ㎚ 내지 약 200 ㎚, 약 1 ㎚ 내지 약 100 ㎚, 약 5 ㎚ 내지 약 200 ㎚, 약 5 ㎚ 내지 약 100 ㎚, 약 5 ㎚ 내지 약 50 ㎚, 또는 약 5 ㎚ 내지 약 30 ㎚, 예를 들어 약 20 ㎚이다. 일부 예에서, 유전자좌의 전체 폭은 약 5 ㎚, 10 ㎚, 20 ㎚, 30 ㎚, 40 ㎚, 50 ㎚, 60 ㎚, 70 ㎚, 80 ㎚, 90 ㎚ 또는 100 ㎚이다. 일부 예에서, 유전자좌의 전체 폭은 약 1 ㎚ 내지 100 ㎚, 30 ㎚ 내지 100 ㎚, 또는 50 ㎚ 내지 70 ㎚이다. 일부 예에서, 인접한 두 유전자좌의 중심 사이의 거리는 약 0.5 ㎚ 내지 약 2 ㎚, 0.5 ㎚ 내지 약 2 ㎚, 약 0.75 ㎚ 내지 약 2 ㎚, 약 1 ㎚ 내지 약 2 ㎚, 약 0.2 ㎚ 내지 약 1 ㎚, 약 0.5 ㎚ 내지 약 1.5 ㎚, 약 0.5 ㎚ 내지 약 0.8 ㎚, 또는 약 0.5 ㎚ 내지 약 1 ㎚, 예를 들어 약 1 ㎚이다. 일부 예에서, 유전자좌의 전체 폭은 약 50 ㎚, 0.1 ㎚, 0.2 ㎚, 0.3 ㎚, 0.4 ㎚, 0.5 ㎚, 0.6 ㎚, 0.7 ㎚, 0.8 ㎚, 0.9 ㎚, 1 ㎚, 1.1 ㎚, 1.2 ㎚, 1.3 ㎚, 1.4 ㎚, 또는 1.5 ㎚이다. 일부 예에서, 유전자좌의 전체 폭은 약 0.5 ㎚ 내지 2 ㎚, 0.75 ㎚ 내지 1 ㎚, 또는 0.9 ㎚ 내지 2 ㎚이다. 일부 예에서, 유전자좌가 실질적으로 평면형이다.
일부 예에서, 각각의 유전자좌는 또 다른 유전자좌에서 서열분석되는 폴리뉴클레오티드 집단과 다른 서열을 갖는 폴리뉴클레오티드 집단의 서열분석을 지원한다. 본원에서는 적어도 10, 100, 256, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13000, 14000, 15000, 20000, 30000, 40000, 50000개 이상의 클러스터를 포함하는 표면이 제공된다. 본원에서는 2,000; 5,000; 10,000; 20,000; 30,000; 50,000; 100,000; 200,000; 300,000; 400,000; 500,000; 600,000; 700,000; 800,000; 900,000; 1,000,000; 5,000,000; 또는 10,000,000개 이상의 개별 유전자좌를 포함하는 표면이 제공된다. 일부 경우에, 각 클러스터는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 120, 130, 150, 200, 500개 이상의 유전자좌를 포함한다. 일부 경우에, 각 클러스터는 50 내지 500, 50 내지 200, 50 내지 150, 또는 100 내지 150개의 유전자좌를 포함한다. 일부 경우에, 각 클러스터는 100 내지 150개의 유전자좌를 포함한다. 일부 경우에, 각 클러스터는 109, 121, 130 또는 137개의 유전자좌를 포함한다.
본원에서는 가장 긴 세그먼트의 폭이 5 내지 100 ㎛인 유전자좌가 제공된다. 일부 경우에, 유전자좌는 폭이 약 30, 35, 40, 45, 50, 55 또는 60 ㎛인 가장 긴 세그먼트를 갖는다. 일부 경우에, 유전자좌는 다중 세그먼트를 갖는 채널이고, 여기서 각 세그먼트는 5 내지 50 ㎛의 중심 간 거리를 갖는다. 일부 경우에, 각 세그먼트의 중심 간 거리는 약 5, 10, 15, 20 또는 25 ㎛이다
본원에서는 가장 긴 세그먼트의 폭이 5 내지 500 ㎚인 유전자좌가 제공된다. 일부 경우에, 유전자좌는 폭이 약 30, 35, 40, 45, 50, 55, 60, 80, 또는 100 ㎚인 가장 긴 세그먼트를 갖는다. 일부 경우에, 유전자좌는 다중 세그먼트를 갖는 채널이고, 여기서 각 세그먼트는 5 내지 50 ㎚의 중심 간 거리를 갖는다. 일부 경우에, 각 세그먼트의 중심 간 거리는 약 5, 10, 15, 20, 25, 50, 100 또는 200 ㎚이다.
일부 예에서, 본원에 기술된 구조물의 표면에서 서열분석된 별개의 폴리뉴클레오티드의 수는 기판에서 이용가능한 별개의 유전자좌의 수에 따라 달라진다. 일부 예에서, 유전자좌의 밀도는 ㎟당 적어도 또는 약 1개 유전자좌, ㎟당 10개 유전자좌, ㎟당 25개 유전자좌, ㎟당 50개 유전자좌, ㎟당 65개 유전자좌, ㎟당 75개 유전자좌, ㎟당 100개 유전자좌, ㎟당 130개 유전자좌, ㎟당 150개 유전자좌, ㎟당 175개 유전자좌, ㎟당 200개 유전자좌, ㎟당 300개 유전자좌, ㎟당 400개 유전자좌, ㎟당 500개 유전자좌, ㎟당 1,000개 유전자좌, ㎟당 104개 유전자좌, ㎟당 105개 유전자좌, ㎟당 106개 유전자좌 이상이다. 일부 예에서, 기판은 ㎟당 약 10개 내지 ㎟당 약 500개 유전자좌, ㎟당 약 25개 내지 ㎟당 약 400개 유전자좌, ㎟당 약 50개 내지 ㎟당 약 500개 유전자좌, ㎟당 약 100개 내지 ㎟당 약 500개 유전자좌, ㎟당 약 150개 내지 ㎟당 약 500개 유전자좌, ㎟당 약 10개 내지 ㎟당 약 250개 유전자좌, ㎟당 약 50개 내지 ㎟당 약 250개 유전자좌, ㎟당 약 10개 내지 ㎟당 약 200개 유전자좌, 또는 ㎟당 약 50개 내지 ㎟당 약 200개 유전자좌를 포함한다. 일부 경우에, 기판은 ㎟당 약 104개 내지 ㎟당 약 105개 유전자좌를 포함한다. 일부 경우에, 기판은 ㎟당 약 105개 내지 ㎟당 약 107개 유전자좌를 포함한다. 일부 경우에, 기판은 ㎟당 적어도 약 105개의 유전자좌를 포함한다. 일부 경우에, 기판은 ㎟당 적어도 약 106개의 유전자좌를 포함한다. 일부 경우에, 기판은 ㎟당 적어도 약 107개의 유전자좌를 포함한다. 일부 경우에, 기판은 ㎟당 약 104개 내지 ㎟당 약 105개 유전자좌를 포함한다. 일부 예에서, 유전자좌의 밀도는 적어도 또는 ㎛2당 약 1개 유전자좌, ㎛2당 10개 유전자좌, ㎛2당 25개 유전자좌, ㎛2당 50개 유전자좌, ㎛2당 65개 유전자좌, ㎛2당 75개 유전자좌, ㎛2당 100개 유전자좌, ㎛2당 130개 유전자좌, ㎛2당 150개 유전자좌, ㎛2당 175개 유전자좌, ㎛2당 200개 유전자좌, ㎛2당 300개 유전자좌, ㎛2당 400개 유전자좌, ㎛2당 500개 유전자좌, ㎛2당 1,000개 이상의 유전자좌이다. 일부 경우에, 기판은 ㎛2당 약 10개 유전자좌 내지 ㎛2당 약 500개 유전자좌, ㎛2당 약 25개 유전자좌 내지 ㎛2당 약 400개 유전자좌, ㎛2당 약 50개 유전자좌 내지 ㎛2당 약 500개 유전자좌, ㎛2당 약 100개 유전자좌 내지 ㎛2당 약 500개 유전자좌, ㎛2당 약 150개 유전자좌 내지 ㎛2당 약 500개 유전자좌, ㎛2당 약 10개 유전자좌 내지 ㎛2당 약 250개 유전자좌, ㎛2당 약 50개 유전자좌 내지 ㎛2당 약 250개 유전자좌, ㎛2당 약 10개 유전자좌 내지 ㎛2당 약 200개 유전자좌, 또는 ㎛2당 약 50개 유전자좌 내지 ㎛2당 약 200개 유전자좌를 포함한다.
일부 예에서, 2개의 인접한 유전자좌의 중심 사이의 거리는 약 10 ㎛ 내지 약 500 ㎛, 약 10 ㎛ 내지 약 200 ㎛, 또는 약 10 ㎛ 내지 약 100 ㎛이다. 일부 경우에, 인접한 유전자좌의 두 중심 사이의 거리는 약 10 ㎛, 20 ㎛, 30 ㎛, 40 ㎛, 50 ㎛, 60 ㎛, 70 ㎛, 80 ㎛, 90 ㎛ 또는 100 ㎛ 이상이다. 일부 경우에, 인접한 두 유전자좌의 중심 사이의 거리는 약 200 ㎛, 150 ㎛, 100 ㎛, 80 ㎛, 70 ㎛, 60 ㎛, 50 ㎛, 40 ㎛, 30 ㎛, 20 ㎛ 또는 10 ㎛ 미만이다. 일부 경우에, 인접한 두 유전자좌의 중심 사이의 거리는 약 10000 ㎚, 8000 ㎚, 6000 ㎚, 4000 ㎚, 2000 ㎚ 1000 ㎚, 800 ㎚, 600 ㎚, 400 ㎚, 200 ㎚, 150 ㎚, 100 ㎚, 80 ㎚, 70 ㎚, 60 ㎚, 50 ㎚, 40 ㎚, 30 ㎚, 20 ㎚ 또는 10 ㎚ 미만이다. 일부 예에서, 본원에 기술된 구조물의 각 평방 미터는 적어도 107, 108, 109, 1010, 1011개의 유전자좌를 허용하며, 여기서 각 유전자좌는 하나의 폴리뉴클레오티드를 지원한다. 일부 예에서, 109개의 폴리뉴클레오티드가 본원에 설명된 구조물의 약 6, 5, 4, 3, 2 또는 1 ㎡ 미만에 지지된다.
일부 예에서, 본원에 설명된 구조물은 2,000; 5,000; 10,000; 20,000; 30,000; 50,000; 100,000; 200,000; 300,000; 400,000; 500,000; 600,000; 700,000; 800,000; 900,000; 1,000,000; 1,200,000; 1,400,000; 1,600,000; 1,800,000; 2,000,000; 2,500,000; 3,000,000; 3,500,000; 4,000,000; 4,500,000; 5,000,000; 10,000,000개 이상의 동일하지 않은 폴리뉴클레오티드의 서열분석을 위한 지지체를 제공한다. 일부 경우에, 구조물은 2,000; 5,000; 10,000; 20,000; 50,000; 100,000; 200,000; 300,000; 400,000; 500,000; 600,000; 700,000; 800,000; 900,000; 1,000,000; 1,200,000; 1,400,000; 1,600,000; 1,800,000; 2,000,000; 2,500,000; 3,000,000; 3,500,000; 4,000,000; 4,500,000; 5,000,000; 10,000,000개 이상의, 별개의 서열을 인코딩하는 폴리뉴클레오티드의 서열분석을 위한 지지체를 제공한다. 일부 예에서, 폴리뉴클레오티드의 적어도 일부가 동일한 서열을 갖는다. 일부 경우에, 상기 구조물은 적어도 50, 60, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 175, 200, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500개 이상의 염기를 갖는 폴리뉴클레오티드의 서열에 대한 표면 환경을 제공한다. 일부 배열에서, 본원에 기술된 폴리뉴클레오티드 서열분석을 위한 구조물은 균일한 배열로 폴리뉴클레오티드 서열분석을 위한 부위를 포함한다. 일부 예에서, 폴리뉴클레오티드 서열분석을 위한 부위가 준균일한 배열로 되어 있다. 일부 예에서, 폴리뉴클레오티드 서열분석을 위한 부위가 포아송 분포에 따라 부하된다. 일부 예에서, 폴리뉴클레오티드 서열분석을 위한 부위가 정규 분포에 따라 부하된다.
일부 예에서, 폴리뉴클레오티드는 구조물의 별개의 유전자좌에서 서열분석되며, 여기서 각 유전자좌는 폴리뉴클레오티드 집단의 서열분석을 지원한다. 일부 경우에, 각 유전자좌는 다른 유전자좌에서 서열분석된 폴리뉴클레오티드 집단과 다른 서열을 갖는 폴리뉴클레오티드 집단의 서열분석을 지원한다. 일부 예에서, 구조물의 유전자좌가 복수의 클러스터 내에 위치한다. 일부 예에서, 구조물은 적어도 10, 500, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10000, 11000, 12000, 13000, 14000, 15000, 20000, 3 0000, 40000, 50000개 또는 더 많은 수의 클러스터를 포함한다. 일부 예에서, 구조물이 2,000; 5,000; 10,000; 100,000; 200,000; 300,000; 400,000; 500,000; 600,000; 700,000; 800,000; 900,000; 1,000,000; 1,100,000; 1,200,000; 1,300,000; 1,400,000; 1,500,000; 1,600,000; 1,700,000; 1,800,000; 1,900,000; 2,000,000; 300,000; 400,000; 500,000; 600,000; 700,000; 800,000; 900,000; 1,000,000; 1,200,000; 1,400,000; 1,600,000; 1,800,000; 2,000,000; 2,500,000; 3,000,000; 3,500,000; 4,000,000; 4,500,000; 5,000,000; 또는 10,000,000개 이상의 별개의 유전자좌를 포함한다. 일부 경우에, 각 클러스터는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 120, 130, 150개 또는 그 이상의 유전자좌를 포함한다. 일부 예에서, 각 클러스터는 50 내지 500개, 100 내지 150개, 또는 100 내지 200개의 유전자좌를 포함한다. 일부 예에서, 각 클러스터는 109, 121, 130 또는 137개의 유전자좌를 포함한다. 일부 예에서, 각 클러스터는 5, 6, 7, 8, 9, 10, 11 또는 12개의 유전자좌를 포함한다. 일부 예에서, 하나의 클러스터 내의 별개의 유전자좌로부터의 폴리뉴클레오티드는 조립될 때 미리 결정된 서열의 연속적인 더 긴 폴리뉴클레오티드를 인코딩하는 서열을 갖는다.
구조물 크기
일부 예에서, 본원에 설명된 구조물은 크기가, 예를 들어 약 40 ㎜와 120 ㎜ 사이 × 약 25 ㎜와 100 ㎜ 사이인 플레이트(예를 들어, 칩 또는 웨이퍼)이다. 일부 경우에, 본원에 설명된 구조물은 약 1000 ㎜, 500 ㎜, 450 ㎜, 400 ㎜, 300 ㎜, 250 ㎜, 200 ㎜, 150 ㎜, 100 ㎜ 또는 50 ㎜ 이하의 직경을 갖는다. 일부 예에서, 기판의 직경은 약 25 ㎜와 1000 ㎜ 사이, 약 25 ㎜와 약 800 ㎜ 사이, 약 25 ㎜와 약 600 ㎜ 사이, 약 25 ㎜와 약 500 ㎜ 사이, 약 25 ㎜와 약 400 ㎜ 사이, 약 25 ㎜와 약 300 ㎜ 사이, 또는 약 25 ㎜와 약 200 ㎜ 사이이다. 기판 크기의 비제한적인 예는 약 300 ㎜, 200 ㎜, 150 ㎜, 130 ㎜, 100 ㎜, 84 ㎜, 76 ㎜, 54 ㎜, 51 ㎜ 및 25 ㎜가 포함된다. 일부 예에서, 기판은 적어도 100 ㎟; 200 ㎟; 500 ㎟; 1,000 ㎟; 2,000 ㎟; 4,500 ㎟; 5,000 ㎟; 10,000 ㎟; 12,000 ㎟; 15,000 ㎟; 20,000 ㎟; 30,000 ㎟; 40,000 ㎟; 50,000 ㎟ 이상의 평면 표면적을 갖는다. 일부 예에서, 두께는 약 50 ㎜와 약 2000 ㎜ 사이, 약 50 ㎜와 약 1000 ㎜ 사이, 약 100 ㎜와 약 1000 ㎜ 사이, 약 200 ㎜와 약 1000 ㎜ 사이, 또는 약 250 ㎜와 약 1000 ㎜ 사이이다. 두께의 비제한적인 예에는 275 ㎜, 375 ㎜, 525 ㎜, 625 ㎜, 675 ㎜, 725 ㎜, 775 ㎜ 및 925 ㎜가 포함된다. 일부 예에서, 두께는 적어도 또는 약 0.5 ㎜, 1.0 ㎜, 1.5 ㎜, 2.0 ㎜, 2.5 ㎜, 3.0 ㎜, 3.5 ㎜, 4.0 ㎜, 또는 4.0 ㎜ 이상이다. 일부 경우에, 두께는 직경에 따라 다르며 기판의 조성에 따라 달라진다. 예를 들어, 실리콘 이외의 재료를 포함하는 구조물은 동일한 직경의 실리콘 구조물과 다른 두께를 가질 수 있다. 구조물의 두께는 사용된 재료의 기계적 강도에 따라 결정되며, 구조물은 취급 시 균열이 발생하지 않고 자체 무게를 지탱할 수 있을 만큼 두꺼워야 한다. 일부 예에서, 구조물은 임의의 한 차원에서 약 1, 2, 3, 4, 5, 10, 15, 30, 40, 50피트 이상이다. 일부 예에서, 구조물은 폴리뉴클레오티드 합성 장치의 배열을 포함한다. 일부 예에서, 구조물이 CMOS에 통합된다.
재료
본원에서는 표면을 포함하는 장치가 제공되며, 여기서 표면은 미리 결정된 위치에서 폴리뉴클레오티드 서열분석을 지원하고 결과적으로 낮은 오류율, 낮은 드롭아웃 비율, 높은 수율, 및 높은 올리고 표현을 제공하도록 변형된다. 일부 예에서, 본원에서 제공된 폴리뉴클레오티드 서열분석용 장치의 표면은 드노보 폴리뉴클레오티드 서열분석 반응을 지원하기 위해 변형이 가능한 다양한 재료로 제작된다. 일부 경우에, 장치는 충분히 전도성이 있으며, 예를 들어 장치 전체 또는 일부에 걸쳐 균일한 전기장을 형성할 수 있다. 본원에 설명된 장치는 유연한 재료를 포함할 수 있다. 예시적인 유연한 재료에는 변형된 나일론, 변형되지 않은 나일론, 니트로셀룰로오스, 및 폴리프로필렌이 포함되지만 이에 제한되지 않는다. 본원에 설명된 장치는 강성 재료를 포함할 수 있다. 예시적인 강성 재료에는 유리, 퓨즈 실리카, 실리콘, 이산화규소, 질화규소, 플라스틱(예를 들어, 폴리테트라플루오로에틸렌, 폴리프로필렌, 폴리스티렌, 폴리카보네이트, 및 이들의 혼합물), 및 금속(예를 들어, 금, 백금))이 포함되지만 이에 제한되지 않는다. 본원에 설명된 장치는 실리콘, 폴리스티렌, 아가로스, 덱스트란, 셀룰로오스 중합체, 폴리아크릴아미드, 폴리디메틸실록산(PDMS), 유리, 또는 이들의 임의의 조합을 포함하는 재료로부터 제조될 수 있다. 일부 경우에, 본원에 개시된 장치는 본원에 열거된 재료의 조합으로 또는 관련 기술분야에 공지된 임의의 다른 적합한 재료로 제조될 수 있다.
본원에 기술된 장치는 인장 강도 범위를 갖는 재료를 포함할 수 있다. 다양한 인장 강도를 갖는 예시적인 재료에는 나일론(70 MPa), 니트로셀룰로오스(1.5 MPa), 폴리프로필렌(40 MPa), 실리콘(268 MPa), 폴리스티렌(40M Pa), 아가로스(1-10MPa), 폴리아크릴아미드(1-10MPa), 폴리디메틸실록산(PDMS)(3.9-10.8MPa)이 포함되지만 이에 제한되지 않는다. 본 명세서에 기술된 고체 지지체는 1 내지 300, 1 내지 40, 1 내지 10, 1 내지 5, 또는 3 내지 11MPa의 인장 강도를 가질 수 있다. 본원에 기술된 고체 지지체는 약 1, 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 20, 25, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 270, 또는 그 이상의 MPa의 인장 강도를 가질 수 있다. 일부 예에서, 본원에 설명된 장치는 테이프 또는 유연한 시트와 같은, 연속 루프 또는 릴에 보관할 수 있는 유연한 물질 형태의 폴리뉴클레오티드 서열분석을 위한 고체 지지체를 포함한다.
영률(Youg's modulus)은 하중 하에서 탄성(복원 가능한) 변형에 대한 재료의 저항을 측정한다. 다양한 영률 강성을 갖는 예시적인 재료에는 나일론(3 GPa), 니트로셀룰로오스(1.5 GPa), 폴리프로필렌(2 GPa), 실리콘(150 GPa), 폴리스티렌(3 GPa), 아가로스(1-10 GPa), 폴리아크릴아미드(1-10 GPa), 폴리디메틸실록산(PDMS)(1-10 GPa)이 포함되지만 이에 제한되지 않는다. 본원에 기술된 고체 지지체는 1 내지 500, 1 내지 40, 1 내지 10, 1 내지 5, 또는 3 내지 11 GPa의 영률을 가질 수 있다. 본원에 기술된 고체 지지체는 약 1, 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 20, 25, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 400, 500, 또는 그 이상의 GPa의 영률을 가질 수 있다. 유연성과 강성 사이의 관계는 서로 반대이기 때문에 유연한 재료는 영률이 낮고 하중을 받으면 모양이 크게 변한다. 일부 예에서, 본원에 기술된 고체 지지체는 적어도 나일론의 유연성을 갖는 표면을 갖는다.
일부 경우에, 본원에 개시된 장치는 이산화규소 베이스와 산화규소 표면층을 포함한다. 대안적으로, 상기 장치는 산화규소 베이스를 가질 수도 있다. 본원에 제공된 장치의 표면은 질감이 있어 폴리뉴클레오티드 합성을 위한 전체 표면적이 증가할 수 있다. 일부 예에서 본원에 공개된 장치는 적어도 5%, 10%, 25%, 50%, 80%, 90%, 95% 또는 99% 실리콘을 포함한다. 일부 예에서, 본원에 개시된 장치는 SOI(silicon on insulator) 웨이퍼로 제조된다,
구조물은 본원에 기술된 본 발명의 방법 및 조성물에 적합한 다양한 재료로부터 제조될 수 있다. 예를 들어, 본 발명을 포함하는 기판/고체 지지체를 제조하는 물질은 낮은 수준의 폴리뉴클레오티드 결합을 나타낸다. 일부 상황에서, 가시광선 및/또는 UV 광선에 투명한 재료를 사용할 수 있다. 충분히 전도성이 있는 재료, 예를 들어 본원에 기술된 기판/고체 지지체의 전부 또는 일부에 걸쳐 균일한 전기장을 형성할 수 있는 것들이 활용될 수 있다. 일부 예에서, 이러한 물질이 전기 접지에 연결될 수 있다. 일부 경우에, 기판이나 고체 지지체가 열 전도성이 있거나 절연될 수 있다. 상기 물질은 일련의 폴리뉴클레오티드 서열분석 반응과 같은 화학적 또는 생화학적 반응을 지원하기 위해 내화학성 및 내열성을 가질 수 있다. 유연한 재료의 경우, 관심 있는 재료에는 변형 및 변형되지 않은 나일론, 니트로셀룰로오스, 폴리프로필렌 등이 포함될 수 있다.
강성 재료의 경우, 특정 관심 재료에는 유리; 퓨즈 실리카; 실리콘, 플라스틱(예를 들어 폴리테트라플루오로에틸렌, 폴리프로필렌, 폴리스티렌, 폴리카보네이트 및 이들의 혼합물 등); 금속(예: 금, 백금 등)이 있다. 구조물은 실리콘, 폴리스티렌, 아가로스, 덱스트란, 셀룰로오스 중합체, 폴리아크릴아미드, 폴리디메틸실록산(PDMS), 및 유리로 이루어진 군으로부터 선택된 재료로 제작될 수 있다. 기판/고체 지지체 또는 미세구조물, 그 안의 반응기는 본원에 열거된 재료의 조합 또는 관련 기술분야에 공지된 임의의 다른 적합한 재료로 제조될 수 있다.
일부 예에서, 본원에 개시된 기판은 컴퓨터 판독 가능한 재료를 포함한다. 컴퓨터로 판독할 수 있는 재료에는 자기 매체, 릴-투-릴 테이프, 카트리지 테이프, 카세트 테이프, 유연한 디스크, 종이 매체, 필름, 마이크로피시, 연속 테이프(예: 벨트) 및 전자 지침을 저장하는 데 적합한 모든 매체가 포함되나 이에 제한되지 않는다. 일부 예에서, 기판은 자기 릴투릴 테이프 또는 자기 벨트를 포함한다. 일부 예에서, 기판은 연성 인쇄 회로 기판을 포함한다.
본원에 기술된 구조물은 가시광선 및/또는 UV광에 대해 투명할 수 있다. 일부 예에서, 본원에 설명된 구조물은 구조물의 전체 또는 일부에 걸쳐 균일한 전기장을 형성하기에 충분히 전도성이다. 일부 예에서, 본원에 설명된 구조물이 열 전도성이거나 절연되어 있다. 일부 예에서, 구조물은 폴리뉴클레오티드 서열분석 반응과 같은 화학 반응을 지원하기 위해 내화학성 및 내열성을 갖는다. 일부 예에서, 기판이 자성이다. 일부 예에서, 구조물이 금속 또는 금속 합금을 포함한다.
폴리뉴클레오티드 서열분석을 위한 구조물은 임의의 차원에서 길이가 1, 2, 5, 10, 30, 50 피트 이상일 수 있다. 유연한 구조물의 경우, 유연한 구조물은 선택적으로 권취된 상태(예: 릴)로 저장된다. 예를 들어 길이가 1피트를 초과하는 대형 강성 구조물의 경우 강성 구조물은 수직 또는 수평으로 보관할 수 있다.
표면 준비
일부 예에서, 본원에 개시된 구조물의 표면은 기판의 표면과 생체분자(예를 들어, 폴리뉴클레오티드, 폴리머라제, 프라이머 또는 이들의 임의의 조합의 복합체) 모두에 결합하도록 구성된 하나 이상의 활성 기능화된 표면을 포함하도록 변형되어, 표면에 대한 커플링 반응을 지원한다. 일부 예에서, 표면은 또한 생체분자를 효율적으로 결합하지 않는 수동 물질로 기능화되어, 수동 기능화제가 결합된 부위에 생체분자가 부착되는 것을 방지한다. 일부 경우에, 표면이 생체분자 지원를 위한 별개의 유전자좌만을 구획하는 활성층을 포함한다.
일부 예에서, 표면이 임의의 다른 비율로 존재하는 작용기의 혼합물과 접촉한다. 일부 예에서, 상기 혼합물은 적어도 2, 3, 4, 5개 이상의 다른 유형의 기능화제를 포함한다. 일부 예에서, 혼합물 중 적어도 두 가지 유형의 표면 기능화제의 비율은 약 1:1, 1:2, 1:5, 1:10, 2:10, 3:10, 4:10, 5:10, 6:10, 7:10, 8:10, 9:10, 또는 두 그룹의 원하는 표면 표현을 얻기 위한 기타 비율이다. 일부 예에서, 원하는 표면 장력, 습윤성, 물 접촉각, 및/또는 다른 적합한 용매에 대한 접촉각은 기판 표면에 적합한 비율의 기능화제를 제공함으로써 달성된다. 일부 경우에, 혼합물 중의 제제가 적합한 반응성 및 불활성 모이어티에서 선택되어, 반응성기의 표면 밀도를 하류 반응을 위한 원하는 수준으로 희석한다. 일부 예에서, 기능화제의 혼합물은 생체분자에 결합하는 하나 이상의 시약과 생체분자에 결합하지 않는 하나 이상의 시약을 포함한다. 따라서, 시약을 조절하면 특정 기능화 영역에서 발생하는 생체분자 결합의 양을 제어할 수 있다. 일부 예에서, 생체분자 결합의 양은 구조물의 결합 용량의 약 10%, 20%, 30%, 40%, 50%, 60% 또는 70%일 수 있다. 일부 예에서, 생체분자 결합의 양은 구조물의 결합 용량의 약 10 내지 60%, 약 10 내지 50%, 약 20 내지 50%, 또는 약 20 내지 40%일 수 있다.
일부 예에서, 기판 기능화 방법은 기판 표면에 실란 분자를 증착하는 것을 포함한다. 실란 분자는 기판의 고에너지 표면에 증착될 수 있다. 일부 예에서, 높은 표면 에너지 영역은 수동 기능화 시약을 포함한다. 본원에 기술된 방법은 표면을 결합하기 위한 실란 그룹을 제공하는 한편, 분자의 나머지 부분은 표면으로부터의 거리와 생체분자가 부착되는 말단의 자유 히드록실기를 제공한다. 일부 예에서, 실란은 유기기능성 알콕시실란 분자이다. 유기기능성 알콕시실란 분자의 비제한적인 예에는 디메틸클로로-옥토데실-실란, 메틸디클로로-옥토데실-실란, 트리클로로-옥토데실-실란, 및 트리메틸-옥토데실-실란, 트리에틸-옥토데실-실란이 포함된다. 일부 예에서, 실란은 아미노 실란이다. 아미노 실란의 예에는 11-아세톡시운데실트리에톡시실란, n-데실트리에톡시실란, (3-아미노프로필)트리메톡시실란, (3-아미노프로필)트리에톡시실란, 글리시딜옥시프로필/트리메톡시실란 및 N-(3-트리에톡시실릴프로필)-4-히드록시부티르아미드가 포함되지만 이에 제한되지 않는다. 일부 예에서, 실란은 11-아세톡시운데실트리에톡시실란, n-데실트리에톡시실란, (3-아미노프로필)트리메톡시실란, (3-아미노프로필)트리에톡시실란, 글리시딜옥시프로필/트리메톡시실란, N-(3-트리에톡시실릴프로필)-4-히드록시부티르아미드, 또는 이들의 임의의 조합을 포함한다. 일부 예에서, 활성 기능화제는 11-아세톡시운데실트리에톡시실란을 포함한다. 일부 예에서, 활성 기능화제는 n-데실트리에톡시실란을 포함한다. 일부 경우에, 활성 기능화제는 글리시딜옥시프로필트리에톡시실란(GOPS)을 포함한다. 일부 예에서, 실란이 플루오로실란이다. 일부 예에서, 실란은 탄화수소 실란이다. 일부 경우에, 실란이 3-요오도-프로필트리메톡시실란이다. 일부 경우에, 실란이 옥틸클로로실란이다.
일부 예에서, 실란화는 유기기능성 알콕시실란 분자와의 자가 조립을 통해 표면에서 수행된다. 유기기능성 알콕시실란은 유기기능에 따라 분류된다. 실록산 기능화제의 비제한적 예에는 히드록시알킬 실록산(실릴레이트 표면, 디보란으로 기능화되고 알코올을 과산화수소로 산화), 디올(디히드록시알킬) 실록산(실릴레이트 표면, 디올로 가수분해), 아미노알킬 실록산(아민은 중간 기능화 단계를 필요로 하지 않음), 글리시독시실란(3-글리시독시프로필-디메틸-에톡시실란, 글리시독시-트리메톡시실란), 메르캅토실란(3-메르캅토프로필-트리메톡시실란, 3-4-에폭시시클로헥실-에틸트리메톡시실란 또는 3-메르캅토프로필-메틸-디메톡시실란), 비시클로헵테닐-트리클로로실란, 부틸-알데히드-트리메톡시실란, 또는 이량체 2차 아미노알킬 실록산이 포함된다. 예시적인 히드록시알킬 실록산에는 3-히드록시프로필로 전환되는 알릴 트리클로로클로로실란, 또는 8-히드록시옥틸로 전환되는 7-옥트-1-에닐 트리클로로클로로실란이 포함된다. 디올(디히드록시알킬) 실록산에는 글리시딜 트리메톡시실란 유래 (2,3-디히드록시프로필옥시)프로필(GOPS)이 포함된다. 아미노알킬 실록산에는 3-아미노프로필로 전환되는 3-아미노프로필 트리메톡시실란(3-아미노프로필-트리에톡시실란, 3-아미노프로필-디에톡시-메틸실란, 3-아미노프로필-디메틸-에톡시실란, 또는 3-아미노프로필-트리메톡시실란)이 포함된다. 일부 경우에, 이량체 2차 아미노알킬 실록산은 비스(실릴옥실프로필)아민으로 전환되는 비스(3-트리메톡시실릴프로필)아민이다.
활성 기능화 영역은 하나 이상의 다른 종의 실란, 예를 들어 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 실란을 포함할 수 있다. 일부 경우에, 하나 이상의 실란 중 하나는 다른 실란보다 더 많은 양으로 기능화 조성물에 존재한다. 예를 들어, 2개의 실란을 갖는 혼합 실란 용액은 한 실란 대 다른 실란을 99:1, 98:2, 97:3, 96:4, 95:5, 94:6, 93:7, 92:8, 91:9, 90:10, 89:11, 88:12, 87:13, 86:14, 85:15, 84:16, 83:17, 82:18, 81:19, 80:20, 75:25, 70:30, 65:35, 60:40, 55:45의 비율로 포함한다. 일부 예에서, 활성 기능화제는 11-아세톡시운데실트리에톡시실란 및 n-데실트리에톡시실란을 포함한다. 일부 예에서, 활성 기능화제는 11-아세톡시운데실트리에톡시실란과 n-데실트리에톡시실란을 약 20:80 내지 약 1:99, 또는 약 10:90 내지 약 2:98, 또는 약 5:95의 비율로 포함한다.
일부 예에서, 기능화는 화학 기상 증착(CVD), 원자층 증착(ALD), 플라즈마 강화 CVD(PECVD), 플라즈마 강화 ALD(PEALD), 금속 유기 CVD(MOCVD), 열선 CVD(HWCVD), 개시 CVD(iCVD), 수정 CVD(MCVD), 증기 축 증착(VAD), 외부 기상 증착(OVD), 물리적 기상 증착 (예: 스퍼터 증착, 증발 증착), 및 분자층 증착(MLD를 포함하지만 이에 제한되지 않는 임의의 증착 기술에 의해 구조물에 기능화제를 증착시키는 것을 포함한다.
다음 기능화 공정의 임의의 단계 또는 구성요소는 최종 기능화된 기판의 원하는 특성에 따라 생략되거나 변경된다. 일부 경우에, 추가 구성요소 및/또는 공정 단계가 본원에 구현된 공정 작업 흐름에 추가된다. 일부 예에서, 예를 들어, 피라냐 용액을 사용하여 기판을 먼저 세정한다. 세정 공정의 예로는 기판을 높은 온도(예: 120℃)에서 피라냐 용액(예: 90% H2SO4, 10% H2O2)에 담그고 기판을 세척(예: 물)하고 건조(예: 질소 가스)시키는 단계를 포함한다. 상기 공정은 선택적으로 피라냐 처리된 기판을 염기성 용액(예를 들어, NH4OH)에 담근 후 수성 세척(예를 들어, 물)을 포함하는 피라냐 후 처리를 포함한다. 일부 예에서, 구조물의 표면을 플라즈마 세정하고, 선택적으로 피라냐 담그기와 선택적으로 피라냐 후 처리를 수행한다. 플라즈마 세정 공정의 예는 산소 플라즈마 에칭을 포함한다. 일부 예에서, 표면에 활성 기능화제가 증착된 후 기화된다. 일부 예에서, 기판은 세정 전에 예를 들어 피라냐 처리 및/또는 플라즈마 세정에 의해 능동적으로 기능화된다.
표면 기능화 방법은 선택적으로 레지스트 코팅 및 레지스트 스트리핑을 포함한다. 일부 예에서, 활성 표면 기능화 후 기판을 레지스트, 예를 들어 SPR™3612 포지티브 포토레지스트로 스핀 코팅한다. 다양한 경우에 표면 기능화 공정은 패턴화된 기능화를 통한 리소그래피를 포함한다. 일부 예에서, 레지스트 코팅 후에 포토리소그래피가 수행된다. 일부 예에서, 리소그래피 후 표면에 리소그래피 결함이 있는지 육안으로 검사한다. 일부 예에서, 표면 기능화 공정은 세정 단계를 포함하며, 이에 따라 기판의 잔류물이 예를 들어 플라즈마 세정 또는 에칭에 의해 제거된다. 일부 예에서, 플라즈마 세정 단계는 리소그래피 단계 이후의 일부 단계에서 수행된다.
일부 예에서, 레지스트로 코팅된 표면은 예를 들어 기능화 후 및/또는 리소그래피 후에 레지스트를 제거하도록 처리된다. 일부 경우에, 레지스트는 용매, 예를 들어 N-메틸-2-피롤리돈을 포함하는 스트리핑 용액을 사용하여 제거된다. 일부 경우에, 레지스트 스트리핑에는 음파 처리 또는 초음파 처리가 포함된다. 일부 예에서, 레지스트를 코팅하고 스트리핑한 다음, 노출된 영역을 능동적으로 기능화하여 원하는 차등 기능화 패턴을 생성한다.
일부 예에서, 본원에 기술된 방법 및 조성물은 선택 영역에서 변형된 표면 특성의 생성을 위한 포토레지스트의 적용에 관한 것이며, 여기서 포토레지스트의 적용은 포토레지스트의 공간 분포를 정의하는 표면의 유체 특성에 의존한다. 이론에 얽매이지 않고, 적용된 유체와 관련된 표면 장력 효과가 포토레지스트의 흐름을 정의할 수 있다. 예를 들어, 표면 장력 및/또는 모세관 현상 효과는 레지스트 용매가 증발하기 전에 제어된 방식으로 포토레지스트를 작은 구조물로 그리는 것을 용이하게 한다. 일부 예에서, 레지스트 접촉점이 날카로운 모서리에 고정되어, 유체의 진행을 제어한다. 기본 구조물은 제조 및 기능화 공정 동안 포토레지스트를 적용하는 데 사용되는 원하는 흐름 패턴을 기반으로 설계될 수 있다. 용매가 증발한 후 남겨진 고체 유기층은 제조 공정의 후속 단계를 진행하는 데 사용될 수 있다. 구조물은 인접한 유체 경로로의 흡수 효과를 촉진하거나 억제하여 유체의 흐름을 제어하도록 설계될 수 있다. 예를 들어, 구조물은 상단과 하단 가장자리 사이의 중첩을 방지하도록 설계되어 레지스트의 특정 배치를 허용하는 상단 구조에 유체를 유지하는 것을 용이하게 한다. 대안적인 예에서, 상단과 하단 가장자리가 겹쳐서, 적용된 유체가 바닥 구조로 흡수된다. 레지스트의 원하는 적용에 따라, 적절한 디자인이 선택될 수 있다.
일부 예에서, 본원에 기술된 구조물은 뉴클레오시드에 결합할 수 있는 반응성기를 포함하는 적어도 또는 적어도 0.1 ㎚, 0.5 ㎚, 1 ㎚, 2 ㎚, 5 ㎚, 10 ㎚ 또는 25 ㎚의 두께를 갖는 물질을 포함하는 표면을 갖는다. 예시에는 유리 및 실리콘(예: 이산화규소 및 질화규소)이 포함되지만 이에 제한되지 않는다. 일부 경우에, 예시적인 표면에는 나일론과 PMMA가 포함된다.
일부 예에서, UV 광 형태의 전자기 방사선이 표면 패턴화에 사용된다. 일부 예에서, 표면 패턴화를 위해 램프가 사용되고, 마스크는 표면에 대한 UV 광의 노출 위치를 중재한다. 일부 예에서, 레이저가 표면 패턴화에 사용되며 셔터 열림/닫힘 상태는 표면에 대한 UV 광 노출을 제어한다. 레이저 장치는 움직일 수 있는 유연한 구조와 결합하여 사용될 수 있다. 이러한 배열에서, 레이저 노출과 유연한 구조물 이동의 조정은 서로 다른 뉴클레오시드 결합 능력을 갖는 하나 이상의 기능화제의 패턴을 생성하는 데 사용된다.
재료 증착 시스템
일부 예에서, 서열분석된 폴리뉴클레오티드는 기판, 예를 들어 고체 지지체 상에 저장된다. 폴리뉴클레오티드는 비연속적 또는 주문형 적하 방법으로 기판 표면에 침착될 수 있다. 일부 예에서, 폴리뉴클레오티드가 서열분석을 위해 장치로 전달된다. 이러한 방법의 예로는 전기기계 전달법, 전기 열 전달법, 정전기력 인력법 등이 있다. 전기기계적 전달 방법에서, 전기 펄스에 의해 변형된 압전 소자가 액적을 배출시킨다. 전기 열전달법에서, 장치의 챔버 내에 기포가 발생하고, 기포의 팽창력에 의해 액적이 분출된다. 정전기력 인력법에서, 정전기적 인력을 사용하여 기판에 액적을 분사한다. 일부 경우에, 드롭 주파수는 약 5 KHz 내지 약 500 KHz; 약 5 KHz 내지 약 100 KHz; 약 10 KHz 내지 약 500 KHz; 약 10 KHz 내지 약 100 KHz; 또는 약 50 KHz 내지 약 500 KHz이다. 일부 경우에, 주파수가 약 500 KHz, 200 KHz, 100 KHz, 또는 50 KHz 미만이다.
분배되는 액적의 크기는 장치의 해상도와 상관관계가 있다. 일부 예에서, 장치는 약 0.01 pl 내지 약 20 pl, 약 0.01 pl 내지 약 10 pl, 약 0.01 pl 내지 약 1 pl, 약 0.01 pl 내지 약 0.5 pl, 약 0.01 pl 내지 약 0.01 pl, 또는 약 0.05 pl 내지 약 1 pl 크기의 시약 액적을 침착시킨다. 일부 예에서, 액적 크기는 약 1 pl, 0.5 pl, 0.2 pl, 0.1 pl, 또는 0.05 pl 미만이다.
일부 배열에서, 폴리뉴클레오티드 서열분석 시스템의 구성은 릴-투-릴 유형 공정으로 이동하기 위해 기판의 유연성을 활용하는 연속 폴리뉴클레오티드 서열분석 공정을 허용한다. 이런 서열분석 공정은 기판의 위치를 회전시키기 위해 하나 이상의 릴을 사용하여 폴리뉴클레오티드 서열분석의 다양한 단계를 통해 기판이 이동하는 연속 생산 라인 방식으로 작동한다. 예시적인 예에서, 폴리뉴클레오티드 서열분석의 반응은 포스포르아미다이트 침착을 위한 침착 장치 아래의, 용매조를 통과, 산화제조를 통과, 아세토니트릴 세척조를 통과, 그리고 탈블록조를 통과하여 기판을 롤링하는 것을 포함한다. 선택적으로, 테이프를 캡핑조에 통과시키기도 한다. 릴-투-릴 유형 공정을 통해 서열분석된 폴리뉴클레오티드를 포함하는 기판의 최종 제품이 테이크업 릴에 쉽게 수집될 수 있으며, 여기서 추가 처리 또는 보관을 위해 운송될 수 있다.
폴리뉴클레오티드 서열분석을 위한 시약이 재활용되거나 재사용되는 장치, 방법, 시스템 및 조성물이 본원에 기술되어 있다. 시약 재활용은 사용되지 않은 시약의 수집, 보관 및 사용 또는 사용한 시약의 정제/변형이 포함될 수 있다. 예를 들어, 시약조는 재활용되어 동일하거나 다른 표면에서 폴리뉴클레오티드 서열분석 단계에 사용된다. 본원에 설명된 시약은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10회 이상 재활용될 수 있다. 대안적으로 또는 조합하여, 반응 부산물을 포함하는 시약 용액을 여과하여 부산물을 제거하고, 시약 용액을 추가적인 폴리뉴클레오티드 서열분석 반응에 사용한다.
많은 통합된 또는 통합되지 않은 요소가 종종 폴리뉴클레오티드 서열분석 시스템과 함께 사용된다. 일부 예에서, 폴리뉴클레오티드 서열분석 시스템은 합성된 폴리뉴클레오티드를 서열분석하기 전에 처리하는 데 유용한 하나 이상의 요소를 포함한다. 예를 들어, 시스템은 열 순환 장치와 같은 온도 제어 요소를 포함한다. 일부 예에서, 온도 제어 요소는 폴리뉴클레오티드 서열분석 전에 PCA와 같은 핵산 어셈블리 및/또는 PCR과 같은 핵산 증폭을 수행하기 위해 복수의 분해 반응기와 함께 사용된다.
드노보 폴리뉴클레오티드 합성
짧은 시간 내에 기판 위에 고밀도의 폴리뉴클레오티드를 합성하기 위한 시스템 및 방법이 본원에 제공된다. 일부 예에서, 기판은 유연한 기판이다. 일부 예에서, 적어도 1010, 1011, 1012, 1013, 1014 또는 1015개의 염기가 하루에 합성된다. 일부 예에서, 하루에 적어도 10 × 108, 10 × 109, 10 × 1010, 10 × 1011 또는 10 × 1012개의 폴리뉴클레오티드가 합성된다. 일부 예에서, 합성된 각 폴리뉴클레오티드는 적어도 20, 50, 100, 200, 300, 400 또는 500개의 핵염기를 포함한다. 일부 경우에, 이러한 염기가 약 100; 200; 300; 400; 500; 1000; 2000; 5000; 10000; 15000; 20000개 염기 중 약 1개 미만의 총 평균 오류율로 합성된다. 일부 예에서, 이러한 오류율은 합성된 폴리뉴클레오티드의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99%, 99.5% 이상에 대한 것이다. 일부 예에서, 합성된 폴리뉴클레오티드의 적어도 90%, 95%, 98%, 99%, 99.5% 이상은 이들이 인코딩하는 미리 결정된 서열과 다르지 않다. 일부 예에서, 본원에 기술된 방법 및 시스템을 사용하여 기판 상에 합성된 폴리뉴클레오티드에 대한 오류율은 약 1/200 미만이다. 일부 예에서, 본원에 설명된 방법 및 시스템을 사용하여 기판 상에 합성된 폴리뉴클레오티드에 대한 오류율은 약 1/1,000 미만이다. 일부 예에서, 본원에 설명된 방법 및 시스템을 사용하여 기판 상에 합성된 폴리뉴클레오티드에 대한 오류율은 약 1/2,000 미만이다. 일부 예에서, 본원에 설명된 방법 및 시스템을 사용하여 기판 상에 합성된 폴리뉴클레오티드에 대한 오류율은 약 1/3,000 미만이다. 일부 예에서, 본원에 설명된 방법 및 시스템을 사용하여 기판 상에 합성된 폴리뉴클레오티드에 대한 오류율은 약 1/5,000 미만이다. 오류율의 개별 유형에는 기판에서 합성된 폴리뉴클레오티드에 대한 불일치, 삭제, 삽입 및/또는 치환이 포함된다. "오류율"이라는 용어는 합성된 폴리뉴클레오티드의 총량과 미리 결정된 폴리뉴클레오티드 서열의 집합체를 비교하는 것을 의미한다. 일부 예에서, 본원에 개시된 합성된 폴리뉴클레오티드는 12개 내지 25개 염기의 테더를 포함한다. 일부 예에서, 테더는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50개 이상의 염기를 포함한다.
폴리뉴클레오티드 합성에 사용되는 화학 반응이 전기화학을 사용하여 제어되는 방법, 시스템, 장치 및 조성물이 본원에 설명되어 있다. 일부 예에서, 전기화학 반응은 임의의 빛, 열, 방사선, 또는 전기 에너지원에 의해 제어된다. 예를 들어, 전극은 표면의 개별 유전자좌 전체 또는 일부로서 화학 반응을 제어하는 데 사용된다. 일부 예에서, 전극은 폴리뉴클레오티드 합성에서 하나 이상의 화학적 단계를 제어하기 위해 전극에 전위를 인가함으로써 충전된다. 일부 예에서, 이러한 전극에 주소를 지정할 수 있다. 본원에 기술된 임의 개수의 화학적 단계는 일부 예에서 하나 이상의 전극으로 제어된다. 전기화학 반응은 산화, 환원, 산/염기 화학, 또는 전극에 의해 제어되는 기타 반응을 포함할 수 있다. 일부 예에서, 전극은 화학적 변형을 위한 시약으로 사용되는 전자나 양성자를 생성한다. 일부 예에서, 전극은 산과 같은 시약을 직접 생성한다. 일부 예에서, 산이 양성자이다. 일부 예에서, 전극은 염기와 같은 시약을 직접 생성한다. 산이나 염기는 종종 보호기를 절단하는 데 사용되거나, 예를 들어 반응 용액의 pH를 조정하여 다양한 폴리뉴클레오티드 합성 반응의 동역학에 영향을 준다. 일부 예로서, 전기화학적으로 제어되는 폴리뉴클레오티드 합성 반응은 산화환원 활성 금속 또는 기타 산화환원 활성 유기 물질을 포함한다. 일부 예에서, 금속 또는 유기 촉매가 이러한 전기화학 반응에 사용된다. 일부 예에서, 퀴논의 산화로부터 산이 생성된다.
화학 반응의 제어는 시약의 전기화학적 생성에 의하나 이에 제한되지 않으며; 화학 반응성은 전극에 의해 생성되는 전기장(또는 그래디언트)을 통해 기판이나 시약에 대한 생물물리학적 변화를 통해 간접적으로 영향을 받을 수 있다. 일부 예에서, 기판에는 핵산이 포함되지만 이에 제한되지 않는다. 일부 예에서, 특정 시약이나 기판을 전극이나 표면 쪽으로 밀어내거나 끌어당기는 전기장이 생성된다. 일부 예에서, 이러한 전기장은 하나 이상의 전극에 전위를 인가함으로써 생성된다. 예를 들어, 음전하를 띤 핵산은 음전하를 띤 전극 표면에서 밀려난다. 일부 예에서, 국소 전기장에 의해 발생하는 폴리뉴클레오티드 또는 기타 시약의 이러한 반발력 또는 인력은 합성 장치 또는 구조물의 영역 내부 또는 외부로 폴리뉴클레오티드 또는 기타 시약의 이동을 제공한다. 일부 예에서, 전극이 합성 표면, 구조물, 또는 장치로부터 폴리뉴클레오티드를 밀어내는 전기장을 생성한다. 일부 예에서, 전극이 합성 표면, 구조물 또는 장치쪽으로 폴리뉴클레오티드를 끌어당기는 전기장을 생성한다. 일부 예에서, 양성자가 기판 또는 그 일부와 접촉하는 것을 제한하기 위해 양성자가 양으로 하전된 표면으로부터 밀려난다. 일부 예에서, 반발력이나 인력을 사용하여 시약이나 기판이 합성 표면의 특정 영역으로 들어가는 것을 허용하거나 차단한다. 일부 예에서, 뉴클레오시드 단량체는 구성요소 중 하나 또는 둘 다 근처에 전기장을 인가함으로써 폴리뉴클레오티드와 접촉하는 것이 방지된다. 이러한 배열은 특정 시약의 게이팅을 허용하며, 이는 시약 및/또는 기판 사이의 농도 또는 접촉 속도가 제어될 때 보호기의 필요성을 제거할 수 있다. 일부 예에서, 보호되지 않은 뉴클레오시드 단량체가 폴리뉴클레오티드 합성에 사용된다. 대안적으로, 하나 또는 두 구성요소 부근에 전기장을 인가하면 뉴클레오시드 단량체와 폴리뉴클레오티드의 접촉이 촉진된다. 또한, 기판에 전기장을 인가하면 기판의 반응성이나 형태가 변경될 수 있다. 예시적인 적용에서, 전극에 의해 생성된 전기장은 인접한 유전자좌의 폴리뉴클레오티드가 상호작용하는 것을 방지하는 데 사용된다. 일부 예로서, 기판은 선택적으로 표면에 부착된 폴리뉴클레오티드이다. 일부 예에서, 전기장을 인가하면 폴리뉴클레오티드의 3차원 구조가 변경된다. 이러한 변경에는 나선, 헤어핀, 루프, 또는 기타 3차원 핵산 구조와 같은 다양한 구조의 폴딩 또는 풀림(unfolding)이 포함된다. 이러한 변경은 웰, 채널, 또는 기타 구조물 내부의 핵산을 조작하는 데 유용하다. 일부 예에서, 2차 구조를 방지하기 위해 핵산 기판에 전기장이 인가된다. 일부 예에서, 전기장이 폴리뉴클레오티드 합성 중에 링커나 고체 지지체에 부착할 필요성을 없애준다.
본 개시내용의 기판 상에서의 폴리뉴클레오티드 합성에 적합한 방법은 포스포르아미다이트 빌딩 블록, 예를 들어 포스포르아미다이트 빌딩 블록의 제어된 첨가를 포함하는 포스포르아미다이트 방법으로, 예를 들어 뉴클레오시드 포스포르아미다이트를 포스포르아미다이트 빌딩 블록과 기판에 결합된 뉴클레오시드 사이에 포스파이트 트리에스테르 연결을 형성하는 커플링 단계에서 성장하는 폴리뉴클레오티드에 첨가하는 방법이다. 일부 예에서, 뉴클레오시드 포스포르아미다이트가 활성화된 기판에 제공된다. 일부 예에서, 뉴클레오시드 포스포르아미다이트가 활성화제와 함께 기판에 제공된다. 일부 예에서, 뉴클레오시드 포스포르아미다이트는 기판-결합된 뉴클레오시드보다 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50, 60, 70, 80, 90, 100배 이상 과량으로 기판에 제공된다. 일부 예에서, 뉴클레오시드 포스포르아미다이트의 첨가는 무수 환경, 예를 들어 무수 아세토니트릴에서 수행된다. 커플링 단계에서 뉴클레오시드 포스포르아미다이트의 첨가 및 연결 후, 기판은 선택적으로 세척된다. 일부 예에서, 커플링 단계는 선택적으로 기판에 대한 뉴클레오시드 포스포르아미다이트 첨가 사이의 세척 단계와 함께 1회 이상 추가로 반복된다. 일부 예에서, 본원에 사용된 폴리뉴클레오티드 합성 방법은 1, 2, 3개 이상의 순차적 커플링 단계를 포함한다. 커플링 전에, 많은 경우에 기판에 결합된 뉴클레오시드는 보호기의 제거에 의해 탈보호되며, 여기서 보호기는 중합반응을 방지하는 기능을 한다. 보호기는 폴리뉴클레오티드의 확장을 방지하는 임의의 화학기를 포함할 수 있다. 일부 예에서, 보호기가 산의 존재 하에서 절단(또는 제거)된다. 일부 예에서, 보호기가 염기의 존재 하에 절단된다. 일부 예에서, 보호기가 빛, 열 또는 기타 에너지원과 같은 전자기 방사선을 사용하여 제거된다. 일부 예에서, 보호기가 산화 또는 환원 반응을 통해 제거된다. 일부 예에서, 보호기가 트리아릴메틸기를 포함한다. 일부 예에서, 보호기가 아릴 에테르를 포함한다. 일부 예에서, 보호기가 이황화물을 포함한다. 일부 예에서, 보호기가 산에 불안정한 실란을 포함한다. 일부 예에서, 보호기가 아세탈을 포함한다. 일부 예에서, 보호기가 케탈을 포함한다. 일부 예에서, 보호기가 에놀 에테르를 포함한다. 일부 예에서, 보호기가 메톡시벤질기를 포함한다. 일부 예에서, 보호기가 아지드를 포함한다. 일부 예에서, 보호기가 4,4'-디메톡시트리틸(DMT)이다. 일부 예에서, 보호기가 3급-부틸 카르보네이트이다. 일부 예에서, 보호기가 3급-부틸 에스테르이다. 일부 예에서, 보호기가 염기 불안정기를 포함한다. 일부 예에서, 폴리뉴클레오티드를 생성하기 위해 효소적 방법이 사용된다. 일부 예에서, 효소적 방법은 폴리머라제의 사용을 포함한다. 일부 예에서, 효소적 방법은 보호된 뉴클레오티드의 사용을 포함한다. 일부 예에서, 효소적 방법은 말단 데옥시트랜스퍼라제 또는 그의 변이체를 사용하는 것을 포함한다.
커플링 후, 포스포르아미다이트 폴리뉴클레오티드 합성 방법은 선택적으로 캡핑 단계를 포함한다. 캡핑 단계에서, 성장하는 폴리뉴클레오티드를 캡핑제로 처리한다. 캡핑 단계는 일반적으로 커플링 후 추가 사슬 신장으로부터 반응하지 않은 기판-결합된 5'-OH기를 차단하여, 내부 염기 결실이 있는 폴리뉴클레오티드의 형성을 방지하는 역할을 한다. 또한, 1H-테트라졸로 활성화된 포스포르아미다이트는 종종 구아노신의 O6 위치와 작은 정도로 반응한다. 이론에 얽매이지 않고, I2/물에 의한 산화 시, 아마도 O6-N7 이동을 통해 이 부산물은 탈퓨린화를 겪는다. 퓨린성이 아닌 부위는 폴리뉴클레오티드의 최종 탈보호 과정에서 결국 절단되어 전체 길이 생성물의 수율을 감소시킬 수 있다. O6 변형은 I2/물로 산화하기 전에 캡핑 시약으로 처리하여 제거할 수 있다. 일부 예에서, 폴리뉴클레오티드 합성 중에 캡핑 단계를 포함시키면 캡핑이 없는 합성에 비해 오류율이 감소한다. 예로서, 캡핑 단계는 기판-결합된 폴리뉴클레오티드를 아세트산 무수물과 1-메틸이미다졸의 혼합물로 처리하는 것을 포함한다. 캡핑 단계 후에, 기판은 선택적으로 세척된다.
뉴클레오시드 포스포르아미다이트의 첨가 후, 선택적으로 캡핑 및 하나 이상의 세척 단계 후, 본원에 기술된 기판은 산화될 수 있는 결합된 성장하는 핵산을 포함한다. 산화 단계는 포스파이트 트리에스테르를 자연 발생 포스페이트 디에스테르 뉴클레오시드간 결합의 보호된 전구체인 4배위 포스페이트 트리에스테르로 산화시키는 것을 포함한다. 일부 예에서, 포스파이트 트리에스테르가 전기화학적으로 산화된다. 일부 예에서, 성장하는 폴리뉴클레오티드의 산화는 선택적으로 피리딘, 루티딘, 또는 콜리딘과 같은 약염기의 존재하에 요오드와 물로 처리하여 수행된다. 산화는 때때로 3급-부틸 히드로퍼옥사이드 또는 (1S)-(+)-(10-캄포르술포닐)-옥사지리딘(CSO)을 사용하여 무수 조건에서 수행된다. 일부 방법에서는 산화 후에 캡핑 단계가 수행된다. 2차 캡핑 단계는 지속될 수 있는 산화로 인한 잔류하는 물이 후속 결합을 억제할 수 있으므로 기판이 건조되도록 한다. 산화 후, 기판 및 성장하는 폴리뉴클레오티드는 선택적으로 세척된다. 일부 예에서, 산화 단계는 폴리뉴클레오티드 포스포로티오에이트를 얻기 위해 황화 단계로 대체되며, 황화 후에 임의의 캡핑 단계가 수행될 수 있다. 3-(디메틸아미노메틸리덴)아미노)-3H-1,2,4-디티아졸-3-티온, DDTT, Beaucage 시약으로도 알려진 3H-1,2-벤조디티올-3-온 1,1-이산화물, 및 N,N,N'N'-테트라에틸티우람 이황화물(TETD)을 포함하지만 이에 제한되지 않는 많은 시약이 효율적인 황 전달이 가능하다.
커플링을 통해 발생하는 뉴클레오시드 혼입의 후속 주기에 대해, 기판 결합된 성장하는 폴리뉴클레오티드의 보호된 5' 말단(또는 합성이 5'에서 3' 방향으로 수행되는 경우 3' 말단)이 제거되어 1차 히드록실기는 다음 뉴클레오시드 포스포르아미다이트와 반응할 수 있다. 일부 예에서, 보호기가 DMT이고 디클로로메탄 중 트리클로로아세트산에 의해 탈블록화가 일어난다. 일부 예에서, 보호기가 DMT이고 전기화학적으로 생성된 양성자에 의해 탈블록화가 일어난다. 장기간 동안 또는 권장되는 산 용액보다 더 강한 용액으로 탈트리틸화를 수행하면 고체 지지체에 결합된 폴리뉴클레오티드의 탈퓨린화가 증가하여 원하는 전체 길이 생성물의 수율이 감소할 수 있다. 본원에 기술된 방법 및 조성물은 바람직하지 않은 탈퓨린화 반응을 제한하는 제어된 탈블록화 조건을 제공한다. 일부 예에서, 기판 결합된 폴리뉴클레오티드는 탈블록화 후에 세척된다. 일부 예에서, 탈블록화 후 효율적인 세척이 낮은 오류율로 폴리뉴클레오티드를 합성하는데 기여한다.
본원에 기술된 기판상에서의 폴리뉴클레오티드를 합성하는 방법은 다음 단계의 반복 순서를 포함할 수 있다: 기판의 표면 피쳐에 보호된 단량체를 적용하여 표면, 링커 또는 이전에 탈보호된 단량체와 연결하는 단계; 후속적으로 적용된 보호된 단량체와 반응할 수 있도록 적용된 단량체를 탈보호하는 단계; 및 연결을 위해 또 다른 보호된 단량체를 적용하는 단계. 하나 이상의 중간 단계에는 산화 및/또는 황화가 포함된다. 일부 예에서, 하나 이상의 세척 단계가 하나 또는 모든 단계에 선행하거나 후행한다.
본원에 기술된 기판 상에서의 폴리뉴클레오티드의 합성 방법은 산화 단계를 포함할 수 있다. 예를 들어, 상기 방법은 다음 단계의 반복 순서를 포함한다: 기판 피쳐의 표면에 보호된 단량체를 적용하여 표면, 링커 또는 이전에 탈보호된 단량체와 연결하는 단계; 후속적으로 적용된 보호된 단량체와 반응할 수 있도록 적용된 단량체를 탈보호하는 단계; 연결을 위해 또 다른 보호된 단량체를 적용하는 단계, 산화 및/또는 황화. 일부 예에서, 하나 이상의 세척 단계가 하나 또는 모든 단계에 선행하거나 후행한다.
본원에 기술된 기판 상에서의 폴리뉴클레오티드의 합성 방법은 다음 단계의 반복 순서를 추가로 포함할 수 있다: 보호된 단량체를 기판 피쳐의 표면에 적용하여 표면, 링커 또는 이전에 탈보호된 단량체를 연결하는 단계; 상기 적용된 단량체를 탈보호하여 후속으로 적용된 보호된 단량체와 반응할 수 있도록 하는 단계; 및 산화 및/또는 황화. 일부 예에서, 하나 이상의 세척 단계가 하나 또는 모든 단계에 선행하거나 후행한다.
본원에 기술된 기판 상에서의 폴리뉴클레오티드의 합성 방법은 다음 단계의 반복 순서를 추가로 포함할 수 있다: 보호된 단량체를 기판 피쳐의 표면에 적용하여 표면, 링커 또는 이전에 탈보호된 단량체를 연결하는 단계; 및 산화 및/또는 황화. 일부 예에서, 하나 이상의 세척 단계가 하나 또는 모든 단계에 선행하거나 후행한다.
본원에 기술된 기판 상에서의 폴리뉴클레오티드의 합성 방법은 다음 단계의 반복 순서를 추가로 포함할 수 있다: 보호된 단량체를 기판 피쳐의 표면에 적용하여 표면, 링커 또는 이전에 탈보호된 단량체를 연결하는 단계; 상기 적용된 단량체를 탈보호하여 후속으로 적용된 보호된 단량체와 반응할 수 있도록 하는 단계; 및 산화 및/또는 황화. 일부 예에서, 하나 이상의 세척 단계가 하나 또는 모든 단계에 선행하거나 후행한다.
일부 예에서, 폴리뉴클레오티드는 광불안정한 보호기로 합성되는데, 여기서 표면에 생성된 히드록실기는 광불안정한 보호기에 의해 차단된다. 표면이 포토리소그래픽 마스크 등을 통해 UV 광에 노출되면, 표면에 자유 히드록실기 패턴이 생성될 수 있다. 이러한 히드록실기는 포스포르아미다이트 화학에 따라 광보호된 뉴클레오시드 포스포르아미다이트와 반응할 수 있다. 제2 포토리소그래피 마스크를 적용할 수 있고, 표면을 UV 광에 노출시켜 히드록실기의 제2 패턴을 생성한 후 5'-광보호된 뉴클레오시드 포스포르아미다이트와 결합할 수 있다. 마찬가지로, 패턴이 생성될 수 있고, 올리고머 사슬이 확장될 수 있다. 이론에 얽매이지 않고, 광절단성 기의 불안정성은 사용된 용매의 파장 및 극성에 따라 달라지며 광절단 속도는 노출 기간 및 빛의 강도에 의해 영향을 받을 수 있다. 이 방법은 마스크 정렬의 정확성, 광 보호기의 제거 효율성, 및 포스포르아미다이트 커플링 단계의 수율과 같은 다양한 요소를 활용할 수 있다. 또한, 의도하지 않은 빛의 이웃 부위로의 누출을 최소화할 수 있다. 스팟당 합성된 올리고머의 밀도는 합성 표면에 리더 뉴클레오시드의 부하량을 조정하여 모니터링할 수 있다.
폴리뉴클레오티드 합성을 위한 지지체를 제공하는 본원에 기술된 기판의 표면은 합성된 폴리뉴클레오티드가 표면에서 절단될 수 있도록 화학적으로 변형될 수 있다. 일부 예에서, 폴리뉴클레오티드는 폴리뉴클레오티드가 탈보호되는 동시에 절단된다. 일부 예에서, 폴리뉴클레오티드는 폴리뉴클레오티드가 탈보호된 후 절단된다. 예시적인 계획에서, (CH3CH2O)3Si-(CH2)2-NH2와 같은 트리알콕시실릴 아민은 기판의 표면 SiOH기와 반응한 후, 숙신산 무수물과 아민과 반응하여 아미드 결합과 유리 OH를 생성하는데. 여기서 핵산 사슬 성장이 지원된다. 절단에는 암모니아 또는 메틸아민에 의한 가스 절단이 포함된다. 일부 예에서, 절단에는 산 또는 염기와 같은 전기적으로 생성된 시약에 의한 링커 절단이 포함된다. 일부 예에서, 일단 표면에서 방출되면, 폴리뉴클레오티드는 저장된 정보를 추출하기 위해 서열분석되고 디코딩되는 더 큰 핵산으로 조립된다.
본원에 기술된 표면은 폴리뉴클레오티드 합성의 추가 주기를 지원하기 위해 폴리뉴클레오티드 절단 후에 재사용될 수 있다. 예를 들어, 링커는 추가적인 처리/화학적 변형 없이 재사용될 수 있다. 일부 예에서, 링커는 기판 표면 또는 폴리뉴클레오티드에 비공유적으로 결합된다. 일부 실시양태에서, 링커는 표면으로부터 절단된 후에도 폴리뉴클레오티드에 부착된 상태로 유지된다. 일부 실시양태에서 링커는 에스테르, 아미드, 케탈, 베타 치환 케톤, 헤테로사이클, 또는 가역적으로 절단될 수 있는 다른 기와 같은 가역적 공유 결합을 포함한다. 이러한 가역적 절단 반응은 일부 예에서 시약의 추가 또는 제거를 통해 제어되거나, 전극에 의해 제어되는 전기화학 공정에 의해 제어된다. 선택적으로, 화학적 링커 또는 표면 결합된 화학기는 반응성을 복원하고 이러한 링커 또는 표면 결합된 화학기에서 원하지 않는 부산물 형성을 제거하기 위해 여러 사이클 후에 재생된다.
컴퓨터 시스템
다양한 양태에서, 본원에 설명된 임의의 시스템은 컴퓨터에 작동 가능하게 연결되고 선택적으로 컴퓨터를 통해 로컬로 또는 원격으로 자동화된다. 다양한 경우에, 본 발명의 방법 및 시스템은 컴퓨터 시스템의 소프트웨어 프로그램 및 그 사용을 추가로 포함한다. 따라서, 재료 증착 장치 이동, 분배 동작 및 진공 작동을 조율하고 동기화하는 것과 같은 분배/진공/리필 기능의 동기화를 위한 컴퓨터화된 제어는 본 발명의 범위 내에 있다. 일부 예에서, 컴퓨터 시스템은 사용자가 지정한 염기 서열과 재료 증착 장치의 위치 사이에 접속하여 기판의 특정 영역에 올바른 시약을 전달하도록 프로그램된다. 예를 들어, 도 6 또는 도 7에 도시된 시스템과 같은 컴퓨터 시스템이 기호 세트로 표현된 데이터를 다른 기호 세트로 인코딩하는 데 사용될 수 있다. 예를 들어, 데이터는 "0" 및 "1"의 2진 값과 같은 숫자 기호로 표시될 수 있으며, 컴퓨터 시스템은 데이터를 복수의 핵산 서열로 전환하고, 복수의 핵산 서열을 데이터로, 또는 둘 다 전환하는 컴퓨터 프로그램을 실행할 수 있다. 일부 예에서, 컴퓨터 프로그램은 기계 학습 알고리즘일 수 있다. 일부 예에서, 기계 학습 알고리즘은 전류 또는 전압과 같은 전기 신호를 기반으로 뉴클레오티드 염기를 결정할 수 있다.
도 6에 도시된 컴퓨터 시스템(3700)은 고정된 매체(3712)를 갖는 서버(3709)에 선택적으로 연결될 수 있는 매체(3711) 및/또는 네트워크 포트(3705)로부터 명령을 판독할 수 있는 논리적 장치로 이해될 수 있다. 상기 시스템은 CPU(3701), 디스크 드라이브(3703), 키보드(3715) 및/또는 마우스(3716)와 같은 선택적 입력 장치 및 선택적 모니터(3707)을 포함할 수 있다. 데이터 통신은 표시된 통신 매체를 통해 로컬 또는 원격 위치에 있는 서버로 수행될 수 있다. 통신 매체는 데이터를 전송 및/또는 수신하는 임의의 수단을 포함할 수 있다. 예를 들어, 통신 매체는 네트워크 연결, 무선 연결 또는 인터넷 연결일 수 있다. 이러한 연결은 World Wide Web을 통한 통신을 제공할 수 있다. 본 개시내용과 관련된 데이터는 당사자(3722)에 의한 수신 및/또는 검토를 위해 그러한 네트워크 또는 연결을 통해 전송될 수 있음이 예상된다.
도 7은 본 발명의 일예와 관련하여 사용될 수 있는 컴퓨터 시스템의 제1 예시적인 아키텍처를 도시하는 블록도이다. 도 5에 도시된 바와 같이, 예시적인 컴퓨터 시스템은 명령을 처리하기 위한 프로세서(3802)를 포함할 수 있다. 프로세서의 비제한적인 예는 다음과 같다: Intel XeonTM 프로세서, AMD OpteronTM 프로세서, Samsung 32비트 RISC ARM 1176JZ(F)-S v1.0TM 프로세서, ARM Cortex-A8 Samsung S5PC100TM 프로세서, ARM Cortex-A8 Apple A4TM 프로세서, Marvell PXA 930TM 프로세서 또는 기능적으로 동등한 프로세서. 병렬 처리를 위해 여러 실행 스레드를 사용할 수 있다. 일부 경우에는, 단일 컴퓨터 시스템에서든, 클러스터에서든, 또는 복수의 컴퓨터, 휴대폰, 및/또는 개인 데이터 보조 장치를 포함하는 네트워크를 통해 시스템 전체에 걸쳐 분산되어 있든, 다중 프로세서 또는 다중 코어를 갖는 프로세서가 사용될 수도 있다. 도 38에 도시된 바와 같이, 고속 캐시(3804)는 프로세서(3802)에 연결되거나 프로세서(3802)에 통합되어 최근에 또는 프로세서(3802)에 의해 자주 사용되는 명령어 또는 데이터에 대한 고속 메모리를 제공할 수 있다. 프로세서(3802)는 프로세서 버스(3808)에 의해 노스 브릿지(3806)에 연결된다. 노스 브릿지(3806)은 메모리 버스(3812)에 의해 무작위 액세스 메모리 (RAM)(3810)에 연결되고 프로세서(3802)에 의해 RAM(3810)에 대한 액세스를 관리한다. 노스 브릿지(3806)은 또한 사우스 브릿지(3814)에 칩셋 버스(3816)에 의해 연결된다. 사우스 브릿지(3814)는 차례로 주변장치 버스(3818)에 연결된다. 주변장치 버스는 예를 들어 PCI, PCI-X, PCI Express, 또는 기타 주변장치 버스일 수 있다. 노스 브릿지 및 사우스 브릿지는 종종 프로세서 칩셋으로 지칭되며 프로세서, RAM, 및 주변장치 버스(3818)의 주변 구성요소 간의 데이터 전송을 관리한다. 일부 대안적 아키텍처에서는 노스 브릿지의 기능이 별도의 노스 브리지 칩을 사용하는 대신 프로세서에 통합될 수 있다. 일부 예에서, 시스템(3800)은 주변장치 버스(3818)에 부착된 가속기 카드(3822)를 포함할 수 있다. 가속기는 특정 처리를 가속화하기 위한 FPGA(Field Programmable Gate Array) 또는 기타 하드웨어를 포함할 수 있다. 예를 들어, 적응형 데이터 재구성이나 확장 집합 처리에 사용되는 대수식 평가에 가속기를 사용할 수 있다.
소프트웨어 및 데이터는 외부 스토리지(3824)에 저장되고 프로세서에 의한 사용을 위해 RAM(3810) 및/또는 캐시(3804)에 부하될 수 있다. 시스템(3800)은 시스템 리소스를 관리하기 위한 운영 체제를 포함한다; 운영 체제의 비제한적인 예로는 Linux, WindowsTM, MACOSTM, BlackBerry OSTM, iOSTM, 및 기타 기능적으로 동등한 운영 체제와 본 발명의 예시적 실시양태에 따라 데이터 저장 및 최적화를 관리하기 위해 운영 체제 위에서 실행되는 애플리케이션 소프트웨어가 있다. 본 예에서, 시스템(3800)은 또한 분산 병렬 처리에 사용될 수 있는 NAS(Network Attached Storage) 및 기타 컴퓨터 시스템과 같은 외부 스토리지에 네트워크 인터페이스를 제공하기 위해 주변장치 버스에 연결된 네트워크 인터페이스 카드(NIC)(3820) 및 (3821)을 포함한다.
도 8은 복수의 컴퓨터 시스템(3902a) 및 (3902b), 복수의 휴대폰 및 개인 데이터 보조기(3902c), 및 NAS(Network Attached Storage)(3904a) 및 (3904b)를 갖는 네트워크(3900)를 도시하는 다이어그램이다. 예시적인 실시양태에서, 시스템(3902a), (3902b), 및 (3902c)는 데이터 스토리지를 관리하고 NAS(Network Attached Storage)(3904a 및 3904b)에 저장된 데이터에 대한 데이터 액세스를 최적화할 수 있다. 수학적 모델은 데이터에 사용될 수 있으며 컴퓨터 시스템(3902a), (3902b), 휴대폰 및 개인 데이터 보조 시스템(3902c) 전반에 걸친 분산 병렬 처리를 사용하여 평가될 수 있다. 컴퓨터 시스템(3902a) 및 (3902b), 휴대폰 및 개인 데이터 보조 시스템(3902c)은 또한 NAS(Network Attached Storage)(3904a) 및 (3904b)에 저장된 데이터의 적응형 데이터 재구성을 위한 병렬 처리를 제공할 수 있다. 도 39는 단지 예를 도시하고 있으며, 본 발명의 다양한 실시양태와 함께 다양한 다른 컴퓨터 아키텍처 및 시스템이 사용될 수 있다. 예를 들어, 블레이드 서버를 사용하여 병렬 처리를 제공할 수 있다. 프로세서 블레이드는 백플레인을 통해 연결되어 병렬 처리를 제공할 수 있다. 스토리지는 별도의 네트워크 인터페이스를 통해 백플레인에 연결하거나 NAS(Network Attached Storage)로 연결할 수도 있다.
일부 예시적인 실시양태에서, 프로세서는 별도의 메모리 공간을 유지하고 다른 프로세서에 의한 병렬 처리를 위해 네트워크 인터페이스, 백플레인 또는 기타 커넥터를 통해 데이터를 전송할 수 있다. 다른 실시양태에서, 프로세서 중 일부 또는 전부는 공유 가상 주소 메모리 공간을 사용할 수 있다. 도 9는 예시적인 실시양태에 따라 공유 가상 주소 메모리 공간을 사용하는 다중 프로세서 컴퓨터 시스템(4000)의 블록도이다. 상기 시스템은 공유 메모리 서브시스템(4004)에 액세스할 수 있는 복수의 프로세서(4002a-f)를 포함한다. 상기 시스템은 메모리 서브시스템(4004)에 복수의 프로그램 가능 하드웨어 메모리 알고리즘 프로세서(MAP)(4006a-f)를 통합한다. 각 MAP(4006a-f)는 메모리(4008a-f) 및 하나 이상의 FPGA(Field Programmable Gate Array)(4010a-f)를 포함할 수 있다. MAP는 구성 가능한 기능 유닛을 제공하며 특정 알고리즘 또는 알고리즘의 일부는 각 프로세서와 긴밀하게 협력하여 처리하기 위해 FPGA(4010a-f)에 제공될 수 있다. 예를 들어, MAP는 데이터 모델에 관한 대수식을 평가하고 예시적인 실시양태에서 적응형 데이터 재구성을 수행하는 데 사용될 수 있다. 이 예에서, 각 MAP은 이러한 목적을 위해 모든 프로세서에서 전역적으로 액세스할 수 있다. 한 구성에서, 각 MAP는 DMA(직접 메모리 액세스)를 사용하여 관련 메모리(4008a-f)에 액세스할 수 있으며, 이는 각 마이크로프로세서(4002a-f)와 독립적으로 그리고 비동기적으로 작업을 실행할 수 있도록 한다. 이 구성에서, MAP는 알고리즘의 파이프라인 및 병렬 실행을 위해 결과를 다른 MAP에 직접 공급할 수 있다.
상기 컴퓨터 아키텍처 및 시스템은 예시일 뿐이며, 일반 프로세서, 보조-프로세서, FPGA 및 기타 프로그래밍 가능 논리 장치, 시스템 온 칩(SOC), 주문형 집적 회로(ASIC), 및 기타 처리 및 논리 요소의 임의의 조합을 사용하는 시스템을 포함하여 다양한 다른 컴퓨터, 휴대폰 및 개인 데이터 보조기 아키텍처 및 시스템이 예시적인 실시양태와 관련하여 사용될 수 있다. 일부 실시양태에서, 컴퓨터 시스템의 전부 또는 일부는 소프트웨어 또는 하드웨어로 구현될 수 있다. 랜덤 액세스 메모리, 하드 드라이브, 플래시 메모리, 테이프 드라이브, 디스크 어레이, NAS(Network Attached Storage) 및 기타 로컬 또는 분산 데이터 저장 장치 및 시스템을 포함하는, 임의의 다양한 데이터 저장 매체가 예시적인 실시양태와 관련하여 사용될 수 있다.
예시적인 실시양태에서, 컴퓨터 시스템은 상기 또는 다른 컴퓨터 아키텍처 및 시스템 중 임의의 것에서 실행되는 소프트웨어 모듈을 사용하여 구현될 수 있다. 다른 실시양태에서, 시스템의 기능은 펌웨어, 현장 프로그래밍 가능 게이트 어레이(FPGA), 시스템 온 칩(SOC), 주문형 집적 회로(ASIC), 또는 기타 처리 및 논리 요소와 같은 프로그래밍 가능 논리 장치에서 부분적으로 또는 완전히 구현될 수 있다. 예를 들어, 하드웨어 가속기 카드를 사용하여 하드웨어 가속으로 세트 프로세서(Set Processor) 및 옵티마이저(Optimizer)를 구현할 수 있다.
실시예
실시예 1:
형광단 뉴클레오티드를 사용하여 폴리뉴클레오티드를 서열분석한다. 서열분석에 앞서, 폴리뉴클레오티드는 도 1의 일반적인 계획에 따라 합성(또는 달리 획득)되고 제조되어, 폴리뉴클레오티드, 프라이머, 및 폴리머라제를 포함하는 복수의 3원 복합체가 생성된다. 복수의 3원 복합체를 포함하는 폴리뉴클레오티드 3원 복합체 라이브러리를 생성하여 유전자좌를 포함하는 단일 분자 서열분석 칩에 부하한다.
각각의 3원 복합체는 단일 분자 서열분석 칩의 유전자좌에 부하한다. 3원 복합체 내의 각각의 폴리뉴클레오티드는 3원 복합체를 서열분석 칩에 연결하기 위해 아비딘/비오틴 연결을 사용하여 서열분석 칩의 유전자좌에 부착된다. 3원 복합체는 서열분석 칩의 약 33% 용량으로 포아송 분포에 따라 서열분석 칩에 부하된다.
각각 고유한 형광단으로 표지된 유리 뉴클레오티드 A, T, C, 및 G를 포함하는 반응 혼합물이 제조된다. 이 경우, 고유한 형광단은 뉴클레오티드의 말단 포스페이트에 있는 포스포르아미데이트 연결을 통해 뉴클레오티드에 부착된다.
서열분석 동안, 고유한 형광단을 갖는 뉴클레오티드는 폴리머라제 및 프라이머를 통해 폴리뉴클레오티드 서열에 연속적으로 혼입된다. 여기원은 각각의 고유한 형광단을 여기시키기 위해 적절한 파장을 갖는 하나 이상의 여기 에너지를 방출하도록 구성된다. 여기원에 의해 방출된 여기 에너지는 미리 결정된 시간 간격으로 펄스화되고 형광단의 형광 수명이 측정된다. 형광 수명 측정은 새로 혼입된 뉴클레오티드를 결정하는 데 사용된다. 새로 혼입된 뉴클레오티드를 검출한 후, 폴리뉴클레오티드로부터 형광단을 분리하기 위해 폴리머라제를 사용하여 포스포르아미데이트 연결을 절단한다. 검출된 방출의 수집으로부터 얻은 서열은 서열 상보성을 통해 폴리뉴클레오티드의 서열을 결정하는 데 사용된다. 서열분석 칩에 부하된 폴리뉴클레오티드의 서열분석에 이어 아비딘/비오틴 연결은 세척 단계 중에 절단되어 서열분석 칩에서 3원 복합체를 분리시킨다. 아비딘/비오틴 연결은 비오틴을 포함하는 용리액으로 서열분석 칩을 세척함으로써 파괴되어, 서열분석 칩의 표면에서 3원 복합체를 방출시킨다.
3원 복합체를 제거한 후, 선택적으로 서열분석 칩의 표면을 재사용을 위해 재구성한다. 그런 다음, 새로운 3원 복합체 라이브러리가 서열분석을 위해 서열분석 칩에 다시 부하되고, 본원에 설명된 서열분석 단계를 반복한다.
실시예 2:
폴리뉴클레오티드의 서열을 결정하는 데 전자 장치가 사용된다. 실시예 1의 일반적인 방법에 따라 폴리뉴클레오티드를 합성하고 서열분석 칩에 부하한다.
서열분석 칩은 이격되어 있는 한 쌍의 전극을 포함하는 분자 전자 센서를 포함한다. 분자 복합체가 각 전극에 부착되어 분자 전자 회로를 형성한다. 분자 복합체는 탄소 나노튜브 가교와 활성을 통해 측정 가능한 전기 매개변수를 조절하는 폴리머라제 프로브 분자를 포함한다.
전류는 전극과 분자 복합체를 통해 흐르며 서열에 혼입되는 뉴클레오티드의 패턴에 따라 구별 가능한 신호를 생성한다. 측정된 구별 가능한 전기적 매개변수는 폴리뉴클레오티드 서열과 관련된 2진 데이터로 전환된다.
3원 복합체 내의 폴리뉴클레오티드가 서열분석된 후, 실시예 1의 일반적인 방법에 따라 서열분석 칩이 세척되고 서열분석 칩으로부터 3원 복합체가 제거된다. 이어서 서열분석 칩은 재사용을 위해 준비되고 새로운 3원 복합 라이브러리가 다시 부하된다.
실시예 3:
합성에 의한 나노포어 서열분석(SBS)을 사용하여 폴리뉴클레오티드 서열분석을 수행한다. 실시예 1의 일반적인 방법에 따라 폴리뉴클레오티드를 서열분석하고 서열분석 칩에 부하한다.
서열분석 장치는 각각 폴리머라제에 접합된 나노포어를 포함한다. 나노포어에 내장된 폴리머라제를 폴리뉴클레오티드 주형 및 각각 올리고뉴클레오티드 태그를 포함하는 복수의 뉴클레오티드에 노출시킨다. 폴리뉴클레오티드 주형에 상보적인 태그된 뉴클레오티드가 폴리머라제 활성 부위에 의해 포획되면, 태그 모이어티가 나노포어에 위치하게 된다. 전위가 인가되고 포어에 태그가 존재하면 개방된 포어 전류에 비해 뚜렷한 차단 전류가 발생한다. 차단 전류는 폴리머라제가 폴리뉴클레오티드 주형에 상보적인 가닥을 합성할 때 측정된다. 측정된 차단 전류의 서열을 사용하여 폴리뉴클레오티드 주형의 서열을 식별한다.
3원 복합체의 폴리뉴클레오티드가 서열분석된 후, 실시예 1의 일반적인 방법에 따라 서열분석 칩을 세척하고, 서열분석 칩에서 3원 복합체를 제거한다. 그런 다음 서열분석 칩은 재사용을 위해 준비되고 새로운 3원 복합체 라이브러리가 다시 부하된다.
본 발명의 바람직한 실시양태가 본원에 도시되고 설명되었지만, 이러한 실시양태는 단지 예로서 제공된다는 것이 관련 기술분야의 숙련가에게 명백할 것이다. 본 발명을 벗어나지 않으면서 관련 기술분야의 숙련가는 다양한 변형, 변경 및 대체를 할 수 있을 것이다. 본원에 기술된 본 발명의 실시양태에 대한 다양한 대안이 본 발명을 실시하는데 채용될 수 있다는 것을 이해해야 한다. 다음의 청구범위는 본 발명의 범위를 정의하고, 이들 청구범위 범위 내의 방법 및 구조 및 그 등가물은 이에 의해 포괄되도록 의도된다.

Claims (74)

  1. 폴리뉴클레오티드 서열분석 방법으로서,
    a) 복수의 폴리뉴클레오티드를 적어도 하나의 프라이머 및 적어도 하나의 폴리머라제와 접촉시켜 복수의 3원 복합체를 형성하는 단계;
    b) 폴리뉴클레오티드의 하나 이상의 염기를 검출하는 단계로서, 여기서 검출은 복수의 3원 복합체가 표면에 결합될 때 이루어지는 것인 단계;
    c) 표면에서 3원 복합체를 제거하는 단계; 및
    d) 단계 a-c를 반복하여 폴리뉴클레오티드의 서열을 분석하는 단계
    를 포함하는 서열분석 방법.
  2. 제1항에 있어서, 단계 c)가 표면을 세척하는 것을 포함하는 것인 방법.
  3. 제1항에 있어서, 세척이 표면을 용매, 열, 소분자, 핵산, 또는 단백질 중 하나 이상과 접촉시키는 것을 포함하는 것인 방법.
  4. 제3항에 있어서, 소분자가 제2 모이어티에 접합하도록 구성된 제1 모이어티를 포함하는 것인 방법.
  5. 제4항에 있어서, 상기 접합이 친핵체/카르보닐; 아지드/포스핀; 1,4 마이클 첨가, 1,3-쌍극성 고리 첨가, 역전자 수요 고리 첨가; 올레핀 복분해; 또는 교차 결합 반응을 포함하는 것인 방법.
  6. 제3항에 있어서, 소분자가 비오틴, 알킨, 아지드, 테트라진, 알켄, 알킨, 카르보닐, 마이클 수용체/공여체, 또는 항원을 포함하는 것인 방법.
  7. 제3항에 있어서, 용매가 유기 용매를 포함하는 것인 방법.
  8. 제3항에 있어서, 유기 용매가 MeCN, 메탄올, 에탄올, 2-프로판올, 아세톤, DMF, 포름아미드, THF, 또는 DMSO를 포함하는 것인 방법.
  9. 제8항에 있어서, 유기 용매가 가열되는 것인 방법.
  10. 제3항에 있어서, 단백질이 프로테이나제 또는 뉴클레아제를 포함하는 것인 방법.
  11. 제10항에 있어서, 프로테이나제가 아미노펩티다제를 포함하는 것인 방법.
  12. 제11항에 있어서, 아미노펩티다제가 프로테이나제 K, N-말단 아미노펩티다제, C-말단 아미노펩티다제, 키모트립신, 트립신, 펩신, 또는 LysC를 포함하는 것인 방법.
  13. 제3항에 있어서, 단백질이 스트렙트아비딘을 포함하는 것인 방법.
  14. 제1항에 있어서, 폴리머라제가 Phi29 폴리머라제 또는 이의 변이체를 포함하는 것인 방법.
  15. 제1항에 있어서, 단계 a)에서 폴리머라제가 표면에 결합되는 것인 방법.
  16. 제1항에 있어서, 단계 a)에서 폴리머라제가 표면에 결합되지 않는 것인 방법.
  17. 제1항에 있어서, 복수의 폴리뉴클레오티드가 적어도 100,000개의 고유한 폴리뉴클레오티드를 포함하는 것인 방법.
  18. 제1항에 있어서, 복수의 폴리뉴클레오티드의 길이가 50 내지 30,000개 염기인 방법.
  19. 제1항에 있어서, 검출이 고유한 파장, 형광 수명, 또는 전류 또는 전압의 변화를 사용하여 염기를 식별하는 것을 포함하는 것인 방법.
  20. 제1항에 있어서, 검출이 합성에 의한 서열분석 및 나노포어 검출 중 하나 이상을 포함하는 것인 방법.
  21. 제1항에 있어서, 검출이 FRET를 포함하는 것인 방법.
  22. 제1항에 있어서, 검출이 3원 복합체를 적어도 하나의 뉴클레오티드와 접촉시키는 것을 포함하는 것인 방법.
  23. 제22항에 있어서, 뉴클레오티드가 표지를 포함하는 것인 방법.
  24. 제23항에 있어서, 표지가 발광 표지를 포함하는 것인 방법.
  25. 제24항에 있어서, 발광 표지가 염료인 방법.
  26. 제1항에 있어서, 폴리머라제가 양자점에 부착되는 것인 방법.
  27. 제1항에 있어서, 단계 a)에서 복수의 폴리뉴클레오티드가 표면에 결합되는 것인 방법.
  28. 제1항에 있어서, 검출이 전자기 에너지에 의한 여기를 포함하는 것인 방법.
  29. 제28항에 있어서, 검출이 레이저를 이용한 여기를 포함하는 것인 방법.
  30. 제29항에 있어서, 레이저가 펄스되는 것인 방법.
  31. 제1항에 있어서, 복수의 폴리뉴클레오티드가 헤어핀 어댑터를 포함하는 것인 방법.
  32. 제1항에 있어서, 복수의 폴리뉴클레오티드가 원형인 방법.
  33. 제1항에 있어서, 단계 a-c가 적어도 3회 반복되는 것인 방법.
  34. 제1항에 있어서, 단계 a-c가 적어도 20회 반복되는 것인 방법.
  35. 제1항에 있어서, 단계 a-c가 10분 이내에 실시되는 것인 방법.
  36. 제1항에 있어서, 단계 c가 5분 이내에 실시되는 것인 방법.
  37. 폴리뉴클레오티드 서열분석 방법으로서,
    a) 단일 분자 서열분석을 위한 복수의 유전자좌를 포함하는 표면 상의 복수의 폴리뉴클레오티드를 서열분석하는 단계;
    b) 상기 표면에서 폴리뉴클레오티드를 제거하는 단계; 및
    c) 단계 a-b를 반복하여 폴리뉴클레오티드를 서열분석하는 단계
    를 포함하며, 여기서 적어도 1 메가바이트의 서열분석 데이터가 표면 상의 복수의 유전자좌 중 150,000개 이하의 유전자좌로부터 1시간 이내에 획득되는 것인 서열분석 방법.
  38. 제37항에 있어서, 적어도 1 기가바이트의 서열분석 데이터가 표면 상의 복수의 유전자좌 중 150,000개 이하의 유전자좌로부터 1시간 이내에 획득되는 것인 방법.
  39. 제37항에 있어서, 적어도 1 테라바이트의 서열분석 데이터가 표면 상의 복수의 유전자좌 중 150,000개 이하의 유전자좌로부터 1시간 이내에 획득되는 것인 방법.
  40. 제37항에 있어서, 1 메가바이트 내지 1 제타바이트의 서열분석 데이터가 표면 상의 복수의 유전자좌 중 150,000개 이하의 유전자좌로부터 1시간 이내에 획득되는 것인 방법.
  41. 제37항에 있어서, 복수의 폴리뉴클레오티드가 적어도 1Gb의 디지털 정보를 인코딩하는 방법.
  42. 디지털 정보 항목을 인코딩하는 방법으로서,
    a) 정보 항목을 디지털 서열로서 제공하는 단계;
    b) 디지털 서열을 핵산 서열로서 인코딩하는 단계; 및
    c) 제1항 내지 제36항 중 어느 한 항의 복수의 폴리뉴클레오티드를 생성하는 단계
    를 포함하는 인코딩 방법.
  43. 디지털 정보 항목을 디코딩하는 방법으로서,
    a) 제1항 내지 제36항 중 어느 한 항의 방법을 사용하여 복수의 폴리뉴클레오티드의 핵산 서열을 얻는 단계;
    b) 상기 핵산 서열을 하나 이상의 디지털 서열로 디코딩하는 단계; 및
    c) 하나 이상의 디지털 서열을 사용하여 디지털 정보 항목을 판독하는 단계
    를 포함하는 디코딩 방법.
  44. 핵산 서열분석용 장치로서,
    (a) 복수의 유전자좌를 포함하는 표면을 포함하는 고체 지지체;
    (b) 유전자좌의 적어도 일부를 덮고 있는 결합 모이어티로서, 하나 이상의 폴리뉴클레오티드, 폴리머라제, 프라이머, 및 이들의 임의 조합의 복합체에 결합하도록 구성되고, 표면은 재사용 가능한 것인 결합 모이어티; 및
    (c) 폴리머라제에 의해 첨가된 하나 이상의 염기의 정체를 식별하도록 구성되어 있는 검출기
    를 포함하는 장치.
  45. 제44항에 있어서, 표면이 결합 모이어티를 제거하지 않고 재사용 가능한 것인 장치.
  46. 제44항에 있어서, 표면이 화학적 변형 없이 재사용 가능한 것인 장치.
  47. 제44항에 있어서, ㎟당 적어도 100,000개의 유전자좌를 포함하는 장치.
  48. 제44항에 있어서, ㎟당 적어도 1,000,000개의 유전자좌를 포함하는 장치.
  49. 제44항에 있어서, ㎟당 100,000개 내지 10억개의 유전자좌를 포함하는 장치.
  50. 제44항에 있어서, 프라이머의 길이가 15 내지 50개 염기인 장치.
  51. 제44항에 있어서, 표면이 복수의 웰 또는 채널을 포함하는 것인 장치.
  52. 제44항에 있어서, 웰 또는 채널이 10 내지 200 ㎚의 가장 긴 선형 치수를 갖는 것인 장치.
  53. 제44항에 있어서, 하나 이상의 나노포어를 추가로 포함하는 장치.
  54. 제44항에 있어서, 표면이 실질적으로 평평한 표면인 장치.
  55. 제44항에 있어서, 고체 지지체가 유리, 실리콘, 또는 이들의 조합을 포함하는 것인 장치.
  56. 제44항에 있어서, 표면이 이에 부착된 복수의 폴리머라제를 포함하는 것인 장치.
  57. 제44항에 있어서, 표면이 이에 부착된 복수의 폴리뉴클레오티드를 포함하는 것인 장치.
  58. 제44항에 있어서, 표면이 2개 이상의 폴리뉴클레오티드, 폴리머라제, 또는 프라이머를 포함하는 복합체를 포함하는 것인 장치.
  59. 제44항에 있어서, 유전자좌의 적어도 1%가 폴리머라제, 폴리뉴클레오티드, 프라이머, 또는 이들의 임의의 조합의 복합체를 포함하는 것인 장치.
  60. 제44항에 있어서, 유전자좌의 적어도 30%가 폴리머라제, 폴리뉴클레오티드, 프라이머, 또는 이들의 임의의 조합의 복합체를 포함하는 것인 장치.
  61. 제44항에 있어서, 복합체가 공유 결합을 통해 부착되는 것인 장치.
  62. 제44항에 있어서, 복합체가 비공유 결합을 통해 부착되는 것인 장치.
  63. 제44항에 있어서, 복합체가 친화성 상호작용, 단백질, 올리고뉴클레오티드, 또는 열 방출성 연결을 통해 부착되는 것인 장치.
  64. 제44항에 있어서, 친화성 상호작용이 스트렙트아비딘-비오틴을 포함하는 것인 장치.
  65. 제44항에 있어서, 친화성 상호작용이 항체-항원 결합을 포함하는 것인 장치.
  66. 제44항에 있어서, 친화성 상호작용이 단백질-단백질 상호작용을 포함하는 것인 장치.
  67. 제44항에 있어서, 유체 인터페이스를 추가로 포함하는 장치.
  68. 제44항에 있어서, 유동 셀을 추가로 포함하는 장치.
  69. 제44항에 있어서, 유전자좌당 적어도 하나의 검출기를 포함하는 장치.
  70. 제44항에 있어서, 상기 검출기가 복수의 제로 모드 도파관을 포함하는 것인 장치.
  71. 제44항에 있어서, 검출기가 가시 파장, UV 파장, 또는 이들의 조합을 측정하도록 구성된 장치.
  72. 제44항에 있어서, 검출기가 형광을 측정하도록 구성된 것인 장치.
  73. 제44항에 있어서, 검출기가 전압 또는 전류의 변화를 측정하도록 구성된 것인 장치.
  74. 제44항에 있어서, 폴리뉴클레오티드 합성 장치를 추가로 포함하는 장치.
KR1020247016284A 2021-10-18 2022-10-17 연속 서열분석에 관한 방법 및 조성물 KR20240101595A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163256866P 2021-10-18 2021-10-18
US63/256,866 2021-10-18
PCT/US2022/046906 WO2023069367A1 (en) 2021-10-18 2022-10-17 Methods and compositions relating to continuous sequencing

Publications (1)

Publication Number Publication Date
KR20240101595A true KR20240101595A (ko) 2024-07-02

Family

ID=86056676

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020247016284A KR20240101595A (ko) 2021-10-18 2022-10-17 연속 서열분석에 관한 방법 및 조성물

Country Status (5)

Country Link
US (1) US20230127969A1 (ko)
EP (1) EP4419713A1 (ko)
KR (1) KR20240101595A (ko)
CN (1) CN118786225A (ko)
WO (1) WO2023069367A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12091777B2 (en) 2019-09-23 2024-09-17 Twist Bioscience Corporation Variant nucleic acid libraries for CRTH2
US11970697B2 (en) 2020-10-19 2024-04-30 Twist Bioscience Corporation Methods of synthesizing oligonucleotides using tethered nucleotides
US12134656B2 (en) 2021-11-18 2024-11-05 Twist Bioscience Corporation Dickkopf-1 variant antibodies and methods of use

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08506664A (ja) * 1993-02-01 1996-07-16 セック,リミテッド Dna配列決定の方法および装置
EP2689028B1 (en) * 2011-03-23 2017-08-30 Pacific Biosciences Of California, Inc. Isolation of polymerase-nucleic acid complexes and loading onto substrates
GB201501603D0 (en) * 2015-01-30 2015-03-18 Norwegian University Of Life Sciences And Hedmark University College Method and product
GB201502152D0 (en) * 2015-02-10 2015-03-25 Nuclera Nucleics Ltd Novel use
WO2016183289A1 (en) * 2015-05-12 2016-11-17 Wake Forest University Health Services Identification of genetic modifications
US10597643B2 (en) * 2016-04-29 2020-03-24 Omniome, Inc. Polymerases engineered to reduce nucleotide-independent DNA binding
US10400272B1 (en) * 2018-04-26 2019-09-03 Omniome, Inc. Methods and compositions for stabilizing nucleic acid-nucleotide-polymerase complexes
CN112567048A (zh) * 2018-07-24 2021-03-26 欧姆尼欧美公司 三元复合物种类的连续形成

Also Published As

Publication number Publication date
EP4419713A1 (en) 2024-08-28
US20230127969A1 (en) 2023-04-27
CN118786225A (zh) 2024-10-15
WO2023069367A1 (en) 2023-04-27

Similar Documents

Publication Publication Date Title
US12086722B2 (en) DNA-based digital information storage with sidewall electrodes
US20230127969A1 (en) Methods and compositions relating to continuous sequencing
US20220032256A1 (en) Devices and methods for light-directed polymer synthesis
US11562103B2 (en) Nucleic acid based data storage
US20220064206A1 (en) Devices and methods for synthesis
KR102723464B1 (ko) 핵산 기반 데이터 저장
KR20180058772A (ko) 핵산 합성을 위한 가요성 기판
US20230175062A1 (en) Nanoelectric devices and use thereof
KR20240101616A (ko) 합성 장치 및 방법
WO2023196499A1 (en) Substrate cleavage for nucleic acid synthesis
Chen et al. Controlling oligonucleotide surface density in light-directed DNA array fabrication
Mandal et al. Single-molecule topochemical analyses for large-scale multiplexing tasks
US20240378459A1 (en) Dna-based digital information storage with sidewall electrodes
Neumann et al. Temperature and time-resolved total internal reflectance fluorescence analysis of reusable DNA hydrogel chips
WO2024163733A1 (en) Electrochemical synthesis with redox stable nucleotides
JP2024542040A (ja) 合成のためのデバイスおよび方法
EA039806B1 (ru) Хранение цифровой информации на основе днк
CN118647733A (zh) 纳米电子装置及其应用