KR20220034054A - 출현에 의한 시퀀싱 - Google Patents

출현에 의한 시퀀싱 Download PDF

Info

Publication number
KR20220034054A
KR20220034054A KR1020217042217A KR20217042217A KR20220034054A KR 20220034054 A KR20220034054 A KR 20220034054A KR 1020217042217 A KR1020217042217 A KR 1020217042217A KR 20217042217 A KR20217042217 A KR 20217042217A KR 20220034054 A KR20220034054 A KR 20220034054A
Authority
KR
South Korea
Prior art keywords
oligonucleotide probe
nucleic acid
probe species
species
target nucleic
Prior art date
Application number
KR1020217042217A
Other languages
English (en)
Inventor
칼림 미르
Original Assignee
엑스게놈스 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/425,929 external-priority patent/US11427867B2/en
Application filed by 엑스게놈스 코포레이션 filed Critical 엑스게놈스 코포레이션
Publication of KR20220034054A publication Critical patent/KR20220034054A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6818Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0019RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/113Nucleic acid detection characterized by the use of physical, structural and functional properties the label being electroactive, e.g. redox labels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

발명은 하나 이상의 중합체의 서열이 중합체(들)에 대한 분자 프로브의 레퍼토리의 결합 상호작용의 창발적 특성을 통해 결정되는 중합체를 시퀀싱하는 방법이다.

Description

출현에 의한 시퀀싱
관련 출원에 대한 교차 참고
본 출원은 "출현에 의한 시퀀싱"의 명칭으로 2017년 11월 29일에 출원된 미국 특허 출원 번호 62/591,850에 대한 우선권을 주장하는 "출현에 의한 시퀀싱"의 명칭으로 2018년 11월 29일에 출원된 미국 특허 출원 번호 16/205,155의 일부 계속이며, 이것은 참고로 본 명세서에 포함된다.
기술 분야
본 개시내용은 일반적으로 하나 이상의 폴리뉴클레오티드에 대한 프로브의 일시적인 결합을 통해 핵산을 시퀀싱하기 위한 시스템 및 방법에 관한 것이다.
DNA 시퀀싱은 겔 전기영동-기반 방법인: 디데옥시 사슬 종결 방법(예를 들어, Sanger 외, Proc. Natl. Acad. Sci. 74:5463-5467, 1977) 및 화학적 분해 방법(예를 들어, Maxam 외, Proc. Natl. Acad. Sci. 74:560-564, 1977)으로 처음 실현되었다. 뉴클레오티드를 시퀀싱하는 이들 방법은 시간-소모적이고 비용이 많이 드는 둘 모두였다. 그럼에도 불구하고, 전자는 10년이 넘는 시간과 수억 달러가 소요되었음에도 처음으로 인간 게놈의 시퀀싱을 이끌어냈다.
개인맞춤형 건강 관리의 꿈이 점점 더 실현됨에 따라, 개별 인간 게놈을 시퀀싱하기 위한 저렴한 대규모 방법에 대한 요구가 증가하고 있다(Mir, Sequencing Genomes: From Individuals to Populations, Briefings in Functional Genomics and Proteomics, 8: 367-378, 2009). 겔 전기영동을 피하는 (그리고 이어서 덜 비싼) 여러 시퀀싱 방법이 "차세대 시퀀싱"으로 개발되었다. 가역적 종결자를 사용하는 이러한 시퀀싱 방법 중 하나(Illumina Inc.에 의해 실행됨)가 지배적이다. 가장 진화된 형태의 Sanger 시퀀싱과 현재 지배적인 Illumina 기술에 사용되는 검출 방법은 형광을 포함한다. 단일 뉴클레오티드 삽입을 감지하는 다른 가능한 수단은 양성자 방출을 사용한 감지를 포함한다(예를 들어, 전계 효과 트랜지스터, 나노포어를 통한 이온 전류 및 전자 현미경을 통한 감지. Illumina의 화학은 가역적 종결자를 사용한 뉴클레오티드의 주기적 부가를 포함하며(Canard 외, Metzker Nucleic Acids Research 22:4259-4267, 1994), 이는 형광성 표지를 담지한다(Bentley 외, Nature 456:53-59, 2008). Illumina 시퀀싱은 단일 게놈 분자를 클론으로 증폭하는 것으로 시작하고 클러스터로 그 다음 클론으로 증폭되는 라이브러리로 표적 게놈을 변환하기 위해 실질적인 선행 샘플 처리가 필요하다.
그러나, 시퀀싱 이전에 증폭에 대한 필요성을 회피하는 몇몇 방법이 이후 업계에 나타났다. 두 가지 새로운 방법은 단일 DNA 분자에서 합성에 의한 형광 시퀀싱(SbS)을 수행한다. HelicosBio(현재 SeqLL)로부터의 첫 번째 방법은 가역적 종료로 단계적 SbS를 수행한다(Harris 외, Science, 320:106-9, 2008). Pacific Biosciences로부터의 SMRT 시퀀싱인 두 번째 방법은 뉴클레오티드를 합체하는 반응의 자연 이탈기인 말단 인산염 상에 표지를 사용하며, 이는 시퀀싱이 연속적으로 그리고 시약을 교환할 필요 없이 수행되도록 허용한다(예를 들어, Levene 외, Science 299:682-686, 2003 및 Eid 외, Science, 323:133-8, 2009). Pacific Bioscience 시퀀싱에 대한 다소 유사한 접근방식은 광학 방법을 통하기보다는 나노포어를 통해 SbS를 검출함에 의해 Genia(현재 Roche의 일부)에서 개발 중인 방법이다.
가장 일반적으로 사용되는 시퀀싱 방법은 판독 길이가 제한되어 있어, 시퀀싱 비용과 수득한 판독을 조합하는 어려움 둘 모두가 증가한다. Sanger 시퀀싱에 의해 얻어진 판독 길이는 1000개 염기 범위에 있다(예를 들어, Kchouk 외, Biol. Med. 9:395, 2017). Roche 454 시퀀싱 및 Ion Torrent 둘 모두는 수백개 염기 범위의 판독 길이를 가지고 있다. 처음에 약 25개 염기의 판독으로 시작된 Illumina 시퀀싱은 현재 전형적으로 150-300개 염기쌍 판독이다. 그러나, 판독 길이의 각 염기에 대해 새로운 시약을 공급되어야 하므로 25개가 아닌 250개 염기를 시퀀싱하려면 10배 더 많은 시간과 10배 더 많은 값비싼 시약이 필요하다. 상업용 시스템에서 가능한 가장 긴 판독 길이는 Oxford Nanopores Technology(ONT)로부터의 나노포어 가닥 시퀀싱 및 Pacific Bioscience(PacBio) 시퀀싱에 의해 얻어진다(예를 들어, Kchouk 외, Biol. Med. 9:395, 2017). 매우 드물게 전자는 길이가 수백 킬로베이스인 판독을 얻을 수 있는 반면 후자는 일상적으로 길이가 평균 약 10,000개 염기인 판독을 갖는다(예를 들어, Laver 외, Biomol. Det. Quant. 3:1 -8, 2015).
ONT 및 PacBio 시퀀싱 외에도, 시퀀싱 기술 그 자체가 아니라 더 긴 판독을 구축하기 위한 스캐폴드를 제공하기 위해 Illumina 짧은 판독 시퀀싱 기술을 보완하는 샘플 준비 접근방식인 다수의 접근방식이 존재한다. 이 중 하나는 10X Genomics에 의해 개발된 액적 기반 기술로, 그것은 액적 내에서 100-200kb 단편(예를 들어, 추출 후 단편의 평균 길이 범위)을 단리하고 각각 그것이 유래하는 100-200kb에 고유한 서열 식별자 태그를 함유하는 더 짧은 길이 단편의 라이브러리로 처리하여, 다수의 액적으로부터 게놈을 시퀀싱할 때 ~50-200Kb 버킷으로 펼쳐질 수 있다(Goodwin 외, Nat. Rev. Genetics 17:333-351, 2016). 닉킹 엔도뉴클레아제에 대한 노출을 통해 DNA에서 닉을 늘리고 유도하는 또 다른 접근방식이 Bionano Genomics에 의해 개발되었다. 이 방법은 분자의 지도 또는 스캐폴드를 제공하기 위해 닉킹의 지점을 형광으로 검출한다. 이 방법은 현재 게놈을 조립하는 데 도움이 될 만큼 충분히 높은 밀도를 갖도록 개발되지 않았지만, 그럼에도 불구하고 게놈의 직접적인 시각화를 제공하고 큰 구조적 변이를 검출하고 긴-범위 단상형을 결정할 수 있다.
다양한 시퀀싱 방법이 개발되고 시퀀싱 비용이 감소하는 일반적인 경향에도 불구하고, 인간 게놈의 크기는 환자에게 계속해서 높은 시퀀싱 비용을 초래한다. 개별 인간 게놈은 46개 염색체로 구성되며, 그 중 가장 짧은 것은 약 50 메가베이스이고 가장 긴 것은 250 메가베이스이다. NGS 시퀀싱 방법은 분석에 필요한 시간을 실질적으로 증가시킬 수 있는 참조 게놈에 대한 의존도를 포함하여 성능에 영향을 미치는 많은 문제를 여전히 가지고 있다(예를 들어, Kulkarni 외, Comput Struct Biotechnol J. 15:471-477, 2017에서 논의됨).
상기 배경을 감안할 때, 당업계에서 필요한 것은 시약 및 시간의 사용에 효율적이고 정확성의 손실 없이 긴 단상형-해석 판독을 제공하는 독립형 시퀀싱 기술을 제공하기 위한 장치, 시스템 및 방법이다.
이 배경기술 부문에 개시된 정보는 단지 일반적인 배경기술에 대한 이해를 향상시키기 위한 것이고 이 정보가 당업계에서 숙련자에게 이미 알려진 선행 기술을 형성한다는 승인 또는 임의의 제안 형태로 받아들여서는 안된다.
본 개시내용은 개선된 핵산 시퀀싱 기술을 제공하기 위한 장치, 시스템 및 방법에 대한 당업계에서의 요구를 다룬다. 하나의 광범위일 양태에서, 본 개시내용은 분자 프로브를 이중-가닥 표적 분자의 하나 이상의 단위에 결합함에 의해 다중-단위 표적 분자의 적어도 하나의 단위를 식별하는 방법을 포함한다. 본 개시내용은 이중-가닥 표적 분자와 분자 프로브의 하나 이상 종의 단일 분자 상호작용의 검출에 기반한다. 일부 실시형태에서, 프로브는 표적 분자의 적어도 하나의 단위에 일시적으로 결합한다. 일부 실시형태에서, 프로브는 표적 분자의 적어도 하나의 단위에 반복적으로 결합한다. 일부 실시형태에서, 분자 실체는 거대분자, 표면 또는 매트릭스 상에 나노미터 정확도로 국지화된다.
일 양태에서, 핵산을 시퀀싱하는 방법이 제공된다. 방법은 (a) 테스트 기판 상에 선형화된 연장된/연신된 형태로 핵산을 고정하고 이에 의해 고정된 연장된/연신된 핵산을 형성하는 것을 포함한다. 방법은 (b) 고정된 연장된/연신된 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 노출시킴에 의해 진행되며, 여기서 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은, 하나의 정의된 뉴클레오티드 및 하나 이상의 축퇴 위치를 포함하는 미리결정된 길이의 프로브 종의 라이브러리이다. 각각의 정의된 뉴클레오티드는 A, C, G, T 염기의 세트에서 선택된다. 각각의 축퇴 위치는 A, C, G, T 염기 또는 보편적인 염기 유사체의 혼합물을 포함한다. 노출 (b)는 각각의 올리고뉴클레오티드 프로브 종의 개별 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 핵산의 하나 이상의 부분에 일시적이고 가역적으로 결합하고, 이에 의해 광학 활성의 각각의 경우에 대해 증가를 제공할 수 있는 조건하에서 발생한다. 방법은 (c) 이미징 장치를 사용하여 노출 (b) 동안 또는 후에 발생하는 각각의 광학 활성의 각각의 경우의 테스트 기판 상의 위치를 측정함에 의해 진행된다. 방법은 (d) 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복하고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득함에 의해 진행된다. 테스트 기판 상의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종의 세트에서의 올리고뉴클레오티드 프로브 종에 상응한다. 방법은 (e) 복수의 위치 세트에 의해 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정함에 의해 계속된다.
본 개시내용의 또 다른 양태에서, 핵산을 시퀀싱하는 방법이 제공된다. 이 추가 방법은 (a) 테스트 기판 상에 선형화된 연장된/연신된 형태로 핵산을 고정하고 이에 의해 고정된 연장된/연신된 핵산을 형성하는 것을 포함한다. 방법은 (b) 고정된 연장된/연신된 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 노출시킴에 의해 계속된다. 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 2개 이상의 정의된 뉴클레오티드 위치 및 하나 이상의 축퇴 위치를 포함하는 미리결정된 길이의 프로브 종의 라이브러리이다. 각각의 정의된 뉴클레오티드 위치는 A, C, G, T 염기를 포함한다. 각 축퇴 위치는 A, C, G, T 염기의 혼합물 또는 보편적인 염기 유사체를 포함한다. 노출 (b)는 각각의 올리고뉴클레오티드 프로브 종의 개별 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 핵산의 하나 이상의 부분에 일시적이고 가역적으로 결합하고, 이에 의해 광학 활성의 각각의 경우에 대해 증가를 제공할 수 있는 조건하에서 발생한다. 방법은 (c) 이미징 장치를 사용하여 노출 (b) 동안 또는 후에 발생하는 각각의 광학 활성의 각각의 경우의 테스트 기판 상의 위치를 측정함에 의해 진행된다. 방법은 (d) 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복하고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득함에 의해 계속된다. 올리고뉴클레오티드 프로브 종 세트에서의 올리고뉴클레오티드 프로브 종에 상응하는 테스트 기판 상의 위치의 각각의 각 세트. 방법은 (e) 복수의 위치 세트에 의해 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정함에 의해 결론지어진다.
본 개시내용의 또 다른 양태에서, 핵산을 시퀀싱하는 방법이 제공된다. 이 추가 방법은 (a) 테스트 기판 상에 선형화된 연장된/연신된 형태로 핵산을 고정하고 이에 의해 고정된 연장된/연신된 핵산을 형성하는 것을 포함한다. 방법은 (b) 고정된 연장된/연신된 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 노출시킴에 의해 진행된다. 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 2개 이상의 정의된 뉴클레오티드 위치 및 하나 이상의 축퇴 위치를 포함하는 미리결정된 길이의 프로브 종의 라이브러리이다. 각각의 정의된 뉴클레오티드 위치는 A, C, G, T 염기의 세트 중 하나를 포함한다. A, C, G, T 염기의 혼합물 또는 보편적인 염기 유사체를 포함하는 각 축퇴 위치. 노출 (b)는 각각의 올리고뉴클레오티드 프로브 종의 개별 프로브이 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 핵산의 하나 이상의 부분에 안정적으로 결합하고 이에 의해 조명 시 고정된 핵산의 하나 이상의 부분에 상응하는 기판 상의 하나 이상의 위치에서의 광학 활성의 각각의 경우에 대해 증가를 제공할 수 있는 조건하에서 발생한다. 방법은 (c) 광학 활성의 경우를 탈색하여 광학 활성의 경우의 단계별 손실이 이미징 장치를 사용하여 측정/기록되도록 함에 의해 진행된다. 방법은 (d) 고정된 연장된/연신된 핵산을 결합된 올리고뉴클레오티드 프로브가 결합 비결합되도록 하는 조건에 노출시키는 것; 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복하고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 얻는 것에 의해 계속된다. 올리고뉴클레오티드 프로브 종의 세트에서 올리고뉴클레오티드 프로브 종에 상응하는 테스트 기판 상의 각각의 각 위치 세트. 방법은 (d) 단일 분자 국지화 알고리즘을 사용하여 광학 활성의 각 경우의 나노미터/미세-조정된 위치를 계산하고, (e) 복수의 위치 세트에 의해 표시된 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정함에 의해 진행된다.
본 개시내용의 또 다른 양태는 핵산을 시퀀싱하는 방법을 제공한다. 방법은 (a) 핵산을 테스트 기판 상에 고정/이동억제화하여 고정/이동억제된 핵산을 형성하는 것을 포함한다. 방법은 (b) 고정/이동억제된 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 노출시키는 것으로 진행된다. 노출 (b)는 각각의 올리고뉴클레오티드 프로브 종의 개별 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정/이동억제된 핵산의 하나 이상의 부분에 결합하고, 이에 의해 광학 활성의 각각의 경우에 대해 증가를 제공할 수 있는 조건하에서 발생한다. 방법은 (c) 이미징 장치를 사용하여 노출 (b) 동안 또는 후에 발생하는 각각의 광학 활성의 각각의 경우의 테스트 기판 상의 위치를 측정함에 의해 진행된다. 방법은 (d) 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복하고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득함에 의해 계속된다. 올리고뉴클레오티드 프로브 종의 세트에서 올리고뉴클레오티드 프로브 종에 상응하는 테스트 기판 상의 각각의 각 위치 세트. 방법은 (e) 복수의 위치 세트에 의해 표시된 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정함에 의해 결론지어진다.
다른 실시형태는 본 명세서에 기술된 방법과 연관된 시스템, 휴대용 소비자 장치, 및 컴퓨터 판독가능 매체에 대한 것이다.
본 명세서에 개시된 바와 같이, 적용가능한 경우 본 명세서에 개시된 임의의 실시형태는 임의의 양태에 적용될 수 있다.
본 개시내용의 추가적인 양태 및 이점은 본 개시내용의 예시적인 실시형태만이 도시되고 설명되는 다음의 상세한 설명으로부터 당업자에게 용이하게 명백해질 것이다. 인식되는 바와 같이, 본 개시내용은 다른 및 상이한 실시형태가 가능하고, 그의 몇몇 세부사항은 개시내용으로부터 전혀 벗어남이 없이 다양한 명백일 측면에서 수정될 수 있다. 따라서, 도면 및 설명은 본질적으로 예시적인 것으로 간주되어야 하고 제한적인 것으로 간주되어서는 안된다.
도 1a 및 1b는 결합 이벤트에 참여하는 다중 프로브를 갖는 중합체, 결합 이벤트의 국지화 및 서열 식별에 관한 정보를 수집하고 저장한 다음 추가로 분석을 수행하여 본 개시내용의 다양한 실시형태에 따른 중합체 서열을 결정하기 위한 컴퓨터 저장 매체를 포함하는 예시적인 시스템 토폴로지를 집합적으로 예시한다.
도 2a 및 2b는 본 개시내용의 다양한 실시형태에 따라 표적 중합체의 서열 및/또는 구조적 특성을 결정하기 위한 방법의 특징 및 공정의 흐름도를 집합적으로 제공한다.
도 3은 본 개시내용의 다양한 실시형태에 따른 표적 중합체의 서열 및/또는 구조적 특성을 결정하기 위한 추가 방법의 특징 및 공정의 흐름도를 제공한다.
도 4는 본 개시내용의 다양한 실시형태에 따른 표적 중합체의 서열 및/또는 구조적 특성을 결정하기 위한 추가 방법의 특징 및 공정의 흐름도를 제공한다.
도 5a, 5b 및 5c는 본 개시내용의 다양한 실시형태에 따른 폴리뉴클레오티드에 대한 프로브의 일시적인 결합의 예를 집합적으로 예시한다.
도 6a 및 6b는 본 개시내용의 다양한 실시형태에 따른 표적 폴리뉴클레오티드에 결합하는 길이가 상이한 k-mer의 프로브의 예를 집합적으로 예시한다.
도 7a, 7b 및 7c는 본 개시내용의 다양한 실시형태에 따른 올리고뉴클레오티드 세트의 연속적인 주기를 갖는 기준 올리고를 사용하는 예를 집합적으로 예시한다.
도 8a, 8b 및 8c는 본 개시내용의 다양한 실시형태에 따른 단일 기준 분자에 별개의 프로브 세트를 적용하는 예를 집합적으로 예시한다.
도 9a, 9b 및 9c는 본 개시내용의 다양한 실시형태에 따른, 다중 유형의 프로브가 사용되는 경우의 일시적인 결합의 예를 집합적으로 예시한다.
도 10a 및 10b는 수집된 다수의 일시적인 결합 이벤트가 본 개시내용의 다양한 실시형태에 따라 달성될 수 있는 프로브의 국지화의 정도와 상관된다는 예를 집합적으로 예시한다.
도 11a 및 도 11b는 본 개시내용의 다양한 실시예에 따른 타일링 프로브의 예를 집합적으로 예시한다.
도 12a, 12b 및 12c는 본 개시내용의 다양한 실시형태에 따른 직접적으로 표지된 프로브의 일시적인 결합의 예를 집합적으로 예시한다.
도 13a, 13b 및 13c는 본 개시내용의 다양한 실시형태에 따른 개재하는 염료의 존재에서 일시적인 프로브 결합의 예를 집합적으로 예시한다.
도 14a, 14b, 14c, 14d, 및 14e는 본 개시내용의 다양한 실시형태에 따른 상이한 프로브 표지화 기술의 예를 집합적으로 예시한다.
도 15는 본 개시내용의 다양한 실시형태에 따른 변성된 다듬은 이중-가닥 DNA 상의 프로브의 일시적인 결합의 예를 예시한다.
도 16a 및 16b는 본 개시내용의 다양한 실시형태에 따른 세포 용해 및 핵산 이동억제화와 신장의 예를 집합적으로 예시한다.
도 17은 본 개시내용의 다양한 실시형태에 따른 단일 세포를 포획하고 선택적으로 세포로부터 핵산의 추출, 신장 및 시퀀싱을 제공하는 예시적인 마이크로유체 구조를 예시한다.
도 18은 본 개시내용의 다양한 실시형태에 따른 개별 세포에 별개의 ID 태그를 제공하는 예시적인 마이크로유체 구조를 예시한다.
도 19는 본 개시내용의 다양한 실시형태에 따른 개별 세포로부터 폴리뉴클레오티드를 시퀀싱하는 예를 예시한다.
도 20a 및 20b는 본 개시의 다양한 실시예에 따른 일시적인 프로브 결합의 이미징을 수행하기 위한 예시적인 장치 레이아웃을 집합적으로 예시한다.
도 21은 본 개시내용의 다양한 실시형태에 따른 에어 갭에 의해 분리된 시약을 함유하는 예시적인 모세관화를 예시한다.
도 22a, 22b, 22c, 22d, 및 22e는 본 개시내용의 다양한 실시형태에 따른 형광의 예를 집합적으로 예시한다.
도 23a, 23b 및 23c는 본 개시내용의 다양한 실시형태에 따른 형광의 예를 집합적으로 예시한다.
도 24는 본 개시내용의 다양한 실시형태에 따른 합성적 변성된 이중-가닥 DNA에 대한 일시적인 결합을 예시한다.
도 25a 및 25b는 "풋프린트" 시퀀싱의 2개 주기를 예시하며 여기서 5-mer의 이 경우에, 5개 주기가 사용되며 각 주기는 올리고뉴클레오티드의 '풋프린트' 또는 길이를 따라 정의된 상이한 단일 뉴클레오티드 위치를 가지고 나머지 뉴클레오티드는 각 위치에서 모든 4개 뉴클레오티드의 라이브러리 또는 각 축퇴 위치에서 보편적인 뉴클레오티드 유사체(예를 들어, 니트로인돌, 니트로피롤 또는 이노신 등)를 포함하는 축퇴이다. 각 정의된 염기는 동일한 혼합에 추가될 때 각각 서로 구별될 수 있는 4개 별도의 표지 중 하나에 연결되는 다른 색상으로 표시된다. 도면에서 위치 1은 제1 주기에서 정의되고 위치 2는 제2 주기에서 정의된다. 이들 주기를 통해 (올리고의 풋프린트 하에서) 표적에서 위치 1, 2, 3, 4, 5의 정체성이 연속적 주기에서 획득된다. 일부 실시형태에서, 표적에서 조사된 염기의 정체성은 올리고에서 상응하는 정의된 염기에 상보적이다. 일부 이러한 실시형태에서 국지화는 올리고 결합 풋프린트의 위치를 정확히 나타내기에 충분할 필요가 있으며, 풋프린트 내의 위치는 색상 또는 주기 번호와 같은 코드에 의해 정의된다.
도 26은 단지 하나의 뉴클레오티드만 정의되고 4개의 다른 정의된 뉴클레오티드 모두가 다른 색상으로 표시되는 경우를 개략적으로 예시한다. 일부 실시형태에서 상이한 색상은 상이한 형광단 또는 상이한 첨가 주기를 나타낸다. 색상이 다른 경우 전반적인 시퀀싱 과정은 시약 교환에 대한 필요 없이 단일 균질한 또는 원-포트 반응으로 수행될 수 있다. 이 접근방식에서 DNA의 가닥은 표면에서 연장/연신되고 짧은 올리고는 용액에 추가되어 그 상보적인 위치에 결합된다.
도 27은 각 측면 상의 4개 축퇴 위치에 의해 측접된 3개 정의된 염기를 갖는 올리고인, 5' cy3 NNgGcNN(올리고 명칭: 3004-3mer)의 결합을 예시한다. 연신된 DNA는 0.5M NaoH로 20분 동안 변성시킨 람다파지이다. 결합 완충액은 4xSSC 및 0.1% 트윈 20이다; 결합은 4도씨에서 수행되었고 이미징은 실온에서 수행되었다.
이제 실시형태를 상세히 참조할 것이며, 그 예는 첨부 도면에 예시되어 있다. 다음의 상세한 설명에서, 본 개시내용의 완전한 이해를 제공하기 위해 다수의 특정 세부사항이 제시된다. 그러나, 본 개시내용이 이들 특정한 세부사항 없이 실시된다는 것은 당업자에게 명백할 것이다. 다른 예에서, 잘 알려진 방법, 절차, 구성요소, 회로 및 네트워크는 실시형태의 양태를 불필요하게 모호하게 하지 않도록 하기 위해 상세하게 설명되지 않았다.
정의
본 명세서에서 사용된 용어는 단지 특정한 실시형태를 설명하기 위한 것이고 본 발명을 한정하려는 의도가 아니다. 설명 및 첨부된 특허청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥이 명백하게 달리 나타내지 않는 한 복수 형태도 포함하도록 의도된다. 또한 본 명세서에서 사용된 용어 "및/또는"은 연관된 나열된 항목 중 하나 이상의 임의의 및 모든 가능한 조합을 지칭하고 포함하는 것으로 이해될 것이다. 본 명세서에서 사용될 때 "포함한다" 및/또는 "포함하는"이라는 용어는 명시된 특징, 정수, 단계, 작동, 요소 및/또는 구성요소의 존재를 지정하지만 하나 이상의 다른 특징, 정수, 단계, 작동, 요소, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는다는 것이 추가로 이해될 것이다.
본 명세서에 사용된 바와 같이, 용어 "만약"은 문맥에 따라 "때" 또는 "시" 또는 "결정에 응답하여" 또는 "검출에 응하여"를 의미하는 것으로 간주된다. 유사하게, "결정된 경우" 또는 "[명시된 조건 또는 이벤트]가 검출된 경우"라는 문구는 문맥에 따라 "결정시" 또는 "결정에 응하여" 또는 "[명시된 조건 또는 이벤트]를 검출시" 또는 "[명시된 조건 또는 이벤트] 감지에 대한 응하여"를 의미하는 것으로 간주된다.
용어 "또는"은 배타적인 "또는"보다는 포괄적인 "또는"을 의미하도록 의도된다. 즉, 달리 명시되지 않거나 문맥에서 명확하지 않은 한, "X는 A 또는 B를 이용한다"라는 문구는 임의의 자연적인 포괄적인 순열을 의미하는 것으로 의도된다. 즉, "X는 A 또는 B를 이용한다"라는 문구는 다음 경우 중 하나에 의해 충족된다. X는 A를 이용한다; X는 B를 이용한다; 또는 X는 A와 B를 모두 이용한다. 부가하여 본 출원 및 첨부된 청구범위에 사용된 관사 "a" 및 "an"은 달리 명시되지 않거나 단수형에 대해 지칭된 것으로 문맥상 명백하지 않는 한 일반적으로 "하나 이상"을 의미하는 것으로 해석되어야 한다.
또한 용어 제1, 제2 등이 본 명세서에서 다양한 요소를 설명하기 위해 사용되지만, 이들 요소는 이들 용어에 의해 제한되어서는 안된다는 것이 이해될 것이다. 이들 용어는 한 요소를 다른 요소와 구별하는 데만 사용된다. 예를 들어, 본 개시내용의 범주를 벗어나지 않으면서 제1 필터는 제2 필터로 명명될 수 있고, 유사하게 제2 필터도 제1 필터로 명명될 수 있다. 제1 필터와 제2 필터는 둘 모두 필터이지만 동일한 필터는 아니다.
본 명세서에 사용된 바와 같이, 용어 "약" 또는 "대략"은 값이 측정되거나 결정되는 방식, 예를 들어 측정 시스템의 한계에 부분적으로 의존할 수 있는, 당업계의 통상인에 의해 결정된 특정 값에 대해 허용가능한 오차 범위 내를 의미할 수 있다. 예를 들어, "약"은 당업계의 관행에 따라 1 또는 1 초과 표준 편차 이내를 의미할 수 있다. "약"은 주어진 값의 ±20%, ±10%, ±5% 또는 ±1%의 범위를 의미할 수 있다. 용어 "약" 또는 "대략"은 값의 5배 이내, 또는 2배 이내인 정도의 규모 이내를 의미할 수 있다. 특정 값이 출원 및 청구범위에 기술되어 있는 경우, 달리 언급되지 않는 한 용어 "약"은 특정 값에 대해 허용가능한 오차 범위 내를 의미하는 것으로 가정되어야 한다. 용어 "약"은 당업계의 통상인에 의해 일반적으로 이해되는 의미를 가질 수 있다. 용어 "약"은 ±10%를 나타낼 수 있다. 용어 "약"은 ±5%를 나타낼 수 있다.
본 명세서에 사용된 용어 "핵산", "핵산 분자" 및 "폴리뉴클레오티드"는 상호교환적으로 사용된다. 용어는 데옥시리보핵산(DNA, 예를 들어, 상보적 DNA(cDNA), 게놈 DNA(gDNA) 등), 리보핵산(RNA, 예를 들어, 메시지 RNA(mRNA), 짧은 억제 RNA(siRNA), 리보솜 RNA(rRNA), 전이 RNA(tRNA), microRNA, 태아 또는 태반에 의해 고도로 발현된 RNA 등) 및/또는 DNA 또는 RNA 유사체(예를 들어, 합성 염기 유사체 및 또는 자연 발생(후성유전적으로 변형된) 염기 유사체, 당 유사체 및/또는 비-천연 백본 등), RNA/DNA 하이브리드 및 펩티드 핵산(PNA)과 같은 임의의 구성 형태의 핵산을 지칭할 수 있으며, 이들 모두는 단일-가닥 또는 이중-가닥 형태일 수 있다. 달리 제한되지 않는 한, 핵산은 천연 뉴클레오티드의 공지된 유사체를 포함할 수 있으며, 이들 중 일부는 자연 발생 뉴클레오티드와 유사한 방식으로 기능할 수 있다. 핵산은 본 명세서에 기술된 바와 같은 과정을 수행하는데 유용한 임의의 형태(예를 들어, 선형, 원형, 초나선형, 단일-가닥, 이중-가닥 등)일 수 있다. 일부 예에서, 핵산은 특정 실시형태에서 플라스미드, 파지, 자가 복제 서열(ARS), 중심체, 인공 염색체, 염색체, 또는 시험관내 또는 숙주 세포에서 복제 또는 복제될 수 있는 기타 핵산, 세포, 세포 핵 또는 세포의 세포질이거나 그로부터 유래한다. 일부 실시형태에서 핵산은 단일 염색체 또는 그의 단편(예를 들어, 이배체 유기체로부터 획득된 샘플의 하나의 염색체로부터의 핵산 샘플)으로부터 유래할 수 있다. 핵산 분자는 완전한 길이의 천연 폴리뉴클레오티드(예를 들어, 긴 비-코딩(lnc) RNA, mRNA, 염색체, 미토콘드리아 DNA 또는 폴리뉴클레오티드 단편)를 포함할 수 있다. 폴리뉴클레오티드 단편은 길이가 적어도 200개 염기일 수 있거나 길이가 적어도 수천 개의 뉴클레오티드일 수 있거나, 게놈 DNA의 경우 폴리뉴클레오티드 단편은 길이가 수백 킬로베이스 내지 수 메가베이스일 수 있다.
특정 실시형태에서 핵산은 뉴클레오솜, 뉴클레오솜 또는 뉴클레오솜-유사 구조의 단편 또는 부분을 포함한다. 핵산은 때때로 단백질(예를 들어, 히스톤, DNA 결합 단백질 등)을 포함한다. 본 명세서에 기술된 과정에 의해 분석된 핵산은 때때로 실질적으로 단리되고 단백질 또는 다른 분자와 실질적으로 연관되지 않는다. 핵산은 또한 단일-가닥("센스" 또는 "안티센스", "플러스" 가닥 또는 "마이너스" 가닥, "정방향" 판독 프레임 또는 "역방향" 판독 프레임) 및 이중-가닥 폴리뉴클레오티드로부터 합성, 복제 또는 증폭된 RNA 또는 DNA의 유도체, 변이체 및 유사체를 포함한다. 데옥시리보뉴클레오티드는 데옥시아데노신, 데옥시시티딘, 데옥시구아노신 및 데옥시티미딘을 포함한다. RNA의 경우 염기 시토신은 우라실로 대체되고 당 2' 위치에는 하이드록실 부분이 포함된다. 일부 실시형태에서, 핵산은 대상체로부터 얻은 핵산을 주형으로 사용하여 제조된다.
본 명세서에 사용된 용어 "말단에 있는 위치" 또는 "말단 위치"(또는 단지 "말단")는 예를 들어, 무세포 DNA 분자, 예를 들어 플라스미드 DNA 분자의 말단에서 가장 바깥쪽 염기의 게놈 좌표 또는 게놈 정체성 또는 뉴클레오티드 정체성을 지칭할 수 있다. 말단 위치는 DNA 분자의 양쪽 말단에 상응할 수 있다. 이와 같이 DNA 분자의 시작과 말단을 언급한다면 둘 모두는 말단에 있는 위치에 상응할 수 있다. 일부 실시형태에서, 하나의 말단 위치는 분석 방법, 예를 들어 대규모 병렬 시퀀싱 또는 차세대 시퀀싱, 단일 분자 시퀀싱, 이중-가닥 또는 단일-가닥 DNA 시퀀싱 라이브러리 준비 프로토콜, 중합효소 연쇄 반응(PCR) 또는 마이크로어레이에 의해 검출 또는 결정되는 무세포 DNA 분자의 일 말단 상의 최외측 염기의 게놈 좌표 또는 뉴클레오티드 정체성이다. 일부 실시형태에서, 이러한 시험관내 기술은 무세포 DNA 분자의 진정한 생체내 물리적 말단(들)을 변경할 수 있다. 따라서, 각각의 검출가능한 말단은 생물학적으로 진정한 말단을 나타낼 수 있거나 말단은 내부로 하나 이상의 뉴클레오티드 또는 분자의 원래 말단으로부터 연장된 하나 이상의 뉴클레오티드, 예를 들어, 클레나우(Klenow) 단편에 의한 비-평활화-말단의 이중-가닥 DNA 분자의 돌출부의 5' 평활화 및 3' 충진일 수 있다. 말단 위치의 게놈 정체성 또는 게놈 좌표는 인간 참조 게놈, 예를 들어 hg19에 대한 서열 판독의 정렬 결과로부터 유도될 수 있다. 그것은 인간 게놈의 원래 좌표를 나타내는 색인 또는 코드의 카탈로그에서 유도될 수 있다. 이는 표적-특이적 프로브, 미니-시퀀싱, DNA 증폭에 의해 판독되지만 이에 제한되지 않는 무세포 DNA 분자 상의 위치 또는 뉴클레오티드 정체성을 지칭할 수 있다. 용어 "게놈 위치"는 폴리뉴클레오티드(예를 들어, 유전자, 플라스미드, 핵산 단편, 바이러스 DNA 단편) 내의 뉴클레오티드 위치를 지칭할 수 있다. 용어 "게놈 위치"는 게놈(예를 들어, 배우자 또는 미생물, 또는 다세포 유기체의 각 세포에서 염색체의 반수체 세트) 내의 뉴클레오티드 위치에 제한되지 않는다.
본 명세서에 사용된 용어 "돌연변이", "단일 뉴클레오티드 변이체", "단일 뉴클레오티드 다형성", "변이체", "후성적 변형" 및 "구조적 재배열"은 하나 이상의 세포의 유전 물질에서 하나 이상의 다른 유형 중 하나 이상의 검출가능한 변화를 지칭한다. 특정 예에서, 하나 이상의 돌연변이가 암세포에서 발견될 수 있고 이를 확인할 수 있다(예를 들어, 드라이버 및 패신저 돌연변이). 돌연변이는 모 세포에서 딸 세포로 전달될 수 있다. 당업자는 모 세포에서의 유전적 돌연변이(예를 들어, 드라이버 돌연변이)가 딸 세포에서 추가적인 상이한 돌연변이(예를 들어, 패신저 돌연변이)를 유도할 수 있음을 이해할 것이다. 돌연변이 또는 변이체는 일반적으로 핵산에서 발생한다. 특정 예에서, 돌연변이는 하나 이상의 데옥시리보핵산 또는 이의 단편에서 검출가능한 변화일 수 있다. 돌연변이는 일반적으로 핵산의 새로운 위치에 추가, 결실, 치환, 역전 또는 전치된 뉴클레오티드를 지칭한다. 돌연변이는 자발적 돌연변이 또는 실험적으로 유도된 돌연변이일 수 있다. 특정 조직의 서열에서 돌연변이는 "조직-특이적 대립유전자"의 한 예이다. 예를 들어, 종양은 정상 세포에서는 발생하지 않는 유전자좌에서 대립유전자를 초래하는 돌연변이를 가질 수 있다. "조직-특이적 대립유전자"의 또 다른 예는 태아 조직에서 발생하지만 모체 조직에서는 발생하지 않는 태아-특이적 대립유전자이다. 용어 "대립유전자"는 경우에 따라 돌연변이와 상호교환적으로 사용될 수 있다.
용어 "일시적인 결합"은 결합 시약 또는 프로브가 폴리뉴클레오티드 상의 결합 부위에 가역적으로 결합하고 프로브가 통상적으로 그의 결합 부위에 부착된 채로 남아 있지 않음을 의미한다. 이것은 분석 과정 동안 결합 부위의 위치에 관한 유용한 정보를 제공한다. 전형적으로 하나의 시약 또는 프로브는 고정된 중합체에 결합한 다음 일정 시간이 지난 후 중합체에서 분리된다. 동일하거나 다른 시약 또는 프로브는 그 다음 다른 부위에서 중합체에 결합할 수 있다. 일부 실시형태에서, 중합체를 따라 다중 결합 부위가 또한 동시에 다중 시약 또는 프로브에 의해 결합될 수 있다. 일부 경우에는 서로 다른 프로브가 중첩하는 결합 부위에 결합한다. 중합체에 가역적으로 결합하는 시약 또는 프로브의 이 과정은 분석 과정에서 여러 번 반복될 수 있다. 이러한 결합 이벤트의 위치, 빈도, 체류 시간, 광자 방출은 결국 중합체의 화학적 구조의 지도를 초래한다. 실제로, 이들 결합 이벤트의 일시적인 특성으로 인해 이러한 결합 이벤트의 증가된 수를 감지할 수 있다. 프로브가 오랜 기간 동안 결합된 상태로 유지되면 각 프로브는 다른 프로브의 결합을 억제할 것이다.
용어 "반복적 결합"은 중합체에서 동일한 결합 부위가 분석 과정 동안 동일한 결합 시약 또는 프로브 또는 동일한 종의 결합 시약 또는 프로브에 의해 여러 번 결합되는 것을 의미한다. 전형적으로 하나의 시약은 한 부위에 결합한 다음 해리되고, 다른 시약은 중합체의 지도가 개발될 때까지 결합한 다음 해리되는 식이다. 반복적인 결합은 프로브에서 얻은 정보의 민감도와 정확성을 증가시킨다. 더 많은 광자가 축적되고 다중의 독립적인 결합 이벤트는 실제 신호가 감지될 확률을 증가시킨다. 신호가 너무 낮아서 단지 한 번만 감지되었을 때 배경 노이즈를 호출할 수 없는 경우에 민감도가 증가한다. 이러한 경우, 신호는 지속적으로 표시될 때 호출할 수 있게 된다(예를 들어, 동일한 신호가 여러 번 표시되면 신호가 진짜라는 신뢰도가 증가함). 정보의 다중 판독은 하나의 판독을 다른 것과 확인하기 때문에 결합 부위 호출의 정확도가 증가한다.
본 명세서에 사용된 용어 "프로브"는 형광성 표지가 부착될 수 있는, 하나 이상의 선택적 표지를 갖는, 올리고뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, 프로브는 선택적으로 형광 염료 또는 형광 또는 광산란 입자로 표지된 펩티드 또는 폴리펩티드이다. 이들 프로브는 핵산 또는 단백질, 탄수화물, 지방산 또는 기타 생체분자 또는 비-생물학적 중합체에 대한 결합 부위의 국지화를 결정하는 데 사용될 수 있다.
본 명세서에 사용된 용어 "올리고뉴클레오티드 프로브 종"은 프로브로서 사용되는 하나 이상의 상이한 올리고뉴클레오티드를 포함할 수 있으며, 여기서 올리고뉴클레오티드 서열의 부분은 올리고뉴클레오티드 프로브 종의 모든 구성원에 공통되고, 기타 부분, 특히 공통 서열에 인접한 염기는 변성 또는 보편적이고, 따라서 올리고뉴클레오티드 프로브 종의 다중 구성원을 초래할 수 있다. 일부 경우에 용어 "올리고뉴클레오티드 프로브 종"은 종의 단일 구성원, 예컨대 개별 올리고뉴클레오티드 프로브를 나타낼 수 있고; 다른 경우에 용어는 종의 복수의 모든 구성원을 나타낼 수 있다. 올리고뉴클레오티드 프로브 종은 표지 또는 표지들이 제공되는 경우 모두 공통 표지 또는 표지들을 가질 것이다. 본 명세서에 사용된 용어 "올리고뉴클레오티드 종의 세트"는 상이한 공통 서열을 갖는 다중 올리고뉴클레오티드 종을 의미한다.
본 명세서에 사용된 용어 "올리고뉴클레오티드 종의 완전한 세트"는 시퀀싱 방법에 사용된 모든 올리고뉴클레오티드 종을 의미한다. 올리고뉴클레오티드의 완전한완벽한 세트의 상이한 구성원은 동일한 길이의 k-mer를 갖거나 상이한 길이의 k-mer를 갖는다. 올리고뉴클레오티드 프로브 종의 완전한 세트는 단일 길이의 k-mer의 모든 k-mer 서열을 포함할 수 있거나, 이의 서브세트를 포함할 수 있다.
본 명세서에 사용된 용어 "서열 프로브의 타일링 세트" 또는 "타일링 세트"는 세트의 2개 올리고뉴클레오티드 프로브 종을 제외한 모두가 또한 세트 내 2개 다른 올리고뉴클레오티드 프로브 종과 공통인 하나의 올리고뉴클레오티드 프로브 종 공통 염기를 제외한 모두를 가지고 상응하는 상이한 염기가 올리고뉴클레오티드 프로브 종 공통 서열의 각각의 말단에 있는 올리고뉴클레오티드 프로브 종의 세트를 의미한다. 타일링 세트의 두 구성원은 하나의 다른 올리고뉴클레오티드 프로브 종과 또한 공통인 하나의 올리고뉴클레오티드 프로브 종 공통 염기를 제외한 모두를 가질 올리고뉴클레오티드 프로브 종을 가지고, 다른 염기는 각각의 3' 및 5' 말단에 있어 모두 중첩하는 올리고의 세트를 완성한다.
본 명세서에 사용된 용어 "올리고뉴클레오티드" 및 "올리고"는 짧은 핵산 서열을 의미한다. 일부 실시형태에서, 올리고는 정의된 크기이고, 예를 들어, 각각의 올리고는 길이가 k 뉴클레오티드 염기(또한 본 명세서에서 "k-mer"로 지칭됨)이다. 전형적인 올리고 크기는 3-mer, 4-mer, 5-mer, 6-mer 등이다. 올리고는 또한 본 명세서에서 N-mer로 지칭될 수 있다.
본 명세서에 사용된 용어 "표지"는 단일 검출가능한 실체(예를 들어, 파장 방출 실체) 또는 다중 검출가능한 실체를 포괄한다. 일부 실시형태에서, 표지는 핵산에 일시적으로 결합하거나 프로브에 공유적으로 또는 비-공유적으로 결합된다. 다른 유형의 표지는 형광 방출 동안 깜박이거나 광자 방출이 변동하거나 광-스위치를 껐다가 켤 수 있다. 다른 이미징 방법에는 다른 표지가 사용된다. 특히 일부 표지는 상이한 유형의 형광 현미경에 고유하게 적합하다. 일부 실시형태에서, 형광 표지는 상이한 파장에서 형광을 발하고 또한 상이한 수명을 갖는다. 일부 실시형태에서, 배경 형광은 이미징 분야에 존재한다. 일부 이러한 실시형태에서, 이러한 배경은 산란 또는 배경 형광으로 인한 형광의 시간 창을 거부함에 의해 분석에서 제거된다. 표지가 프로브의 한쪽 말단(예를 들어, 올리고 프로브의 3' 말단)에 있는 경우, 국지화에서 정확도는 프로브의 해당 말단(예를 들어, 프로브 서열의 3' 말단 및 표적 서열의 5' 말단)에 상응한다. 표지의 겉보기 일시적, 변동 또는 깜박임 또는 흐릿한 거동은 부착된 프로브가 그 결합 부위에 결합하는지 여부를 구별할 수 있다.
본 명세서에 사용된 용어 "플랩"은 제2 실체의 결합을 위한 수용체로서 작용하는 실체를 지칭한다. 두 실체는 분자 결합 쌍을 포함할 수 있다. 이러한 결합 쌍은 핵산 결합 쌍을 포함할 수 있다. 일부 실시형태에서, 플랩은 표지된 올리고뉴클레오티드에 결합하는 올리고- 또는 폴리뉴클레오티드 서열의 스트레치를 포함한다. 플랩과 올리고뉴클레오티드 사이의 이러한 결합은 표적에 결합하는 프로브 부분의 일시적인 결합을 이미징하는 과정의 경과 동안 실질적으로 안정적이어야 한다.
용어 "연신된", "연장된", "신장된", "선형화된" 및 "직선화된"은 상호교환적으로 사용될 수 있다. 특히, 용어 "연신된 폴리뉴클레오티드"(또는 "연장된 폴리뉴클레오티드" )는 일부 방식으로 표면 또는 매트릭스에 부착된 다음 선형 형태로 신장된 핵산 분자를 나타낸다. 일반적으로, 이들 용어는 폴리뉴클레오티드를 따라 결합 부위가 이들 사이의 다수의 뉴클레오티드와 다소 상관관계가 있는 물리적 거리만큼 분리되어 있음을 의미한다(예를 들어, 폴리뉴클레오티드는 직선형임). 물리적 거리가 염기의 수와 일치하는 정도에서 약간의 부정확성은 용인될 수 있다.
본 명세서에 사용된 용어 "이미징"은 2-차원 어레이 및 2-차원 스캐닝 검출기 둘 모두를 포함한다. 대부분의 경우, 본 명세서에서 사용된 이미징 기술은 형광 여기 소스(예를 들어, 적절한 파장의 레이저) 및 형광 검출기를 필수적으로 포함할 것이다.
본 명세서에 사용된 용어 "서열 비트"는 서열의 하나 또는 소수의 염기(예를 들어, 길이가 1 내지 9개 염기)를 나타낸다. 특히, 일부 실시형태에서, 서열은 일시적인 결합에 사용되는 올리고(또는 펩티드)의 길이에 상응한다. 따라서, 이러한 실시형태에서, 서열은 표적 폴리뉴클레오티드의 영역을 지칭한다.
본 명세서에 사용된 용어 "단상형"은 전형적으로 함께 유전되는 변이의 세트를 지칭한다. 이는 변이의 세트가 폴리뉴클레오티드 또는 염색체에 매우 근접하여 존재하기 때문에 발생한다. 일부 경우에, 단상형은 하나 이상의 단일 뉴클레오티드 다형성(SNP)을 포함한다. 일부 경우에, 단상형은 하나 이상의 대립유전자를 포함한다.
본 명세서에 사용된 용어 "메틸-결합 단백질"은 약 70개 뉴클레오티드 잔기를 포함하는 메틸-CpG-결합 도메인을 함유하는 단백질을 지칭한다. 이러한 도메인은 DNA의 비메틸화된 영역에 대해 낮은 친화성을 가지고, 따라서 메틸화된 핵산의 위치를 식별하는 데 사용될 수 있다. 일부 일반적인 메틸-결합 단백질은 MeCP2, MBD1 및 MBD2를 포함한다. 그러나, 메틸-CpG 결합 도메인을 함유하는 광범위한 상이한 단백질이 있다(예를 들어, Roloff 외, BMC Genomics 4:1, 2003에 기술된 바와 같음). 유사하게, 다른 유형의 항체는 메틸 아데닌과 같은 다른 유형의 후성 유전적 변형에 결합하는 데 사용된다.
본 명세서에 사용된 용어 "나노바디"는 중쇄 단독 항체 단편을 포함하는 단백질의 세트를 지칭한다. 이들은 고도로 안정적인 단백질이고 다양한 인간 항체와 유사한 서열 상동성을 갖도록 설계될 수 있으므로 신체에서의 세포 유형 또는 영역, 또는 특정 유형의 자연 발생 후성유전적으로 변형된 핵염기에 특이적 표적화할 수 있다. 나노바디 생물학에 대한 검토는 Bannas 외, Frontiers in Immu. 8:1603, 2017에서 찾을 수 있다.
본 명세서에 사용된 용어 "아피머"는 비-항체 결합 단백질을 지칭한다. 이들은 2개 펩티드 루프 및 일부 실시형태에서 원하는 단백질 표적에 대한 친화도 및 특이성을 제공하도록 무작위화된 N-말단 서열을 갖는 고도로 맞춤화가능한 단백질이다. 따라서, 일부 실시형태에서, 아피머는 단백질에서 관심있는 서열 또는 구조적 영역을 식별하는 데 사용된다. 일부 이러한 실시형태에서, 아피머는 많은 상이한 유형의 단백질 발현, 국지화 및 상호작용을 식별하는 데 사용된다(예를 들어, Tiede 외, ELife 6:e24903, 2017에 기술된 바와 같음).
본 명세서에 사용된 용어 "압타머"는 고도로 다용도인 맞춤화가능한 결합 분자의 또 다른 범주를 지칭한다. 압타머는 뉴클레오티드 및/또는 펩티드 영역을 포함한다. 가능한 압타머 서열의 무작위 세트를 생성한 다음 관심있는 특정 표적 분자에 결합하는 원하는 서열을 선택하는 것이 전형적이다. 압타머는 다른 범주의 결합 단백질보다 그것을 바람직하게 만드는 그 안정성 및 유연성을 넘어 추가적인 특성을 가지고 있다(예를 들어, Song 외, Sensors 12:612-631, 2012 및 Dunn 외, Nat. Rev. Chem. 1:0076, 2017에 기술된 바와 같음).
예시를 위한 예시적인 적용에 대해 참조하여 여러 양태가 아래에서 기술된다. 본 명세서에 기술된 특징에 대한 완전한 이해를 제공하기 위해 수많은 특정 세부사항, 관계 및 방법이 제시되어 있음이 이해되어야 한다. 그러나 관련 기술 분야의 통상의 지식을 가진 자는 본 명세서에 기술된 특징이 하나 이상의 특정 세부사항 없이 또는 다른 방법으로 실행될 수 있음을 이해할 것이다. 일부 행위는 다른 순서로 및/또는 다른 행위 또는 이벤트와 동시에 발생할 수 있기 때문에 본 명세서에 기술된 특징은 행위 또는 이벤트의 예시된 순서에 의해 제한되지 않는다. 더욱이, 본 명세서에 기술된 특징에 따라 방법론을 구현하기 위해 예시된 모든 행위 또는 이벤트가 필요한 것은 아니다.
예시적인 시스템 실시형태.
일 양태에서, 표적 핵산을 시퀀싱하는 방법이 본 명세서에 개시되어 있다. 방법은 (a) 테스트 기판 상에 이중-가닥 선형화된 신장된 형태인 표적 핵산을 고정하고 이에 의해 고정된 신장된 이중-가닥 핵산을 형성하는 것을 포함할 수 있다. 방법은 (b) 고정된 신장된 이중-가닥 핵산을 테스트 기판 상의 단일 가닥 형태로 변성시켜 이에 의해 표적 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 수득하는 것을 추가로 포함할 수 있으며, 여기서 고정된 제2 가닥의 각각의 염기는 인접하여 놓일 수 있거나 고정된 제1 가닥의 상응하는 상보적 염기에 매우 근접한다. 방법은 (c) 고정된 제1 가닥 및 고정된 제2 가닥을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀에 노출시키는 것을 추가로 포함할 수 있으며, 여기서 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 미리결정된 서열 및 길이의 것이다. 노출 (c)는 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀의 개별 프로브가 결합하여 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 제1 가닥 또는 고정된 제2 가닥의 각 부분과 각각의 듀플렉스를 형성하도록 허용하는 조건하에서 발생할 수 있다. 그리고 그에 의해 광학 활성의 각각의 경우를 일으킬 수 있다. 방법은 (d) 테스트 기판 상의 위치를 측정하는 것 및 선택적으로 하나 이상의 2-차원 이미저를 사용하여 노출 (c) 동안 발생하는 광학 활성의 각각의 각 경우의 지속시간으로 지속할 수 있다. 그 다음, 방법은 (e) 올리고뉴클레오티드 프로브 종의 세트에서 올리고뉴클레오티드 프로브 종의 각각의 풀에 대해 노출 (c) 및 측정 (d)를 반복하고 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득하는 것에 의해 진행할 수 있다. 테스트 기판 상의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종의 세트에서 하나 이상의 올리고뉴클레오티드 프로브 종에 상응할 수 있다. 테스트 기판 상의 복수의 위치 세트는 여기에 연관된 다중 표지를 사용한 결과로 일련으로 또는 동시에 다수의 상이한 올리고뉴클레오티드 프로브 종이 측정되는 경우 노출 (c)의 단일 단계로부터 얻어진다. 방법은 (f) 상이한, 또는 상이한 세트의 올리고뉴클레오티드 프로브 종에 상응하는 복수의 위치 세트로 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 표적 핵산의 적어도 일부의 서열을 결정하는 것을 추가로 포함할 수 있다.
일부 실시형태에서, 노출 (c)는 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀의 개별 올리고뉴클레오티드 프로브 종이 개별 올리고뉴클레오티드 프로브에 상보적인 고정된 제1 가닥 또는 고정된 제2 가닥의 각 부분과 일시적이고 가역적으로 결합하고 각각의 듀플렉스를 형성하고 이에 의해 광학 활성의 경우를 발생시키도록 하는 조건하에서 일어난다. 일부 실시형태에서, 노출 (c)는 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀의 개별 올리고뉴클레오티드 프로브 종이 개별 프로브에 상보적인 고정된 제1 가닥 또는 고정된 제2 가닥의 각 부분과 반복적으로 일시적이고 가역적으로 결합하고 각각의 듀플렉스를 형성하고 이에 의해 광학 활성의 각각의 경우를 반복적으로 발생시키도록 하는 조건하에서 일어난다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서, 올리고뉴클레오티드 종의 풀에서 각각의 올리고뉴클레오티드 프로브는 표지(예를 들어, 염료, 형광 나노입자, 또는 광-산란 입자)와 결합된다.
일부 실시형태에서, 방법에서 노출은 개재하는 염료의 형태에서 제1 표지의 존재에서 수행된다. 일부 실시형태에서, 제2 표지, 제1 표지 및 제2 표지와 결합된 올리고뉴클레오티드 프로브 종의 세트에서, 올리고뉴클레오티드 종의 풀에서 각각의 올리고뉴클레오티드 프로브는 제1 표지 형광 및 제2 표지 형광 중 하나가 제1 표지 및 제2 표지가 서로 매우 근접하여 있고, 광학 활성의 각각의 경우가 개재하는 염료의 근접에서 유래할 때, 올리고뉴클레오티드 프로브에 결합된 제2 표지에, 올리고뉴클레오티드 프로브와 고정된 제1 가닥 또는 고정된 제2 가닥 사이에 각각의 듀플렉스를 개재하는 것을 증가하도록 야기하는 중첩하는 공여체 방출 및 수용체 여기 스펙트럼을 가진다. 다른 실시형태에서, 제1 표지 및 제2 표지 둘 모두는 올리고뉴클레오티드 프로브에 결합된다.
일부 실시형태에서, 노출은 개재하는 염료의 형태에서 제1 표지의 존재에서 이루어지며, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 제2 표지와 결합되고, 제1 표지는 제2 표지의 형광이 제1 표지와 제2 표지가 서로 매우 근접해 있고 광학 활성의 각각의 경우가 개재하는 염료의 근접에서 유래할 때, 제2 표지에, 올리고뉴클레오티드 프로브와 고정된 제1 가닥 또는 고정된 제2 가닥 사이에 각각의 듀플렉스를 개재하는 것을 증가하도록 야기할 수 있다.
일부 실시형태에서, 노출은 개재하는 염료의 형태에서 제1 표지의 존재에서 이루어지며, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 제2 표지와 결합되고, 제2 표지는 제1 표지의 형광이 제1 표지와 제2 표지가 서로 매우 근접해 있고 광학 활성의 각각의 경우가 개재하는 염료의 근접에서 유래할 때, 제2 표지에, 올리고뉴클레오티드 프로브와 고정된 제1 가닥 또는 고정된 제2 가닥 사이에 각각의 듀플렉스를 개재하는 것을 증가하도록 야기한다.
일부 실시형태에서, 노출은 개재하는 염료의 존재에서 이루어지고, 광학 활성의 각각의 경우는 올리고뉴클레오티드 프로브와 고정된 제1 가닥 또는 고정된 제2 가닥 사이에 각각의 듀플렉스를 개재시키는 개재하는 염료의 형광으로부터의 것이다. 그러한 실시형태에서, 광학 활성의 각각의 경우는 그것이 각각의 듀플렉스를 개재하기 전에 개재하는 염료의 형광보다 더 크다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 하나 초과의 올리고뉴클레오티드 프로브 종은 노출 (c)의 단일 경우 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 노출 (c)의 단일 경우 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출된 올리고뉴클레오티드 프로브 종의 세트에서 각각 다른 올리고뉴클레오티드 프로브 종은 다른 표지와 연관된다. 일부 이러한 실시형태에서, 제1 표지와 연관되는 제1 올리고뉴클레오티드 프로브 종인, 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종의 제1 풀은 노출 (c)의 단일 경우 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 제2 표지와 연관되는 제2 올리고뉴클레오티드 프로브 종인, 올리고뉴클레오티드 프로브 종의 세트에서 제2 올리고뉴클레오티드 프로브 종의 제2 풀은 노출 (c)의 단일 경우 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 제1 표지와 제2 표지는 상이하다. 대안적으로, 제1 표지와 연관되는 제1 올리고뉴클레오티드 프로브 종인, 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종의 제1 풀은 노출 (c)의 단일 경우 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 제2 표지와 연관되는 제2 올리고뉴클레오티드 프로브 종인, 올리고뉴클레오티드 프로브 종의 세트에서 제2 올리고뉴클레오티드 프로브 종의 제2 풀은 노출 (c)의 단일 경우 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 그리고 제3 표지와 연관되는 제3 올리고뉴클레오티드 프로브 종인, 올리고뉴클레오티드 프로브 종의 세트에서 제3 올리고뉴클레오티드 프로브 종의 제3 풀은 노출 (c)의 단일 경우 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 제1 표지, 제2 표지 및 제3 표지는 각각 상이하다.
다른 실시형태에서, 여기, 방출, 형광 수명 등에 의해 구별되는 임의의 수의 상이한 표지가 올리고뉴클레오티드 프로브 종의 연관된 풀과 함께 사용된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 풀은 단일 올리고뉴클레오티드 프로브 종을 포함한다. 다른 실시형태에서, 올리고뉴클레오티드 프로브 종의 풀은 다중 올리고뉴클레오티드 프로브 종을 포함한다. 추가 실시형태에서, 다중 올리고뉴클레오티드 프로브 종의 풀은 다중 올리고뉴클레오티드 프로브 종의 풀에서 각각의 단일 올리고뉴클레오티드 프로브 종과 연관된(결합하는) 구별되는 표지를 갖는다. 추가 실시형태에서, 다중의 상이한 올리고뉴클레오티드 프로브 종의 세트의 일부 또는 전부는 다중 올리고뉴클레오티드 프로브 종의 풀에서 다른 올리고뉴클레오티드 프로브 종과 직접적으로 구별할 수 없는 동일한 유형의 표지를 갖는다. 또 다른 실시형태에서, 다중 올리고뉴클레오티드 프로브 종의 풀에서 하나 이상의 올리고뉴클레오티드 프로브 종은 표지되지 않는다.
일부 실시형태에서, 반복 (e), 노출 (c) 및 측정 (d)는 올리고뉴클레오티드 프로브 종의 세트에서 각각의 단일 올리고뉴클레오티드 프로브 종에 대해 수행된다.
일부 실시형태에서, 노출 (c) 및 측정 (d) 및 반복은 순차적으로 수행된다. 다른 실시예에서, 노출 (c) 및 측정 (d)는 동시적이며, 여기서 측정 (d)는 노출 (c) 과정 동안 단일 프레임이 획득되자마자 시작한다. 추가 실시형태에서, 다중 노출 (c) 과정은, 예를 들어 측정 (d) 과정을 수행하기 이전에 올리고뉴클레오티드 프로브의 상이한 풀로 수행된다.
일부 실시형태에서, 노출 (c)는 제1 온도에서 올리고뉴클레오티드 프로브의 세트에서 단일 종을 포함하거나 다중 올리고뉴클레오티드 프로브 종을 포함하는 올리고뉴클레오티드 프로브 종의 제1 풀에 대해 수행되고 반복 (e), 노출 (c) 및 측정 (d)는 제2 온도에서 올리고뉴클레오티드 프로브 종의 제1 풀에 대해 노출 (c) 및 측정 (d)를 수행하는 것을 포함한다.
일부 실시형태에서, 노출 (c)는 제1 온도에서 올리고뉴클레오티드 프로브 종의 세트에서 올리고뉴클레오티드 프로브 종의 제1 풀에 대해 수행되며, 반복 (e), 노출 (c) 및 측정 (d)의 경우는 복수의 상이한 온도 각각에서 올리고뉴클레오티드 프로브 종의 제1 풀에 대해 노출 (c) 및 측정 (d)를 수행하는 것을 포함하고, 제1 온도 및 복수의 상이한 온도에서의 각각의 온도에 대해 (d)를 측정함에 의해 기록된 광학 활성의 측정된 위치 및 지속시간을 사용하여 올리고뉴클레오티드 프로브 종의 제1 풀에 대한 용융 곡선을 구성하는 것을 추가로 포함한다. 다른 실시형태에서, 상이한 온도 대신 상이한 염 농도가 사용된다. 추가 실시형태에서, 변성 시약 예컨대 포름아미드 또는 pH에서의 변화를 사용하여 결합 친화도를 변경한다. 추가 실시형태에서, 상이한 염 농도, 상이한 온도, 상이한 pH 수준 또는 상이한 수준의 변성 시약의 임의의 조합이 용융 곡선 등가물을 달성하기 위해 하나 이상의 올리고뉴클레오티드 프로브 종에 대해 이용된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트는 다중 상이한 유형의 올리고뉴클레오티드 프로브 종의 풀을 포함하는 복수의 서브세트를 포함하고 반복 (e), 노출 (c), 및 측정 (d)는 올리고뉴클레오티드 프로브 종의 복수의 서브세트에서 다중 상이한 유형의 올리고뉴클레오티드 프로브 종을 포함하는 풀의 각각의 개별 서브세트에 대해 수행된다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종의 다중 상이한 유형 풀을 포함하는 각각의 각 서브세트는 올리고뉴클레오티드 프로브 종의 세트로부터의 2개 이상의 상이한 올리고뉴클레오티드 프로브 종을 포함한다. 대안적으로, 다중 상이한 올리고뉴클레오티드 프로브 종 풀을 포함하는 각각의 각 서브세트는 올리고뉴클레오티드 프로브 종의 세트로부터의 4개 이상의 상이한 올리고뉴클레오티드 프로브 종을 포함한다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트는 올리고뉴클레오티드 프로브 종의 풀을 포함하는 4개 서브세트로 구성된다. 일부 실시형태에서, 방법은 각각의 올리고뉴클레오티드 프로브 종의 계산된 또는 실험적으로 유도된 용융 온도에 기반하여 올리고뉴클레오티드 프로브 종의 풀을 포함하는 복수의 서브세트로 올리고뉴클레오티드 프로브 종의 세트를 분할하는 것을 추가로 포함하며, 여기서 유사한 용융 온도를 갖는 올리고뉴클레오티드 프로브 종은 분할에 의해 올리고뉴클레오티드 프로브의 동일한 서브세트에 배치되고 그리고 여기서 노출 (c)의 경우의 온도 또는 지속시간은 올리고뉴클레오티드 프로브 종의 풀을 포함하는 상응하는 서브세트에서 올리고뉴클레오티드 프로브 종의 평균 용융 온도에 의해 결정된다. 더욱이, 일부 실시형태에서, 방법은 올리고뉴클레오티드 프로브의 세트를 각각의 올리고뉴클레오티드 프로브 종의 서열에 기반한 올리고뉴클레오티드 프로브 종의 풀을 포함하는 복수의 서브세트로 분할하는 것을 추가로 포함하고, 여기서 중첩하는 서열을 갖는 올리고뉴클레오티드 프로브 종은 올리고뉴클레오티드 프로브 종의 풀을 포함하는 상이한 서브세트에 배치된다.
일부 실시형태에서, 테스트 기판 상의 위치를 측정하는 것은 2-차원 이미저에 의해 획득된 데이터의 프레임에서 광학 활성의 각각의 경우의 중심 또는 광학 활성의 각각의 경우의 일부를 식별하고 피팅하기 위해 피팅 함수으로 광학 활성의 각각의 경우를 식별하고 피팅하는 것을 포함하고 광학 활성의 각각의 경우의 중심은 테스트 기판 상의 광학 활성의 각각의 경우의 위치인 것으로 간주된다. 일부 그러한 실시형태에서, 피팅 함수는 가우시안 함수, 1차 모멘트 함수, 기울기-기반 접근방식, 또는 푸리에 변환이다.
일부 실시형태에서, 광학 활성의 각각의 경우는 2-차원 이미저에 의해 측정된 복수의 프레임에 걸쳐 지속되고, 광학 활성의 각각의 경우를 포함하는 복수의 프레임에서 단일 프레임은 광학 활성의 각각의 경우의 일부이고, 테스트 기판 상의 위치를 측정하는 것은 복수의 프레임에 걸쳐 광학 활성의 각각의 경우의 중심을 식별하기 위해 복수의 프레임에 걸쳐 피팅 함수로 광학 활성의 각각의 경우를 식별하고 피팅하는 것을 포함하고, 그리고 광학 활성의 각각의 경우의 중심은 복수의 프레임에 걸쳐 테스트 기판 상의 광학 활성의 각각의 경우의 위치인 것으로 간주된다. 일부 이러한 실시형태에서, 피팅 함수는 가우시안 함수, 1차 모멘트 함수, 기울기-기반 접근방식, 또는 푸리에 변환이다.
일부 실시형태에서, 테스트 기판 상의 위치를 측정하는 것은 2-차원 이미저에 의해 측정된 데이터의 프레임을 훈련된 합성곱 신경망 안으로 입력하는 것을 포함하고, 데이터의 프레임은 복수의 광학 활성의 경우 중에서 광학 활성의 각각의 경우를 포함하고, 복수의 광학 활성 경우에서 광학 활성의 각 경우는 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 결합하는 올리고뉴클레오티드 종의 개별 올리고뉴클레오티드 프로브에 상응하고, 그리고 입력하는 것에 반응하여 훈련된 합성곱 신경망은 복수의 광학 활성의 경우에서 하나 이상의 광학 활성의 경우의 각각의 테스트 기판 상의 위치를 식별한다. 일부 실시형태에서, 광학 활성의 다중 경우가 하나 이상의 데이터 프레임에서 상이한 위치에 존재하며, 광학 활성의 다중 상이한 위치는 그 각각이 노출 단계에서 광학 활성의 다중 경우를 가지고, 하나 이상의 표적 폴리뉴클레오티드의 제1 및 또는 제2 가닥 상의 상이한 결합 부위에 상응한다. 추가 실시형태에서, 동일한 위치를 갖는 광학 활성의 각각의 경우는 상이한 프레임 세트에 걸쳐 발생하고, 상이한 위치를 갖는 각각의 광학 활성의 다른 경우와, 그리고 상이한 프레임 세트에 걸쳐 개별적으로 및/또는 동시적으로 처리된다.
일부 실시형태에서, 측정하는 것은 적어도 20nm, 적어도 2nm, 적어도 60nm, 또는 적어도 6nm의 국지화 정밀도로 테스트 기판 상의 위치에 대해 광학 활성의 각각의 경우의 중심을 분해한다.
일부 실시형태에서, 측정하는 것은 테스트 기판 상의 위치에 대해 광학 활성의 각각의 경우의 중심을 분해하고, 여기서 위치는 회절-이하 제한된 정확도 및/또는 정밀도로 결정된다.
일부 실시형태에서, 테스트 기판 상의 위치 및 광학 활성의 각각의 경우의 지속시간을 측정하는 것 (d)는 위치에서 5000개 초과의 광자, 위치에서 50,000개 초과의 광자, 또는 위치에서 200,000개 초과의 광자를 측정한다. 일부 실시형태에서, 측정하는 것 (d)에 사용된 다수의 광자는 단일 프레임에서 비롯되거나 광학 활성의 단일 경우를 포함하는 것으로 간주되는 프레임의 조합에서 비롯된다.
일부 실시형태에서, 광학 활성의 각각의 경우는 테스트 기판에 대해 관찰된 배경 광학 활성에 비해 미리결정된 수 초과의 표준 편차(예를 들어, 3, 4, 5, 6, 7, 8, 9 또는 10 표준 편차 초과)이다.
일부 실시형태에서, 복수의 올리고뉴클레오티드 프로브 종의 세트 또는 서브세트에서 각각의 각 올리고뉴클레오티드 프로브 종은 고유한 N-mer 서열을 포함하며, 여기서 N은 세트에서 정수이고 {1, 2, 3, 4, 5, 6, 7, 8 및 9} 그리고 여기서 길이 N의 모든 고유한 N-mer 서열은 복수의 올리고뉴클레오티드 프로브 종을 포함하는 세트 또는 서브세트에 의해 재송부된다. 일부 이러한 실시형태에서, 독특한 N-mer 서열은 하나 이상의 축퇴 뉴클레오티드 및 또는 하나 이상의 보편적 염기(예를 들어, 2'-데옥시이노신, CPG 500, 5-니트로인돌)가 차지하는 하나 이상의 뉴클레오티드 위치를 포함한다. 일부 이러한 실시형태에서, 독특한 N-mer 서열은 단일 축퇴 또는 보편적 뉴클레오티드 위치가 측접된 5' 또는 단일 축퇴 또는 보편적 뉴클레오티드 위치가 측접된 3'이다. 일부 실시형태에서, 표적 핵산은 길이가 적어도 140개 염기이고 결정하는 것 (f)는 70% 초과의 표적 핵산 서열의 백분율을 결정한다. 일부 실시형태에서, 표적 핵산은 길이가 적어도 140개 염기이고 결정하는 것 (f)는 90% 초과의 표적 핵산 서열의 백분율을 결정한다. 일부 실시형태에서, 표적 핵산은 길이가 적어도 140개 염기이고 결정하는 것 (f)는 99% 초과의 표적 핵산 서열의 백분율을 결정한다. 일부 실시형태에서, 결정하는 것 (f)는 99% 초과의 표적 핵산 서열의 백분율을 결정한다.
일부 실시형태에서, 표적 핵산은 길이가 적어도 10,000개 염기이거나 길이가 적어도 1,000,000개 염기이다.
일부 실시형태에서, 테스트 기판은 노출 (c) 및 측정 (d)를 반복하기 이전에 세정되고, 이에 의해 올리고뉴클레오티드 프로브 종의 세트에서 하나 이상의 올리고뉴클레오티드 프로브 종에 테스트 기판을 노출시키기 이전에 테스트 기판로부터 하나 이상의 올리고뉴클레오티드 프로브 종을 제거한다.
일부 실시형태에서, 고정하는 것 (a)는 분자 다듬기(후퇴하는 메니스커스), 유동 신장 나노구획, 또는 전기-신장에 의해 테스트 기판에 핵산을 적용하는 것을 포함한다.
일부 실시형태에서, 광학 활성의 각각의 각 경우는 미리결정된 역치를 만족시키는 관찰 메트릭을 갖는다. 일부 그러한 실시형태에서, 관찰 메트릭은 지속시간, 신호 대 잡음, 광자 수 또는 강도를 포함한다. 일부 실시형태에서, 미리결정된 역치는 (i) 고유한 N-mer 서열의 각각의 염기, 또는 각각의 비-축퇴 및/또는 비-보편적 염기가 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥에서 상보적 염기에 결합하는 제1 형태의 결합, 및 (ii) 고유한 N-mer 서열의 염기, 또는 각각의 비-축퇴 및/또는 비-보편적 염기와 각각의 올리고뉴클레오티드 프로브가 결합하여 광학 활성의 각각의 경우를 형성하는 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥에서 서열 간에 적어도 하나의 불일치가 있는 제2 형태의 결합 사이를 구별한다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 각 올리고뉴클레오티드 프로브 종은 그 자신의 상응하는 미리결정된 역치를 갖는다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 각 올리고뉴클레오티드 프로브 종에 대한 미리결정된 역치는 훈련 데이터세트로부터 유래된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 각 올리고뉴클레오티드 프로브 종에 대한 미리결정된 역치는 훈련 데이터세트로부터 유래되고, 훈련 세트는 올리고뉴클레오티드 프로브 종의 세트에서 각각의 각 올리고뉴클레오티드 프로브 종에 대해, 각각의 올리고뉴클레오티드 프로브 종의 고유한 N-mer 서열의 각각의 염기, 또는 각각의 비-축퇴 및 또는 비-보편적 염기가 참조 서열에서 상보적 염기에 결합하도록 참조 서열에 결합할 때 각각의 올리고뉴클레오티드 프로브에 대한 관찰 메트릭의 측정치를 포함한다. 일부 이러한 실시형태에서, 참조 서열은 참조 기판 상에 고정된다. 대안적으로, 참조 서열에는 표적 핵산과 분리되거나 표적 핵산에 결찰되고, 테스트 기판에 고정된 표적 핵산이 포함되어 있다. 일부 실시형태에서, 참조 서열은 PhiX174, M13, 람다 파지, T7 파지, 대장균, 사카로마이세스 세레비지애, 사카로마이세스 폼베, 또는 임의의 다른 자연 발생 게놈 또는 전사체의 게놈 전체 또는 일부를 포함한다. 일부 실시형태에서, 참조 서열은 공지된 서열의 합성 작제물이다. 일부 실시형태에서, 참조 서열은 토끼 글로빈 RNA의 전부 또는 일부를 포함한다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 고정된 제1 가닥의 상보적 부분에 결합함에 의해 광학 활성의 제1 경우와 고정된 제2 가닥의 상보적 부분에 결합함에 의해 광학 활성의 제2 경우를 산출한다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 고정된 제1 가닥의 2개 이상의 상보적 부분에 결합함에 의해 테스트 기판 상의 상이한 위치에서 광학 활성의 2개 이상의 경우, 및 또는 고정된 제2 가닥의 2개 이상의 상보적 부분에 결합함에 의해 테스트 기판 상의 상이한 위치에서 광학 활성의 2개 이상의 제2 경우를 산출한다.
일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브 종은 노출 (c) 동안 동일한 위치에서 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 2 이상 횟수로 결합하여 이에 의해 광학 활성의 2개 이상의 경우를 초래하며, 광학 활성의 각 경우는 복수의 결합 이벤트에서 결합 이벤트를 나타낸다.
일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브는 다중 위치에서 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 결합하고, 각 위치에서 다중 횟수 결합하여, 노출 (c) 동안 광학 활성의 각 위치에서 광학 활성의 다중 경우를 잠재적으로 생성하여 광학 활성의 각 경우는 복수의 결합 이벤트에서 결합 이벤트를 나타낸다.
일부 실시형태에서, 노출 (c)는 5분 이상, 5분 이하, 2분 이하, 또는 1분 이하 동안 발생한다.
일부 실시형태에서, 노출 (c)는 2-차원 이미저의 하나 이상의 프레임, 2-차원 이미저의 2개 이상의 프레임, 2-차원 이미저의 500개 이상의 프레임 또는 2-차원 이미저의 5,000개 이상의 프레임에 걸쳐 발생한다.
일부 실시형태에서, 다중 2-차원 이미저가 동시적으로 및 또는 순차적으로 이용되며, 여기서 다중 2-차원 이미저의 각각은 특정 유형의 표지를 검출하도록 최적화되어, 이에 의해 다중의 상이한 올리고뉴클레오티드 프로브 종과 연관된 다중 표지에 대한 데이터의 동시 수집을 허용한다.
일부 실시형태에서, 노출 (c)는 제1 기간에 대한 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종에 대해 수행되며, 여기서 반복 (e), 노출 (c) 및 측정 (d)는 제2 기간에 대한 제2 올리고뉴클레오티드 프로브 종에 대해 노출 (c)를 수행하는 것을 포함하고, 제1 기간은 제2 기간과 상이하다.
일부 실시형태에서, 노출 (c)는 2-차원 이미저의 제1 프레임 수에 대한 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종에 대해 수행되며, 여기서 반복 (e), 노출 (c) 및 측정 (d)는 2-차원 이미저의 제2 프레임 수에 대해 제2 올리고뉴클레오티드 프로브 종에 대해 노출 (c)를 수행하는 것을 포함하고, 제1 프레임 수는 제2 프레임 수와 상이하다.
일부 실시형태에서, 노출 (c)는 2-차원 이미저의 제1 프레임 수에 대한 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종에 대해 수행되며, 여기서 반복 (e), 노출 (c) 및 측정 (d)는 2-차원 이미저의 제2 프레임 수에 대해 제2 올리고뉴클레오티드 프로브 종에 대해 노출 (c)를 수행하는 것을 포함하고, 제1 프레임 수에서 각 프레임에 대한 노출 지속시간은 제2 프레임 수에서 각각의 프레임에 대한 노출 지속시간과 상이하다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 동일한 길이의 것이다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 동일한 길이 M의 것이며, 여기서 M은 2 이상의 양의 정수이고(예를 들어, M은 2, 3, 4, 5, 6, 7, 8, 9, 10, 또는 10 초과임), 테스트 기판 상의 복수의 위치 세트로부터 표적 핵산의 적어도 일부의 서열을 결정하는 것 (f)는 복수의 위치 세트에 의해 표시되는 상이한 올리고뉴클레오티드 프로브 종의 중첩하는 서열을 추가로 사용한다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 올리고뉴클레오티드 프로브 종의 세트에서 다른 올리고뉴클레오티드 프로브와 M-1 서열 상동성을 공유한다. 일부 이러한 실시형태에서, 테스트 기판 상의 복수의 위치 세트로부터 표적 핵산의 적어도 일부의 서열을 결정하는 것은 고정된 제1 가닥에 상응하는 제1 타일링 경로 및 고정된 제2 가닥에 상응하는 제2 타일링 경로를 결정하는 것을 포함한다. 일부 그러한 실시형태에서, 제1 타일링 경로의 중단은 제2 타일링 경로의 대응하는 부분을 사용하여 해결되며, 여기서 제2 타일링 경로는 제1 타일링 경로에 상보적이다. 다른 실시형태에서, 제1 타일링 경로 또는 제2 타일링 경로의 중단은 참조 서열을 사용하여 해결된다. 다른 실시형태에서, 제1 타일링 경로 또는 제2 타일링 경로의 중단은 표적 핵산의 다른 경우로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 해결된다. 일부 이러한 실시형태에서, 표적 핵산 서열의 서열 할당에서 신뢰도는 제1 타일링 경로 및 제2 타일링 경로의 상응하는 부분을 사용하여 증가된다. 다른 실시형태에서, 표적 핵산 서열의 서열 할당에서 신뢰도는 표적 핵산의 다른 경우로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 증가된다.
일부 실시형태에서, 노출 (c)의 경우의 시간 길이는 노출 (c)의 경우에 사용된 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종의 추정된 용융 온도에 의해 결정된다.
일부 실시형태에서, 방법은 (f) 고정된 이중-가닥 또는 고정된 제1 가닥 및 고정된 제2 가닥을 항체, 아피머, 나노바디, 압타머 또는 메틸-결합 단백질에 노출시켜 이에 의해 표적 핵산에 대한 변형을 결정하거나 또는 테스트 기판 상의 복수의 위치 세트로부터 표적 핵산의 일부의 서열과 상관시키는 것을 포함한다. 일부 실시형태에서, 방법은 표적 핵산의 일부를 포함할 수 있는 다양한 후성유전적 변형의 결정을 허용할 수 있다.
일부 실시형태에서, 테스트 기판은 2-차원 표면을 포함할 수 있다. 일부 이러한 실시형태에서, 2-차원 표면은 겔 또는 매트릭스로 코팅된다.
일부 실시형태에서, 테스트 기판은 유동 셀, 셀, 3-차원 매트릭스 또는 겔을 포함할 수 있다.
일부 실시형태에서, 테스트 기판은 고정 (a) 이전에 서열-특이적 올리고뉴클레오티드 프로브 종과 결합되고, 고정 (a)는 테스트 기판에 결합된 서열-특이적 올리고뉴클레오티드 프로브 종을 사용하여 테스트 기판 상에 표적 핵산을 포획하는 것을 포함할 수 있다.
일부 실시형태에서, 테스트 기판의 표면에 결합되고, 천연 올리고뉴클레오티드 염기보다 더 높은 용융 온도를 갖는 염기, 예컨대 PNA 및/또는 LNA 염기를 포함할 수 있고, 그리고 표적 핵산의 변성을 허용할 수 있는 서열 특이적 올리고뉴클레오티드 프로브 종. 일부 실시형태에서, 상보적이고 이에 의해 표적 핵산의 제1 가닥 및 제2 가닥의 결합을 허용하여, 각각의 단일 표적 핵산으로부터 표적 핵산의 더 높은 백분율의 염기의 결정을 허용할 수 있는 다중 상이한 서열 특이적 올리고뉴클레오티드 프로브 종.
일부 실시형태에서, 핵산은 추가의 복수의 세포 성분을 포함하는 용액에 있고 고정 (a) 또는 변성 (b)는 표적 핵산이 테스트 기판에 고정된 후 그리고 노출 (c) 이전에 테스트 기판을 세정하고 이에 의해 표적 핵산으로부터 추가의 복수의 세포 성분을 정제하는 것을 추가로 포함할 수 있다.
일부 실시형태에서, 테스트 기판은 노출 (c) 이전에 폴리에틸렌 글리콜, 소 혈청 알부민-비오틴-스트렙타비딘, 카제인, 소 혈청 알부민(BSA), 하나 이상의 상이한 tRNA, 하나 이상의 상이한 데옥시리보뉴클레오티드, 하나 이상의 상이한 리보뉴클레오티드, 연어 정자 DNA, 플루로닉 F-127, 트윈-20, 수소 실세스퀴옥산(HSQ), 또는 임의의 이의 조합으로 부동태화된다.
일부 실시형태에서, 테스트 기판은 고정 (a) 이전에 7-옥테닐트리클로로실란 또는 메타크릴옥시프로필트리메톡시실란을 포함하는 비닐실란 코팅으로 코팅된다.
본 개시내용의 다른 양태는 핵산을 시퀀싱하는 방법을 제공하며, 이것은 (a) 선형화된 신장된 형태의 표적 핵산을 테스트 기판 상에 고정시켜 고정된 신장된 표적 핵산을 형성하는 것, (b) 고정된 신장된 표적 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀에 노출시키는 것으로, 여기서 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 미리결정된 서열 및 길이의 것이며, 노출 (b)는 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀의 개별 올리고뉴클레오티드 프로브를 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 표적 핵산의 각 부분에 일시적으로 및 가역적으로 되도록 허용하는 조건하에서 발생하여 이에 의해 각각의 경우의 광학 활성을 발생시키는 것, (c) 테스트 기판 상의 위치 및 선택적으로 2-차원 이미저를 사용한 노출 (b) 동안 발생하는 광학 활성의 각각의 각 경우의 지속시간을 측정하는 것, (d) 올리고뉴클레오티드 프로브 종 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복함에 의해 복수 세트의 테스트 기판 상의 위치를 획득하는 것으로, 여기서 테스트 기판 상의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종의 세트에서 올리고뉴클레오티드 프로브 종에 상응할 수 있는 것, 및 (e) 복수의 위치 세트에 의해 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 표적 핵산의 적어도 일부의 서열을 결정하는 것으로, 여기서 위치 세트는 테스트 기판 상의 상이한 및 또는 동일한 장소에서 광학 활성의 장소를 포함할 수 있는 것을 포함할 수 있다. 일부 이러한 실시형태에서, 표적 핵산은 이중-가닥 핵산이고, 방법은 표적 고정 이중-가닥 핵산을 테스트 기판 상에 단일 가닥 형태로 변성시켜 표적 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 것을 추가로 포함할 수 있으며, 여기서 고정된 제2 가닥은 고정된 제1 가닥에 상보적이다. 일부 실시형태에서, 표적 핵산은 단일 가닥 RNA이다.
본 개시내용의 다른 양태는 (a) 이중-가닥 형태인 표적 핵산을 테스트 기판 상에 고정시켜 고정된 이중-가닥 핵산을 형성하는 것, (b) 표적 고정된 이중-가닥 핵산을 테스트 기판 상에 단일 가닥 형태로 변성시켜 표적 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 수득하는 것으로, 여기서 고정된 제2 가닥은 고정된 제1 가닥에 상보적인 것, 및 (c) 고정된 제1 가닥 및 고정된 제2 가닥을 하나 이상의 올리고뉴클레오티드 프로브 종에 노출시키고, 하나 이상의 올리고뉴클레오티드 프로브 종이 고정된 제1 가닥 또는 고정된 제2 가닥에 결합하는지 여부를 결정하는 것을 포함할 수 있는, 핵산을 시퀀싱하는 방법을 제공한다.
예시적인 시스템의 세부사항이 이제 도 1a와 관련하여 기술된다. 도 1a는 일부 구현에 따른 시스템(100)을 예시하는 블록도이다. 일부 구현에서 장치(100)는 하나 이상의 프로세싱 유닛(CPU(들))(102)(프로세서 또는 프로세싱 코어로도 지칭됨), 하나 이상의 네트워크 인터페이스(104), 사용자 인터페이스(106), 비-영구 메모리(111), 영구 메모리(112), 및 이들 구성요소를 상호연결하기 위한 하나 이상의 통신 버스(114)를 포함할 수 있다. 하나 이상의 통신 버스(114)는 선택적으로 시스템 구성요소 사이의 통신을 상호연결하고 제어하는 회로(때때로 칩셋으로 불림)를 포함한다. 비-영구 메모리(111)는 전형적으로 DRAM, SRAM, DDR RAM과 같은 고속 랜덤 액세스 메모리를 포함하는 반면, 영구 메모리(112)는 전형적으로 CD-ROM, 디지털 다목적 디스크(DVD) 또는 기타 광학 저장, 자기 카세트, 자기 테이프, 자기 디스크 저장 또는 기타 자기 저장 장치, 자기 디스크 저장 장치, 광 디스크 저장 장치, ROM, EEPROM, 플래시 메모리 장치, 또는 기타 비-휘발성 고체 상태 저장 장치를 포함한다. 영구 메모리(112)는 선택적으로 CPU(들)(102)로부터 멀리 떨어진 하나 이상의 저장 장치를 포함한다. 영구 메모리(112)는 비-일시적인 컴퓨터 판독가능 저장 매체를 포함한다. 일부 구현에서, 비-영구 메모리(111) 또는 대안적으로 비-일시적인 컴퓨터 판독가능 저장 매체는 다음 프로그램, 모듈 및 데이터 구조, 또는 이의 서브세트를 때때로 영구 메모리(112)와 관련하여 저장할 수 있다.
ㆍ 다양한 기본 시스템 서비스를 처리하고 하드웨어 종속 작업을 수행하기 위한 절차를 포함할 수 있는 선택적 운영 체제(116);
ㆍ 시스템(100)을 다른 장치 또는 통신 네트워크와 연결하기 위한 선택적 네트워크 통신 모듈(또는 명령)(118);
ㆍ 표적 분자(들)(130)에 대한 정보를 수집하기 위한 광학 활성 검출 모듈(120);
ㆍ 표적 분자(들)(130)에 대한, 광학 활성의 위치 세트와 직접적으로 상관될 수 있는 복수의 결합 부위에서 각각의 각 결합 부위(140)에 대한 정보;
ㆍ (i) 지속시간(144) 및 (ii) 방출된 광자의 수(146)를 포함할 수 있는 각 결합 부위(140)에 대한 복수의 결합 이벤트에서 각각의 각 결합 이벤트(142)에 대한 정보;
ㆍ 표적 분자(들)(130)의 서열을 결정하기 위한 시퀀싱 모듈(150);
ㆍ (i) 염기 호출(152) 및 (ii) 확률(154)을 포함할 수 있는 각 표적 분자(130)에 대한 복수의 결합 부위에서 각각의 각 결합 부위(140)에 대한 정보;
ㆍ 각 표적 분자(130)에 대한 참조 게놈(160)에 관한 선택적 정보; 및
ㆍ 각 표적 분자(130)에 대한 상보적 가닥(170)에 관한 선택적 정보.
다양한 구현들에서, 상기 식별된 요소들 중 하나 이상은 이전에 언급된 메모리 장치들 중 하나 이상에 저장되고, 상기에서 기술된 바와 같은 기능을 수행하기 위한 명령어 세트에 상응한다. 본 명세서에서, 상기 식별된 모듈, 데이터 또는 프로그램(예를 들어, 명령어 세트)은 별도의 소프트웨어 프로그램, 절차, 데이터세트 또는 모듈로 구현될 필요가 없으며, 따라서 이들 모듈 및 데이터의 다양한 서브세트는 다양한 구현에서 조합되거나 달리 재-배열된다. 일부 구현에서, 비-영구 메모리(111)는 선택적으로 상기 식별된 모듈 및 데이터 구조의 서브세트를 저장한다. 더욱이, 일부 실시형태에서, 비-영구 메모리(111) 또는 영구 메모리(112)는 상기에 기술되지 않은 추가 모듈 및 데이터 구조를 저장한다. 일부 실시형태에서, 상기 식별된 요소 중 하나 이상은 시각화 시스템(100)이 필요할 때 이러한 데이터의 전부 또는 일부를 검색할 수 있도록, 시각화 시스템(100)에 의해 주소지정될 수 있는, 시각화 시스템(100) 이외의 컴퓨터 시스템에 저장된다.
네트워크 통신 모듈(118)의 예는 월드 와이드 웹(WWW), 인트라넷, 근거리 통신망(LAN), 계측제어기 통신망(CAN), 카메라링크 및/또는 무선 통신망, 예컨대 휴대 전화 통신망, 무선 근거리 통신망(WLAN) 및/또는 대도시 통신망(MAN), 및 무선 통신에 의한 기타 장치를 포함하지만 이에 제한되지 않는다. 유선 또는 무선 통신은 선택적으로 이동 통신 세계화 시스템(GSM), 향상된 데이터 GSM 환경(EDGE), 고속 다운링크 패킷 액세스(HSDPA), 고속 업링크 패킷 액세스(HSUPA), 에볼루션, 데이터-전용(EV-DO), HSPA, HSPA+, 듀얼-셀 HSPA(DC-HSPDA), 롱텀 에볼루션(LTE), 근거리 통신(NFC), 광대역 코드 분할 다중 접속(W-CDMA), 코드 분할 다중 접속(CDMA), 시분할 다중 접속(TDMA), 블루투스, 무선 피델리티(Wi-Fi)(예를 들어, IEEE 802.11a, IEEE 802.11ac, IEEE 802.11ax, IEEE 802.11b, IEEE 802.11g 및/또는 IEEE 802.11n), 인터넷 전화 통화 규약(VoIP), Wi-MAX, 전자 메일용 프로토콜(예를 들어, 인터넷 메시지 접속 프로토콜(IMAP) 및/또는 포스트 인터넷 프로토콜(POP)), 인스턴트 메시징(예를 들어, 확장형 메시징 및 프레즌스 프로토콜(XMPP), 인스턴트 메시징 및 프레즌스 레버리지 확장을 위한 세션 개시 프로토콜((SIMPLE), 인스턴트 메시징 및 프레즌스 서비스(IMPS), 및/또는 단문 메시지 서비스(SMS), 또는 본 개시내용의 출원일 현재 아직 개발되지 않은 통신 프로토콜을 포함하는 기타 적절한 통신 프로토콜을 포함하지만 이에 제한되지 않는 임의의 복수의 통신 표준, 프로토콜 및 기술을 사용한다.
도 1a는 "시스템(100)"을 도시하지만, 도면은 본 명세서에 기술된 구현의 구조적 개략도라기보다 컴퓨터 시스템에 존재하는 다양한 특징의 기능 설명으로서 더 의도된다. 실제로, 그리고 당업자에 의해 인식되는 바와 같이, 별도로 도시된 항목은 결합될 수 있고 일부 항목은 분리될 수 있다. 더욱이, 도 1a는 비-영구적 메모리(111)의 특정 데이터 및 모듈을 도시하지만, 이들 데이터 및 모듈의 일부 또는 전부는 영구 메모리(112)에 있다. 또한, 일부 실시형태에서, 메모리(111 및/또는 112)는 상기에 기술되지 않은 추가 모듈 및 데이터 구조를 저장한다. 다른 실시형태에서, 하나 이상의 2-차원 이미저, 레이저 및 격자 또는 필터 휠 및 관련 컨트롤러를 포함하는 광학 시스템, 및 다양한 펌프, 밸브, 히터 및 기타 기계 시스템을 포함하는 유체 시스템과 같은 시스템(100)의 일부로서 하나 이상의 상이한 하드웨어 모듈(미도시)이 포함된다.
본 개시내용에 따른 시스템이 도 1a를 참조하여 개시되었지만, 본 개시내용에 따른 방법은 이제 도 2a, 2b, 3 및 4를 참조하여 상세하게 설명된다.
블록 202. 표적 핵산인 분자의 화학 구조를 결정하는 방법이 제공된다. 본 개시내용의 목적은 표적 핵산의 단일 뉴클레오티드 분해 시퀀싱을 가능하게 하는 것이다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종 또는 다른 분자와 표적 핵산 또는 다른 분자를 포함하는 하나 이상의 프로브 간의 상호작용을 특성화하는 방법이 제공된다. 방법은 하나 이상의 프로브 종이 표적 핵산 또는 다른 분자에 일시적으로 결합하도록 하는 조건하에서 올리고뉴클레오티드 프로브 종 또는 또 다른 분자를 포함할 수 있는 하나 이상의 프로브를 표적 핵산 또는 다른 분자에 첨가하는 것을 포함한다. 방법은 하나 이상의 2-차원 이미저를 포함할 수 있는 검출기 상에 표적 핵산 또는 기타 분자에 대한 개별 결합 이벤트를 지속적으로 모니터링함에 의해 진행될 수 있고, 일정 기간에 걸쳐 또는 일련의 프레임에 걸쳐 결합 이벤트(들)를 기록하는 것을 포함할 수 있다. 결합 이벤트(들)로부터 데이터는 그 다음 상호작용의 하나 이상의 특성을 결정하기 위해 분석될 수 있다.
일부 실시형태에서, 표적 핵산인 중합체의 서열인 정체성을 결정하는 방법이 제공된다. 일부 실시형태에서, 세포 또는 조직의 정체성을 결정하는 방법이 제공된다. 일부 실시형태에서, 유기체의 정체성을 결정하는 방법이 제공된다. 일부 실시형태에서, 개체의 정체성을 결정하는 방법이 제공된다. 일부 실시형태에서, 방법은 단일 세포 핵산 및/또는 단백질 시퀀싱에 적용된다.
표적 폴리뉴클레오티드.
일부 실시형태에서, 분자는 표적 핵산이고 천연 표적 폴리뉴클레오티드이거나 천연 폴리뉴클레오티드의 카피이다. 다양한 실시형태에서, 방법은 샘플로서 본 명세서에 또한 기술될 수 있는 온전한 표적 폴리뉴클레오티드로서 단일 세포, 단일 소기관, 단일 염색체, 단일 바이러스, 엑소좀 또는 체액으로부터 단일 표적 폴리뉴클레오티드 분자를 추출하는 것을 추가로 포함할 수 있다. 추가 실시형태에서, 방법은 샘플로서 본 명세서에 또한 기술될 수 있는 온전한 표적 폴리뉴클레오티드로서 단일 세포, 단일 소기관, 단일 염색체, 단일 바이러스, 엑소좀 또는 체액으로부터 하나 이상의 표적 폴리뉴클레오티드 분자를 추출하는 것을 포함할 수 있다. 또 다른 실시형태에서, 방법은 샘플로서 본 명세서에 또한 기술될 수 있는 온전한 표적 폴리뉴클레오티드로서 다중 세포, 다중 소기관, 다중 염색체, 다중 바이러스, 다중 엑소솜 또는 체액으로부터 하나 이상의 표적 폴리뉴클레오티드 분자를 추출하는 것을 포함할 수 있다. 일부 실시형태에서, 단일 표적 폴리뉴클레오티드는 단일 RNA, 단일 ssDNA, 또는 단일 dsDNA를 포함할 수 있다.
일부 실시형태에서, 표적 핵산은 짧은 폴리뉴클레오티드(예를 들어, <1 킬로베이스 또는 <300 베이스)이다. 일부 실시형태에서, 짧은 폴리뉴클레오티드는 소변 및 혈액과 같은 체액에서 무-세포 DNA에 대해 발견되는 바와 같이 길이가 100-200개 염기, 150-250개 염기, 200-350개 염기 또는 100-500개 염기이다.
일부 실시형태에서, 표적 핵산은 길이가 적어도 10,000개 염기이다. 일부 실시형태에서, 표적 핵산은 길이가 적어도 1,000,000개 염기이다.
다양한 실시형태에서, 단일 표적 핵산은 염색체이다. 다양한 실시형태에서, 단일 표적 폴리뉴클레오티드는 길이가 약 102, 103, 104, 105, 106, 107, 108 또는 109개 염기이거나 10^2 내지 10^9개 염기 사이의 임의의 길이이다.
일부 실시형태에서, 방법은 표적 단백질, 표적 폴리펩티드 또는 표적 펩티드의 아미노-산 서열의 분석을 가능하게 한다. 일부 실시형태에서, 표적 단백질, 표적 폴리펩티드, 또는 표적 펩티드의 아미노산 서열을 분석 및 결정하는 방법이 제공된다. 일부 실시형태에서, 표적 폴리뉴클레오티드의 아미노-산 서열뿐만 아니라 펩티드 변형을 분석하는 방법이 제공된다. 일부 실시형태에서, 표적 분자 실체는 적어도 5 단위를 포함하는 중합체이다. 이러한 실시형태에서 결합 프로브는 올리고뉴클레오티드, 항체, 아피머, 나노바디, 압타머, 결합 단백질 또는 소분자 등을 포함하는 분자 프로브이다.
일부 실시형태에서, 표준 20개 아미노산, 22개 단백질생성 아미노산, 동종단백질에서 발견되거나 또는 번역후 변형의 결과로서 비-단백질생성 아미노산, 천연 발생 D-아미노산 또는 천연 발생 L-아미노산의 각각 또는 하나 이상은 N-레코그닌, 나노바디, 항체, 압타머 등을 포함하는 상응하는 특이적 프로브에 의해 결합된다. 각 프로브의 결합은 표적 단백질, 표적 폴리펩타이드 사슬, 또는 표적 펩티드 내에서 각각의 상응하는 아미노산에 특이적이다. 일부 실시형태에서, 표적 단백질, 표적 폴리펩티드 사슬 또는 표적 펩티드에서 서브-유닛의 순서가 결정된다. 일부 실시형태에서, 결합은 결합 부위의 대용물에 대한 것이다. 일부 실시형태에서, 대용물은 특정 아미노산 또는 펩티드 서열에 부착된 태그이고 일시적인 결합은 대용물 태그에 대한 것이다.
일부 실시형태에서, 분자는 이종 분자이다. 일부 실시형태에서, 이종 분자는 초분자 구조의 일부를 포함할 수 있다. 일부 실시형태에서, 방법은 이종 중합체에 대한 화학 구조의 단위를 식별하고 정렬하는 것을 가능하게 하거나 초분자 구조의 화학 구조의 단위를 식별하고 정렬하는 것을 가능하게 하며, 여기서 이러한 단위는 핵산 및 아미노산과 같은 상이한 유형의 중합체 서브유닛을 포함할 수 있다. 이러한 실시형태는 하나 이상의 중합체를 연장시키는 것 및 복수의 프로브를 결합하여 연장된 중합체를 따라 복수의 부위에서 화학 구조를 식별하는 것을 포함할 수 있다. 헤테로중합체를 연장시키는 것은 프로브 결합 부위의 하위-회절 수준(예를 들어, 나노메트릭) 국지화를 허용할 수 있다.
일부 실시형태에서, 중합체의 서브유닛을 인식하는 올리고뉴클레오티드 프로브 종의 결합에 의해 중합체를 시퀀싱하는 방법이 제공된다. 전형적으로, 하나의 올리고뉴클레오티드 프로브 종의 결합은 중합체를 서열화하기에 충분하지 않다. 예를 들어, 도 1b에서 중합체(130)의 시퀀싱이 프로브 종(182)의 완전한 세트와의 일시적인 상호작용(예를 들어, 올리고뉴클레오티드 프로브 종의 완전한 세트와 변성된 표적 핵산의 상호작용 또는 나노바디 또는 아피머, 항체 또는 기타 아미노산 특이적 결합제 프로브 종의 세트와 변성된 표적, 단백질, 표적 폴리펩타이드 또는 표적 펩타이드의 상호작용, 여기서 상이한 프로브 종은 광학 활성을 관찰할 수 있도록 표지됨)을 측정하는 것에 기반되는 실시형태가 도시되어 있다.
표적 중합체의 추출 및/또는 제조.
일부 실시형태에서, 관심 있는 세포를 관심 없는 다른 세포로부터 분리하거나, 핵산 추출이 수행되기 전에 단일 유형의 여러 세포의 라이브러리를 생성하는 것이 바람직하다. 하나의 그러한 예에서, 순환하는 종양 세포 또는 순환하는 태아 세포는 (예를 들어, 친화성 포획을 위한 세포 표면 마커를 사용함에 의해) 혈액으로부터 단리된다. 일부 실시형태에서, 관심 있는 것이 미생물 세포로부터 표적 핵산을 검출하고 분석하는 것인, 인간 세포로부터 미생물 세포를 분리하는 것이 바람직하다. 일부 실시형태에서, 광범위한 미생물을 친화성 포획하고 포유동물 세포로부터 분리하기 위해 옵소닌이 사용된다. 다른 실시형태에서, 차등 용해가 수행된다. 포유동물 세포는 비교적 온화한 조건하에서 먼저 용해된다. 미생물 세포는 전형적으로 포유동물 세포보다 더 단단하고 (용해하기가 더 어렵고), 따라서 미생물 세포는 포유동물 세포의 용해를 통해 온전한 상태로 남아 있을 수 있다. 용해된 포유동물 세포 단편은 씻겨져 나간다. 그런 다음 더 가혹한 조건을 사용하여 미생물 세포를 용해한다. 표적 미생물 폴리뉴클레오티드는 그런 다음 선택적으로 서열화된다.
일부 실시형태에서, 표적 핵산은 시퀀싱 이전에 세포로부터 추출된다. 대안적인 실시형태에서, (예를 들어, 염색체 DNA의) 시퀀싱은 염색체 DNA가 간기 동안 복잡한 경로를 따르는 세포 내부에서 수행된다. 제자리에서 올리고뉴클레오티드 프로브 종의 안정적인 결합은 Beliveau 외, Nature Communications 6:7147 (2015)에 의해 입증되었다. 올리고뉴클레오티드 프로브 종의 이러한 제자리 결합 및 3-차원 공간에서 올리고뉴클레오티드 프로브 종의 나노메틱 국지화는 세포 내에서 염색체 분자(표적 핵산)의 서열 및 구조적 배열의 결정을 가능하게 할 수 있다.
표적 폴리뉴클레오티드는 종종 천연 접힘 상태로 존재한다. 예를 들어, 게놈 DNA는 염색체에 고도로 응축되어 있는 반면 RNA는 2차 구조를 형성할 수 있다. 일부 실시형태에서, 생물학적 샘플로부터의 추출 동안 긴 길이의 폴리뉴클레오티드가 (예를 들어, 천연 폴리뉴클레오티드의 실질적으로 천연 길이를 보존함에 의해) 수득된다. 일부 실시형태에서, 폴리뉴클레오티드는 그의 길이를 따라 장소가 모호성이 거의 또는 전혀 없이 추적되도록 선형화된다. 이상적으로, 표적 폴리뉴클레오티드는 선형화되기 전이나 후에 곧게 펴지거나, 늘어나거나, 연장된다.
일부 실시형태에서, 방법은 천연 길이 또는 그의 상당한 비율이 (예를 들어, DNA 전체 염색체 또는 약 1 메가베이스 이상의 단편에 대해) 보존되는 매우 긴 중합체 길이를 시퀀싱하는 데 특히 적합하다. 그러나, 일반적인 분자 생물학 방법은 DNA의 의도하지 않은 단편화를 초래할 수 있다. 예를 들어, 피펫팅과 와동은 DNA 분자를 파괴할 수 있는 전단력을 유발한다. 뉴클레아제 오염으로 인해 핵산이 분해되거나 단편화될 수 있다. 일부 실시형태에서, 천연 길이 또는 천연 길이의 실질적인 고분자량(HMW) 단편은 이동억제화, 신장 및 시퀀싱이 시작되기 전에 보존된다.
일부 실시형태에서, 폴리뉴클레오티드는 시퀀싱을 진행하기 전에 비교적으로 균질한 긴 길이(예를 들어, 약 1Mb 길이)로 의도적으로 단편화된다. 일부 실시형태에서, 폴리뉴클레오티드는 고정 또는 연장 후에 또는 그 동안 비교적으로 균질한 긴 길이로 단편화된다. 일부 실시형태에서, 단편화는 효소적으로 수행된다. 일부 실시형태에서, 단편화는 물리적으로 수행된다. 일부 실시형태에서, 물리적 단편화는 초음파처리를 통해 수행된다. 일부 실시형태에서, 물리적 단편화는 이온 충격 또는 방사선을 통해 수행된다. 일부 실시형태에서, 물리적 단편화는 전자기 방사를 통해 수행된다. 일부 실시형태에서, 물리적 단편화는 UV 조사를 통해 수행된다. 일부 실시형태에서, UV 조사의 용량은 주어진 길이로 단편화를 수행하도록 제어된다. 일부 실시형태에서, 물리적 단편화는 UV 조사 및 염료(예를 들어, YOYO-1)를 사용한 염색의 조합을 통해 수행된다. 일부 실시형태에서, 단편화 과정은 물리적 작용 또는 시약의 첨가에 의해 중단된다. 일부 실시형태에서, 단편화 과정의 중단에 영향을 미칠 수 있는 시약은 베타-메르캅토에탄올(BME)과 같은 환원제이다.
방사선량에 의한 단편화 및 시퀀싱
2-차원 이미저의 시야가 완전한 메가베이스 길이의 DNA를 2-차원 이미저의 1차원에서 관찰되도록 허용할 수 있는 일부 실시형태에서, 길이 1Mb의 게놈 DNA를 생성하는 것이 효율적이다. 다른 실시형태에서 여기서 더 크거나 작은 단편이 2-차원 이미저의 1차원 내에 피팅되는 단편에 의해 가시화될 수 있다. 추가 실시형태에서, 2-차원 이미저에 의해 단일 이미지로서 이미지화될 수 있는 것보다 더 큰 표적 핵산의 길이가 사용되며, 여기서 상이한 부분 표적 핵산의 이미지는 상이한 시간에 촬영되고 하나의 이미징 (c) 단계에서 표적 핵산의 하나 이상의 영역에 대한 하나 이상의 프레임으로 이미지화되거나, 또는 2차원 이미저 시야를 표적 핵산의 다른 부분으로 이동하기 전에 보다 완전한 시퀀싱의 과정이 수행되며, 이는 완전한 세트의 올리고뉴클레오티드 프로브 종 또는 그의 임의의 서브세트의 이용을 포함할 수 있다. 또한 염색체 길이 단편의 크기를 줄이는 것은 가닥의 엉킴을 최소화할 수 있고 잘-단리된 형태로 뻗어 있는 DNA의 최대 길이를 허용할 수 있다는 점에 유의해야 한다.
하기 단계를 포함하는 염색체의 긴 하위-단편을 시퀀싱하는 방법:
i) 염색체 이중-가닥 DNA를 염료로 염색하는 단계, 상기 염료는 이중-가닥 DNA의 염기 쌍 사이에 개재됨
ii) 원하는 크기 범위 내에서 염색체 DNA의 하위-단편을 생성하기 위해 개재하는 염료 염색된 염색체 DNA를 미리-결정된 용량의 전자기 조사에 노출하는 단계
iii) 표면 상에 개재하는 염료 염색된 염색체 하위-단편 DNA 연장 및 고정하는 단계
iv) 염색된 염색체 단편을 변성시켜 염기-쌍을 파괴하고 이에 의해 개재하는 염료를 방출하는 단계
v) 생성된 탈-염색된, 연장된, 고정된, 단일-가닥 염색체 단편을 원하는 길이 및 서열의 올리고뉴클레오티드 프로브 종의 하나 이상의 세트에 노출하는 단계
vi) 올리고뉴클레오티드 프로브 종의 하나 이상의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대한 탈-염색된 연장된 단일 가닥 염색체 단편을 따라 결합의 장소(들)를 결정하는 단계
vii) 하나 이상의 올리고뉴클레오티드 프로브 종의 세트에서 올리고뉴클레오티드 프로브 종의 결합의 장소를 축적하여 염색체 하위-단편의 완전한 시퀀싱을 얻는 단계.
일부 실시형태에서, 상기 기재된 바와 같이 염색체가 세포 안에 있을 때 염색이 일어날 수 있다. 일부 실시형태에서, 상기 기재된 바와 같이, 표지된 올리고뉴클레오티드는 더 많은 개재하는 염료 염색을 추가하고 후속적으로 듀플렉스가 형성될 때 듀플렉스 안으로 개재해는 결과로서 표지된다. 일부 실시형태에서, 상기 기재된 바와 같이, 선택적으로 변성 이외에, 염색을 탈색할 수 있는 전자기 조사의 용량이 적용된다. 상기의 일부 실시형태에서, 상기 미리-결정된 용량은 노출의 강도 및 지속시간을 조작하고 화학적 노출에 의한 단편화의 중지를 조작함에 의해 달성되며, 여기서 상기 화학적 노출은 베타-메르캅토에탄올과 같은 환원제이다. 상기의 일부 실시형태에서, 용량은 대략 1Mb 길이 단편의 푸아송 분포를 생성하도록 미리-결정된다.
고정 및 이동억제화 방법.
블록 204. 표적 핵산을 테스트 기판 상에 이중-가닥 선형 연신 형태로 고정함에 의해 고정 연신 이중-가닥 핵산을 형성한다. 선택적으로, 분자는 표면 또는 매트릭스 상에 고정된다. 일부 실시형태에서, 단편화된 또는 천연 중합체가 고정된다. 일부 실시형태에서, 고정된 이중-가닥 선형 핵산은 직선형일 수 있거나 곡선 또는 구불구불한 경로를 따를 수 있다.
일부 실시형태에서, 고정하는 것은 분자 다듬기(메니스커스 후퇴), 유동 신장, 나노구획, 또는 전기-신장에 의해 테스트 기판에 표적 핵산을 적용하는 것을 포함할 수 있다. 일부 실시형태에서, 표적 핵산을 기판에 적용 또는 고정하는 것은 표적 핵산이 기판에 공유 결합되는 UV 가교결합하는 단계를 추가로 포함할 수 있다. 일부 실시형태에서, 표적 핵산의 기판에 대한 UV 가교결합하는 것은 수행되지 않을 수 있고, 표적 핵산은 다른 수단(예를 들어, 소수성 상호작용, 수소 결합 등)을 통해 기판에 결합된다.
표적 핵산을 단지 한쪽 말단에 이동억제화하는 것(예를 들어, 고정하는 것)은 폴리뉴클레오티드가 비배위된 방식으로 신축 및 수축되도록 할 수 있다. 따라서, 어떤 연장 방법이 사용되든, 표적 핵산의 길이를 따른 신장의 백분율은 표적 핵산에서 임의의 특정 위치에 대해 변할 수 있다. 일부 실시형태에서, 표적 핵산을 따른 다중 장소의 상대적 위치가 고정되고 변동의 대상이 되지 않는 것이 필요하다. 이러한 실시형태에서, 연장된 표적 핵산은 그 길이를 따라 다중 접촉점에 의해 표면에 이동억제화되거나 고정된다(예를 들어, Michalet 외, Science 277:1518-1523, 1997의 분자 다듬기 기술에서 수행된 바와 같음; 또한 표면 상의 신장하는 것에 대해서는 Molecular Combing of DNA: Methods and Applications, Journal of Self-Assembly and Molecular Electronics (SAME) 1:125-148을 참조하여 사용될 수 있다(예를 들어, ACS Nano. 2015 Jan 27;9(1):809 -16)), 및 Bensimon 등의 US6344319, 및 Dedecker 등의 US20130130255에서 기술된 바와 같음.
일부 실시형태에서, 표적 핵산의 어레이는 표면 상에 고정되고, 일부 실시형태에서, 어레이의 표적 핵산은 회절-제한 이미징에 의해 개별적으로 분해될 만큼 충분히 멀리 떨어져 있다. 일부 실시형태에서, 표적 핵산은 주어진 표면 영역 내에서 표적 핵산이 최대로 패킹되고 표적 핵산이 중첩되지 않을 수 있도록 정렬된 방식으로 표면 상에 고정된다. 일부 실시형태에서, 이는 패턴화된 표면(예를 들어, 표적 핵산의 말단이 결합할 수 있는 그러한 장소에서 소수성 패치 또는 스트립의 정렬된 배열)을 제조함에 의해 달성된다. 일부 실시형태에서, 어레이의 표적 핵산은 회절 제한 이미징에 의해 개별적으로 분해될 만큼 충분히 떨어져 있지 않을 수 있고 초-해상도 방법에 의해 개별적으로 분해된다.
일부 실시형태에서, 표적 핵산은 DNA 커튼을 이용하여 조직화된다(Greene 외, Methods Enzymol. 472:293-315, 2010). 이것은 긴 표적 핵산에 특히 유용하다. 이러한 실시형태에서, 일시적인 결합은 한쪽 말단에 부착되고 유동 또는 전기영동 힘에 의해 연장되는 DNA 가닥 동안, 또는 가닥의 양 말단이 포획된 후에 기록된다. 일부 실시형태에서, DNA 커튼 방법에서 이용되는 복수의 표적 핵산을 형성할 수 있는 동일한 표적 핵산 서열의 많은 카피가 있는 경우, 서열은 하나의 표적 핵산보다는 오히려 복수의 표적 핵산으로부터 집합체로 결합 패턴으로부터 조립된다. 일부 실시형태에서, 표적 핵산의 양 말단은 패드(예를 들어, 테스트 기판의 다른 섹션보다 표적 핵산에 더 강하게 결합할 수 있는 테스트 기판의 영역)에 결합할 수 있고, 각각의 말단은 상이한 패드에 결합할 수 있다. 일부 실시형태에서, 단일 선형 표적 핵산이 결합할 수 있는 2개의 패드는 단일 선형 표적 핵산의 신장된 구성을 제자리에 유지할 수 있고 동등하게 이격된, 비-중첩 또는 비-상호작용 단일 선형 표적 핵산의 정렬된 어레이가 형성되도록 허용할 수 있다. 일부 실시형태에서, 단 하나의 표적 핵산만이 개별 패드를 점유할 수 있다. 일부 실시형태에서, 패드가 푸아송 과정을 사용하여 채워지는 경우, 일부 패드는 무 표적 핵산에 의해, 일부는 하나의 무 표적 핵산에 의해, 일부는 하나 초과의 무 표적 핵산에 의해 점유된다.
일부 실시형태에서, 표적 핵산인 표적 분자는 정렬된 초분자 스캐폴드(예를 들어, DNA 오리가미 구조) 상에 포획된다. 일부 실시형태에서, 스캐폴드 구조는 표적 핵산인 표적 분자를 포획하기 위한 용액상 동역학의 이점을 이용하기 위해 유리 용액에서 초기에 사용될 수 있다. 일단 점유되면, 스캐폴드는 표면 상에 정착하거나 자가-조립될 수 있고 표면에 결합된다. 정렬된 어레이는 시야당 더 높은 밀도의 분자(고밀도 어레이)를 허용하는 분자의 효율적인 하위-회절 패킹을 가능하게 할 수 있다. 단일 분자 국지화 방법은 고밀도 어레이 내의 표적 핵산인 표적 분자가 초-분해될 수 있도록 허용할 수 있다(예를 들어, 점간 거리 40nm 이하).
일부 실시형태에서, 헤어핀은 듀플렉스 표적 핵산의 말단 상에 (선택적으로 표적 핵산의 말단을 폴리싱한 후) 결찰된다. 일부 실시형태에서, 헤어핀은 표적 핵산을 표면에 이동억제화할 수 있는 비오틴을 함유할 수 있다. 대안적인 실시형태에서, 헤어핀은 듀플렉스 표적 핵산의 2개 가닥을 공유적으로 연결하는 역할을 할 수 있다. 일부 이러한 실시형태에서, 표적 핵산의 다른 말단은 예로서 올리오 d(T) 또는 특정 서열에 의한 표면 포획을 위해 꼬리가 달려 있다. 변성 후 표적 핵산의 양 가닥은 올리고뉴클레오티드 또는 다른 프로브 종과의 상호작용에 이용가능하다.
일부 실시형태에서, 정렬된 어레이는 함께 연결되어 큰 DNA 격자를 형성하는 개별 스캐폴드의 형태를 취할 수 있다(예를 들어, Woo and Rothemund, Nature Communications, 5: 4889에 기술된 바와 같음). 일부 이러한 실시형태에서, 개별 작은 스캐폴드는 염기-쌍화에 의해 서로에 대해 잠겨질 수 있다. 일부 실시형태에서, 작은 스캐폴드는 함께 결합하여 본 명세서에 기술된 바와 같은 시퀀싱 단계를 위한 고도로 정렬된 나노구조의 어레이를 제시할 수 있다. 일부 실시형태에서, 포획 부위는 정렬된 2-차원 격자에서 10nm 피치로 배열된다. 완전히 점하는 경우 이러한 격자는 제곱센티미터당 1조 분자 정도를 포획하는 용량을 갖는다.
일부 실시형태에서, 격자 내의 포획 부위는 정렬된 2-차원 격자에서 5nm 피치, 10nm 피치, 15nm 피치, 30nm 피치, 또는 50nm 피치로 배열된다. 일부 실시형태에서, 격자 내의 포획 부위는 정렬된 2-차원 격자에서 5nm 피치와 50nm 피치 사이에 배열된다.
일부 실시형태에서, 표적 핵산 또는 다른 표적 분자의 정렬된 어레이는 나노유체를 사용하여 생성된다. 하나의 이러한 예에서, 나노트렌치 또는 나노그루브의 어레이(예를 들어, 100nm 폭 및 150nm 깊이)가 표면 안으로 형성되고 긴 표적 핵산을 정렬하는 역할을 한다. 이러한 실시형태에서, 나노트렌치 또는 나노그루브에서 하나의 표적 핵산의 발생은 다른 표적 핵산의 진입을 배제할 수 있다. 다른 실시형태에서, 나노피트 어레이가 사용되며, 여기서 긴 표적 핵산의 세그먼트는 피트 내에 있고, 피트 내에 결합되고 표적 핵산의 개재되는 긴 세그먼트는 피트 사이에 분산된다.
일부 실시형태에서, 표적 핵산의 고밀도는 여전히 초-해상도 이미징 및 정밀한 시퀀싱을 허용할 수 있다. 예를 들어, 일부 실시형태에서 여기서 표적 핵산의 서브세트만이 관심 있는 것이다(예를 들어, 표적화된 시퀀싱). 이러한 실시형태에서, 표적 핵산의 서브세트 및 또는 복합 샘플(예를 들어, 전체 게놈 또는 전사체, 다중 게놈)로부터의 표적 핵산의 영역만이 표적화된 시퀀싱이 수행되고 표적 핵산이 통상보다 높은 밀도로 테스트 기판 또는 매트릭스에 고정될 때 분석될 필요가 있을 수 있다. 이러한 실시형태에서, 회절 제한된 공간 또는 SMLM 해상도 공간 내에 존재하는 여러 폴리뉴클레오티드가 있는 경우에도, 신호가 검출될 때, 그것이 표적화된 유전자좌 중 단지 하나에서 유래하고 이 유전자좌가 동일한 올리고뉴클레오티드 프로브 종에 동시에 결합되는 또 다른 이러한 유전자좌의 회절 제한된 거리 또는 SMLM 해상도 공간 내에 있지 않을 가능성이 높다. 표적화된 시퀀싱을 겪는 각 표적 핵산 사이의 필요한 거리는 표적화되는 폴리뉴클레오티드의 백분율과 상관관계가 있다. 예를 들어, 폴리뉴클레오티드의 <5%가 표적화되면 폴리뉴클레오티드의 밀도는 모든 표적 핵산 서열이 필요한 경우보다 20배 더 크다. 표적화된 시퀀싱의 일부 실시형태에서, 이미징 시간은 전체 게놈이 분석되는 경우보다 더 짧다(예를 들어, 상기 예에서 표적화된 시퀀싱 이미징은 전체 게놈 시퀀싱보다 10X 더 빠를 수 있음).
일부 실시형태에서, 테스트 기판은 고정 단계 이전에 서열-특이적 올리고뉴클레오티드 프로브 종과 결합되고, 고정 단계는 테스트 기판에 결합된 서열-특이적 올리고뉴클레오티드 프로브 종을 사용하여 테스트 기판 상에 표적 핵산을 포획 또는 고정하는 것을 포함할 수 있다. 일부 실시형태에서, 표적 핵산은 5' 말단에 고정되거나 결합된다. 일부 실시형태에서, 표적 핵산은 3' 말단에 고정되거나 결합된다. 또 다른 실시형태에서, 테스트 기판 상에 2개의 별개의 프로브가 있는 경우, 하나의 프로브는 표적 핵산의 제1 말단에 고정 또는 결합할 수 있고, 제2 프로브는 표적 핵산의 제2 말단에 고정 또는 결합할 수 있다. 두 개의 프로브가 사용되는 경우에, 표적 핵산의 길이에 관한 사전 정보를 갖는 것이 바람직할 수도 있다. 일부 실시형태에서, 표적 핵산은 테스트 기판에 고정 또는 결합하기 이전에 미리결정된 엔도뉴클레아제로 절단된다. 추가 실시형태에서, 표적 핵산은 초기에 한쪽 또는 양쪽 말단에서 고정 또는 결합한 후 표적 핵산의 길이를 따라 추가 지점에서 고정되거나 결합되게 된다.
다양한 실시형태에서, 고정 이전에 표적 핵산이 겔 또는 매트릭스 안으로 추출되거나 그 안에 포매된다(예를 들어, Shag 외, Nature Protocols 7:467-478, 2012에 기재된 바와 같음). 하나의 이러한 비-제한적인 예에서, 표적 핵산은 액체에서 겔로의 전이를 겪는 매질을 함유하는 유로에 침착된다. 표적 핵산은 초기에 연장되어 액상으로 분포된 다음, 상을 고체/겔 상으로 변화시킴에 의해 (예를 들어, 가교 결합을 일으키거나 가속화할 수 있는 가열에 의해, 또는 폴리아크릴아미드의 경우에는 보조-인자를 부가함에 의해 또는 시간과 함께) 고정된다. 일부 실시형태에서, 표적 핵산은 고체/겔 상에서 연장된다.
일부 대안적인 실시형태에서, 하나 이상의 올리고뉴클레오티드 프로브 종은 테스트 기판 또는 매트릭스 상에 또는 내에 이동억제된다. 이러한 실시형태에서, 하나 이상의 표적 핵산은 용액 중에 현탁되고 하나 이상의 고정된 올리고뉴클레오티드 프로브 종에 일시적으로 결합할 수 있다. 일부 실시형태에서, 하나 이상의 올리고뉴클레오티드 프로브 종의 공간적으로 어드레스할 수 있는 어레이가 표적 핵산을 포획하기 위해 사용된다. 일부 실시형태에서, 여기서 무세포 DNA 또는 microRNA와 같은 짧은 표적 핵산(예를 들어, <300개 뉴클레오티드) 또는 mRNA와 같은 비교적 짧은 표적 핵산(예를 들어, <10,000개 뉴클레오티드)이 하나 이상의 올리고뉴클레오티드 프로브 종을 포함할 수 있거나 비오틴 아비딘과 같은 다른 결합 기전을 포함할 수 있는 적절한 포획 분자를 사용하여 표적 핵산의 변형된 또는 비-변형된 말단을 포획함에 의해 표면 상에 무작위로 이동억제된다. 일부 실시형태에서, 짧거나 비교적 짧은 표적 핵산은 테스트 기판과 다중 상호작용을 가지고, 시퀀싱은 테스트 기판에 평행한 방향으로 수행된다. 따라서 스플라이싱 이소폼 조직화 또는 구조적 DNA 변형이 해결된다. 예를 들어, 일부 이소폼에서는 반복되거나 뒤섞인 엑손의 장소가 묘사되거나 결정될 수 있으며, 또는 암세포에서는 유의한 구조적 재배열이 발생할 수 있고 이러한 구조적 재배열 및 유전자 또는 DNA의 중요한 비암호화 영역과의 관계가 묘사되거나 결정된다.
일부 실시형태에서, 고정된 프로브는 표적 핵산에 어닐링할 수 있는 공통 서열을 포함할 수 있다. 이러한 실시형태는 표적 핵산이 하나 또는 양 말단에서 발생할 수 있는 공통 서열을 가질 때 특히 유용하다. 일부 실시형태에서, 표적 핵산은 단일 가닥이고 폴리A 꼬리와 같은 공통 서열을 갖는다. 하나의 그러한 예에서, 폴리아데닐화된 꼬리를 수반하고 폴리아데닐화된 꼬리가 추가된 천연 mRNA는 예를 들어 블런트 결찰 또는 스프린트 올리고를 이용하여 천연 mRNA의 5' 말단에 결찰을 사용하고, 테스트 기판 또는 기타 표면 또는 매트릭스 상의 올리고뉴클레오티드 polyd(T) 프로브의 어레이 또는 론 상에 포획된다. 일부 실시형태, 특히 짧은 DNA가 분석되는 것들에서, 표적 핵산의 말단은 예를 들어 특이적 짧은 올리고를 결찰함에 의해 또는 테스트 기판 또는 기타 표면 또는 매트릭스 상의 특이적 상보적 올리고뉴클레오티드 프로브 종인 포획 분자와의 상호작용을 위해 비오틴을 결합함에 의해 적응된다.
일부 실시형태에서, 표적 핵산은 제한 효소에 의해 생성되는 점착성 말단을 갖는 이중 가닥 DNA를 포함할 수 있다. 일부 비-제한적 예에서, 드문 부위를 갖는 제한 효소(예를 들어, Pmme1 또는 NOT1)를 사용하여 표적 핵산의 긴 단편을 생성하며, 각 단편은 공통 말단 서열을 갖는 점착성 말단을 함유한다. 일부 실시형태에서, 적응은 말단 전이효소를 사용하여 수행된다. 다른 실시형태에서, 결찰 또는 태깅화는 일루미나 시퀀싱의 사용자에 의해 이용되는 것과 유사한 방식으로 어댑터를 도입하는 데 사용된다. 이를 통해 사용자는 잘-확립된 일루미나 프로토콜을 사용하여 샘플을 준비할 수 있으며, 이것은 그 다음 본 명세서에 기술된 방법에 의해 포획되고 서열화될 수 있다. 이러한 실시형태에서, 표적 핵산은 오류 및 바이어스을 도입하고 천연 표적 핵산의 일부를 포함할 수 있는 임의의 후성유전 정보를 제거하는 임의의 증폭 전에 시퀀싱을 위해 포획되거나 고정된다.
연장의 방법
대부분의 실시형태에서, 폴리뉴클레오티드 또는 다른 표적 분자, 예컨대 표적 핵산, 표적 단백질, 표적 폴리펩타이드 또는 표적 펩타이드는 발생하는 연장을 위해 테스트 기판, 표면 또는 매트릭스에 부착, 결합 또는 고정될 필요가 있을 수 있다. 일부 실시형태에서, 표적 핵산의 연장은 표적 핵산을 그의 결정학적 길이와 같게, 더 길거나 더 짧게 만든다(예를 들어, dsDNA에 대해 한 염기에서 다음 염기로의 공지된 원 위치에서 0.34nm 분리가 있는 경우). 일부 실시형태에서, 표적 핵산은 원 위치에서 결정학적 길이보다 더 길게 신장된다.
일부 실시형태에서, 표적 핵산은 분자 다듬기를 통해 신장된다(예를 들어, Michalet 외, Science 277:1518-1523, 1997 및 Deen 외, ACS Nano 9:809-816, 2015에 기재된 바와 같음). 이것은 수백만 및 수십억 개의 표적 핵산을 병렬로 신장 및 단방향 정렬을 가능하게 할 수 있다. 일부 실시형태에서, 분자 다듬기는 원하는 표적 핵산을 함유하는 용액을 테스트 기판 상으로 세정한 다음 용액의 메니스커스를 수축시킴에 의해 수행된다. 메니스커스를 수축시키기 이전에 표적 핵산은 테스트 기판과 공유 또는 기타 상호작용을 형성할 수 있다. 용액이 물러감에 따라 표적 핵산은 메니스커스와 같은 방향으로 (예를 들어, 표면 보유를 통해) 당겨진다; 그러나, 표적 핵산과 테스트 기판 사이의 상호작용을 결합 또는 고정하는 강도가 표면 보유력을 극복하기에 충분하다면 표적 핵산은 물러나는 메니스커스의 방향에서 균일한 방식으로 신장된다. 일부 실시형태에서, 분자 다듬기는 Kaykov 외, Sci Reports. 6:19636 (2016)에 기재된 바와 같이 수행되며, 이는 그 전체가 참고로 본 명세서에 포함된다. 다른 실시형태에서, 분자 다듬기는 Petit 외 Nano Letters 3:1141-1146(2003)에 기술된 방법 또는 수정된 버전의 방법을 사용하여 채널(예를 들어, 마이크로유체 장치)에서 수행된다.
공기/물 계면의 형태는 분자 다듬기에 의해 신장되는 연장된 표적 핵산의 방향화를 결정할 수 있다. 일부 실시형태에서, 표적 핵산은 공기/물 계면에 수직으로 연장된다. 일부 실시형태에서, 표적 핵산은 하나의 그 말단의 변형 없이 테스트 기판 또는 다른 표면에 부착, 결합 또는 고정되거나 그 말단 중 어느 하나에 변형 없이 결합 또는 고정된다. 일부 실시형태에서, 이중-가닥 표적 핵산의 말단이 소수성 상호작용에 의해 포획되는 경우, 물러나는 메니스커스로의 신장은 이중-가닥 표적 핵산의 일부를 변성시키고 테스트 기판 또는 표면과 추가적인 소수성 상호작용을 형성하게 할 수 있다.
일부 실시형태에서, 표적 핵산은 분자 스레딩을 통해 신장된다(예를 들어, Payne 외, PLoS ONE 8(7):e69058, 2013에 기술된 바와 같음). 일부 실시형태에서, 분자 스레딩은 표적 핵산이 단일 가닥으로 변성된 후에 (예를 들어, 화학적 변성제, 온도 또는 효소, 염 농도 또는 pH에 의해) 수행된다. 일부 실시형태에서, 표적 핵산은 일 말단에서 묶인 다음 유체 유동을 이용하여 신장된다(예를 들어, Greene 외, Methods in Enzymology, 327: 293-315에 예시된 바와 같음).
다양한 실시형태에서, 표적 핵산은 미세-유체 채널 내에 존재한다. 일부 실시형태에서, 표적 핵산은 마이크로유체 채널 안으로 흐르거나 하나 이상의 염색체, 엑소솜, 핵 또는 세포로부터 유로 안으로 추출된다. 일부 실시형태에서, 표적 핵산을 마이크로- 또는 나노유체 유동 셀을 통해 나노채널 안으로에 삽입하는 것보다 표적 핵산은 채널의 벽 및 또는 바닥을 형성할 수 있는 표면이 전기적으로 바이어스되는 방식으로 나노-채널 또는 마이크로-채널인 하나 이상의 채널을 구성함에 의해 개방형-상부 채널 안으로 삽입된다(예를 들어, Asanov 외, Anal Chem. 1998 Mar. 15; 70(6):1156-6 참조). 일부 실시형태에서, 채널의 벽 및 또는 바닥을 형성할 수 있는 표면에 양의 바이어스가 적용되어 음으로 하전된 표적 핵산이 나노채널 안으로 끌어당겨진다. 동시에, 채널 사이의 영역은 전기적으로 바이어스되지 않을 수 있어 표적 핵산이 채널 사이의 영역 상에 침착될 가능성이 적다.
일부 실시형태에서, 연장은 유체역학적 당기기에 의해 수행된다. 일부 실시형태에서, 표적 핵산은 나노슬릿에서 직교류를 통해 신장된다(Marie 외, Proc Natl Acad Sci USA 110:4893-8, 2013). 일부 실시형태에서, 표적 핵산의 연장은 유로에서의 나노구획에 의해 실행된다. 유동 신장 나노구획은 일반적으로 마이크로유체 또는 나노유체 장치 내에서 수행되는 유동 구배를 통해 선형 형태로 표적 핵산을 신장하는 것을 포함할 수 있다. 이 신장 방법을 이용할 수 있는 마이크로유체 또는 나노유체 소자의 나노구획 부분은 마이크로유체 또는 나노유체 장치의 좁은 영역을 지칭할 수 있다. 좁은 영역이나 채널의 사용은 분자 개체주의의 문제(예를 들어, 신장 동안 개별 핵산 또는 기타 중합체가 다중 구조를 채택하는 경향)를 극복하는 데 도움이 될 수 있다. 유동 신장 방법의 한 가지 문제는 유동이 표적 핵산을 따라 항상 균등하게 적용되지 않을 수 있다는 것이다. 이것은 연장 길이의 넓은 범위인 범위를 나타내는 표적 핵산을 생성할 수 있다. 일부 실시형태에서, 유동 신장 방법은 연장의 유동 및/또는 유체역학적 당기기를 포함할 수 있다. 일부 실시형태에서, 표적 핵산이 마이크로채널 또는 나노채널 안으로 끌어 당겨지는 경우, 하나 이상의 표적 핵산은 마이크로채널 또는 나노채널에 나노한정되고 이에 의해 연장된다. 일부 실시형태에서, 나노한정 후 표적 핵산은 바이어스된 표면 또는 테스트 기판 또는 다른 표면 상부의 코팅 또는 매트릭스 상에 침착, 결합 또는 고정된다.
일부 실시형태에서, 표면에 양성 또는 음성 바이어스를 적용하는 다중 방법 중 임의의 것이 이용된다. 일부 실시형태에서, 테스트 기판 또는 다른 표면은 비-오염 특성을 갖는 물질로 제조되거나 코팅되고, 테스트 기판 또는 다른 표면은 지질(예를 들어, 지질 이중층), 소 혈청 알부민(BSA), 카제인, 다양한 PEG 유사체 등에 의해 부동태화된다. 부동태화는 채널의 임의의 한 부분에서 폴리뉴클레오티드 격리, 결합 또는 고정을 방지하는 역할을 할 수 있으므로 연장 및 또는 더 균일한 연장을 가능하게 할 수 있다. 일부 실시형태에서, 테스트 기판 또는 다른 표면은 또한 인듐 주석 산화물(ITO) 또는 넓은 스펙트럼의 투명한 전도성 산화물, 전도성 중합체, 그래핀, 매우 얇은 금속 필름 등과 같은 다른 투명한 전기적으로 전도성 표면을 포함할 수 있다.
일부 실시형태에서, 마이크로유체 또는 나노유체 채널을 포함하는 테스트 기판 또는 다른 표면 상의 지질 이중층(LBL)의 생성을 위해, 1% Lissamine™ 로다민 B 1,2-디헥사데카노일-sn-글리세로-3-포스포에탄올아민을 갖는 쯔비터이온성 POPC(1-팔미토일-2-올레오일-sn-글리세로-3-포스포콜린) 지질이 표면 상으로 코팅된다. 트리에틸암모늄 염(로다민-DHPE) 지질의 추가는 형광 현미경으로 LBL 형성의 관찰을 가능하게 할 수 있다. 본 개시내용의 일부 실시형태에서 사용되는 지질 이중층 부동태화의 방법은 Persson 외, Nano Lett. 12:2260-2265, 2012에 의해 기술되어 있다.
일부 실시형태에서, 하나 이상의 표적 핵산의 연장은 전기영동 또는 유전영동을 통해 수행된다. 일부 실시형태에서, 표적 핵산은 일 말단에 묶인 다음 전기장에 의해 신장된다(예를 들어, Giese 외, Nature Biotechnology 26: 317-325, 2008에 기재된 바와 같음). 핵산의 전기-신장은 핵산이 고도로 음으로 하전된 분자라는 사실에 근거한다. 예를 들어 Randall 외 2006, Lab Chip. 6, 516-522에 의해 기술된 바와 같은 전기-신장의 방법은 전기장에 의해 (표적 핵산 분자의 배향화를 유도하기 위해) 마이크로채널 또는 나노채널을 통해 유도되는 핵산을 포함한다. 일부 실시형태에서, 전기-신장은 겔 또는 얽힌 중합체 내에서 또는 그것 없이 수행된다. 겔 또는 얽힌 중합체를 사용하는 한 가지 이점은 표적 핵산에 이용가능한 3-차원 공간을 제한하여 분자 개체주의를 극복하는 데 도움이 된다는 것이다. 나노구획과 같은 압력-구동 신장 방법에 비해 전기-신장의 일반적인 이점은 핵산 분자를 파괴하기에 충분한 전단력이 없다는 것이다.
일부 실시형태에서, 복수의 폴리뉴클레오티드가 테스트 기판 또는 다른 표면 상에 존재할 때, 표적 핵산은 동일한 배향화로 정렬되지 않을 수 있거나 직선이 아닐 수 있다(예를 들어, 표적 핵산은 테스트 기판 또는 다른 표면에 부착, 결합 또는 고정될 수 있거나 또는 곡선의 경로에서 겔 또는 얽힌 중합체를 통해 나사산이 형성된다). 이러한 실시형태에서, 복수의 표적 핵산 중 2개 이상이 중첩될 가능성이 증가하여, 각각의 표적 핵산의 길이를 따라 프로브의 국지화에 관한 잠재적인 혼란을 초래한다. 일부 실시형태에서, 직선의 잘-정렬된 표적 핵산에서와 동일한 시퀀싱 정보가 곡선형 표적 핵산으로부터 얻어지지만, 곡선형 표적 핵산으로부터 시퀀싱 정보를 처리하는 이미지 처리 작업은 직선의 잘-정렬된 표적 핵산으로부터 얻어진 것보다 더 많은 계산 능력 또는 시간을 요할 수 있다.
실시형태에서, 하나 이상의 표적 핵산이 테스트 기판의 표면인 평면 표면에 평행한 방향으로 연장되는 경우, 표적 핵산의 길이는 CMOS 또는 CCD 카메라와 같은 어레이 검출기인 2-차원 이미저에서 일련의 인접한 픽셀에 걸쳐 이미지화된다. 일부 실시형태에서, 하나 이상의 표적 핵산은 테스트 기판 또는 다른 표면에 수직인 방향으로 연장된다. 일부 실시형태에서, 표적 핵산은 광 시트 현미경, 회전 디스크 공초점 현미경, 3-차원 초해상도 현미경, 3-차원 단일 분자 국지화, 또는 레이저 스캐닝 디스크 공초점 현미경 또는 이의 변이체를 통해 이미지화된다. 일부 실시형태에서, 표적 핵산은 테스트 기판 또는 다른 표면에 대해 비스듬한 각도로 연장된다. 일부 실시형태에서, 표적 핵산은 2-차원 이미저 또는 검출기를 통해 이미지화되고 결과 이미지 또는 프레임은 단일 분자 국지화 알고리즘 소프트웨어(예를 들어, Ovesny 외, BioInform.30:2389-2390, 2014에서 기술된 바와 같은 Fiji/ ImageJ plug-in ThunderSTORM)를 통해 처리된다.
고정 및 연장 이전에 단일 세포로부터 DNA를 추출 및 단리하는 것.
일부 실시형태에서, 개별 세포에서 표적 핵산이 방출되는 동안 개별 세포를 한 장소에 유지하도록 마이크로유체 구조 내에 단일 세포에 대한 트랩이 설계된다(예를 들어, WO/2012/056192 또는 WO/2012/055415의 장치 설계를 사용함에 의함). 일부 실시형태에서, 나노채널에서 표적 핵산을 추출 및 신장하는 대신, 커버-유리 또는 호일이 미세/나노유체 구조를 밀봉하는 데 사용되며, 이는 분자 다듬기를 가능하게 하기 위해 폴리비닐실란으로 추가로 코팅될 수 있다(예를 들어, Petit 외, Nano Letters 3:1141-1146. 2003에 의해 기술된 바와 같은 유체의 움직임에 의함). 유동성 칩 내부의 온화한 조건은 추출된 표적 핵산이 긴 길이로 보존되도록 할 수 있다.
단일 세포 또는 핵으로부터 생체고분자를 추출하기 위해 다수의 상이한 접근방식이 이용가능하다(예를 들어, 일부 적합한 방법은 Kim 외, Integr Biol 1(10), 574-86, 2009에서 검토됨). 일부 비-제한적 예에서, 세포는 세포막을 파열시키거나 제거하기 위해 고농도의 KCL로 처리된다. 세포는 저장 용액을 추가함에 의해 용해된다. 일부 실시형태에서, 각 세포는 별도로 단리되고, 각 세포의 DNA는 별도로 추출되고, 그 다음 단일 세포와 연관된 표적 핵산의 각 세트는 마이크로유체 용기 또는 장치에서 별도로 서열화된다. 일부 실시형태에서, 표적 핵산 추출은 하나 이상의 세포를 세제 및/또는 단백질분해효소로 처리함에 의해 발생할 수 있다. 일부 실시형태에서, 킬레이트화제(예를 들어, EDTA 또는 EDDS)는 뉴클레아제에 의해 요구되는 2가 양이온을 포획하기 위해 (그리고 따라서 뉴클레아제 활성을 감소시키기 위해) 용해 용액에 제공된다.
일부 실시형태에서, 단일 세포의 핵 및 여분의 핵 성분은 다음 방법에 의해 별도로 추출된다. 하나 이상의 세포는 마이크로유체 장치의 공급 채널에 제공된다. 그런 다음 하나 이상의 세포가 포획될 수 있으며, 여기서 각 세포는 하나의 트래핑 구조에 의해 포획된다. 제1 용해 완충액은 하나 이상의 포획된 세포가 있는 마이크로유체 장치의 트래핑 구조 안으로 흘러 들어가며, 여기서 제1 용해 완충액은 세포 막을 용해할 수 있지만 세포 핵의 무결성을 보존할 수 있다. 제1 용해 완충액이 흐르면 마이크로유체 장치의 트래핑 구조에 있는 하나 이상의 포획된 세포의 핵외 성분이 방출된 RNA와 세포질이 이동억제된 마이크로유체 장치 내의 유동 셀 안으로 방출된다. 그 다음 하나 이상의 포획된 세포 또는 그의 잔류물을 갖는 마이크로유체 장치의 트래핑 구조에 제2 용해 완충액을 공급함에 의해 하나 이상의 핵이 추가로 용해될 수 있다. 제2 용해 완충액의 추가는 마이크로유체 장치에서 유동 셀 안으로 하나 이상의 핵 및/또는 미토콘드리아의 구성성분(예를 들어, 게놈 DNA 또는 미토콘드리아 DNA)의 방출을 야기할 수 있으며 여기서 DNA는 후속적으로 이동억제화될 수 있다. 하나 이상의 세포의 핵외 및 세포내 구성성분은 동일한 유동 셀의 다른 장소에서 또는 동일한 마이크로유체 장치 내의 다른 유동 셀 또는 다른 마이크로유체 장치에 이동억제된다.
도 16a 및 16b의 개략도는 다중 단일 세포를 포획 및 단리할 수 있는 마이크로유체 구성을 나타낸다. 세포(1602)는 유동 셀(2004) 내에서 세포 트랩(1606)에 의해 포획된다. 일부 실시형태에서, 세포가 포획된 후, 용해 시약은 세포 트랩(1606)으로 예시된 내부 및 이를 통해 유동된다. 용해 후, 핵산(1608)은 그 다음 다른 세포(1602)로부터 추출된 핵산(1608)으로부터 단리된 채로 남아 있으면서 포획 트랩(1606)에 가깝게 분포될 수 있다. 일부 실시형태에서, 도 16b에 예시된 바와 같이, 전기영동의 유도가 (예를 들어, 전하(1610)을 사용하여) 수행되어 핵산을 조작한다. 용해는 세포(1602) 및 핵(1604)으로부터 핵산(1608)을 방출할 수 있다. 핵산(1608)은 세포(1602)가 포획되었을 때 핵산(1608)이 있었던 위치(예를 들어, 세포 트랩(1606)에 비해)에 남아 있을 수 있다. 트랩은 단일 세포의 치수이다(예를 들어, 2-10μm). 일부 실시형태에서, 미세액적 및 마이크로유체 장치 유동 셀을 함께 담지하는 샘플을 수반하는 채널은 2μm, 10μm 또는 10μm 초과보다 더 넓고 더 높다. 일부 실시형태에서, 분기 채널과 트랩 사이의 거리는 1-1000 미크론이다.
표면 상에 고분자량 DNA를 추출 및 연장하는 것.
HMW 폴리뉴클레오티드를 신장하기 위한 다양한 방법이 상이한 실시형태에서 사용된다(예를 들어, ACS Nano. 9(1):809-16, 2015). 하나의 그러한 예에서, 표면 상의 연장은 유동 셀에서 수행된다(예를 들어, Nano. Lett. 3: 1141-1146, 2003에서 Petit 및 Carbeck에 의해 기술된 접근방식을 사용함에 의함). 유체 또는 마이크로유체 접근방식에 부가하여, 일부 실시형태에서, 폴리뉴클레오티드는 Giess 외, Nature Biotechnology 26, 317 - 325 (2008)에 개시된 것과 같은 전기장을 사용하여 신장된다. 폴리뉴클레오티드가 표면에 부착되지 않은 경우 폴리뉴클레오티드를 연장하기 위해 여러 접근방식이 이용가능하다(예를 들어, Frietag 외, Biomicrofluidics, 9(4):044114 (2015); Marie 외, Proc Natl Acad Sci USA 110:4893-8, 2013).
일부 실시형태에서, 겔 플러그에서 DNA를 사용하는 것에 대한 대안으로서, 테스트 기판을 포함할 수 있는 마이크로유체 장치 상에 장입하기에 적합한 염색체는 Cram 외, Methods Cell Sci., 2002, 24, 27-35에 의해 기술된 바와 같은 폴리 아민 방법에 의해 제조되고, 테스트 기판을 포함할 수 있는 마이크로유체 장치 안으로 직접적으로 피펫팅된다. 일부 이러한 실시형태에서, 염색체에서 DNA에 결합된 단백질은 단백질분해효소를 사용하여 분해되어 실질적으로 네이키드 DNA를 방출하며, 이는 그 다음 상기 기재된 바와 같이 고정되고 연장될 수 있다.
판독의 장소의 보존을 위해 샘플을 처리하는 것.
매우 긴 영역 또는 중합체가 시퀀싱되어야 하는 실시형태에서, 표적 핵산의 임의의 분해는 전반적인 시퀀싱의 정확도를 유의하게 감소시킬 가능성이 있다. 전체 연장된 중합체의 보존을 용이하게 하는 방법이 아래에 제시되어 있다.
표적 핵산은 추출, 저장 또는 준비 동안 손상될 가능성이 있다. 닉, 갭, 염기의 산화, 시토신의 박리 및 첨가 생성물은 천연 이중-가닥 게놈 DNA 분자에서 형성될 수 있다. 이는 샘플 폴리뉴클레오티드가 FFPE 물질로부터 유래된 경우에 특히 그렇다. 따라서, 일부 실시형태에서, DNA 복구 용액은 DNA가 고정되기 전 또는 후에 도입된다. 일부 실시형태에서, DNA 복구는 겔 플러그 안으로 DNA 추출 후에 수행된다. 일부 실시형태에서, 복구 용액은 DNA 엔도뉴클레아제, 키나제 및 기타 DNA 변형 효소를 함유할 수 있다. 일부 실시형태에서, 복구 용액은 폴리머라제 및 리가제를 포함할 수 있다. 일부 실시형태에서, 복구 용액은 New England Biolabs의 사전-PCR 키트이다. 일부 실시형태에서, 이러한 방법은 주로 Karimi-Busheri 외, Nucleic Acids Res. Oct 1;26(19):4395-400, 1998 및 Kunkel 외, Proc. Natl Acad Sci. USA, 78, 6734-6738, 1981에 기술된 바와 같이 수행된다. 다른 실시형태에서, 표적 핵산 손상을 검출하는 것이 바람직하다. 예를 들어, 하나 이상의 DNA 첨가 생성물의 수와 장소를 결정하는 것이 바람직하다. 이러한 실시형태에서, 추가의 표지된 첨가 생성물 특이적 결합 모이어티가 시퀀싱 방법의 일부로서 이용된다.
일부 실시형태에서, 표적 핵산이 연장된 후, 겔 오버레이가 적용된다. 일부 이러한 실시형태에서, 테스트 기판 또는 다른 표면 상의 연장 및 변성 후, 이중-가닥 또는 변성된 표적 핵산은 겔 층으로 도포된다. 대안적으로, 표적 핵산은 이미 겔 환경에 있는 동안 연장된다(예를 들어, 상기 기재된 바와 같음). 일부 실시형태에서, 표적 핵산이 연장된 후 겔에서 캐스팅된다. 예를 들어, 일부 실시형태에서, 표적 핵산이 일 말단에서 표면에 부착되고 시약 유동 스트림 또는 전기영동의 필드에 의해 신장될 때, 주변 영역 매질이 겔 안으로 캐스팅된다. 일부 실시형태에서, 겔 안으로의 캐스팅은 아크릴아미드, 암모늄 퍼설페이트 및 TEMED를 시약 유동 스트림에 포함함에 의해 발생할 수 있다. 이러한 화합물은 중합될 때 폴리아크릴아미드가 된다. 대안적인 실시형태에서, 열에 반응하는 겔이 적용된다. 일부 실시형태에서, 표적 핵산의 말단은 아크릴아미드와 중합될 수 있는 아크리다이트로 변형된다. 일부 이러한 실시형태에서, 천연 폴리뉴클레오티드의 백본의 음전하가 주어지면, 폴리뉴클레오티드를 양성 전극 쪽으로 연장시키는 전기장이 인가된다.
일부 실시형태에서, 표적 핵산은 표적 핵산의 완전성을 보존하기 위해 겔 플러그 또는 겔 층에서 세포로부터 추출되고; 그런 다음 AC 전기장이 겔 내에서 유전영동으로 표적 핵산을 신장거나 연장하기 위해 인가되고; 유전영동 신장은 커버 유리 위의 겔 층에서, 또는 테스트 기판 또는 다른 표면과 연관된 겔에서 수행되며, 이후에 본 명세서에 기술된 방법 중 임의의 것이 이용되어 신장된 표적 핵산에 적용되어 일시적인 올리고뉴클레오티드 프로브 종 결합을 검출할 수 있다.
일부 실시형태에서, 샘플 또는 표적 핵산은 그 환경의 매트릭스에 가교-결합된다. 일 예에서 이것은 세포의 환경이다. 예를 들어, 본 명세서에 기술된 방법 핵산 시퀀싱이 세포 내 원 위치에서 수행될 때, 표적 핵산은 이종이기능성 가교 링커를 사용하여 세포의 기질에 가교-결합된다. 이는 FISSEQ와 같은 기술을 사용하여 세포 내부에서 직접적으로 시퀀싱 방법의 일부로 수행된다(Lee 외, Science 343:1360-1363, 2014).
표적 생체분자에 대한 손상의 대부분은 세포 및 조직으로부터 표적 생체분자를 추출하고, 이를 분석하기 전에 표적 생체분자를 후속 처리하는 과정에서 발생한다. 표적 핵산의 경우에 그 무결성의 손실로 이어지는 그의 처리하는 양태는 피펫팅, 와동, 동결-해동 및 과도한 가열을 포함할 수 있다. 일부 실시형태에서, ChemBioChem, 11:340-343 (2010)에 개시된 방식과 같이 기계적 응력이 최소화된다. 부가하여, 칼슘 또는 아연, EDTA, EGTA 또는 갈산 (및 그 유사체 및 유도체)과 같은 비-촉매 2가 양이온의 고농도는 뉴클레아제에 의한 분해를 억제할 수 있다. 일부 실시형태에서, 샘플 대 비-촉매 2가 양이온 중량의 2:1 비는 극도의 뉴클레아제 수준이 있는 대변과 같은 샘플에서도 뉴클레아제를 억제하기에 충분하다.
표적 핵산의 완전성을 보존하기 위해(예를 들어, 더 작은 단편으로 DNA 손상 또는 파단을 유도하지 않기 위해), 일부 실시형태에서, DNA 또는 RNA와 같은 생체거대분자를 염색체, 미토콘드리아, 세포, 핵, 엑소좀 등과 같은 그 천연 보호 환경에서 유지하는 것이 바람직하다. 표적 핵산이 이미 그 보호 환경 밖에 있는 일부 실시형태에서, 이를 겔 또는 미세액적과 같은 보호 환경에 넣는 것이 바람직하다. 일부 실시형태에서, 표적 핵산은 그것이 시퀀싱될 장소(예를 들어, 시퀀싱 데이터가 획득될 수 있는 유체 시스템 또는 유동 셀의 일부)에 물리적으로 매우 근접한 그 보호 환경으로부터 방출된다. 따라서, 일부 실시형태에서, 생체거대분자(예를 들어, 핵산, 단백질)가 보호 실체에 제공되고, 상기 보호 실체는 생체거대분자를 그의 천연 상태(예를 들어, 천연 길이)에 가깝게 보존하여 생체거대분자를 포함하는 보호 실체를 생체거대분자가 시퀀싱될 수 있는 장소와 매우 근접하게 한 다음 시퀀싱된 영역으로 또는 시퀀싱되는 영역에 근접하여 생체거대분자를 방출한다. 일부 실시형태에서, 유동 셀은 샘플 표적 게놈 DNA를 효과적으로 캡슐화할 수 있는 아가로스 겔을 포함할 수 있으며, 상기 아가로스 겔은 길이가 200Kb 초과인 길이를 갖는 게놈 DNA의 실질적인 분획을 보존하고, 표적 게놈 DNA를 포함하는 아가로스 겔을 표적 게놈 DNA가 시퀀싱되는 환경(예를 들어, 테스트 기판, 표면, 겔, 매트릭스)의 근처에 배치하고, 아가로스 겔로부터 시퀀싱 환경으로 (또는 표적 게놈 DNA가 추가로 이송하고 취급하는 것이 최소화되도록 시퀀싱 환경에 가깝게) 표적 게놈 DNA를 방출하고 그리고 하나 이상의 시퀀싱 방법을 수행한다. 시퀀싱 환경으로의 방출은 전기장의 적용 또는 아가라제에 의한 아가로스 겔의 소화에 의해 된다.
중합체 변성.
블록 206. 일부 실시형태에서, 고정된 연신된 이중-가닥 표적 핵산은 후속적으로 테스트 기판 상에서 단일 가닥 형태로 변성되고, 이에 의해 표적 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 수득한다. 고정된 제2 가닥의 각각의 염기는 고정된 제1 가닥의 상응하는 상보적 염기에 인접하게 놓일 수 있다. 일부 실시형태에서, 변성은 먼저 이중 가닥 표적 핵산을 연장하거나 신장한 다음 변성 용액을 첨가하여 두 가닥을 분리함에 의해 수행된다.
일부 실시형태에서, 변성은 하나 이상의 시약(예를 들어, 0.5M NaOH, DMSO, 포름아미드, 우레아 등)을 포함하는 화학적 변성이다. 일부 실시형태에서, 변성은 열 변성이다(예를 들어, 샘플을 85℃ 이상으로 가열함에 의함). 일부 실시형태에서, 변성은 헬리카제 또는 헬리카제 활성을 갖는 다른 효소의 사용을 통한 것과 같은 효소적 변성을 통한 것이다. 일부 실시형태에서, 표적 핵산은 표면과의 상호작용을 통해 또는 임계 길이를 넘어서는 신장과 같은 물리적 과정에 의해 변성된다. 일부 실시형태에서, 변성은 전체 또는 부분적이다.
일부 실시형태에서, 표적 핵산의 반복 단위 상의 변형(예를 들어, 폴리뉴클레오티드에서 후성유전적으로 변형된 뉴클레오티드, 또는 폴리펩티드의 인산화)에 대한 올리고뉴클레오티드 프로브 종의 결합은 선택적 변성 단계 전 또는 후에 수행된다.
일부 실시형태에서, 이중-가닥 표적 핵산의 선택적 변성은 전혀 수행되지 않을 수 있다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종은 표적 핵산의 듀플렉스 구조에 결합하거나 어닐링하는 데 이용된다. 예를 들어, 일부 실시형태에서, 올리고뉴클레오티드 프로브 종은 가닥 침입을 통해 (예를 들어, PNA 프로브를 사용함), 듀플렉스 형태 표적 핵산의 과도한 휴지를 유도함에 의해, 변형된 징-핑거 단백질을 사용함에 의한 듀플렉스 형태 표적 핵산에서 서열을 인식함에 의해, 또는 가이드 RNA가 결합하도록 하는 듀플렉스 형태의 표적 핵산을 변성시키는 Cas9 또는 유사한 단백질을 사용함에 의해 듀플렉스 형태 표적 핵산의 개별 가닥에 결합할 수 있다. 일부 실시형태에서, 가이드 RNA는 조사 프로브 서열 및 표지를 포함할 수 있고, 따라서 본 명세서에 기술된 바와 같은 올리고뉴클레오티드 프로브 종으로서 기능할 수 있고, 올리고뉴클레오티드 프로브 종의 하나 이상의 세트에 대한 각각의 서열을 포함하는 gRNA가 제공된다.
일부 실시형태에서, 이중-가닥 표적 핵산은 닉(예를 들어, 천연 닉 또는 DNase1 처리에 의해 생성된 것들)을 함유할 수 있다. 이러한 실시형태에서, 반응 조건하에서, 한 가닥이 듀플렉스의 다른 가닥으로부터 일시적으로 닳거나 벗겨지거나(예를 들어, 일시적으로 변성), 또는 천연 염기-쌍 휴지가 발생한다. 이것은 천연 가닥의 재혼성화에 의해 치환되기 전에 올리고뉴클레오티드 프로브 종이 일시적으로 결합하도록 할 수 있다.
일부 실시형태에서, 단일 이중-가닥 표적 핵산이 변성되어 듀플렉스의 가닥 각각이 올리고뉴클레오티드 프로브 종에 의한 결합에 이용가능하다. 일부 실시형태에서, 단일 표적 핵산은 변성 과정에 의해 또는 시퀀싱 방법의 다른 단계에서 손상되고 복구된다(예를 들어, 적합한 DNA 폴리머라제 및 또는 리가제의 첨가에 의함).
일부 실시형태에서, 이중-가닥 표적 게놈 DNA의 이동억제화 및 선형화(테스트 기판 또는 다른 표면에 대한 고정 또는 결합을 위한 준비에서)는 분자 다듬기, 이중-가닥 표적 게놈 DNA의 표면에 대한 UV 가교결합, 선택적 습윤, 화학적 변성제(예를 들어, 알칼리 용액, DMSO 등)에 대한 노출을 통한 이중-가닥 표적 게놈 DNA의 변성, 세정 후 산성 용액에 대한 선택적 노출 및 선택적 사전-컨디셔닝 완충액에 대한 노출을 포함할 수 있다.
프로브의 어닐링.
블록 208. 선택적 변성 단계 후, 방법은 고정된 제1 가닥 및 고정된 제2 가닥을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀에 노출시킴에 의해 지속할 수 있으며, 여기서 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 미리결정된 서열 및 길이를 갖는다. 노출은 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀의 개별 올리고뉴클레오티드 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 각 부분(또는 부분들)과 결합하여 각각의 듀플렉스를 형성하도록 허용하는 조건하에서 발생할 수 있어 그에 의해 광학 활성의 각각의 경우에 증가를 제공한다.
도 5a, 5b 및 5c는 하나의 중합체(502)에 대한 상이한 프로브 종의 일시적인 결합의 예를 예시한다. 각각의 프로브(예를 들어, 504, 506 및 508)는 특정 조사 서열(예를 들어, 올리고뉴클레오티드 또는 펩티드 서열)을 포함할 수 있다. 프로브 종(504)을 중합체(502)에 적용한 후, 프로브 종(504)은 하나 이상의 세정 단계로 중합체(502)로부터 세정된다. 유사한 세정 단계를 사용하여 후속적으로 프로브 종(506 및 508)을 제거한다.
프로브 디자인 및 표적.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 하나 이상의 풀을 포함하는 용액이 용액 내 표적 핵산에 제공된다. 올리고뉴클레오티드 프로브 종을 포함하는 풀이 테스트 기판, 다른 표면 또는 매트릭스 상의 표적 핵산과 접촉하게 되면, 올리고뉴클레오티드 프로브는 확산 및 분자 충돌을 통해 표적 핵산과 접촉할 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 하나 이상의 풀을 포함하는 용액을 교반하여 올리고뉴클레오티드 프로브를 하나 이상의 표적 핵산과 접촉시킨다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종 함유 용액은 교환하여 신선한 올리고뉴클레오티드 프로브를 테스트 기판, 다른 표면 또는 매트릭스 상의 하나 이상의 표적 뉴클레오티드로 가져온다. 일부 실시형태에서, 전기장은 올리고뉴클레오티드 프로브를 테스트 기판, 또는 다른 표면으로 끌어 당기는 데 사용되며, 예를 들어 양으로 바이어스된 표면 또는 AC 장은 음으로 하전된 올리고를 끌어 당길 수 있다.
일부 실시형태에서, 표적 핵산은 특정 폴리뉴클레오티드 서열을 포함할 수 있고 올리고뉴클레오티드 프로브 종의 특이적 결합 부분은 예를 들어 3-mer, 4-mer, 5-mer, 또는 6-mer 올리고뉴클레오티드 서열 조사 부분, 선택적으로 하나 이상의 축퇴 또는 보편적 위치, 및 선택적으로 뉴클레오티드 스페이서(예를 들어, 하나 이상의 T 뉴클레오티드) 또는 비염기성 또는 비-뉴클레오티드 부분을 포함한다. 도 6a 및 6b에 예시된 바와 같이, 사용되는 올리고뉴클레오티드 프로브 종(예를 들어, 604 및 610)의 길이에 관계없이 표적 핵산(602)을 따라 유사한 결합이 발생한다. 상이한 k-mer 길이 올리고뉴클레오티드에 고유한 주요 차이점은 k-mer 길이가 각각의 올리고뉴클레오티드 프로브 종에 의해 결합되는 결합 부위의 길이를 설정한다는 것이다(예를 들어, 3-mer 프로브(604)는 (606)과 같은 3-뉴클레오티드 긴 부위에 주로 더 안정적으로 결합할 것이고 5-mer 프로브(610)는 (610)과 같은 5-뉴클레오티드 긴 부위에 주로 더 안정적으로 결합할 것이다).
도 6a에서, 예시된 3-mer 올리고뉴클레오티드 프로브 종은 올리고뉴클레오티드 프로브로 사용하기에 비정상적으로 짧다. 정상적으로 이러한 짧은 서열은 매우 낮은 온도와 긴 인큐베이션 시간이 사용되지 않는 한 안정적으로 결합할 수 없기 때문에 올리고뉴클레오티드 프로브로 사용되지 않는다. 그러나, 이러한 짧은 올리고뉴클레오티드 프로브 종은 본 명세서에 기술된 바와 같은 검출 방법에 의해 요구되는 바와 같이 표적 핵산에 일시적인 결합을 형성한다. 더욱이, 올리고뉴클레오티드 프로브 종 서열이 더 짧을수록, 더 적은 올리고뉴클레오티드 프로브 종이 올리고뉴클레오티드 프로브 종 세트에 존재한다. 예를 들어, 3-mer 올리고뉴클레오티드 프로브 종의 완전한 세트에는 단지 64개 올리고뉴클레오티드 서열이 필요한 반면, 올리고뉴클레오티드 프로브 종의 완전한 4-mer 세트에는 256개 올리고뉴클레오티드 서열이 필요하다. 더욱이, 초-단형 올리고뉴클레오티드 프로브 종의 풀은 일부 실시형태에서 용융 온도를 증가시키기 위해 변형되고, 일부 실시형태에서는 본 명세서에 기술된 바와 같은 축퇴(예를 들어, N) 또는 보편적 뉴클레오티드를 포함할 수 있다. 예를 들어, 4개 N 뉴클레오티드는 3-mer 올리고뉴클레오티드의 안정성을 7-mer 올리고뉴클레오티드의 안정성으로 증가시킬 것이다.
도 6b에서, 개략도는 5-mer 올리고뉴클레오티드 프로브의 그 완벽한 일치 위치(612-3), 1 염기 불일치 위치(612-2) 및 2 염기 불일치 위치(612-1)에 대한 결합을 예시한다.
임의의 하나의 올리고뉴클레오티드 프로브의 결합은 표적 핵산의 시퀀싱을 허용하기에 충분하지 않을 수 있다. 일부 실시형태에서, 표적 핵산의 서열을 재구성하기 위해 완전한 세트의 올리고뉴클레오티드 프로브가 요구된다. 올리고뉴클레오티드 프로브 종 결합 부위의 장소, 중첩 결합 부위에 대한 올리고뉴클레오티드 프로브 종의 일시적으로 분리된 결합, 올리고뉴클레오티드 프로브 종과 표적 핵산 사이의 불일치의 부분적 결합, 결합 빈도 및 결합의 지속시간에 대한 정보는 모두 서열 또는 표적 핵산을 추론하는데 기여할 수 있다. 연장되거나 신장된 표적 핵산의 경우, 표적 핵산의 길이를 따라 결합하는 올리고뉴클레오티드 프로브 종의 장소는 높은 신뢰도로 서열을 구축하는 데 기여할 수 있다. 이중-가닥 표적 핵산의 경우, 더 높은 신뢰도의 서열이 동시적으로 듀플렉스 형태 표적 핵산의 양 가닥(예를 들어, 양 상보적 가닥)의 시퀀싱으로부터 나타날 수 있다.
일부 실시형태에서, 공통 기준 올리고뉴클레오티드 프로브 종은 올리고뉴클레오티드 프로브 종의 하나 이상의 세트에서 올리고뉴클레오티드 프로브 종의 하나 이상의 풀의 각각과 함께 첨가된다. 예를 들어, 도 7a, 7b 및 7c에서 공통 기준 올리고뉴클레오티드 프로브 종(704)은 올리고뉴클레오티드 프로브 종의 세트(예를 들어, 706, 712, 및 716)에 포함된 임의의 추가 프로브에 관계없이 표적 핵산(702) 상의 동일한 결합 부위(708)에 결합한다. 공통 기준 올리고뉴클레오티드 프로브 종(704)의 존재는 다른 올리고뉴클레오티드 프로브 종(706, 712, 및 716)의 그 각각의 결합 부위(예를 들어, 710, 714, 718, 720 및 722)에 결합하는 것을 방해하지 않는다.
도 7c에 도시된 바와 같이, 결합 부위(718, 720 및 722)는 개별 올리고뉴클레오티드 프로브(716-1, 716-2 및 716-3)가 그 부위가 중첩하는 경우에도 모든 가능한 부위에 결합하는 방법을 예시한다. 도 7a, 7b 및 7c에서 프로브 서열은 3-mer로 도시된다. 그러나, 유사한 방법은 4-mer, 5-mer, 6-mer 등인 프로브를 사용하여 동등하게 잘 수행될 수 있다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 하나 이상의 세트는 주어진 길이의 모든 올리고를 포함할 수 있다. 예를 들어, 1024개 개별 5-mer의 완전한완벽한 세트가 인코딩되고 본 개시내용의 일 실시형태에 따른 올리고뉴클레오티드 프로브 종의 하나 이상의 세트에 포함된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 하나 이상의 세트는 다중 길이의 모든 올리고뉴클레오티드 프로브 종을 포함할 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브의 세트는 올리고뉴클레오티드 프로브 종의 타일링 시리즈이다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트는 올리고뉴클레오티드 프로브 종의 패널이다. 합성 생물학에서 특정 적용(예를 들어, DNA 데이터 저장)의 경우 시퀀싱은 특정 서열 블록의 순서를 모색하는 것을 포함할 수 있으며, 여기서 블록은 원하는 데이터를 인코딩하도록 설계된다.
도 8a, 8b 및 8c에 의해 예시된 바와 같이, 올리고뉴클레오티드 프로브 종의 다중 세트(예를 들어, 804, 806 및 808)가 일부 실시형태에서 임의의 표적 핵산(802)에 적용된다. 각각의 올리고뉴클레오티드 프로브 종은 그의 상보적 결합 부위에 우선적으로 결합할 것이다. 일부 실시형태에서, 각각의 노출 (c) 사이에 완충액으로 세정하는 것은 이전 세트에서 올리고뉴클레오티드 프로브 종의 제거를 보조한다.
일부 실시형태에서, 핵산 시퀀싱을 위한 프로브는 올리고뉴클레오티드이고 에피-변형을 위한 프로브는 변형-결합 단백질 또는 펩티드(예를 들어, 메틸 결합 단백질 예컨대 MBD1) 또는 항-변형 항체(예를 들어, 항-메틸 C 항체)이다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종은 게놈에서 특정 부위(예를 들어, 알려진 돌연변이가 있는 부위)를 표적으로 할 수 있다. 도 9a, 9b 및 9c에 예시된 바와 같이, 올리고뉴클레오티드(예를 들어, 804, 806 및 808) 및 대안적 프로브(예를 들어, 902) 둘 모두가 일부 실시형태에서 표적 핵산(802)에 동시에 (그리고 다중 노출 단계를 통해) 적용된다. 관심있는 표적 부위를 결정하는 방법은 Liu 외, BMC Genomics 9: 509 (2008)에 제공되며, 이는 본 명세서에 참고로 포함된다.
일부 실시형태에서, 하나 이상의 프로브 세트의 올리고뉴클레오티드 프로브 종이고, 올리고뉴클레오티드 프로브 종 또는 하나 이상의 프로브 종 세트의 서브세트이고, 올리고뉴클레오티드 프로브 종의 하나 이상의 세트인, 각각의 프로브 종이 차례로 적용된다(예를 들어, 올리고뉴클레오티드 프로브 종 또는 올리고뉴클레오티드 프로브 종의 서브세트 또는 하나 이상의 세트인 하나의 프로브 종의 결합이 먼저 검출되고 그런 다음 다음 올리고뉴클레오티드 프로브 종이 추가, 검출되기 전에 제거될 수 있고 그런 다음 다음 것이 제거되는 것, 등). 일부 실시형태에서, 프로브의 하나 이상의 세트에서 프로브의 전부 또는 서브세트는 단일 풀에 동시적으로 첨가되고, 각각의 결합 프로브는 결합 프로브의 정체성을 완전히 또는 부분적으로 코딩하는 표지에 연결되고 결합 프로브의 각각에 대한 코드는 검출 및 분석 프로세스에 의해 디코딩된다.
도 11a 및 11b에 의해 예시된 바와 같이, 프로브의 타일링 시리즈 또는 타일링 세트는 일부 실시형태에서 다중 프로브의 결합 부위에 대한 정보를 얻기 위해 사용될 수 있다. 도 11a에서 제1 타일링 세트(1104)는 표적 핵산(1102)에 적용된다. 제1 타일링 세트(1104)에서 타일링 프로브의 서브세트에서의 각 타일링 프로브는 하나의 공통 염기(1108)를 함유하며, 이에 의해 표적 핵산(1102)에서 그 하나의 공통 염기(1108)의 5X 커버리지의 깊이를 초래한다. 커버리지의 깊이는 타일링 시리즈에서 프로브의 k-mer 길이에 비례할 것이다(예를 들어, 3-mer 올리고의 세트는 표적 핵산에서 모든 염기의 약 3X 커버리지를 초래할 것이다).
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트가 표적 염기를 따라 타일링될 때 타일링 경로에 중단이 있는 경우 문제가 발생할 가능성이 있다. 예를 들어, 5-mer의 올리고뉴클레오티드 프로브 종의 세트로는 5개 염기보다 긴 표적 분자에서 하나 이상의 서열의 신장에 결합할 수 있는 올리고뉴클레오티드 프로브 종이 없다. 이 경우, 일부 실시형태에서 하나 이상의 접근방식이 이용된다. 첫째, 표적 핵산이 이중-가닥 핵산을 포함하는 경우, 하나 이상의 염기 할당이 듀플렉스의 상보적 가닥으로부터 획득된 서열(들)에 따르거나 이에 의존할 수 있다. 둘째, 표적 핵산의 다중 카피가 이용가능한 경우, 하나 이상의 염기 할당은 표적 핵산의 다른 카피 상의 동일한 서열의 다른 카피에 의존할 수 있다. 셋째, 일부 실시형태에서, 참조 서열이 이용가능하다면, 하나 이상의 염기 할당은 참조 서열을 따르거나 이에 의존할 수 있고, 하나 이상의 염기는 그것이 참조 서열로부터 인공적으로 이식되었음을 나타내기 위해 주석이 달려 있다.
일부 실시형태에서, 특정 올리고뉴클레오티드 프로브 종은 다양한 이유로 올리고뉴클레오티드 프로브 종의 하나 이상의 세트로부터 생략된다. 예를 들어, 일부 올리고뉴클레오티드 프로브 서열은 그 자체로 문제가 있는 상호작용 ― 예컨대 올리고뉴클레오티드 프로브 종의 완전한 세트에서 다른 프로브 또는 표적 핵산과 자가-상보성 또는 회문 서열을 나타낸다(예를 들어, 알려진 확률론적 무차별 결합). 일부 실시형태에서, 정보제공 올리고뉴클레오티드 프로브 종의 최소 수는 표적 핵산의 각 유형에 대해 결정된다. k-mer 올리고뉴클레오티드 프로브 종의 완전한 세트 내에서, 올리고뉴클레오티드의 절반은 올리고뉴클레오티드의 다른 절반에 완전히 상보적이다. 일부 실시형태에서, 이들 상보적 쌍 (및 실질적인 상보성으로 인해 문제가 되는 다른 쌍)이 동시에 폴리뉴클레오티드에 첨가될 수 없지만, 오히려 올리고뉴클레오티드 프로브 종의 상이한 서브세트 또는 풀에 할당될 수 있다는 것이 보장된다. 센스 및 안티센스 단일-가닥 DNA(단일 이중 가닥 표적 핵산 유래) 둘 모두가 존재하는 일부 실시형태에서, 시퀀싱은 각각의 상보적 올리고뉴클레오티드 프로브 종 쌍의 단 하나의 구성원으로 수행된다. 센스 및 안티센스 가닥 둘 모두에서 얻은 시퀀싱 정보를 조합하여 전반적인 서열을 생성한다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종은 맞춤형 마이크로어레이 합성을 사용하여 제조된 라이브러리를 포함할 수 있다. 일부 실시형태에서, 마이크로어레이 라이브러리는 게놈의 특정 표적 부분에 체계적으로 결합하는 올리고뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, 마이크로어레이 라이브러리는 표적 게놈을 가로질러 특정 거리 떨어져 있는 장소에 체계적으로 결합하는 올리고뉴클레오티드 프로브 종을 포함할 수 있다. 예를 들어, 백만 개의 올리고뉴클레오티드 프로브 종을 포함하는 라이브러리는 약 3000개 염기마다 결합하도록 설계된 올리고뉴클레오티드 프로브 종을 포함할 수 있다. 유사하게, 천만 개의 올리고뉴클레오티드 프로브 종을 포함하는 라이브러리는 약 300개 염기마다 결합하도록 설계될 수 있고, 3천만 개의 올리고뉴클레오티드 프로브 종을 포함하는 라이브러리는 약 100개 염기마다 결합하도록 설계될 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 서열은 참조 게놈 서열에 기반하여 계산적으로 설계된다.
일부 실시형태에서, 표적화된 게놈의 영역은 특이적 유전자좌이다. 다른 실시형태에서, 표적화된 게놈의 영역은 유전자좌의 패널(예를 들어, 암에 연결된 유전자 또는 기타 고도로 보존된 영역) 또는 게놈-전체 연관 연구에 의해 식별된 염색체 간격 내의 유전자 또는 고도로 보존된 영역이다. 일부 실시형태에서, 표적화된 유전자좌는 또한 게놈의 암흑 물질, 전형적으로 반복적인 게놈의 착색 영역, 뿐만 아니라 반복 영역 부근에 있는 복잡한 유전적 유전자좌를 포함할 수 있다. 이러한 영역에는 말단소체, 중심체, 중심성 염색체의 짧은 팔뿐만 아니라 게놈의 다른 낮은 복잡성 영역이 포함된다. 전통적인 시퀀싱 방법은 게놈의 반복적인 부분을 해결할 수 없지만(2019년 현재 아직 완전한 인간 게놈은 없음), 나노미터 정밀도가 높을 때 본 명세서에 기술된 방법은 이들 영역을 포괄적으로 해결한다.
일부 실시형태에서, 복수의 올리고뉴클레오티드 프로브 종에서 각각의 각 올리고뉴클레오티드 프로브 종은 고유한 N-mer 서열을 포함하며, 여기서 N은 세트에서의 정수 {1, 2, 3, 4, 5, 6, 7, 8 및 9}이고 여기서 길이 N의 모든 고유한 N-mer 서열은 복수의 올리고뉴클레오티드 프로브 종으로 표시된다.
올리고뉴클레오티드 프로브 종을 만드는 데 사용되는 올리고 길이가 길수록 올리고뉴클레오티드 프로브 종에 영향을 미치는 회문 또는 폴드백 서열이 효율적인 프로브로서 기능할 가능성이 더 크다. 일부 실시형태에서, 결합 효율은 하나 이상의 축퇴성 또는 보편적 염기를 제거함에 의해 이러한 올리고의 길이를 감소시킴에 의해 실질적으로 개선된다. 이 이유로, 올리고뉴클레오티드 프로브 종에 대해 더 짧은 조사 서열(예를 들어, 4-mer)의 사용이 유리하다. 그러나, 더 짧은 올리고뉴클레오티드 프로브 서열은 덜 안정적인 결합(예를 들어, 더 낮은 결합 온도)을 나타낸다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 결합 안정성은 특이적 안정화 염기 변형 또는 올리고 접합체(예를 들어, 스틸벤 캡)를 사용함에 의해 향상된다. 일부 실시형태에서, 완전히 변형된 3-mer 또는 4-mer(예를 들어, 잠금 핵산(LNA) 및/또는 펩티드 핵산(PNA))이 사용된다.
일부 실시형태에서, 고유한 N-mer 서열은 하나 이상의 축퇴 뉴클레오티드가 차지하는 하나 이상의 뉴클레오티드 위치를 포함할 수 있다. 일부 실시형태에서, 축퇴 위치는 축퇴 염기 장소에 제공된 4개의 뉴클레오티드의 각각인 올리고뉴클레오티드 프로브를 포함하는 올리고뉴클레오티드 프로브 종의 구성원 및 4개 뉴클레오티드 모두를 포함한다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종에서 하나 이상의 뉴클레오티드 위치는 보편적인 염기에 의해 점유된다. 일부 실시형태에서, 보편적 염기는 2'-데옥시이노신 또는 본 명세서에 기술된 바와 같은 다른 보편적 염기이다. 일부 실시형태에서, 고유한 N-mer 서열은 단일 축퇴 또는 보편적 뉴클레오티드 위치에 의해 5' 말단에 측접되고 단일 축퇴 또는 보편적 뉴클레오티드 위치에 의해 3' 말단에 측접된다. 일부 실시형태에서, 5' 단일 보편적 뉴클레오티드 및 또는 3' 단일 보편적 뉴클레오티드는 각각 2'-데옥시이노신 또는 본 명세서에 기술된 바와 같은 다른 보편적 염기일 수 있다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 동일한 길이 M의 것이다. 일부 실시형태에서, M은 2 이상의 양의 정수이다. 테스트 기판 상의 광학 활성의 복수의 위치 세트로부터 표적 핵산의 적어도 일부의 서열을 결정하는 것 (f)는 광학 활성의 복수의 위치 세트로 표시되는 올리고뉴클레오티드 프로브 종의 중첩하는 서열을 추가로 사용할 수 있으며, 이는 단일 올리고뉴클레오티드 프로브 종의 상이한 장소 및 광학 활성의 동일한 장소에서의 상이한 시간, 지속시간, 강도 광자, 또는 이의 합계의 조합을 포함할 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 올리고뉴클레오티드 프로브의 세트에서 다른 올리고뉴클레오티드 프로브와 M-1 서열 상동성을 공유한다. 다른 실시형태에서, 올리고뉴클레오티드 프로브의 세트의 서브세트 또는 어느 것도 세트에서 다른 올리고뉴클레오티드 종과 M-1 서열 상동성을 공유하지 않을 수 있다.
프로브 표지.
일부 실시형태에서, 올리고뉴클레오티드 프로브의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 표지와 결합된다. 도 14a-e는 올리고뉴클레오티드 프로브 또는 다른 프로브 유형을 표지하는 다양한 방법을 예시한다. 일부 실시형태에서, 표지는 염료, 형광성 나노입자, 또는 광-산란 입자이다. 일부 실시형태에서, 프로브(1402)는 표지(1406)에 직접적으로 결합된다. 일부 실시형태에서, 프로브(1402)는 올리고뉴클레오티드 프로브(1408-B) 상의 서열에 상보적인 서열(1408-B)을 포함할 수 있는 플랩 서열(1410)을 통해 간접적으로 표지된다.
유리한 특성을 가진 많은 유형의 유기 염료가 표지화에 사용가능하며, 일부는 높은 광 안정성 및/또는 높은 양자 효율 및/또는 최소 암흑-상태 및/또는 높은 용해도 및/또는 낮은 비-특이적 결합을 갖는다. Atto 542는 다수의 유리한 품질을 지닌 유리한 염료이다. Cy3B는 매우 밝은 염료이고 Cy3 또한 효과적이다. 일부 염료는 적색 염료 Atto 655 및 Atto 647N과 같이 단백질, 세포 또는 세포 물질로부터 자동 형광이 널리 퍼져 있는 파장을 회피할 수 있다. 많은 유형의 나노 입자가 표지화에 이용가능하다. 형광으로 표지된 라텍스 입자 외에, 본 개시내용은 금 또는 은 입자, 반도체 나노결정(양자점), 및 나노다이아몬드를 나노입자 표지로 사용한다. 일부 실시형태에서, 나노다이아몬드가 표지로서 특히 바람직하다. 나노다이아몬드는 높은 양자 효율(QE)로 빛을 방출하고, 높은 광 안정성, 높은 화학적 안정성, 긴 형광 수명(예를 들어, 광 산란 및/또는 자가형광에서 관찰된 배경을 줄이는 데 사용할 수 있는 20ns의 정도)을 가지고, 하나 초과의 형광 방출을 가지고, 상이한 방출 대역폭을 가지고, 작다(예를 들어, 직경이 대략 40nm). DNA 나노구조 및 나노볼은 다중 유기 염료를 분기된 구조를 포함할 수 있는 그 구조 안으로 통합하거나 개재하는 염료와 같은 표지를 이용함에 의해 예외적으로 밝은 표지일 수 있다.
일부 실시형태에서, 각각의 간접 표지는 올리고뉴클레오티드 프로브 종의 서열 조사 부분에서 코딩되는 염기의 정체성을 특정할 수 있다. 일부 실시형태에서, 표지는 염료가 개재하는 핵산의 하나 이상의 분자를 포함할 수 있다. 일부 실시형태에서, 표지는 하나 이상의 유형의 염료 분자, 형광 나노입자, 또는 광-산란 입자를 포함할 수 있다. 일부 실시형태에서, 더 긴 이미징 시간을 허용하기 위해 신속하게 광탈색하지 않는 표지가 선택된다.
도 12a, 12b 및 12c는 표적 핵산(1206)에 대해 부착된 형광 표지(1202)를 갖는 올리고뉴클레오티드 프로브(1204)의 일시적인 온-오프 결합을 예시한다. 표지(1202)는 올리고뉴클레오티드 프로브(1204)가 표적 핵산(1206) 상의 결합 부위에 결합하는지 여부에 관계없이 형광을 낼 것이다. 유사하게, 도 13a, 13b 및 13c는 표지되지 않은 올리고뉴클레오티드 프로브(1306)의 일시적인 온-오프 결합을 예시한다. 결합 이벤트는 용액(1302)으로부터 일시적으로 형성하는 듀플렉스(1304) 안으로 염료(1304)(예를 들어, YOYO-1)의 개재에 의해 검출된다. 개재하는 염료는 용액에서 자유로이 부유하는 것과 비교하여 이중-가닥 핵산에 결합될 때 형광의 상당한 증가를 나타낸다.
일부 실시형태에서, 표적 핵산에 결합할 수 있는 올리고뉴클레오티드 프로브 종은 직접적으로 표지되지 않을 수 있다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종은 플랩을 함유할 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종을 구축하는 것(예를 들어, 이들을 코딩하는 것)은 특이적 서열 단위를 커플링하는 것을 포함하며, 여기서 단위는 올리고뉴클레오티드 프로브 종의 하나 이상의 세트에서 각 k-mer의 일 말단(예를 들어, 플랩 서열)에 결합된 상보적인 (특정 단위에 대함) 인코딩된 올리고뉴클레오티드 서열을 갖는 표지에 결합하기에 충분한 길이의 것이다. 플랩의 인코딩 서열의 각 단위는 별개의 형광으로 표지된 프로브에 대한 도킹 또는 결합 부위로 작용할 수 있다. 5개 염기 프로브 서열을 인코딩하기 위해, 프로브 상의 플랩은 5개 별개의 단위 또는 결합 장소를 함유할 수 있으며, 예를 들어 각 장소는 다음 장소에 직렬로 연결된 상이한 DNA 염기 서열이다. 예를 들어, 플랩 상의 제1 단위 또는 결합 위치는 올리고뉴클레오티드 프로브 종 서열(표적 핵산에 결합할 수 있는 부분)에 인접하고, 제2 단위 또는 결합 위치는 제1 단위 또는 결합 위치에 인접하고, 등등이다. 시퀀싱에서 프로브-플랩을 사용하기 전에, 각각의 다양한 프로브-플랩은 형광 표지된 올리고의 세트에 결합되고, 플랩 서열 상의 단위 또는 결합 위치의 수가 상이한 표지와 연관된 올리고가 올리고뉴클레오티드 프로브 종 서열에 대한 고유한 식별자 태그를 생성하기 위해 상이한 단위 또는 결합 위치에 상보적인 각각의 서열을 갖는 형광 표지 유형의 원하는 수보다 큰 경우 표지되지 않은 올리고를 포함할 수 있다. 일부 실시형태에서, 이는 플랩 상의 각각의 단위 또는 결합 위치에 상보적인 4개의 별개로 표지된 올리고 서열(예를 들어, 총 16개의 별개의 표지 조합)을 사용함에 의해 수행될 수 있다.
일부 실시형태에서, A, C, T 및 G가 정의된 프로브는 표지가 올리고뉴클레오티드 프로브 종에서 특정 위치에서 단 하나의 정의된 뉴클레오티드에 대해 보고하는 (그리고 다른 위치는 축퇴 또는 보편적인) 방식으로 코딩된다. 이것은 뉴클레오티드당 하나의 색상인, 4가지 색상 코딩만 요할 수 있다.
일부 실시형태에서, 노출 과정 전체에 걸쳐 단지 하나의 형광단 색상이 사용된다. 이러한 실시형태에서, 각각의 노출 과정은 4-하위-과정으로 분할되며, 그 각각에서 특정 위치(예를 들어, 위치 1)에서 상이한 염기를 갖는 4개 올리고뉴클레오티드 프로브 종의 세트의 하나의 올리고뉴클레오티드 프로브 종은 세트의 다음 올리고뉴클레오티드 프로브 종이 추가되기 전에 개별적으로 추가된다. 각 주기에서 올리고뉴클레오티드 프로브 종은 동일한 표지를 담지할 수 있다. 5-mer 올리고뉴클레오티드 프로브 종 서열 길이에 대한 이 구현에서, 하나 이상의 올리고뉴클레오티드 세트의 완전한 세트는 단일 염기 위치에서의 조사에 상응하는 올리고뉴클레오티드 프로브 종의 5개 세트를 포함할 수 있으며 여기서 각 세트는 5-mer 올리고뉴클레오티드 프로브 종의 세트에서의 단일 위치에서 단일 염기를 변경하는 것에 상응하는 4개 올리고뉴클레오티드 프로브 종을 포함할 수 있고, 노출 하위-과정의 총 수는 시간이 유의하게 절약되는 20이다(5-mer 올리고뉴클레오티드 프로브 세트의 완전한 세트에서 각 염기 위치에 상응하는 5개 세트로, 여기서 각 세트는 4개 올리고뉴클레오티드 프로브 종을 가짐).
일부 실시형태에서, 올리고뉴클레오티드 프로브 종 서열에서 제1 염기는 플랩 서열에서 제1 단위에 의해 인코딩되고, 제2 염기는 제2 단위에 의해 인코딩되는 식이다. 플랩에서 단위의 순서는 올리고뉴클레오티드 프로브 종 염기 서열의 순서에 상응할 수 있다. 그 다음 별개의 형광 표지가 (상보적 염기 쌍화를 통해) 플랩에 포함된 각각의 상응하는 단위 상으로 결합되거나 도킹될 수 있다. 일 예에서 제1 단위와 연관된 제1 표지는 제1 올리고뉴클레오티드 프로브 종 서열 위치와 따라서 연관되어 있어 500nm - 530nm의 파장에서 방출할 수 있으며, 제2 표지는 제2 단위와 그리고 따라서 제2 올리고뉴클레오티드 프로브 종 서열 위치와 연관되어 있어 550nm - 580nm의 파장에서, 제3은 600nm - 630nm에서, 제4는 650nm - 680nm에서, 제5는 700nm - 730nm에서 방출할 수 있다. 각 장소에서 염기의 정체성은 그 다음 예를 들어 표지의 형광 수명에 의해 인코딩될 수 있다. 하나의 이러한 예에서 A에 상응하는 표지는 T에 상응하는 표지보다 더 긴 수명을 갖는, G에 상응하는 표지보다 더 긴 수명을 갖는, C에 상응하는 표지보다 더 긴 수명을 갖는다. 상기 예에서, 위치 1의 염기 A는 가장 긴 수명으로 500nm - 530nm에서 방출할 수 있고 위치 3의 염기 G는 세 번째로 긴 수명으로 600nm - 630nm에서 방출할 수 있는, 등등이다.
일부 실시형태에서, 도 14e에 예시된 바와 같이, 올리고뉴클레오티드 프로브 종(1402)은 서열(1408-B)에 상응하는 서열(1408-A)를 포함할 수 있다. 서열(1408-B)은 플랩 영역(1410)에 결합, 부착 또는 연결된다. 도 14e 전반적인 작제물을 초래할 수 있는 가능한 서열의 예로서, 1410에서 4개 단위 위치의 각각은 서열 AAAA(예를 들어, 1412에 대해 상보적인 영역), CCCC(예를 들어, 1414에 대해 상보적인 영역), GGGG(예를 들어, 1416에 대해 상보적인 영역) 및 TTTT(예를 들어, 1418에 대해 상보적인 영역)에 의해 각각 정의된다. 따라서, 전반적인 플랩 서열은 (서열번호 1) 5'-AAAACCCCGGGGTTTT-3'이다. 그런 다음 각 단위 위치는 특정 방출 파장 범위를 이용하여 코딩되고 그 위치에 있을 수 있는 4개의 다른 염기는 4개의 다른 형광 수명-표지된 올리고에 의해 코딩되며, 여기서 수명/밝기 비율은 올리고뉴클레오티드 프로브 종(1402) 서열 자체에 상응하는 특정 염기 위치 및 염기 코드에 상응할 수 있다.
적합한 코드의 예는 다음과 같다:
ㆍ위치 1-A 염기 코드- TTTT-방출 피크 510, 수명/밝기 #1
ㆍ위치 1-C 염기 코드- TTTT-방출 피크 510, 수명/밝기 #2
ㆍ위치 1-G 염기 코드- TTTT-방출 피크 510, 수명/밝기 #3
ㆍ위치 1-T 염기 코드- TTTT-방출 피크 510, 수명/밝기 #4
ㆍ위치 2-A 염기 코드- GGGG-방출 피크 560, 수명/밝기 #1
ㆍ위치 2-C 염기 코드- GGGG-방출 피크 560, 수명/밝기 #2
ㆍ위치 2-G 염기 코드- GGGG-방출 피크 560, 수명/밝기 #3
ㆍ위치 2-T 염기 코드- GGGG-방출 피크 560, 수명/밝기 #4
ㆍ위치 3-A 염기 코드- CCCC-방출 피크 610, 수명/밝기 #1
ㆍ위치 3-C 염기 코드- CCCC-방출 피크 610, 수명/밝기 #2
ㆍ위치 3-G 염기 코드- CCCC-방출 피크 610, 수명/밝기 #3
ㆍ위치 3-T 염기 코드- CCCC-방출 피크 610, 수명/밝기 #4
ㆍ위치 4-A 염기 코드- AAAA-방출 피크 660, 수명/밝기 #1
ㆍ위치 4-C 염기 코드- GGGG-방출 피크 660, 수명/밝기 #2
ㆍ위치 4-G 염기 코드- GGGG-방출 피크 660, 수명/밝기 #3
ㆍ위치 4-T 염기 코드- GGGG-방출 피크 660, 수명/밝기 #4
다른 실시형태에서, 상이한 단위 위치는 형광 수명에 의해 코딩되고 염기는 형광 방출 파장에 의해 코딩된다. 일부 실시형태에서, 다른 측정가능한 물리적 속성은 코딩을 위해 또는 그 측정이 파장 및 수명의 측정과 호환되는 경우 대안적으로 사용될 수 있다. 예를 들어, 방출의 편광 또는 밝기는 플랩 안으로 함입을 위해 이용가능한 다수의 코드의 크기를 증가시키기 위해 또한 측정될 수 있다.
일부 실시형태에서, 토-홀드 프로브(예를 들어, Levesque 외, Nature Methods 10:865-867, 2013에 기술된 바와 같음)가 사용된다. 이들 프로브는 부분적으로 이중-가닥이고 불일치하는 표적에 결합될 때 경쟁적으로 불안정해진다(예를 들어, Chen 외, Nature Chemistry 5, 782-789, 2013에 자세히 설명됨). 일부 실시형태에서, 토-홀 프로브는 단독으로 사용된다. 일부 실시형태에서, 토-홀 프로브는 정확한 혼성화를 보장하기 위해 사용된다. 일부 실시형태에서, 토-홀 프로브는 표적 핵산에 결합된 다른 프로브의 오프 반응 속도를 용이하게 하기 위해 사용된다.
일부 실시형태에서, 양자점인 공통 여기선에 의해 여기되는 표지가 이용된다. 일부 이러한 실시형태에서, 이 예에 따르면, Qdot 525, Qdot 565, Qdot 605, 및 Qdot 655는 4개 각각의 뉴클레오티드에 상응하도록 선택된다. 대안적으로, 4개 별개의 레이저 라인을 사용하여 4개 별개의 유기 형광단을 여기시키고 이미지 스플리터에 의해 분할된 방출을 감지한다. 일부 다른 실시형태에서, 방출 파장은 2개 이상의 유기 염료에 대해 공통적이지만 형광 수명은 상이하다. 숙련된 기술자는 과도한 노력과 실험 없이 다수의 상이한 인코딩 및 검출 방식을 구상할 수 있을 것이다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 하나 이상의 세트에서 상이한 올리고뉴클레오티드 프로브 종은 개별적으로 첨가될 수 없지만 함께 인코딩되고 풀링된다. 한 번에 하나의 색상과 하나의 올리고로부터 가장 간단한 증강은 한 번에 2개의 색상(또는 2개의 수명, 표지 간에 차이를 감지할 수 있는 다른 2개)과 2개의 올리고뉴클레오티드 프로브 종이다. 5개의 구별가능한 단일 염료 인코딩된 표지인, 5개의 올리고뉴클레오티드 프로브 종의 각각에 대해 하나의 염료 인코딩된 표지의 직접 검출을 사용하여 한 번에 최대 대략 5개의 올리고뉴클레오티드 프로브 종을 풀링할 것으로 예상하는 것이 합리적이다.
더 높은 수준의 복잡성이 필요하거나 요구되는 다른 실시형태에서, 플레이버 또는 코드가 증가할 수 있다. 예를 들어, 3-mer 올리고뉴클레오티드 프로브 종의 완전한 세트에서 각 염기에 대해 개별적으로 코딩하기 위해 64개 별개의 코드가 필요하다. 또한, 예를 들어, 5-mer 올리고뉴클레오티드 프로브 종의 완전한 세트에서 각 염기에 대해 개별적으로 코딩하기 위해 1024개 별개의 코드가 필요하다. 그러한 많은 수의 코드는 다중 상이한 검출가능한 표지 특성으로 구성된 올리고당 코드를 가짐에 의해 달성된다. 일부 실시형태에서, 더 작은 세트의 코드는 올리고뉴클레오티드 프로브 종의 완전한 세트의 더 작은 세트 또는 서브세트를 인코딩하는 데 사용되며, 예를 들어, 일부 예에서 64개 코드는 5-mer의 1024개 올리고뉴클레오티드 프로브 종 서열의 완전한 세트의 16개 서브세트를 인코딩하는 데 사용된다.
일부 실시형태에서, 올리고 코드의 큰 세트가 다수의 방식에서 획득된다. 예를 들어, 일부 실시형태에서 비드는 코드-특이적 염료로 장입되거나 DNA 나노구조-기반 코드는 상이한 형광 파장 방출 염료의 최적 간격을 포함할 수 있다(예를 들어, Lin 외, Nature Chemistry 4: 832-839, 2012). 일부 실시형태에서, 도 14c 및 14d에 예시된 바와 같이, 비드(1412)는 다중 형광성 표지(1414)을 포함할 수 있다. 도 14c에서, 표지(1414)는 비드(1412) 상에 코팅된 것으로 도시된다. 도 14d에서, 표지(1414)는 비드(1412)에 캡슐화되는 것으로 도시된다. 일부 실시형태에서, 각각의 표지(1414)는 상이한 유형의 형광 분자이다. 일부 실시형태에서, 모든 표지(1414)는 동일한 유형의 형광 분자(예를 들어, Cy3)이다. 추가 실시형태에서, 상이한 및 또는 동일한 형광 분자를 포함하는 상이한 표지 중 하나 이상이 비드에 결합되어 코팅되거나 그 안에 캡슐화된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종에서 염기의 위치 및 그의 정체성을 기술하기 위해 모듈식 코드가 사용되는 코딩 방식이 사용된다. 일부 실시형태에서, 이는 올리고뉴클레오티드 프로브 종을 식별할 수 있는 표지의 조합을 포함할 수 있는 올리고뉴클레오티드 프로브 종에 코딩 암을 추가함에 의해 구현된다. 예를 들어, 모든 가능한 5-mer 올리고뉴클레오티드 프로브의 라이브러리가 인코딩되는 것이 바람직한 경우, 암은 5개의 부위, 단위 또는 결합 위치를 가지며, 각 부위, 단위 또는 결합 위치는 5-mer 올리고뉴클레오티드 프로브 종에서 5개 핵염기의 각각에 상응하고, 그리고 5개 부위의 각각은 5개 구별가능한 표지에 결합되며, 여기서 부위, 단위 또는 결합 위치와 연관된 5개 구별가능한 표지의 각각은 상이한 염기의 결정과 연관된 15개 다른 표지로부터 추가로 구별가능하다. 하나의 이러한 예에서, 특정 피크 방출 파장을 갖는 형광단을 포함하는 표지는 각 부위, 단위 또는 결합 위치에 상응하고(예를 들어, 부위, 단위 또는 결합 위치 1의 경우 500nm, 부위, 단위 또는 결합 위치 2의 경우 550nm, 부위, 단위 또는 결합 위치 3의 경우 600nm, 부위, 단위 또는 결합 위치 4의 경우 650nm 및 부위, 단위 또는 결합 위치 5의 경우 700nm), 방출 파장은 동일하지만 형광 수명이 상이한 4개 형광단은 각 위치에서 4개 염기의 각각에 대해 코딩할 수 있다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종 또는 기타 결합 시약 상의, 이에 결합 또는 이에 연결된 상이한 표지가 방출의 파장에 의해 코딩되거나 부분적으로 코딩된다. 일부 실시형태에서, 상이한 표지가 형광 수명에 의해 코딩되거나 부분적으로 코딩된다. 일부 실시형태에서, 상이한 표지가 형광 편광에 의해 코딩되거나 부분적으로 코딩된다. 일부 실시형태에서, 상이한 표지가 파장, 형광 수명 형광 편광 수명 또는 임의의 다른 광학적으로 관찰가능한 기전의 임의의 조합에 의해 코딩되거나 부분적으로 코딩된다.
일부 실시형태에서, 상이한 표지가, 연관된 올리고뉴클레오티드 프로브 종인 연관된 프로브 종의 반복적인 온-오프 혼성화 동역학에 의해 코딩되거나 부분적으로 코딩된다. 상이한 결합-해리 상수를 갖는 상이한 올리고뉴클레오티드 프로브 종인 상이한 결합 프로브가 사용된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종인 프로브는 형광 강도에 의해 코딩되거나 부분적으로 코딩된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종인 프로브는 그에 결합, 부착 또는 연결된 상이한 수의 선택적으로 비-자가-소광성 형광단을 가짐에 의해 코딩된 형광 강도이다. 개별 형광단은 전형적으로 소광성을 방지하거나 줄이기 위해 잘 분리될 필요가 있다. 일부 실시형태에서, 이는 서로로부터 적절한 거리에서 표지를 제자리에 유지하기 위해 선택적으로 강성 링커 또는 DNA 나노구조를 사용하여 달성된다.
일부 실시형태에서, 형광 강도에 의한 코딩은 유사한 방출 스펙트럼을 갖지만 양자 수율 또는 기타 측정가능한 광학 특성에서 상이한 염료 변이체를 사용함에 의해 수행된다. 예를 들어, 여기/방출 558/572를 갖는 Cy3B는 여기/방출 550/570을 가지고 양자 수율이 0.15인 Cy3보다 실질적으로 더 밝지만(예를 들어, 양자 수율 0.67) 유사한 흡수/방출 스펙트럼을 갖는다. 일부 그러한 실시형태에서, 532nm 레이저는 양 염료를 여기하는데 사용된다. 다른 적합한 염료는 위로 전이된 여기 및 방출 스펙트럼을 갖지만 그럼에도 불구하고 532nm 레이저에 의해 여기되는 Cy3.5(여기/방출 591/604nm를 가짐)를 포함할 수 있다. 그러나, 그 파장에서의 여기는 Cy3.5에 대해 차선책이고 Cy3.5의 방출은 Cy3에 대해 최적화된 대역통과 필터에서 덜 밝게 나타날 것이다. 여기/방출 532/553을 갖는 Atto 532는 0.9의 양자 수율을 가지고 532nm 레이저가 그 최대 여기에서 Atto 532를 여기할 수 있으므로 밝을 것으로 예상된다.
다른 실시형태에서, 염료의 방출 수명을 측정하기 위해 단일 여기 파장을 사용하여 다중 코드가 실행된다. 이러한 실시형태에 따른 일 예에서, Alexa Fluor 546, Cy3B, Alexa Fluor 555 및 Alexa Fluor 555를 포함하는 세트가 사용된다. 일부 경우에는 다른 염료 세트가 더 유용하다. 일부 실시형태에서, 코드의 세트는 FRET 쌍을 사용함에 의해 및/또는 또한 방출된 광의 편광을 측정함에 의해 확장된다. 코딩된 표지의 수를 증가시키기 위한 또 다른 방법은 다중 색상으로 코딩하는 것이다.
도 15는 표적 핵산에 대한 올리고뉴클레오티드 프로브 종의 일시적인 결합으로부터의 형광의 예를 예시한다. 시계열에서 선택된 프레임(예를 들어, 프레임 번호 1, 20, 40, 60, 80, 100)은 특정 사이트에서 신호의 존재(예를 들어, 어두운 점) 및 부재(예를 들어, 흰색 영역)를 도시하여 온-오프 결합을 나타낸다. 각각의 각 프레임은 표적 핵산을 따라 다중 결합된 올리고뉴클레오티드 프로브 종으로 인한 형광을 나타낸다. 집합체 이미지는 100 프레임 동안 올리고뉴클레오티드 프로브 종이 결합되고 감지된 모든 사이트를 나타내는, 모든 이전 프레임의 형광의 집계 또는 합산을 나타낸다.
표적 폴리뉴클레오티드에 대한 프로브의 일시적인 결합.
올리고뉴클레오티드 프로브 종인 프로브의 결합은 동적 과정이고, 지속적으로 결합된 프로브는 비결합으로 되어질 일부 가능성이 있다(예를 들어, 온도, 염 농도, 프로브 간의 경쟁, 및 다수의 기타 인자를 포함한 다양한 인자에 의해 결정된 바와 같음). 따라서, 항상 한 프로브를 다른 프로브로 교체할 기회가 있다. 예를 들어, 일 실시형태에서, 상보적인 올리고뉴클레오티드 프로브 종을 포함하는 올리고뉴클레오티드 프로브 종의 풀이 사용되고, 테스트 기판 또는 다른 표면 상의 신장된 표적 핵산에 대한 어닐링 사이에 그리고 용액에서 상보적인 올리고뉴클레오티드 프로브 종과 지속적인 경쟁을 야기할 수 있다. 또 다른 실시형태에서, 프로브는 3개 부분을 가지며, 여기서 제1 부분은 표적 핵산에 완전히 상보적이고, 제2 부분은 표적 핵산에 부분적으로 상보적이고 표적 핵산에 노출된 공통 풀에서 하나 이상의 다른 올리고뉴클레오티드 프로브 종에 부분적으로 상보적이고, 제3 부분은 표적 핵산에 노출된 공통 풀에서 하나 이상의 다른 올리고뉴클레오티드 프로브 종에 완전히 상보적이다. 일부 실시형태에서, 표적 핵산의 염기 위치와 같은 화학 구조의 단위의 정확한 공간적 장소에 대한 정보를 수집하는 것은 거대분자의 구조 및/또는 서열을 결정하는 데 도움이 될 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종 결합 부위의 장소는 나노미터 또는 심지어 서브-나노미터 정밀도로 (예를 들어, 단일 분자 국지화 알고리즘을 사용하여) 결정된다. 일부 실시형태에서, 복수의 관찰된 올리고뉴클레오티드 프로브 종 결합 부위는 회절 제한 광학 이미징 방법에 의해 분해가능하고, 결합 이벤트가 일시적으로 분리되기 때문에 분해된다. 표적 핵산의 서열은 각 장소에 결합할 수 있는 올리고뉴클레오티드 프로브 종의 정체성에 기반하여 결정된다.
일부 실시형태에서, 노출 과정은 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀의 개별 프로브가 고정된 제1 가닥 또는 고정된 제2 가닥의 각 부분 또는 개별 올리고뉴클레오티드 프로브 종에 상보적인 표적 핵산과 일시적으로 및 가역적으로 결합하여 각각의 듀플렉스를 형성하도록 하고, 이에 의해 광학 활성의 경우를 발생시키는 조건을 사용하여 발생할 수 있다. 일부 실시형태에서, 체류 시간(예를 들어, 특정 올리고뉴클레오티드 프로브 종에 의한 결합의 지속시간 및/또는 지속성)은 결합 이벤트가 완벽한 일치, 불일치 또는 가짜인지 여부를 결정하는 데 사용된다.
일부 실시형태에서, 노출 과정은 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀의 개별 프로브가 개별 올리고뉴클레오티드 프로브 종에 상보적인 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥의 각 부분과 반복적으로 일시적이고 가역적으로 결합하고 각각의 듀플렉스를 형성하고 이에 의해 광학 활성의 각각의 경우를 반복적으로 발생시키는 조건을 사용하여 발생할 수 있다.
일부 실시형태에서, 시퀀싱 과정 또는 방법은 연장된 표적 핵산을 순차적으로 제공된 올리고뉴클레오티드 프로브 종의 하나 이상의 세트 중 완전한 세트 각각으로부터 일시적인 상호작용에 적용하는 것을 포함할 수 있다(여기서, 하나의 올리고뉴클레오티드 프로브 종을 수반하는 용액은 제거되고 다음 올리고뉴클레오티드 프로브 종을 수반하는 용액은 추가됨). 일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브 종의 결합은 올리고뉴클레오티드 프로브 종이 일시적으로 결합하도록 하는 조건을 사용하여 수행된다. 따라서 예를 들어, 결합은 하나의 올리고뉴클레오티드 프로브 종에 대해 25℃에서 수행되고 다음 올리고뉴클레오티드 프로브 종에 대해 30℃에서 수행된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종은 올리고뉴클레오티드 프로브 종의 공통 풀에 있는 세트에 이용된다. 예를 들어, 유사한 온도, 유사한 염 농도 또는 혼성화 결합에 영향을 미칠 수 있는 기타 인자와 같은 유사한 조건을 사용하여 일시적으로 결합할 수 있는 모든 올리고뉴클레오티드 프로브 종이 선택적으로 올리고뉴클레오티드 프로브 종의 공통 풀에서 세트로 수집되고 함께 사용될 수 있다. 일부 이러한 실시형태에서, 세트의 각각의 올리고뉴클레오티드 프로브 종은 차등적으로 표지되거나 차등적으로 인코딩된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종 일시적인 결합은 소량의 2가 양이온을 갖지만 1가 양이온이 없는 완충액에서 수행된다. 일부 실시형태에서, 완충액은 5mM Tris-HCl, 10mM 염화마그네슘, mm EDTA, 0.05% 트윈-20, 및 pH 8을 포함할 수 있다. 일부 실시형태에서, 완충액은 1nM 미만, 5nM 미만, 10nM 미만, 또는 15nM 미만의 염화마그네슘, 염화칼슘, 염화망간, 또는 기타 적절한 2가 양이온을 포함할 수 있다. 다른 실시형태에서, 용액 내에 음으로 하전된 핵염기의 농도의 절반보다 약간 더 많은 2가 양이온 농도가 제공되며, 이 용액은 올리고뉴클레오티드 프로브 종 및 표적 핵산을 포함할 수 있다.
일부 실시형태에서, 일시적인 결합을 촉진하는 다중 조건이 사용된다. 일부 실시형태에서, 하나의 조건은 그의 Tm에 의존하여 하나의 올리고뉴클레오티드 프로브 종에 대해 사용되고 또 다른 조건은 그의 Tm에 의존하여 다른 올리고뉴클레오티드 프로브 종에 대해 사용되고 뉴클레오티드 프로브 종의 완전한 세트, 예를 들어, 1024개 가능한 5-mer의 완전한 세트로부터의 각각의 5-mer 올리고뉴클레오티드 프로브 종에 대해서도 그렇다. 일부 실시형태에서, 단지 512개 비-상보적 5-mer이 제공된다(예를 들어, 표적 핵산이 듀플렉스 형태이고, 따라서 양 상보적 가닥이 모두 샘플에 존재하기 때문임). 일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브 종 부가는 동일한 서열 순서로 동일한 5개 특정 염기 및 2개 축퇴성 또는 보편적 염기를 포함하는 올리고뉴클레오티드 프로브의 혼합물을 포함할 수 있으며, (따라서 16개의 헵타머) 모두는 시스템 처리량 및 표적 핵산 서열을 조사하는 데 사용되는 다양한 시약 세트의 수와 관련하여 단일 5량체 올리고뉴클레오티드 프로브로 기능할 수 있는 동일한 표지로 표지된다. 축퇴성 또는 보편적인 염기는 올리고뉴클레오티드 프로브 종의 세트의 복잡성을 증가시킴이 없이 안정성을 추가할 수 있다.
일부 실시형태에서, 동일하거나 유사한 Tm을 공유할 수 있는 복수의 올리고뉴클레오티드 프로브 종에 대해 동일한 조건이 제공된다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 상이한 인코딩 표지를 포함할 수 있다(이는 각각의 표지 종이 고유하게 식별되도록 상이한 모이어티를 입증할 수 있음). 이러한 경우에, 온도는 동일하거나 유사한 Tm을 공유할 수 있는 올리고뉴클레오티드 프로브 종의 다음 세트에 대해 변경되기 전에 올리고뉴클레오티드 프로브 종 교환의 풀인 여러 올리고뉴클레오티드 프로브 종을 통해 유지된다.
일부 실시형태에서, 노출 과정의 일부인 올리고뉴클레오티드 프로브 종 결합 기간 동안, 온도가 변경되어 하나 초과의 온도에서 올리고뉴클레오티드 프로브 종의 결합 거동이 측정된다. 일부 실시형태에서, 용융 곡선의 아날로그가 수행되며, 여기서 표적 핵산에 대한 올리고뉴클레오티드 프로브 종의 결합 거동 또는 결합 패턴이 선택된 범위(예를 들어, 10℃ 내지 65℃ 또는 1℃ 내지 35℃)를 통해 온도의 단계-별 세트와 상관관계가 있다. 다른 실시형태에서, 염의 변화, 포름아미드와 같은 변성제의 첨가, 및 올리고뉴클레오티드 프로브 결합에 영향을 미치는 것으로 알려진 기타 매개변수의 변화와 같은, 온도의 변화와 유사한 방식으로 표적 핵산에 결합하는 올리고뉴클레오티드 프로브에 영향을 미칠 수 있는 다른 매개변수에 대한 변화가 이루어 진다. 다른 실시형태에서, 단일 온도가 이용되고, 결합 동역학의 관찰이 올리고뉴클레오티드 프로브 결합 Tm과 상관될 수 있는 또 다른 측정가능한 매개변수로서 사용된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종 Tm은 예를 들어 최근접 이웃 매개변수에 의해 계산된다. 다른 실시형태에서, 올리고뉴클레오티드 프로브 종 Tm은 경험적으로 유도된다. 예를 들어, 최적의 용융 온도 범위는 용융 곡선을 수행(예를 들어, 온도의 범위에 걸쳐 흡수에 의한 용융의 정도 측정)하여 유도된다. 일부 실시형태에서, 세트 올리고뉴클레오티드 프로브 종의 조성은 경험적 시험에 의해 검증된 연관된 이론적으로 일치하는 Tm에 따라 설계된다. 일부 실시형태에서, 노출 과정의 일부로서 올리고뉴클레오티드 프로브 종의 결합은 실질적으로 Tm 아래인 온도(예를 들어, 계산된 Tm보다 최대 33℃ 아래)에서 수행된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 개별 올리고뉴클레오티드 프로브 종에 대해 경험적으로 정의된 최적 온도는 시퀀싱 방법에서 노출 과정의 일부로서 각각의 개별 올리고뉴클레오티드 프로브 종의 결합에 대해 사용된다.
일부 실시형태에서, 대안으로서 또는 상이한 Tm을 갖는 올리고뉴클레오티드 프로브 종에 대한 온도를 변형하는 것에 부가하여, 프로브 및/또는 염의 농도가 변경되고/되거나 pH가 변경된다. 일부 실시형태에서, 다른 표면의 테스트 기판 상의 전기적 바이어스는 올리고뉴클레오티드 프로브 종과 하나 이상의 표적 핵산 사이의 일시적인 결합을 능동적으로 촉진하기 위해 양의 부호와 음의 부호 사이에서 반복적으로 전환된다.
일부 실시형태에서, 사용된 올리고뉴클레오티드 프로브 종의 농도는 올리고뉴클레오티드 프로브 종 서열의 AT 대 GC 함량에 따라 조정된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 보다 높은 농도는 보다 높은 GC 함량을 갖는 올리고에 대해 제공된다. 일부 실시형태에서, 염기 조성의 영향을 보상할 수 있는 완충액(예를 들어, CTAB, 베타인 또는 카오트로픽 시약 예컨대 테트라메틸 염화암모늄(TMACl)을 함유하는 완충액)은 2.5M 내지 4M의 농도에서 사용되고, 따라서 동일한 조건의 세트를 사용하여 측정된 다른 AT 대 GC 서열 함량 및 상이한 Tm을 갖는 상이한 올리고뉴클레오티드 프로브 종에 대한 유효한 Tm을 균등화할 수 있다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종은 확률적 효과 또는 시퀀싱 챔버의 설계 측면(예를 들어, 나노채널의 모서리나 벽에 대해 프로브를 포획할 수 있는 유동 셀의 와동)에 기인하여 샘플(예를 들어, 테스트 기판, 유동 챔버, 슬라이드, 표적 핵산(들)의 길이 및/또는 표적 핵산의 정렬된 어레이)에 걸쳐 불균일하게 분포된다. 프로브의 국소적 고갈은 올리고뉴클레오티드 프로브 종 용액의 효율적인 혼합 또는 교반이 있는지 확인함에 의해 해결된다. 일부 경우에, 이것은 난류를 생성할 수 있는 용액에 입자를 포함함에 의해 및/또는 유동 셀(예를 들어, 하나 이상의 표면 상의 헤링본 패턴)을 구조화하여 난류를 생성함에 의해 음파를 사용하여 수행된다. 부가하여, 유동 셀에 존재하는 층류로 인해 전형적으로 혼합이 거의 없고 표면에 가까운 용액은 벌크 용액과 거의 혼합되지 않는다. 이것은 표면에 가까운 시약/결합 프로브를 제거하고 신선한 시약/프로브를 표면으로 가져오는 데 문제를 일으킬 수 있다. 상기에서 기술된 난류 생성 접근방식은 이를 완화하기 위해 구현될 수 있고/있거나 표면(들)에 걸친 광범위한 유체 흐름/교환이 수행될 수 있다. 일부 실시형태에서, 표적 핵산이 배열되기 전 또는 후에, 비-형광 비드 또는 구체가 표적 핵산이 결합된 표면인 표면에 부착되어, 표면 경관에 거친 질감을 제공한다. 이것은 표면에 가까운 유체를 보다 효과적으로 혼합 및/또는 교환하기 위해 와동 및 전류를 생성할 수 있다. 다른 실시형태에서, 전기장은 결합된 올리고뉴클레오티드 프로브 종을 농축 및 또는 제거하기 위해 이용되며, 여기서 장은 하나 이상의 표적 핵산이 결합되는 표면과 벌크 용액 사이에 가해진다.
일부 실시형태에서, 올리고뉴클레오티드 종의 완전한 세트 또는 서브세트가 함께 첨가된다. 일부 이러한 실시형태에서, 염기 조성 효과를 균등화하는 완충액(예를 들어, 미국 특허 출원 번호 2004/0058349에 기술된 바와 같은 TMACl 또는 구아니디늄 티오시아네이트 및 기타)이 사용된다. 일부 실시형태에서, 동일하거나 유사한 Tm을 갖는 프로브 종이 함께 추가된다. 일부 실시형태에서, 함께 추가된 올리고뉴클레오티드 프로브 종은 차등적으로 표지되지 않을 수 있다. 일부 실시형태에서, 함께 추가된 올리고뉴클레오티드 프로브 종은 차등적으로 표지된다. 일부 실시형태에서, 차등 표지는 예를 들어, 상이한 밝기, 수명, 최대 여기, 최대 방출, 또는 기타 관찰가능한 광학적 특성, 및/또는 이러한 물리적 특성의 조합을 가지는 방출을 갖는 표지이다.
일부 실시형태에서, 여기서 2개 이상의 올리고뉴클레오티드 프로브 종은 함께 사용되고, 그의 결합 장소는 상이한 올리고뉴클레오티드 종으로부터 생성된 신호 간을 구별하기 위한 규정 없이 결정되었다(예를 들어, 올리고는 동일한 방출 파장으로 표지됨). 듀플렉스 표적 핵산의 양 가닥 모두가 이용가능한 경우 양 가닥에서 결합 부위 데이터를 얻는 것은 어셈블리 알고리즘의 일부로 둘 이상의 올리고뉴클레오티드 사이의 분화를 허용할 수 있다. 일부 실시형태에서, 하나 이상의 참조 올리고뉴클레오티드 프로브 종은 세트 또는 서브세트의 각각의 올리고뉴클레오티드 프로브 종과 함께 추가된 다음 어셈블리 알고리즘은 광학 활성의 장소 및 결과적인 이러한 참조 프로브의 결합 장소를 사용하여 표적 핵산 서열 어셈블리를 스캐폴드 또는 앵커링할 수 있다. 다른 실시형태에서, 여기서 2개 이상의 올리고뉴클레오티드 프로브 종은 함께 사용되고, 그의 결합 장소는 올리고뉴클레오티드 프로브 종의 다중 세트를 생성함에 의해, 상이한 올리고뉴클레오티드 종으로부터 생성된 신호 간을 구별하기 위한 규정 없이 결정되었으며(예를 들어, 올리고는 동일한 방출 파장으로 표지됨), 여기서 올리고뉴클레오티드 프로브 종의 완전한 세트에서 각각의 올리고뉴클레오티드 프로브 종은 올리고뉴클레오티드 프로브 종의 하나 초과의 서브세트에 표시되고, 올리고뉴클레오티드 프로브 종의 식별은 상이한 서브세트의 조합을 사용하여 실행되어, 광학 활성의 공통 장소와 따라서 올리고뉴클레오티드 프로브 종 결합 장소를 결정한다.
하나의 대안적인 실시형태에서, 올리고뉴클레오티드 프로브 종은 유리한 결합 조건을 사용하여 안정적으로 결합할 수 있지만, 결합 조건을 유리하지 않은 결합 조건으로의 변경을 이용하여 결합을 제어하고 일시적인 결합을 수행한다. 비-제한적 실시형태에서, 조건의 변경은 올리고뉴클레오티드 프로브 종을 결합 해제하게 할 수 있는 열, pH, 전기장 또는 시약 교환이다. 그런 다음 조건은 다시 유리한 결합 조건으로 변경되어, 올리고뉴클레오티드 프로브 종이 다시 결합하도록 한다. 일부 실시형태에서, 제1 유리한 결합 조건 시간 간격이 모든 표적 핵산 부위를 포화시키지 않을 수 있는 경우, 제2 유리한 결합 조건 시간 간격 올리고뉴클레오티드 로브 종에서 제1 유리한 결합 조건 시간 간격에서 사용된 것과 동일한 세트의 올리고뉴클레오티드 프로브 종인 올리고뉴클레오티드 프로브 종은 제1 유리한 결합 조건 시간 간격과 상이한 세트의 표적 핵산 부위에 결합할 수 있다. 일부 실시형태에서, 이들 주기는 제어가능한 속도로 여러 번 수행된다.
일부 실시형태에서, 일시적인 결합은 1밀리초 이하, 50밀리초 이하, 500밀리초 이하, 1마이크로초 이하, 10마이크로초 이하, 50마이크로초 이하, 500마이크로초 이하, 1초 이하, 2초 이하, 5초 이하, 또는 10초 이하 동안 지속된다.
일부 실시형태에서, 일시적인 결합 방법을 사용하고 신선한 올리고뉴클레오티드 프로브 종의 지속적인 공급을 보장할 때 형광단의 광 탈색은 유의한 문제를 일으키지 않을 수 있고 조명을 제한하기 위해 정교한 시야 조리개 또는 파웰 렌즈가 필요하지 않을 수 있다. 따라서, 형광단의 선택 (또는 변색방지, 산화환원 시스템의 제공)은 중요하지 않을 수 있고, 일부 이러한 실시형태에서 비교적 단순한 광학 시스템이 구성된다; 예를 들어, 2-차원 이미저의 시야에 있지 않은 표적 핵산의 조명을 방지할 수 있는, f-스톱.
일부 실시형태에서, 일시적인 결합의 또 다른 이점은 폴리뉴클레오티드를 따라 매 결합 부위에서 다중 측정이 이루어질 수 있어 광학 활성 경우 또는 검출의 정확성에서의 신뢰도를 증가시킬 수 있다는 것이다. 예를 들어, 일부 경우에, 분자 과정의 전형적인 확률론적 특성으로 인해 올리고뉴클레오티드 프로브 종이 잘못된 장소에 결합할 수 있다. 예를 들어, 올바른 결합보다 훨씬 더 짧을 가능성이 있을 특이값 같은, 일시적으로 결합된 프로브를 사용하면 단리된 결합 이벤트가 폐기될 수 있고 다중 감지된 상호작용에 의해 확증된 이들 결합 이벤트만이 표적 핵산 서열 결정의 목적을 위한 유효한 검출 이벤트로 허용된다.
일시적인 결합의 검출 및 결합 부위의 국지화.
일시적인 결합은 하위-회절 수준의 국지화를 가능하게 하는 필수 구성요소이다. 일시적으로 결합하는 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브는 표적 핵산에 결합되거나 용액에 존재할 확률이 언제든지 있다. 따라서, 모든 표적 핵산 결합 부위가 어느 한 번에 올리고뉴클레오티드 프로브에 의해 결합되는 것은 아닐 것이다. 이것은 빛의 회절 한계보다 더 가까운 부위(예를 들어, 표적 핵산에서 단지 10nm 떨어져 있는 2개 부위)에서 결합 이벤트의 검출을 허용할 수 있다. 예를 들어, 서열 AAGCTT가 60개 염기 후에 반복된다면, 반복되는 서열은 약 20nm 떨어져 있을 것이다(표적 핵산이 약 0.34nm의 왓슨-크릭 염기 길이로 연장되고 곧게 신장된 경우). 20나노미터는 정상적으로 광학 이미징으로 구별할 수 없다. 그러나, 프로브가 이미징 중에 서로 다른 시간에 두 사이트에 결합하면 개별적으로 검출된다. 이것은 결합 이벤트의 초고해상도 이미징을 허용한다. 나노미터의 정밀도는 단독중합체 반복이거나 또는 2개 염기 반복, 3개 염기 반복 또는 3개 초과의 염기 반복일 수 있는 서열 반복을 분석하고 그의 수를 결정하는 데 특히 중요하다.
일부 실시형태에서, 광학 활성의 다중 경우와 연관되고 표적 핵산의 장소와 상관된 다중 결합 이벤트는 단일 올리고뉴클레오티드 프로브 종 서열로부터 유래되지 않을 수 있지만, 올리고뉴클레오티드 프로브 종의 완전한 세트로부터 데이터를 분석하고, 결합 이벤트 또는 부분적으로 중첩하는 서열로 인해 발생할 수 있는 광학 활성의 경우를 고려함에 의해 결정된다. 일 예에서 동일한 (실제로 나노미터 이하로 가까운) 장소는 공통 5개 염기 서열을 공유하고 각각이 다른 서열을 검증할 뿐만 아니라 서열을 공통 5 염기 서열의 어느 하나의 측면 상의 일 염기로 확장하는 6-mer인 프로브 ATTAAG 및 TTAAGC에 의해 결합된다. 일부 경우에, 5개 염기 서열의 어느 하나의 측면 상의 염기가 불일치이고(말단에서의 불일치는 전형적으로 내부에 있는 불일치보다 더 많이 허용될 것으로 예상됨) 양 결합 이벤트에 존재하는 5개 염기 서열만이 검증된다.
일부 대안적인 실시형태에서, 일시적인 단일 분자 결합은 비-광학적 방법에 의해 검출된다. 일부 실시형태에서, 비-광학적 방법은 전기적 방법이다. 일부 실시형태에서, 일시적인 단일 분자 결합은 직접적인 여기 방법이 없고; 오히려 생물발광 또는 화학발광 기전이 사용되는 비-형광 방법에 의해 검출된다.
일부 실시형태에서, 표적 핵산에서 각각의 염기는 그의 서열이 중첩될 수 있는 다중 올리고뉴클레오티드 프로브 종에 의해 조사된다. 각 염기의 이 반복된 샘플링은 표적 핵산에서 희귀한 단일 뉴클레오티드 변이체 또는 돌연변이의 검출을 허용한다.
일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브 종이 분석하에 있는 표적 핵산과 함께 갖는 광학 활성 또는 결합 상호작용(이는 역치 결합 지속시간보다 긴 지속시간을 가짐)의 모든 경우가 이러한 분석에 이용된다. 일부 실시형태에서, 시퀀싱은 완벽한 매치로부터 서열을 스티칭하거나 재구성하는 것을 포함할 수 있을 뿐만 아니라 제1 소프트웨어 서열 결정 과정에서 각각의 올리고뉴클레오티드 프로브 종과 연관된 광학 활성 또는 결합 이벤트의 유효한 경우를 먼저 분석함에 의해 서열을 얻을 수 있다. 일부 실시형태에서, 일시적인 결합은 검출의 수단으로서 기록되지만 올리고뉴클레오티드 프로브 종 결합의 국지화를 개선하기 위해 사용되지 않을 수 있다.
광학 활성을 검출하고 결합 부위의 국지화를 결정하기 위한 이미징 기술.
블록 214. 일부 실시형태에서, 테스트 기판 상의 장소 및 선택적으로 2-차원 이미저를 사용하여 노출 과정 동안 발생하는 광학 활성의 각각의 각 경우의 지속시간이 측정된다.
일부 실시형태에서, 테스트 기판 상의 장소를 측정하는 것은 2-차원 이미저에 의해 측정된 데이터의 프레임을 훈련된 합성곱 신경망에 입력하는 것을 포함할 수 있다. 데이터의 프레임은 상이한 장소 및 동일한 장소에서의 복수의 광학 활성의 경우 중에서 상이한 장소에서의 광학 활성의 각각의 경우를 포함할 수 있다. 복수의 광학 활성의 경우에서의 광학 활성의 각각의 경우는 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 결합하는 개별 뉴클레오티드 프로브 종에 상응할 수 있다. 입력에 응하여, 훈련된 합성곱 신경망은 복수의 광학 활성의 경우에서의 광학 활성의 하나 이상의 경우의 각각의 테스트 기판 상의 위치를 식별할 수 있다.
일부 실시형태에서, 검출기는 2-차원 검출기이고, 결합 이벤트는 (예를 들어, 단일 분자 국지화 알고리즘을 사용함에 의하여) 나노미터 정확도로 국지화된다. 일부 실시형태에서, 상호작용 특성은 표적 핵산과 올리고뉴클레오티드 프로브 종의 결합 친화도에 상응할 수 있는, 광학 활성 또는 결합 이벤트의 각 경우의 지속시간을 포함할 수 있다. 일부 실시형태에서, 특성은 특정 표적 핵산(예를 들어, 특정 유전자 서열에 상응하는 폴리뉴클레오티드)의 어레이 내의 장소에 상응할 수 있는 테스트 기판, 표면 또는 매트릭스 상의 장소이다.
일부 실시형태에서, 광학 활성의 각각의 각 경우는 미리결정된 역치를 만족할 수 있는 관찰 메트릭을 갖는다. 일부 실시형태에서, 관찰 메트릭은 지속시간, 신호 대 잡음, 광자 계수, 또는 강도, 또는 이의 조합을 포함한다. 일부 실시형태에서, 하나의 프레임에 대해 광학 활성의 각각의 경우가 관찰될 때 미리결정된 역치가 충족된다. 일부 실시형태에서, 광학 활성의 각각의 경우의 강도는 비교적 낮고, 광학 활성의 각각의 경우가 1/10 프레임 동안 관찰될 때 미리결정된 역치가 충족된다.
일부 실시형태에서, 미리결정된 역치는 (i) 올리고뉴클레오티드 프로브 종의 고유한 N-mer 서열의 각 잔기가 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥에서 상보적 염기에 결합하는 제1 형태의 결합, 및 (ii) 올리고뉴클레오티드 프로브 종의 고유한 N-mer 서열과 각각의 올리고뉴클레오티드 프로브 종이 결합되어 광학 활성 또는 결합 이벤트의 각각의 경우를 형성하는 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥에서의 서열 사이에 적어도 하나의 불일치가 있는 제2 형태의 결합 사이에서 구별될 수 있다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 각 올리고뉴클레오티드 프로브 종은 그 자체의 상응하는 미리결정된 역치를 갖는다.
일부 실시형태에서, 미리결정된 역치는 올리고뉴클레오티드 프로브 종과 표적 핵산 중에서 특정 장소에 표적 핵산 사이에 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 또는 6개 이상의 결합 이벤트를 관찰하는 것에 기반하여 결정된다.
일부 실시형태에서, 각각의 각 올리고뉴클레오티드 프로브 종 올리고뉴클레오티드 프로브 종의 세트에 대한 미리결정된 역치는 훈련 데이터세트(예를 들어, 람다 파지 시퀀싱, 또는 임의의 공지된 합성 표적 핵산에 일시적인 결합 방법을 적용함에 의해 획득된 정보로부터 유래된 데이터세트)로부터 유래된다. 일부 실시형태에서, DNA 염기에 비해 우리딘과 같은 후성유전적으로 변형된 염기 또는 RNA 염기와 같은, 상이한 염기 변이체에 대해 상이한 역치가 결정되고, 이러한 상이한 역치는 예상되는 샘플 표적 핵산 유형 또는 잠재적으로 변정된 염기 영역, 예컨대 CpG 섬 중 하나에 상응하여 사용된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 각 올리고뉴클레오티드 프로브 종에 대한 미리결정된 역치는 훈련 데이터세트로부터 유래된다. 훈련 세트는, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 각 올리고뉴클레오티드 프로브 종에 대해, 참조 핵산 서열에 결합할 때 각각의 각 올리고뉴클레오티드 프로브 종에 대한 관찰 메트릭의 측정값을 포함하여 각각의 올리고뉴클레오티드 프로브 종의 고유한 N-mer 서열의 각 잔기는 참조 핵산 서열에서의 상보적 염기에 결합한다.
일부 실시형태에서, 참조 핵산은 참조 기판 상에 고정된다. 일부 실시형태에서, 참조 핵산은 테스트 기판에 포함되고 그 위에 고정된다. 일부 실시형태에서, 참조 핵산 서열은 PhiX174, M13, 람다 파지, T7 파지, 대장균, 사카로마이세스 세레비지애 또는 사카로마이세스 폼베의 게놈 전체 또는 일부를 포함할 수 있다. 일부 실시형태에서, 참조 핵산 서열은 공지된 서열의 합성 작제물이다. 일부 실시형태에서, 참조 핵산 서열은 토끼 글로빈 RNA의 전부 또는 일부를 포함할 수 있다(예를 들어, 이는 표적 핵산이 RNA를 포함할 때 또는 표적 핵산의 한 가닥만이 서열화될 때 이용됨).
일부 실시형태에서, 노출 과정은 개재하는 염료의 형태에서 제1 표지를 이용할 수 있다. 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 제2 표지와 결합된다. 제1 표지와 제2 표지는 중첩하는 공여체 방출 및 수용체 여기 스펙트럼을 가지고 있어 제1 표지와 제2 표지가 서로 근접해 있을 때 제1 표지 및 제2 표지 중 하나가 형광 수준을 증가시킬 수 있다. 광학 활성의 각각의 경우는, 제2 표지에 대한 올리고뉴클레오티드 프로브 종과 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥 사이의 각각의 듀플렉스에 개재되는, 개재하는 염료의 근접성으로부터 발생할 수 있다. 일부 실시형태에서, 노출 과정 및 연관된 형광은 푀르스터 공명 에너지 전달(FRET) 방법을 포함할 수 있다. 이러한 실시형태에서, 개재하는 염료는 FRET 공여체를 포함할 수 있고, 제2 표지는 FRET 수용체를 포함할 수 있다.
일부 실시형태에서, 광학 활성의 경우는 올리고뉴클레오티드 프로브 종 또는 표적 핵산 서열에 결합, 연결 또는 회합된 표지에 대한 개재하는 염료 사이의 FRET를 이용하여 검출된다. 일부 실시형태에서, 표적 핵산이 이동억제된 후, 모든 표적 핵산의 말단은 예를 들어 FRET 파트너로 작용할 수 있는 형광으로 표지된 뉴클레오티드를 추가하는 말단 전이효소에 의해 표지된다. 일부 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종은 그의 말단 중 하나에서 Cy3B 또는 Atto 542 표지로 표지된다.
일부 실시형태에서, FRET는 광 활성화에 의해 대체된다. 이러한 실시형태에서, 공여체(예를 들어, 표적 핵산 상의 표지)는 광 활성화제를 포함할 수 있고, 수용체(예를 들어, 올리고뉴클레오티드 프로브 종의 표지)는 형광단을 비활성화되거나 어두운 상태로 한다(예를 들어, Cy5 표지는 형광 이미징 실험 전에 pH 7.5, 2mM EDTA 및 50mM NaCl에서 20mM Tris 내 1mg/mL NaBH4로 케이싱함에 의해 어둡게 될 수 있음). 이러한 실시형태에서, 올리고뉴클레오티드 프로브 종에 결합되고, 활성화제에 매우 근접할 때 스위치 온되는, 어두워진 형광단의 형광으로, 그 활성화제는 표적 핵산에 결합된다.
일부 실시형태에서, 노출 과정은 개재하는 염료(예를 들어, 광 활성화제)의 형태에서 제1 표지를 이용할 수 있다. 올리고뉴클레오티드 프로브 종의 세트에서 각 올리고뉴클레오티드 프로브 종은 제2 표지(예를 들어, 어두운 형광단)와 결합된다. 제1 표지는 제1 표지와 제2 표지가 서로 매우 근접해 있을 때 제2 표지가 형광을 발하도록 할 수 있다. 광학 활성의 각각의 경우는, 올리고뉴클레오티드 프로브 종에 결합되는 제2 표지에 대한, 올리고뉴클레오티드 프로브 종과 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥 사이의 각각의 듀플렉스에 개재되는, 개재하는 염료의 근접성으로부터 발생할 수 있다.
일부 실시형태에서, 노출 과정은 개재하는 염료(예를 들어, 어두워진 형광단)의 형태에서 제1 표지를 이용할 수 있다. 올리고뉴클레오티드 프로브 종의 세트에서 각 올리고뉴클레오티드 프로브 종은 제2 표지(예를 들어, 광 활성화제)와 결합된다. 제2 표지는 제1 표지와 제2 표지가 서로 매우 근접해 있을 때 제1 표지가 형광을 발하도록 할 수 있다. 광학 활성의 각각의 경우는, 올리고뉴클레오티드 프로브 종에 결합되는 제2 표지에 대한, 올리고뉴클레오티드 프로브 종과 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥 사이의 각각의 듀플렉스에 개재되는, 개재하는 염료의 근접성으로부터 발생할 수 있다.
일부 실시형태에서, 노출 과정은 개재하는 염료를 이용할 수 있다. 광학 활성의 각각의 경우는 올리고뉴클레오티드 프로브 종과 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥 사이의 각각의 듀플렉스에 개재되는, 개재하는 염료의 형광으로부터 발생할 수 있으며, 여기서 광학 활성의 각각의 경우는 각각의 듀플렉스에 개재시키기 전에 개재하는 염료의 형광보다 더 크다. 표적 핵산과 올리고뉴클레오티드 프로브 종 사이의 듀플렉스 안으로 개재되는 하나 이상의 개재하는 염료의 증가된 형광(100X 이상)은 단일 분자 국지화 알고리즘에 대한 포인트 소스-유사 신호를 제공할 수 있고 결합 부위의 장소의 정확한 결정을 허용할 수 있다. 개재하는 염료는 듀플렉스 안으로 개재할 수 있어, 강력하게 검출되고 정확하게 국지화된 각 올리고뉴클레오티드 프로브 종 결합 부위에 대한 결합 이벤트와 연관된 광학 활성의 상당한 수의 듀플렉스 야기된 경우를 생성할 수 있다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 표적 핵산의 고정된 제1 가닥의 상보적 부분에 결합함에 의해 광학 활성의 제1 경우 및 표적 핵산의 고정된 제2 가닥의 상보적인 부분에 결합함에 의해 광학 활성의 제2 경우를 생성할 수 있다. 일부 실시형태에서, 표적 핵산의 고정된 제1 가닥의 일부는 그의 상보적 올리고뉴클레오티드 프로브 종의 결합에 의해 광학 활성의 경우를 생성할 수 있고, 표적 핵산의 고정된 제1 가닥의 일부에 상보적인 표적 핵산의 고정된 제2 가닥의 일부는 그의 상보적 올리고뉴클레오티드 프로브 종의 결합에 의해 광학 활성의 또 다른 경우를 생성할 수 있다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종은 표적 핵산의 고정된 제1 가닥의 2개 이상의 상보적 영역에 결합함에 의해 광학 활성의 2개 이상의 제1 경우 및 표적 핵산의 고정된 제2 가닥의 2개 이상의 상보적 영역을 결합함에 의해 광학 활성의 2개 이상의 제2 경우를 생성할 수 있다.
일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브 종은 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 결합할 수 있으며, 이는 노출 과정 동안 3회 이상 각각의 올리고뉴클레오티드 프로브 종에 상보적이고, 이에 의해 광학 활성의 3개 이상의 경우를 초래하며, 여기서 광학 활성의 각각의 경우는 복수의 결합 이벤트에서 결합 이벤트를 나타낼 수 있다.
일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브 종은 표적 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 결합할 수 있으며, 이는 노출 과정 동안 5회 이상 각각의 올리고뉴클레오티드 프로브 종에 상보적이고, 이에 의해 광학 활성의 5개 이상의 경우를 초래하며, 여기서 광학 활성의 각각의 경우는 복수의 결합 이벤트에서 결합 이벤트를 나타낼 수 있다.
일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브 종은 노출 과정 동안 10회 이상 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 결합할 수 있고, 이에 의해 광학 활성의 10개 이상의 경우를 초래하며, 여기서 광학 활성의 각각의 경우는 복수의 결합 이벤트에서 결합 이벤트를 나타낼 수 있다.
일부 실시형태에서, 노출 과정은 5분 이하, 4분 이하, 3분 이하, 2분 이하, 또는 1분 이하 동안 발생할 수 있다.
일부 실시형태에서, 노출 과정은 2-차원 이미저의 1개 이상의 프레임에 대해 발생할 수 있다. 일부 실시형태에서, 노출 과정은 2-차원 이미저의 2개 이상의 프레임에 대해 발생할 수 있다. 일부 실시형태에서, 노출 과정은 2-차원 이미저의 500개 이상의 프레임에 대해 발생할 수 있다. 일부 실시형태에서, 노출 과정은 2-차원 이미저의 5,000개 이상의 프레임에 대해 발생할 수 있다. 일부 실시형태에서, 광학 활성이 희박한 경우(예를 들어, 프로브 결합의 경우가 공간적으로 적은 경우), 일시적인 결합의 일 프레임은 올리고뉴클레오티드 프로브 종 결합 부위와 연관된 신호를 국지화하기에 충분하다.
일부 실시형태에서, 노출 과정 동안 광학 활성의 평균 경우의 예상된 시간 길이는 노출 과정에 사용된 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종의 추정된 용융 온도에 의해 결정된다.
일부 실시형태에서, 광학 활성은 표지로부터 형광 방출의 검출을 포함할 수 있다. 각각의 표지는 여기되고 상응하는 방출 파장은 필터 휠에서 별도 필터를 사용하여 별도로 검출된다. 일부 실시형태에서, 표지 방출 수명은 형광 수명 이미징(FLIM) 시스템을 사용하여 측정된다. 대안적으로, 방출 파장이 분할되어 단일 센서의 다른 사분면 또는 4개의 개별 센서 상으로 투영된다. 일부 실시형태에서, 프리즘을 사용하여 CCD의 픽셀에 걸쳐 방출 스펙트럼을 분할하는 방법은 Lundquit 외, Opt Lett., 33:1026-8, 2008에 의해 기술된 바와 같이 고소된다. 일부 실시형태에서, 분광기가 또한 사용될 수 있다. 대안적으로, 일부 실시형태에서, 방출 파장은 예상된 올리고뉴클레오티드 프로브 종 결합 시간이 프레임 노출 시간보다 상당히 짧은 경우 결합 부위에서 프로브의 체류 시간에 대한 정보를 제공하기 위해 밝기 수준과 조합될 수 있다.
스캐닝 프로브 현미경(고속 원자력 현미경 포함) 및 전자 현미경과 같은 여러 검출 방법은 폴리뉴클레오티드 분자가 검출 평면에서 연장될 때 나노미터 거리를 분해할 수 있다. 그러나, 이들 방법은 형광단의 광학 활성에 관한 정보를 제공하지 않는다. 초고해상도 정밀도로 형광 분자를 검출하는 다수의 광학 이미징 기술이 있다. 여기에는 자극 방출 고갈(STED), 확률적 광학 재구성 현미경(STORM), 초고해상도 광학 변동 이미징(SOFI), 단일 분자 국지화 현미경(SMLM) 및 전반사 형광(TIRF) 현미경이 포함된다. 일부 실시형태에서, 나노스케일 토포그래피(PAINT)에서의 포인트 축적과 가장 유사한 SMLM 접근방식이 사용된다. 이들 시스템은 전형적으로 형광단을 자극하기 위해 하나 이상의 레이저, 초점 감지/유지 기전, 하나 이상의 CCD 또는 CMOS 카메라, 적절한 대물렌즈, 릴레이 렌즈 및 거울이 필요하다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 결합-온 및 -오프를 기록하기 위해 다수의 이미지 프레임(예를 들어, 영화 또는 비디오)에 대해 노출 단계가 발생할 수 있다.
SMLM 방법은 높은 광자 계수에 의존한다. 높은 광자 계수는 형광단 방출 생성된 가우시안 패턴의 중심이 결정되는 정밀도를 개선하지만 높은 광자 계수에 대한 필요성은 또한 긴 이미지 획득 및 밝고 광 안정한 형광단에 대한 의존성과 연관되어 있다. 켄칭된 프로브, 분자 비콘을 사용하거나 상보적인 올리고뉴클레오티드 프로브 종과 연관된 2개 이상의 표지, 예를 들어, 듀플렉스 형태 표적 핵산의 각 면에 하나를 가짐으로써 해로운 배경을 야기하지 않으면서 프로브의 높은 용액 농도가 이용된다. 이러한 실시형태에서, 표지는 염료-염료 상호작용을 통한 용액에서 켄칭된다. 그러나, 그 표적 표지에 결합되면 분리되어 밝게 형광(예를 들어, 단일 염료보다 2배 더 밝게)되어 그것을 더 쉽게 검출하게 할 수 있다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종인 프로브 종의 온-속도는 예를 들어, 프로브 농도 증가, 온도 증가, 또는 분자 군집 증가(예를 들어, 용액에 PEG 400, PEG 800을 포함함에 의함)에 의해 변경(예를 들어, 증가)된다. 다른 실시형태에서, 올리고뉴클레오티드 프로브 종인 프로브 종의 오프 속도는 예를 들어 그의 화학적 성분을 조작하고 불안정화 첨가물을 추가함에 의해 올리고뉴클레오티드 프로브 종인 프로브 종의 열 안정성을 감소시킴에 의해 변결될 수 있거나, 또는 구체적으로 올리고뉴클레오티드 프로브 종의 경우, 천연 염기 대신 후성유전적으로 변형되거나 합성적으로 변형된 염기를 사용하여 그 길이를 감소시키고, 예를 들어 전하를 추가함에 의해 핵염기 또는 당 사이의 간격을 변경함에 의해 올리고뉴클레오티드 프로브 종 백본을 변형시키는 것은 오프 속도를 증가시킬 수 있다. 일부 실시형태에서, 오프-속도는 온도 증가, 염 농도 감소(예를 들어, 엄격성 증가), 또는 pH 변경에 의해 증가된다.
일부 실시형태에서, 사용된 올리고뉴클레오티드 프로브 종의 농도는 올리고뉴클레오티드 프로브 종 표지인 프로브 표지를 이들이 결합할 때까지 본질적으로 비-형광성으로 만듦에 의해 배경 수준을 유의하게 상승시키지 않으면서 증가된다. 이를 수행하는 한 가지 방법은 결합이 광 활성화 이벤트를 유도하는 것이다. 다른 하나는 결합이 발생할 때까지 표지가 켄칭되는 것이다(예를 들어, 분자 비콘). 다른 하나는 에너지 전달 이벤트의 결과로 신호가 검출되는 것이다(예를 들어, FRET, CRET, BRET). 일부 실시형태에서, 표적 핵산인 생체고분자는 공여체에 결합되고, 테스트 기판인 표면 상에 있고, 올리고뉴클레오티드 프로브 종인 프로브는 수용체에 결합되거나) 또는 반대의 경우도 마찬가지이다. 다른 실시형태에서 개재하는 염료는 용액에 제공되고 표지된 프로브의 결합 시 개재하는 염료와 표지된 프로브 사이에 FRET 상호작용이 있다. 개재하는 염료의 예는 YOYO-1이고 프로브 상의 표지 예는 ATTO 655이다. 다른 실시형태에서 개재하는 염료는 FRET 기전 없이 사용된다― 테스트 기판 또는 다른 표면 상의 단일 가닥 표적 핵산 및 올리고뉴클레오티드 프로브 종 둘 모두는 표지되지 않고 결합은 개재하는 염료가 그 안으로 개재될 수 있는 상보적 이중 가닥을 생성할 때만 신호가 검출될 수 있다. 개재하는 염료는 듀플렉스 핵산 안으로 개재되지 않고 대신 용액에서 유리될 때 그 정체성에 따라 100X 또는 1000X 덜 밝다. 일부 실시형태에서, TIRF 또는 고도로 경사지고 적층된 광학(HILO)(예를 들어, Mertz 외, J. of Biomedical Optics, 15(1): 016027, 2010에 기술된 바와 같음) 현미경은 용액에서 개재하는 염료로부터 임의의 배경 신호를 제거하는 데 사용된다.
일부 실시형태에서, 표지된 프로브의 고농도로 인해 흐릿함이 초래될 수 있는 테스트 기판 또는 다른 표면 상의 신호의 검출을 불명확하게 할 수 있는 높은 배경 형광성의 감소. 일부 실시형태에서, 이것은 테스트 기판 또는 다른 표면 상에 형성된 듀플렉스를 표지하기 위해 DNA 염색 또는 개재하는 염료를 이용함에 의해 해결된다. 염료는 표적 핵산이 단일 가닥이거나 단일 가닥 프로브로 되지 않을 때 개재되지 않을 수 있지만, 개재하는 염료는 올리고뉴클레오티드 프로브 종과 표적 핵산 사이에 듀플렉스가 형성될 때 개재될 것이다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종은 표지되지 않고, 검출되는 신호는 개재하는 염료로부터만 발생할 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종은 개재하는 염료 또는 DNA 염색에 대한 FRET 파트너로서 작용할 수 있는 표지로 표지된다. 일부 실시형태에서, 개재하는 염료는 공여체이고 상이한 파장의 수용체와 결합할 수 있으므로 올리고뉴클레오티드 프로브 종이 다중 형광단으로 인코딩되도록 허용할 수 있다.
일부 실시형태에서, 노출 과정은 올리고뉴클레오티드 프로브 종에 상보적인 각 표적 핵산 부위와 연관된 광학 활성 또는 결합 이벤트의 다중 경우를 검출할 수 있다. 일부 실시형태에서, 다중 이벤트는 온 및 오프 결합하는 단일 올리고뉴클레오티드 프로브 분자, 온 및 오프 결합하는 올리고뉴클레오티드 프로브 종의 아종, 또는 온 및 오프 결합하는 올리고뉴클레오티드 프로브 종으로부터의 것이고 전술한 결합 이벤트의 임의의 조합(올리고뉴클레오티드 프로브의 단일, 아종 또는 종)은 여러 번 발생할 수 있다. 일부 실시형태에서, 결합 온- 또는 오프-속도는 조건을 변경함에 의해 영향을 받지 않을 수 있다. 예를 들어, 결합-온 및 결합-오프 둘 모두는 동일한 조건(예를 들어, 염 농도, 온도 등) 하에서 발생하고 프로브-표적 상호작용이 약하게 되기 때문이다.
일부 실시형태에서, 시퀀싱은 더 짧거나 동일한 길이 또는 올리고뉴클레오티드 프로브 종 길이의 크기 순서 내인 단일 표적 핵산 상의 다중 장소에서 광학 활성 또는 온-오프 결합 이벤트의 다중 경우를 이미징함에 의해 수행된다. 이러한 실시형태에서, 더 긴 표적 핵산이 단편화되거나 단편의 패널이 미리-선택되고 테스트 기판 또는 다른 표면 상에 배열되어 각각의 표적 핵산 분자가 개별적으로 분해가능하다. 이들 경우에, 올리고뉴클레오티드 프로브 종이 표적 핵산 서열에 완전히 상보적인지 여부를 결정하기 위해 특정 장소에 결합하는 올리고뉴클레오티드 프로브 종 또는 광학 활성의 경우의 빈도 또는 지속시간이 사용된다. 올리고뉴클레오티드 프로브 종 결합의 빈도 또는 지속시간은 올리고뉴클레오티드 프로브 종이 (잔존하는 염기가 불일치되거나 돌출함으로) 표적 핵산 서열의 전부 또는 일부에 상보적인지 여부를 결정할 수 있다.
일부 실시형태에서, 표적 핵산 사이의 병렬 중첩의 발생은 일부 실시형태에서 DNA 염색으로부터 형광의 증가에 의해 검출된다. 염색을 사용할 수 없는 일부 실시형태에서, 중첩은 명목상으로 단일하지만 실제로는 중첩된 표적 핵산 쌍의 영역 내의 겉보기 결합 부위의 빈도에서의 증가에 의해 검출된다. 예를 들어, 회절-제한 분자가 광학적으로 중첩되는 것처럼 보이지만 실제로는 물리적으로 중첩되지 않을 수 있는 일부 경우에, 그것은 본 개시내용의 다른 곳에서 기술된 바와 같이 단일 분자 국지화를 사용하여 초-분해된다. 말단-상-말단 중첩이 발생하는 경우, 일부 실시형태에서, 표적 핵산의 말단을 표시하는 표지를 사용하여 병치된 표적 핵산을 단일 표적 핵산의 진정한 연속 길이와 구별한다. 일부 실시형태에서, 게놈 또는 표적화된 서열의 많은 카피가 예상되고 명백한 키메라의 단 한 번의 발생이 발견되는 경우 이러한 광학 키메라는 인공물로 무시된다. 표적 핵산의 말단(회절-제한)은 광학적으로 중첩되는 것으로 보이지만 물리적으로 중첩되지 않는, 일부 실시형태에서, 그것은 본 개시내용의 방법에 의해 분해된다. 일부 실시형태에서, 장소 결정은 매우 정밀하여 매우 가까운 표지에서 나오는 신호가 분해된다.
일부 실시형태에서, 시퀀싱은 올리고뉴클레오티드 프로브 종보다 더 긴 단일 표적 핵산 상의 다중 장소에서 광학 활성 또는 온-오프 결합 이벤트의 다중 경우를 이미징함에 의해 수행된다. 일부 실시형태에서, 단일 표적 핵산에 대한 광학 활성 또는 프로브 결합 이벤트의 경우의 장소가 결정된다. 일부 실시형태에서, 단일 표적 핵산에 대한 광학 활성 또는 결합 이벤트의 올리고뉴클레오티드 프로브 종의 장소는 표적 핵산을 연장함에 의해 결정되어, 표적 핵산의 길이를 따라 광학 활성 또는 결합 이벤트의 상이한 장소가 검출되고 분해된다.
일부 실시형태에서, 표적 핵산에 결합된 올리고뉴클레오티드 프로브 종으로부터 비결합된 올리고뉴클레오티드 프로브 종의 광학 활성을 구별하는 것은 결합하지 않은 올리고뉴클레오티드 프로브 종으로부터 신호의 거부 또는 제거를 필요로 할 수 있다. 일부 이러한 실시형태에서, 이는 예를 들어 조명을 위한 소멸장 또는 도파관을 이용하거나 FRET 쌍 표지를 이용하거나 또는 광 활성화를 이용함에 의해 실행되어 특정 장소에서 올리고뉴클레오티드 프로브 종을 검출한다(예를 들어, Hylkje 외, Biophys J. 2015, 108(4): 949-956에 기술된 바와 같음).
일부 실시형태에서, 도 13a-13c에 예시된 바와 같이, 올리고뉴클레오티드 프로브 종은 표지되지 않을 수 있지만 표적과의 상호작용은 듀플렉스 안으로 개재될 수 있고 결합이 발생하거나 발생하였음에 따라 개재된 염료(1304)로 형광을 개시할 수 있는 비결합된 개재하는 염료(1302)와 같은 DNA 염색을 사용하여 검출된다(예를 들어, 도 13a-13c에 예시된 바와 같음). 일부 실시형태에서, 하나 이상의 개재하는 염료는 표적 핵산과 올리고뉴클레오티드 프로브 종 사이의 단일 듀플렉스 안으로 임의의 시점에 개재될 수 있다. 일부 실시형태에서, 개재하는 염료는 일단 그것이 개재됨에 의해 방출되는 형광은 용액에서 자유로 부유하는 비결합된 개재하는 염료로부터의 형광보다 수십 배 더 크다. 예를 들어, 개재된 YOYO-1 염료로부터의 신호는 유리 용액에서 YOYO-1 염료로부터의 신호보다 약 100x 더 크다. 일부 실시형태에서, 약하게 염색된 (또는 부분적으로 광 탈색된) 이중-가닥 폴리뉴클레오티드가 이미징될 때, 관찰되는 폴리뉴클레오티드에 따른 개별 신호는 단일 개재하는 염료 분자에 상응할 수 있다. 듀플렉스에서 YOYO-1 염료의 교환을 용이하게 하고 밝은 신호를 얻기 위해 메틸 바이올로겐 및 아스코르브산을 포함하는 산화-환원 시스템(ROX)이 일부 실시형태에서 결합 완충액에 제공된다.
일부 실시형태에서, 단일 염료 분자로 표지된 개별 뉴클레오티드의 혼입을 검출함에 의해 단일 표적 핵산에 대한 시퀀싱(예를 들어, Helicos 및 PacBio 시퀀싱에 의해 실행되는 바와 같음)은 염료가 검출되지 않을 때 오류를 도입할 수 있다. 일부 경우에, 이것은 뉴클레오티드가 더 이상 염료에 결합되지 않을 수 있고, 단일 뉴클레오티드 결합 이벤트가 감지하기에는 너무 짧고, 염료가 광탈색되고, 감지된 누적 신호가 염료 깜박임으로 인해 약하고, 염료가 너무 약하거나 염료가 길고 어두운 광물리학 상태에 들어가기 때문이다. 일부 실시형태에서, 이것은 다수의 대안적인 방식으로 극복된다. 첫 번째는 유리한 광물리적 특성을 가진 강력한 개별 염료(예를 들어, Cy3B)로 뉴클레오티드를 표지화하는 것이다. 다른 것은 광 탈색 및 어두운 광물리적 상태를 감소시키는 완충액 조건 및 첨가제를 제공하는 것이다(예를 들어, 베타-메르캅토에탄올, 트롤록스, 비타민 C 및 그 유도체, 산화환원 시스템). 또 다른 것은 빛에 대한 노출을 최소화하는 것이다(예를 들어, 더 짧은 노출을 필요로 하는 더 민감한 검출기를 갖거나 스트로보스코프 조명을 제공하는 것). 두 번째는 단일 염료 대신 양자점(예를 들어, Qdot 655), 형광구, 나노다이아몬드, 플라즈몬 공명 입자, 광산란 입자 등과 같은 나노 입자로 뉴클레오티드를 표지화하는 것이다. 다른 것은 단일 염료보다는 뉴클레오티드당 많은 염료를 갖는 것이다(예를 들어, 도 14c 및 14d에 예시된 바와 같음). 이 경우에 다중 염료(1414)는 그 자체-소광(예를 들어, 충분히 멀리 떨어져 이격되는 DNA 오리가미와 같은 강성 나노구조체(1412)를 사용함) 또는 강성 링커를 통한 선형 이격화를 최소화하는 방식으로 구성된다.
일부 실시형태에서, 검출 오류율은 우레아, 아스코르브산 또는 이의 염, 이소아스코르브산 또는 이의 염, 베타-메르캅토에탄올(BME), DTT, 산화환원 시스템 또는 트롤록스로부터 선택된 하나 이상의 화합물(들)의 용액의 존재에서 추가로 감소된다 (그리고 신호 수명은 증가된다).
일부 실시형태에서, 표적 핵산 단독에 대한 프로브의 일시적인 결합은 염료 광물리학으로 인한 오류를 줄이기에 충분하다. 노출 과정 동안 얻은 정보는 상이한 표지된 올리고뉴클레오티드 프로브 종의 많은 온/오프 상호작용의 집합체이다. 따라서, 표지가 누락되거나 단일 결합 이벤트가 너무 짧아 제대로 검출하지 못하거나 표지가 광탈색되거나 어두운 상태에 있는 경우에도, 표적 핵산에 결합하는 다른 올리고뉴클레오티드 프로브 종 상의 표지가 모두 누락되지 않을 수 있고 표지는 검출하기에 너무 짧은 결합 이벤트를 갖고, 사진이 탈색되거나 어두운 상태의 표지를 가지고 따라서 일부 실시형태에서 그 결합 부위의 장소에 대한 정보를 제공할 것이다.
일부 실시형태에서, 각 일시적인 결합 이벤트로부터 광학 활성 신호의 경우는 2-차원 이미저의 1개 초과의 픽셀을 커버하기 위해 광학 경로(전형적으로, 배율 인자를 제공함)를 통해 투사된다. 광학 활성 신호의 경우에 대한 점 확산 함수(PSF)가 결정되고, 광학 활성 신호의 경우의 정확한 장소로서 PSF의 중심이 사용된다. 일부 실시형태에서, 국지화는 서브-회절(예를 들어, 초분해능) 및 심지어 서브-나노미터 정확도로 결정된다. 국지화 정확도는 수집된 광자의 수에 반비례한다. 따라서, 형광 표지에 의해 초당 방출되는 더 많은 광자 또는 더 긴 광자가 수집될수록 정확도가 높아진다.
일 예에서, 도 10a 및 10b에 예시된 바와 같이, 각각의 올리고뉴클레오티드 프로브 종 결합 부위에서의 광학 활성 또는 결합 이벤트의 경우의 수 및 수집된 광자의 수 둘 모두는 달성되는 국지화 정도와 상관관계가 있다. 표적 핵산(1002)의 경우, 결합 부위에 대해 기록된 가장 적은 수의 결합 이벤트(1004-1) 및 가장 적은 수의 광자(1008-1)가 각각 가장 정밀하지 않은 국지화(1006-1 및 1010-1)와 상관관계가 있다. 결합 이벤트의 수(1004-2, 1004-3) 또는 기록된 광자의 수(1008-2, 1008-3)가 결합 부위에 대해 증가함에 따라 국지화의 정도가 각각 증가한다(1006-2, 1006-3 및 1010-2, 1010-3). 도 10a에서, 표적 핵산(1002)을 갖는 표지된 올리고뉴클레오티드 프로브 종의 광학 활성 또는 결합 이벤트(예를 들어, 1004-1, 1004-2, 1004-4)의 검출된 확률론적 경우의 상이한 수는 프로브의 국지화(1006-1, 1006-2, 1006-3)의 상이한 정도를 초래하며, 여기서 더 많은 수의 결합 이벤트(예를 들어, 1004-2)는 더 높은 정도의 국지화(예를 들어, 1006-2)와 상관관계가 있고 더 적은 수의 결합 이벤트(예를 들어, 1004-1)는 더 낮은 수준의 국지화(예를 들어, 1006-1)와 상관관계가 있다. 도 10b에서 유사하게 검출된 상이한 수의 광자(예를 들어, 1008-1, 1008-2 및 1008-3)는 상이한 정도의 국지화(각각 1010-1, 1010-2 및 1010-3)를 초래한다.
대안적인 실시형태에서, 각 일시적인 결합 이벤트에서 표지로부터의 신호는 광학 확대 경로를 통해 투사되지 않을 수 있다. 대신, 기판(전형적으로 표적 핵산 분자가 상주할 수 있는 광학적으로 투명한 표면)은 2-차원 검출기 어레이에 직접적으로 커플링된다. 검출기 어레이의 픽셀이 작을 때(예를 들어, 1미크론 제곱 이하), 검출기의 표면 상에 신호의 일-대-일 투사는 결합 신호가 적어도 1-미크론 정확도로 국지화도록 허용할 수 있다. 일부 실시형태에서, 표적 핵산이 충분하게 신장된 경우(예를 들어, 표적 핵산의 2킬로베이스가 길이 1미크론으로 신장된 경우), 2킬로베이스 떨어져 있는 신호가 분해된다. 예를 들어, 신호가 매 4096개 염기 또는 매 2미크론마다 발생할 것으로 예상되는 6-mer 프로브의 경우, 앞서 언급한 분해능은 개별 결합 부위를 명확하게 국지화하기에 충분하다. 신호는 부분적으로 2개 픽셀과 중간 장소 사이에서 유래할 수 있다(예를 들어, 신호가 2개 픽셀 사이에 있는 경우 해상도는 픽셀 1미크론 제곱에 대해 500nm 또는 그 보다 양호할 수 있음). 일부 실시형태에서, 초분해능 방법은 2차원 이미저에 비해 적절한 장소에 표적 핵산을 갖는 시스템에 이용된다. 이러한 장소는 2차원 이미저에 사용되는 센서의 유형에 따라 달라질 수 있다. 예를 들어, 후면 박형 CCD는 전면 조명 CCD보다 센서의 감지 표면에서 더 멀리 떨어진 실제 센서 영역을 가지고, 둘 모두 각 픽셀과 연관된 나노-렌즈를 이용할 수 있는 CCD 또는 CMOS 이미저와 유의하게 상이하다. 일부 실시형태에서, 기판은 더 높은 해상도를 제공하기 위해 2-차원 어레이 검출기와 관련하여 X 및 또는 Y 차원으로 (예를 들어, 100nm의 증분으로) 물리적으로 병진이동된다. 그러한 실시형태에서, 장치 또는 시스템은 렌즈 또는 렌즈 사이의 공간을 필요로 하지 않기 때문에 더 작다(또는 더 얇다). 일부 실시형태에서, 기판의 해독은 또한 분자 저장 판독을 기존 컴퓨터 및 데이터베이스와 더 호환가능한 전자 판독으로 직접 전환을 제공한다. 일부 실시형태에서, 시간 분해 형광이 이용되고, 형광 수명을 포착하기 위해 이용되거나 단순히 여기 배경을 제거하기 위해 사용된다.
일부 실시형태에서, 광학 활성 또는 결합 이벤트의 고속의 일시적 사건을 포착하기 위해 포착 프레임 속도가 증가되고 데이터 전송 속도가 표준 현미경 기술에 비해 증가된다. 일부 실시형태에서, 노출 과정의 속도는 높은 프레임 속도와 프로브의 증가된 농도를 커플링함에 의해 증가된다. 그러나, 최대 프레임 속도는 각 프레임과 연관된 획득된 신호에 비해 전자 노이즈를 줄이는 데 적합하다. 200밀리초 노출의 전자 노이즈는 단일 100밀리초 노출과 동일하지만 단일 200밀리초 노출과 2개 100밀리초 노출을 비교할 때 2의 제곱근만큼 더 높다.
더 빠른 이미징을 가능하게 할 더 빠른 CMOS 카메라가 이용가능해지고 있다. 예를 들어 Andor Zyla Plus는 단지 USB 3.0 연결만으로 제곱된 512x1024 픽셀에 걸쳐 초당 최대 398개 프레임을 허용하고 제한된 관심있는 영역(ROI)(더 적은 수의 픽셀)보다 또는 CameraLink 연결을 사용할 때 훨씬 더 빠르다.
일부 실시형태에서, 빠른 이미징을 수행할 수 있는 시스템은 갈보 미러 또는 디지털 마이크로미러를 사용하여 시간적으로 증분된 이미지를 다른 센서에 송출할 수 있다. 영화 프레임의 올바른 순서는 그의 획득 시간에 따라 상이한 센서로부터의 프레임을 인터리빙함에 의해 재구성된다.
일부 실시형태에서, 일시적인 결합 과정은 염 농도와 같은 다양한 생화학적 매개변수를 조정함에 의해 가속화될 수 있다. 결합의 속도를 일치시키는 데 사용될 수 있는 높은 프레임 속도를 갖는 다수의 카메라가 있으며, 이는 종종 픽셀의 세브세트에서 더 빠른 판독값을 얻기 위해 제한된 시야를 갖는다. 일부 실시형태에서, 검류계 미러는 연속적인 신호를 단일 센서의 다른 영역에 일시적으로 분배하거나 센서를 분리하는 데 이용된다. 후자는 센서의 전체 시야를 이용할 수 있게 해주지만 분산된 신호가 축적될 때 전반적인 잠정적 해상도를 증가시킨다.
다중 결합 이벤트의 데이터세트 구축.
블록 218. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 개별 올리고뉴클레오티드 프로브 종에 대해 노출 및 측정 과정이 반복되어, 이에 의해 테스트 기판 상의 광학 활성 또는 결합 이벤트의 복수의 위치 세트를 획득하고, 테스트 기판 상의 광학 활성 또는 결합 이벤트의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종 세트에서 단일 올리고뉴클레오티드 프로브 종에 상응한다.
일부 실시형태에서, 올리고뉴클레오티드 프로브의 세트는 올리고뉴클레오티드 프로브의 복수의 서브세트를 포함할 수 있고 노출 및 측정 과정을 반복하는 것은 올리고뉴클레오티드 프로브 종의 복수의 서브세트에서 올리고뉴클레오티드 프로브 종의 각각의 각 서브세트에 대해 수행된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 각각의 각 서브세트는 올리고뉴클레오티드 프로브 종의 세트로부터 2개 이상의 상이한 올리고뉴클레오티드 프로브 종을 포함할 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 각각의 각 서브세트는 올리고뉴클레오티드 프로브 종의 세트로부터 4개 이상의 상이한 올리고뉴클레오티드 프로브 종을 포함할 수 있다. 일부 실시형태에서, 올리고뉴클레오티드 프로브의 세트는 올리고뉴클레오티드 프로브 종의 4개의 서브세트를 포함할 수 있다.
일부 실시형태에서, 방법은 각 올리고뉴클레오티드 프로브 종의 계산된 또는 실험적으로 유도된 용융 온도에 기반하여 올리고뉴클레오티드 프로브 종의 세트를 올리고뉴클레오티드 프로브 종의 복수의 서브세트로 분할하는 것을 추가로 포함할 수 있다. 유사한 용융 온도를 갖는 올리고뉴클레오티드 프로브 종은 분할에 의해 올리고뉴클레오티드 프로브의 동일한 서브세트에 배치된다. 더욱이, 노출 과정의 온도 또는 지속시간은 올리고뉴클레오티드 프로브 종의 상응하는 서브세트에서 올리고뉴클레오티드 프로브 종의 평균 용융 온도에 의해 결정된다.
일부 실시형태에서, 방법은 각 올리고뉴클레오티드 프로브 종의 서열에 기반하여 올리고뉴클레오티드 프로브의 세트를 올리고뉴클레오티드 프로브의 복수의 서브세트로 분할하는 것을 추가로 포함할 수 있으며, 여기서 중첩하는 서열을 갖는 올리고뉴클레오티드 프로브 종은 상이한 서브세트에 배치된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 세트에서 각 단일 올리고뉴클레오티드 프로브 종에 대해 노출 및 측정 과정을 반복하는 것이 수행된다.
일부 실시형태에서, 노출 과정은 제1 온도에서 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종에 대해 수행되고, 노출 및 측정 과정을 반복하는 것은 제2 온도에서 제1 올리고뉴클레오티드 프로브 종에 대한 노출 및 측정 과정을 수행하는 것을 포함할 수 있다.
일부 실시형태에서, 노출 과정은 제1 온도에서 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종에 대해 수행될 수 있다. 노출 및 측정 과정을 반복하는 경우는 복수의 상이한 온도 각각에서 제1 올리고뉴클레오티드 프로브 종에 대한 노출 및 측정 과정을 수행하는 것을 포함할 수 있다. 방법은 복수의 상이한 온도에서 제1 온도 및 각각의 온도에 대한 노출 및 측정 과정에 의해 결정된 광학 활성의 경우의 측정된 장소 및 선택적으로 지속시간을 사용하여 제1 올리고뉴클레오티드 프로브 종에 대한 용융 곡선을 구성하는 것을 추가로 포함할 수 있다.
일부 실시형태에서, 테스트 기판은 노출 및 측정 과정을 반복하기 이전에 세정되고, 이에 의해 테스트 기판을 상이한 하나 이상의 올리고뉴클레오티드 프로브 종에 노출시키기 이전에 테스트 기판로부터 하나 이상의 각각의 올리고뉴클레오티드 프로브 종을 제거한다. 선택적으로, 제1 올리고뉴클레오티드 프로브 종을 하나 이상의 세정 용액으로 대체한 다음, 상이한 하나 이상의 올리고뉴클레오티드 프로브 종을 추가한다.
일부 실시형태에서, 테스트 기판 상의 결합 이벤트 장소를 측정하는 것은 2-차원 이미저에 의해 획득된 데이터의 프레임에서 광학 활성의 각각의 경우의 중심을 식별하고 피팅하기 위해 피팅 함수로 광학 활성의 각각의 경우를 식별하고 피팅하는 것을 포함할 수 있다. 광학 활성의 각각의 경우의 중심은 테스트 기판 상의 결합 이벤트 또는 광학 활성의 각각의 경우의 장소인 것으로 간주된다.
일부 실시형태에서, 피팅 함수는 가우시안 함수, 1차 모멘트 함수, 기울기-기반 접근방식, 또는 푸리에 변환이다. 가우시안 피팅은 현미경 시스템의 PSF의 근사치일 뿐이지만, 일부 실시형태에서 스플라인(예를 들어, 큐빅 스플라인) 또는 푸리에 변환 접근방식의 추가는 PSF의 중심을 결정하는 정확도를 개선할 수 있다(예를 들어, Babcock 외, Sci Rep. 7:552, 2017 및 Zhang 외, 46:1819-1829, 2007에 기술된 바와 같음).
일부 실시형태에서, 측정 과정을 완료한 후, 올리고뉴클레오티드 프로브 종의 단일 공칭 결합 장소에 대한 광학 활성의 위치의 세트는 결정된 위치 및 식별된 올리고뉴클레오티드 프로브 종을 가지고(예를 들어, 검출된 방출 파장으로 인함) 그리고 과정은 세트로부터의 올리고뉴클레오티드 프로브 종 중 어느 것이 (예를 들어, 결정된 허용오차 내에서 동일한 나노미터 장소에 결합하고, 예를 들어 검출되는 광자의 다른 수에 기인하여 상이한 올리고뉴클레오티드 프로브 종에 대해 상이한) 표적 핵산에 대해 중첩되는 공칭 결합 장소를 갖고 있는지 결정할 수 있다. 일 예에서, 나노미터 장소는 1nm 중심(+/- 0.5nm)의 정밀도로 정의되고, 따라서 각각의 PSF 중심에 대한 각 정밀도 또는 허용오차가 중첩하는 모든 올리고뉴클레오티드 프로브 종은 함께 비닝된다. 정의된 각각의 단일 올리고뉴클레오티드 프로브 종은 적절한 정밀도 또는 허용오차(나노미터 또는 서브-나노미터)로 나노미터(또는 서브-나노미터) 중심으로 정확한 국지화를 가능하게 하기 위해 (예를 들어, 방출 및 수집된 광자의 수에 따라) 여러 번 결합할 수 있다.
일부 실시형태에서, 나노미터 또는 서브-나노미터 국지화는, 예를 들어, 5'-AGTCG-3'의 올리고뉴클레오티드 프로브 종 서열에 대해 제1 염기는 A, 제2 염기는 G, 제3 염기는 T, 제4 염기는 C 및 제5 염기는 G이다는 것을 결정할 수 있다. 이러한 패턴은 5'-CGACT-3'의 표적 서열을 시사한다. 따라서, 모든 단일-염기 정의된 1024개 5-mer 올리고뉴클레오티드 프로브 종은 상기 기술된 바와 같은 프로브 코딩 시스템을 사용하여 5개 주기를 사용하여 적용되거나 테스트되며, 여기서 각각의 주기는 노출, 결정 및 반복하는 과정을 포함할 수 있고 올리고뉴클레오티드 프로브 종 풀 첨가 및 세정 단계 둘 모두를 추가로 포함할 수 있다. 일부 실시형태에서, 올리고뉴클레오티드의 풀에서 각각의 특정 올리고뉴클레오티드 프로브 종의 농도 [프로브 종은 그것이 단독으로 사용되어 질 때보다 더 낮다. 일부 실시형태에서, 잠재적으로 상이한 올리고뉴클레오티드 프로브 종 간의 경쟁의 결과로서, 결합 이벤트의 역치 수에 도달하기 위해 노출 과정 동안 더 긴 시간 또는 더 많은 프레임이 획득되기 위해 데이터의 획득이 수행된다. 일부 실시형태에서, 축퇴 또는 보편적 염기를 이용할 수 있는 올리고뉴클레오티드 프로브 종의 더 높은 농도가 축퇴 염기 또는 보편적 염기가 없는 동일한 k-mer 종 길이의 올리고뉴클레오티드 프로브 종에 사용된다. 일부 실시형태에서, 코딩 계획은, 예를 들어 올리고뉴클레오티드 프로브 종의 3' 또는 5' 위치에서 표지를 합성하거나 접합함에 의해 올리고뉴클레오티드 프로브 종의 직접 표지화에 의해 실행된다. 그러나, 일부 대안적 실시형태에서, 이것은 (예를 들어, 본 명세서에 기재된 바와 같이 각각의 표지된 올리고에 플랩 서열을 부착함에 의해) 간접적인 표지화에 의해 수행된다.
일부 실시형태에서, 각각의 올리고뉴클레오티드 프로브 종의 장소는 그 장소에 대한 다중 결합 이벤트에 대한 PSF를 결정함에 의해 정확하게 정의되고, 그 다음 오프셋 결합 이벤트 (및 이용가능한 경우, 듀플렉스 형태 표적 핵산의 상보적 가닥으로부터의 데이터)로부터 부분적인 서열 중첩에 의해 확증될 수 있다. 본 명세서에 기재된 바와 같이 일부 실시형태는 1 또는 수 나노미터로 프로브 결합의 단일 분자 국지화에 크게 의존한다.
일부 실시형태에서, 광학 활성의 각각의 경우는 2-차원 이미저에 의해 측정된 바와 같이 복수의 프레임에 걸쳐 지속될 수 있다. 테스트 기판 상의 장소를 측정하는 것은 복수의 프레임에 걸쳐 광학 활성의 각각의 경우의 중심을 식별하기 위해 복수의 프레임에 걸쳐 피팅 함수로 광학 활성의 각각의 경우를 식별하고 피팅하는 것을 포함한다. 광학 활성의 각각의 경우의 중심은 복수의 프레임에 걸쳐 테스트 기판 상의 광학 활성의 각각의 경우의 위치인 것으로 간주된다. 일부 실시형태에서, 피팅 함수는 복수의 프레임에서 각각의 프레임 상의 중심을 개별적으로 결정할 수 있다. 다른 실시형태에서, 피팅 함수는 복수의 프레임에 걸쳐 집합적으로 광학 활성의 경우에 대한 중심을 결정할 수 있다.
일부 실시형태에서, 피팅은 바로 인접한(예를 들어, 픽셀의 절반 이내) 국소화가 다음 프레임에 존재하는 경우, 얼마나 밝은지에 의해 가중되어 이들을 함께 평균화할 수 있는 추적하는 단계를 이용할 수 있고; 이것은 광학 활성 또는 결합 이벤트의 단일 경우인 것으로 가정할 수 있다. 그러나, 광학 활성의 경우가 다중 프레임(예를 들어, 결합 이벤트 사이의 적어도 5프레임 간격, 적어도 10프레임 간격, 적어도 25프레임 간격, 적어도 50프레임 간격 또는 적어도 100프레임 간격)으로 분리된 경우, 피팅 함수는 그것들이 별개의 결합 이벤트라고 가정할 수 있다. 광학 활성 또는 결합 이벤트의 고유한 경우를 추적하는 것은 서열 할당에서 신뢰도를 증가시키는 데 도움이 될 수 있다.
일부 실시형태에서, 측정 과정은 적어도 20nm의 국지화 정밀도로 테스트 기판 상의 위치로 광학 활성의 각각의 경우의 중심을 분해할 수 있다. 일부 실시형태에서, 측정 과정은 적어도 2nm, 적어도 60nm, 적어도 6nm의 국지화 정밀도로 테스트 기판 상의 위치로 광학 활성의 각각의 경우의 중심을 분해할 수 있다. 일부 실시형태에서, 측정은 2nm 내지 100nm의 국지화 정밀도로 테스트 기판 상의 위치로 광학 활성의 각각의 경우의 중심을 분해할 수 있다. 일부 실시형태에서, 측정 과정은 테스트 기판 상의 위치로 광학 활성의 각각의 경우의 중심을 분해할 수 있으며, 여기서 위치는 하위-회절 제한된 위치이고 또한 하위-회절 제한될 수 있는 정밀도를 갖는다. 일부 실시형태에서, 해상도는 정밀도보다 더 제한적이다.
일부 실시형태에서, 측정 과정은 테스트 기판 상의 장소 및 선택적으로 광학 활성의 각각의 경우의 지속시간을 결정할 수 있고, 측정 과정은 광학 활성의 하나 이상의 경우가 장소에서 5000개 초과의 광자를 포함했다고 결정할 수 있다. 일부 실시형태에서, 측정 과정은 테스트 기판 상의 장소 및 선택적으로 광학 활성의 각각의 경우의 지속시간을 결정할 수 있고, 측정 과정은 광학 활성의 하나 이상의 경우가 장소에서 50,000개 초과의 광자 또는 장소에서 200,000개 초과의 광자를 포함했다고 결정할 수 있다.
각각의 염료는 그것이 광자를 생성할 수 있는 최대 속도(예를 들어, 1KHz-1MHz)를 갖는다. 예를 들어, 일부 염료는 단지 1초에 200,000개 광자를 측정할 수 있다. 염료에 대한 전형적인 수명은 10나노초이고 따라서 초당 100,000,000개 광자를 방출하며, 수집 효율과 조합될 때, 검출기 양자 효율 여과 손실은 검출되는 초당 훨씬 적은 광자 규모의 정도를 초래할 수 있다. 따라서, 일부 실시형태에서, 테스트 기판 상의 장소 및 선택적으로 광학 활성의 각각의 경우의 지속시간을 측정하는 것은 연관된 장소에서 1,000,000개 초과의 광자를 측정할 수 있다.
일부 경우에, 특정 이상치 서열은 비-왓슨 크릭 방식으로 결합할 수 있거나 짧은 모티프는 지나치게 높은 온-속도 또는 낮은 오프-속도를 초래할 수 있다. 예를 들어, RNA와 DNA 사이의 일부 퓨린-폴리프리미딘 상호작용은 매우 강력하다(예를 들어, AGG와 같은 RNA 모티프). 이들은 더 낮은 오프 속도를 가질 뿐만 아니라 보다 안정적인 핵생성 서열로 인해 높은 온 속도를 갖는다. 일부 경우에는 결합은 특정 알려진 규칙을 반드시 준수하지 않는 이상치로부터 발생한다. 일부 실시형태에서, 알고리즘은 그러한 이상치를 식별하거나 그러한 이상치의 예상을 고려하는 데 사용된다.
일부 실시형태에서, 광학 활성의 각각의 경우는 테스트 기판에 대해 관찰된 배경에 대해 미리결정된 수 초과의 표준 편차(예를 들어, 3, 4, 5, 6, 7, 8, 9, 또는 10 초과 표준 편차)이다.
일부 실시형태에서, 노출 과정은 제1 기간 동안 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종에 대해 수행된다. 일부 이러한 실시형태에서, 노출 및 측정 과정을 반복하는 것은 제2 기간 동안 제2 올리고뉴클레오티드 프로브 종에 대한 노출 과정을 수행하는 것을 포함할 수 있다. 제1 기간은 제2 기간보다 크다.
일부 실시형태에서, 노출 과정은 2-차원 이미저를 사용하여 제1 프레임의 수에 대한 올리고뉴클레오티드 프로브 종의 세트에서 제1 올리고뉴클레오티드 프로브 종에 대해 수행된다. 일부 이러한 실시형태에서, 노출 및 측정 과정을 반복하는 것은 2-차원 이미저를 사용하여 제2 프레임의 수에 대해 제2 올리고뉴클레오티드 프로브 종에 대한 노출 과정를 수행하는 것을 포함할 수 있다. 제1 프레임의 수는 제2 프레임의 수보다 크다.
일부 실시형태에서, 하나 이상의 타일링 세트에서 상보적 올리고뉴클레오티드 프로브 종을 사용하여 변성된 듀플렉스 표적 핵산의 가닥 각각에 결합한다. 도 11b에 의해 예시된 바와 같이, 테스트 기판 상의 복수의 위치 세트를 사용하여 표적 핵산의 적어도 일부의 서열을 결정하는 것이 가능하며, 이것은 표적 핵산(1110)의 고정된 제1 가닥에 상응하는 제1 타일링 경로(1114) 및 표적 핵산(1112)의 고정된 제2 가닥에 상응하는 제2 타일링 경로(1116)를 결정하는 것을 포함할 수 있다.
일부 실시형태에서, 제1 타일링 경로에서 중단은 제2 타일링 경로의 상응하는 부분을 사용하여 해결되며, 여기서 타일링 경로의 중단은 원하는 신뢰도로 염기 서열을 결정할 수 없고, 중단을 해결하는 것은 원하는 신뢰도의 염기 서열을 결정한다. 일부 실시형태에서, 제1 타일링 경로 또는 제2 타일링 경로의 중단은 참조 서열을 사용하여 해결된다. 일부 실시형태에서, 제1 타일링 경로 또는 제2 타일링 경로의 중단은 표적 핵산의 다른 경우로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 해결된다.
일부 실시형태에서, 각각의 결합 부위에 대한 표적 핵산 서열의 서열 할당에서의 신뢰도는 제1 타일링 경로 및 제2 타일링 경로의 상응하는 부분을 사용하여 증가된다. 일부 실시형태에서, 표적 핵산 서열의 서열 할당에서의 신뢰도는 표적 핵산의 다른 경우로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 증가된다.
서열의 정렬 또는 어셈블리.
블록 222. 일부 실시형태에서, 표적 핵산의 적어도 일부의 서열은 복수의 위치 세트로 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트를 사용하여 결정된다.
일부 실시형태에서, 연속 서열은 신규 어셈블리를 통해 획득된다. 다른 실시형태에서 참조 서열은 어셈블리를 용이하게 하기 위해 사용된다. 완전한 게놈 시퀀싱이 게놈의 동일한 영역에 걸쳐 있는 다중 표적 핵산 분자(이상적으로는 동일한 염색체에서 유래된 분자)로부터의 정보의 합성을 필요로 하는 경우, 알고리즘은 다중 표적 핵산 분자에서 얻은 정보를 처리할 필요가 있을 수 있다. 일부 실시형태에서, 다중 표적 핵산 분자 사이에 공통인 서열에 기반하여 표적 핵산 서열을 정렬할 수 있고, 영역이 커버되는 공동-정렬된 분자로부터 전가함에 의해 각 표적 핵산 분자의 임의의 갭을 채울 수 있는 알고리즘이 이용된다(예를 들어, 하나의 표적 핵산 분자에서 갭이 다른 공동-정렬된 표적 핵산 분자에 대해 결정된 서열 판독에 의해 커버됨).
일부 실시형태에서, 샷건 어셈블리 방법(예를 들어, Schuler 외, Science 274:540-546, 1996에 기재된 바와 같음)이 본 명세서에 기재된 바와 같이 획득된 서열 할당을 사용하여 어셈블리를 수행하도록 조정된다. Sanger 또는 Illumina 샷건 시퀀싱에 비해 현재 방법의 이점은 그것이 전체-길이의 손상되지 않은 표적 핵산 분자 또는 이의 매우 큰 단편으로부터 시퀀싱되기 때문에 다수의 판독이 사전-어셈블리된다는 것이다(예를 들어, 서로에 대한 판독 또는 콘티그의 장소 및 판독 또는 콘티그 사이 갭의 길이는 이미 알려져 있을 수 있음). 다양한 실시형태에서, 참조 게놈은 긴-범위 게놈 구조 또는 짧은-범위 폴리뉴클레오티드 서열 또는 둘 모두의 어셈블리를 용이하게 하기 위해 사용된다. 일부 실시형태에서, 판독은 부분적으로 새로이 어셈블리된 다음 참조에 대해 정렬된 다음 참조-보조된 어셈블리가 추가로 새로이 어셈블리된다. 일부 실시형태에서, 게놈 어셈블리에 대한 일부 지침을 제공하기 위해 다양한 참조 어셈블리가 사용된다. 다른 실시형태에서, 실제 분자로부터 획득된 정보(특히 그것이 2개 이상의 분자에 의해 확증되는 경우)는 참조 서열로부터의 임의의 정보보다 더 크게 가중된다.
일부 실시형태에서, 서열 비트가 수득되는 표적 핵산은 표적 핵산 사이의 서열 중첩의 세그먼트에 기반하여 정렬되고, 더 긴 인 실리코 콘티그 및 궁극적으로 전체 염색체의 서열이 생성된다.
일부 실시형태에서, 표적 핵산의 정체성은 그의 길이를 따라 결합하는 올리고뉴클레오티드 프로브 종의 패턴에 의해 결정된다. 일부 실시형태에서, 정체성은 RNA 종 또는 RNA 이소폼의 정체성이다. 일부 실시형태에서, 정체성은 표적 핵산이 상응할 수 있는 참조 서열 내의 장소이다.
일부 실시형태에서, 국지화 정확도 또는 정밀도는 서열 비트를 함께 스티칭하기에 충분하지 않을 수 있다. 일부 실시형태에서, 프로브의 서브세트는 특정 발생지 내에서 결합하는 것으로 발견되지만, 엄밀히 말하면 국지화 데이터로부터 서열 순서는 원하는 신뢰도로 결정하기 어렵다. 일부 실시형태에서, 해상도는 회절 제한적이다. 일부 실시형태에서, 발생지 또는 회절-제한된 지점 내의 짧은-범위 서열은 발생지 또는 지점 내에 위치하는 올리고뉴클레오티드 프로브 종의 서열 중첩에 의해 어셈블리된다. 따라서 짧은-범위 서열은 예를 들어 올리고뉴클레오티드 프로브 종의 서브세트의 개별 서열이 어떻게 중첩되는지에 대한 정보를 사용하여 어셈블리될 수 있다. 일부 실시형태에서, 이러한 방식으로 구축된 짧은 범위 서열은 그 다음 표적 핵산 상의 그의 순서에 기반하여 긴-범위 서열 안으로 함께 스티칭될 수 있다. 따라서 인접하거나 중첩하는 지점에서 획득된 짧은-범위 서열을 결합함에 의해 긴-범위-서열이 획득될 수 있다.
일부 실시형태에서, (예를 들어, 천연적으로 이중-가닥인 표적 핵산의 경우), 상보적 가닥에 대해 획득된 참조 서열 및 서열 정보는 서열 할당을 용이하게 하기 위해 사용된다.
일부 실시형태에서, 표적 핵산은 길이가 적어도 140개 염기이고 결정 과정은 70% 초과의 표적 핵산 서열의 서열의 적용범위를 결정할 수 있다. 일부 실시형태에서, 표적 핵산은 길이가 적어도 140개 염기이고 결정 과정은 90% 초과의 표적 핵산 서열의 서열의 적용범위를 결정할 수 있다. 일부 실시형태에서, 표적 핵산은 길이가 적어도 140개 염기이고 결정 과정은 99% 초과의 표적 핵산 서열의 서열의 적용범위를 결정할 수 있다. 일부 실시형태에서, 결정 과정은 99% 초과의 표적 핵산 서열의 서열의 적용범위를 결정할 수 있다.
비-특이적 또는 불일치하는 결합 이벤트.
일반적으로, 시퀀싱은 표적 핵산이 결합된 핵산에 상보적인 뉴클레오티드를 함유한다고 가정한다. 그러나, 이것이 항상 그 경우일 수는 없다. 결합 불일치 오류는 이 가정이 성립하지 않는 경우의 예이다. 그럼에도 불구하고 알려진 규칙이나 행동에 따라 발생하는 경우 불일치는 표적 핵산의 서열을 결정하는 데 유용하다. 짧은 올리고뉴클레오티드 프로브 종(예를 들어, 5-mer)의 사용은 하나의 염기가 5-mer 길이의 20%이기 때문에 단일 불일치의 효과가 안정성에 큰 영향을 미친다는 것을 의미한다. 따라서, 적절한 조건을 사용하여 짧은 올리고뉴클레오티드 프로브 종에 의해 절묘한 특이성이 획득된다. 그럼에도 불일치가 발생할 수 있으며 분자 상호작용의 확률론적 특성으로 인해 그 결합 지속시간 중 일부는 5개 염기 모두가 특이적인 결합과 구별되지 않을 수 있다. 일부 실시형태에서, 알고리즘은 염기(또는 서열) 호출을 수행하는 데 사용되고 어셈블리는 종종 불일치의 발생을 고려한다. 많은 유형의 불일치가 예측가능하고 특정 규칙을 따른다. 이들 규칙 중 일부는 이론적 고려사항에 의해 유도되는 반면 다른 규칙은 실험적으로 유도된다(예를 들어, Maskos and Southern, Nucleic Acids Res 21(20): 4663-4669, 2013; Williams 외, Nucleic Acids Res 22:1365-1367, 1994에 기술된 바와 같은).
일부 실시형태에서, 표면에 대한 비-특이적 결합의 효과는 비-특이적 부위에 대한 프로브 결합의 이러한 비-지속성이 지속되지 않음에 의해 완화되고 일단 하나의 이미저가 비-특이적(예를 들어, 상보적 표적 서열 상에 있지 않음) 결합 부위를 점유하면 그것은 탈색될 수 있지만 일부 경우에는 제자리에 남아 있어, 그 장소에 대한 추가 결합을 차단한다(예를 들어, G-4개조 형성으로 인한 상호작용). 전형적으로, 표적 폴리뉴클레오티드에 대한 이미저 결합의 분해능을 방지하는 대부분의 비-특이적 결합 부위는 이미징의 초기 단계 내에서 점유되고 탈색되어, 이후 쉽게 관찰되도록 폴리뉴클레오티드 부위에 대한 이미저의 온/오프 결합을 남겨둔다. 따라서 일 실시형태에서, 초기에 비-특이적 결합 부위를 차지하는 프로브를 탈색하기 위해 높은 레이저 출력이 사용되며, 선택적으로 이 단계 동안 이미지가 촬영되지 않고, 그 다음 레이저 출력이 선택적으로 감소되고 이미징은 폴리뉴클레오티드에 대한 온-오프 결합를 포착하기 개시된다. 초기 비-특이적 결합 후, 추가의 비-특이적 결합은 덜 빈번하고(탈색된 프로브는 종종 비-특이적 결합 부위에 붙어 있기 때문임), 일부 실시형태에서, 예를 들어, 도킹 부위에 대한 특이적 결합으로 간주되도록 역치를 적용함에 의해 계산적으로 필터링되고, 동일한 장소에 대한 결합이 지속적이어야 하며, 예를 들어 동일한 부위에서 적어도 5회 또는 적어도 10회 발생해야 한다. 전형적으로 도킹 부위에 대한 대략 20개 특정 결합 이벤트가 검출된다.
다른 실시형태에서, 비-특이적 결합은 형광단 신호가 표면 상에 신장된 표적 분자의 선형 가닥의 위치와 상관되어야 하고, 다른 신호는 알고리즘적으로 제거된다는 것이다. 일부 실시형태에서, 선형 듀플렉스 형태 표적 핵산 가닥을 직접적으로 염색하거나 지속적인 결합 부위를 통해 라인을 보간함에 의해 표적 핵산 가닥의 위치를 결정하는 것이 가능하다. 일반적으로, 라인을 따라 떨어지지 않는 신호는 지속 여부에 관계없이 일부 실시형태에서 폐기된다. 유사하게, 초분자 격자가 사용될 때, 격자의 공지된 구조와 상관되지 않는 결합 이벤트는 일부 실시형태에서 폐기된다.
일부 실시형태에서, 다중 결합 이벤트는 또한 특이성을 증가시킬 수 있다. 예를 들어, 단일 "호출"에서 검출되는 모이어티 또는 서열의 정체성을 설정하는 대신 다중 호출에서 일치가 획득된다. 또한 표적 모이어티 또는 표적 핵산에 대한 다중 결합 이벤트는 실제 장소에 대한 결합이 비-특이적 결합 이벤트와 구별되도록 할 수 있으며, 여기서 (역치 지속시간의) 결합은 동일한 장소에서 여러 번 발생할 가능성이 적다. 또한 시간 경과에 따른 다중 결합 이벤트의 측정은 탈색될 표면에 대한 비-특이적 결합 이벤트의 축적을 허용하고, 그 후에 비-특이적 결합이 거의 다시 검출되지 않을 수 있다는 것이 관찰된다. 이는 비특이적 결합으로부터의 신호가 탈색되더라도 비-특이적 결합 부위가 점유되거나 차단되어 남아있을 수 있기 때문일 수 있다.
일부 실시형태에서, 시퀀싱은 표적 핵산에 대한 불일치 및 비-특이적 결합에 의해 복잡해진다. 비-특이적 결합 또는 이상치 이벤트의 효과를 피하기 위해, 일부 실시형태에서, 방법은 신호의 장소 및 지속성에 기반하여 신호를 가중할 수 있다. 장소로 인한 가중치는 격자 구조 내의 장소를 포함하여 프로브가 예를 들어 신장된 표적 핵산 또는 초분자 격자(예를 들어, DNA 오리가미 격자) 상에 공동-국지화되는지 여부에 따라 단정된다. 결합의 지속성으로 인한 가중치는 결합의 지속시간 및 결합의 빈도와 관련이 있고 다른 명목 결합 이벤트 또는 결합 장소와 연관된 가중치를 사용하여 전체 일치, 부분 일치 또는 비-특이적 결합의 가능성을 결정할 수 있다. 올리고뉴클레오티드 프로브 종의 완전한 세트에서 각 올리고뉴클레오티드 프로브 종에 대해 설정된 가중치는 신호의 정확성을 결정하는 데 사용된다.
일부 실시형태에서, 우선순위는 신호 지속 기간이 소정의 역치보다 큰지 여부, 신호 반복 또는 빈도가 미리결정된 역치보다 큰지 여부, 신호가 표적 분자의 장소와 상관되는지 여부, 및/또는 수집된 광자의 수가 소정의 역치보다 큰지 여부를 결정함에 의해 신호 검증 및 염기 호출을 용이하게 하는 데 사용된다. 일부 실시형태에서, 이들 결정 중 임의의 것에 대한 대답이 참인 경우, 신호는 실제로 (예를 들어, 불일치 또는 비-특이적 결합 이벤트가 아닌 것으로서) 수용된다. 다른 실시형태에서, 신호가 참으로 수용되기 위해서는 이들 결정 중 하나 이상이 참일 필요가 있을 수 있다.
일부 실시형태에서, 불일치는 그 잠정적 결합 패턴에 의해 구별되고 따라서 서열 정보의 2차 층으로 간주된다. 이러한 실시형태에서, 결합 신호가 그의 잠정적 결합 특성으로 인해 불일치인 것으로 판단될 때, 연관된 서열 비트는 추정된 불일치 염기를 제거하기 위해 생물정보학적으로 트리밍되고 나머지 서열 비트는 서열 결정을 위해 이용된다. 불일치는 혼성화 올리고뉴클레오티드 프로브 종의 말단에서 발생할 가능성이 가장 높기 때문에, 불일치를 결정하기 위한 잠정적 결합 특성의 사용은 일부 실시형태에서 올리고뉴클레오티드 프로브 종 서열의 말단으로부터 트리밍되는 하나 이상의 염기를 초래할 수 있다. 어떤 염기가 적절하게 트리밍되는지에 대한 결정은 일부 실시형태에서 동일한 표적 핵산 영역에 걸쳐 타일링된 다른 올리고로부터의 정보에 의해 알려진다.
일부 실시형태에서, 가역적으로 보이지 않는 신호는 (예를 들어, 표면에 형광성 오염물의 부착으로 인해) 비-특이적 신호에 상응할 기회 또는 가능성의 정도를 갖기 때문에 음으로 가중된다.
블록 302 - 304. 일부 실시형태에서, 표적 핵산을 시퀀싱하는 방법은 표적 핵산이 테스트 기판 상에 선형화된 신장된 형태로 결합되어 이에 의해 고정된 신장된 핵산을 형성하는 고정 과정을 포함할 수 있다. 표적 핵산은 상기 기재된 방법 중 어느 하나에 따라 테스트 기판에 부착된다.
표면 상의 단일 세포 단리 및 DNA와 RNA 둘 모두 추출.
일부 실시형태에서, RNA 및 DNA 중 하나 또는 둘 모두는 단일 세포로부터 단리되고 시퀀싱될 수 있다. 일부 실시형태에서, 목표가 DNA를 시퀀싱하는 것인 경우, RNase는 시퀀싱이 시작되기 전에 샘플과 반응된다. 일부 실시형태에서, 목적이 RNA를 시퀀싱하는 것인 경우, DNase는 시퀀싱이 시작되기 전에 샘플과 반응된다. 일부 실시형태에서, 세포질 핵산 및 핵 핵산 둘 모두가 분석되어야 하는 경우, 이들은 차등적으로 또는 순차적으로 추출된다. 일부 실시형태에서, 먼저 세포막(핵막이 아님)이 파열되어 세포질 핵산을 방출 및 수집한다. 그런 다음 연관된 핵막이 파열되어 핵 핵산을 방출한다. 일부 실시형태에서, 단백질 및 폴리펩티드는 세포질 분획의 일부로서 수집된다. 일부 실시형태에서, RNA는 세포질 분획의 일부로서 수집된다. 일부 실시형태에서, DNA는 핵 분획의 일부로서 수집된다. 일부 실시형태에서, 세포질 및 핵 분획은 함께 추출된다. 일부 실시형태에서, 추출 후 mRNA 및 게놈 DNA는 차등적으로 포획된다. 예를 들어, mRNA는 표면에 부착된 올리고 dT 프로브에 의해 포획된다. 이는 유동 셀의 제1 부분에서 발생할 수 있고 DNA는 DNA 말단이 포획될 수 있는 소수성 비닐실란 코팅을 갖는 유동 셀의 제2 부분에서 포획된다(예를 들어, 추정컨대 소수성 상호작용이 기인함).
일부 실시형태에서, 폴리(L)라이신(PLL)과 같은 양전하를 갖는 표면(예를 들어, Microsurfaces Inc.로부터 입수가능하거나 사내 코팅됨)이 이용되고 세포막에 결합할 수 있는 것으로 알려져 있다. 일부 실시형태에서, 낮은 높이 및 또는 너비의 유로(예를 들어, <30 미크론)이 사용되어 세포가 표면과 충돌할 기회가 증가한다. 충돌의 수는 일부 실시형태에서 난류를 도입하기 위해 유동 셀 천장에서 헤링본 또는 구불구불한 패턴을 사용함에 의해 증가된다. 일부 실시형태에서, 세포 부착은 이러한 실시형태에서 세포가 표면 상에 낮은 밀도로 분산되는 것이 바람직하기 때문에 효율적일 필요가 없을 수 있다(예를 들어, 세포 사이에 충분한 공간이 있어 각 개별 세포로부터 추출된 RNA 및 DNA는 공간적으로 분리된 상태로 유지될 수 있는 것을 보장하기 위함). 일부 실시형태에서, 세포는 단백질분해효소 처리를 사용하여 용리되어 세포 및 핵막 둘 모두가 파열된다(예를 들어, 따라서 세포 내용물이 배지 안으로 방출되고 단리된 세포 부근의 표면에서 포획됨). 일단 이동억제화되면, 일부 실시형태에서 DNA 및 RNA가 신장된다. 일부 실시형태에서, 신장 완충액은 커버 유리 표면을 가로질러 단방향으로 흐른다(예를 들어, DNA 및 RNA 폴리뉴클레오티드가 신장되도록 하고 유체 흐름의 방향으로 정렬되게 함). 일부 실시형태에서, 조건(예를 들어, 온도, 신장 완충액의 조성 및 흐름의 물리적 힘)의 조절은 대부분의 RNA 2차/3차 구조를 변성시킬 수 있어 RNA가 항체에 결합하거나 시퀀싱에 이용가능할 수 있다. RNA가 변성된 형태로 신장되면 변성 완충액에서 결합 완충액으로 전환할 수 있다.
대안적으로, RNA는 먼저 세포막을 파열하고 한 방향으로의 흐름을 유도함에 의해 추출 및 이동억제된다. 다음으로 단백질분해효소를 사용하여 핵막을 파열하고 반대 방향으로 흐름을 유도한다. 일부 실시형태에서, DNA는 예를 들어 희귀-절단 제한 효소(예를 들어, NOT1, PMME1)를 사용함에 의해 방출 전 또는 후에 단편화된다. 이 단편화는 DNA 얽힘을 푸는 데 도움이 될 수 있으며 개별 가닥을 분리하고 다듬기를 할 수 있다. 이동억제된 세포는 각 세포에서 추출된 RNA와 DNA가 함께 섞이지 않을 정도로 충분히 떨어져 있도록 시스템이 구성된다. 일부 실시형태에서, 이는 세포의 파열 또는 파쇄 전, 후에 또는 동안 액체에서 겔로의 전이를 유도함에 의해 보조된다.
일부 실시형태에서, 표적 핵산은 이중-가닥 핵산이다. 이러한 실시형태에서, 방법은 고정된 이중-가닥 표적 핵산을 테스트 기판 상의 단일 가닥 형태로 변성시키는 것을 추가로 포함할 수 있다. 일부 실시형태에서, 핵산은 시퀀싱이 진행되도록 단일 가닥 형태여야 하거나, 부분적으로 변성된 형태이거나, 가닥 침입 또는 삼중체 형성 올리고뉴클레오티드 프로브 종을 사용할 때 이중-가닥이다. 고정된 이중-가닥 핵산이 변성되면, 핵산의 고정된 제1 가닥과 고정된 제2 가닥 둘 모두에 직접적으로 접근할 수 있다. 고정된 제2 가닥은 천연 듀플렉스 표적 뉴클레오티드의 고정된 제1 가닥에 상보적이다.
일부 실시형태에서, 표적 핵산은 단일 가닥(예를 들어, mRNA, lncRNA microRNA)이다. 일부 실시형태에서, 표적 핵산이 단일 가닥 RNA인 경우, 시퀀싱 방법이 진행되기 전에 변성시키는 것은 요구되지 않는다.
일부 실시형태에서, 샘플은 매우 근접한 천연 상보적 가닥이 없는 단일-가닥 DNA 폴리뉴클레오티드를 포함할 수 있다. 일부 실시형태에서, 표적 핵산을 따라 올리고뉴클레오티드 프로브 종의 완전한 세트의 각 올리고뉴클레오티드 프로브 종에 대한 결합 장소가 축적되는 경우, 서열은 그 장소에 따라 모든 서열 비트를 집계하고 이들을 함께 스티칭함에 의해 어셈블리된다.
RNA 신장.
일부 실시형태에서, 하전된 표면 상의 핵산의 신장은 용액 양이온 농도에 의해 영향을 받는다. 낮은 염 농도에서 단일 가닥이고 그 백본을 따라 음전하를 띠는 RNA는 그 길이를 따라 무작위로 표면에 결합할 수 있다.
RNA를 선형 형태로 변성 및 신장시키는 여러 가능한 방법이 있다. 일부 실시형태에서, tRNA는 초기에 (예를 들어, 높은 염 농도를 사용함에 의해) 구형 형태로 들어가도록 권장된다. 일부 이러한 실시형태에서, 각각의 RNA 분자의 말단(예를 들어, 특히 폴리 A 꼬리)은 상호작용에 더 접근가능하게 된다. 일단 RNA가 구형 형태로 결합되면, 일부 실시형태에서 상이한 완충액(예를 들어, 변성 완충액)이 유동 셀 안으로 유입된다.
대안적인 실시형태에서, 표면은 mRNA의 폴리 A 꼬리를 포획하기 위해 올리고 d(T)로 사전-코팅된다(예를 들어, Ozsolak 외, Cell 143:1018-1029, 2010에 기재된 바와 같음). 폴리A 꼬리는 전형적으로 2차 구조가 상대적으로 없어야 하는 영역이다(예를 들어, 그것은 단독중합체이기 때문임). 폴리 A 꼬리가 고등 진핵생물에서 상대적으로 길기 때문에(250-3000개 뉴클레오티드), 일부 실시형태에서, 긴 올리고 d(T) 포획 프로브는 혼성화가, RNA에서 분자내 염기 쌍화의 상당한 단편을 용융하기에 충분한, 상대적으로 높은 엄격성(예를 들어, 고온 및/또는 염 조건)에서 수행되도록 설계된다. 결합 후, 일부 실시형태에서, 나머지 RNA 구조를 구형에서 선형 상태로 전이하는 것은 포획 프로브로부터 분리하기에 충분하지 않지만 잠재적으로 유체 흐름 또는 전기영동력과 조합하여 RNA에서 분자내 염기-쌍화를 파열할 수 있는 변성 조건을 사용함에 의해 수행된다.
블록 310. 일부 실시형태에서, 고정된 신장된 표적 핵산은 올리고뉴클레오티드 프로브 세트에서 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀에 노출된다. 올리고뉴클레오티드 프로브 종의 세트에서 각 올리고뉴클레오티드 프로브 종은 미리결정된 서열 및 길이의 것이고, 노출은 각각의 올리고뉴클레오티드 프로브 종의 각각의 풀의 개별 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 핵산의 각 부분에 일시적으로 그리고 가역적으로 결합하여, 이에 의해 광학 활성의 각각의 경우를 발생시킬 수 있는 조건하에서 발생할 수 있다.
블록 312. 일부 실시형태에서, 테스트 기판 상의 장소 및 선택적으로 2-차원 이미저를 이용할 수 있는 노출 과정 동안 발생하는 광학 활성의 각각의 각 경우의 지속시간은 측정 과정에서 결정된다.
블록 314. 일부 실시형태에서, 노출 및 측정 과정은 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 반복되고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득하고, 테스트 기판 상의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종의 세트에서 올리고뉴클레오티드 프로브 종에 상응한다.
블록 316. 일부 실시형태에서, 표적 핵산의 적어도 일부의 서열은 복수의 위치 세트에 의해 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 결정된다.
RNA 시퀀싱.
RNA의 길이는 전형적으로 게놈 DNA보다 짧지만 현재 기술을 사용하여 일 말단으로부터 다른 말단으로 RNA를 서열화하는 것은 어렵다. 그럼에도 불구하고, 대체 스플라이싱 및 유전자 이소폼 때문에 mRNA의 전체 서열 구성을 결정하는 것이 매우 중요하다. 일부 실시형태에서, mRNA는 그의 폴리 A 꼬리를 이동억제된 올리고 d(T)에 결합함에 의해 포획되고 그의 2차 구조는 신장력(예를 들어, >400pN) 및 변성 조건(예를 들어, 포름아미드 및 또는 7M 또는 8M 우레아)의 적용에 의해 제거되어 표면 상에서 연장된다. 이것은 그 다음 결합 올리고뉴클레오티드 프로브 종(예를 들어, 엑손-특이적)이 일시적으로 결합되도록 허용한다. RNA의 길이가 짧기 때문에, 엑손을 분해, 분화 및 위치결정하기 위해 본 명세서에 기술된 바와 같은 단일 분자 국지화 방법을 이용하는 것이 유리하다. 일부 실시형태에서, mRNA에 걸쳐 흩어져 있는 단지 몇 개의 결합 이벤트는 특정 mRNA 이소폼에 대한 mRNA에서 엑손의 순서 및 정체성을 결정하기에 충분하다.
이중-가닥 컨센서스
샘플 분자로부터 서열 정보를 획득하는 방법은 다음과 같다:
i) 제1 방출 최대 파장 표지를 갖는 제1 올리고뉴클레오티드 프로브 종을 제공한다. 제2 올리고뉴클레오티드 프로브 종 서열이 제1 올리고뉴클레오티드 프로브 종 서열에 대해 서열에서 상보적인 제2 방출 최대 파장 표지를 갖는 제2 올리고뉴클레오티드 프로브 종 제공한다
ii) 기판 상의 천연 이중-가닥 표적 핵산 분자를 연장, 고정 및 변성한다
iii) 광학 활성의 경우를 포함하는 이미징 데이터를 생성하면서 ii의 변성된 핵산에 제1 및 제2 올리고 둘 모두를 노출한다.
iv) 제1 및 제2 올리고뉴클레오티드 프로브 종의 결합의 장소를 결정한다
v) 결합의 위치가 공동-위치화하는 경우, 장소가 올바른 것으로 간주된다
vi) 연장된 표적 핵산을 따라 다중 장소가 결합된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종은 일시적으로 그리고 가역적으로 결합할 수 있다. 일부 실시형태에서, 제1 및 제2 올리고뉴클레오티드 프로브 종은 주어진 길이의 제1 및 제2 올리고뉴클레오티드 프로브 종의 완전한 세트의 일부이고, 단계 ii-iii는 전체 핵산을 서열화하기 위해 올리고뉴클레오티드 프로브 종의 완전한 세트의 각각의 제1 및 제2 올리고 쌍에 대해 반복된다.
일부 실시형태에서, 2개의 최대 방출 파장이 그들이 있어야 하는 곳에서 광학적으로 공동-위치화하도록 보장하기 위해 다수의 교정이 이루어질 필요가 있을 수 있다. 이것은 광학적으로 또는 소프트웨어 프로세스를 이용하여 색수차에 대한 교정을 포함할 수 있다. 일부 이러한 실시형태에서, 2개의 상보적인 올리고뉴클레오티드 프로브 종이 동시에 노출되지만, 이들이 서로 어닐링되고 따라서 표적 핵산에 대한 동시 결합을 방해하는 것을 방지하기 위해 변형된 올리고뉴클레오티드 화학이 사용되며, 여기서 비-자가-쌍화는 변형된 G는 상보적 올리고뉴클레오티드에서 변형된 C와 쌍을 이룰 수 없지만 표적 핵산 상에서 비변형된 C와 쌍을 이룰 수 있고 변형된 A는 상보적 올리고뉴클레오티드 프로브 종에서 변형된 T와 쌍을 이룰 수 없지만 비변형된 T와 쌍을 이룰 수 있는 유사체 염기이다. 따라서 이러한 실시형태에서 제1 및 제2 올리고뉴클레오티드 프로브 종은 제1 올리고뉴클레오티드 프로브 종이 제2 올리고뉴클레오티드 프로브 종과 염기 쌍을 형성할 수 없도록 변형되고, 따라서 표적 핵산에 대한 방해받지 않는 접근을 허용하고 색수차의 스펙트럼 보정을 가능하게 하며, 이는 시야에 걸쳐 다양할 수 있다. 일부 실시형태에서, 색수차를 보정하고 제거하는 데 사용되는 동일한 프로세스를 이용하면 스펙트럼 및 공간 PSF 변동이 유사하게 보정되고 보상될 수 있다.
일부 실시형태에서, 제1 및 제2 올리고뉴클레오티드 프로브 종은 함께 첨가되지 않고 하나씩 첨가된다.
올리고뉴클레오티드 프로브 종이 차례로 첨가되는 이러한 실시형태에서, 세정 단계는 그 사이에 수행되고; 이 경우 상보적인 올리고뉴클레오티드 프로브 종은 동일한 최대 방출 파장으로 표지되고 색수차를 교정할 필요가 없다. 또한 두 올리고가 서로 결합할 가능성도 없다.
일부 실시형태에서, 표적 핵산은 올리고뉴클레오티드 프로브 종의 전체 세트가 노출될 때까지 추가의 제1 및 제2 올리고뉴클레오티드 프로브 종에 노출된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 완전한 세트에서 상보적인 올리고뉴클레오티드 프로브 종의 다른 쌍이 추가되기 전에, 제1 올리고뉴클레오티드 프로브 종 후에 다음 올리고뉴클레오티드 프로브 종으로서 제2 올리고뉴클레오티드 프로브 종이 추가된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 완전한 세트의 다른 올리고뉴클레오티드 프로브 종이 추가되기 전에 다음 올리고뉴클레오티드 프로브 종으로서 제2 올리고뉴클레오티드 프로브 종이 추가되지 않는다.
이러한 실시형태의 예는 다음과 같은 샘플 표적 핵산 분자로부터 서열 정보를 획득하는 방법을 포함한다:
i) 기판 상에 이중-가닥 표적 핵산 분자를 연장, 고정 및 변성하는 것
ii) 제1 표지된 올리고를 i)의 변성된 표적 핵산에 노출시키고 올리고뉴클레오티드 프로브 종 결합의 장소를 검출하고 기록하는 것
iii) 세정에 의해 제1 표지된 올리고뉴클레오티드 프로브 종을 제거하는것
iv) 제2 표지된 올리고뉴클레오티드 프로브 종을 i)의 변성된 표적 핵산에 노출시키고 올리고뉴클레오티드 프로브 종 결합의 장소를 검출하고 기록하는 것
v) ii)와 iv)에서의 기록 사이 드리프트를 선택적으로 교정하는 것
vi) ii-iv에서 획득한 결합의 기록된 위치가 공동-위치화되는 경우, 장소의 서열에 대해 따라서 획득된 서열 정보는 정확한 것으로 간주된다.
일부 실시형태에서, 제1 및 제2 올리고뉴클레오티드 프로브 종은 올리고뉴클레오티드 프로브 종 e의 완전한 세트의 일부이고 단계 ii-iii은 전체 표적 핵산을 서열화 하기 위해 올리고뉴클레오티드 프로브 종의 완전한 세트의 각각의 제1 및 제2 올리고뉴클레오티드 프로브 종 쌍에 대해 반복된다.
공동-국지화는 본 발명자들이 동일한 서열 유전자좌를 관찰하고 있음을 알려줄 수 있다. 추가로, 센스 가닥을 표적화하는 올리고뉴클레오티드 프로브 종은 4개의 차등으로 표지된 올리고를 사용하여 중심 염기를 식별하는 것을 모색할 수 있고 안티센스 가닥을 표적화하는 올리고뉴클레오티드 프로브 종은 센스 가닥에 대한 올리고뉴클레오티드 프로브 종에 대해 상보적 서열을 가진 4개의 차등으로 표지된 올리고 뉴클레오티드 프로브 종을 사용하여 중심 염기를 식별하는 것을 모색할 수 있다. 중앙 위치에 대한 검증된 염기 호출을 획득하기 위해, 센스 가닥에 대한 데이터가 안티센스 가닥에 대한 데이터를 확증해야 한다. 따라서 중심 A 염기를 가진 올리고뉴클레오티드 프로브 종이 센스 가닥에 결합한다면, 중심 T 염기를 가진 상보적인 올리고뉴클레오티드 프로브 종은 안티센스 가닥에 결합해야 한다.
일부 실시형태에서, 센스 및 안티센스 가닥에 대한 이러한 확증 또는 컨센서스를 획득하는 것은 G:T 또는 G:U 워블 염기 쌍화로 인한 모호성을 극복하는 데 도움이 될 수 있다. 이것이 센스 가닥에서 발생하는 경우 C:A가 염기-쌍을 형성할 가능성이 적기 때문에 안티센스 가닥에서 신호를 생성할 가능성이 낮다.
일부 실시형태에서, 변형된 G 염기 또는 T/U는 워블 염기-쌍의 형성을 방지하기 위해 올리고뉴클레오티드 프로브 종에서 사용될 수 있다. 일부 다른 실시형태에서, 어셈블리 알고리즘은 특히 상보적 표적 핵산 가닥 상에 C:G 염기-쌍과의 확증이 부재하고 장소가 A:T 염기 쌍을 형성하는 상보적 표적 핵산 가닥에 결합하는 올리고뉴클레오티드 프로브 종과 상관되는 경우 워블 염기-쌍의 형성 가능성을 고려할 수 있다. 일부 실시형태에서, 3개보다 단지 2개의 수소 결합을 형성하는 능력을 갖는 7-데아자구아니신은 이것이 형성될 수 있는 염기 쌍화의 안정성 및 G-사중체와 그의 매우 강한 (따라서 난잡한 결합)의 형성을 감소시키기 위한 G 변형으로서 사용된다.
동시 듀플렉스 컨센서스 어셈블리.
일부 실시형태에서, 이중 나선 표적 핵산의 양 가닥이 존재하고 표적 가닥 사이에 매우 근접하면서 상기에 기술된 바와 같은 올리고뉴클레오티드 프로브 종에 노출된다. 일부 실시형태에서, 2개의 상보적 가닥 중 올리고뉴클레오티드 프로브 종의 각각의 세트에서 각 올리고뉴클레오티드 프로브 종이 결합된 것을, 검출되는 일시적인 광학 신호로부터 구별하는 것이 가능하지 않을 수 있다. 예를 들어, 표적 핵산을 따라 올리고뉴클레오티드 프로브 종의 각각의 세트의 올리고뉴클레오티드 프로브 종 각각에 대한 각 표적 핵산 가닥을 따라 결합 장소가 축적될 때, 상이한 서열의 2개의 프로브가 동일한 장소에 결합된 것처럼 나타날 수 있다. 이들 올리고뉴클레오티드 프로브 종은 상보적인 서열을 가져야 하고, 그러면 2개 올리고뉴클레오티드 프로브 종의 각각이 어느 가닥에 결합하는지 결정하는 것이 어려워지며, 이는 표적 핵산에 대한 서열을 정확하게 축적하기 위한 전제 조건이다.
일부 실시형태에서, 단일 올리고뉴클레오티드 프로브 종 결합 이벤트가 획득된 광학 활성 데이터의 완전한 세트, 제1 또는 제2 표적 핵산 가닥에 대한 것인지에 대한 결정이 고려되어야 한다. 예를 들어, 올리고뉴클레오티드 프로브 종의 2개의 타일링 시리즈가 문제의 위치를 덮는 경우, 신호를 생성하는 올리고뉴클레오티드 프로브 종 서열이 중첩되는 그 시리즈에 기반하여 신호가 속하는 2개의 타일링 시리즈 중 어느 것이 할당될 것이다. 일부 실시형태에서, 서열은 그 다음 먼저 결합의 장소 및 서열 중첩을 사용함에 의해 각 타일링 시리즈를 구성하여 어셈블리될 수 있다. 그런 다음 2개의 타일링 시리즈는 역 보체로 정렬되고 각 장소에서 염기 할당은 두 가닥 서열 데이터가 이들 장소의 각각에서 완벽한 역 보체인 경우에만 허용된다(예를 들어, 따라서 이중 컨센서스 서열을 제공함).
일부 실시형태에서, 시퀀싱 불일치는 2개의 가능성 중 하나가 독립적인 불일치 결합 이벤트와 같은 정보의 추가 층에 의해 확증될 필요가 있는 모호한 염기 호출인 것으로 플래그된다. 일부 실시형태에서, 듀플렉스 컨센서스가 획득되면, 통상적인(다중-분자) 컨센서스는 게놈의 동일한 영역을 커버하는 다른 표적 핵산으로부터의 데이터를 비교함에 의해 결정된다(예를 들어, 다중 세포로부터의 결합 부위 정보가 이용가능한 경우). 이러한 접근방식이 갖는 한 가지 문제는 단상형 서열을 함유하는 다른 표적 핵산의 가능성이다.
대안적으로, 일부 실시형태에서, 개별 가닥 컨센서스는 개별 가닥 컨센서스의 듀플렉스 컨센서스가 획득되기 전에 획득된다. 이러한 실시형태에서, 듀플렉스 표적 핵산의 각 가닥의 서열은 동시적으로 획득된다. 이것은 일부 실시형태에서, 현재의 NGS 방법(예를 들어, Salk 외, Proc. Natl. Acad. Sci. 109(36), 2012에 의해 기술된 바와 같음)과 달리 분자 바코드로 듀플렉스 표적 핵산의 가닥을 차등적으로 태깅하는 것 같은, 추가 샘플 준비 단계를 요구하지 않고 수행된다.
센스 및 안티센스 가닥 둘 모두의 동시 서열 획득은 나노포어 시퀀싱에 이용되는 2D 또는 1D2 컨센서스 시퀀싱과 유리하게 비교된다. 이들 대체 방법은 제2 가닥의 서열을 획득하기 전에 듀플렉스의 한 가닥에 대한 서열이 획득될 필요가 있다. 일부 실시형태에서, 듀플렉스 컨센서스 시퀀싱은 106 범위의 정확도, 예를 들어 100만 염기 중 하나의 오류(다른 NGS 접근방식의 102-103 원시 정확도와 비교됨)를 제공할 수 있다. 이것은 방법을, 암 상태를 나타내는 희귀 변이체(예를 들어, 예컨대 무-세포 DNA에 존재하는 것) 또는 종양 세포 모집단에 낮은 빈도로 존재하는 변이체를 해결해야 할 필요성과 고도로 호환가능하게 한다.
단일-세포 분해된 시퀀싱.
다양한 실시형태에서, 방법은 단일 세포의 게놈을 시퀀싱하는 것을 추가로 포함할 수 있다. 일부 실시형태에서, 단일 세포는 다른 세포로부터의 부착이 없다. 일부 실시형태에서, 단일 세포는 클러스터 또는 조직에서 다른 세포에 부착된다. 일부 실시형태에서, 이러한 세포는 개별 비-부착 세포로 해리된다.
일부 실시형태에서, 세포는 폴리뉴클레오티드가 신장된 구조(예를 들어, 유동 셀 또는 마이크로웰)의 입구로 (예를 들어, 피펫을 사용하여) 유체 이동되기 전에 해리된다. 일부 실시형태에서, 해리는 단백질분해효소, 초음파처리 또는 물리적 교반을 적용함에 의해, 세포를 피펫팅함에 의해 수행된다. 일부 실시형태에서, 세포는 신장된 구조 안으로 유체 이동된 후 해리된다.
일부 실시형태에서, 단일 세포가 단리되고 표적 핵산이 단일 세포로부터 방출되어, 동일한 세포로부터 유래하는 모든 표적 핵산이 서로 가깝게 배치된 상태로 유지되고 다른 세포의 내용물이 처리되는 장소와 구별되는 장소에 유지된다. 일부 실시형태에서, 트랩 구조는 Di Carlo 외, Lab Chip 6:1445-1449, 2006에 의해 기술된 바와 같이 사용된다.
일부 실시형태에서, 다중 단일 세포를 포획하고 단리하는 마이크로유체 구조(예를 들어, 도 16a 및 16b에 도시된 바와 같이 트랩이 분리된 경우), 또는 다중 비-단리된 세포를 포획하는 구조(예를 들어, 트랩이 연속적인 경우)를 사용하는 것이 가능하다. 일부 실시형태에서, 트랩은 단일 세포의 치수이다(예를 들어, 2μM - 10μM. 일부 실시형태에서, 유동 셀은 길이가 수백 미크론 내지 밀리미터이고 깊이가 ~30 미크론이다.
일부 실시형태에서, 예를 들어 도 17에 도시된 바와 같이, 단일 세포는 전달 채널(1702) 내로 흐르고, 포획되고(1704), 폴리뉴클레오티드가 방출된 다음 신장된다. 일부 실시형태에서, 세포(1602)는 용리되고(1706), 그 다음 세포 핵은 제2 용리 단계(1708)를 통해 용리되어 세포외 및 세포내 폴리뉴클레오티드(1608)를 순차적으로 방출한다. 선택적으로, 단일 용리 단계를 사용하여 핵외 및 핵내 폴리뉴클레오티드 둘 모두가 방출된다. 방출 후, 폴리뉴클레오티드(1608)는 유동 셀(2004)의 길이를 따라 이동억제화되고 연장된다. 일부 실시형태에서, 트랩은 단일 세포의 치수이다(예를 들어, 2μM - 10μM 폭). 일 실시형태에서, 트랩 치수는 바닥에서 폭이 4.3μM이고, 중간 깊이에서 6μm이고, 상단에서 8μm이고 깊이가 33μm으로 장치는 사출 성형을 사용하여 고리형 올레핀(COC)으로 만들어진다.
일부 실시형태에서, 단일 세포는 개별 채널 안으로 용리되고, 각각의 개별 세포는 폴리뉴클레오티드가 조합되고 동일한 혼합물에서 시퀀싱되기 전에 트랜스포사제 매개 통합을 통해 고유한 태그 서열과 반응한다. 일부 실시형태에서, 트랜스포사제 복합체는 세포 안으로 형질감염되거나 세포를 함유하는 액적 안으로 병합된 액적에 있다.
일부 실시형태에서, 응집체는 세포의 작은 클러스터이고, 일부 실시형태에서, 전체 클러스터는 동일한 시퀀싱 태그로 태깅된다. 일부 실시형태에서, 세포는 응집되지 않고 순환 종양 세포(CTC) 또는 순환 태아 세포와 같은 자유 부유 세포이다.
단일 세포 시퀀싱에서 세포 용리 후 자발적인 시토신 탈아미노화로 인한 시토신-대-티민 단일 뉴클레오티드 변이체의 문제가 있다. 이것은 시퀀싱 이전에 샘플을 우라실 N-글리코실라제(UNG)로 전처리함에 의해 극복된다(예를 들어, Chen 외, Mol Diagn Ther. 18(5): 587-593, 2014에 기술된 바와 같음).
단상형 식별.
다양한 실시형태에서, 상기 기재된 방법은 단상형을 시퀀싱하기 위해 사용된다. 단상형의 시퀀싱은 본 명세서에 기재된 방법을 사용하여 이배체 게놈의 단상형에 걸쳐 있는 제1 표적 핵산의 시퀀싱을 포함한다. 이배체 게놈의 제2 단상형 영역에 걸쳐 있는 제2 표적 핵산도 시퀀싱되어야 한다. 제1 및 제2 표적 핵산은 상동 염색체의 다른 카피에서 유래한다. 제1 및 제2 표적 폴리뉴클레오티드의 서열을 비교하고 이에 의해 제1 및 제2 표적 핵산 상의 단상형을 결정한다.
따라서, 실시형태로부터 획득된 단일 분자 판독 및 어셈블리는 단상형-특이적인 것으로 분류된다. 단상형-특이적 정보가 긴 범위에 걸쳐 반드시 쉽게 얻어지지 않는 유일한 경우는 어셈블리가 간헐적일 때이다. 이러한 실시형태에서, 그럼에도 불구하고 판독의 장소가 제공된다. 이러한 상황에서도 게놈의 동일한 세그먼트를 커버하는 다중 폴리뉴클레오티드가 분석된다면 단상형이 계산적으로 결정된다.
일부 실시형태에서, 상동 분자는 단상형 또는 모 염색체 특이성에 따라 분리된다. 본 개시내용의 방법에 의해 획득된 정보의 시각적 성질은 실제로 물리적으로 또는 시각적으로 특정 단상형을 나타낼 수 있다. 일부 실시형태에서, 단상형의 분해는 개선된 유전적 또는 가계 연구가 수행되게 할 수 있다. 다른 실시형태에서, 단상형의 분해는 더 나은 조직 유형화가 수행되게 할 수 있다. 일부 실시형태에서, 단상형의 분해 또는 특정 단상형의 검출은 진단이 이루어지게 할 수 있다.
다중 세포로부터 동시에 폴리뉴클레오티드 시퀀싱.
다양한 실시형태에서, 상기에 기재된 방법은 각 폴리뉴클레오티드가 그의 기원 세포의 정보를 보유하는 복수의 세포(또는 핵)로부터 폴리뉴클레오티드를 서열화하는 데 사용된다.
특정 실시형태에서, 트랜스포존 매개 서열 삽입은 세포 내부에서 매개되고, 각각의 삽입은 기원 세포에 대한 표지로서 고유한 ID 서열 태그를 포함한다. 다른 실시형태에서, 트랜스포존 매개 삽입은 단일 세포가 단리된 용기 내부에서 발생하며, 이러한 용기는 아가로스 비드, 오일-물 액적 등을 포함한다. 고유한 태그는 태그를 담지하는 모든 폴리뉴클레오티드는 동일한 세포로부터 유래해야 한다는 것을 나타낸다. 그런 다음 모든 DNA 및 또는 RNA를 추출하고 혼합되도록 하고 연장한다. 그런 다음 본 명세서에 기술된 바와 같은 실시형태에 따른 시퀀싱(또는 임의의 다른 시퀀싱 방법)이 표적 핵산에 대해 수행될 때, ID 서열 태그의 판독은 표적 핵산이 어느 세포로부터 유래하는지를 나타낸다. 일부 실시형태에서, 세포 식별 태그는 짧다. (예를 들어, 종양 현미경 검사에서) 10,000개 세포의 경우, ~65,000개 고유한 서열이 8개 뉴클레오티드 길이의 식별자 서열에 의해 제공되고 대략 백만 개의 고유한 서열이 10개 뉴클레오티드 길이의 식별자 서열에 의해 제공된다.
일부 실시형태에서, 개별 세포는 정체성(ID) 태그로 태깅된다. 도 19에 도시된 바와 같이, 일부 실시형태에서, 정체성 태그는 태그화에 의해 폴리뉴클레오티드 안으로 통합되며, 이를 위해 시약은 단일 세포에 직접적으로 제공되거나 세포(1802)와 병합되거나 이를 삼키는 미세 액적에 제공된다. 각 세포는 상이한 ID 태그를 (큰 세트 예를 들어, 백만 개 초과의 가능한 태그로부터) 수신한다. 미세액적과 세포가 융합된 후(1804), ID 태그는 개별 세포 내의 폴리뉴클레오티드 안으로 통합된다. 개별 세포의 내용물은 유동 셀(2004) 내에서 혼합된다. 그런 다음 (예를 들어, 본 명세서에 개시된 방법에 의한) 시퀀싱은 특정 표적 핵산이 기원하는 세포를 밝힌다. 대안적인 실시형태에서, 미세액적은 세포를 집어삼키고 태깅 시약을 세포에 전달한다(예를 들어, 세포 안으로 확산시키거나 세포 내용물을 미세액적 안으로 파열시킴에 의함).
이 동일한 인덱싱 원리는 샘플을 혼합하고, 이들을 함께 시퀀싱하지만 각각의 개별 샘플에 속하는 서열 정보를 복구하는 것이 목적일 때 (예를 들어, 다른 개체로부터) 세포 이외의 샘플에 적용된다.
더욱이, 다중 세포가 시퀀싱되는 경우, 세포 모집단의 단상형 다양성 및 빈도를 결정할 수 있다. 일부 실시형태에서, 단일 세포의 내용물을 함께 유지할 필요가 없이 모집단 내 게놈의 이질성이 분석되는데, 이는 분자가 충분히 긴 경우 세포의 모집단에 존재하는 상이한 염색체, 긴 염색체 분절 또는 단상형이 결정되기 때문이다. 이것은 2개의 단상형이 세포에 함께 존재하는지 나타내지는 않지만, 게놈 구조 유형(또는 단상형)의 다양성과 그 빈도 및 존재하는 비정상적인 구조적 변이에 대해 보고한다.
일부 실시형태에서, 표적 핵산이 RNA이고 cDNA 카피가 시퀀싱되는 경우, 태그의 추가는 태그 서열을 함유하는 프라이머로 cDNA 합성을 포함한다. RNA가 직접적으로 시퀀싱되는 경우 T4 RNA 리가제를 사용하여 3' RNA 말단에 태그의 결찰에 의하여 태그가 추가된다. 태그를 생성하는 대안적인 방법은 4개의 A, C, G 및 T 염기 중 하나 초과의 뉴클레오티드로 말단 전이효소를 사용하여 RNA 또는 DNA를 연장하여 각 개별 폴리뉴클레오티드가 확률적으로 그 위에 꼬리가 달린 고유한 뉴클레오티드의 서열을 얻도록 하는 것이다.
일부 실시형태에서, 태그 서열의 양을 짧게 유지하여 보다 많은 서열 판독이 폴리뉴클레오티드 서열 그 자체를 시퀀싱하는데 전념하도록 하기 위해, 태그 서열은 다수의 부위에 걸쳐 분포된다. 여기서 다중 짧은 식별자 서열, 즉 3개가 각 세포 또는 용기 안으로 도입된다. 그런 다음 폴리뉴클레오티드의 기원은 폴리뉴클레오티드를 따라 분포된 태그의 비트에서 결정된다. 따라서 이 경우 한 장소에서 판독된 태그의 비트는 기원 세포를 결정하는 데 충분하지 않지만 다중 태그 비트는 결정을 내리기에 충분하다.
구조적 변이체의 검출.
일부 실시형태에서, 검출된 서열과 참조 게놈 사이의 차이는 치환, 삽입결실 및 구조적 변이를 포함한다. 특히, 참조 서열이 본 개시내용의 방법에 의해 어셈블링되지 않은 경우, 반복은 전형적으로 압축되고, 어셈블리는 반복을 압축해제할 것이다.
일부 실시형태에서, 폴리뉴클레오티드에 따른 일련의 서열 판독의 배향은 역전 이벤트가 발생했는지 여부를 보고할 것이다. 참조와 비교하여 다른 판독에 반대 배향에서 하나 이상의 판독은 역전을 나타낸다.
일부 실시형태에서, 그 부근의 다른 판독의 맥락에서 예상되지 않는 하나 이상의 판독의 존재는 참조와 비교하여 재배열 또는 전좌를 나타낸다. 참조에서 판독의 장소는 게놈의 어느 부분이 다른 부분으로 전이했는지 나타낸다. 일부 경우에 그의 새 장소에서 판독은 전좌가 아니라 복제이다.
일부 실시형태에서, 반복 영역 또는 카피 수 변이를 검출하는 것이 또한 가능하다. 유사 변이를 수반하는 판독 또는 관련된 판독의 반복 발생은 게놈에서 다중 장소에서 발생하는 다중 또는 매우 유사한 판독으로 관찰된다. 이들 다중 장소는 (예를 들어, 위성 DNA에서와 같이) 일부 경우에 함께 가깝게 포장되거나 (예를 들어, 유사유전자에서와 같이) 다른 경우에 게놈 전반에 걸쳐 분산된다. 본 개시내용의 방법은 짧은 탠덤 반복(STRS), 탠덤 반복의 가변성 수(VNTR), 트리뉴클레오티드 반복 등에 적용된다. 특정 판독의 부재 또는 반복은 각각 결실 또는 증폭이 발생했음을 나타낸다. 일부 실시형태에서, 본 명세서에 기술된 바와 같은 방법은 폴리뉴클레오티드에 다중 및/또는 복잡한 재배열이 있는 경우에 특히 적용된다. 본 명세서에 기술된 바와 같은 방법은 단일 폴리뉴클레오티드를 분석하는 것을 기반으로 하기 때문에, 일부 실시형태에서, 상기에 기술된 구조적 변이체는 소수의 세포, 예를 들어 모집단에서 단 1%의 세포에서 드물게 발생하도록 분해된다.
유사하게, 일부 실시형태에서, 분절 중복 또는 듀플리콘은 게놈에서 정확하게 국지화된다. 분절 듀플리콘은 전형적으로 거의 동일한 서열의 DNA 서열의 긴 영역(예를 들어, 길이 1킬로베이스 초과)이다. 이들 분절 중복은 체세포 돌연변이를 포함하여 개별 게놈에서 많은 구조적 변이를 야기한다. 분절 듀플리콘은 게놈의 말단 부분에 존재할 수 있다. 현재의 차세대 시퀀싱에서는 판독이 어떤 분절 듀플리콘에서 발생하는지 결정하기 어렵다(따라서 어셈블리가 복잡해짐). 본 개시내용의 일부 실시형태에서, 서열 판독은 긴 분자(예를 들어, 0.1-10메가베이스 길이 범위)에 걸쳐 수득되고, 일반적으로 판독을 사용하여 듀플리콘의 게놈 상황을 결정하여 게놈의 어느 세그먼트가 듀플리콘에 상응하는 게놈의 특정 세그먼트에 측접해 있는지를 결정하는 것이 가능하다.
구조적 변형의 중단점은 본 개시내용의 일부 실시형태에서 정확하게 국지화된다. 일부 실시형태에서, 게놈의 두 부분이 융합된 것을 검출하는 것이 가능하고, 중단점이 발생한 정확한 개별 판독이 결정된다. 본 명세서에 기재된 바와 같이 수집된 서열 판독은 2개의 융합된 영역의 키메라를 포함하고, 중단점의 한 쪽에 있는 모든 서열은 융합된 세그먼트 중 하나에 상응할 것이고 다른 면은 융합된 세그먼트의 다른 쪽이다. 이는 중단점 주변의 구조가 복잡한 경우에도 중단점을 결정하는데 있어 높은 신뢰도를 제공한다. 일부 실시형태에서, 정확한 염색체 중단점 정보는 질병 기전을 이해하거나, 특정 전좌의 발생을 검출하거나, 질병을 진단하는데 사용된다.
후성유전체 변형의 국지화.
일부 실시형태에서, 방법은 고정된 이중 가닥 표적 핵산 또는 천연 듀플렉스 표적 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 항체, 아피머, 나노바디, 압타머 또는 메틸-결합 단백질에 노출시켜 이에 의해 핵산에 대한 변형을 결정하거나 또는 테스트 기판 상의 복수의 위치 세트로부터의 핵산 부분의 서열과 서로 관련시키는 것을 추가로 포함한다. 일부 항체는 이중 가닥 또는 단일 가닥에 결합한다. 메틸 결합 단백질은 염색질에서와 같이 이중 가닥 폴리뉴클레오티드에 결합할 것으로 예상된다.
일부 실시형태에서, 천연 폴리뉴클레오티드는 시퀀싱을 위해 표시되기 전에 처리를 필요로 하지 않는다. 이것은 DNA의 화학적 변형이 제자리에 유지될 것이기 때문에 방법이 서열 정보와 후성유전체 정보를 통합할 수 있도록 한다. 일부 실시형태에서, 폴리뉴클레오티드는 방향적으로 잘 정렬되어 있고 따라서 이미지, 이미지 처리, 염기 호출 및 어셈블리하는 것이 비교적 용이하며; 서열 오류율이 낮고 적용범위가 높다. 본 개시내용을 수행하기 위한 다수의 실시형태가 기술되지만 각각은 샘플 준비의 부담이 완전히 또는 거의 완전히 제거되도록 수행된다.
이들 방법은 증폭 없이 게놈 DNA에 대해 수행되기 때문에, 일부 실시형태에서, 증폭 바이어스 및 오류를 겪지 않고, 후성유전체 마크가 보존되고 (예를 들어, 서열의 획득에 직교로) 검출된다. 일부 경우에 핵산이 메틸화되었는지 여부를 서열-특이적 방식으로 결정하는 것이 유용하다. 예를 들어, 태아를 모체 DNA와 구별하는 한 가지 방법은 전자가 관심있는 유전자좌에서 메틸화된다는 것이다. 이것은 비-침습적 산전 검사(NIPT)에 유용하다.
포유류에서 여러 시토신 변이체를 생성하는 탄소-5(C5)의 알킬화, C5-메틸시토신(5-mC), C5-하이드록시메틸시토신(5-hmC), C5-포르밀시토신 및 C5-카르복실시토신과 같은 다중 유형의 메틸화가 가능하다. 진핵생물과 원핵생물은 또한 아데닌을 N6-메틸아데닌(6-mA)으로 메틸화한다. 원핵생물에서는 N4-메틸시토신도 만연하다.
항체는 이용가능하거나 관심있는 것으로 해석되는 임의의 다른 것뿐만 아니라 이들 변형의 각각에 대해 생성된다. 변형을 목표로 하는 아피머, 나노바디 또는 압타머는 더 작은 풋프린트의 가능성으로 인해 특히 관련이 있다. 본 발명에서 항체에 대한 임의의 언급은 아피머, 나노바디, 압타머 및 임의의 유사한 시약을 포함하는 것으로 해석되어야 한다. 부가하여, 다른 천연 발생 DNA 결합 단백질, 예를 들어 메틸 단백질(MBD1, MBD2 등)이 일부 실시형태에서 사용된다.
메틸화 분석은 일부 실시형태에서 시퀀싱에 직교로 수행된다. 일부 실시형태에서, 이것은 시퀀싱 전에 수행된다. 예로서, 항-메틸 C 항체 또는 메틸 결합 단백질(메틸 결합 도메인(MBD) 단백질 계열은 MeCP2, MBD1, MBD2 및 MBD4를 포함함) 또는 펩티드(MBD1 기반)는 일부 실시형태에서 폴리뉴클레오티드에 결합되고, 이들의 장소는 제거되기 전에 표지를 통해 검출된다(예를 들어, 고염 완충액, 카오트로픽 시약, SDS, 단백질분해효소, 요소 및/또는 헤파린을 추가함에 의함). 일부 실시형태에서, 시약은 온-오프 결합을 촉진하는 일시적인 결합 완충액의 사용으로 인해 일시적으로 결합할 수 있거나 시약은 일시적으로 결합하도록 조작된다. 항체가 이용 가능하거나 발생되는, DNA 손상의 부위 또는 하이드록시메틸화와 같은 다른 폴리뉴클레오티드 변형을 위해 유사한 접근방식이 사용된다. 변형의 장소가 감지되고 변형 결합 시약이 제거된 후 시퀀싱이 시작된다. 일부 실시형태에서, 항-메틸 및 항-하이드록시메틸 항체 등은 표적 폴리뉴클레오티드가 단일 가닥이 되도록 변성된 후에 추가된다. 방법은 매우 민감하고 긴 폴리뉴클레오티드 상에서 단일 변형을 감지할 수 있다.
도 19는 단일 세포로부터 DNA 및 RNA의 추출 및 신장과 (예를 들어, 각각 mC 및 m6A에 대한 항체로) DNA 및 RNA의 차등적 표지화를 예시한다. 세포(1602)는 표면 상에 이동억제된 다음 용리된다(1902). 용리에 의해 핵(1604)에서 방출된 핵산(1608)은 이동억제화되고 신장된다(1904). 그런 다음 핵산은 첨부된 DNA 태그(1910 및 1912)가 있는 항체에 노출되고 결합된다. 일부 실시형태에서, 태그는 DNA PAINT-기반 단일 분자 국지화를 위한 형광 염료 또는 올리고뉴클레오티드 도킹 서열이다. 일부 실시형태에서, 태그 및 DNA PAINT를 사용하는 대신에, 항체 또는 다른 결합 단백질은 단일 형광 표지 또는 다중 형광 표지로 직접적으로 형광으로 표지된다. 항체가 인코딩되는 경우에, 표지화의 일 예는 도 14a, 14c 및 14d에 도시된 바와 같다. DNA 및 RNA 둘 모두의 에피-변형 분석은 일부 실시형태에서 본 명세서에 기재된 시퀀싱 방법을 사용하여 이들의 서열과 커플링된다.
일부 실시형태에서, 결합 단백질에 의한 메틸화를 검출하는 것에 더하여, 결합 부위에서의 메틸화의 존재는 변형이 없을 때와 비교하여 표적 핵산 부위에 변형이 존재할 때 차등적 올리고뉴클레오티드 결합 거동에 의해 검출된다.
일부 실시형태에서, 중아황산염 처리를 사용하여 메틸화를 검출한다. 여기에서 올리고뉴클레오티드 프로브 종의 완전한 세트를 통해 수행한 후, 중아황산염 처리를 사용하여 비메틸화된 시토신을 우라실로 전환한 다음 올리고뉴클레오티드 프로브의 완전한 세트를 다시 적용한다. 중아황산염 처리 전 C로 판독되는 뉴클레오티드 위치를 중아황산염 처리 후 U로 판독되면 그것은 비메틸화된 것으로 간주할 수 있다.
메틸화와 같은 DNA 변형에 대한 참조 후성유전체가 없다. 유용하기 위해서는 미지의 폴리뉴클레오티드의 메틸화 맵이 서열 기반 맵에 연결될 필요가 있다. 따라서, 에피-맵핑 방법은 일부 실시형태에서 에피-맵에 상황을 제공하기 위해 올리고 결합에 의해 획득된 서열 비트와 상관된다. 서열 판독에 부가하여, 일부 실시형태에서 다른 종류의 메틸화 정보도 커플링된다. 이것은 비-제한적인 예로서 닉킹 엔도뉴클레아제 기반 맵, 올리고뉴클레오티드 프로브 종-결합 기반 맵, 변성 및 변성-원형재현 맵을 포함한다. 일부 실시형태에서, 하나 이상의 올리고뉴클레오티드 프로브 종의 일시적인 결합을 사용하여 폴리뉴클레오티드를 지도화한다. 게놈에 대한 기능적 변형에 부가하여, 일부 실시형태에서, DNA 손상 및 단백질 또는 리간드 결합의 부위와 같은 게놈에 지도화되는 다른 특징에 동일한 접근방식이 적용된다.
본 개시내용에서는 염기 시퀀싱 또는 후성유전체 시퀀싱 중 어느 하나를 먼저 수행한다. 일부 실시형태에서, 둘 모두가 동시에 수행된다. 예를 들어, 특정 에피-변형에 대한 항체는 일부 실시형태에서 올리고로부터 차등적으로 코딩된다. 이러한 실시형태에서, 두 유형의 프로브의 일시적인 결합을 촉진하는 조건이 사용된다(예를 들어, 저염 농도).
일부 실시형태에서, 폴리뉴클레오티드가 염색체 또는 염색질을 포함하는 경우, 항체는 DNA 상의 변형 및 또한 히스톤 상의 변형(예를 들어, 히스톤 아세틸화 및 메틸화)을 검출하기 위해 염색체 또는 염색질 상에서 사용된다. 이들 변형의 장소는 염색체 또는 염색질 상의 장소에 대한 항체의 일시적인 결합에 의해 결정된다. 일부 실시형태에서, 항체는 올리고 태그로 표지되고 일시적으로 결합하지 않고 오히려 그의 결합 부위에 영구적으로 또는 반-영구적으로 고정된다. 이러한 실시형태에서, 항체는 올리고 태그를 포함할 것이고, 이들 항체 결합 부위의 장소는 항체 태그 상의 올리고에 대한 상보적인 올리고의 일시적인 결합을 사용함에 의해 검출된다.
무-세포 핵산의 단리 및 분석.
진단을 위해 가장 접근하기 쉬운 DNA 또는 RNA 중 일부는 체액이나 대변에서 세포의 외부에서 발견된다. 이러한 핵산은 종종 신체에서의 세포에 의해 유출된다. 혈액에서 순환하는 무-세포 DNA는 21번 염색체 삼체성 및 기타 염색체 및 게놈 장애에 대한 산전 검사에 사용된다. 이것은 또한 특정 병리학적 상태에 대한 마커인 종양-유래 DNA 및 기타 DNA 또는 RNA를 검출하는 수단이다. 그러나, 분자는 전형적으로 작은 부분으로 존재한다(예를 들어, 혈액에서는 ~200 염기 쌍 길이 범위, 및 소변에서는 더 짧음). 게놈 영역의 카피 수는 게놈의 다른 부분과 비교하여 참조의 특정 영역에 정렬되는 판독의 수와 비교하여 결정된다.
일부 실시형태에서, 본 개시내용의 방법은 2가지 접근방식에 의해 무세포 DNA 서열의 열거 또는 분석에 적용된다. 제1은 변성 전 또는 후에 짧은 핵산을 이동억제화하는 것을 포함한다. 일시적인 결합 시약은 핵산의 정체성, 그 카피 수, 돌연변이 또는 특정 SNP 대립유전자가 존재하는지 여부, 및 검출된 서열이 메틸화되었는지 또는 다른 변형(바이오마커)을 담지하는지 여부를 결정하기 위해 핵산을 조사하는 데 사용된다.
제2 접근방식은 작은 핵산 단편을 공동연결하는 것을 포함한다(예를 들어, 무-세포 핵산이 생물학적 샘플에서 단리된 후. 공동연결은 조합된 핵산을 신장할 수 있다. 연결은 DNA의 말단을 연마하고 무딘 말단-결찰을 수행함에 의해 실행된다. 대안적으로, 혈액 또는 무세포 DNA는 2개의 부분표본으로 분할되고 하나의 부분표본은 폴리 A(터미널 트랜스퍼라제 사용)로 꼬리가 붙고 다른 부분표본은 폴리 T로 꼬리가 붙는다.
생성된 연쇄체는 그 다음 시퀀싱된다. 그런 다음 생성된 "수퍼" 서열 판독은 참조와 비교되어 개별 판독을 추출한다. 개별 판독은 계산적으로 추출된 다음 다른 짧은 판독과 동일한 방식으로 처리된다.
일부 실시형태에서, 생물학적 샘플은 핵산을 분해하는 높은 수의 엑소뉴클레아제를 함유하는 배지인 대변을 포함한다. 이러한 실시형태에서, 엑소뉴클레아제가 기능하기 위해 필요한 높은 농도의 2가 양이온의 킬레이터(예를 들어, EDTA)를 사용하여 DNA를 충분히 온전하게 유지하고 시퀀싱을 가능하게 한다. 일부 실시형태에서, 무-세포 핵산은 엑소좀에서의 캡슐화를 통해 세포로부터 유출된다. 초원심분리 또는 스핀 컬럼(Qiagen)을 사용하여 엑소좀이 단리되고, 그 안에 함유된 DNA 또는 RNA가 수집되고 서열화된다.
일부 실시형태에서, 메틸화 정보는 상기에 기재된 방법에 따라 무-세포 핵산으로부터 수득된다.
시퀀싱 기술 조합.
일부 실시형태에서, 본 명세서에 기재된 방법은 다른 시퀀싱 기술과 조합된다. 일부 실시형태에서, 일시적인 결합에 의한 시퀀싱에 이어서, 제2 방법에 의한 시퀀싱이 동일한 분자에 대해 개시된다. 예를 들어, 더 길고 더 안정적인 올리고뉴클레오티드는 합성에 의해 시퀀싱을 개시하도록 결합된다. 일부 실시형태에서, 방법은 완전한 게놈 시퀀싱에 미치지 못하고 Illumina의 것과 같은 짧은 판독 시퀀싱을 위한 스캐폴드를 제공하는 데 사용된다. 이 경우에 게놈의 보다 균일한 적용범위를 얻기 위해 PCR 증폭 단계를 제외하여 Illumina 라이브러리 준비를 수행하는 것이 유리하다. 이들 실시형태 중 일부의 한 가지 이점은 필요한 시퀀싱의 접힘 적용범위가 예를 들어 약 40x에서 20x로 절반으로 된다는 것이다. 일부 실시형태에서, 이는 본 명세서에 기재된 방법이 제공하는 방법 및 장소의 정보에 의해 수행된 시퀀싱의 추가로 인한 것이다. 일부 실시형태에서, 선택적으로 광학적으로 표지된 보다 긴 보다 안정한 올리고를 표적에 결합하여 시퀀싱 과정의 일부 또는 전체를 통한 짧은 시퀀싱 올리고 전에 또는 이와 동시에 (상이하게 표지됨) 게놈(예를 들어, BRCA1 유전자좌)에서 관심있는 특정 영역을 표시할 수 있다.
기계 학습 방법.
일부 실시형태에서, 인공 지능 또는 기계 학습이 공지된 서열의 중합체(예를 들어, 폴리뉴클레오티드)에 대해 테스트될 때 및/또는 폴리뉴클레오티드의 서열이 다른 방법으로부터의 데이터로 교차-검증될 때 올리고뉴클레오티드 프로브 종의 완전한완벽한 세트의 구성원의 거동을 학습하는 데 사용된다. 일부 실시형태에서, 학습 알고리즘은 하나 이상의 조건 또는 상황에서 올리고뉴클레오티드 프로브 종에 대한 결합 부위를 함유하는 하나 이상의 폴리뉴클레오티드 표적에 대한 특정 올리고뉴클레오티드 프로브 종의 전체 거동을 고려한다. 동일하거나 상이한 샘플에 대해 더 많은 시퀀싱이 수행될수록 기계 학습으로부터의 지식이 더욱 강력해진다. 기계 학습에서 학습된 것은 일시적인 결합-기반 긴급 시퀀싱에 부가하여 다양한 기타 검정, 특히 올리고와 올리고/폴리뉴클레오티드의 상호 작용(예를 들어, 혼성화에 의한 시퀀싱)을 포함하는 것에 적용된다.
일부 실시형태에서, 인공 지능 또는 기계 학습은 알려진 서열의 하나 이상의 폴리뉴클레오티드에 완전한 세트의 짧은 올리고(예를 들어, 3-mer, 4-mer, 5-mer, 또는 6-mer)의 결합에 대해 실험적으로 획득된 결합 패턴의 데이터를 제공함에 의해 훈련된다. 각 올리고에 대한 훈련 데이터는 결합 장소, 결합의 지속시간 및 주어진 기간 동안의 결합 이벤트의 수를 포함한다. 이 훈련 후, 기계 학습 알고리즘은 결정될 서열의 폴리뉴클레오티드에 적용되고 그 학습을 기반으로 폴리뉴클레오티드의 서열을 어셈블리할 수 있다. 일부 실시형태에서, 기계 학습 알고리즘에는 또한 참조 서열이 제공된다.
일부 실시형태에서, 서열 어셈블리 알고리즘은 기계 학습 요소와 비-기계 학습 요소 둘 모두를 포함한다.
일부 실시형태에서, 실험적으로 획득된 결합 패턴으로부터 학습하는 컴퓨터 알고리즘 대신에, 결합 패턴은 시뮬레이션을 통해 획득된다. 예를 들어, 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 완전한 세트의 올리고뉴클레오티드 프로브 종의 공지된 서열의 폴리뉴클레오티드에 대한 일시적인 결합의 시뮬레이션이 수행된다. 시뮬레이션은 실험 또는 공개된 데이터에서 얻은 각 올리고뉴클레오티드 프로브 종 서열의 거동의 모델을 기반으로 한다. 예를 들어, 결합 안정성의 예측은 가장 가까운 이웃 방법에 따라 이용가능하다(예를 들어, SantaLucia 외, Biochemistry 35, 3555-3562 (1996) 및 Breslauer 외, Proc. Natl. Acad. Sci. 83: 3746-3750, 1986에 기술된 바와 같음). 일부 실시형태에서, 불일치하는 거동이 알려져 있거나(예를 들어, A에 대한 G 불일치 결합은 T보다 A로의 강하거나 더 강한 상호작용으로 될 수 있음) 실험적으로 유도된다. 추가로, 일부 실시형태에서, 올리고의 일부 짧은 하위-서열(예를 들어, GGA 또는 ACC)의 지나치게 높은 결합 강도가 공지되어 있다. 일부 실시형태에서, 기계 학습 알고리즘은 시뮬레이션된 데이터에 대해 훈련된 다음 짧은 올리고의 완전한 세트에 의해 조사될 때 알려지지 않은 서열의 서열을 결정하는 데 사용된다.
일부 실시형태에서, 올리고뉴클레오티드 프로브 종 또는 패널의 완전한 세트의 올리고의 데이터(장소, 결합 지속시간, 신호 강도, 등)는 1개 또는 수십, 또는 수백 또는 수천 개의 알려진 서열에 대해 훈련된 기계 학습 알고리즘 안으로 플러깅된다. 그런 다음 기계 학습 알고리즘을 적용하여 해당 서열로부터 데이터-세트를 생성하고 기계 학습 알고리즘은 해당하는 알려지지 않은 서열의 서열을 생성한다. 상대적으로 더 작거나 덜 복잡한 게놈(예를 들어, 박테리아, 박테리오파지 등)일 유기체의 시퀀싱을 위한 알고리즘의 훈련은 그 유형의 유기체에 대해 수행되어야 한다. 더 크거나 복잡한 게놈을 가진 유기체(예를 들어, S. 폼베 또는 인간), 특히 반복적인 DNA 영역을 가진 유기체의 경우 그 유형의 유기체에 대해 훈련이 수행되어야 한다. 전체 염색체 길이에 대한 메가베이스 단편의 긴-범위 어셈블리의 경우, 훈련은 일부 실시형태에서 유사한 유기체에 대해 수행되어 게놈의 특정 측면이 훈련 동안 표현된다. 예를 들어, 인간 게놈은 이배체이고 분절 중복이 있는 큰 서열 영역을 나타낸다. 다른 관심있는 게놈, 특히 농업적으로 중요한 많은 식물 종은 매우 복잡한 게놈을 가지고 있다. 예를 들어, 밀 및 기타 곡물은 고도로 배수체 게놈을 가지고 있다.
일부 실시형태에서, 기계 학습 기반 서열 어셈블리 접근방식은: (a) 하나 이상의 훈련 데이터-세트로부터 수집된 올리고뉴클레오티드 프로브 종의 완전한 세트에서 각 올리고뉴클레오티드 프로브 종의 결합 거동에 대한 정보를 제공하는 것 및 (b) 올리고뉴클레오티드 프로브 종의 완전한 세트의 각 올리고뉴클레오티드 프로브 종을 그 서열이 결정되어 지는 표적 핵산에 물리적 결합을 위해 제공하는 것 및 (c) 결합 장소 및/또는 결합 지속시간 및/또는 각 올리고뉴클레오티드 프로브 종에 대한 각 장소에서 결합이 발생하는 횟수(예를 들어, 결합 반복의 지속성)에 대한 정보를 제공하는 것을 포함한다.
일부 실시형태에서, 특정 실험의 서열은 먼저 비-기계 학습 알고리즘에 의해 처리된다. 그런 다음 제1 알고리즘의 출력 서열은 기계 학습 알고리즘을 훈련하는 데 사용되므로 훈련은 동일한 정확한 분자의 실제 실험적으로 유도된 서열에서 발생한다. 일부 실시형태에서, 서열 어셈블리 알고리즘은 베이지안 접근방식을 포함한다. 일부 실시형태에서, 본 개시내용의 방법으로부터 유래된 데이터는 WO2010075570에 기재된 유형의 알고리즘에 제공되고 선택적으로 다른 유형의 게놈 또는 시퀀싱 데이터와 조합된다.
일부 실시형태에서, 서열은 다수의 방식으로 데이터로부터 추출된다. 서열 어셈블리 방법의 스펙트럼의 일 말단에서 모노머 또는 모노머의 스트링의 국지화는 매우 정확하여(나노미터 또는 서브-나노미터) 서열은 단지 모노머 또는 스트링을 순서화함에 의해 얻어진다. 스펙트럼의 다른 말단에서 데이터는 서열에 대한 다양한 가설을 배제하는 데 사용된다. 예를 들어, 하나의 가설은 서열이 알려진 개별 게놈 서열에 상응한다는 것이다. 알고리즘은 데이터가 개별 게놈에서 분기되는 위치를 결정한다. 또 다른 경우에 가설은 서열이 "정상" 체세포에 대한 알려진 게놈 서열에 상응한다는 것이다. 알고리즘은 추정되는 종양 세포로부터의 데이터가 "정상" 체세포의 서열에서 분기되는 위치를 결정한다.
본 개시내용의 일 실시형태에서, 하나 이상의 공지된 표적 핵산(예를 들어, 람다 파지 DNA 또는 올리고뉴클레오티드 프로브 종의 완전한 세트에서 각 올리고뉴클레오티드 프로브 종에 대한 상보체를 포함하는 슈퍼 서열을 포함하는 합성 작제물)을 포함하는 훈련 세트는 올리고뉴클레오티드 프로브 종의 완전한 세트로부터 각 올리고뉴클레오티드 프로브 종의 테스트된 반복적 결합에 대해 사용된다. 일부 실시형태에서, 올리고뉴클레오티드 프로브 종의 결합 및 불일치 특성을 결정하기 위해 기계 학습 알고리즘이 사용된다. 따라서 반-직관적으로, 불일치 결합은 서열에 신뢰도를 조합 및/또는 추가하는 데 사용되는 추가 데이터를 제공하는 방법으로 여겨진다.
시퀀싱 기기 및 장치.
시퀀싱 방법은 공통의 기기 요건을 갖는다. 기본적으로 기기는 이미징 및 시약 교환이 가능해야 한다. 이미징 요구사항은: 대물 렌즈, 중계 렌즈, 빔-스플리터, 미러, 필터 및 카메라 또는 포인트 검출기 군으로부터 하나 이상을 포함한다. 카메라 또는 이미저는 CCD, 어레이 CMOS 또는 애벌랜치 포토다이오드 어레이 검출기를 포함한다. 포인트 검출기는 광전자증배관(PMT) 또는 애벌랜치 포토다이오드(APD)를 포함한다. 일부 경우에 고속 카메라가 사용된다. 기타 선택적 양태는 방법의 형식에 따라 조정된다. 예를 들어, 조명원(예를 들어, 램프, LED 또는 레이저), 기판에 대한 조명의 결합(예를 들어, 프리즘, 도파관, 광자 나노구조, 격자, 졸-겔, 렌즈, 전환가능한 스테이지 또는 전환가능한 대물렌즈), 이미저와 관련하여 샘플을 이동시키기 위한 기전, 샘플 혼합/교반, 온도 제어 및 전기 제어는 본 명세서에 개시된 상이한 실시헝태에 대해 각각 독립적으로 조정된다.
단일 분자 구현의 경우, 조명은 예를 들어 프리즘-기반 전반사, 대물-기반 전반사, 플라즈몬 도파관, 격자-기반 도파관, 하이드로겔 기반 도파관 또는 적절한 각도로 기판의 가장자리 안으로 레이저 광을 가져와 생성된 소멸 도파관을 통한 소멸파를 이용할 수 있다. 일부 실시형태에서, 도파관은 코어 층 및 제1 클래딩 층을 포함한다. 조명은 대안적으로 HILO 조명 또는 광 시트를 포함한다. 일부 단일 분자 기기에서 광 산란의 효과는 펄스 조명과 시간-제한 감지의 동기화를 사용함에 의해 완화된다; 여기에서 빛의 산란은 차단된다. 일부 실시형태에서 암시야 조명이 사용된다. 일부 기기는 형광 수명 측정을 위해 설정된다.
일부 실시형태에서, 기구는 또한 세포, 핵, 소기관, 염색체 등으로부터 폴리뉴클레오티드의 추출을 위한 수단을 함유한다.
대부분의 실시형태에 적합한 기기는 Illumina로부터의 게놈 분석기 IIx이다. 이 기기는 프리즘-기반 TIR, 20x Dry Objective, 라이트 스크램블러, 532nm 및 660nm 레이저, 적외선 레이저 기반 포커싱 시스템, 방출 필터 휠, Photometrix CoolSnap CCD 카메라, 온도 제어 및 시약 교환을 위한 주사기 펌프-기반 시스템을 포함한다. 대안적인 카메라 조합으로 이 기기의 변형은 일부 실시형태에서 더 나은 단일 분자 시퀀싱을 가능하게 한다. 예를 들어, 센서는 낮은 전자 노이즈, <2 e를 갖는다. 또한 센서에는 많은 수의 픽셀을 갖는다. 주사기-펌프 기반 시약 교환 시스템은 일부 실시형태에서 압력-구동 흐름에 기반한 것에 의해 대체된다. 시스템은 호환되는 Illumina 유동 셀 또는 일부 실시형태에서 기기의 실제 또는 변형된 배관에 맞도록 구성된 맞춤형-유동 셀와 함께 사용된다.
대안적으로, 레이저 베드(표지의 선택에 의존하는 레이저) 또는 레이저 시스템 및 게놈 분석기로부터 광 스크램블러와 결합된 전동화된 Nikon Ti-E 현미경, EM CCD 카메라(예를 들어, Hamamatsu ImageEM) 또는 과학적 CMOS(예를 들어, Hamamatsu Orca FLASH) 및 선택적으로 온도 제어가 사용된다. 일부 실시형태에서, 과학적 센서보다는 컨슈머가 사용된다. 이것은 시퀀싱의 비용을 극적으로 줄일 가능성이 있다. 이것은 압력 구동식 또는 주사기 펌프 시스템 및 특별히 설계된 유동 셀과 결합된다. 일부 실시형태에서, 유동 셀은 유리 또는 플라스틱으로 제조되며, 각각은 장점과 단점을 갖는다. 일부 실시형태에서, 유동 셀은 환형 올레핀 공중합체(COC), 예를 들어 TOPAS, 기타 플라스틱, 또는 PDMS를 사용하거나 또는 미세가공 방법을 사용하여 실리콘 또는 유리로 제작된다. 일부 실시형태에서, 열가소성 수지의 사출 성형은 산업적 규모 제조에 대해 저-비용 라우터를 제공한다. 일부 광학 구성에서 열가소성 플라스틱은 고유한 형광을 최소화하면서 우수한 광학 특성을 가져야 한다. 방향족 또는 공액계를 함유하는 중합체는 상당한 고유 형광을 가질 것으로 예상되므로 이상적으로 제외되어야 한다. Zeonor 1060R, Topas 5013 및 PMMA-VSUVT(예를 들어, 미국 특허 번호 8,057,852에 기술된 바와 같음)는 가장 유리한 속성을 갖는 Zeonar 1060R과 함께 녹색 및 적색 파장 범위(예를 들어, Cy3 및 Cy5의 경우)에서 합리적인 광학 특성을 갖는 것으로 보고되었다. 일부 실시형태에서, 마이크로유체 장치의 넓은 영역에 걸쳐 열가소성 물질을 결합하는 것이 가능하다(예를 들어, Sun 외, Microfluidics and Nanofluidics, 19(4), 913-922, 2015에 의해 보고됨). 일부 실시형태에서, 생체고분자가 부착된 유리 커버 유리는 열가소성 유체 구조에 결합된다.
대안적으로, 수동으로 작동되는 유동 셀이 현미경 상부에 사용된다. 이것은 일부 실시형태에서 양면 점착 시트를 사용하여 유동 셀을 만들어 적절한 치수의 채널을 갖도록 레이저 절단하고 커버슬립과 유리 슬라이드 사이에 끼워 넣음에 의해 구축된다. 일 시약 교환 주기에서 다른 주기까지 유동 셀은 프레임에서 프레임으로 등록하기 위해 기기/현미경 상에 남아 있을 수 있다. 일부 실시형태에서, 넓은 영역의 이미징 동안 스테이지가 병진되는 시기를 보장하기 위해 선형 인코더를 갖는 전동화된 스테이지가 사용된다. 동일한 장소는 올바르게 재방문된다. 망선상 기준점 마커는 올바른 등록을 유지하는 데 사용된다. 일부 실시형태에서, 유동 셀 또는 표면 이동억제된 비드에서의 에칭과 같은 망선상 기준점 표시는 광학적으로 검출되는 유동 셀 내에 제공된다. 폴리뉴클레오티드 백본이 (예를 들어, YOYO-1에 의해) 염색되어 고정된 경우 한 프레임에서 다음 프레임으로 이미지를 정렬하는 데 알려진 위치가 사용된다.
일 실시형태에서, 레이저 또는 LED 조명을 사용하는 조명 기전(예를 들어, 예컨대 미국 특허 번호 7,175,811 및 Ramachandran 외, Scientific Reports 3:2133, 2013에 기술된 것)은 본 명세서에 기술된 방법을 수행하기 위한 선택적인 가열 기전 및 시약 교환 시스템과 결합된다. 일부 실시형태에서, 스마트폰 기반 이미징 설정(ACS Nano 7:9147)은 선택적인 온도 제어 모듈 및 시약 교환 시스템과 결합된다. 그러한 실시형태에서, 주로 사용되는 것은 전화 상의 카메라이지만, iPhone 또는 다른 스마트폰 장치의 조명 및 진동 능력과 같은 다른 양태도 사용될 수 있다.
도 20a 및 20b는 유동 셀(2004) 및 통합된 광학 레이아웃을 사용하여 본 명세서에 기술된 바와 같은 일시적인 프로브 결합의 이미징을 수행하기 위한 가능한 장치를 예시한다. 시약은 에어 갭(2022)에 의해 분리된 시약/완충액의 패킷(2008)으로 전달된다. 도 20a는 프리즘(2016)(예를 들어, TIRF 설정)을 통해 투과되는 결합 레이저 광(2014)을 통해 소멸파(2010)가 생성되는 실시예 레이아웃을 예시한다. 일부 실시형태에서, 반응의 온도는 통합된 열 제어(2012)에 의해 제어된다(예를 들어, 일 예에서 투명 기판(2024)은 전기적으로 결합되고 따라서 전반적인 기판(2024)의 온도를 변경하는 인듐 주석 산화물을 포함한다). 시약은 시약/완충액(2008)의 연속적인 흐름으로 전달된다. 격자, 도파관(2020) 또는 광자 구조는 레이저 광(2014)을 결합하여 소멸장(2010)을 생성하는 데 사용된다. 일부 실시형태에서, 열 제어는 공간을 커버하는 블록(2026)으로부터 이루어진다.
도 20a에 기술된 레이아웃의 양태는 도 20b에 기술된 레이아웃의 양태와 상호교환가능하다. 예를 들어, 대물형 TIRF, 광 가이드 TIRF, 콘덴서 TIRF가 대안으로 사용될 수 있다. 연속 또는 에어-갭 시약 전달은 일부 실시형태에서 주사기 펌프 또는 압력 구동 흐름에 의해 제어된다. 에어 갭 방법은 모든 시약(2008)이 모세관/튜빙(2102)(예를 들어, 도 21에 도시된 바와 같음) 또는 채널에 사전-장입되고 주사기 펌프 또는 압력 제어 시스템으로부터 밀거나 당김에 의해 전달되도록 허용한다. 에어-갭 방법은 모든 시약을 모세관/튜빙 또는 채널에 사전-장입되고 주사기 펌프 또는 압력 제어 시스템으로부터 밀거나 당김에 의해 전달되도록 허용한다. 에어 갭(2022)은 공기 또는 질소와 같은 기체 또는 수성 용액과 혼화할 수 없는 액체를 포함한다. 에어 갭(2022)은 또한 분자 다듬기뿐만 아니라 시약 전달을 수행하는 데 사용될 수 있다. 유체 장치(예를 들어, 유체 용기, 카트리지 또는 칩)는 폴리뉴클레오티드 이동억제화 및 선택적으로 연장이 수행되는 유동 셀 영역, 시약 저장, 유입구, 배출구 및 폴리뉴클레오티드 추출뿐만 아니라 소멸장을 형성하기 위한 선택적 구조를 포함한다. 일부 실시형태에서, 장치는 유리, 플라스틱 또는 유리와 플라스틱의 하이브리드로 만들어진다. 일부 실시형태에서, 열 및 전기 전도성 요소(예를 들어, 금속성)는 유리 및/또는 플라스틱 구성요소에 통합된다. 일부 실시형태에서 유체 용기는 웰이다. 일부 실시형태에서 유체 용기는 유동 셀이다. 일부 실시형태에서, 표면은 하나 이상의 화학 층, 생화학 층(예를 들어, BSA-비오틴, 스트렙타비딘), 지질 층, 하이드로겔 또는 겔 층으로 코팅된다. 그 다음 비닐실란에 코팅된 22x22mm 커버 유리(BioTechniques 45:649-658, 2008 또는 Genomic Vision으로부터 이용가능) 또는 클로로벤젠 용액에 1.5% Zeonex로 스핀-코팅된 커버 유리. 기판은 또한 2% 3-아미노프로필트리에톡시실란(APTES) 또는 폴리 라이신으로 코팅될 수 있으며, HEPES 완충액에서 pH 7.5-8에서 정전기적 상호작용을 통해 신장이 발생한다. 대안적으로, 실란 처리된 커버글라스를 비스-아크릴아미드 및 테메드를 함유하는 1-8% 폴리아크릴아미드 용액에 스핀- 또는 딥-코팅했다. 이를 위해서 뿐만 아니라 비닐실란 코팅된 커버글라스를 사용하여 코브 유리는 1시간 동안 아세톤에서 10% 3-메타크릴옥시프로필트리메톡시실란(바인드 실란, Pharmacia Biotech)(v/v)으로 코팅될 수 있다. 폴리아크릴아미드 코팅은 기술된 바와 같이 획득될 수도 있다(Liu Q 외 Biomacromolecules, 2012, 13(4), pp 1086-1092). 사용될 수 있는 다수의 하이드로겔 코팅이 Mateescu 외 Membranes 2012, 2, 40-69에 기술되어 있고 참고된다.
표적 핵산은 또한 교류(AC)(유전영동) 전기장을 적용함에 의해 아가로스 겔에서 연장될 수 있다. DNA 분자를 겔 안으로 전기영동하거나 DNA를 용융 아가로스와 혼합한 다음 아가로스로 고정할 수 있다. 그런 다음 약 10Hz의 주파수를 가진 AC 장이 인가되고 200 내지 400V/cm의 장 강도가 사용된다. 신장은 0.5 내지 3%의 아가로스 겔 농도 범위에서 수행될 수 있다. 일부 경우에 표면이 유로 또는 웰에서 BSA-비오틴으로 코팅된 다음 스트렙타비딘 또는 뉴트라비딘이 추가된다. 이 코팅된 커버글라스는 먼저 pH 7.5 완충액에서 DNA를 결합한 다음 pH 8.5 완충액에서 DNA를 신장시킴에 의해 이중 가닥 게놈 DNA를 신장시키는데 사용될 수 있다. 일부 경우에 스트렙타비딘으로 코팅된 커버글라스를 사용하여 핵산 가닥을 포획하고 이동억제화하지만 신장은 수행되지 않는다. 따라서, 한쪽 말단에는 핵산이 부착되어 있는 반면 다른 쪽 말단에는 용액에 매달려 있다.
GAIIx와 같은 광학 시퀀싱 시스템의 다양한 현미경-유사 구성요소를 사용하는 대신, 일부 실시형태에서, 시퀀싱을 위해 보다 통합된 모놀리식 장치가 구성된다. 이러한 실시형태에서, 폴리뉴클레오티드는 센서 어레이 상에 또는 센서 어레이에 인접한 기판 상에 직접적으로 부착되고 선택적으로 연장된다. 센서 어레이에 대한 직접 검출은 어레이에 대한 DNA 혼성화에 대해 입증되었다(예를 들어, Lamture 외, Nucleic Acid Research 22:2121-2125, 1994에 의해 기술된 바와 같음). 일부 실시형태에서, 센서는 형광 염료로부터의 방출에 비해 수명이 짧은 레일리 산란에 기인한 배경 형광을 감소시키기 위해 시간 게이팅된다.
일 실시형태에서, 센서는 CMOS 검출기이다. 일부 실시형태에서, 다중 방출 최대 파장이 검출된다(예를 들어, 미국 특허 출원 번호 2009/0194799에 기술된 바와 같음). 일부 실시형태에서, 검출기는 Foveon 검출기(예를 들어, 미국 특허 제6,727,521호에 기술된 바와 같음)이다. 일부 실시형태에서, 센서 어레이는 삼중-접합 다이오드의 어레이(예를 들어, 미국 특허 번호 9,105,537에 기술된 바와 같음)이다.
일부 실시형태에서, 시약/완충액은 단일 투여량으로 (예를 들어, 블리스터 팩을 통해) 유동 셀에 전달된다. 팩에서의 각 블리스터는 올리고뉴클레오티드의 올리고뉴클레오티드 프로브 종의 세트와 상이한 올리고뉴클레오티드 프로브 종을 함유한다. 올리고뉴클레오티드 프로브 종 간의 임의의 혼합 또는 오염 없이 제1 블리스터가 관통되고 표적 핵산이 그 내용물에 노출된다. 일부 실시형태에서, 일련의 다음 블리스터로 이동하기 전에 세정 단계가 적용된다. 이것은 올리고뉴클레오티드 프로브 종의 다른 세트를 물리적으로 분리하는 역할을 하고, 따라서 이전 세트로부터 올리고뉴클레오티드 프로브 종이 이미징 뷰에 남아 있는 배경 노이즈를 감소시킨다.
일부 실시형태에서, 시퀀싱은 세포가 배치되고/되거나 폴리뉴클레오티드가 추출된 동일한 장치 또는 모놀리식 구조에서 발생한다. 일부 실시형태에서, 방법을 수행하는 데 필요한 모든 시약은 분석이 시작되기 전에 유체 장치 상에 사전-장입된다. 일부 실시형태에서, 시약(예를 들어, 프로브)은 장치에 건조 상태로 존재하고 반응이 진행되기 전에 습윤되고 용해된다.
추가 실시형태
하나의 넓은 양태에서 본 발명은 하부적인 이벤트의 레퍼토리를 분석함에 의해 부수적인 정보를 획득하는 방법이다.
하나의 넓은 양태에서 본 발명의 범주는 분자의 하나 이상의 단위에 분자 프로브를 결합함에 의해 다중-단위 분자의 적어도 하나의 단위를 식별하는 방법을 포함한다. 발명은 분자와 분자 프로브의 하나 이상의 종의 단일 분자 상호작용의 검출에 기반한다. 일부 실시형태에서, 프로브는 분자의 적어도 하나의 단위에 일시적으로 결합한다. 일부 실시형태에서, 프로브는 분자의 적어도 하나의 단위에 반복적으로 결합한다. 일부 실시형태에서, 분자 실체는 나노미터 정확도(전형적으로 <250nm, 바람직하게는 <50nm, 보다 바람직하게는 <2nm)로 표면 또는 매트릭스 상에 국지화된다.
일부 실시형태에서, 발명은 다음을 포함하는 하나 이상의 프로브와 분자 사이의 상호작용을 특성화하는 방법을 포함한다:
프로브(들)가 분자에 일시적으로 결합할 수 있는 조건하에서 하나 이상의 프로브 종을 분자에 첨가하는 것
검출기 상에서 분자에 대한 개별 결합 이벤트를 지속적으로 모니터링하고 일정 기간 동안 기록하는 것
상호작용의 하나 이상의 특성을 결정하기 위해 단계 b로부터의 데이터를 분석하는 것
선택적으로, 분자는 단계 a 전에 표면 또는 매트릭스에 이동억제된다. 일부 실시형태에서, c의 검출기는 2D 또는 검출기이고 결합 이벤트는 예를 들어 단일 분자 국지화 알고리즘을 사용하여 표면 또는 매트릭스 상에서 나노미터 정확도로 국지화된다. 일부 실시형태에서, 특성은 분자와 프로브(들)의 친화도에 상응하는 각 이벤트의 지속시간이다. 일부 실시형태에서, 특성은 표면 또는 매트릭스 상의 장소이다.
일부 실시형태에서, 발명은 다음을 포함하는, 거대분자에서 복수의 부위에서 화학 구조를 식별하기 위해 복수의 프로브를 결합하는 것을 포함하는 이종의 거대분자에서 화학 구조의 단위를 식별하거나 특성화하는 방법을 포함한다:
a) 프로브(들)이 거대분자에 결합할 수 있는 조건하에서 하나 이상의 프로브 종을 거대분자에 첨가하는 것;
b) 검출기 상에서 거대분자에 대한 결합 이벤트를 지속적으로 모니터링하고 일정 기간 동안 기록하는 것; 및
c) 거대분자에서 복수의 부위에서 화학 구조를 식별하기 위해 단계 b로부터의 데이터를 분석하는 것.
선택적으로 거대분자는 단계 a 전에 표면 또는 매트릭스 상에 이동억제된다. 일부 실시형태에서, 거대분자는 초분자 구조를 포함한다. 일부 실시형태에서, 하나 이상의 프로브 각각은 거대분자에 일시적으로 결합한다. 일부 실시형태에서, 복수의 프로브 각각은 중합체에 반복적으로 결합한다.
일부 실시형태에서, 분자 실체는 적어도 5개의 단위를 포함하는 중합체이다. 일부 실시형태에서, 결합 프로브는 올리고뉴클레오티드, 항체, 결합 단백질, 소분자 등을 포함하는 분자 프로브이다. 전형적으로, 중합체는 폴리뉴클레오티드 또는 폴리펩티드를 포함한다.
일부 실시형태에서, 발명은 다음을 포함하는, 중합체를 따라 복수의 부위에서 화학 구조를 식별하기 위해 복수의 프로브를 결합하는 것을 포함하는 이종의 중합체에서 화학 구조의 단위를 식별하거나 특성화하는 방법을 포함한다:
a) 프로브(들)가 중합체에 결합할 수 있는 조건하에서 하나 이상의 프로브 종을 중합체에 첨가하는 것;
b) 검출기 상에서 중합체에 대한 결합 이벤트를 지속적으로 모니터링하고 일정 기간 동안 기록하는 것; 및
c) 중합체를 따라 복수의 부위에서 화학 구조를 식별하기 위해 단계 b로부터의 데이터를 분석하는 것.
일부 실시형태에서, 중합체는 단계 a 전에 표면 또는 매트릭스 상에 이동억제된다. 일부 실시형태에서, 중합체는 단계 a 전에 변성된다. 일부 실시형태에서, 하나 이상의 프로브 각각은 중합체에 일시적으로 결합한다. 일부 실시형태에서, 복수의 프로브 각각은 중합체에 반복적으로 결합한다. 일부 실시형태에서, 화학 구조의 단위를 식별하는 프로브 결합의 장소는 나노미터 (및 보증되는 경우 심지어 서브-나노미터) 정확도/정밀도(예를 들어, 단일 분자 국지화 알고리즘을 사용함)로 결정되고 이에 의해 "서열"은 각 장소에 결합하는 프로브의 정체성을 기반으로 결정된다.
국지화의 정확도 및 정밀도가 높은(서브 나노미터 또는 수 나노미터) 일부 실시형태에서 각 서열 비트의 장소 및 순서는 명확하게 결정된다. 그러나 서열 판독은 구두점 방식으로 비-연속적으로 나타난다. 대부분의 시퀀싱 방법이 서열을 처음부터 말단까지 일련으로 판독하는 경우, 발명에서 서열 정보의 획득은 확률적으로 분산된다. 모든 서열 데이터가 수집되면 그 공간적 장소에 따라 얻은 서열 정보의 비트를 순서대로 정렬함에 의해 서열이 함께 구성되어 각 서열 비트는 획득된 정보의 이전 및 다음 국지화된 서열 비트와 중첩되어야 하며, 예를 들어, 5mer에 대해 각각의 서열 비트는 한 쪽 말단에서 이전 서열 비트에 대해 4개 염기로, 다음 서열 비트를 갖는 다른 쪽 말단에 대해 4개 염기로 서열에서 중첩되어야 한다. 이것이 정확히 유지되지 않는 경우(예를 들어, 4개가 아닌 3개만 중첩) 서열 비트는 불일치로 인해 획득되었기 쉽거나 국지화가 약간 벗어났을 수 있다. 발명의 신규한 양태는 이 내부 검사 기전이 서열 비트의 올바른 순서를 해결하고 따라서 높은 신뢰도로 서열을 해결할 수 있어야 한다는 것이다.
일부 실시형태에서, 프로브 첨가의 각 주기의 지속시간은 각각의 상보적 결합 부위에 대해 특정 수의 결합 이벤트가 수집될 수 있도록 구성된다. 결합 이벤트의 수는 평균적으로 5, 10, 20 등이다. 일부 실시형태에서, 프로브 첨가의 각 주기의 지속시간은 각각의 상보적 결합 부위에 대해 특정 수의 광자가 수집될 수 있도록 구성된다. 각 결합에 대해 수집된 광자의 수가 많을수록 달성될 수 있는 국지화의 정도(정확도)와 정밀도가 양호하게 된다. 일부 실시형태에서, 상이한 프로브 또는 프로브 세트에 대한 지속시간은 상이하다. 따라서, 일부 프로브는 높은 정밀도로 국한될 수 있지만, 다른 프로브는 더 낮은 정밀도로 국한될 수 있다. 일부 실시형태에서, 고도로 국지화된 위치는 서열 어셈블리를 앵커링하는 데 사용될 수 있으며, 여기서 보다 덜 국지화된 위치는 서열에서의 중첩에 의해 계산적으로 어셈블리된다. 일부 실시형태에서, 국지화된 위치(보다 덜 국지화된 위치를 포함함)는 드 브루인 그래프를 사용하는 것과 같은 어셈블리 알고리즘에서 사용될 수 있다.
일부 실시형태에서, 프로브는 표지된다. 표지이라는 용어는 단일 검출가능한 실체(예를 들어, 파장 방출 실체) 또는 다중 검출가능한 실체를 포괄한다. 일부 실시형태에서, 다중 검출가능한 실체는 프로브 종이 식별될 수 있는 코드를 포함할 수 있다. 일부 실시형태에서, 프로브는 형광단 또는 입자로 표지된다. 형광 표지는 다른 파장에서 형광을 방출할 수 있고 또한 수명이 다르다. 일부 실시형태에서, 배경 형광은 산란으로 인한 형광의 초기 시간 창을 거부함에 의해 제거된다. 표지가 프로브의 한쪽 말단, 예를 들어, 올리고 프로브의 3' 말단 상에 있는 경우 1nm 정확도는 프로브 서열의 3' 말단 및 표적 서열의 5' 말단에 상응한다.
일부 실시형태에서, 중합체의 시퀀싱은 프로브의 레퍼토리와의 그 일시적인 상호작용, 예를 들어 올리고뉴클레오티드의 레퍼토리와 폴리뉴클레오티드의 상호작용을 측정하는 것에 기반한다. 일부 실시형태에서, 레퍼토리는 주어진 길이 또는 주어진 길이의 세트의 모든 올리고뉴클레오티드를 포함하였다.
일부 실시형태에서, 발명은 다음을 포함하는 단일 표적 폴리뉴클레오티드 상의 뉴클레오티드 염기 및/또는 변형을 시퀀싱하는 방법을 포함한다:
a) 표면 또는 매트릭스 상에 폴리뉴클레오티드를 이동억제화하고, 선택적으로 폴리뉴클레오티드를 신장시키는 것;
b) 선택적으로 폴리뉴클레오티드의 적어도 일부가 프로브에 결합할 수 있게 되는 정도로 폴리뉴클레오티드를 변성시키는 것;
c) 프로브(들)가 폴리뉴클레오티드에 일시적으로 결합할 수 있는 조건하에서 하나 이상의 프로브 종을 첨가하는 것;
d) 검출기 상의 폴리뉴클레오티드에 대한 결합 이벤트를 연속적으로 모니터링하고 일정 기간 동안 기록하는 것;
e) b의 프로브를 제거하는 것;
f) 프로브의 완전한 레퍼토리의 결합이 모니터링될 때까지 상이한 하나 이상의 프로브 종으로 매번 단계 b-d를 반복하는 것; 및
g) 변형 및/또는 염기의 서열을 재구성하기 위해 단계 c의 각 반복으로부터 데이터를 축적하는 것.
일부 실시형태에서, 중합체의 시퀀싱은 프로브 종의 레퍼토리의 일시적인 결합 상호작용의 출현 특성의 결과이다. 하나의 프로브의 결합은 올리고머의 완전한 완벽한 레퍼토리(예를 들어, 폴리뉴클레오티드의 경우 올리고뉴클레오티드의 레퍼토리)가 필요한 중합체를 시퀀싱하기에 충분하지 않다. 올리고의 결합의 장소, 중첩하는 부위에 일시적으로 분리된 결합, 불일치의 부분적 결합, 결합의 빈도, 결합의 지속시간에 대한 정보는 모두 강력한 서열을 구축하는 데 기여한다. 연장되거나 신장된 폴리뉴클레오티드의 경우, 폴리뉴클레오티드의 길이를 따라 결합하는 프로브의 장소는 강력한 서열을 구축하는 데 기여한다. 또한 이중-가닥 DNA의 경우 듀플렉스의 두 가닥을 동시에 시퀀싱하여 서열이 출현한다.
상기 중 일부 실시형태에서, 중합체의 반복 단위(폴리뉴클레오티드 내의 뉴클레오티드) 상의 변형에 대한 프로브의 결합은 b의 선택적 변성 단계 전에 수행된다. 일부 실시형태에서, 단계 b의 선택적 변성은 수행되지 않고 프로브는 듀플렉스 구조를 다룬다. 일부 경우에 프로브는 가닥 침입(예를 들어, PNA 프로브를 사용함)을 통해 듀플렉스의 개별 가닥에 결합하여, 변형된 징-핑거 단백질을 통해 듀플렉스의 서열을 인식하거나 Cas9 또는 예를 들어 가이드 RNA 서열이 결합하도록 허용하는 듀플렉스를 용융시키는 유사한 단백질을 사용함에 의해 듀플렉스의 과도한 휴지를 유도한다; 가이드 RNA는 조사 프로브 서열을 포함할 수 있고, 레퍼토리의 각 서열을 포함하는 gRNA가 제공된다.
상기에 대한 발명 특허권 보호 신청은 일부 실시형태에서, 예를 들어 레퍼토리에서 다른 프로브 또는 폴리뉴클레오티드로 그 자체로 문제적인 상호작용(예를 들어, 자체 상보성, 자체의 다른 카피와의 결합을 허용하는 회문 서열)으로 인해 특정 프로브가 레퍼토리에서 생략될 수 있지만(예를 들어, 알려진 확률론적 무차별 결합) 본 발명의 시퀀싱을 수행하기에 충분한 프로브가 남아 있다는 것이다. 실제로 분석하에 있는 각 유형의 서열에 대해 최소 수의 정보용 프로브가 결정될 수 있다. 또 다른 발명 특허권 보호 신청은 전체 레퍼토리의 절반이 레퍼토리에서 다른 올리고에 완전히 상보적이다; 일부 실시형태에서, 이들 상보적 쌍 (및 실질적인 상보성으로 인해 문제가 되는 다른 쌍)이 동시에 폴리뉴클레오티드에 추가되지 않는 것이 보장된다; 일부 실시형태에서, 이중 가닥 DNA의 센스 및 안티센스 가닥 둘 모두가 존재하는 경우, 상보적 쌍의 단 하나의 구성원으로 시퀀싱이 수행되고 센스 및 안티센스 가닥 둘 모두로부터 획득된 서열 정보는 조합되어 서열을 생성한다는 사실에 관한 것이다.
일부 실시형태에서, (천연 이중 가닥인 표적의) 상보적 가닥에 대해 획득된 참조 서열 및 서열 정보는 특정 장소에서 서열의 할당을 용이하게 하기 위해 사용될 수 있다.
발명의 일부 실시형태에서 시퀀싱은 다음 단계를 포함한다(5개 염기 시퀀싱에 대해 예시됨):
a) 표면 상에 듀플렉스 DNA를 신장/연장시키는 단계;
b) 듀플렉스 DNA를 변성시켜 표면 상에 제자리에 남아 있는 상보적 가닥의 쌍을 남기는 단계;
c) 짧은 올리고(예를 들어, 3, 4, 5, 6-mer)의 완전한 레퍼토리를 DNA 가닥의 쌍에 결합하고 가닥 쌍의 선형 길이를 따라 각 올리고의 결합 장소를 기록하는 단계;
d) 2개 가닥의 각각에 대한 상보체를 나타내는 올리고의 2개 타일링 경로를 구성하기 위해 올리고 간의 결합의 장소 및 서열 중첩을 사용하는 단계; 및
e) 두 가닥의 역 상보체 서열을 비교하고 양 가닥에 의해 할당이 확증되고 확증이 발견되지 않은 경우 염기 호출에서의 모호성이 표시되는 '듀플렉스 컨센서스' 유도된 염기 할당을 만드는 단계.
타일링 경로에 중단이 있는 경우, 예를 들어 5개 염기 시퀀싱의 경우 길이가 5개 염기보다 긴 서열의 신장에 대한 올리고 결합이 없는 경우 문제가 발생할 수 있다. 이 경우 하나 이상의 접근방식을 취할 수 있다: 염기 할당은 이용가능한 경우 듀플렉스의 상보적 가닥에서 획득된 서열을 따르고; 이용가능하다면 동일한 서열 세그먼트의 다른 카피에 의존하고; 또는 참조 서열을 따른다(이 경우 염기는 참조에서 인공적으로 이식되었음을 나타내기 위해 주석을 달 수 있음).
일부 실시형태에서, 인공 지능 또는 기계 학습은 공지된 서열의 중합체(예를 들어, 폴리뉴클레오티드)에 대해 테스트될 때 및/또는 폴리뉴클레오티드의 서열이 다른 방법의 데이터로 교차-검증될 때 레퍼토리 구성원의 거동을 학습하는 데 사용된다. 학습 알고리즘은 하나 이상의 조건 또는 상황에서 프로브에 대한 결합 부위를 함유하는 하나 이상의 폴리뉴클레오티드 표적에 대한 특정 프로브의 전체 거동을 고려한다. 동일하거나 다른 샘플에 대해 더 많은 시퀀싱이 수행될수록 기계 학습으로부터의 지식이 더욱 강력해진다. 기계 학습으로부터 학습된 것은 다양한 다른 검정, 특히 올리고와 올리고/폴리뉴클레오티드의 상호작용을 포함하는 것들, 예를 들어, 일시적인 결합-기반 긴급 시퀀싱 및 본 발명의 다른 실시형태에 부가하여 혼성화에 의한 시퀀싱에 적용될 수 있다.
일부 실시형태에서, 인공 지능 또는 기계 학습은 알려진 서열의 하나 이상의 폴리뉴클레오티드에 대한 짧은 올리고(예를 들어, 3mer, 4mer, 5mer, 또는 6mer)의 완전한 레퍼토리의 결합에 대해 실험적으로 획득된 결합 패턴의 데이터를 제공함에 의해 훈련된다. 각 올리고에 대한 훈련 데이터는 결합 장소, 결합의 지속시간 및 주어진 기간 동안의 결합 이벤트의 수를 포함한다. 이 훈련 후 기계 학습 알고리즘은 결정되어 지는 서열의 폴리뉴클레오티드에 적용되고 그 학습을 기반으로 폴리뉴클레오티드의 서열을 어셈블리할 수 있다. 기계 학습 알고리즘은 또한 참조 서열에 제공될 수 있다.
일부 실시형태에서, 서열 어셈블리 알고리즘은 기계 학습 요소와 비-기계 학습 요소 둘 모두를 포함한다.
일부 실시형태에서, 서열 어셈블리 알고리즘은 베이지안 접근방식을 포함한다. 일부 실시형태에서, 발명의 방법으로부터 유도된 데이터는 (WO2010075570)에 기재된 유형의 알고리즘에 제공될 수 있고, 선택적으로 다른 유형의 게놈 또는 시퀀싱 데이터와 조합될 수 있다.
일부 실시형태에서, 실험적으로 획득된 결합 패턴으로부터 학습하는 컴퓨터 알고리즘 대신에, 결합 패턴은 시뮬레이션을 통해 획득된다. 예를 들어, 알려진 서열의 폴리뉴클레오티드에 대한 레퍼토리의 올리고의 일시적인 결합의 시뮬레이션이 수행될 수 있다; 시뮬레이션은 실험 또는 공개된 데이터에서 얻은 각 올리고의 거동 모델을 기반으로 할 수 있다. 예를 들어 결합 안정성의 예측은 최근접 이웃 방법[SantaLucia 외 Biochemistry 35, 3555-3562 (1996); Breslauer 외 Proc. Natl. Acad. Sci. USA, 83: 3746-3750 (1986)]에 따라 이용가능하고 불일치 거동이 알려져 있거나 실험적으로 유도될 수 있으며, GGA 대 ACC와 같은 올리고의 일부 짧은 하위-서열의 지나치게 높은 결합 강도가 알려져 있다. 기계 학습 알고리즘은 시뮬레이션된 데이터에 대해 훈련된 다음 짧은 올리고의 완전한 레퍼토리에 의해 조사될 때 알려지지 않은 서열의 서열을 결정하는 데 사용할 수 있다.
일부 실시형태에서, 레퍼토리 또는 패널의 올리고의 데이터(장소, 결합 지속시간, 신호 강도 등)는 알려진 서열 중 바람직하게는 하나 이상(수십, 수백 또는 수천)에 대해 훈련된 기계 학습 알고리즘 안으로 플러깅된다.
그런 다음 기계 학습 알고리즘을 적용하여 문제의 서열에서 데이터-세트를 생성하고 기계 학습 알고리즘은 문제의 미지의 서열의 서열을 생성한다. 하등 유기체, 예를 들어, 박테리아, 박테리오파지 등의 시퀀싱을 위한 알고리즘의 훈련은 그 유형의 유기체에 대해 수행해야 한다. S. 폼베와 같은 효모에서 시작하여 반복적인 DNA를 갖는 인간 또는 밀에 이르기까지 고등 유기체에 대해서도 고등 유기체에 대한 훈련이 필요하다. 메가베이스 단편을 전체 염색체 길이로 긴-범위 어셈블리하려면 유사한 유기체에 대해 훈련을 수행해야 할 수 있으므로 훈련 동안 게놈의 특정 양태가 표시된다. 예를 들어 인간 게놈은 이배체이고 많은 부분 복제를 갖는다. 밀은 배수체이다.
일부 실시형태에서, 기계 학습 기반 서열 재구성 접근방식은 다음을 포함한다:
a) 하나 이상의 훈련 데이터-세트로부터 수집된 레퍼토리에서 각 올리고의 결합 거동에 대한 정보 및 그러한 정보를 사용할 수 있는 어셈블리 알고리즘을 제공하는 것;
b) 레퍼토리의 각 올리고를 서열이 결정되어야 하는 폴리뉴클레오티드에 물리적으로 결합하고 결합 장소, 및/또는 결합 지속시간 및/또는 각 올리고에 대한 각 장소에서 결합이 발생하는 횟수(결합 반복의 지속성)에 대한 정보를 제공하는 것; 및
c) 훈련 데이터-세트를 사용하는 어셈블리 알고리즘을 사용하여 폴리뉴클레오티드의 서열을 재구성하는 것.
인간 게놈의 경우 양호한 기본 규칙 게놈은 NA12878이며, 이는 다양한 시퀀싱, 단상형 및 구조적 매핑 방법에 의해 광범위하게 특징지어지고 그 어셈블리는 모든 인간 게놈 중에서 가장 신뢰할 수 있다. 그럼에도 불구하고, 지금까지 본 발명자들이 복잡한 게놈의 진정한 표현을 본 발명자들에게 제공한다고 확신할 수 있는 완벽한 기술이 없기 때문에 그러한 게놈에 대해 이용할 수 있는 실측 자료 데이터 세트는 완벽하지 않을 수 있고 기계 학습 알고리즘은 대안적인 "실측 자료" 또는 "평균" 또는 "합의" 실측 자료는 Illumina 시퀀싱과 조합하여 다른 기술(예를 들어, 10X Genomics, Bionanogenomics, PacBio, ONT)을 사용한 어셈블리에서 사전-구성된다는 것을 고려해야 할 필요가 있을 수 있다.
일부 실시형태에서, 특정 실험의 서열은 먼저 비-기계 학습 알고리즘에 의해 처리된다. 그런 다음 제1 알고리즘의 출력 서열은 기계 학습 알고리즘을 훈련하는 데 사용되어, 훈련은 동일한 정확한 분자의 실제 실험적으로 유도된 서열에서 발생한다. 기계 학습 알고리즘의 이점은 다른 알고리즘보다 빠르게 구현될 수 있다는 것이다.
일부 실시형태에서, 발명은 중합체를 따라 복수의 부위에서 화학 구조를 식별하기 위해 복수의 프로브를 결합하는 것을 포함하는 이종의 중합체에서 화학 구조의 단위를 식별하고 정렬하는 방법을 포함한다. 복수의 상기 부위는 회절 제한 광학 이미징에 의해 분해될 수 있는 것보다 더 가깝지만 그의 검출이 시간적으로 분리되기 때문에 분해된다. 화학 구조를 식별하는 프로브의 결합은 필요에 따라 나노미터/서브-나노미터 국지화 정확도/정밀도로 결정되며, 이에 의해 화학 구조의 공간적 순서인 "서열"이 결정된다.
추가 실시형태에서, 특성화되거나 서열화된 복수의 중합체는 회절 제한 광학 이미징에 의해 분해될 수 있는 것보다 더 가깝지만 그 길이를 따라 결합하는 프로브의 장소가 나노미터적으로 국지화되어 있기 때문에 분해된다.
일부 실시형태에서, 발명은 중합체를 연장하고 연장된 중합체를 따라 복수의 부위에서 화학 구조를 식별하기 위해 복수의 프로브를 결합하는 것을 포함하는 이종의 중합체에서 화학 구조의 단위를 식별하고 정렬하는 방법을 포함한다. 복수의 상기 부위는 회절 제한 광학 이미징에 의해 분해될 수 있는 것보다 더 가깝지만 중합체가 연장되고/되거나 그의 표지화가 잠정적으로 분리되기 때문에 분해된다. 각 화학 구조를 식별하는 프로브의 결합 장소는 나노미터 정확도로 결정되고 이에 의해 화학 구조의 공간적 순서인 "서열"이 결정된다.
일부 실시형태에서, 발명은 표적 폴리뉴클레오티드 상의 염기 서열을 분석하는 방법을 포함한다. 일부 실시형태에서, 발명은 표적 폴리뉴클레오티드 상의 염기 서열뿐만 아니라 뉴클레오티드 변형 또는 DNA 손상을 분석하는 방법을 포함한다. 일부 실시형태에서, 발명은 표적 폴리뉴클레오티드 상의 서열의 조직화를 분석하는 방법을 포함한다.
"일시적인 결합"이라는 용어는 결합 시약 또는 프로브가 분석의 과정 동안 통상적으로 그 결합 부위에 부착된 상태로 남아 있지 않고, 전형적으로 하나의 시약이 온 및 오프 결합한 다음 동일한 또는 상이한 시약이 온 및 오프 결합하는 등을 의미한다. 반복적 결합은 분석의 과정 동안 동일한 결합 부위가 동일한 결합 시약 또는 프로브 또는 동일한 종의 결합 시약 또는 프로브에 의해 여러 번 결합되고 전형적으로 하나의 시약이 온 및 오프 결합한 다음 다른 시약이 온 및 오프 결합하는 등을 의미한다. 일부 실시형태에서, 결합 상호작용은 일정 기간에 걸쳐 연속적으로 관찰된다.
일부 실시형태에서, 반복적인 결합은 획득된 정보의 감도 및 정확도를 증가시킨다. 신호가 너무 낮아서 한 번 감지되면 배경을 호출할 수 없는 경우 지속적으로 볼 때 호출가능하므로 민감도가 증가한다 - 신호가 실제라는 신뢰도가 증가된다. 정보의 다중 판독이 하나의 판독을 다른 판독과 함께 확인하기 때문에(양 가닥을 유사하게 판독하면 하나의 판독을 다른 판독으로 확인할 수 있음) 정확도가 증가한다.
일부 실시형태에서, 방법의 기전은 표적 분자에 대한 프로브 분자의 결합을 포함하며, 이러한 결합 이벤트는 수명이 짧거나 일시적이고, 많은 이러한 결합 이벤트는 동일한 장소 및/또는 부분적으로 중첩되는 장소에서 반복적으로 발생한다. 이러한 결합 이벤트의 장소, 빈도, 체류 시간 및 광자 방출이 기록되고 계산으로 처리된다.
일부 실시형태에서, 일시적인 결합은 소량의 2가 양이온을 갖지만 1가 양이온이 없는 완충액, 예를 들어 5mM Tris-HCl, 10mM MgCl2, 1mM EDTA, 0.05% 트윈-20, pH 8에서 수행된다.
따라서 폴리뉴클레오티드 시퀀싱은 다음 단계를 포함한다:
a) 폴리뉴클레오티드를 이동억제화하는 단계;
b) <1, <5, 10 또는 15nM의 염화마그네슘을 함유하는 반응 완충액에서 폴리뉴클레오티드에 올리고의 레퍼토리 또는 서브-레퍼토리를 결합하는 단계;
c) 일시적인 결합을 검출하는 단계
d) 필요에 따라 b-c를 반복하는 단계.
폴리뉴클레오티드 서열의 어셈블링
일부 실시형태에서, 분자가 이동억제화되는 고체 기재는 유리, 실리콘, 이산화규소, 질화규소, 금속(예를 들어, 금), 폴리디메톡시실란(PDMS), 중합체(예를 들어, 환형 올레핀, Zeonex, 폴리 메틸 메타크릴레이트, 폴리스티렌)를 포함한다. 일부 실시형태에서, 고체 표면은 예를 들어 폴리비닐실란으로 코팅된다. 일부 실시형태에서, 중합체는 분자 다듬기에 의해 폴리비닐 코팅된 표면 상에 신장된 다음 자외선 또는 고온에 노출되어 표면에 가교결합된다.
일부 실시형태에서, 발명은 표면 또는 매트릭스와 다중 상호작용을 형성하는 연장된 중합체에 대한 레퍼토리의 각 구성원의 결합 장소를 결정하는 것을 포함한다. 일부 실시형태에서, 결합 장소는 그의 결합이 잠정적으로 분리되는 경향이 있기 때문에 결합의 부위가 중첩될 수 있지만 서로의 결합을 현저하게 방해하지 않는 반복적 일시적인 온-오프 프로브 결합 이벤트를 검출함에 의해 결정된다. 프로브가 더 오랜 기간 동안 결합된 경우 하나의 결합이 다른 것의 결합을 차단한다.
일부 실시형태에서, 레퍼토리는 완전한 레퍼토리, 예를 들어 주어진 길이의 모든 올리고이다. 일부 실시형태에서, 그것은 올리고 프로브의 타일링 시리즈이다. 일부 실시형태에서, 그것은 올리고 프로브의 패널이다. 예를 들어, DNA 데이터 저장과 같은 합성 생물학에서 특정 응용의 경우, 시퀀싱은 데이터를 인코딩하도록 설계된 서열의 특정 블록의 순서를 찾는 것을 포함할 수 있다.
일부 실시형태에서, 방법의 기전은 표적 분자에 대한 프로브 분자의 결합을 포함하며, 이러한 결합은 표지로 인해 검출가능하고, 상기 표지는 그의 방출 또는 광-스위칭 오프 및/또는 온에서 일시적으로 결합하거나, 깜박이거나, 변동하고, 그리고 많은 이러한 결합 이벤트는 동일한 장소 및/또는 하나 이상의 부분적으로 중첩하는 장소에서 반복적으로 발생할 수 있다. 이러한 결합 이벤트의 장소와 지속시간이 기록되고 처리된다. 일부 실시형태에서, 표지의 명백한 일시적, 변동 또는 깜박임 거동은 표지가 표적으로부터 온 및 오프 결합하는 프로브에 부착되기 때문이다.
일부 실시형태에서, 표적에 결합하는 프로브는 직접적으로 표지되지 않는다. 일부 이러한 실시형태에서, 프로브는 제2 실체의 결합에 대한 수용체로서 작용하는 실체인 "플랩"을 함유한다. 두 실체는 분자 결합 쌍을 포함할 수 있다. 이러한 결합 쌍은 핵산 결합 쌍을 포함할 수 있다. 일부 실시형태에서, 플랩은 표지된 올리고뉴클레오티드(올리고)에 결합하는 올리고- 또는 폴리-뉴클레오티드 서열의 신장을 포함하고, 이러한 결합은 표적에 결합하는 프로브의 부분의 일시적인 결합을 이미징하는 과정 동안 실질적으로 안정하다. 일부 실시형태에서, 표적은 폴리뉴클레오티드 서열을 포함하고 프로브의 결합 부분은 예를 들어 3mer 또는 4mer, 또는 5mer 또는 6mer 서열 조사 부분, 선택적으로 하나 이상의 축퇴 또는 보편적 위치, 선택적으로 뉴클레오티드 스페이서(예를 들어, 하나 이상의 T 뉴클레오티드) 또는 무염기성 또는 비-뉴클레오티드 부분 및 플랩 부분을 포함한다. 이러한 플랩 부분은 서열이 비-변형되고 이미징 과정 동안 안정성을 유지하기 위해, 예를 들어 안정하도록 설계된 서열 및 바람직하게는 표적 폴리뉴클레오티드에서 드물게 스크리닝되는 서열을 갖는 길이가 20개 염기이거나 더 길다.
일부 실시형태에서, 프로브의 레퍼토리가 표적에 적용된다. 일부 실시형태에서, 레퍼토리의 프로브 각각 또는 레퍼토리의 프로브의 서브-세트가 차례로 적용되고; 즉, 하나 또는 서브-세트의 결합이 먼저 검출된 다음 제거되고 나서 다음이 추가, 검출 및 제거되고 나서 다음이 계속되는 식이다. 그 다음 데이터는 각 특이성의 프로브의 각 프로브 결합 이벤트의 나노미터 또는 서브-나노미터 국지화를 제공하도록 처리된다. 일부 실시형태에서, 각 프로브 특이성의 결합 순서 및/또는 장소는 서열을 함께 합치는데 사용된다.
일부 실시형태에서, 레퍼토리 내의 결합 프로브의 전부 또는 서브-세트가 동시에 추가되고 각 결합 프로브는 그의 정체성을 완전히 또는 부분적으로 코딩하는 표지에 묶이고 각각의 결합 프로브에 대한 코드는 검출에 의해 디코딩된다.
일부 실시형태에서, 프로브 상의 플랩은 모듈식이고, 이러한 올리고는 상이한 표지와 같은 상이한 올리고에 대한 결합 부위를 함유할 수 있고, 올리고의 프로브 부분의 정체성을 코딩하는데 사용된다.
일부 실시형태에서, 핵산 표적은 표면 또는 매트릭스에 부착된다. 일부 이러한 실시형태에서, 표적의 일 말단은 표면 또는 매트릭스에 부착되는 반면 표적의 나머지는 상호작용을 위해 자유로워진다. 일부 실시형태에서, 표적은 정렬된 초분자 스캐폴드(예를 들어, DNA 오리가미 구조) 상에 포획된다. 일부 실시형태에서, 스캐폴드 구조는 표적 분자를 포획하기 위한 용액 상 동역학을 이용하기 위해 용액에서 자유로이 시작된다. 일단 그들이 점유되면, 스캐폴드는 표면 상에 정착하거나 자가-조립되고 큰 DNA 격자를 형성하기 위해 잠겨지고, 개별적인 작은 스캐폴드는 서로 잠겨된다. 그런 다음 그것은 발명의 시퀀싱 단계를 위해 고도로 정렬된 나노구조 어레이를 제시한다.
일부 실시형태에서, 비-특이적 결합 또는 이상치 이벤트의 효과를 회피하기 위해, 방법은 신호의 장소 및 지속성에 기반하여 신호의 우선순위를 정한다. 장소에 기인한 우선순위는 격자 구조 내의 장소를 포함하여 프로브가 예를 들어 신장된 중합체 또는 초분자 격자(예를 들어, DNA 오리가미 격자) 상에 공동-국지화되는지 여부에 따라 단정했다. 결합의 지속성에 기인한 우선순위는 결합의 지속기간 및 결합의 빈도와 관련이 있으며 우선순위 목록을 사용하여 전체 일치 부분 일치 또는 비-특이적 결합의 가능성을 결정한다. 패널 또는 레퍼토리의 각 결합 프로브에 대해 설정된 이 우선순위는 신호의 정확성을 결정하는 데 사용된다. 우선순위는 신호 검증 및 염기 콜을 용이하게 하기 위해 본 발명의 알고리즘에 의해 사용된다. 일부 실시형태에서, 알고리즘은 다음 조사를 포함한다:
1. 신호 지속 시간 > 역치인가. 그렇다면 실제로 수용한다.
2. 신호 반복/빈도 > 역치인가. 그렇다면 실제로 수용한다.
3. 신호가 패턴(격자 또는 선)과 상관 관계가 있는가. 그렇다면 실제로 수용한다.
그렇지 않으면 이 신호에 대한 데이터를 폐기한다. 1과 2에 대한 대안으로 알고리즘은 수집된 광자의 수가 > 역치인지 물을 수 있다.
또한 가역적으로 나타나지 않는 신호는 비-특이적 신호(예를 들어, 표면에 형광성 오염물질의 부착)에 대응할 수 있기 때문에 어셈블리 알고리즘에서 폐기되거나 그에 대한 가중치가 적용될 수 있다.
일부 실시형태에서, 발명은 다음을 포함하는 단일 표적 폴리뉴클레오티드에 대한 뉴클레오티드 변형 및/또는 염기를 시퀀싱하는 방법을 포함한다:
표면 상에 폴리뉴클레오티드를 이동억제화하고 선형화하는 것
프로브(들)가 일시적으로 결합하고 표적 부위에 대한 프로브 결합이 비-표적 부위에 대한 프로브 결합과 구별될 수 있는 조건하에서 하나 이상의 표지된 프로브 종을 첨가하는 것
각 장소에서 결합 이벤트의 역치 수(요구된 국지화에서의 정밀도에 의존함)가 누적될 때까지 2D 검출기에서 폴리뉴클레오티드를 연속적으로 이미징하고 프로브 결합의 픽셀 좌표를 기록하는 것
b의 프로브를 제거하는 것.
상이한 하나 이상의 프로브 종으로 매번 단계 b-d를 반복하는 것
프로브가 지속적으로 결합하는 결합 부위 각각의 나노미터 좌표(예를 들어, 결합 부위에 대한 4개 이상의 결합 이벤트)를 제공하기 위해 단일 분자 국지화 알고리즘을 사용하여 단계 c의 각 반복으로부터의 데이터를 축적하고 나노미터적으로 국지화된 부위를 프로브 종의 정체성(예를 들어, 특정 올리고뉴클레오티드 서열 또는 특정 항체)과 상관시키는 것.
폴리뉴클레오티드의 길이에 걸쳐 뉴클레오티드 변형 및/또는 염기 서열을 축적하기 위해 서브-나노미터 또는 나노미터 장소의 각각과 연관된 서열 정체성 (및 변형 상태)을 결정하기 위해 결합 종의 순서(서열)를 결정하고 폴리뉴클레오티드의 길이에 걸쳐 임의의 갭을 검출하는 것.
일부 실시형태에서, 추가 단계가 단계 g 전에 구현되며, 여기 단계에서 그 결합 장소의 각각에 대한 특정 프로브 종의 지속시간 및/또는 지속성뿐만 아니라 어느 프로브가 인접 장소 및 표적이 변성된 이중-가닥인 경우 상보적 가닥에 결합되었는지는 결합 이벤트가 완벽한 일치, 불일치 또는 가짜 결합인지 여부를 결정하는 것을 고려하여 된다.
일부 실시형태에서, 일 유형의 결합의 표적(예를 들어, 항원)과 다른 것(예를 들어, 서열)과의 상관관계를 결정하는 것에 대한 단계 h가 추가될 수 있다.
일부 실시형태에서, 단계 b의 프로브는 시약 교환에 의해 제거된다. 선택적으로 먼저 프로브는 하나 이상의 세정 용액으로 교체된 다음 프로브의 다음 세트가 추가된다.
일부 실시형태에서, 단계 c에서 (온-오프 결합 이벤트의) 이미징은 결합 이벤트의 역치 수가 축적될 가능성이 충분히 있기에 긴 기간 동안 실행된다.
일부 실시형태에서, 방법은 2D 검출기 상에서 폴리뉴클레오티드를 연속적으로 이미징하는 것과, 각 장소에서 결합 이벤트의 역치 수가 누적될 가능성이 있을 때까지 프로브 결합의 픽셀 좌표를 기록하는 것을 포함한다.
일부 실시형태에서, 이미징 지속시간의 기간은 요구된 국지화 정확도(예를 들어, 나노미터 또는 서브-나노미터)에 의존한다. 10nM 이하 또는 서브-나노미터 국지화를 얻기 위해서 이미징이 더 오래 실행될 필요가 있을 수 있다. 일부 실시형태에서, 이미징 지속기간은 어떤 짧은 신장의 서열(서열 비트)이 어느 프로브에 의해 결합되는지에 관해 요구된 신뢰도의 정도에 의존한다. 더 오래 실행하면 정확한 일치에 대한 신뢰도가 높아질 것이고 가짜 또는 불일치 결합이 계산적으로 필터링될 수 있다.
일부 실시형태에서, 본 발명의 표적 폴리뉴클레오티드는 이동억제된다. 일부 실시형태에서, 이동억제화는 구조적 지지체(예를 들어, 평면 표면, 세포 매트릭스) 상에 있다. 일부 실시형태에서, 표적 폴리뉴클레오티드는 웰 또는 유동 셀과 같은 유체 용기에 배치된다.
일부 실시형태에서, 이중 가닥 게놈 DNA를 이동억제화 및 선형화하는 것과 표면 상의 일시적인 결합을 위한 준비는 다음을 포함한다:
a) 분자 다듬기;
b) UV 가교결합;
c) 선택적 습윤;
d) 화학적 변성제, 알칼리 용액, DMSO 등에 대한 노출을 포함하는 변성;
e) 세정 후 산성 용액에 대한 선택적 노출;
f) 선택적인 사전-컨디셔닝 완충액;
일부 실시형태에서, 중합체는 <1Kbp 또는 <300bp인 짧은 폴리뉴클레오티드이다. 일부 실시형태에서, 짧은 폴리뉴클레오티드는 소변 및 혈액과 같은 체액에서 무세포 DNA에 대해 발견되는 바와 같이 100-200 염기 범위에 있다. 일부 실시형태에서, 폴리뉴클레오티드는 바람직하게는 2개의 말단 중 하나에 의해 표면 상에 부착되거나 포획된다. 일부 실시형태에서, 폴리뉴클레오티드는 나노구조 격자에서 정렬된 방식으로 포획된다. 격자는 DNA 오리가미로 형성될 수 있는 것과 같은 초분자 구조로 구성된다. 포획 부위는 정렬된 2D 격자에서 10nm 피치로 배열될 수 있다; 전체 점유로 그러한 격자는 cm2당 1조 분자를 포착할 수 있었다.
일부 실시형태에서, 중합체는 선형화된다. 일부 실시형태에서, 선형화는 표면 상의 물결 모양 또는 구불구불한 경로를 따라 중합체를 렌더링한다. 다른 실시형태에서 중합체는 연장되고 직선형이다. 일부 실시형태에서, 직선형 중합체는 단일 방향으로 정렬된다. 일부 실시형태에서, 중합체는 연장되지 않고 2D 또는 3D 공간을 통해 구불구불한 경로를 형성할 수 있다. 후자는 방법을 세포 내부의 생체고분자에 적용한 경우이다.
일부 실시형태에서, 폴리뉴클레오티드는 표면 또는 매트릭스 상에 무작위로 배열된다. 일부 실시형태에서, 폴리뉴클레오티드는 정렬된 방식으로 배열된다. 일부 실시형태에서, 폴리뉴클레오티드는 DNA 커튼으로 디스플레이된다[Greene 및 동료; US20080274905A1]. 이러한 실시형태에서, 일시적인 결합은 한쪽 말단에 부착된 DNA 가닥이 흐름 또는 전기영동력에 의해 연장되는 동안 또는 가닥의 양 말단이 포획된 후에 기록된다. 일부 실시형태에서, 한쪽 말단 또는 양쪽 말단에서의 포획은 커튼이 연장되는 표면 또는 계면 상의 공간적으로 어드레스할 수 있는 올리고에 대한 결합 또는 결찰에 기인한 것이다. 일부 실시형태에서, DNA 커튼에 사용되는 지질 표면 코팅은 표면 결합 및 배경을 최소화한다. 동일한 서열의 많은 카피가 DNA 커튼에서 복수의 폴리뉴클레오티드를 형성하는 일부 실시형태에서, 서열은 하나의 폴리뉴클레오티드가 아닌 복수의 폴리뉴클레오티드로부터 집합적으로 결합 패턴으로부터 어셈블리된다.
긴 폴리뉴클레오티드의 경우에, 정렬된 방식은 각 긴 폴리뉴클레오티드의 일 말단을 패드의 정렬된 어레이 내의 패드에 개별적으로 부착함에 의한 것일 수 있으며, 여기서 상이한 폴리뉴클레오티드의 말단은 DNA 커튼(Greene 및 동료)에 대해 입증된 바와 같이 각 패드를 점한다. 일부 실시형태에서, 폴리뉴클레오티드의 양 말단은 패드에 결합하고, 각 말단은 상이한 패드에 결합한다. 단일 선형 폴리뉴클레오티드가 결합하는 2개 패드는 폴리뉴클레오티드의 신장된 구성을 제자리에 유지하는 역할을 할 수 있고 균일하게 이격된, 비-중첩 또는 비-상호작용 폴리뉴클레오티드의 정렬된 어레이가 형성되도록 할 수 있다. 일부 실시형태에서, 단 하나의 폴리뉴클레오티드가 개별 패드를 점할 수 있다. 패드가 포아송 프로세스에 의해 점유되는 일부 실시형태에서, 일부 패드는 무 폴리뉴클레오티드에 의해 점유되고, 일부는 1개, 일부는 1개 초과에 의해 점유된다.
다수의 세포로부터 추출된 DNA의 시퀀싱이 그 실질적인 수에서 동일한 세포 유형인 (및 실질적으로 동일한 서열을 함유할 것으로 예상된) 발명의 일부 실시형태에서, 서열은 하나의 폴리뉴클레오티드보다는 복수의 폴리뉴클레오티드로부터의 집합체에서 결합 패턴으로부터 어셈블리된다.
일부 실시형태에서, 폴리뉴클레오티드는 그의 자연적 상황(예를 들어, 세포, 조직, 생체유체)에서 제거되고 표면 상에 이동억제된다. 일부 실시형태에서, 폴리뉴클레오티드는 그의 세포 또는 조직 상황에 남아 있다. 일부 실시형태에서, 세포 또는 조직은 고정된다. 일부 실시형태에서, 폴리뉴클레오티드는 세포 내부에서 가교-결합된다.
일부 실시형태에서, 폴리뉴클레오티드는 단일-가닥(예를 들어, mRNA, lncRNA microRNA)이다. 일부 실시형태에서, 폴리뉴클레오티드는 이중-가닥이다. 일부 실시형태에서, 폴리뉴클레오티드는 변성된다. 일부 실시형태에서, 변성은 0.5M 또는 1M NaOH, DMSO(예를 들어, 60%), 포름아미드(10-90%), 우레아(7-8M) 등으로부터의 하나 이상의 시약을 포함하는 화학적 변성이다. 일부 실시형태에서, 변성은 85℃ 이상인, 열 변성이다. 일부 실시형태에서, 변성은 헬리카제 또는 헬리카제 활성을 갖는 다른 효소의 사용을 통한 것과 같은 효소적 변성을 통한 것이다. 일부 실시형태에서, 폴리뉴클레오티드는 표면과의 상호작용을 통해 또는 임계 길이를 넘어서는 신장과 같은 물리적 공정에 의해 변성된다. 일부 실시형태에서, 변성은 전체적 또는 부분적이다.
일부 실시형태에서, 폴리뉴클레오티드의 어레이는 표면 상에 이동억제화되고, 일부 실시형태에서, 어레이의 폴리뉴클레오티드는 개별적으로 분해되기에 충분히 멀리 떨어져 있다. 일부 실시형태에서, 어레이의 폴리뉴클레오티드는 개별적으로 분해될 만큼 충분히 멀리 떨어져 있지 않다. 일부 실시형태에서, 어레이의 폴리뉴클레오티드는 초-해상도 방법에 의해 개별적으로 분해된다. 일부 실시형태에서, 폴리뉴클레오티드는 표면에 평행하게 연장된다. 일부 실시형태에서, 폴리뉴클레오티드는 표면에 대해 비스듬한 각도로 연장된다. 일부 실시형태에서, 2D 검출기를 통한 검출은 단일 분자 국지화 알고리즘 소프트웨어(예를 들어, Fiji/ImageJ에 대한 플러그-인인 Thunderstorm 또는 https://github.com/jungmannlab/picasso에서 다운로드로 이용할 수 있는 Picasso)를 통해 처리된다. 일부 실시형태에서, 폴리뉴클레오티드는 표면에 수직으로 연장된다. 표지 좌표의 검출은 회전 디스크 공초점 현미경, 광-시트 현미경, 3D 초-해상도 현미경 또는 3D 단일 분자 국지화 현미경 또는 기타 3D 이미징 접근방식을 통해 이루어진다.
발명의 방법에서 (특정 종의 다수의 카피로부터) 프로브는 특정 방식(예를 들어, 왓슨-크릭 염기 쌍화, 항체-항원 결합)에서 폴리뉴클레오티드의 표적 부위에 일시적으로 결합되고 데카르트 좌표와 과도 결합의 지속시간이 기록된다. 일부 실시형태에서, 동일한 종의 프로브는 표적 부위에 반복적으로 일시적으로 결합한다. 일부 실시형태에서, 하나의 프로브 종이 제거되고 다른 것이 추가된다. 일부 실시형태에서, 이것은 레퍼토리(예를 들어, 완전한 레퍼토리), 타일링 시리즈 또는 프로브의 패널이 시험될 때까지 반복된다. 일부 실시형태에서, 각각의 프로브 종의 결합 장소가 기록된다. 일부 실시형태에서, 기록은 나노미터 국지화 정확도, 즉 요구되는 정밀도 또는 적용의 목적에 따라 사용할 수 있는 정밀도에 의존하여 수십 나노미터, 수 나노미터 및 심지어 수 서브-나노미터(옹스트롬) 이내로 결합의 x-y 및 일부 실시형태에서 z 좌표를 제공하도록 처리된다. 일부 실시형태에서, 하나의 올리고 프로브 종 또는 올리고 프로브 서열의 레퍼토리 또는 패널이 제공되고 핵산 변형 또는 손상의 부위에 결합할 수 있는 결합제(예를 들어, 단백질)의 하나 또는 레퍼토리가 또한 제공될 수 있다.
일부 실시형태에서, 프로브 상의 표지의 하나 이상의 물리적 특성이 또한 기록되고 상이한 프로브 종은 상이한 물리적 특성을 포함하는 표지로 표지화되며, 이러한 물리적 특성은 밝기(흡수, 양자 수율), 파장, 수명, 양극화를 포함한다. 일부 실시형태에서, 물리적 특성은 단일 분자 또는 단일 입자 수준에서 측정될 수 있는 임의의 다른 물리적 특성이다. 일부 실시형태에서, 다중 표지 실체는 표지를 포함한다.
일부 실시형태에서, 일시적인 결합은 수 초 또는 몇 초 동안이다. 일부 실시형태에서, 일시적인 결합은 10마이크로초 내지 수십 초에 걸쳐 있을 수 있다. 일부 실시형태에서, 일시적인 결합은 지속시간이 1밀리초 내지 1초이다. 일부 실시형태에서, 일시적인 결합은 10마이크로초 내지 1밀리초이다.
발명은 단일(개별) 분자(예를 들어, 중합체)에 대해 실행되어 방법이 절묘한 민감도에 대한 잠재성을 갖고 분자의 이종 모집단에서 다양성을 해결할 수 있다. 민감도는 또한 발명이 샘플 분자가 그 수반되는 손실(예를 들어, 결찰은 매우 비효율적이어서 결찰에 의해 적응되지 않은 이들 분자는 효과적으로 손실됨) 및 인공물의 도입(예를 들어, PCR 동안 복제 오류)과 함께 처리될 필요가 없다는 사실에 의해 긍정적으로 영향을 받는다.
다중 결합 이벤트는 감도를 증가시키고, 더 많은 광자가 축적되고, 다중 독립적 결합 이벤트는 실제 신호가 검출될 확률을 증가시킨다. 다중 결합 이벤트는 또한 단일 "호출"에서 검출되는 모이어티 또는 서열의 정체성을 확립하기보다는 다중 호출로부터 컨센서스가 획득될 수 있기 때문에 특이성을 증가시킨다. 또한 표적 모이어티 또는 서열에 대한 다중 결합 이벤트는 실제 장소에 대한 결합이 비-특이적 결합 이벤트와 구별되도록 하며, 여기서 (역치 지속시간의) 결합은 동일한 장소에서 여러 번 발생할 가능성이 적다. 또한 시간 경과에 따른 다중 결합 이벤트의 측정은 탈색되는 표면에 대한 비-특이적 결합 이벤트의 축적을 허용하여, 그 후 비-특이적 결합은 거의 다시 검출되지 않는 것으로 관찰된다. 이는 비특이적 결합의 신호가 탈색되어도 비-특이적 결합 부위는 점유되거나 차단된 상태로 남아 있기 때문일 수 있다. 따라서 무비의 초기 프레임이 잘릴 수 있으므로 비-특이적 결합을 최소화하기 위해 표면을 부동화하기 위한 광범위한 노력이 필요하지는 않다.
일부 실시형태에서, 각 일시적인 결합 이벤트에서 표지로부터의 신호는 2D 검출기의 하나 초과의 픽셀을 커버하기 위해 광학 경로(전형적으로, 확대 인자 제공)를 통해 투사된다. 신호의 점 확산 함수(PSF)가 플롯팅되고 PSF의 중심이 신호의 정확한 장소로 된다. 이 국지화는 서브-nm 정확도로 수행될 수 있다. 국지화 정확도는 수집된 광자의 수에 반비례하므로 초당 방출되는 광자가 많을수록 또는 광자가 오래 수집될수록 정확도가 높아진다. 높은 정확도와 정밀도를 달성하기 위해, 2D 검출기와 관련된 샘플의 드리프트를 최소화하거나 드리프트 보정을 위한 효과적인 수단이 구현될 필요가 있다. 일부 실시형태에서, 드리프트 보정 접근방식은 드리프트를 보정하기 위한 참조로 사용될 수 있는 망선상 기준점 마커를 표면 상에 포함하는 것을 포함한다; 다중 특정된 결합 장소를 갖는 DNA 오리가미는 정밀도가 수 나노미터 또는 서브-나노미터로 낮아야 할 때 매우 효과적인 망선상 기준점 마커이다.
발명의 대안적인 실시형태에서, 각 일시적인 결합 이벤트에서 표지로부터의 신호는 광학 확대 경로를 통해 투영되지 않고, 오히려 기판, 전형적으로 표적 분자가 상주하는 광학적으로 투명한 표면이 2D 검출기 어레이에 직접적으로 커플링된다. 검출기 어레이의 픽셀이 작은 경우, 예를 들어, 1미크론 이하이면 표면 상에 신호의 1:1로 투영으로 결합 신호가 적어도 1미크론 정확도로 국지화되도록 허용한다. 2kb 길이가 1 미크론에 상응하는 것인 신장된 DNA의 경우에 2킬로베이스 떨어져 있는 신호가 분해될 수 있다. 신호가 4096개 염기 또는 2미크론마다 발생할 것으로 예상되는 6mer 프로브의 경우에 이 해상도로 충분하다. 또한 두 픽셀 사이에 부분적으로 떨어지는 신호는 중간 장소를 제공하므로 해상도는 1미크론 픽셀에 대해 500nm이다. 물론 실제 천연 폴리뉴클레오티드 서열에서 신호는 모든 4096개 염기보다 더 가까운 장소에서 발생할 것으로 예상된다. 그러나, DNA 저장과 같은 일부 이색적인 적용에서는 예를 들어 신호가 2Kb마다 떨어지는 방식으로 폴리뉴클레오티드 작제물이 설계될 수 있다. 이 접근방식의 이점은 장치가 더 간단하고 안정적이라는 것이다. 또한 기판은 2D 어레이 검출기와 관련하여 예를 들어 100nm 증분으로 변환되어 더 높은 해상도를 제공할 수 있다. 이 실시형태의 한 가지 이점은 장치가 렌즈 및 렌즈 사이의 공간을 필요로 하지 않기 때문에 더 작아 (또는 더 얇아) 질 수 있다는 것이다. 또한 분자 저장 판독값의 기존 컴퓨터 및 데이터베이스와 더 호환가능한 전자 판독값으로의 직접적 변환을 제공할 수 있다.
일부 실시형태에서, 일시적인 결합을 촉진하는 다중 조건이 사용된다. 일부 실시형태에서, 하나의 조건은 그의 Tm에 따라 하나의 프로브 종에 대해 사용되고 또 다른 조건은 프로브 종의 전체 레퍼토리, 예를 들어 1024개 가능한 5mer의 레퍼토리로부터의 각 5mer 종에 대해 그의 Tm 등에 따라 다른 프로브 종에 대해 사용된다. 일부 실시형태에서, 표적 폴리뉴클레오티드 가닥 둘 모두가 샘플에 존재하기 때문에 512개 비-상보적 5mer만이 제공된다. 일부 실시형태에서, 각 프로브 추가는 5개 특정 염기 및 2개 축퇴성 염기를 포함하는 프로브의 혼합물을 포함하며(따라서 16개 헵타머) 모두는 서열을 조사하는 능력의 관점에서 하나의 오량체로서 기능하는 동일한 표지로 표지된다; 축퇴 염기는 프로브 세트의 복잡성을 증가시키지 않으면서 안정성을 추가한다.
일부 실시형태에서, 동일하거나 유사한 Tm을 공유하는 복수의 프로브에 대해 동일한 조건이 제공된다. 레퍼토리에서 각 프로브는 다른 인코딩 표지(또는 그에 따라 식별되는 표지)를 포함할 수 있다. 이러한 경우에 온도는 동일하거나 유사한 Tm을 공유하는 다음 일련의 프로브에 대해 상승되기 전에 여러 프로브 교환을 통해 유지된다.
일부 실시형태에서, Tm은 예를 들어 최근접 이웃 매개변수에 의해 계산된다. 다른 실시형태에서 Tm은 경험적으로 유도된다. 예를 들어, 최적의 TM 또는 TM 범위는 용융 곡선을 수행함(예를 들어, 온도 범위에 대한 흡수에 의한 용융의 정도를 측정하는 것)에 의하여 유도된다. 일부 실시형태에서, 프로브 세트의 구성은 경험적 시험에 의해 검증된 그의 이론적으로 일치하는 Tm에 따라 설계된다. 일부 실시형태에서, 결합은 Tm보다 실질적으로 낮은 온도, 예를 들어 Tm보다 33도 낮은 온도에서 수행된다. 일부 실시형태에서, 완벽한 일치로부터 불일치를 구별하기 위한 최적의 온도는 다양한 장소에서의 완벽한 일치 및 불일치를 포함하는 짧은 합성 표적을 사용하여 용융 곡선을 경험적으로 수행하여 결정된다. 일부 실시형태에서, 각 올리고에 대해 경험적으로 결정된 최적 온도는 시퀀싱에서 각 올리고의 결합에 사용된다.
일부 실시형태에서, 사용된 올리고의 농도는 올리고 서열의 AT 대 GC 함량에 따라 조정된다. GC 함량이 더 높은 올리고에 대해 더 높은 농도의 올리고가 제공된다. 일부 실시형태에서, 2.5 내지 4M 농도에서 CTAB, 베타인 또는 카오트로픽 시약예컨대 테트라메틸 염화암모늄(TMACl)을 함유하는 염기 조성물의 효과를 균등화하는 완충액이 사용된다.
사용된 올리고 길이가 길수록 올리고에 영향을 미치는 회문 또는 폴드백 서열이 효율적인 프로브로서 기능할 가능성이 더 커진다. 효율성은 하나 이상의 축퇴 염기를 제거함에 의해 이러한 올리고의 길이를 줄임으로써 실질적으로 향상될 수 있다. 이 경우 올리고의 결합 안정성은 특정 안정화 염기 변형 또는 올리고 접합체를 사용함에 의해 향상될 수 있다. 이 이유로 4mer 같이 더 짧은 조사 서열을 사용하는 것이 유리하다. 일부 실시형태에서, 완전히 변형된 3mer 또는 4mer(예를 들어, LNA)가 사용될 수 있다.
일부 실시형태에서, 전체 레퍼토리가 함께 추가된다. 일부 이러한 실시형태에서, 염기 조성 효과를 균등화하는 완충액(예를 들어, TMACl 또는 구아니디늄 티오시아네이트)이 사용된다. 일부 실시형태에서, 동일하거나 유사한 Tm을 갖는 프로브 종이 함께 추가된다. 일부 실시형태에서, 함께 추가된 프로브 종은 차등적으로 표지되지 않는다. 일부 실시형태에서, 함께 추가된 프로브 종은 차등적으로 표지된다. 일부 실시형태에서, 차등 표지는 예를 들어 상이한 밝기, 수명 또는 파장, 및 이러한 물리적 특성의 조합을 가지는 방출을 갖는 표지이다.
일부 실시형태에서, 차등 표지는 코딩되며, 예를 들어, 그것은 DNA 오리가미 또는 DNA 나노구조-기반 코드이다. 일부 실시형태에서, 코딩 아암은 프로브를 식별하는 표지의 조합을 포함하는 프로브에 추가된다. 예를 들어, 모든 가능한 5mer 올리고뉴클레오티드 프로브의 라이브러리가 인코딩되어야 하는 경우, 아암은 5mer에서의 5개 핵염기 각각에 상응하는 5개 부위 각 부위를 가지고 5개 부위의 각각은 5개 구별가능한 종에 결합될 수 있다. 예를 들어, 특정 피크 방출 파장을 갖는 형광단은 각 위치에 상응할 수 있고(예를 들어, 위치 1의 경우 500nm, 위치 2의 경우 550, 위치 3의 경우 600nm, 위치 4의 경우 650nm 및 위치 5의 경우 700nm) 동일한 파장이지만 다른 형광 수명을 갖는 4개 형광단은 각 위치에서 4개 염기 각각에 대해 코딩될 수 있다.
일부 실시형태에서, 프로브는 표지가 올리고뉴클레오티드에서의 특정 위치에서 단 하나의 뉴클레오티드에 대해 보고하는 방식으로 코딩된다. 레퍼토리의 서브-세트(서브-레퍼토리)가 동시에 추가될 수 있다. 각 주기에서, 올리고에서 염기 위치 중 하나가 정의되고 다른 위치가 축퇴하는 4개 색상 코딩 체계가 사용될 수 있다.
A, C, T 및 G가 정의된 모든 올리고는 각각 그 정의된 염기에 특이적인 특정 형광단으로 표지된다. 제1 염기가 정의되고 나머지는 축퇴하는 올리고의 서브-레퍼토리의 결합, 검출 및 제거한 후, 유사한 조성의 프로브의 서브-레퍼토리가 추가되지만 제2 위치는 표지에 의해 인코딩되고 (그리고 나머지는 축퇴하고), 그런 다음 제3, 제4 및 제5가 각각 차례로 된다.
제1 주기, 세트 1: 4개 색상은 위치 일에서 4개 염기를 나타낸다.
제2 주기, 세트 2: 4개 색상은 위치 이에서 4개 염기를 나타낸다.
제3 주기, 세트 3: 4개 색상은 위치 삼에서 4개 염기를 나타낸다.
제4 주기, 세트 4: 4개 색상은 위치 사에서 4개 염기를 나타낸다.
제5 주기, 세트 5: 4개 색상은 위치 오에서 4개 염기를 나타낸다.
전체 레퍼토리는 5 주기에서 소진될 수 있다.
일부 실시형태에서, 4 미만, 예를 들어 단 하나의 색상만이 공정 전반에 걸쳐 사용된다. 이 경우에, 각 주기는 4개-하위-주기로 분할되며, 그 각각에서 위치(예를 들어, 위치 1)에서 4개 염기 중 하나가 다음 것이 추가되기 전에 개별적으로 추가된다; 매번 프로브는 동일한 표지를 수반한다. 이 실시형태에서 전체 레퍼토리는 20 주기에서 소진될 수 있다.
데이터 처리 후, 단일 분자 국지화는 (검출된 색상으로 인해) 세트 1-5의 프로브 중 어느 것이 폴리뉴클레오티드 상에 동일한 풋프린트를 갖는지, 즉 동일한 나노미터 장소에 결합하는지 식별할 수 있다. 예를 들어, 나노미터 장소는 1nm 중심의 정밀도(+/- 0.5nm)로 정의된다. 따라서 PSF의 중심이 동일한 1nm 내에 속하는 모든 프로브는 함께 비닝된다. 각 단일 염기 한정된 올리고 종은 나노미터(또는 서브-나노미터) 중심에 대한 정확한 국지화를 가능하게 하기 위해 (방출 및 수집된 광자의 수에 따라) 여러 번 결합할 수 있다. 따라서 나노- 또는 서브-나노-미터 국지화는 예를 들어 5'AGTCG 3'의 올리고 서열에 대한 제1 염기가 A, 제2는 G, 제3은 T, 제4는 C 및 제5는 T임을 결정할 수 있다; 이것은 5'CGACT3'의 표적 서열을 제안할 것이다. 따라서 모든 단일-염기 한정된 1024개 올리고 프로브는 단지 5개 주기(올리고 추가 및 세정 포함)로 통과되거나 시험될 수 있다; 이것은 5mer의 전체 서열 공간을 커버한다. 일부 실시형태에서, 세트에서 각 올리고의 농도는 그것이 단독으로 사용될 때 사용되는 것보다 더 낮고, 이 경우에 결합 이벤트의 역치 수에 도달하기 위해 더 긴 시간 동안 데이터의 획득이 수행된다; 또한 특정 올리고보다 더 높은 농도의 축퇴 올리고가 사용될 수 있다. 이 코딩 계획은 예를 들어 올리고의 3' 또는 5'에서 표지를 합성하거나 접합함에 의해 프로브를 직접적인 표지화함에 의해 수행될 수 있다. 그러나 그것은 간접적인 표지화함에 의해 수행될 수도 있는데, 예를 들어, 프로브 서열은 프로브의 서열 조사 부분에서 코딩되는 염기의 정체성을 특정하는 표지된 올리고가 결합되는 '플랩'(결합 상호작용에 대해 의도되지 않은 서열) 서열에 부착될 수 있다. 이 계획에서 단지 4개 염기가 구별될 필요가 있고 따라서 4개 다른 유형의 표지만 필요하다. 하나의 염기만 인코딩된 올리고 라이브러리의 합성은 저렴한데, 이는 하나의 염기가 한정되고 다른 4개가 축퇴되어 각각 단지 20개 상이한 올리고만이 합성될 필요가 있기 때문이다. 합성 동안 반응성에 대해 농도를 조정할 수 있도록 축퇴 위치의 자동화된 합성 동안 수동-혼합을 사용하는 것이 바람직하다.
각 올리고의 장소는 그 장소에 대한 다중 이벤트에 대한 PSF를 결정함에 의해 정확하게 한정된 다음 오프셋 이벤트에서 부분 서열 중첩에 의해 확증된다. 이 실시형태는 나노미터 또는 서브-나노미터 정밀도로 결합하는 프로브의 단일 분자 국지화에 크게 의존한다.
일부 실시형태에서, 모든 4개 염기로부터의 기여는 균등화된다. 이것은 G-C 쌍의 안정성을 억제하거나 AT의 안정성을 증가시키는 시약을 사용함에 의해 수행될 수 있다. 베타인, TMA 및 광범위의 기타 시약을 포함한 이러한 시약. 대안적으로, 뉴클레오티드 유사체, 변형 및 N 위치를 사용하여 프로브의 Tm을 균등화할 수 있다. 따라서 G와 동등한 Tm을 얻기 위해 증가된 안정성을 갖는 T 유사체가 사용된다.
일부 실시형태에서, 4개 부분적으로 축퇴한 올리고 풀의 농도는 각각 Tm에 따른 단일 인코딩된 염기의 안정성에서 차이를 보상하도록 조정된다; Tm에 의한 농도의 조정은 축퇴한 위치에 적용되지 않기 때문에 이것은 단지 단편적 보상일 수 있다.
일부 실시형태에서, 레퍼토리의 프로브의 프로브가 인코딩된다. 일부 실시형태에서, 예를 들어 1024개 5 mer의 전체 세트가 인코딩된다. 일부 실시형태에서, 인코딩은 특정 서열 단위를 서열의 조사에 사용되는 5mer의 일 말단(예를 들어, 플랩 서열)에 커플링하는 것을 포함한다. 인코딩 서열의 각 단위는 플랩 상으로 혼성화된 형광 표지된 올리고로. 별개의 형광으로 표지된 프로브에 대한 도킹 부위로 작용한다. 5개 염기 프로브 서열을 인코딩하기 위해, 프로브 상의 플랩은 5개 별개의 결합 장소를 함유하며, 예를 들어, 각 장소는 다음 장소에 직렬로 연결된 다른 DNA 염기 서열이다. 예를 들어, 플랩 상의 제1 위치는 프로브 서열(폴리뉴클레오티드 표적에 결합할 부분)에 인접하고, 제2 위치는 제1 위치에 인접하는 등이다. 시퀀싱에서 프로브-플랩을 사용하기에 앞서 각 다양한 프로브-플랩을 형광으로 표지된 올리고 세트에 결합하여 프로브 서열에 대한 고유한 ID 태그를 생성한다. 이것은 플랩 상의 각 위치에 상보적인 4개의 뚜렷하게 표지된 올리고 서열을 사용함에 의해 수행될 수 있으며, 총 16개 별개 표지가 필요하다.
일부 실시형태에서, 서열에서 제1 염기는 플랩에의 제1 단위에 의해 인코딩되고, 제2 염기는 제2 단위에 의해 인코딩되는 식이다; 염기 서열의 순서에 상응하는 단위의 순서. 그런 다음 별개의 형광 표지가 (상보적 염기 쌍화를 통해) 각각의 단위 상으로 도킹된다. 예를 들어, 제1 위치는 파장 500-530nm에서, 제2 위치는 파장 550-580nm에서, 제3 위치는 600-630nm에서, 제4 위치는 650-680nm에서, 그리고 제5 위치는 700-730nm에서 방출할 수 있다. 각 장소에서 염기의 정체성은 그 다음 예를 들어 표지의 형광 수명에 의해 인코딩될 수 있다. 예를 들어 A에 상응하는 표지는 T보다 수명이 더 긴, G보다 수명이 더 긴, C보다 수명이 더 길다.
따라서 위치 1에서 A는 가장 긴 수명으로 500-530nm에서 방출한다. 위치 3에서 G는 세 번째로 긴 수명으로 600-630nm에서 방출하는 식이다.
폴리뉴클레오티드를 시퀀싱하는, 일부 이러한 실시형태에서, 방법은 다음을 포함한다:
a) 각 단위에 대해 구별되는 표지된 프로브가 사전-결합된 모듈식 다중-단위 서열을 포함하는 인코딩 같은 올리고의 인코딩된 세트를 제공하는 것;
b) 레퍼토리를 폴리뉴클레오티드에 일시적이고 반복적으로 결합하고 각 유형의 별개의 신호를 국지화하는 것; 및
c) 기록된 결합 장소를 사용하여 폴리뉴클레오티드의 서열을 재구성하고 각 프로브의 정체성을 디코딩하는 것.
일부 실시형태에서, 단지 4개 상이한 올리고뉴클레오티드 서브-레퍼토리가 사용되며, 여기서 단지 중심 염기. 예를 들어, 5 mer의 것만이 한정되고 나머지는 축퇴한다. 올리고뉴클레오티드의 중심 위치에서 불일치가 가장 불안정할 것으로 예상되고 조건이 설정될 수 있으므로 중심 염기가 결합하고 불일치를 형성하지 않아야 하는 절대적인 요구사항이 있다. 일시적인 결합은 어느 정도 모든 부위가 올리고뉴클레오티드 결합에 의해 커버되고, 그 다음 만약 국지화가 높은 수준, 예를 들어 서브-nm로 수행되면 폴리뉴클레오티드의 서열은 중앙으로 코딩된 올리고에 의해 제공된 염기-대-염기 정보를 단지 함께 스티칭함에 의해 어셈블리될 수 있다는 것을 보장할 것이다. 각각의 중심 염기 A, C, G, T는 4개 상이한 구별가능한 형광체, 예를 들어, Atto 488, Cy3B, Atto 655, Alexa 700에 의해 코딩될 수 있다.
실제로, 최적 농도 (뿐만 아니라 반응 조건 및 온도)는 바람직하게는 공지된 서열의 폴리뉴클레오티드의 시퀀싱에서 각 풀의 농도, 반응 조건 및 온도를 반복적으로 조정함에 의해 결정되고; 다양한 대표적인 폴리뉴클레오티드에 대해 가장 정확한 서열을 산출하는 농도/조건이 최적인 것으로 간주될 수 있다.
일부 실시형태에서, 발명은 다음을 포함하는 폴리뉴클레오티드를 시퀀싱하는 방법이다:
a) 폴리뉴클레오티드를 이동억제화하는 것;
b) 올리고에서 일 위치인 염기 A, C, G, T가 특정되고 (X) 표지에 의해 인코딩되고 나머지 염기가 축퇴되는 (N) 올리고뉴클레오티드의 라이브러리/레퍼토리를 추가하는 것;
c) 각 표지된 올리고의 폴리뉴클레오티드에 대한 반복적인 결합을 이미징하고 특정된 염기의 결합 장소 및 정체성을 나노미터법으로 국지화하는 것;
d) 제2 위치에 대해 표지된 올리고뉴클레오티드의 라이브러리/레퍼토리를 추가하고 제3, 제4 및 제5 위치에 대해 지정된 염기 등의 결합 장소 및 정체성을 나노미터법으로 국지화하는 것;
e) 염기 표지가 올리고뉴클레오티드 레퍼토리에서의 각 위치에 대한 장소에 지속적으로 일시적으로 결합하는 것에 따라 각 장소에서 서열을 어셈블리하는 것; 및
f) 결합 장소 및 인접 장소 간의 서열에서의 중첩을 고려하여 폴리뉴클레오티드의 서열을 어셈블리하는 것.
발명의 이 실시형태는 프로브 올리고뉴클레오티드에서 특정된 염기의 장소가 같은 부근에서 결합하는 다른 프로브 올리고뉴클레오티드에서 특정된 염기의 장소와 구별될 수 있도록 <2.5nm 또는 <1nm, 또는 =<0.34nm인 나노미터 국지화 정밀도로부터 이익을 얻는다.
일부 실시형태에서, 레퍼토리의 프로브 중 일부가 인코딩된다. 일부 실시형태에서, 예를 들어 1024개 5 mer의 전체 세트가 인코딩된다. 일부 실시형태에서, 인코딩은 특정 서열 단위를 서열의 조사에 사용되는 5mer의 일 말단(예를 들어, 플랩 서열)에 커플링하는 것을 포함한다. 인코딩 서열의 각 단위는 플랩 상으로 혼성화된 형광 표지된 올리고를 갖는 별개의 형광으로 표지된 프로브 종에 대한 도킹 부위로 역할을 한다. 5개 염기 프로브 서열을 인코딩하기 위해, 프로브 상의 플랩은 5개의 별개 결합 장소를 함유하고, 예를 들어 각 장소는 다음 장소에 직렬로 연결된 다른 DNA 염기 서열이다. 예를 들어, 플랩 상의 제1 위치는 프로브 서열(폴리뉴클레오티드 표적에 결합할 부분)에 인접하고, 제2 위치는 제1 위치에 인접하는 식이다. 시퀀싱에 프로브-플랩을 사용하기에 앞서 각 다양한 프로브-플랩을 형광으로 표지된 올리고 세트에 커플링하여 프로브 서열에 대한 고유한 ID 태그를 생성한다. 이것은 플랩 상의 각 위치에 상보적인 4개의 뚜렷하게 표지된 올리고 서열을 사용함에 의해 수행될 수 있으며, 총 16개 별개 표지가 필요하다.
일부 실시형태에서, 서열에서 제1 염기는 플랩에의 제1 단위에 의해 인코딩되고, 제2 염기는 제2 단위에 의해 인코딩되는 식이다; 염기 서열의 순서에 상응하는 단위의 순서. 그런 다음 별개의 형광 표지가 (상보적 염기 쌍화를 통해) 각각의 단위 상으로 도킹된다. 예를 들어, 제1 위치는 파장 500-530nm에서, 제2 위치는 파장 550-580nm에서, 제3 위치는 600-630nm에서, 제4 위치는 650-680nm에서, 그리고 제5 위치는 700-730nm에서 방출할 수 있다. 각 장소에서 염기의 정체성은 그 다음 예를 들어 표지의 형광 수명에 의해 인코딩될 수 있다. 예를 들어 A에 상응하는 표지는 T보다 수명이 더 긴, G보다 수명이 더 긴, C보다 수명이 더 길다.
따라서 위치 1에서 A는 가장 긴 수명으로 500-530nm에서 방출한다. 위치 3에서 G는 세 번째로 긴 수명으로 600-630nm에서 방출하는 식이다.
폴리뉴클레오티드를 시퀀싱하는, 일부 이러한 실시형태에서, 방법은 다음을 포함한다:
a) 각 단위에 대해 구별되는 표지된 프로브가 사전-결합된 모듈식 다중-단위 서열을 포함하는 인코딩 같은 올리고의 인코딩된 세트를 제공하는 것;
b) 레퍼토리를 폴리뉴클레오티드에 일시적이고 반복적으로 결합하고 각 유형의 별개의 신호를 국지화하는 것; 및
c) 기록된 결합 장소를 사용하여 폴리뉴클레오티드의 서열을 재구성하고 각 프로브의 정체성을 디코딩하는 것.
이 접근방식의 이점은 모든 개별 올리고가 개별적으로 합성될 필요가 없고, 합성 주기에서 뉴클레오티드의 혼합물을 추가함에 의해 간단하게 만들어진다는 것이다.
올리고에서 특정 뉴클레오티드가 제공할 수 있는 구별의 정도는 올리고에서의 그 위치에 의존한다. 불일치는 5mer의 중심에서 가장 나쁘게 용인되고 중심에서 멀어질수록 더 잘 용인될 것으로 예상된다. 따라서, 단일 결합 이벤트의 데이터에서 올바른 서열 정체성을 할당하는 것이 때때로 어려울 수 있지만 부위 및 인접(중첩, 오프셋) 부위에 대한 다중 이벤트는 서열을 확증할 수 있다.
일부 경우에 결합의 지속시간이 정확하지 않거나 재현가능하지 않거나 예상한 것에 상응하지 않을 수 있다. 그러나, 일부 실시형태에서, 서열은 그 장소에 결합하는 완전한 레퍼토리로부터 모든 프로브의 결합 지속시간을 관찰함에 의해 장소에 대한 가장 긴 평균 결합 지속시간을 갖는 프로브를 선택함에 의해 할당될 수 있다. 비-왓슨-크릭 염기-쌍을 형성하는 프로브의 결합 또는 불일치의 비정상적으로 높은 결합이 데이터-세트에 적용되는 지식이 있는 한 일부 실시형태에서, 가장 긴 결합 지속시간을 갖는 올리고가 폴리뉴클레오티드에서의 서열에 상응하는 것으로 취해진다.
일부 실시형태에서, 올리고가 그의 용융 온도에 따라 세트로 분할되기 때문에 5회 초과의 주기이 수행된다. 대략 20개의 세트는 5mer의 Tm 레퍼토리를 나타내기에 충분하다(이상치 제외). 일부 실시형태에서, A 또는 T=2 및 G 또는 C=4의 Tm 기여는 Tm을 계산하는 데 사용된다. 다른 경우에 가장 가까운 이웃 매개변수(예를 들어, Breslauer에 따름)가 Tm을 계산하는 데 사용된다. 다른 경우에 각 올리고의 Tm이 경험적으로 결정된다. 실증적 결정은 용융 곡선을 획득함을 통해 되거나 또는 각각의 주어진 온도에서 보체 중 하나가 표면에 결합되고 다른 하나가 용액에서 표지될 때 올리고 보체의 결합을 분석함에 의해 결정된다.
일부 실시형태에서, 모든 올리고 결합에 대해 동일한 온도가 사용되고 Tm은 올리고의 농도를 조정함에 의해 조정된다. 덜 안정적인 올리고에는 더 높은 농도가 사용되고 더 안정적인 올리고에는 더 낮은 농도가 사용된다. 각 올리고의 농도는 경험적으로 또는 이론적으로 결정된다. 일부 실시형태에서, 단일 온도가 사용되지만 올리고뉴클레오티드의 길이 또는 화학적 조성은 변경된다.
일부 실시형태에서, 짧은 올리고 프로브가 일치와 불일치 간을 효율적으로 구별하기 위한 조건이 먼저 발견된다. 짧은 프로브는 매우 빠른 역학을 가지므로 짧은 시간의 공간(예를 들어, 1초 미만, 수 초 또는 1 또는 2분)에 많은 다수의 일시적인 결합 이벤트가 축적될 수 있다. 속도 제한 단계는 시약 교환 및 온도 조정일 수 있다. 결합은 건조 없이 이미지화되고 이에 의해 각 프로브에 대한 최적의 평형 반응 조건이 사용될 수 있다.
일반적으로, 시퀀싱은 표적 폴리뉴클레오티드가 결합된 것에 상보적인 뉴클레오티드를 함유한다고 가정한다; 결합 불일치 오류는 이 가정이 성립하지 않는 경우의 예이다. 그럼에도 불구하고 알려진 규칙이나 거동에 따라 발생하는 경우 불일치는 표적의 서열을 결정하는 데 유용할 수 있다. 짧은 올리고뉴클레오티드, 예를 들어 5mer의 사용은 하나의 염기가 5mer 길이의 20%이기 때문에 단일 불일치의 효과가 안정성에 큰 영향을 미친다는 것을 의미한다. 따라서, 적절한 조건에서 절묘한 특이성이 짧은 올리고 프로브에 의해 획득될 수 있다. 그럼에도 불구하고 불일치가 발생할 수 있고 분자 상호작용의 확률론적 특성으로 인해 일부 경우에서 그 결합 지속시간이 5개 염기 모두가 특이적인 결합과 구별가능하지 않을 수 있다. 그러나, 염기(또는 서열) 호출 및 어셈블리를 수행하는 데 사용되는 알고리즘은 불일치의 발생을 고려할 수 있다. 많은 유형의 불일치가 예측 가능하고 특정 규칙을 따른다. 이들 규칙 중 일부는 이론적 고려사항에 의해 유도될 수 있고; 다른 것들은 실험적으로 유도된다(예를 들어, Maskos and Southern Nucleic Acids Res, Williams et al Nucleic Acids Res 22:13651367 (1994)
발명의 일 실시형태에서, 하나 이상의 공지된 표적 폴리뉴클레오티드(들)(예를 들어, 람다 파지 DNA 또는 레퍼토리에서 각 올리고에 대한 상보체를 포함하는 수퍼서열을 포함하는 합성 작제물)를 포함하는 훈련 세트는 레퍼토리로부터 각 올리고뉴클레오티드의 반복적 결합을 시험하기 위해 사용된다. 기계 학습 알고리즘을 사용하여 올리고 프로브의 결합 및 불일치 특성을 결정할 수 있다. 따라서 반-직관적으로, 불일치 결합은 서열에 대한 신뢰도를 추가 및/또는 어셈블리하는 데 사용될 수 있는 추가 데이터를 제공하는 방법으로 볼 수 있다.
특정 이상치 서열은 비-왓슨 크릭 방식으로 결합할 수 있거나 짧은 모티프는 지나치게 높은 온-속도 또는 낮은 오프-속도를 유발할 수 있다. 예를 들어, RNA와 DNA 사이의 퓨린-폴리프리미딘 상호작용은 매우 강력할 수 있다(예를 들어, agg와 같은 RNA 모티프). 이들은 더 안정적인 핵형성 서열을 제공함에 의해 더 낮은 오프 속도를 가질 뿐만 아니라 더 높은 온 속도를 갖는다. 일부 경우에 결합은 특정 알려진 규칙을 반드시 준수하지 않는 이상치로부터 발생한다. 알고리즘은 이러한 이상치를 식별하거나 이러한 이상치의 예상을 고려하도록 설계될 수 있다.
이중-가닥 DNA(예를 들어, 천연 인간 게놈 DNA)가 이동억제된 경우에서, 1024개의 세트로부터 하나의 올리고(안티-센스)는 한 가닥(센스)에 결합할 것이고 다른 올리고(센스)는 다른 가닥(안티-센스)에 결합한다. 변성 후에도 특정 올리고가 결합된 가닥, 센스 또는 안티센스를 즉시 구별하는 것이 가능하지 않을 수 있다.
변성된 가닥 중에서 프로브의 하나가 결합하는 것은 즉시 구별가능하지 않을 수 있다. 그러나, 전체 시퀀싱 데이터-세트는 중첩하는 서열을 결합하는 올리고가 나노미터적으로 한쪽 또는 다른 쪽으로 위치하는 것으로 밝혀졌기 때문에 이를 밝힐 수 있다(도 7 참조).
공동-위치되어 남아 있는 두 가닥의 놀라운 이점은 상보적 표적 부위를 기반으로 한 염기 서열 할당이 독립적으로 조사됨으로 매우 높은 정확도를 허용한다는 것이다. 하나의 가닥에 대한 하나의 특정 올리고의 결합 여부는 표면 상에 수 또는 몇몇 나노미터 내에 공동-위치되어 지는 다른 가닥에 대한 그 보체의 결합에 의해 확립될 수 있다.
일부 실시형태에서, 6개의 정의된 염기를 갖는 올리고뉴클레오티드 프로브가 사용되며; 완전한 레퍼토리는 4096개 서열을 포함한다. 일부 실시형태에서, 5개의 정의된 염기를 갖는 올리고뉴클레오티드 프로브가 사용되며; 완전한 레퍼토리는 1024개 서열로 포함한다. 일부 실시형태에서, 5 또는 6개의 염기가 정의되고 추가의 보편적 염기 또는 축퇴 위치가 올리고뉴클레오티드 길이 안에 포함된다.
비-특이적 결합은 전형적으로 특정 프로브보다 더 짧은 기간 동안 결합하고 따라서 데이터 처리 동안 계산적으로 구별될 수 있다. 예를 들어, 특정 조건하에서 10ms보다 짧은 결합 이벤트는 비-특이적으로 간주된다.
프로브의 온-속도는 프로브 농도 증가, 온도 증가, 분자 군집 증가(PEG 400, PEG 800 등을 포함함에 의함)에 의해 조작(증가)될 수 있다. 그 화학 성분을 조작하거나 불-안정한 부속물을 추가하거나 올리고뉴클레오티드의 경우 그의 길이를 감소시킴에 의해 프로브의 열 안정성을 낮추는 것은 오프-속도가 증가시킬 수 있다. 오프-속도는 또한 온도 증가, 염 농도 감소(엄격도 증가), pH를 스케일의 극단으로 이동함에 의해 가속화될 수 있다.
프로브의 농도를 증가시켜 온-속도를 증가시키는 것은 문제가 될 수 있는데, 용액 내 프로브에 기인한 배경 형광이 감지될 수 있기 때문이다. 표면 상의 단일 분자 검출은 낮아지는 배경 신호에 의존하여 표면에 결합하는 신호가 배경 위에서 검출될 수 있다.
일부 실시형태에서, 사용되는 프로브의 농도는 프로브가 결합할 때까지 프로브를 본질적으로 비-형광성으로 만듦에 의해 증가될 수 있다. 이를 수행하는 한 가지 방법은 결합이 광활성화 이벤트를 유도하는 것이다. 다른 하나는 프로브가 형광성이라는 것이다. 다른 하나는 결합이 발생할 때까지 표지가 켄칭된다는 것이다(예를 들어, Molecular Beacons). 다른 하나는 신호가 에너지 전달 이벤트(예를 들어, FRET, CRET, BRET)의 결과로 감지된다는 것이다. 일 실시형태에서, 표면 상의 생체고분자는 공여체를 보유하고 프로브는 수용체를 보유하거나) 그 반대의 경우도 마찬가지이다. 다른 실시형태에서 개재하는 염료는 용액에 제공되고 표지된 프로브의 결합 시 개재하는 염료와 프로브 사이에 FRET 상호작용이 있다. 개재하는 염료는 공여체와 프로브 상의 표지 수용체가 될 수 있고 그 반대의 경우도 마찬가지이다. 예를 들어, 개재하는 염료는 스톡으로부터 YOYO-1 1000-10,000x 희석 또는 100-10,000x 희석에서 Evagreen일 수 있고 프로브 상의 표지는 ATTO 655일 수 있다. 또 다른 실시형태에서, 개재하는 염료는 FRET 기전 없이 사용된다 - 표면 상의 단일 가닥 표적 서열과 프로브 서열 둘 모두는 비표지되고 결합이 개재하는 염료가 삽입되는 이중 가닥을 생성할 때만 신호가 검출된다. 그 정체성에 따라 개재하는 염료는 그것은 DNA 안으로 개재되지 않고 용액에서 유리할 때 100 또는 1000x 덜 밝을 수 있으며; 이것을 TIRF 또는 HILO 현미경과 커플링하면 용액에 개재되는 염료로부터 임의의 배경 신호를 제거한다.
일부 실시형태에서, 발명은 다음을 포함하는 단일 표적 폴리뉴클레오티드 상의 뉴클레오티드 변형 및/또는 염기를 시퀀싱하는 방법을 포함한다:
i) 표면 또는 매트릭스 상에 폴리뉴클레오티드를 이동억제화하는 것;
ii) 프로브(들)가 폴리뉴클레오티드에 일시적으로 결합할 수 있는 조건하에서 하나 이상의 프로브 종을 첨가하여 폴리뉴클레오티드로부터 검출된 하나 이상의 형광(또는 다른 검출가능한) 신호에서 변화를 초래하는 것;
iii) 검출기 상에서 폴리뉴클레오티드로부터의 하나 이상의 신호를 연속적으로 모니터링하고 일정 기간 동안 결합 이벤트를 기록하는 것;
iv) b의 프로브를 제거하는 것;
v) 상이한 하나 이상의 프로브 종으로 매번 단계 ii-iv를 반복하는 것; 및
vi) 변형 및/또는 염기의 서열을 재구성하기 위해 단계 iii의 각 반복으로부터 데이터를 축적하는 것.
특정 실시형태에서, 발명의 방법은 폴리뉴클레오티드의 어레이에서 작동될 수 있다. 일부 실시형태에서, 표적 폴리뉴클레오티드의 어레이는 단일 시야에서 복수의 폴리뉴클레오티드가 관찰될 수 있도록 이동억제된다.
일부 실시형태에서, 표적 폴리뉴클레오티드는 연장되거나 신장되어 화학적 특징(염기 서열, 손상, 변형)이 그 길이를 따라 관찰될 수 있다. 일부 실시형태에서, 단일의 비정상적으로 긴 표적 폴리뉴클레오티드가 이동억제화되어 그의 길이의 실질적으로 전체가 단일 시야에서 관찰될 수 있다(Frietag 외).
일부 실시형태에서 유체 용기는 웰이다. 일부 실시형태에서 유체 용기는 유동 셀이다. 일부 실시형태에서, 표면은 하나 이상의 화학 층, 생화학 층(예를 들어, BSA-비오틴, 스트렙타비딘), 지질 층, 하이드로겔 또는 겔 층으로 코팅된다.
일부 실시형태에서, 천연 폴리뉴클레오티드는 시퀀싱을 위해 디스플레이되기 전에 가공을 필요로 하지 않는다. 이것은 DNA의 화학적 변형이 제자리에 유지되기 때문에 방법이 서열 정보와 후성유전체 정보를 통합할 수 있도록 한다. 바람직하게는 폴리뉴클레오티드는 방향적으로 잘 정렬되어 있고 따라서 이미지, 이미지 처리, 염기 호출 및 어셈블리에 비교적 용이하며; 서열 오류율이 낮고 적용범위가 높다. 발명을 수행하기 위한 다수의 수단이 설명되어 있지만 각각은 샘플 준비의 부담이 완전히 또는 거의 완전히 제거되도록 수행된다.
발명은 게놈 DNA에서의 염기 수보다 훨씬 더 적은 정도의 시약 첨가 주기를 수행함에 의해 게놈 DNA의 100만 개 이상의 실질적으로 인접한 염기가 시퀀싱되도록 허용하기 때문에 놀랍고 반-직관적이다. 발명의 방법은 부분적으로 단일 표적 폴리뉴클레오티드 분자가 이들에 대한 프로브의 일시적인 결합을 검출함에 의해 서열화될 수 있다는 발견에 기초한다. 따라서, 발명은 다양한 양태 및 실시형태에서: 긴 길이의 폴리뉴클레오티드를 수득하는 것; 그 길이를 따른 장소가 추적될 수 있도록 폴리뉴클레오티드를 선형 상태로 배치하는 것을 포함한다.
일부 실시형태에서, 폴리뉴클레오티드의 전체 또는 거의 전체 길이는 무시할 수 있는 수의 갭을 갖는 연속성 판독을 포함한다. 이는 게놈의 반복적인 영역을 통해서도 긴-범위 게놈 구조를 제공하고 또한 개별 단상형이 분해되도록 허용한다. 이 방법은 하나 또는 단지 몇 개의 세포에서 매우 완전한 서열을 제공할 수 있다.
일부 실시형태에서, 연속성 서열은 알고리즘을 사용하여 드 노보 어셈블리를 통해 획득된다. 일부 경우에 알고리즘의 작업은 중첩하는 서열 비트의 높은 비율의 장소가 실험적으로 얻어지기 때문에 비교적 간단한다. 그러나, 어려움이 있는 경우 또는 신뢰도를 높이기 위해 참조 서열을 사용하여 어셈블리를 용이하게 할 수도 있다. 다중 폴리뉴클레오티드로부터 정보를 처리하는 알고리즘 중 일부는 매우 긴 거리를 포괄하는 개별 단상형을 분해하는 데 사용된다.
서열은 다수의 방식으로 데이터로부터 추출될 수 있다. 서열 재구성 방법의 스펙트럼의 일 말단에서 모노머 또는 모노머 스트링의 국지화는 매우 정밀하여(나노미터 또는 서브-나노미터) 서열은 모노머 또는 스트링을 단지 순서화함에 의해 획득된다. 스펙트럼의 다른 말단에서 데이터는 서열에 대한 다양한 가설을 배제하는 데 사용된다. 예를 들어 한 가지 가설은 서열이 알려진 개별 게놈 서열에 상응한다는 것이다. 알고리즘은 데이터가 개별 게놈에서 분기되는 위치를 결정한다. 다른 경우에 가설은 서열이 "정상" 체세포에 대한 알려진 게놈 서열에 상응한다는 것이다. 알고리즘은 추정되는 종양 세포로부터 데이터가 "정상" 체세포의 서열에서 분기되는 위치를 결정한다. 이들 접근방식의 스펙트럼에 걸쳐 변형이 구현될 수 있다.
따라서 일부 실시형태에서, 공지되지 않은 서열의 어셈블리는 다음을 포함한다:
a) 참조 게놈을 제공하는 것
b) 올리고의 레퍼토리에 대한 참조 게놈의 이론적 결합 패턴을 인 실리코 결정하는 것
c) 실제 데이터를 인 실리코 이론적 참조와 비교하는 것;
d) 실제 데이터와 인 실리코 이론적 참조 간의 차이를 결정하는 것; 및
e) 이전에 공지되지 않은 서열의 어셈블리를 생성하기 위해 d에서 발견된 차이에 따라 참조의 서열을 변형/재구성하는 것.
일부 실시형태에서, 차이는 치환, 삽입결실 및 구조적 변이를 포함한다. 특히, 참조 서열이 발명의 방법에 의해 어셈블리되지 않은 경우, 반복이 압축되고 재구성은 압축해제될 것이다.
게놈 DNA가 다중 세포로부터 수득되는 일부 실시형태에서, 데이터는 복수의 분자 사이에 통합될 수 있다. 다중 분자의 각각은 다중 분자 중 적어도 다른 분자와 부분적으로 중첩되고 공통 프로브 결합 패턴을 일치시킴에 의해 정렬된다. 부분적으로 중첩하는 분자의 각각은 다른 분자와 일련의 서열을 공유한다. 정렬이 계산적으로 완료되면 각각의 분자에 고유한 서열을 사용하여 갭을 채우고 완전히 또는 실질적으로 연속적인 어셈블리된 서열을 생성한다.
방법은 다중 개별(비-클론) 폴리뉴클레오티드 상에서 병렬로 실행될 수 있고 다중 폴리뉴클레오티드는 크게는 그 길이의 전체(또는 실질적인 부분)에 걸쳐 개별적으로 분해될 수 있고 개별 폴리뉴클레오티드 간의 중첩이 최소화되거나 전혀 발생하지 않는 방식으로 배치된다. 나란히 중첩이 발생하는 경우 이는 DNA 염색에서 형광이 증가하거나 염색이 사용되지 않은 경우 결합 이벤트의 증가된 빈도에 의해 검출될 수 있으며; 분자(회절-제한됨)가 광학적으로 중첩하는 것처럼 보이지만 물리적으로 겹치지 않는 경우, 그것들은 발명에 의해 제공된 단일 분자 국지화에 의해 제공되는 초-해상도에 의해 분해될 수 있다. 말단-상-말단 중첩이 발생하는 경우, 일부 실시형태에서, 폴리뉴클레오티드의 말단을 표시하는 표지를 사용하여 병치된 폴리뉴클레오티드를 실제 연속성 길이로부터 구별할 수 있다. 게놈의 많은 카피가 예상되고 명백한 키메라의 단 하나의 출현이 발견되는 경우 이러한 광학 키메라는 또한 인공물로 무시될 수 있다. 다시 말하지만, 분자(회절-제한됨)의 말단이 광학적으로 중첩하는 것처럼 보이지만 물리적으로 중첩하지 않는 경우 그것들은 발명의 방법에 의해 분해될 수 있다. 일부 실시형태에서, 장소 결정은 정밀하여 매우 가까운 표지에서 나오는 신호는 분해될 수 있다.
켄칭된 프로브 분자 표지를 사용하거나, 예를 들어 올리고의 각 면에 하나씩 같은 유형의 2개 이상의 표지를 가짐으로써 해로운 배경을 야기함이 없이 프로브의 높은 용액 농도가 달성될 수 있다. 용액에 있을 때 그것은 염료-염료 상호작용을 통해 켄칭된다. 그러나 표적에 결합되면 그것은 분리되어 단일 염료보다 2배 더 밝게 형광을 발할 수 있어, 더 쉽게 검출하게 한다. 이러한 염료-염색 상호작용은 Cy3에 대해 알려져 있다.
일 양태에서 발명은 광원, 유체 도관, 광학 성분, 검출기, 전자 회로, 선택적으로 컴퓨터 프로세서 및 컴퓨터 메모리를 포함하는 장치와 같은 프로브의 레퍼토리의 일시적인 결합에 의해 중합체를 시퀀싱하기 위한 장치를 포함한다. DNA는 유체 용기에 배치되고 결합 프로브와 유체 접촉하며, 광원은 결합 프로브와 연관된 표지가 검출기에 의해 검출되게 하는 빛을 방출한다. 일부 실시형태에서, 검출기는 2D 검출기이다. 일부 실시형태에서, 폴리뉴클레오티드는 유체 도관의 한 부분에 유지되고 결합 프로브는 다른 부분에 있다. 선택적으로 유체 도관의 한 부분은 밸브를 통해 다른 부분과 분리된다. 일부 실시형태에서, 올리고 또는 올리고의 세트는 액적 또는 패킷으로서 전달된다. 일부 실시형태에서, 액적은 시퀀싱이 수행되는 유동-셀 상에 사전-장입된다.
일부 실시형태에서, 시퀀싱되는 폴리뉴클레오티드의 서브-세트는 먼저 폴리뉴클레오티드의 제1 세트로부터 선택된다. 일부 이러한 실시형태에서, 포획 올리고뉴클레오티드는 폴리뉴클레오티드의 서브-세트에 혼성화하고 이들을 용액 밖으로 끌어내기 위해 용액에서 사용된다. 예를 들어, Agilent의 SureSelect 또는 이와 유사한 접근방식이 사용될 수 있다. 일부 실시형태에서, 선택은 핵산 결합이 단백질 결합에 의해 촉진되는 CRISPR 유형의 접근방식을 포함한다. 유사하게, 시퀀싱되는 단백질 또는 폴리펩타이드는 포획 항체, 나노바디, 아피바디, 압타머 등에 의해 용액으로부터 선택될 수 있다. 유사하게, 시퀀싱되는 항체, 아피바디 또는 나노바디는 포획 항원에 의해 용액으로부터 선택될 수 있다. 단리된 생체고분자는 표면 상에 배열되고 본 발명의 시퀀싱 방법에 적용된다.
일부 실시형태에서, 결합 프로브는 단백질(예를 들어, cas9) 및 가이드 RNA를 포함하는 CRISPR 시스템을 포함한다. 일부 실시형태에서, 시퀀싱의 목적은 표적 및 표적-외 효과를 검출하기 위해 가이드 RNA의 결합의 장소를 결정하는 것이다.
일부 실시형태에서, 표적 폴리뉴클레오티드는 체액, 예를 들어 혈액 내에 순환하는 DNA 또는 RNA에 존재하는 폴리뉴클레오티드다. 이러한 폴리뉴클레오티드는 길이가 약 200개 염기로 혈액에서 짧고 소변에서 더 짧다. 이들 폴리뉴클레오티드는 표면 상에 이동억제화될 수 있고 발명의 시퀀싱 방법에 적용될 수 있다. 일부 이러한 폴리뉴클레오티드는 이동억제된 단일 가닥 말단을 보유한다. 예를 들어 그것은 비닐 실란 표면(Genomic Vision, 프랑스 소재) 상에 이동억제화될 수 있다. 일부 실시형태에서, 순환하는 DNA 또는 RNA는 고리화되고 서클은 롤링 서클 반응에 사용된다. 일부 실시형태에서, 고리화는 서클리가제와 같은 효소에 의해 수행된다. 일부 실시형태에서, 롤링 서클 증폭 반응의 생성물인 긴 길이의 탠덤 카피를 표면 또는 매트릭스에서 신장시킨 다음 발명의 시퀀싱 방법에 적용하며; 이러한 접근방식은 순환하는 폴리뉴클레오티드의 컨센서스 서열이 획득되도록 허용한다. 일부 실시형태에서, 검출되는 순환하는 DNA가 드문 경우, 예를 들어 암의 조기 검출의 경우에, 탠덤 카피의 시퀀싱에 의해 획득된 컨센서스는 시퀀싱 방법의 오류율보다 높은 정확도 수준을 얻을 수 있게 한다. 예를 들어 방법의 원시 정확도가 99.9%인 경우 컨센서스 판독은 99.999%의 정확도를 가능하게 할 수 있어 매우 희귀한 변이체가 검출되도록 할 수 있다. 이 상황에서 롤링 서클 증폭의 이점은 각 앰플리콘이 고리화된 폴리뉴클레오티드에서 직접적으로 복사되기 때문에 제1 또는 초기 복사하는 라운드(PCR과 같을 수 있음)로부터 오류를 영속화하지 않는다는 것이다.
일부 실시형태에서, 방법은 신장된 분자를 따라 제자리에 적용된다. 일부 실시형태에서, 방법은 염색질 상의 제자리에 적용된다. 일부 실시형태에서, 방법은 유사분열/중기 염색체 상의 제자리에 적용될 수 있다. 일부 실시형태에서, 방법은 간기 염색체 상의 제자리에 적용될 수 있다. 일부 실시형태에서, 방법은 세포 내부의 염색체 DNA 상의 제자리에 적용될 수 있다. 일부 실시형태에서, 방법은 탠덤 카피를 따라 제자리에 적용될 수 있다.
일부 실시형태에서, 목적이 DNA를 서열화하는 것인 경우, RNAse는 시퀀싱이 개시되기 전에 샘플에 적용된다. 일부 실시형태에서, 목적이 RNA를 서열화하는 것인 경우, DNAse는 시퀀싱이 개시되기 전에 샘플에 적용된다. 일부 실시형태에서, 세포질 핵산 및 핵 핵산 둘 모두가 분석되어야 하는 경우, 그것은 차등적으로 또는 순차적으로 추출된다. 먼저 세포막(핵막 아님)이 파열되어 세포질 핵산을 방출하고 수집한다. 그런 다음 핵막이 파열되어 핵 핵산이 방출된다. 일부 실시형태에서, 단백질 및 폴리펩티드는 세포질 분획의 일부로서 수집된다. 일부 실시형태에서, RNA는 세포질 분획의 일부로서 수집된다. 일부 실시형태에서, DNA는 핵 분획의 일부로서 수집된다. 일부 실시형태에서, 세포질 및 핵 분획은 함께 추출된다. 일부 실시형태에서, 추출 후 mRNA 및 게놈 DNA는 차등적으로 포획된다. 예를 들어 mRNA는 표면에 부착된 올리고 dT 프로브에 의해 포획된다. 이는 유동 셀의 제1 부분에서 발생할 수 있고 DNA는 DNA의 말단이 (아마 소수성 상호작용으로 인해) 그 위에 포획될 수 있는 소수성 비닐 실란 코팅을 갖는 유동 셀의 제2 부분에서 포획된다.
지금까지 기술된 일시적인 결합의 기전은 수동적이고 프로브 결합이 불안정하기 때문에 그렇다. 다음은 일시적인 결합이 활성 기전인 발명의 대안적인 실시형태를 기술한다. 여기서 프로브 결합은 안정적이고 물리적 또는 분자적 수단에 의해 제거되어야 한다.
따라서, 활성인 일시적인 결합 루프는 다음을 포함한다:
1) 올리고 또는 올리고 세트를 표적에 안정적으로 결합하는 것;
2) 표적으로부터 올리고 또는 올리고 세트를 적극적으로 제거하는 것; 및
3) 1과 2를 반복하는 것.
일부 실시형태에서, 루프는 적어도 2회 수행된다. 일부 실시형태에서, 온-오프 결합은 연속적으로 모니터링된다. 일부 실시형태에서, 온 결합만이 모니터링된다. 단계 1에서 표적에 올리고를 결합하는 것은 동일한 서열의 많은 올리고를 결합하는 것을 포함한다. 일부 실시형태에서, 다중 올리고 서열은 단계 1에서 표적 상의 상이한 부위에 대한 표적에 결합된다.
일부 실시형태에서, 시퀀싱 방법은 다음을 포함한다:
1) 올리고 1 또는 올리고 세트 1을 추가;
2) 이미징하는 동안 표적 부위의 서브-세트에 안정한 결합 올리고를 허용;
3) 표적으로부터 올리고를 적극적으로 제거;
4) 충분한 장소로부터 충분한 광자가 수집될 때까지 2 및 3을 반복;
5) 올리고를 세정;
6) 올리고 2 또는 올리고 세트 2를 추가;
7) 단계 2-5를 반복;
8) 올리고 3 또는 올리고 세트 3을 추가;
9) 단계 2-5를 반복; 및
10) 레퍼토리가 소진될 때까지 상기 과정을 지속.
일부 실시형태에서, 단계 2 및 3은 각각의 올리고 또는 올리고 세트에 대해 여러 번 수행된다. 이것은 다수의 이유로 수행된다. 결합은 확률적 과정이기 때문에 결합이 적절한 시간 동안 수행되어 평형-전 또는 초기 단계에서 반응이 중단되면 결합 부위의 일부만이 점유될 것이다. 따라서 사용된 올리고 또는 올리고 세트의 결합 부위가 전체적으로 함께 너무 가까워서 개별적으로 분해될 수 없는 경우, 올리고의 농도와 반응 시간이 적절하게 설정된다면 서브세트가 통계적으로 더 떨어져 그것을 개별적으로 검출되도록 허용한다. 적절한 시간과 농도는 경험적으로 결정될 수 있다. 이를 통해 부위의 다른 서브-세트가 각 반복에서 결합되고 조사될 수 있다. 결합을 여러 번 수행하는 또 다른 이유는 대부분의 부위 전체 또는 거의 모든 부분을 조사하고 실질적으로 모든 또는 대부분의 부위를 각각 여러 번 조사하도록 허용하여 민감도와 정확도를 향상시키기 위한 것이다.
일부 실시형태에서, 활성 결합 및 제거는 온도 변화에 의해 수행된다. 일부 실시형태에서, 활성 결합 및 제거는 시약 변경에 의해 수행된다. 일부 실시형태에서, 활성 결합 및 제거는 전기적 변화에 의해 수행된다.
발명의 일부 실시형태에서, 프로브 결합 기간의 과정 동안 온도는 하나 이상의 온도에서 프로브의 결합 거동이 결정될 수 있도록 변경될 수 있다. 일부 실시형태에서, 표적 중합체에 대한 결합 거동 또는 결합 패턴이 선택된 범위, 예를 들어 10도 내지 65도를 통한 온도의 램프와 상관되는, 용융 곡선의 유사체가 수행된다.
일부 실시형태에서, 대안으로서 또는 상이한 Tm을 갖는 올리고뉴클레오티드 프로브에 대한 온도를 변형하는 것에 부가하여, 그의 농도가 변경될 수 있고/있거나 염 조건 및/또는 pH가 변경될 수 있다. 일부 실시형태에서, 표면 상의 전기적 바이어스는 일시적인 결합을 능동적으로 촉진하기 위해 포지티브와 네거티브 사이에서 반복적으로 스위칭된다.
일부 대안적인 실시형태에서 일시적인 단일 분자 결합은 비-광학 방법에 의해 검출된다. 일부 실시형태에서, 비-광학 방법은 전기적 방법이다. 일부 실시형태에서, 일시적인 단일 분자 결합은 직접적인 여기 방법이 없고 오히려 생물발광 또는 화학발광 기전이 사용되는 비-형광 방법에 의해 검출된다.
일부 실시형태에서, 발명은 다음을 포함하는 표적 폴리뉴클레오티드를 시퀀싱하는 방법을 포함한다:
1) 표면/매트릭스로 그 길이를 따라 하나 이상의 상호작용(예를 들어, 다중 상호작용)에 의해 표적 폴리뉴클레오티드를 이동억제화하는 것;
2) 표적에서 일치가 발견되면, 비-특이적 결합 위에서 구별할 수 있는 일시적인 결합이 지속시간 동안 또는 지속성으로 발생할 수 있는 조건(올리고 농도, 염 농도, 온도) 하에서 주어진 서열 및 길이 또는 화학적 조성의 올리고뉴클레오티드로 이동억제된 표적 폴리뉴클레오티드를 플러딩하는 것;
3) 일시적인 결합 이벤트를 검출하고 그의 2D 좌표를 기록하는 것;
4) 올리고뉴클레오티드를 제거하는 것;
5) 다음 세트의 올리고뉴클레오티드를 추가하고 주어진 길이의 서열의 전체 레퍼토리가 시험되고 제거될 때까지 3 및 4를 반복하는 것; 및
6) 일시적으로 결합하는 올리고뉴클레오티드의 장소에 기반하여 이동억제된 표적 폴리뉴클레오티드의 서열을 축적하기 위한 알고리즘을 사용하는 것.
본 발명의 방법은 고유 길이 또는 이의 상당한 비율이 보존되는(예를 들어, DNA 전체 염색체 또는 ~1Mbp 분획의 경우) 매우 긴 중합체 길이를 서열화하는 데 특히 적합하다. 그러나, 일반적인 분자 생물학 방법은 DNA의 단편화를 초래한다. 임의의 피펫팅, 볼텍싱은 DNA 분자를 파괴할 수 있는 전단력을 유발하며; 뉴클레아제 오염은 핵산이 분해되도록 야기할 수 있다. 발명의 일부 실시형태에서 고유 길이 또는 고유 길이의 실질적인 고분자량(HMW) 단편은 이동억제화, 신장 및 시퀀싱이 개시되기 전에 보존된다.
따라서, 일부 실시형태에서, 발명은 다음을 포함하는 표적 폴리뉴클레오티드를 시퀀싱하는 방법을 포함한다:
1) 마이크로유체 용기 또는 장치에 세포를 배치하는 것;
2) 세포로부터 마이크로유체 환경 안으로 폴리뉴클레오티드를 추출하는 것;
3) 표면/매트릭스로 그 길이를 따라 하나 이상(예를 들어, 다중 상호작용)에 의해 표적 폴리뉴클레오티드를 이동억제화하고 연장하는 것;
4) 표적에서 일치가 발견되면, 비-특이적 결합 위에서 구별할 수 있는 일시적인 결합이 지속시간 동안 또는 지속성으로 발생할 수 있는 조건(올리고 농도, 염 농도, 온도) 하에서 주어진 서열 및 길이 또는 화학적 조성의 올리고로 이동억제된 표적 폴리뉴클레오티드를 플러딩하는 것;
5) 일시적인 결합 이벤트를 검출하고 그의 2D 좌표를 기록하는 것;
6) 올리고를 제거하는 것;
7) 주어진 길이의 서열의 전체 레퍼토리가 시험될 때까지 다른 올리고로 매번 4-6을 반복하는 것;
8) 나노미터적으로 각 결합 부위를 국지화하기 위해 단일 분자 국지화 알고리즘을 사용하는 것; 및
9) 일시적으로 결합하는 올리고뉴클레오티드의 장소에 기반하여 이동억제된 표적 폴리뉴클레오티드의 서열을 축적하기 위한 알고리즘 사용하는 것.
일부 실시형태에서, 단일 직선형 선형 중합체가 한 번에 분석되거나 고려된다. 이 경우에 2D 좌표를 기록하는 것보다는 1D 좌표만이 요구된다.
일부 실시형태에서, 폴리뉴클레오티드는 단계 1 후, 동안 또는 이전에 비교적 균질한 긴 길이(예를 들어, ~1Mb)로 단편화된다. 일부 실시형태에서, 폴리뉴클레오티드는 단계 2 후 또는 동안 비교적 균질한 긴 길이로 단편화된다. 일부 실시형태에서, 단편화는 효소적으로 수행된다. 일부 실시형태에서, 단편화는 물리적으로 수행된다. 일부 실시형태에서, 물리적 단편화는 초음파처리를 통해 된다. 일부 실시형태에서, 물리적 단편화는 이온 충격 또는 방사선을 통해 된다. 일부 실시형태에서, 물리적 단편화는 전자기 복사를 통해 된다. 일부 실시형태에서, 물리적 단편화는 UV 조명을 통해 된다. 일부 실시형태에서, UV 조명의 용량은 주어진 길이로 단편화를 수행하도록 제어된다. 일부 실시형태에서, 물리적 단편화는 UV 조명 및 염료(예를 들어, YOYO-1)를 사용한 염색의 조합을 통해 된다. 일부 실시형태에서, 단편화 과정은 물리적 작용 또는 시약의 첨가에 의해 중단된다. 일부 실시형태에서, 단편화 과정을 중단시키는 시약은 베타-메르캅토에탄올(BME)과 같은 환원제이다.
일부 실시형태에서, 본 발명은 다음을 포함한다:
1) 마이크로유체 용기 또는 장치에 세포를 배치하는 것;
2) 개재하는 염료로 세포를 염색하는 것;
3) 개재하는 염료 매개 단편화를 수행하기 위해 사전-결정된 용량의 UV 광을 제공하는 것;
4) 선택적으로 단편화를 중단시키는 것;
5) 세포로부터 마이크로유체 환경 안으로 폴리뉴클레오티드를 추출하는 것;
6) 폴리뉴클레오티드를 이동억제화하고 연장하는 것; 및
7) 이동억제화되고 연장된 폴리뉴클레오티드에 대한 제자리 시퀀싱을 하는 것.
이들 단계는 단리된 단일 세포 상에 작용하는 것들을 포함하는 발명의 다양한 실시형태에 추가될 수 있다.
일부 실시형태에서, 각각의 세포는 별도로 분리되고, 그의 DNA는 마이크로유체 용기 또는 장치에서 별도로 추출되고 별도로 시퀀싱된다. 일부 실시형태에서, 추출은 세제 및 또는 단백질분해효소로 처리함에 의해 발생한다. 일부 실시형태에서, 킬레이트화제(예를 들어, EDTA)는 뉴클레아제에 의해 요구되는 2가 양이온을 제거하기 위해 용액에 제공된다. 일부 실시형태에서, 그리고 특정 샘플 공급원으로 2가 양이온의 농도는 분자 생물학에서 정상적으로 사용되는 것보다 더 높다.
일부 유리한 실시형태에서, 본 발명은 유력한 시퀀싱 기술보다 더 빠르다. 일부 유리한 실시형태에서, 본 발명은 유력한 시퀀싱 기술보다 저-비용이다. 일부 유리한 실시형태에서, 본 발명은 유력한 시퀀싱 기술보다 더 긴 판독을 제공한다. 일부 유리한 실시형태에서, 본 발명은 유력한 시퀀싱 기술보다 더 높은 정확도를 제공한다. 일부 유리한 실시형태에서, 본 발명은 유력한 시퀀싱 기술보다 더 높은 민감도를 제공한다. 가장 유리한 실시형태에서 본 발명은 전술한 모든 이점을 제공한다. 더욱이, 일부 유리한 실시형태에서, 전체 게놈은 유동 셀, 기기 및 컴퓨터 전력의 비용이 비용을 추가함에도 불구하고 단지 몇 달러 이하의 비용이 드는 소량의 생화학적 시약을 사용하여 1시간 이내에 서열화될 수 있다. 예를 들어, 20개 염기 표지화 부위가 있는 5mer는 약 $1에 구입할 수 있고 전체 레퍼토리는 $1000이다. 약 $50에 대한 표지화 부위에 안정적으로 결합할 수 있는 형광 표지 올리고. 마이크로몰 규모로 합성된 이러한 올리고의 약 100만분의 1이 사용되어 실행당 비용이 1달러 미만으로 된다.
발명의 방법은 효소를 필요로 하지 않고 프로브(올리고)의 묽은 용액만을 소비한다는 점에서 주목할 만하다. 따라서 방법은 비용이 저렴하다. 시퀀싱 화학은 단순한 프로브와 완충액만 소비하고 결과적으로 장비와 플라스틱-제품이 비용을 지배한다.
발명의 놀라운 특징은 단일 분자 연장된 표적이 수백 번의 시약 교환 및 세정 주기에 걸쳐 안정적으로 유지된다는 것이다.
단일 분자 국지화에 의해 가능해진 발명의 주목할만한 양태는 완전히 점유될 때 10nm 피치의 정렬된 어레이가 ㎠당 1조 개 표적 분자를 제공할 것이다는 것이다.
발명의 또 다른 주목할만한 양태는 표적에서 단일 염기 치환이 참조 서열에 대해 10개 5mer 프로브(예를 들어)가 변경되게 한다는 것이다: 이전에 결합하지 않았을 5개 프로브가 이제 결합하고 이전에 결합했던 5개의 프로브는 이제 결합하지 않는다. 이 변화는 다른 가닥에서도 역시 관찰될 수 있다.
그 바람직한 실시형태에서 본 발명은 다음 요소 중 2개 이상을 포함함에 의해 이전 기술과 구별된다: 폴리뉴클레오티드가 이동억제화되기 전에 사전 라이브러리 준비가 없음; 일부 실시형태에서, 폴리뉴클레오티드의 한 방향으로의 정렬; 일시적인 결합; 반복적인 결합; 폴리뉴클레오티드에서 연속하는 서열은 서열 정보의 비트를 함께 스티칭함에 의해 구성된다.
발명의 일부 실시형태에서 실질적으로 방법을 수행하는 데 필요한 모든 시약은 분석이 개시되기 전에 유체 장치 상에 사전-장입된다. 일부 실시형태에서, 시약(예를 들어, 프로브)은 장치에 건조 상태로 있고 존재하고 반응이 진행되기 전에 습윤되고 용해된다.
일부 실시형태에서, 방법은 시약 교환 없이 이미징의 과정 동안 단일 중합체에 대한 다중 결합 이벤트를 포함하는 표적 생체고분자를 시퀀싱하는 수단을 포함한다. 일부 실시형태에서, 다중 결합 이벤트는 단일 생체고분자 상의 복수의 장소 각각에 단독으로 또는 다중으로 발생한다.
일부 실시형태에서, 시퀀싱 방법은 단일 폴리뉴클레오티드에 대한 서열 프로브의 일시적인 결합을 포함하며 여기서 상기 프로브는 단일 폴리뉴클레오티드 상의 다중 중첩 부위 각각에 실질적으로 상보적이다. 일부 실시형태에서, 중첩하는 부위 각각은 방법의 장소적 정확도 및 정밀도에 의해 분해된다.
일부 실시형태에서, 시퀀싱 방법은 단일 폴리뉴클레오티드에 대한 서열 프로브의 레퍼토리의 일시적인 결합을 포함하며 여기서 레퍼토리에서 복수의 프로브는 각각 단일 폴리뉴클레오티드 상의 서열 비트에 실질적으로 상보적이고, 여기서 중첩하는 부위에 결합하는 2개 이상 프로브의 결합은 잠정적으로 분리된다.
일부 실시형태에서, 시퀀싱 방법은 서열 프로브의 타일링 세트의 단일 폴리뉴클레오티드에 대한 일시적인 결합을 포함하며 여기서 세트에서의 복수의 프로브는 각각 단일 폴리뉴클레오티드 상의 서열 비트에 실질적으로 상보적이고, 여기서 중첩하는 부위/비트에 대한 2개 이상의 프로브의 결합은 잠정적으로 분리된다.
일부 실시형태에서, 시퀀싱 방법은 단일 폴리뉴클레오티드에 대한 서열 프로브의 패널의 결합을 포함하며 여기서 패널에서 복수의 프로브는 각각 단일 폴리뉴클레오티드 상의 서열 비트에 실질적으로 상보적이다. 일부 이러한 실시형태에서, 서열 비트는 동일하거나 상이한 프로브에 의해 여러 번 조사된다.
일부 실시형태에서, 발명은 표적 단백질 상의 아미노-산 서열을 분석하는 방법을 포함한다. 일부 실시형태에서, 발명은 표적 폴리펩티드 상의 아미노산 서열을 분석하는 방법을 포함한다. 일부 실시형태에서, 발명은 표적 폴리뉴클레오티드 상의 펩티드 변형뿐만 아니라 아미노-산 서열을 분석하는 방법을 포함한다.
일부 실시형태에서, 발명의 방법은 폴리펩티드의 시퀀싱에 적용된다. 20개 아미노산 각각은 N-레코그닌, 나노바디, 항체, 압타머 등을 포함하는 상응하는 특이적 프로브에 의해 결합된다. 각 프로브의 결합은 폴리펩티드 사슬 내의 상응하는 각각의 아미노산에 특이적이다.
일부 실시형태에서, 폴리펩타이드에서 서브-유닛의 순서가 결정된다. 일부 실시형태에서, 결합은 결합 부위의 대용물에 대한 것이다. 일부 실시형태에서, 대용물은 특정 아미노산 또는 펩티드 서열에 부착된 태그이다. 일시적인 결합은 대용물 태그에 대한 것이다.
일부 실시형태에서, 발명은 중합체의 정체성을 결정하는 것을 포함한다. 일부 실시형태에서, 발명은 세포 또는 조직의 정체성을 결정하는 것을 포함한다. 일부 실시형태에서, 발명은 유기체의 정체성을 결정하는 것을 포함한다. 일부 실시형태에서, 발명은 개체의 정체성을 결정하는 것을 포함한다. 일부 실시형태에서, 본 발명의 방법은 단일 세포 시퀀싱에 적용된다.
일부 실시형태에서, 시퀀싱은 세포 내부에서 제자리에서 수행된다. 세포의 내용물은 매트릭스로 지칭될 수 있고 일시적인 결합이 개시되기 전에 고정되고 변성된다. 일부 실시형태에서, 세포는 단층을 형성할 수 있거나 다른 실시형태에서는 조직 또는 오르가노이드와 같은 3D 구조체의 일부이다. 다중-광자 현미경 및 광 시트 현미경과 같은 3D 구조에서 이벤트를 검출할 수 있는 이미징 방법이 사용될 수 있다. 매트릭스나 겔에 분자를 고정하고 그 안에서 조사는 희귀한 분자를 포함하여 모든 분자를 포획하는 능력을 제공한다. 일부 실시형태에서, 세포(예를 들어, 순환 종양 세포 CTC)는 표면 상에 분산되고 서열화된다. 일부 실시형태에서, 세포는 각 세포가 다른 세포로부터 잘 단리되도록 표면 상에 분산된다. 그런 다음 세포는 용리될 수 있고 그의 분자 목록은 표면 상에서 포획될 수 있고 발명의 시퀀싱 방법에 적용될 수 있다.
일부 이러한 실시형태에서, 방법은 다음을 포함한다:
I) 세포 내부의 폴리뉴클레오티드의 장소를 고정하는 것;
II) 주어진 특이성의 올리고를 첨가하고 단일 분자 국지화를 사용하여 모든 결합 이벤트의 장소를 결정하는 것;
III) 상이한 특이성의 올리고를 첨가하고 단일 분자 국지화를 사용하여 모든 결합 이벤트의 장소를 결정하는 것;
IV) 단계 II-III을 반복하는 것; 및
V) 올리고뉴클레오티드의 결합의 장소를 축적함에 의해 세포 내의 폴리뉴클레오티드의 선형 경로 또는 영역 장소의 서열을 재구성하는 것.
위의 일부 실시형태에서 기전(FRET, 형광성 표지, 켄칭된 표지 등)은 개별 점 원의 검출을 어렵게 만드는 배경 형광/광 산란을 최소화하는 데 사용된다. 일부 실시형태에서, 상기 중 RNAse가 발명이 나머지 DNA에 적용되기 전에 RNA를 제거하는 데 사용된다. 일부 실시형태에서, 상기 중, 듀플렉스 DNA는 올리고의 첨가 전에 제자리에서 변성된다.
일부 실시형태에서, 변형의 장소는 또한 단일 분자 국지화를 사용함에 의해 결정되어 5 메틸 C(5MC)와 같은 변형의 장소를 결정한다.
발명의 일부 실시형태는 디지털 분자 계수에서 문제를 해결하도록 설계되었다. 분자를 계수하는데 있어 한 가지 문제는 재현가능한 고정밀 데이터를 얻는 것이다. 분자 상호작용의 확률론적 특성으로 인해 종말-점 디지털 계수 검정은 종말-점 측정이 수행될 때 존재하지 않는 특정 이벤트를 놓칠 수 있거나 가짜의 이벤트(예를 들어, 비-특이적 결합 또는 부분 일치)를 계산할 수 있다. 이 이유로 여러 번(또는 반복적으로) 결합하는 일시적인 결합 프로브에 의해 계수되는 분자가 검출되는 디지털 계수 검정이 더 적합하다. 다중 결합 이벤트는 실제가 감지되고 있다는 확신을 제공하고 감지되는 것 또는 감지되는 것의 일부 특성(예를 들어, 부분적 일치)을 결정할 수 있다.
따라서, 일부 실시형태에서, 발명은 다음을 포함하는 샘플에서 분자의 유형(예를 들어, 특정 서열을 함유하는 DNA 단편)의 수를 계수하는(또는 카피 수를 결정하는) 방법을 포함한다:
a) 프로브(들)가 분자에 일시적으로 결합할 수 있는 조건하에서 하나 이상의 프로브 종을 첨가하는 것;
b) 검출기에서 분자 상의 개별 결합 이벤트를 지속적으로 모니터링하고 일정 기간 동안 기록하는 것;
c) 비-인증 상호작용을 걸러내고 인증 상호작용의 수를 결정하고 이에 의해 분자의 카피 수를 결정하기 위해 단계 b로부터의 데이터를 분석하는 것; 및
d) 선택적으로 분자는 단계 a 전에 표면 또는 매트릭스에 이동억제된다.
일부 실시형태에서, 분자의 유형의 열거는 일시적인 결합 상호작용의 창발적 특성의 결과이다. 하나의 프로브 결합 이벤트 또는 결합의 종말-점 결정은 분자의 유형의 수에 대한 진정한 값을 결정하기에 충분하지 않으며; 진정한 결정은 밀과 겨를 분리할 수 있는 (비-진정한 이벤트로부터 진정한 이벤트) 다중 결합 이벤트의 분석으로부터 나온다(이의 창발적 특성이다).
일부 실시형태에서, 발명은 다음을 포함하는 하나 이상의 프로브와 분자 사이의 상호작용을 계수하는 방법을 포함한다:
a) 프로브(들)가 분자에 일시적으로 결합할 수 있는 조건하에서 주어진 특이성의 하나 이상의 프로브를 첨가하는 것;
b) 검출기에서 분자 상의 개별 결합 이벤트를 지속적으로 모니터링하고 일정 기간 동안 기록하는 것;
c) 기간 동안 발생한 상호작용의 수를 결정하기 위해 단계 b로부터의 데이터를 분석하는 것;
d) 선택적으로 상이한 특이성의 하나 이상의 프로브를 추가하고 단계 b-c를 반복하는 것; 및
e) 선택적으로 분자는 단계 a 전에 표면 또는 매트릭스 상에 이동억제된다. 일부 이러한 실시형태에서, 단계 c에서 상호작용은 각 상호작용의 지속시간에 의해 분류되고 각 분류에 속하는 이벤트의 수가 기록된다. 이 실시형태는, 예를 들어 서열과 상이한 프로브 사이의 일치도가 측정되어 지는 경우에 유용할 수 있다. 이 실시형태는 진정한 이벤트를 비-진정한 이벤트로부터 구별하기 위해 이전 실시형태에 대해 적용될 수 있다.
무엇이 진정한 이벤트를 구성하고 무엇이 비-진정한 이벤트를 구성하는지를 결정하기 위해 다수의 기준이 확립될 수 있으며, 예를 들어, 결합 지속시간 컷-오프는 진정한 이벤트를 비-진정한 이벤트로부터 분리하는 하나의 기준이다.
측정되어야 하는 고밀도의 분자를 함유하는 밀집된 장을 다루는 PAINT와 같은 특정 단일 분자 국지화 방법에서, 국지화 정확도는 (1) 수집된 광자의 수(국지화의 정도는 광자의 수에 반비례하므로 서브-나노미터 또는 낮은 나노미터 수준으로 국지화를 얻기 위해 많은 수의 광자가 요구된다); (2) 낮은 의무 주기, 즉 각 결합 이벤트가 지속되는 시간이 짧아, 결합 이벤트가 확률론적이기 때문에 통계적으로 단편적이고 따라서 개별적으로 분해가능한 신호만이 주어진 시간에 방출된다는 것을 의미하는 것에 의존한다.
일부 대안적인 실시형태에서, 분자의 장이 밀집되지 않거나 고-밀도가 아닌 경우 또는 연장되거나 신장된 중합체를 따른 부위가 드문 경우, 낮은 의무 주기가 요구되지 않는다. 신호 또는 검출가능한 광자 방출은 오래-지속될 수 있고 검출되는 지속시간은 단일 분자 국지화 알고리즘을 사용하여 국지화를 수행할 수 있는 정도를 결정한다. 더 많은 광자를 수집하기 위해 긴 노출 시간을 사용할 수 있다. 이러한 실시형태에서 프로브의 광탈색을 최소화하기 위해 펄스 또는 스트로보스코프 조명을 사용하는 것이 유용하다. 또한 염료로부터의 신호는 종종 더 낮은 파장의 광으로 여기에 의해 복구될 수 있다. 따라서 검출은 다음을 포함한다:
1) 파장 1로 조명;
2) 신호의 검출;
3) 파장 2로 조명; 및
4) 충분한 광자가 요구된 국지화를 위해 수집될 때까지 1-3을 반복한다.
폴리뉴클레오티드의 길이를 따라 5mer 프로브의 장소를 결정하기 위해 이것이 시퀀싱에 적용될 때, 서열 비트는 수 나노미터로 국지화될 수 있고 프로브의 레퍼토리 각각의 장소를 사용하여 결합 이벤트의 레퍼토리의 장소의 창발적 특성인 폴리뉴클레오티드의 서열을 함께 모을 수 있다. 일시적인 결합을 필요로 하지 않는 이 실시형태는 그럼에도 불구하고 신호가 나노미터 또는 서브-나노미터 차원에 국지화되기 때문에 신규한다.
일부 실시형태에서, 폴리뉴클레오티드는 액체에서 겔로의 전이를 겪을 수 있는 매질을 함유하는 유로에 배치되어, 폴리뉴클레오티드가 잘 분산되고 개별적으로 단리된 후, 졸-겔 전이가 유도될 수 있어 그의 장소에 폴리뉴클레오티드를 고정한다. 본 발명의 프로브는 그 다음 겔 상에 포획된 폴리뉴클레오티드에 적용될 수 있다. 폴리뉴클레오티드가 (한 방향으로 정렬되지만) 3D로 분산될 것이기 때문에, 광-시트 현미경과 같은 이미징 방법을 사용하여 2D 슬라이스를 이미지화할 수 있다.
일부 실시형태에서, 용액은 2개의 상인, 액체상 및 고체(또는 겔)상을 갖는다. 폴리뉴클레오티드는 처음에 연장되고 액상에 분포된 다음 상을 고체/겔 상으로 변경함에 의해 고정된다(예를 들어, 가열함에 의해, 또는 폴리아크릴아미드의 경우 보조-인자를 추가하거나 시간이 지남에 의함). 일부 경우에 폴리뉴클레오티드는 고체/겔 상에서 연장될 수 있다. 발명의 시퀀싱 화학은 그 다음 고체 상에서 3차원으로 단리된 정적 폴리뉴클레오티드에 적용된다. 그런 다음 시퀀싱 반응의 검출은 공초점, 다중-광자, 광 시트 현미경, 회전 디스크 공초점 현미경 등에 의해 수행된다. 이 실시형태는 샘플에서 실질적으로 모든 분자가 (단지 표면 상에 포획될 수 있는 것뿐 아니라) 서열화될 필요가 있는 경우 특히 관련이 있다. 폴리뉴클레오티드는 폴리(N-이소프로필아크릴아미드)를 포함하는 매질에서 처리되며; 가열은 3D 공간에서 폴리뉴클레오티드를 고정하지만 하이드로겔을 통한 시약의 교환을 허용하는 하이드로겔을 생성하는 상 전이로 이어진다(Eriksen 외 Biomicrofluidics 5:31101-311014 2011).
일부 실시형태에서, 중합체는 일 말단에서 포획된 다음 중합체가 배치되는 액체 매질의 흐름으로 인해 중합체 상의 힘으로 인해 곧게 펴지거나 신장된다. 액체/졸 상은 겔 상으로 전이되어 분자가 정적이 된다.
일부 방법에서 중합체가 겔에 배치되거나 배치되게 될 때 중합체의 길이를 따라 특징(예를 들어, 서열 버트 또는 아미노산)의 상대적으로 고정되거나 정적인 위치는 단일 분자 국지화 방법에 의해 결정되어 지는 중합체의 길이를 따라 표지의 장소를 허용한다.
따라서 이들 실시형태는 다음을 포함한다:
I) 겔 또는 매트릭스에서 단일 배향으로 폴리뉴클레오티드를 정렬하는 것;
II) 올리고가 폴리뉴클레오티드와 일시적인 상호작용을 할 수 있도록 겔 또는 매트릭스를 통해 주어진 특이성의 형광 올리고를 유동하게 하는 것;
III) 올리고가 폴리뉴클레오티드와 일시적인 상호작용을 할 수 있도록 겔 또는 매트릭스를 통해 상이한 특이성의 형광 올리고를 유동하게 하는 것;
IV) 단계 III를 반복하는 것; 및
V) 각 특이성의 올리고의 결합 장소에 대한 정보를 사용하여 표적 폴리뉴클레오티드의 서열을 결정하는 것.
일부 실시형태에서, 서열 정보는 서열-특이적 핵산 결합 단백질, 예컨대 제한 효소, 닉킹 엔도뉴클레아제 및 메틸트랜스퍼라제의 일시적인 결합에 의해 수득된다. 많은 양의 서열 공간을 포괄하는 상업적으로 이용가능한 그러한 단백질의 큰 레퍼토리가 있다. 회문 서열을 인식하는 다수의 서열 효소가 이용가능하다. 3가지 앞서 언급된 단백질의 하나의 특징은 그것이 이중-가닥 DNA에서 서열을 인식한다는 것이다. 이들 프로브는 완전한 레퍼토리로부터 일부 올리고뉴클레오티드, 예를 들어 일반적인 반응 조건하에서 상대적으로 비효율적인 프로브로 만드는 자가-자가 또는 헤어핀 상호작용을 겪는 일부 올리고뉴클레오티드를 대체하는 데 사용할 수 있다.
항체 또는 결합 단백질의 일시적인 결합은 염 농도와 같은 반응 조건의 조작에 의해 수행될 수 있다. 일부 실시형태에서, 염 농도는 일시적인 결합을 수행하기 위해 >100mM으로 상승된다. 일부 실시형태에서, 염 농도는 >200mM으로 상승된다. 일부 실시형태에서, 염 농도는 >300mM으로 상승된다. 일부 실시형태에서, 일시적인 결합은 완충액을 저염에서 고-염으로 교환함에 의해 능동적으로 수행된다. 일부 실시형태에서, 서열 또는 변형(예를 들어, 메틸화) 특이적 결합 단백질은 안정적으로 또는 일시적으로 결합하도록 허용되고, 그의 장소는 그 위에 접합된 표지의 단일 분자 국지화 또는 단백질에 직접적으로 또는 태그를 통한 결합에 의해 결정된다.
일부 실시형태에서, 반응이 역전되고 프로브가 이동억제화되고 용액 내 분자(분석되어 지는 표적)와의 일시적인 상호작용이 결정된다.
발명의 일부 실시형태에서 분자는 표면 또는 매트릭스 상에 이동억제화되지 않고 용액에서 자유롭게 확산된다. 검출은 형광 상관 분광법(FCS)에 의해 수행된다. 일부 이러한 실시형태에서, 분자는 (예를 들어, 더 크고 그리고) 프로브보다 용액을 통해 더 천천히 이동한다. 따라서 각 공초점 지점에서 분자가 공초점 지점에서 확산되기 전에 분자와 프로브의 많은 추정 결합 이벤트가 기록될 수 있으며; 이들 결합 이벤트는 교차-상관될 것이다. 결합 교차-상관은 프로브가 공초점 지점에 머무는 시간에 의해 비-결합 교차-상관과 구별될 수 있다. 일부 실시형태에서, 올리고의 인코딩된 레퍼토리가 제공되고 결합 올리고의 정체성(통계적으로 한 번에 하나씩 발생함)은 형광 결합 신호를 디코딩함에 의해 결정된다.
일부 이러한 실시형태에서, 방법은 다음을 포함한다:
I) 폴리뉴클레오티드를 용액 안으로 첨가하는 것;
II) 단일 폴리뉴클레오티드를 단리하는 공초점 부피를 조명하는 것;
III) 올리고가 폴리뉴클레오티드와 일시적인 상호작용을 할 수 있도록 주어진 특이성의 형광 올리고를 유동하게 하거나 케이징 해제하는 것;
IV) 올리고가 폴리뉴클레오티드와 일시적인 상호작용을 할 수 있고 그의 결합 특성이 결정되도록 상이한 특이성의 형광 올리고를 유동하게 하거나 케이징 해제하는 것;
V) 단계 IV를 반복하는 것; 및
VI) 각 특이성의 올리고에 대해 검출된 결합 이벤트의 지속시간 및 지속성에 대한 정보를 사용하여 표적 폴리뉴클레오티드의 서열을 결정하는 것.
일부 실시형태에서, 결합 특성은 사전-결정된 역치를 넘어서는 결합 지속시간이 발생하는지 여부를 포함한다.
일부 실시형태에서, 폴리뉴클레오티드는 용액에 남아 있고, 그의 벌크는 이것이 상대적으로 동일한 장소 또는 공초점 부피 내에 남아 있도록 허용하고 레퍼토리의 올리고는 부피를 통해 하나씩 (또는 세트별로) 통과되거나 또는 바람직하게는 인코딩된 레퍼토리가 모두 동시에 추가된다. 일부 실시형태에서, 폴리뉴클레오티드의 벌크는 물리적 트랩, 예를 들어, 레이저 트랩핑, 정전기 트랩핑에 의해 고정된 장소에서 트랩되도록 허용한다. 일부 실시형태에서, 다중 폴리뉴클레오티드는 다중 광학 트랩에 의해 개별적으로 트랩될 수 있다.
일부 실시형태에서, 폴리뉴클레오티드는 용기, 예를 들어 비혼화성 지질 소포 내에 국한된다. 용기는 프로브의 교환을 허용할 수 있지만 폴리뉴클레오티드의 탈출은 허용하지 않는다.
일부 실시형태에서 공초점 부피는 다중-광자 부피이다.
일부 실시형태에서, 용액 내의 중합체는 고정되어 있지 않으며; 중합체는 레퍼토리의 상이한 프로브를 운반하는 잘 단리된 유동 스트림(예를 들어, 층류 유동 스트림)의 방향에 수직 방향으로 이동한다. 이동은 그 궤적이 폴리뉴클레오티드의 이동의 방향에 의해 눈에 띄게 영향을 받지 않는 유동 스트림에서의 올리고보다 분자량이 더 큰 폴리뉴클레오티드에 작용하는 전기영동(즉, 양으로 바이어스된 전극 쪽으로 향함)이다.
일부 실시형태에서, 폴리뉴클레오티드는 일 말단에서만 이동억제화되지만 표면(또는 예를 들어 광학적으로 트랩된 비드에 이동억제화될 때 검출의 2D 평면)에 평행한 유동 스트림으로 신장되고 일 말단 이외의 그 길이를 따라 장소로부터 표면과의 장기-생존하는 상호작용을 만들지 않는다. 일부 실시형태에서, 일 말단에 이동억제된 폴리뉴클레오티드는 단일 가닥이다. 그런 다음 레퍼토리의 올리고는 유체 부피에서 교환된다. 일부 실시형태에서, 올리고의 유동 방향은 폴리뉴클레오티드의 연장의 방향과 동일하다. 일부 실시형태에서, 올리고의 벌크가 유동 방향을 따라 이동하는 경우에도, 개별 올리고 분자의 검출가능한 반복된 일시적인 결합이 연장된 중합체에서 상보적 장소에 발생한다.
일부 실시형태에서, 폴리뉴클레오티드는 유동 방향에 수직인 그 이동억제화 지점으로부터 신장된다. 이것은 흐름 방향에 수직인 전기장을 제공함에 의해 수행될 수 있다. 유동은 1밀리바에서 최대 1바의 압력을 적용하여 압력 구동 유동에 의해 실행되고 전기장은, 폴리뉴클레오티드의 말단이 이동억제화는 표면이 음성으로 되고 유동 셀의 다른 표면은 폴리뉴클레오티드가 끌어당겨지는 양성으로 되어, 센티미터당 1 내지 100볼트 사이가 될 수 있다.
일부 이러한 실시형태에서, 방법은 다음을 포함한다:
I. 폴리뉴클레오티드를 일 말단에 의해 표면에 부착하고 물리적 기전에 의해 한 방향으로 연장하는 것;
II. 올리고가 폴리뉴클레오티드와 일시적인 상호작용을 할 수 있도록 주어진 특이성의 형광성 올리고를 유동시키는 것;
III. 올리고가 폴리뉴클레오티드와 일시적인 상호작용을 할 수 있도록 상이한 특이성의 형광성 올리고를 유동시키는 것;
IV. 단계 III을 반복하는 것; 및
V. 각 특이성의 올리고에 대해 검출된 결합 이벤트의 지속시간 및 지속성에 대한 정보를 사용하여 표적 폴리뉴클레오티드의 서열을 결정하는 것
일부 실시형태에서, 물리적 기전은 유동 신장, 전기영동 신장, 또는 폴리뉴클레오티드의 일 말단에 부착된 부피가 큰 실체(예를 들어, 비드)에 대한 작용으로 인한 신장이다. 그런 다음 부피가 큰 실체는 레이저 트래핑, 정전기 트래핑(하전된 경우), 자기 트래핑(상자성인 경우)의 대상이 될 수 있다.
상기 방법의 폴리뉴클레오티드가 게놈 DNA인 경우, 방법은 어셈블리된 폴리뉴클레오티드 서열을 중첩하여 염색체를 어셈블리하는 것을 추가로 포함할 수 있다.
일부 실시형태에서, 발명은 다음을 포함하는 분석을 위한 생체거대분자를 전달하는 방법에 관한 것이다:
1. 생체거대분자를 포함하는 보호 실체를 제공하는 것으로, 상기 보호 실체는 생체거대분자를 그 자연 상태에 가깝게 보존하는 것;
2. 생체거대분자를 포함하는 보호 실체를 분석 영역의 근처에 배치하는 것;
3. 생체거대분자를 보호 실체로부터 분석 영역 안으로 방출하는 것; 및
4. 본 발명에 기술된 방법에 따라 생체거대분자를 분석하는 것.
일부 실시형태에서, 프로브는 단 하나의 정의된 뉴클레오티드(예를 들어, NNNXNNN, 여기서 X는 정의되거나 코딩된 뉴클레오티드임)에 따라 표지된다. 일부 실시형태에서, NNNXNNN 올리고의 레퍼토리는 위치 X= A, C, G 또는 T를 포함하고 위치 N은 A, C, G 및 T 중 하나이다. 올리고에서의 중심 염기는 그의 정체성에 따라, A, C, G 또는 T로 상이하게 표지된다. 일부 실시형태에서, NNNXNNN 올리고의 4개 라이브러리(예를 들어, 올리고뉴클레오티드의 세트를 포함하는 각각의 라이브러리: NNNANNN, NNNTNNN, NNNGNNN 및 NNCNNN)는 각각 차등적으로 표지되고, 시퀀싱 과정 동안 시약 교환이 필요하지 않은 균질 반응에 사용된다.
상보적 핵산 서열(예를 들어, 올리고 프로브)을 사용하여 핵산 서열을 검출하는 것은 매우 쉽다. 올리고뉴클레오티드에 의해 결합되는 서열(예를 들어, 5개 염기)은 본 명세서에서 서열 비트로 지칭된다. 일부 검정, 예를 들어 Fodor의 유전자-칩 검정(예를 들어, Chee 등 Science 274:610-4.1996에 기술된 바와 같음)에서, 프로브는 이동억제화되고 표적은 표지되고 용액에 제공된다. 많은 다른 검정에서 표적은 이동억제화되고 프로브는 표지되고 용액에 제공된다(예를 들어, Southern EM, Journal of Molecular Biology, 98: 503-517 (1975)에 기술된 바와 같이 Southern Blot을 통함). 이러한 검정에서, 프로브는 왓슨-크릭 상호작용에 의해 표적 핵산 서열에 혼성화되고, 과잉 표지된 프로브는 세정되고, 나머지 결합된 프로브가 검출된다. 혼성화는 세정을 견디고 검출 동안 제자리에 유지될 만큼 충분히 안정하기 위해 올바른 결합을 필요로 한다. 올리고뉴클레오티드의 레퍼토리의 혼성화에 의해서만 이동억제된 폴리뉴클레오티드를 시퀀싱을 위한 방법이 제안되었고(예를 들어, Drmanac et al Science, 260, 1649-1652, 1993에 기술된 바와 같음) 이 '혼성화에 의한 시퀀싱'(SbH) 접근방식은 작은 게놈의 재-시퀀싱에 대해 입증되었다(예를 들어, Pihlak et al Nature, Biotechnlogy 26: 676-684 2008에 기술된 바와 같음). Mir(WO2002074988, 2001)는 표면 상에 신장된 폴리뉴클레오티드의 SbH를 추가로 제안하였다. 앞서 언급된 모든 프로빙 및 시퀀싱 방법은 종말-점 검정이고 프로브가 상보적 폴리뉴클레오티드 표적과 장기-생존하는 상호작용을 형성할 것을 요한다. 임의의 핵산 상호작용에는 오프-속도를 갖지만 핵산 검정의 경우 오프-속도는 검정에 유의한 영향을 미치지 않는 지점으로 느리다. 프로브가 안정적으로 결합되면 일련의 다음 프로브가 혼성화되기 전에 프로브를 제거하기 위해 엄격한 스트리핑 프로토콜(고온 포함)과 관련된 특정 단계를 수행해야 한다. 조건의 가혹함은 DNA를 손상시키거나 표면에서 표적 DNA를 제거할 수 있고, 발명자의 경험에 따르면 상당한 양의 프로브가 효과적으로 영구적으로 붙어 있는 상태로 남아 있다.
본 발명은 단기-생존하는 표적 서열과 프로브의 왓슨-크릭 상호작용을 포함하는 새롭고 반-직관적인 시퀀싱 접근방식이다. 프로브의 화학 구조(예를 들어, 서열, 3D 구조)는 사용된 조건하에서 장기-생존하는 안정적인 상호작용을 형성하지 않도록 설계되었다. 오히려 프로브는 대부분의 프로브 분자가 표적에 결합한 다음 검출 과정 동안 결합이 해제되도록 설계된다. 이는 대부분의 프로브가 검출 동안 결합된 상태로 유지될 것으로 예상되는 혼성화와 다르다.
발명적 단계는 시퀀싱에서 혼성화 기반 시도가 안정한 장기-생존하는 결합을 포함하는 경우, 본 접근방식은 특히 단기-생존하는 불안정한 결합을 필요로 한다는 사실을 포함한다. 전체 레퍼토리(1024개 올리고)를 쉽게 생성하고 실행하기에 충분히 짧은 5개 조사 염기만큼 짧은 올리고뉴클레오티드의 불안정하고 일시적인 반복 결합에 대한 조건이 발견되었다.
발명은 SbH와 몇 가지 유사점이 있지만, SbH의 본질적인 문제를 겪지는 않는다: 하나의 프로브가 결합되면, 예를 들어 5mer가 결합되면 그 풋프린트는 5개 염기의 서열을 커버할 것이고 부분적으로 결합에서 5개 염기 풋프린트와 중첩할 다른 프로브를 억제하거나 방해한다. 한 번에 단지 하나의 프로브를 사용하는 경우에도 프로브의 하위-서열이 탠덤으로 반복되면 제1 결합 올리고는 인접 위치에서 정보가 획득되는 것을 방지할 것이다. 그러나, 본 발명은 일시적인 결합을 포함하기 때문에, 제1 프로브가 떨어져서, 서열이 제2 프로브에 의해 결합에 대해 접근가능하게 할 것이고 제2 프로브는 떨어져서 제3 프로브의 결합을 허용하는 식이다. 현재 접근방식의 또 다른 장점은 반복 결합에 의해 각 서열 비트의 유효성을 입증되는 반면 SbH에서는 어떤 것이 일단 결합되면 그것은 고정되어 특이적 또는 비-특이적 결합의 결과인지 결정하기가 어렵다는 것이다. 부가하여, 불일치의 안정적인 결합은 SbH에 문제를 일으키지만, 본 발명의 경우에서 불일치는 결합의 지속시간, 장기간 결합의 빈도 등에 의해 완벽한 일치와 구별될 수 있다. 불일치의 일부의 경우에서 예를 들어 4개 염기는 왓슨-크릭 염기 쌍을 형성할 수 있고 5번째는 염기 쌍을 형성하지 않는다. 다른 경우에서, 예를 들어 4개는 왓슨-크릭 염기쌍을 형성하고 5번째는 비-왓슨 크릭 염기쌍을 형성한다. 일부 경우(예를 들어, 비-왓슨-크릭 결합이 형성되는 경우)에 일부 왓슨-크릭 염기쌍과 하나 이상의 비-왓슨-크릭 염기-쌍을 갖는 비-완벽한 일치가 실제로는 완벽한 일치보다 더 안정한 상호작용을 형성할 수 있고, 결합의 평균 지속시간이 더 길다. 이러한 모든 가능성에 대한 경험적 데이터를 수집하면 본 발명의 시퀀싱 기술의 성능이 향상될 것이다. 기계 학습은 전체 세트의 거작을 예측하기 위해 실험의 서브-세트에서 이러한 거동을 학습하는 데 사용될 수 있다.
발명의 짧은 올리고뉴클레오티드의 사용은 표적 서열에 대한 검색이 전형적으로 3, 4, 5, 또는 6개 일치를 찾는 것을 포함하는데, 이는 매우 신속하게 일어날 수 있고 표적 서열의 발생은 매우 빈번하다는 이점을 갖는다. 일부 실시형태에서, 실질적으로 모든 일치 및 불일치 부위가 검출의 과정 동안 일시적으로 결합되는 반면, 일부 실시형태에서는 단지 부위의 분획만이 결합된다.
본 발명의 폴리뉴클레오티드 시퀀싱은 올리고의 레퍼토리의 결합 특성의 창발적인 특성이다. 일반적으로 SbH 및 혼성화 검정은 합성 올리고뉴클레오티드의 왓슨-크릭 규칙에 따라 그 표적화된 천연 폴리뉴클레오티드에 대한 완벽한 일치의 결합으로부터 정보를 얻고 불일치를 포함하는 결합을 제거하기 위해 노력한다. 본 발명의 일부 실시형태는 각각의 올리고뉴클레오티드가 분석 중인 폴리뉴클레오티드와 함께 갖는 결합 상호작용(역치 결합 지속시간 초과)의 레퍼토리를 조사한다. 일부 실시형태에서, 시퀀싱은 완벽한 일치로부터 서열을 스티칭 또는 재구성하는 것을 포함할 뿐만 아니라 각 올리고의 결합 성향을 분석함에 의해 서열을 획득한다. 방법은 각 올리고 종의 결합 성향을 측정하기 위해 고유하게 설정되며: 온-오프 결합의 속도와 지속시간은 프로브가 결합하는 부위와 만드는 염기-쌍의 유형 및 수의 함수이다. 요약하면, 올리고가 전체 염기-쌍화를 형성하거나 완벽한 일치를 형성하는 부위와 올리고의 반복적인 결합 상호작용은 프로브에서 일부의 염기가 표적과 쌍을 이루지 않는 불일치를 형성하는 장소에서 이들과 다르게 되는 경향이 있을 것이며; 대부분의 경우에서 불일치 부위에 대한 결합은 완벽한 일치 부위보다 단기-생존되는 경향이 있을 것이다. 경험적 데이터는 왓슨-크릭 불일치 결합이 왓슨-크릭 일치 결합보다 장기 생존하는 특정 이상치에 대한 기대를 변경하는 데 사용될 것이다. 발명의 알고리즘은 이것을 고려할 수 있다.
발명의 일부 실시형태에서, 검출 단계는 프로브의 결합-온 및 -오프가 기록되는 다수의 이미지 프레임(예를 들어, 무비 또는 비디오)을 취하는 것을 포함한다.
일부 실시형태에서, 검출 단계는 각각의 상보적 부위에 대한 다중 결합-온 및 -오프 이벤트를 검출하는 것을 포함한다. 다중 이벤트는 동일한 프로브 분자가 결합 온 또는 오프되거나, 동일한 특이성(즉, 동일한 서열 또는 분자 구조에 특이적임)의 다른 분자에 의한 대체됨으로부터 발생하고, 이는 여러 번 발생할 수 있다. 결합 온 또는 오프는 조건을 변경함에 의해 영향을 받지 않으며, 결합-온 및 결합-오프 둘 모두는 동일한 조건(염 농도, 온도 등) 하에서 발생하고, 프로브-표적 상호작용이 약하게 되는 것에 기인하여 결합이 일시적이다.
발명의 일부 실시형태에서 시퀀싱은 더 짧거나 동일한 길이 또는 프로브 길이의 크기 정도 내인 단일 표적 폴리뉴클레오티드 상의 다중 장소에서 다중 온-오프 결합 이벤트를 이미징함에 의해 수행된다. 이러한 실시형태에서, 더 긴 표적 폴리뉴클레오티드가 단편화되거나 단편의 패널이 사전-선택되어 표면 상에 배열되어 각각의 폴리뉴클레오티드 분자가 개별적으로 분해가능하다. 이들 경우에 특정 장소에 대한 프로브 결합의 빈도 또는 지속시간을 사용하여 프로브가 표적 서열에 상응하는지 여부를 결정한다. 프로브 결합의 빈도 또는 지속시간은 프로브가 표적 서열의 전체 또는 일부에 상응하는지 여부를 또한 결정할 수 있다(나머지 염기는 불일치됨).
발명의 일부 실시형태에서, 시퀀싱은 프로브보다 긴 단일 표적 폴리뉴클레오티드 상의 다중 장소에서 다중 온-오프 결합 이벤트를 이미징함에 의해 수행된다. 일부 실시형태에서, 단일 폴리뉴클레오티드에 대한 프로브 결합 이벤트의 장소가 결정된다. 일부 실시형태에서, 단일 폴리뉴클레오티드에 대한 프로브 결합 이벤트의 장소는 표적 폴리뉴클레오티드를 연장하여 그 길이를 따른 상이한 장소가 검출되고 분해될 수 있도록 결정된다. 일부 실시형태에서, 연장은 표면 상에서 발생한다. 일부 실시형태에서, 연장은 나노채널에서 발생한다. 일부 실시형태에서, 연장은 표적의 한쪽 또는 양쪽 말단이 장력하에 있을 때 유체역학적 드래그에 의해 발생한다. 일부 실시형태에서, 연장은 전기영동력을 통해 발생하며, 예를 들어 표적 폴리뉴클레오티드의 일 말단이 테더링, 앵커링 또는 트랩되고 다른 말단은 용액 또는 겔에서 자유롭게 현수되어 있을 때 발생한다.
일부 실시형태에서, 표지된 프로브의 온-오프 결합은 결합되지 않은 프로브로부터 신호의 거부 또는 제거를 필요로 한다. 이것은 예를 들어 조명을 위한 소멸장 또는 도파관을 사용하거나 공명 에너지 전이(RET, 예를 들어 형광 또는 Forster RET)을 사용하거나 광 활성화를 이용함에 의하여 수행될 수 있다(예를 들어, Biophys J. 2015 Feb 17; 108(4): 949-956에 기술된 바와 같음).
일부 실시형태에서, 프로브는 표지되지 않지만, 표적과의 상호작용은 결합이 발생하거나 발생하였음에 따라 듀플렉스 안으로 삽입되는 개재하는 개재 염료와 같은 DNA 염색에 의해 검출된다. 하나 이상의 개재하는 염료가 듀플렉스 안으로 개재될 수 있다. 개재하는 염료에 의해 방출되는 형광은 일단 그것이 개재되면 용액에 없는 개재하는 염료로 인해 형광보다 수십 배 더 클 수 있다. 예를 들어 개재하는 YOYO-1 염료로부터 신호는 용액에 YOYO-1 염료 없는 것으로부터 신호보다 약 100x 더 크다.
발명의 이 양태는 원래 가볍게 염색된(또는 어느 정도의 광탈색 후) 이중 가닥 폴리뉴클레오티드가 이미징될 때 폴리뉴클레오티드를 따른 개별 신호가 단일 개재하는 염료 분자에 상응하는 것으로 관찰될 수 있다는 관찰을 함에 의해 동기가 부여되었다. 듀플렉스에서 YOYO-1 염료의 교환을 용이하게 하고 밝은 신호를 얻기 위해 s 및 아스코르브산을 포함하는 산화환원-산화 시스템(ROX)이 결합 완충액에 제공될 수 있다.
일부 실시형태에서, 시퀀싱은 연장된 폴리뉴클레오티드를 하나씩 차례로 제공된 프로브의 완전한 서열 레퍼토리 각각으로부터 일시적인 상호작용에 적용하는 것을 포함한다(하나의 프로브 서열을 수반하는 용액이 제거되고, 다음 프로브 용액을 수반하는 용액이 추가됨). 일부 실시형태에서, 각각의 프로브의 결합은 프로브가 일시적으로 결합하도록 허용하는 조건하에서 수행된다. 예를 들어, 결합은 한 프로브의 경우 25℃에서 수행되고 다음 프로브의 경우 30℃에서 수행된다. 또한 프로브는 세트로 결합될 수 있다. 예를 들어 일시적으로 결합되는 모든 프로브는 거의 동일한 방식으로 세트 안으로 수집되어 함께 사용될 수 있다. 일부 이러한 실시형태에서, 세트의 각 프로브 서열은 차등적으로 표지되거나 차등적으로 인코딩된다.
일부 실시형태에서, 또는 일부 경우에 표적에서 장소에 대한 다중 결합 이벤트는 단일 프로브 서열로부터의 것이 아니라, 레퍼토리로부터의 데이터를 분석하고 부분적으로 중첩하는 서열로부터 발생하는 이벤트를 고려함에 의해 결정된다. 예를 들어, 동일한(실제로 서브-나노미터로 가까운) 장소는 공통 5개 염기 서열을 공유하는 6mer인 프로브 ATTAAG 및 TTAAGC에 의해 결합되고, 각각은 다른 하나를 검증할 뿐만 아니라 5개 염기의 양 면에서 일 염기로 서열을 확장한다. 일부 경우에 5개 염기 서열의 각 면에 있는 염기가 불일치이고(말단에서 불일치는 전형적으로 내부에 있는 불일치보다 더 많이 용인될 것으로 예상됨) 본 발명자가 검증한 두 결합 이벤트에 존재하는 5개 염기 서열만이 있다.
일부 실시형태에서, 신호는 개재하는 염료로부터 프로브 또는 표적 서열 상의 표지로의 FRET에 의해 검출된다. 일부 이러한 실시형태에서, 프로브는 그의 말단 중 하나에서 Cy3B 표지로 표지된다. 일부 실시형태에서, 표적이 이동억제된 후, 모든 표적 분자의 말단은 예를 들어 FRET 파트너로서 작용하는 형광으로 표지된 뉴클레오티드를 통합하는 말단 전이효소에 의해 표지된다.
일부 실시형태에서, 완전한 서열 레퍼토리가 사용되지 않고, 오히려 관심있는 서열의 특정 세그먼트를 커버하는 용액 프로브의 타일링 어레이가 사용된다. 일부 실시형태에서, 완전한 서열 레퍼토리가 사용되지 않고, 오히려 프로브의 패널이 사용되어 서열 특이적 일시적인 결합 프로브에 의해 다중 장소가 조사된다.
일부 실시형태에서, 표적 폴리뉴클레오티드는 단일 가닥(예를 들어, mRNA)이어야 하거나 발명이 구현되기 위해 단일 가닥으로 만들어져야 한다. 일부 실시형태에서, 표적 폴리뉴클레오티드는 이중 가닥이고 일시적인 결합은 프로브의 일시적인 가닥 침입에 기인한다. 일부 실시형태에서, 이중 가닥 표적은 닉(예를 들어, 천연 또는 DNase1 처리에 의해 생성됨)을 함유하고 반응 조건하에서 한 가닥이 일시적으로 다른 가닥으로부터 닳거나 벗겨지거나, 천연 염기-쌍 휴지가 발생하여 천연 가닥에 의해 옮겨지기 전에 프로브가 일시적으로 결합하도록 한다.
일부 실시형태에서, 서열은 각각의 프로브에 대해 수집된 일시적인 데이터를 분석함에 의해 구성된다. 일부 실시형태에서, 이러한 데이터는 전형적으로 연장된 폴리뉴클레오티드의 경로와 상관된 2-D 표면 상의 결합 이벤트의 좌표를 포함한다.
프로브 결합의 장소는 각각의 프로브의 결합의 순서를 제공하며, 이는 연속적인 서열 안으로 축적될 수 있다.
본 명세서 및 청구범위에서 용어 표적 폴리뉴클레오티드는 단일 가닥만이 있는 경우 및 2개의 이중 나선 가닥이 있는 경우 모두에 대해 지칭된다. 이중-가닥 또는 단일 단일 가닥 폴리뉴클레오티드가 단독으로 의도된 경우, 그것은 본문에서 표시된다. RNA가 언급된 경우 그것은 단일 가닥으로 가정된다.
본 명세서 및 청구범위에서 결합 또는 장소가 기판에 기록될 때 결합의 실질적인 분획이 기판 상의 핵산에서 발생했다고 가정될 수 있다.
폴리뉴클레오티드 추출
다양한 실시형태에서, 방법은 실질적으로 온전한 표적 폴리뉴클레오티드로서 세포, 소기관, 염색체, 바이러스, 엑소좀 또는 신체 물질 또는 체액으로부터 단일 표적 폴리뉴클레오티드 분자를 추출하는 것을 추가로 포함한다. 다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 연장/신장된다. 다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 표면 상에 이동억제된다. 다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 겔에 배치된다(예를 들어, Shag 외 Nature Prototcols 7: 467-478 (2012)과 비교). 다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 마이크로- 및/또는 나노-유체 채널에 배치된다. 다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 온전하다.
다양한 실시형태에서, 방법은 단일 세포의 게놈을 시퀀싱하는 것을 추가로 포함한다. 다양한 실시형태에서, 방법은 단일 세포로부터 유로 안으로 폴리뉴클레오티드를 방출하는 것을 추가로 포함한다. 다양한 실시형태에서, 유로의 벽은 폴리뉴클레오티드 격리를 방지하는 부동태화를 포함한다. 다양한 실시형태에서, 부동태화는 지질, 폴리에틸렌 글리콜(PEG), 카세인 및/또는 소 혈청 알부민(BSA) 코팅을 포함한다.
일부 실시형태에서, 추출이 수행되기 전에 관심있는 세포를 관심없는 다른 세포로부터 분리하는 것이 필요하다. 혈액에서 순환하는 종양 세포 또는 순환하는 태아 세포를 단리하는 데 사용할 수 있는 몇 가지 방법이 있으며, 예를 들어 친화력 포획를 위한 그의 표면 마켓을 사용하는 것이다. 일부 실시형태에서, 미생물 세포를 인간 세포로부터 분리하는 것이 필요하며, 여기서 관심있는 것은 미생물 세포로부터 다핵체를 검출하고 분석하는 것이다. 옵소닌은 광범위한 미생물을 친화성 포획하고 포유동물 세포로부터 그것을 분리하는데 사용될 수 있어 미생물 폴리뉴클레오티드가 선택적으로 서열화될 수 있다. 부가하여 차등 용리가 수행될 수 있다. 여기서 조건은 먼저 포유동물 세포를 용리하는 데 사용된다. 미생물 세포(특히 마이코박테리움)는 포유동물 세포를 용리하는 데 사용되는 조건에 강하고 따라서 온전한 상태로 남아 있고 포유동물 세포 내용물을 씻어내어 단리될 수 있다. 그런 다음 더 가혹한 조건을 사용하여 미생물 세포로부터 폴리뉴클레오티드를 추출하고 그것을 선택적으로 서열화한다.
시퀀싱
일반적으로, 발명의 방법은 다음을 포함한다:
a) 표적 핵산을 제공하는 것;
b) 표적 상의 서열 비트의 제1 세트의 장소를 획득하기 위해 일시적인 결합 반응을 수행하는 것;
c) 표적 상의 서열 비트의 제2 세트의 장소를 획득하기 위해 일시적인 결합 반응을 수행하는 것; 및
d) 표적 상의 서열 비트의 제3 세트의 장소를 획득하기 위해 일시적인 결합 반응을 수행하는 것 등등
일부 실시형태에서, 다중 올리고가 조합되거나 결정가능한 거리만큼 분리된다.
일부 실시형태에서, 서열 비트가 획득되는 표적은 표적 사이의 서열 중첩의 세그먼트에 기반하여 정렬되고, 더 긴 "인 실리코" 콘티그 및 궁극적으로 전체 염색체의 서열이 생성된다.
발명의 일부 실시형태에서 표적 폴리뉴클레오티드는 겔과 접촉된다. 일부 실시형태에서, 겔을 접촉하는 것은 표적 폴리뉴클레오티드를 연장시킨 후에 발생한다. 일부 실시형태에서, 겔과 접촉하는 것은 표적 폴리뉴클레오티드를 연장시키기 전에 발생한다.
일부 실시형태에서, 표적 폴리뉴클레오티드에서 일반적으로 발생하는 서열이 사용된다. 이것은 게놈에서 극히-빈번하게 발생하는 여러 서열 중 하나 이상일 수 있다. 이 경우에 게놈의 전체 서열이 아닌 게놈의 지문이 쉽게 획득될 수 있다.
일부 실시형태에서, 발명은 밀접하게 패킹된 폴리뉴클레오티드뿐만 아니라 폴리뉴클레오티드를 따른 서열 비트를 초-분해함에 의해 얻어질 수 있는 서열 정보의 밀도를 증가시킨다.
일 실시형태에서 방법은 다음 단계를 포함한다:
1) 긴 길이의 게놈 DNA를 추출하고 DNA의 무 변형 또는 처리를 수행하는 단계;
2) 표면 상에서 게놈 DNA 분자를 신장하거나 연장하는 단계;
3) 용액이 표면 상에 신장된 DNA 위로 흐를 수 있도록 유동 셀을 제공하는 단계(신장은 유동 셀에서 발생했거나 유동 셀은 표면 위에 구성됨);
4) DNA를 변성시키는 단계;
5) 일시적으로 결합 프로브를 추가하는 단계;
6) 예를 들어, 레이저 전반사(TIR) 조명, 초점 검출/유지 기전, CCD 카메라 적절한 대물렌즈, 릴레이 렌즈 및 미러를 사용하여 각 장소에서 결합하는 프로브를 검출하는 단계;
7) 다른 장소(그 제1 위치에서 CCD의 시야 외부)에서 렌더링된 게놈 분자 또는 분자의 일부가 서열화될 수 있도록 유동 셀이 장착된 스테이지를 CCD 카메라에 대해 변위시키는 단계; 및
8) 필요한 경우 단계 5-7을 반복하는 단계; 및
9) 다음을 포함하는 데이터 처리 단계:
a) 이미지를 처리하는 단계;
b) 서열 호출을 만드는 단계;
c) 공간 장소에 서열 호출을 묶는 단계;
d) 어떤 서열 호출 장소가 라인에 맞는지를 결정하는 단계;
e) 획득된 정보를 사용하여 초-연속 판독을 제공하기 위해 시퀀싱 판독을 어셈블리하는 단계;
f) 어셈블리된 판독을 사용하여 게놈을 어셈블리하는 단계; 및
g) 바람직하게는 컴퓨터 또는 스마트폰 유형 장치 상의 그래픽 인터페이스를 통해 사용자에게 서열 판독 및/또는 어셈블리된 게놈을 제공하는 단계.
게놈 DNA가 다중 세포로부터 추출될 수 있는 경우 분자의 많은 카피가 표면 상에 표시되며; 동일한 상동체로부터의 결과가 수집되고 컨센서스 판독이 획득되며; 상동성 분자는 단상형 또는 모 염색체 특이성에 따라 분리된다.
일부 실시형태에서, 일시적인 결합은 검출의 수단으로서 기록되지만 국지화를 개선하기 위해 사용되지는 않는다. 일부 경우에 분자가 드문드문 배열되어 있고 증가된 국지화가 요구되지 않는다. 그러나, 광탈색에 대한 견고성과 비-특이적 배경을 여과하는 능력(영구적으로 고착된 신호가 처리될 수 있음)은 접근방식을 매력적으로 만든다.
일부 실시형태에서, 프로브는 표적에 결합된 상태로 유지되지만 일시적으로 결합 표지가 온 및 오프에 결합하는 꼬리 또는 플랩을 갖는다. 일부 실시형태에서, 꼬리는 비-왓슨-크릭 염기 쌍화 핵산 유사체로 구성된다.
단일 염기 조사
일부 실시형태에서, 프로브는 단 하나의 정의된 뉴클레오티드에 따라 표지된다.
일부 실시형태에서, 올리고뉴클레오티드는 상이한 뉴클레오티드인, ACGT가 정의되고 각각의 상이한 뉴클레오티드에 상응하는 각각의 올리고가 상이하게 표지되고 선택적으로 함께 시퀀싱 반응에 추가되는 종으로 분할된다
일부 실시형태에서, 올리고는 차등적으로 표지되지 않지만, 세정이 이전 뉴클레오티드를 제거한 후 각 염기 유형이 별도로 추가된다.
일부 실시형태에서, 상대적으로 짧은 시간 규모(예를 들어, 1분 이상)에 걸쳐 결합 이벤트를 검출하기 위해, 이에 상응하여 단지 1개 또는 소수의 염기만이 정의된 더 높은 농도의 올리고가 더 높은 복잡성의 올리고 라이브러리를 처리하는 데 필요하다. 5개 염기가 정의된 올리고의 10nM이면 충분하게 되는 경우, 하나의 염기만 정의된 올리고의 256x 더 높은 농도가 필요하다. 이는 2.56uM의 올리고뉴클레오티드에 해당하며(일부 실시형태에서, 불일치 등으로 인해 더 낮은 농도가 충분할 것임), 이는 표면에서 조명의 기하급수적으로 감소하는 소멸 장이 사용되는 경우에도, 표면 상의 폴리뉴클레오티드 표적에 대한 결합 이벤트를 검출하기 어렵게 만드는 배경 형광의 수준으로 이어질 것이다. 배경 형광은 실질적으로 광 산란으로 인한 것이기 때문에, 일부 실시형태에서, 이는 타임-게이트 아웃될 수 있다. 일부 실시형태에서, 용액 내 고농도의 올리고가 형광성이 아니지만 형광성을 띠고, 켄칭되거나 직접적으로 여기되지 않지만, 표면 또는 표적 폴리뉴클레오티드 자체에 부착된 실체로부터 공명 에너지 전이를 받는 경우에만 광을 방출하는 기전이 이용된다. 일부 실시형태에서, 형성된 듀플렉스 안으로 개재되는 염료는 여기되고 결합할 때 올리고 상의 형광성 표지에 에너지를 전달한다. 일부 실시형태에서, 정의된 올리고 라이브러리 각각이 한 번에 하나씩 추가되는 경우, 어떠한 표지도 올리고에 부착되지 않고 용액으로부터의 핵산 염색 또는 개재하는 염료만이 결합 이벤트를 표지하는 데 사용된다.
일부 실시형태에서, 단지 하나의 염기만이 올리고뉴클레오티드에 정의되고 나머지 위치는 축퇴하는 경우, 4개의 가능한 정의된 염기 A, C, G 또는 T에 대해 단지 4 이하의 시약 교환 주기가 요구된다. 일부 실시형태에서, 각각의 염기는 별개의 표지에 의해 코딩되고, 4개 표지 모두를 동시에 검출하는 수단이 있는 경우, 시약 교환은 필요하지 않는다. 이러한 균질 또는 원-포트 시퀀싱 반응이 수행될 때 장비는 시약 교환이 필요하지 않은, 본질적으로 현미경으로 매우 간단하다. 예를 들어, 적절한 완충액에 있는 올리고 믹스(혼합물 o 올리고뉴클레오티드 프로브 종)의 단 한 방울을 표적 폴리뉴클레오티드가 위치한 커버 유리 상으로 추가한 다음 하나 이상의 결합 이벤트를 갖는 전체 서열을 커버에 충분한 기간 동안 결합 이벤트가 관찰된다. 이 균질한 반응은 몇 시간 동안 실행되고 증발되지 않도록 밀봉된다. 충분히 높은 부피가 사용된 경우 표면 근처에서 발생할 수 있는 시약의 고갈은 용액의 대부분에서 확산에 의해 시약 교환을 촉진함(예를 들어, 이는 난류 또는 혼돈 혼합에 의해 향상될 수 있음)에 의해 극복될 수 있다. 대안적으로, 다른 올리고 믹스를 추가할 목적이 아니라 단지 고갈된 시약을 교체하기 위해 시약 교환이 수행된다.
일부 이러한 실시형태에서, 표적 폴리뉴클레오티드는 결합 이벤트의 장소, 및 이에 따른 폴리뉴클레오티드의 길이를 따른 뉴클레오티드의 장소가 결정될 수 있도록 연장되거나 신장된다. 일부 이러한 실시형태에서, 폴리뉴클레오티드는 단일 가닥이므로 올리고가 결합하는 가닥에 대한 모호성이 없고; 이는 이 단일-뉴클레오티드 조사 접근방식이 개별 결합 이벤트가 발생하는 변성 이중 나선 폴리뉴클레오티드의 가닥을 분해하기 위해 타일링 경로를 구성하는 사치를 갖지 않기 때문에 유용하다. 단일-뉴클레오티드 조사 접근방식이 단일 가닥에 적용될 수 있는 몇 가지 경우가 있다. 첫째로, RNA는 대부분의 경우 자연적으로 단일 가닥이다. 다른 경우에 이중 가닥 핵산은 단일 가닥으로 만들어질 수 있고 추가의 경우에서, 핵산이 환형으로 만들어지고 롤링 서클 증폭을 통해 반복적으로 카피되는 경우와 같이, 듀플렉스 나선의 가닥 중 하나가 카피되어 단일 가닥을 만든다.
일부 이러한 실시형태에서, 각 결합 이벤트가 단지 단일 염기의 정보만을 제공하기 때문에 드리프트를 우회할 강한 필요성이 존재하며, 중첩하는 서열의 비트에 의해 형성된 타일링 경로는 서열에서 뉴클레오티드의 배치를 용이하게 하는 완전한 데이터-세트로부터 추출될 수 없다. 요구되는 정밀도를 얻기 위해 진동 및 열적 드리프트의 관점에서 매우 안정적인 시스템이 사용된다. 이러한 안정적인 시스템 중 하나는 Olympus's IX81 도립 레이저 TIRF 현미경과 함께 사용될 수 있는 IX2 Nosepiece Stage이다. 일부 실시형태에서, 추가 또는 대안으로서, 드리프트 보정 기전이 사용되고 드리프트 보정을 위한 매우 효과적인 수단은 DNA 오리가미와 같은 망선상 기준점 마커를 사용하고 정확한 고정밀 초-해상도 이미지를 생성을 위해 데이터를 반복적으로 드리프트 수정하기 위해 다중 라운드의 처리를 수행하는 것이다. DNA 오리가미는 구조 내에서 매우 잘 정렬되고 정확하게 위치된 위치에서 형광 표지에 대한 다중 결합 부위를 갖도록 당업자에 의해 설계되었다. 예를 들어, 본 명세서에 참고로 포함된 Dai et al(Nature Nanotechnology 2016, 11:798-807)에 기술된 유형의 DNA 오리가미가 사용될 수 있으며, 예를 들어 12 또는 16 포인트 격자를 포함한다. 오리가미는 단일 가닥 도킹 사이트가 격자의 상단 표면에서 돌출되고 형광으로 표지된 이미저에 의해 일시적으로 결합되는 DNA PAINT 기전에 의해 표지된다. 결합 부위는 4개의 단일-뉴클레오티드 정의된 올리고 라이브러리를 구체적으로 표지하는 데 사용되는 4개의 별개 표지로 표지된 이미저에 격자 상에 제공된다. 일부 실시형태에서, 오리가미 격자에 결합하는 이미저는 시퀀싱 반응의 왓슨-크릭 결합 시스템보다 직교 결합 시스템을 갖도록 설계된다. 이러한 직교 시스템은 예를 들어 Firebird Biomolecular Sciences LLC(www.firebirdbio.com)에서 이용가능한 인공적으로 확장된 유전 정보 시스템(AEGIS) 포스포라미다이트 시약을 사용하는 확장된 알파벳 핵산 염기-쌍 시스템이다. 이 시스템은 본 발명의 시퀀싱 시스템에서 사용되는 왓슨 크릭 A:T 및 G:C 염기 쌍에 직교하는 Z:P 및 S:B 염기 쌍을 제공한다.
일부 실시형태에서, 올리고, 예를 들어 3mer가 정의된 올리고는 저온 또는 고염에서 결합하도록 허용되며, 이는 많은 수의 부위가 결합할 수 있고 그 중 일부는 분해가능하지 않을 수 있다. 일부 실시형태에서, 결합의 장소를 정확히 지적하기 위해 형광 표지가 탈색되도록 하여 각각의 정확한 장소가 단일 분자 국지화에 의해 결정될 수 있다. 예를 들어, Neely 외 Nucleic Acids Res. 2014 Apr; 42(7): e50 및 또한 2012년 12월 3일에 출원된 미국 특허 출원 번호 13/701,628을 참고하며, 이는 본 명세서에 참고로 포함된다. 이 비-일시적인 결합 접근방식에서 일 올리고의 결합이 중첩하는 올리고의 결합을 방해할 수 있다는 것이 가능하다. 이를 방지하기 위해 다중 주기가 사용된다. 결합된 올리고의 제1 세트는 온도 및/또는 화학적 변성에 의해 용융되어 진 다음 결합이 다시 개시되어 제1 주기에서 차단된 장소가 제2 주기에서 결합할 수 있는 식의 가능성을 허용한다. 이것은 더 많은 주기 동안 선택적으로 반복되어 이전에 차단된 부위가 더 많이 결합되도록 한다. 유사하게, 일부 실시형태에서, 결합은 확률적 광학 재구성 현미경(STORM; 예를 들어, 본 명세서에 참고로 포함되는 미국 특허 번호 7,776,613 및 미국 특허 번호 10,073,035에 기재된 바와 같음)에 의해 검출되어, 어느 한 순간에 형광단 신호의 일부만을 스위칭한다. 일부 실시형태에서, 이것은 서열을 최대로 커버하기 위해 여러 번 반복된다.
결합의 속도는 올리고 농도 증가, 결합 온도 증가, 및/또는 염 및 부피 배제 제제의 정체성 및 농도를 변화함에 의해 증가될 수 있다. 일부 실시형태에서, 부피 배제 제제는 하이드록시프로필 메틸 셀룰로스(HPMC), 하이드록시에틸 메틸 셀룰로스(HEMC), 하이드록시부틸 메틸 셀룰로스, 하이드록시프로필 셀룰로스, 메틸셀룰로스 및 하이드록실 메틸셀룰로스, PEG-800으로 구성된 군으로부터 약 0.002% 내지 약 15% w/w의 범위인 농도로 선택된다. 부가하여, 100-600mM 농도에서의 MgCl2와 같은 2가 양이온은 결합 속도에 가속 효과를 갖는다.
일부 실시형태에서, 결합의 속도를 증가시키는 추가의 수단은 흐름의 존재하에서 측정을 수행하는 것이다. 따라서 최대 50ul의 유동 셀 부피에서 분당 1μl의 유속은 결합 속도를 증가시킬 수 있다. 일부 실시형태에서, 흐름은 난류이다. 일부 실시형태에서, 난류는 표면으로부터 나오는 막대 또는 범프의 존재, 유동 셀의 상부 표면 상의 헤링본 패턴, 또는 유동을 난류로 만드는 용액 내의 비드 또는 미세구조의 존재에 의해 유도된다. 결합 속도를 높이는 것에 부가하여 흐름 과정을 최적화하면 시약 교환의 효율성이 높아져 이전 주기의 잔류 올리고가 최소로 남는 것을 보장한다. 일부 실시형태에서, 하나의 올리고 종에서 다음으로의 교환의 과정 동안 크린 완충액을 사용한 하나 이상의 세정이 필요하고 세정 동안 올리고 프로브가 표면으로부터 확산되어 평형 농도에 도달하기 위한 시간이 필요하다. 일부 실시형태에서, 시간은 1분이고, 다른 실시형태에서 시간은 10분이다. 일부 실시형태에서, 10-100 부피의 완충액이 잔류 올리고의 제거를 보장하기 위해 유동 셀을 통해 통과된다. 일부 실시형태에서, TIRF 범위를 벗어나는 프로브의 이동이, 예를 들어 양으로 바이어스된 전극에 -ver 하전된 올리고를 이동시키는 전기장을 인가함에 의해 촉진되기 때문에 시간이 감소된다. 다양한 과정 중 하나 이상인, 시간, 난류, 교환된 완충액의 부피 및 전기장이 조합될 수 있다. 일부 실시형태에서, 어느 정도의 잔류 올리고가 허용되며; 이전 올리고의 정체성이 알려져 있기 때문에 어셈블리 알고리즘은 미량의 그 존재를 고려할 수 있다.
일부 실시형태에서, 축퇴 위치가 사용되지 않고 올리고뉴클레이티드의 원하는 안정성은 조건(예를 들어, 저온, 고염)을 적절하게 조작하거나 자체적으로 충분히 안정한 올리고 화학(예를 들어, 감마 PNA 등)을 사용함에 의해 획득되거나 또는 스페르민 또는 스틸벤과 같은 접합체를 말단에 추가하여 짧은 올리고뉴클레오티드의 안정성을 증가시킨다.
일부 실시형태에서, 혼성화는 비-한정된 위치에서 모든 가능한 서열을 포함하는 올리고뉴클레오티드의 라이브러리를 사용하기 보다는 축퇴에서 니트로인돌 또는 데옥시이노신과 같은 보편적인 염기를 사용함에 의해 개선될 수 있다. 이들 보편적인 염기는 다양한 공급업체로부터 구입된 올리고에서 서열에 따라 위치에서 특정될 수 있다. 일부 실시형태에서, 일부 위치는 뉴클레오티드의 라이브러리에 의해 점유되고 다른 위치는 보편적 염기에 의해 점유된다. 보편적인 염기는 혼합물의 복잡성을 줄이기 때문에 더 낮은 농도의 올리고 프로브가 이용될 수 있다.
일 염기 코딩에서 사용되는 올리고의 복잡성이 높기 때문에 사용되는 올리고 라이브러리의 농도는 증가될 필요가 있어, 10nM 농도 대신 1uM 이상의 농도를 사용할 필요가 있고 배경이 크기 때문에 이는 일부 실시형태에서 개재하는 염료, 개재 표지화 방식(FRET 없음) 또는 올리고가 혼성화가 발생할 때 형광을 발하는 형광성 표지로 표지되는 것과 같은 사용되는 FRET 기전을 생성한다.
일부 실시형태에서, 2개 한정된 염기로 모든 64개의 가능한 올리고가 동시에 추가되고 차등적으로 표지된다. 일부 실시형태에서, 16개의 차등 표지가 이용가능하고 따라서 64개의 라이브러리가 16개의 4개 라이브러리로 분할된다. 따라서 단 4개의 주기로 시퀀싱이 종결된다. 다른 실시형태에서, 4개 표지가 사용되어 4개의 올리고가 함께 추가될 수 있게 하여 수행되는 16개의 주기를 필요로 한다. 그들 3 mer의 혼성화는 4x SSC 또는 2.4M TMACl 또는 3.5M TMACl, LiTCA, GUCN을 포함하는 완충액에서 수행될 수 있으며 이는 불일치를 더 잘 구별하고/하거나 염기 조성의 효과를 균등화하는 역할을 할 수 있다.
잠정적 분해능 증가.
일시적인 결합 과정은 염 농도와 같은 다양한 생화학적 매개변수를 조정함에 의해 가속화될 수 있다. 결합의 속도를 일치시키는 데 사용할 수 있는 높은 프레임 속도를 갖는 다수의 카메라가 있으며, 종종 픽셀의 하위집합에서 더 빠른 판독값을 얻기 위해 시야가 제한된다. 한 가지 대안적인 접근방식은 검류계 미러를 사용하여 연속 신호를 단일 센서의 다른 영역에 잠정적으로 분산하거나 센서를 분리하는 것이며, 후자는 센서의 전체 시야를 활용할 수 있지만 분배된 신호가 축적될 때 전반적인 잠정적 분해능을 증가시킨다. 회절 제한된 지점 내에서 다중 신호의 경우를 이미지 처리하는 동안 거부하는 능력은, 높은 프로브 결합 속도에 대처할 수 있으므로 처리가 더 빠르게 실행되도록 허용한다.
DNA 광-손상 회피
일부 실시형태에서, 서열화되어 지는 핵산에 대한 광손상의 효과를 감소시키기 위해 단백질을 통해 올리고뉴클레오티드에 부착된 형광 모이어티를 갖는 것이 편리하다. 일부 실시형태에서, 단백질 모이어티의 효과는 형광 표지의 다양한 역효과로부터 올리고 및 표적 서열에 대한 보호를 제공하기 위한 것이다. 산화적 손상과 같은 이들 부작용 중 일부는 환원제 또는 산화환원 시스템과 같은 첨가제를 반응 용액에 포함함에 의해 극복될 수 있다. 그러나 전자 전달 또는 터널링과 같은 다른 유해한 기전은 첨가제에 의해 방지되지 않을 수 있다. 일부 실시형태에서, 환원제 또는 산화환원 시스템은 올리고에 물리적으로 연결된다. 일부 실시형태에서, 단백질은 스트렙타비딘이다. 스트렙타비딘의 형광으로 표지된 버전은 예를 들어 Fret에 의한 파장 전이를 수행하기 위해 다른 염료에 접합된 스트렙타비딘-피코에리트린을 포함하는, 예를 들어 스트렙타비딘-피코에리트린을 이용할 수 있다. 스트렙타비딘은 그 다음 또한 잘 알려진 비오틴-스트렙타비딘 상호작용에 의해 하나 이상의 비오틴화된 올리고뉴클레오티드에 결합된다. 밀접하게 관련된 다양한 단백질인 아비딘, 뉴트라비딘이 또한 사용될 수 있다. 스트렙타비딘에는 다중 염료가 부착되어 있다. 다른 적합한 단백질은 유비퀴틴 및 SNAP-태그 단백질을 포함한다. 손상을 방지하기 위해 형광 염료 주위에 보호막을 제공하는 것이 경험적으로 발견될 수 있다면, 단백질 이외의 다른 분자가 또한 사용될 수 있다.
따라서 일부 실시형태에서, 시퀀싱 시약은 단백질 상의 제1 위치에 부착된 일시적인 결합 뉴클레오티드/올리고뉴클레오티드; 단백질 상의 제2 위치에 부착된 적어도 하나의 형광 염료 모이어티를 포함하는 염료 성분을 포함한다.
단일-세포 분해된 시퀀싱
다양한 실시형태에서, 방법은 단일 세포의 게놈을 시퀀싱하는 것을 추가로 포함한다. 일부 실시형태에서, 단일 세포는 다른 세포로부터의 부착이 없다. 일부 실시형태에서, 단일 세포는 클러스터 또는 조직에서 다른 세포에 부착된다. 일부 실시형태에서, 이러한 세포는 개별 비-부착 세포로 분리된다.
일부 실시형태에서, 발명은 폴리뉴클레오티드를 시퀀싱하는 방법을 포함하며, 상기 방법은 하기의 단계를 포함한다:
i) 하나 이상의 세포를 유동 셀 안으로 도입하는 단계;
ii) 상기 세포를 처리하여 폴리뉴클레오티드가 방출되도록 하는 단계;
iii) 유동 셀에서 방출된 폴리뉴클레오티드를 연장하는 단계; 및
iv) 상기 연장된 폴리뉴클레오티드를 주형/시퀀싱 표적으로 사용하여 시퀀싱 반응을 수행하는 단계.
일부 실시형태에서, 발명은 폴리뉴클레오티드를 시퀀싱하는 방법을 포함하며, 상기 방법은 하기의 단계를 포함한다:
i) 하나 이상의 세포를 마이크로-용기 안으로 도입하는 단계;
ii) 상기 세포를 처리하여 폴리뉴클레오티드가 방출되도록 하는 단계;
iii) 용기의 내용물을 유동 셀 안으로 방출하는 단계;
iv) 폴리뉴클레오티드를 연장하는 단계; 및
v) 상기 연장된 폴리뉴클레오티드를 주형으로 사용하여 시퀀싱 반응을 수행하는 단계.
일부 실시형태에서, 폴리뉴클레오티드를 시퀀싱하는 방법이 제공되며, 상기 방법은 하기의 단계를 포함한다:
i) 유동 셀에 세포를 노출시키는 단계로, 상기 유동 셀은 유입구 및 유출구를 포함하는, 단계;
ii) 상기 세포로부터 폴리뉴클레오티드를 추출하는 단계;
iii) 상기 폴리뉴클레오티드의 적어도 일부가 개별적으로 분해가능하도록 상기 폴리뉴클레오티드를 상기 유동 셀의 표면에 부착하는 단계;
iv) 올리고를 상기 폴리뉴클레오티드에 노출시키는 단계;
v) 상기 폴리뉴클레오티드 상의 올리고의 결합의 장소를 식별하는 단계
일부 실시형태에서, 세포는 폴리뉴클레오티드가 연장되는 구조(예를 들어, 유동 셀 또는 마이크로웰)의 유입구로 (예를 들어, 피펫을 사용하여) 유체로 이동되기 전에 분해된다. 분해는 단백질분해효소, 초음파 처리 또는 물리적 교반을 적용함에 의해 세포를 파이펫팅하여 수행될 수 있다. 일부 실시형태에서, 세포는 폴리뉴클레오티드가 연장되는 구조 안으로 유체로 전달된 후 분해된다.
일부 실시형태에서, 단일 세포는 단리되고 폴리뉴클레오티드는 단일 세포로부터 방출되어, 동일한 세포에서 유래하는 모든 폴리뉴클레오티드가 서로 근접하고 다른 세포의 내용물이 배치하는 장소와 구별되는 장소에 배치되어 남아 있다. 일부 실시형태에서, Lab Chip, 2006, 6, 1445-1449에 기술된 바와 같은 트랩 구조가 사용된다.
일부 실시형태에서, 단일 세포는 트랩핑되고 내용물은 방출된 다음 신장된다. 일부 실시형태에서, 단일 세포는 개별 채널 안으로 파열되고, 각각의 개별 세포는 폴리뉴클레오티드가 조합되고 동일한 혼합물에서 서열화되기 전에 트랜스포사제 매개된 통합을 통해 고유한 태그 서열과 반응된다. 트랜스포사제 복합체는 세포 내로 형질감염될 수 있거나 세포를 함유하는 액적 안으로 병합된 액적에 있다.
일부 실시형태에서, 응집체는 세포의 작은 클러스터이고 일부 실시형태에서, 전체 클러스터는 동일한 시퀀싱 태그로 태깅된다. 일부 실시형태에서, 세포는 응집되지 않고 순환 종양 세포(CTC) 또는 순환 태아 세포와 같은 자유 부유 세포이다.
단일 세포 시퀀싱에서 세포 용리 후 자발적인 시토신 탈아미노화에 의해 야기되는 시토신-대-티민 단일 뉴클레오티드 변이체의 문제가 있다. 이것은 시퀀싱 이전에 샘플을 우라실 N-글리코실라제(UNG)로 사전처리함에 의해 극복된다. (예를 들어, Mol Diagn Ther. 2014 Oct; 18(5): 587-593에 기술된 바와 같음.)
폴리뉴클레오티드의 세포-특이적 인덱싱
다양한 실시형태에서 방법은 각각의 폴리뉴클레오티드가 그 기원 세포의 정보를 보유하는 복수의 세포(또는 핵)로부터 폴리뉴클레오티드를 시퀀싱하는 데 추가로 적용한다.
특정 실시형태에서 트랜스포존 매개된 삽입은 세포 내부에서 발생하고, 각각의 삽입은 기원 세포에 대한 표지로서 고유한 ID 서열 태그를 포함한다. 다른 실시형태에서 트랜스포존 매개된 삽입은 단일 세포가 단리된 용기 내부에서 발생하며, 그러한 용기는 아가로스 비드, 오일-물 액적 등을 포함한다. 고유 태그는 태그를 담지하는 모든 폴리뉴클레오티드가 동일한 세포로부터 유래해야 함을 나타낸다. 그런 다음 모든 게놈 DNA 및/또는 RNA가 추출될 수 있고, 혼합되고 연장될 수 있다. 그런 다음 SbS(또는 임의의 다른 시퀀싱 방법)가 PBS 또는 프로모터에서 유래된 경우, 획득하는 제1 서열은 세포 식별 서열에서 유래한 것이며 폴리뉴클레오티드의 서열이 뒤따른다. 세포 식별 태그는 짧게 유지하는 것이 바람직하다. (예를 들어, 종양 현미경검사로부터) 10,000개 세포의 경우, ~65,000개 고유한 서열이 8개 뉴클레오티드 길이의 식별자 서열과 10개 뉴클레오티드 길이의 식별자 서열로부터 대략 백만 개의 고유 서열에 의해 제공될 수 있다.
이 동일한 인덱싱 원리는 샘플을 혼합하고, 이들을 함께 서열화하지만 각 개별 샘플과 관련된 서열 정보를 복구하는 것이 목표인 경우 (예를 들어, 다른 개체로부터) 세포 이외의 샘플에 적용될 수 있다.
따라서, 일부 실시형태에서, 방법은 다음을 포함한다:
1) 세포의 내용물을 단리하는 것;
2) 세포의 폴리뉴클레오티드 안으로 세포에 대한 고유한 서열 태그의 트랜스포존 매개된 삽입을 수행하는 것;
3) 세포의 폴리뉴클레오티드를 이동억제화하는 것; 및
4) 태그의 서열 및 폴리뉴클레오티드의 서열을 판독하는 것을 포괄하는 본 발명의 시퀀싱 방법을 수행하는 것.
일부 실시형태에서, 폴리뉴클레오티드는 RNA이고 cDNA 카피가 서열화된다. 이러한 실시형태에서, 태그의 추가는 태그 서열을 함유하는 프라이머를 사용한 cDNA 합성을 포함할 수 있다.
일부 실시형태에서, 서열 판독의 더 많은 부분이 폴리뉴클레오티드 서열 자체를 시퀀싱하는 데 전념할 수 있도록 짧게 유지되는 서열의 양을 유지하기 위해, 태그 서열은 다수의 부위에 걸쳐 분포된다. 여기서 다중의 짧은 식별자 서열, 즉, 3개가 각 셀 또는 용기 안으로 도입된다. 그런 다음 폴리뉴클레오티드의 기원은 폴리뉴클레오티드를 따라 분포된 태그의 비트로부터 결정된다. 따라서 이 경우에 일 장소에서 판독된 태그의 비트가 기원 세포를 결정하는 데 충분하지 않을 수 있지만 다중 태그 비트는 결정을 내리기에 충분하다.
다중 방법에 의한 시퀀싱
일부 실시형태에서, 일시적인 결합에 의한 시퀀싱에 이어서, 제2 방법에 의한 시퀀싱이 동일한 분자 상에서 개시될 수 있다. 예를 들어, 더 긴 더 안정한 올리고뉴클레오티드는 합성에 의해 시퀀싱을 개시하도록 결합될 수 있다.
표적 폴리뉴클레오티드
용어 폴리뉴클레오티드는 DNA, RNA 및 이의 변이체 또는 모방체를 지칭하고, 핵산과 동의어로 사용될 수 있다. 단일 표적 폴리뉴클레오티드는 하나의 핵산 사슬이다. 핵산 사슬은 이중 가닥 또는 단일 가닥이다. 중합체는 긴 비-코딩(lnc) RNA, mRNA, 염색체, 미토콘드리아 DNA와 같은 천연 폴리뉴클레오티드의 완전한 길이를 포함할 수 있거나 그것은 길이가 적어도 200개 염기, 그러나 바람직하게는 길이가 적어도 수천 개의 뉴클레오티드 그리고 보다 바람직하게는, 게놈 DNA의 경우 길이가 수 백의 킬로베이스에서 수 메가베이스의 폴리뉴클레오티드 단편이다.
다양한 양태 및 실시형태에서, 발명은 예를 들어 생물학적 환경으로부터 추출 동안 폴리뉴클레오티드의 실질적으로 천연 길이를 보존함에 의해 긴 길이의 폴리뉴클레오티드를 수득하는 것; 폴리뉴클레오티드를 선형 상태로 배치하여 그 길이를 따른 장소가 거의 또는 전혀 모호하지 않게 추적될 수 있도록 하고, 이상적으로는 폴리뉴클레오티드가 곧게 펴지거나, 신장되거나, 연장되도록 하는 것; 선형 상태에서 표적 폴리뉴클레오티드의 배치 전 또는 후에 하는 것을 포함한다.
다양한 실시형태에서, 단일 표적 폴리뉴클레오티드는 염색체이다. 다양한 실시형태에서, 단일 표적 폴리뉴클레오티드는 길이가 약 102, 103, 104, 105, 106, 107, 108 또는 109개 염기이다. 밀 염색체 3b는 길이가 9억 9,500만 염기인 반면 가장 큰 인간은 2억 4,900만 염기에서의 염색체 1이다. 다양한 실시형태에서, 단일 표적 폴리뉴클레오티드는 단일 가닥이다. 다양한 실시형태에서, 단일 표적 폴리뉴클레오티드는 이중 가닥이다.
단일 표적 뉴클레오티드는 바람직하게는 천연 폴리뉴클레오티드이다. 단일 표적 뉴클레오티드는 게놈 DNA와 같은 이중 가닥일 수 있다. 단일 표적 폴리뉴클레오티드는 mRNA와 같은 단일 가닥일 수 있다. 단일 이중 가닥 표적 폴리뉴클레오티드는 듀플렉스의 각각의 가닥이 올리고에 의한 결합에 이용가능하도록 변성될 수 있다. 단일 폴리뉴클레오티드는 손상되고 복구된다. 다양한 실시형태에서, 단일 표적 폴리뉴클레오티드는 염색체의 전체 DNA 길이이다. 염색체의 전체 DNA 길이는 추출 없이 세포 내부에 남아 있을 수 있다. 시퀀싱은 염색체 DNA가 간기 동안 복잡한 경로를 따르는 세포 내부에서 수행될 수 있다. 제자리에서 올리고의 안정적인 결합이 입증되었다: B. Beliveau, A 외 Nature Communications 6 7147 (2015). 이러한 제자리 결합 올리고 및 3D 공간에서의 그의 나노메틱 국지화는 세포에서 염색체 분자의 서열 및 영역 배열이 결정되도록 할 수 있다. 본 발명은 올리고의 결합이 안정적이지 않고- 그것이 일시적이고 염색체 영역의 초-미세 분해를 가능하게 한다는 점에서 상이하다. 유사하게 RNA(예를 들어, microRNA, mRNA, lncRNA)의 장소 및 양은 결합 올리고에 대한 그의 결합 패턴에 의해 결정될 수 있다.
민감도의 한계에 도달하기
일단 분자가 세포로부터 방출되면 실질적으로 모든 분자는 시퀀싱에 이용가능하다. 첫째로, 관련이 있는 경우 분자가 고착하는 것을 방지하기 위해 영역이 부동태화된다. 그러면 실질적으로 모든 분자가 두 가지 방식 중 하나로 포획된다. 제1 경우 분자는 채널에서 계속 흘러 채널의 길이에 걸쳐 확률적으로 포획되며, 채널의 길이는 실질적으로 모든 분자가 결국 포획될 수 있을 만큼 충분히 길다. 이를 위해 채널은 매우 긴 길이를 작은 공간 안에 포장할 수 있는 구불구불한 채널이 될 수 있다. 둘째로, 하나 이상의 세포에서 방출되는 모든 분자는 3D 공간에서 개별적으로 분해가능할 수 있을 만큼 충분히 흐르고 분리되도록 허용될 수 있다. 그런 다음 용액은 젤리화되어, 즉 고체-겔 전이가 되어 분자가 3D 공간에서 이동억제된다. 그런 다음 분자는 광 시트 현미경 또는 회전 디스크 현미경 및 3D 단일 분자 국지화와 같은 3D 단면화 방법에 의해 3D 공간이 조사될 수 있는 본 발명의 시퀀싱 방법에 적용될 수 있다.
표면 상에 폴리뉴클레오티드 포획
일부 실시형태에서, 표적 폴리뉴클레오티드는 말단과의 소수성 상호작용을 통해 표면에 부착된다. 일부 실시형태에서, 폴리뉴클레오티드의 표면과의 접촉은 말단이 마모되어 소수성 단일 가닥이 노출되는 엄격한 조건하에서 발생한다.
일부 실시형태에서, 후퇴하는 메니스커스를 통해 신장을 생성하거나 유동 신장을 수행하기 위해 유동 셀을 사용하는 대신, 커버 유리는 용액으로부터 커버 유리를 빼낼 때 다듬질되는 폴리뉴클레오티드를 수반하는 트로프 안으로 침지된다.
일부 실시형태에서, 전기장은 (샘플의 더 많은 비율이 샘플링될 수 있도록) 음으로 하전된 폴리뉴클레오티드 및 일부 경우에 올리고 프로브를 표면으로 끌어당기는 데 사용될 수 있다.
표면 상에 폴리뉴클레오티드 고정
한쪽 말단에 이동억제화와 유동은 흔들기, 신장 및 수축 등을 허용하고, 중합체의 길이에 따른 신장의 정도에서 변동(그 수축 및 팽창)으로 인해, x-y 좌표는 한 주기와 다음 주기 사이의 표적에서 특정 위치에 대해 보장될 수 없다.
일부 실시형태에서, 재현가능한, 고정밀 및 정확한 국지화를 얻기 위해서는 중합체를 따라 다중 장소의 상대 위치가 변동되지 않는 것이 바람직하다는 인식이 있다. 그러한 경우에 연장된 분자는 그 길이를 따라 접촉의 다중 지점에 의해 표면에 이동억제화되거나 고정되어야 한다.
따라서 일부 실시형태에서, 중합체는 다중 상호작용에 의해 표면에 접촉된다(분자 다듬기 기술에서 수행되는 바와 같음(Michalet 외, Science 1999)). 그러면 사용의 조건하에서 상대적 장소가 고정되어 있이 공지되어 있다. 이를 고려하면, 본 발명자들은 그러한 현상을 본 적이 없지만, 부분적으로 표면에서 떨어져 나와 재-부착되는 일부 이상치가 있다.
따라서 긴 중합체가 분석되는 일부 실시형태에서 긴 중합체는 표면 또는 매트릭스와 다중 상호작용을 형성한다.
일부 양태에서 발명은 단일 분자에 대한 각 염기를 여러 번 조사하는 것을 포함하는 희귀 변이체를 검출하는 방법을 포함한다. 각 일시적인 결합 이벤트는 하나 이상의 염기를 조사하고 각 염기는 다중 결합 이벤트에 의해 조사된다. 더욱이 일부 실시형태에서, 각 염기는 서열이 중첩하는 다중 올리고뉴클레오티드에 의해, 예를 들어 타일링 시리즈에 의해 조사된다.
폴리뉴클레오티드 연장
다양한 실시형태에서, 방법은 온전한 표적 폴리뉴클레오티드로서 세포, 소기관, 염색체, 바이러스, 엑소좀 또는 체액으로부터 단일 표적 폴리뉴클레오티드 분자를 추출하는 것을 추가로 포함한다. 표적 폴리뉴클레오티드는 종종 천연의 접힌 상태를 취한다. 예를 들어 게놈 DNA는 염색체에 고도로 응축되어 있고 RNA는 2차 구조를 형성한다. 발명의 다양한 실시형태에서, 폴리뉴클레오티드를 펼치기 위한 단계가 수행된다. 다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 그의 백본이 추적될 수 있도록 선형 상태로 된다. 다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 연장된다. 이러한 연장은 그 결정학적 길이(한 염기에서 다음 염기로의 0.34nm 분리)와 같거나 더 길거나 더 짧게 만들 수 있다. 일부 실시형태에서, 폴리뉴클레오티드는 결정학적 길이를 넘어 신장된다.
다양한 실시형태에서 표적 폴리뉴클레오티드는 겔 또는 매트릭스에 배치된다. 다양한 실시형태에서 표적 폴리뉴클레오티드는 겔 또는 매트릭스 안으로 추출된다. 다양한 실시형태에서 표적 폴리뉴클레오티드는 마이크로유체 유동 셀 또는 채널 내부에서 추출된다.
다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 표면 상에 이동억제된다. 폴리뉴클레오티드는 평면 표면에 평행하게 또는 표면에 수직으로 배치될 수 있다. 평면 표면에 평행한 경우 CMOS 또는 CCD 카메라와 같은 2-D 어레이 검출기에서 인접 일련의 픽셀에 걸쳐 그의 길이가 이미지화될 수 있다. 표면에 수직인 경우 광 시트 현미경 또는 스캐닝 디스크 공초점 현미경 또는 그 변이체를 통해 그의 길이가 이미지화될 수 있다.
일부 실시형태에서, 폴리뉴클레오티드는 분자 다듬기를 통해 신장된다(예를 들어, Michalet 외, Science 277:1518 (1997) 및 Deen 외, ACS Nano 9:809-816 (2015)에 의해 기술된 바와 같음). 이것은 수백만 및 수십억 분자의 신장 및 단방향 정렬을 병렬로 가능하게 할 수 있다. 일부 실시형태에서, 분자 다듬기는 표면 위로 유체/액체의 전면을 변이함에 의해 수행된다. 일부 실시형태에서, 분자 다듬기는 Petit 외 Nano Letters 3:1141-1146(2003)에 기술된 방법 또는 방법의 변형된 버젼을 사용하여 채널에서 수행된다.
공기/물 계면의 모양은 연장된 폴리뉴클레오티드의 배향을 결정한다. 일부 실시형태에서, 폴리뉴클레오티드는 공기 물 계면에 수직으로 신장된다. 일부 실시형태에서, 표적 폴리뉴클레오티드는 그의 말단 중 하나 또는 둘 모두의 변형 없이 표면에 부착된다. 말단이 소수성 상호작용에 의해 포획되는 일부 실시형태에서, 후퇴하는 메니스커스를 사용한 신장은 듀플렉스의 일부를 변성시키고 표면과의 추가 소수성 상호작용을 생성한다.
일부 실시형태에서, 폴리뉴클레오티드는 분자 스레딩을 통해 신장된다(예를 들어, Payne 외, PLoS ONE 8(7): e69058 (2013)에 기술된 바와 같음). 일부 실시형태에서, 분자 스레딩은 표적이 (예를 들어, 화학적 변성제, 온도 또는 효소에 의해) 단일 가닥으로 만들어진 후에 수행된다. 일부 실시형태에서, 폴리뉴클레오티드는 일 말단에서 속박된 다음 유체 흐름에서 신장된다(예를 들어, Greene 외, Methods in Enzymology, 327: 293-315에 의해 기술된 바와 같음). 일부 실시형태에서, 폴리뉴클레오티드는 일 말단에서 속박된 다음 전기장에 의해 신장된다(예를 들어, Giese et al Nature Biotechnology 26: 317-325 (2008)에 의해 기술된 바와 같음).
다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 겔에 배치된다. 다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 마이크로-유체 채널에 배치된다. 다양한 실시형태에서, 표적 폴리뉴클레오티드는 일 말단에서 표면에 부착되고 유동 스트림에서 연장된다.
일부 실시형태에서, 연장은 전기영동으로 인한 것이다. 일부 실시형태에서, 연장은 나노구속으로 인한 것이다. 일부 실시형태에서, 연장은 유체역학적 드래그로 인한 것이다. 일부 실시형태에서, 폴리뉴클레오티드는 교차유동 나노슬릿에서 신장된다(예를 들어, Marie 외 Proc Natl Acad Sci U S A. 110:4893-8 (2013)에 의해 기술된 바와 같음).
일부 실시형태에서, 폴리뉴클레오티드를 마이크로- 또는 나노유체 유동 셀을 통해 나노채널 안으로 삽입하는 것보다, 폴리뉴클레오티드는 채널의 벽이 형성되는 표면이 전기적으로 바이어스되는 방식으로 채널을 구성함에 의해 개방형-상부 채널 안으로 삽입된다(예를 들어, Asanov AN, Wilson WW, Oldham P B. Anal Chem. 1998 Mar. 15; 70(6):1156-6 참조). 양의 바이어스가 표면에 적용되어, 음으로 하전된 폴리뉴클레오티드가 나노채널 안으로 끌려진다. 채널 벽의 융기부는 바이어스를 포함하지 않으므로 폴리뉴클레오티드는 거기에 침착될 가능성이 적고 비-오염 특성을 갖고, 지질, BSA, Caesin, PEG 등으로 부동태화되는 물질로 제작되거나 이들로 코팅될 수 있다. 일부 실시형태에서, 나노채널 안으로 끌어당겨진 폴리뉴클레오티드는 채널에 나노구속되고 이에 의해 연장된다. 일부 실시형태에서, 나노구속 후 폴리뉴클레오티드는 바이어스된 표면, 또는 표면 상부의 코팅 또는 매트릭스 상에 침착된다. 표면은 인듐 주석 산화물(ITO)을 포함할 수 있다.
일부 실시형태에서, 폴리뉴클레오티드는 모두 동일한 방향으로 잘 정렬되지 않거나 직선이 아니며, 오히려 2D 또는 3D 공간에 걸쳐 곡선 경로를 차지하며; 직선형의 잘 정렬된 분자와 같은 동일한 종류의 정보가 획득될 수 있지만, 이미지 처리 작업이 더 어렵고 분자가 다른 방향을 취하는 경우에 중첩하고 오류가 초래될 가능성이 증가된다. 그러나 이것은 시퀀싱이 세포 내부의 제자리에서 폴리뉴클레오티드에 대해 수행될 때 필요악이다.
다양한 실시형태에서, 방법은 단일 또는 다중 염색체, 엑소좀, 핵 또는 세포로부터 폴리뉴클레오티드를 유로 안으로 방출하는 것을 추가로 포함한다.
다양한 실시형태에서, 유로의 벽은 폴리뉴클레오티드 격리를 방지하는 부동태화를 포함한다. 다양한 실시형태에서, 부동태화는 카제인, PEG, 지질 또는 소 혈청 알부민(BSA) 코팅을 포함한다.
용어 연장된, 연신된, 신장된, 선형화된, 직선화된은 상호교환가능하게 사용될 수 있고 일반적으로 다중 결합 부위가 떨어져 있는 뉴클레오티드의 수와 다소 상관관계가 있는 물리적 거리만큼 분리되어 있음을 의미한다. 물리적 거리가 염기의 수와 일치하는 정도에서 약간의 부정확성은 용인될 수 있다. 폴리뉴클레오티드 길이의 전체에 걸쳐 연장 또는 신장이 균일하지 않은 경우에, 물리적 거리는 폴리뉴클레오티드의 전체 길이에 걸쳐 동일한 비율을 갖는 염기의 수와 상관관계가 없다. 이것은 무시할 수 있는 정도로 발생할 수 있고 알고리즘에 의해 효과적으로 무시되거나 처리될 수 있다. 이것이 상당한 정도로 발생하는 경우, 다른 조치가 필요하다. 예를 들어, 폴리뉴클레오티드의 일부 세그먼트에서 신장은 결정학적 길이의 90%인 반면, 다른 영역에서는 대략 50% 분기될 수 있다. 이를 처리하는 한 가지 방법은 연속적인 서열을 함께 처리하는 어셈블리 알고리즘을 통한 것이다. 한 극단에서 알고리즘은 거리 데이터가 필요하지 않고 판독의 순서만 필요하다. 이를 처리하는 또 다른 방법은 JOJO-1 또는 YOYO-1과 같은 개재하는 염료를 사용하여 폴리뉴클레오티드의 길이를 염색하는 것에 의한 것이며, 그런 다음 폴리뉴클레오티드가 특정 세그먼트에서 덜 신장되는 경우, 더 많은 염료 신호는 폴리뉴클레오티드가 더 신장되는 세그먼트에 비교하여 폴리뉴클레오티드의 세그먼트에 걸쳐 관찰될 것이다. 통합된 염료 신호는 원점 간의 거리를 계산하는 방정식의 일부로 사용될 수 있다.
다양한 실시형태에서, 표적 폴리뉴클레오티드 분자는 온전하다. 표적이 천연 게놈 DNA인 경우 올리고뉴클레오티드가 결합되기 전에 단일 가닥으로 만들 수 있다. 이는 먼저 추가된 폴리뉴클레오티드를 연장하거나 신장한 다음 변성 용액(예를 들어, 0.5M 또는 1M NaOH)을 추가하여 두 가닥을 분리함에 의해 수행될 수 있다. 올리고는 더 높은 안정성 듀플렉스를 형성할 수 있도록 변형될 수 있다. 올리고는 안정성을 증가시키기 위해 확장이 일어날 수 있는 자유 3' 말단이다. 일부 실시형태에서, 올리고는 게놈 내의 특정 초-빈도 표적 부위를 표적화할 수 있다(예를 들어, Liu 외 BMC Genomics 9:509 2008에 기재된 바와 같음).
올리고는 맞춤형 마이크로어레이 합성을 사용하여 만들어진 라이브러리를 포함할 수 있다. 마이크로어레이 제작 라이브러리는 암 패널과 같은 특정 질환에 대한 패널 또는 모든 엑손과 같은 게놈에서의 특정 부위를 표적화하는 올리고를 포함할 수 있다. 마이크로어레이 제작 라이브러리는 폴리뉴클레오티드를 가로질러 특정 거리 떨어져 있는 장소에 체계적으로 결합하는 올리고를 포함할 수 있다. 예를 들어 100만 개 올리고로 구성된 라이브러리는 대략 3000개 염기마다 결합할 것이다. 천만 개 올리고를 포함하는 라이브러리는 대략 300개 염기마다 결합하도록 설계될 수 있고 3천만 개 올리고를 포함하는 라이브러리는 100개 염기마다 결합하도록 설계될 수 있다. 올리고의 서열은 참조 게놈 서열에 기반하여 계산적으로 설계될 수 있다. 예를 들어 올리고가 1000개 염기마다 결합하도록 설계된 경우에, 그러나 1회 또는 몇 회의 뉴클레오티드 통합 후 거리가 발산한다는 것이 분명해지면, 참조와 비교하여 구조적 변형이 발생하고 있다는 징후이다. 올리고의 세트는 참조 자체로부터 폴리뉴클레오티드에 대한 시퀀싱을 시작하기 위해 이를 사용함에 의해 먼저 검증될 수 있고 올바른 장소에 결합하지 못하는 올리고는 향후 라이브러리에서 생략될 수 있다.
폴리뉴클레오티드를 따라 밀접하게 이격된 신호의 검출
스캐닝 프로브 현미경(고속 AFM 포함) 및 전자 현미경과 같은 여러 검출 방법은 폴리뉴클레오티드 분자가 검출의 평면에서 연장될 때 나노미터 거리를 분해할 수 있다. 더욱이 STED, 확률적 광학 재구성 현미경(STORM), 초-해상도 광학 변동 이미징(SOFI), 단일 분자 국지화 현미경(SMLM)과 같은 초-해상도 광학 방법이 이러한 거리를 분해할 수 있다. 이들 방법을 포괄하지만, 본 발명은 특히 나노스케일 토포그래피(PAINT)에서의 포인트 축적과 가장 유사한 SMLM 접근방식을 이용한다.
본 발명은 단일 결합 위치를 짧은 DNA 표적에 단순히 국지화하는 것 이상이다. 발명의 신규한 양태는 폴리뉴클레오티드의 길이를 따라 단일 올리고 종의 다중 결합 위치를 국지화하는 것이다. 발명의 또 다른 신규한 양태는 다중 올리고뉴클레오티드 종의 결합을 폴리뉴클레오티드 상에 국지화하는 것이다. 발명의 또 다른 신규한 양태는 단일 올리고뉴클레오티드 종 또는 다중 올리고뉴클레오티드 종의 결합 위치 사이의 거리를 결정하는 것이다. 발명의 또 다른 신규한 양태는 폴리뉴클레오티드에 따른 다중 결합 위치의 나노미터 장소를 결정하는 것이다. 발명의 또 다른 신규한 양태는 폴리뉴클레오티드의 어레이에 존재하는 특정 폴리뉴클레오티드에 프로브 결합 이벤트를 할당하는 것이다. 발명의 또 다른 신규한 양태는 폴리뉴클레오티드에 따른 다중 유형의 화학적 실체(예를 들어, 서열 결합 프로브, 에피게놈 마크 결합 프로브)의 다중 결합 위치의 나노미터 장소를 결정하는 것이다. 발명의 또 다른 신규한 양태는 후성유전체 결합 프로브를 폴리뉴클레오티드에 나노미터적으로 국지화하는 것을 포함한다. 발명의 또 다른 양태는 단일 폴리뉴클레오이드에 대한 서열의 반복적인 조사에 의해 서열을 검출하는 정확도를 증가시키는 것이다. 발명의 또 다른 신규한 양태는 올리고뉴클레오티드의 완전한 레퍼토리의 장소를 결정함에 의해 폴리뉴클레오티드의 서열을 결정하는 것이다. 발명의 또 다른 신규한 양태는 올리고뉴클레오티드의 타일링 어레이의 장소를 결정함에 의해 폴리뉴클레오티드의 표적화된 분절의 서열을 결정하는 것이다.
정렬된 어레이
폴리뉴클레오티드는 분자가 주어진 표면 영역 내에서 최대로 패킹되고 이들이 중첩되지 않도록 정렬된 방식으로 표면 상에 렌더링될 수 있다. 이는 패턴화된 표면, 예를 들어 폴리뉴클레오티드의 말단(예를 들어, 길이 1Mbp)이 결합하는 그러한 장소에서 다음 패치가 폴리뉴클레오티드의 말단 바로 너머에 있는 소수성 패치의 정렬된 배열을 만들어 수행될 수 있다. 대안적으로, 올리고뉴클레오티드의 공간적으로 어드레스할 수 있는 어레이는 폴리뉴클레오티드를 포획하는데 사용될 수 있다. 폴리뉴클레오티드는 단일 가닥이고 폴리A 꼬리(예를 들어, mRNA)와 같은 공통 서열 트랙을 갖는다. 폴리뉴클레오티드는 제한 효소에 의해 생성된 점착성 말단을 갖는 이중 가닥이다. 예를 들어 희귀 절단 제한 효소, 예를 들어, Pmme1 또는 NOT 1을 사용하여 각각 공통 말단 서열을 함유하는 긴 단편을 생성할 수 있다.
정렬된 어레이는 또한 나노유체학을 사용하여 생성될 수 있다. 일 경우에, 표면에 텍스처링된 나노트렌치 또는 나노그루브(예를 들어, 폭 100nm, 깊이 150nm)의 어레이는 거류하는 하나의 폴리뉴클레오티드가 다른 폴리뉴클레오티드의 진입을 배제하는 긴 폴리뉴클레오티드를 정렬하는 역할을 한다. 또 다른 경우에, 긴 폴리뉴클레오티드의 세그먼트가 피트에 있고 긴 세그먼트가 피트 사이에 있는 나노피트 어레이가 있다. 정렬된 어레이가 또한 제작될 수 있다.
일시적인 프로브 결합 및 어셈블리에 의한 시퀀싱
발명의 일부 실시형태에서, 시퀀싱 판독은 그 자체로 획득되지 않는다. 일시적인 프로브 결합에 의한 시퀀싱의 경우, 판독은 폴리뉴클레오티드 상의 특정 장소에 혼성화된 올리고의 상보체이다. 제1 수준에서 어셈블리는 올리고의 결합에 의해 수집된 서열 정보로부터 수행된다. 따라서, 발명의 일부 실시형태는 다음을 포함한다:
(i) 폴리뉴클레오티드(들)를 신장하는 것
(ii) 폴리뉴클레오티드(들)를 변성하는 것(예를 들어, 표적이 RNA인 경우 2차 구조를 제거하거나, 표적이 게놈 DNA와 같은 이중 가닥 DNA인 경우 이중 나선을 분리하는 것);
(iii) 불안정한 상호작용으로 표적에 결합하는 짧은 올리고 프로브를 추가하는 것; 및
(iv) 각 짧은 올리고 프로브의 결합의 장소를 결정하는 것.
일부 실시형태에서, 각 올리고 서열은 한번에 하나씩 추가된다. 일부 실시형태에서, 올리고는 그의 정체성이 디코딩될 수 있는 태그, 예를 들어, 올리고의 직교 세트가 결합될 수 있거나 그의 정체성을 결정하는 서열 태그를 보유한다. 일부 실시형태에서, 한 번에 하나 초과의 올리고가 추가된다. 일부 실시형태에서, 디코딩될 수 있는 만큼 많은 올리고가 추가된다. 예를 들어 16개 별도의 코드가 이용가능한 경우 각각 코드 중 하나를 담지하는 16개 올리고 서열이 동시에 추가된다. 일부 실시형태에서, 실질적으로 더 많은 올리고가 추가되고 광학 바코드, 예컨대 DNA 오리가미(예를 들어, Nat Chem. 10:832-9, 2012에 기술된 바와 같음)를 사용하여 구별된다. 일부 실시형태에서, 올리고의 완전한 세트, 예를 들어 모든 5-mer 또는 6-mer(선택적으로 축퇴 또는 보편적 위치로 보충됨)가 사용된다.
제2 수준에서 어셈블리는 제1 수준에서 어셈블리된 폴리뉴클레오티드의 중첩에 의해 전체 염색체에 수행된다. 중첩하는 길이가 충분한 경우 단상형 단계적 어셈블리가 수행될 수 있다.
경쟁을 통해 수행된 일시적인 프로브 결합
올리고 프로브의 결합은 동적 과정이고 결합된 프로브는 (온도 및 염 농도를 포함한 다양한 인자에 의해 결정되는 속도로) 지속적으로 휴지하므로, 한 가닥의 다른 가닥과의 변위에 대한 기회가 있다는 것이 이해되어야 한다. 예를 들어, 일 실시형태에서 용액에서의 보체를 갖는, 표면 상의 신장된 표적 DNA에 대한 어닐링 사이의 연속적인 경쟁을 생성하는 프로브 보체가 사용된다. 다른 실시형태에서, 프로브는 3개의 부분을 갖는다: 제1 부분은 표적에 상보적이고; 제2 부분은 표적에 부분적으로 상보적이고 용액에서 올리고에 부분적으로 상보적이며; 제3 부분은 용액에서 올리고에 상보적이다.
일부 실시형태에서, 불일치 표적에 결합될 때 경쟁적으로 불안정화되는 부분 이중 가닥을 포함하는 토홀드 프로브(예를 들어, Nature Methods 10:865(2013)에 기재된 바와 같음)가 사용된다(예를 들어, Nature Chemistry 5, 782-789(2013)에 기재된 바와 같음).
이 방법은 일시적인 프로브 결합에 의해 시퀀싱의 정확성을 보장할 수 있다. 방법은 다음을 포함한다:
(i) 폴리뉴클레오티드를 신장하는 것;
(ii) 폴리뉴클레오티드가 단일 가닥이 아닌 경우, 그것을 (예를 들어, 변성을 통해) 실질적으로 단일-가닥으로 만드는 것;
(iii) 토홀드 프로브 세트의 레퍼토리를 표적 폴리뉴클레오티드에 적용하는 것;
(iv) 레퍼토리에서 각 토홀드 프로브 세트에 대한 토홀드 프로브 세트로부터 하나의 올리고의 결합의 장소를 결정하는 것; 및
(v) 레퍼토리에서 모든 토홀드 프로브에 대한 국지화 데이터를 기반으로 서열을 재구성하는 것.
일부 실시형태에서, 정확한 혼성화를 보장하기 위해 토-홀드 프로브가 사용된다. 일부 실시형태에서, 토-홀드 프로브는 오프 반응을 촉진하기 위해 사용된다.
짧은 범위 서열을 어셈블리하고 긴 범위 서열을 만들기 위해 조합하는 것
일부 실시형태에서, 국지화 정확도 또는 정밀도는 서열 비트를 함께 스티칭하기에 충분하지 않다. 프로브의 서브-세트는 특정 지역 내에서 결합하는 것으로 밝혀졌지만 엄격히 국지화 데이터에서 그 순서를 확신을 가지고 결정하기는 어렵다. 일부 경우에 분해능은 회절로 제한된다. 일부 실시형태에서, 지역 또는 회절-제한된 지점 내의 짧은-범위 서열은 지역 또는 지점 내에 위치하는 프로브의 서열 중첩에 의해 어셈블리될 수 있다. 따라서 짧은-범위 서열은 예를 들어 올리고의 서브-세트의 개별 서열이 어떻게 중첩하는지에 대한 정보를 사용함에 의해 어셈블리된다. 이 방식으로 구성된 짧은 범위 서열은 그 다음 폴리뉴클레오티드 상의 그 순서에 기반하여 긴-범위 서열 안으로 함께 스티칭될 수 있다. 따라서 인접하거나 중첩하는 지점에서 획득된 짧은-범위 서열을 조합함에 의하여 긴-범위-서열이 획득된다.
단독중합체 및 짧은 탠덤 반복
단독중합체의 문제가 있는데, 길이가 올리고의 길이보다 긴 경우 염기의 수, 예를 들어 10개 염기 단독중합체를 열거하기 어렵다는 문제가 있다. 또한 짧은 탠덤 반복은 열거하기 어려울 수 있다. 이것은 예를 들어 다음 중 임의의 하나인, 다수의 방법에서 해결될 수 있다.
1. 반복이 확장되는 정확한 범위가 결정될 수 있도록 국지화 정확도를 증가시킨다.
2. 영역에 대한 결합의 동역학은 (임의의 반복 서열의) 다중 탠덤 카피가 있는 경우 또는 부분 카피가 있는 경우에도 상이할 것이고, 카피의 수는 결합 속도의 증가에 의해 추정될 수 있고; 오프 속도는 또한 한 사이트를 묶은 올리오가 3-D 공간을 거치지 않고도 다른 인접 부위로 이동할 수 있기 때문에 영향을 받을 것이다.
3. 또한 듀플렉스에서 두 가닥 사이의 염기의 수는 일치해야 하고 일치하지 않으면 그것은 부정확성을 제시한다.
4. 단독중합체 뿐만 아니라 5-mer 레퍼토리의 경우, 더 긴 단독중합체 올리고가 적절한 Tm, 예를 들어 6As, 7As, 8As 등에서 추가될 수 있다.
5. 참조 게놈을 고려한다.
6. 단독중합체 또는 반복이 특정 길이일 가능성을 제공한다.
폴리뉴클레오티드 식별
폴리뉴클레오티드의 정체성은 그 길이에 따른 프로브 결합의 패턴에 의해 결정될 수 있다. 정체성은 RNA 종의 정체성, RNA 이소폼일 수 있다. 그것은 또한 폴리뉴클레오티드가 상응하는 참조에서의 장소일 수 있다.
후성유전체 변형의 국지화
메틸화 분석은 시퀀싱에 직교하여 수행될 수 있다. 일부 실시형태에서, 이것은 시퀀싱 전에 수행된다. 항-메틸 C 항체 또는 메틸 결합 단백질(메틸 결합 도메인(MBD) 단백질 패밀리는 MeCP2, MBD1, MBD2 및 MBD4를 포함함) 또는 펩티드(MBD1 기반)는 폴리뉴클레오티드에 결합될 수 있으며, 그의 장소는 그것이 제거되기 전에 표지를 통해 감지되었다(예를 들어, 고염 완충액, 카오트로픽 시약, SDS, 단백질분해효소, 요소 및/또는 헤파린을 첨가함에 의함). 바람직하게는 시약은 온-오프 결합을 촉진하는 일시적인 결합 완충액의 사용으로 인해 일시적으로 결합하거나 시약은 일시적으로 결합하도록 조작된다.
항체가 이용가능하거나 생성될 수 있는 DNA 손상의 부위 또는 하이드록시메틸화와 같은 다른 폴리뉴클레오티드 변형에 대해 유사한 접근방식이 취해진다. 변형의 장소가 검출되고 변형 결합 시약이 제거된 후 시퀀싱을 개시할 수 있다. 일부 실시형태에서, 항-메틸 및 항-하이드록시메틸 항체 등은 표적 폴리뉴클레오티드가 단일 가닥이 되도록 변성된 후에 추가된다. 이 방법은 매우 민감성이고 긴 폴리뉴클레오티드 상에서 단일 변형을 검출할 수 있다.
메틸화와 같은 DNA 변형에 대한 참조 후성유전체는 없다. 유용하기 위해서는 공지되지 않은 폴리뉴클레오티드의 메틸화 지도가 핵산 서열 또는 서열-기반 지도에 연결되어야할 필요가 있다. 따라서 본 발명의 에피-매핑 방법은 에피게놈 지도에 상황를 제공하기 위해 올리고 결합에 의해 획득된 서열 비트와 상관될 수 있다. 서열 판독 외에, 서열 정보를 획득하는 다른 수단은 후성유전체 지도와 커플링될 수 있다. 이것은 닉킹 엔도뉴클레아제-기반 지도, 올리고-결합 기반 지도, 변성 및 변성-재생 지도를 포함한다. 일부 실시형태에서, 하나 이상의 올리고의 일시적인 결합을 사용하여 폴리뉴클레오티드를 맵핑할 수 있다. 게놈에 대한 기능적 변형 외에도 DNA 손상 및 단백질(예를 들어, 전사 인자) 또는 리간드 결합의 부위와 같은 게놈 상에 매핑되는 다른 기능에도 동일한 접근방식을 적용할 수 있다.
본 발명에서 염기 시퀀싱 또는 후성유전체 시퀀싱이 먼저 수행될 수 있다. 일부 실시형태에서, 둘 모두는 동시에 수행될 수 있다. 예를 들어, 특이적 에피-변형에 대한 항체는 올리고로부터 차등적으로 코딩될 수 있고, 두 유형의 프로브의 결합을 일시적으로 만드는 저염과 같은 조건이 사용된다.
일부 실시형태에서, 항체는 DNA 상의 변형 뿐만 아니라 히스톤 아세틸화 및 메틸화와 같은 히스톤 상의 변형을 검출하기 위해 염색체 또는 염색질 상에서 사용될 수 있다. 이들 변형의 장소는 염색체 또는 염색질 상의 장소에 대한 항체의 일시적인 결합에 의해 결정될 수 있다. 일부 실시형태에서, 항체는 올리고 태그로 표지되고 일시적으로 결합하지 않지만 그의 결합 부위에 영구적으로 또는 반-영구적으로 고정될 수 있다. 이 경우에 장소는 항체에 태깅하는 것에 대한 상보적 올리고의 일시적인 결합을 사용함에 의해 감지될 수 있다.
판독의 장소 보존을 위한 샘플 처리
일부 실시형태에서, 폴리뉴클레오티드가 신장된 후 겔 오버레이가 적용된다. 표면 상의 연장 및 변성 후 폴리뉴클레오티드(이중 가닥 또는 변성된 것)는 겔 층으로 커버될 수 있다. 대안적으로 폴리뉴클레오티드는 이미 겔 환경에 있는 동안 연장된다. 일부 실시형태에서, 폴리뉴클레오티드가 연장된 후 겔에서 캐스팅된다. 예를 들어 폴리뉴클레오티드가 한쪽 말단에서 표면에 부착되고 유동 스트림에서 또는 전기영동 전류에 의해 신장되면 주변 매체가 겔 안으로 캐스팅될 수 있다. 이는 경화될 때 폴리아크릴아미드가 되는 유동 스트림에 아크릴아미드, 암모늄 퍼설페이트 및 TEMED를 포함함에 의해 발생할 수 있다. 대안적으로 열에 반응하는 겔이 적용될 수 있다. 일부 실시형태에서, 폴리뉴클레오티드의 말단은 아크릴아미드와 중합하는 아크리다이트로 변형될 수 있다. 그런 다음 천연 폴리뉴클레오티드의 음의 백본이 주어지면 폴리뉴클레오티드를 양극 쪽으로 연장하는 전기장이 적용될 수 있다.
일부 실시형태에서 샘플은 그 환경의 매트릭스에 가교-결합되며; 이것은 세포 환경이다. 예를 들어, 시퀀싱이 세포 내에서 제자리에서 수행될 때, 폴리뉴클레오티드는 이종이기능성 교차 링커를 사용하여 세포 매트릭스에 가교-결합된다. 이것은 FISSEQ와 같은 기술을 사용하여 시퀀싱이 세포 내부에 직접 적용될 때 수행되었다(예를 들어, Lee 외 Science 343:1360-3(2014)에 기재된 바와 같음).
일부 실시형태에서, 표적화된 시퀀싱을 가능하게 하기 위해, 프로브의 패널이 사용된다. 표적화된 시퀀싱이 수행될 때 복잡한 샘플(예를 들어, 전체 게놈 또는 전사체)로부터 폴리뉴클레오티드의 하위집합만 분석되어질 필요가 있기 때문에 폴리뉴클레오티드는 평소보다 높은 밀도로 표면 또는 매트릭스 상에 배치될 수 있다. 따라서 회절 제한된 공간 내에서 연장된 폴리뉴클레오티드가 여러 개 있는 경우에도 신호가 검출되면 표적화된 유전자좌 중 하나만 있을 가능성이 높다. 이것은 그 다음 표적화된 시퀀싱에 필요한 이미징이 표적이 되는 샘플의 분획과 동반되는 것을 허용한다. 예를 들어, 엑손을 포함하는 게놈의 <5%가 표적화된 경우 폴리뉴클레오티드의 밀도는 20X 더 클 수 있고 따라서 전체 게놈을 분석하는 경우보다 이미징 시간이 10x 더 짧을 수 있다.
일부 실시형태에서, 표적화된 게놈의 부분은 특정 유전자의 유전자좌이다. 다른 실시형태에서, 표적화된 게놈의 부분은 유전자좌의 패널, 예를 들어 암에 연결된 유전자, 또는 게놈-와이드 협회 연구에 의해 확인된 염색체 간격 내의 유전자이다. 표적화된 유전자좌는 또한 게놈의 암흑 물질, 전형적으로 반복적인 게놈의 이색성 영역, 뿐만 아니라 반복 영역 부근에 있는 복잡한 유전자의 유전자좌일 수 있다. 이러한 영역은 텔로미어, 중심체 및 말단 동원체형의 염색체의 짧은 팔뿐만 아니라 게놈의 다른 낮은 복잡성 영역을 포함했다. 전통적인 시퀀싱 방법은 게놈의 반복적인 부분을 다룰 수 없지만, 나노미터 정밀도가 높을 때 본 발명의 방법은 이들 영역을 포괄적으로 다룰 수 있다.
본 발명의 이점은 대신에 짧은 올리고의 결합에 의해 획득된 연속적이거나 중첩하는 서열 정보를 함께 스티칭함에 의해 비용이 많이 들고 시간 소모적인 개별 긴 판독을 실제로 수행함이 없이 긴 판독을 얻을 수 있다는 것이다. 단일 폴리뉴클레오티드 분자의 길이를 따라 복수의 짧은, 3, 4, 5 또는 6개 염기 서열 정보의 비트가 동시적으로 획득되고, 따라서 그것이 모두 연결되고, 폴리뉴클레오티드가 온-오프 결합 올리고로 포화되었을 때 그의 나노미터 위치, 분해능 및 순서는 전체 분자의 서열을 밝힌다. 폴리뉴클레오티드의 시퀀싱은 분자에서 한 장소에서 다른 장소로의 SbS 반응(예를 들어, PacBio 시퀀싱)에 의해 단일 긴 판독이 획득되어 지는 것보다 다중 서열 정보의 비트가 동시적으로 획득되어 지기 때문에 현재 방법보다 시간이 덜 걸린다.
발명의 또 다른 주요 이점은 마이크로어레이 기반 기술, 현재의 지배적인 접근방식 및 해결법에서는 도전적인 균형된 카피 수 변이 및 역전과 마이크로어레이, 세포유전학 또는 기타 현재 시퀀싱 방법으로는 접근할 수 없는 규모를 포함하여, 작거나 크거나 상관없이 모든 유형의 구조적 변이를 검출할 수 있다는 것이다.
더욱이, 방법은 게놈의 반복 영역을 통한 시퀀싱을 허용한다. 기존 시퀀싱의 경우 게놈의 이러한 부분을 통한 판독에서의 문제는 첫째, 이러한 영역이 참조 게놈 및 드 노보 어셈블리가 아닌 참조로 정렬을 만듦에 의해 큰 게놈을 전형적으로 다루는 Illumina, Ion Torrent, Helicos/SeqLL 및 Complete Genomics와 같은 기술에서 잘 표현되지 않는다는 것이다. 둘째로, 판독이 반복 영역 전체에 걸쳐 실행되지 않으면 영역에 걸쳐 더 짧은 판독을 통해 영역을 어셈블리하기가 어렵다. 이는 한 분자에 대한 반복 영역과 다른 분자에 대한 반복 영역과의 사이에서 가능한 다중 정렬 중 어느 것이 올바른지 결정하기 어려울 수 있기 때문이다. 잘못된 정렬은 어셈블리에서 반복 영역을 줄이거나 늘릴 수 있다. 발명의 시퀀싱 방법에서, 동시에 또는 한 세트씩 차례로 수행하는 다중 판독에 의해 단일 분자의 완전하거나 거의 완전한 적용범위가 있는 경우, (폴리뉴클레오티드 그 자체가 반복 영역의 전체에 걸쳐 있는 경우) 반복 영역의 전체에 걸쳐 있는 어셈블리가 구성될 수 있다. 본 발명의 방법은 반복 영역에 걸쳐 있기에 충분히 긴 폴리뉴클레오티드에 적용될 수 있다. 1Mb에서 10Mb 사이의 폴리뉴클레오티드는 게놈에서 대부분의 반복 영역에 걸쳐 있기에 충분하다. 발명의 방법은 Freitag 외에 나타나 있고 다음에서(예를 들어, Rasmussen, 외 Lab on a Chip, 11:1431-3 (2011)에 기술된 바와 같이 시도된 바와 같이 진핵생물 게놈으로부터 폴리뉴클레오티드의 완전한 염색체 길이에 적용될 수 있으며 따라서 게놈에서 가능한 반복 길이의 전부 또는 대부분에 걸쳐 있는 것이 가능하다.
폴리뉴클레오티드 제자리 영역 정보 보존
일부 실시형태에서, 본 발명의 시퀀싱 방법은 세포 내부에서 제자리에 적용된다. RNA 및 게놈 DNA의 경우에 그것이 변성된 후 시퀀싱이 시작될 수 있다. mRNA의 경우에, 시퀀싱은 2차 구조를 변성시킨 후 선택적으로 시작될 수 있다. 일부 실시형태에서, 시퀀싱은 예를 들어 마이크로톰에 의해 획득된 세포의 슬라이스 상에서 수행된다.
세포 내부에서 본 발명의 시퀀싱 방법을 수행함에 의해 게놈 DNA의 시퀀싱 뿐만 아니라 세포 내 게놈 DNA의 장소를 확립할 수 있다. 더욱이, 조직에 적용하면 그것은 염색체 조직에서 차이뿐만 아니라 분석할 조직의 세포에서 체세포 변이체의 분포를 가능하게 한다. 이는 게놈의 다른 부분이 세포 내부에서 서로 상호작용하기 때문에 매우 중요하다. 예를 들어 인핸서는 루프를 통해 유전자 영역에 접촉하고 제자리 게놈 분석은 이러한 상호작용이 관찰될 수 있게 한다. 또한, 세포 내부의 게놈 또는 개별 염색체의 조직화를 시각화하거나 결정할 수 있다. 부가하여 과정은 접시에서 성장한 세포의 모집단(예를 들어, 섬유아세포 또는 뉴런) 또는 조직 절편에 대해 수행될 수 있다. 실질적으로 3-차원인 세포 또는 조직의 경우, 시퀀싱은 세포 또는 조직의 조각에 대해 수행될 수 있다. 일부 실시형태에서, 세포 내부의 염색질 DNA는 변성되고(예를 들어 0.5M NaOH 사용함), 그 다음 발명의 일시적인 결합 상호작용이 수행된다. RNA는 RNAses를 추가함에 의해 제거될 수 있다. 일부 실시형태에서, 일시적인 결합 상호작용은 표지되지 않은 프로브 결합에 의해 형성된 듀플렉스 안으로 염료 결합을 개재시킴에 의해 검출된다. 일부 실시형태에서, 프로브는 표지되고 결합은 듀플렉스 안으로 개재되는 염료와 프로브 상의 표지 사이의 FRET를 통해 검출된다.
결합 프로브의 정체성 및 공간적 위치
발명의 일 양태는 복수의 서열 단편 각각에 일시적으로 결합된 프로브의 정체성 및 공간적 위치를 저장하는 것이다. 폴리뉴클레오티드를 따른 프로브의 결합 위치는 검출기의 장소 민감성 양태에 의해 결정된다. CCD와 같은 2-차원 검출기를 사용하는 경우 장소는 이미지가 투영되는 픽셀의 x-y 좌표에 의해 결정된다. 실제 탐지 이벤트에서 표지의 가짜 결합을 제거하기 위해 다수의 계산 필터가 사용된다. 표지는 폴리뉴클레오티드가 따라오는 경로를 표시하기 위해 여러 기원을 통해 추적하는 선과 상호연관되어야 하며; 경로가 직선일 때 필터를 통과하는 위치는 직선에 떨어진다.
생체고분자에 결합하는 프로브의 정체성은 두 가지 방식 중 하나로 결정될 수 있다. 복수의 프로브가 상이하게 표지되고 하나의 반응 부피에서 함께 사용되는 경우, 올리고의 정체성은 폴리뉴클레오티드를 따라 특정 장소에서 검출되는 코드 표지를 검출함에 의해 결정된다. 이것은 각 표지에 하나씩 4개의 서로 다른 레이저를 발사함에 의하여, 각 표지에 하나씩 4개의 서로 다른 방출 필터를 사용함에 의해 또는 서로 다른 레이저와 방출 필터의 조합을 사용함에 의해 수행될 수 있다. 이 경우 이미지는 하나의 파장에 대해 촬영되고, 폴리뉴클레오티드에 매핑될 수 있고, 그 다음에 다음이 되는 식이다. 4개 표지를 직렬로 검출하는 대안은 4개 표지를 동시적으로 검출하는 것이다. 이것은 프리즘을 사용하여 방출 광을 2-차원 검출기 상에 별개의 장소로 분할함에 의해 수행될 수 있다. 이것은 또한 4개의 표지 각각에 대해 하나씩 4개의 채널로 방출 파장을 분할하기 위해 2색성의 거울과 방출 필터를 사용함에 의해 수행될 수 있다. 마지막으로, 방출 파장은 임의의 수의 채널 사이에 분할될 수 있고, 각 신호의 강도는 각 채널에서 검출되어 표지 특이적-서명을 제공한다. 일부 실시형태에서, 각 형광단에 대한 채널에 걸쳐 있는 서명을 먼저 얻은 다음, 서명을 사용하여 표지 및 이에 따라 기록된 데이터로부터의 서열을 식별한다.
시퀀싱 태그
일부 실시형태에서, DNA의 세그먼트는 제자리에서 (즉, 게놈 DNA의 길이를 따라 또는 세포 내에서) 태그되고 태그의 장소 및 정체성은 본 발명의 일시적인 결합 방법을 사용하여 결정된다. 태그는 서열 태그일 수 있고 일시적으로 결합하는 올리고의 작은 풀만이 그의 정체성을 결정하는 데 사용될 수 있는 방식으로 설계될 수 있다. 일부 실시형태에서, 일단 태그의 장소 및 정체성이 결정되면, 폴리뉴클레오티드는 세포로부터 추출되거나 표면으로부터 방출될 수 있는 반면, 서열 태그는 폴리뉴클레오티드 단편에 부착된 채로 남아 있다. 폴리뉴클레오티드 + 서열 태그는 임의의 시퀀싱 방법, 예를 들어 고처리량 Illumina 시퀀싱을 사용하여 선택적으로 증폭 및 서열화될 수 있다. 시퀀싱의 출력으로부터 태그의 서열은 서열의 특정 세그먼트를 게놈에서 특정 장소에 국지화하는 데 사용될 수 있다.
염료 광물리학
단일 형광 염료의 검출은 각 특정 염료 유형의 특이성에 민감한다. 특정 염료는 어두운 상태, 빠른 광탈색 및 낮은 양자 수율과 같은 광물리적 특성을 가지고 있어 후보 염료로 제외된다. 또한 염료의 화학적 특성, 그의 구조 및 전하를 수반하는지 여부도 염료가 얼마나 잘 통합될 수 있는지와 비-특이적으로 결합하는 정도에 영향을 미친다. 염료의 선택은 열악한 광물리적 및 화학적 문제의 회피 뿐만 아니라 선택한 기기 설정에서 이들이 얼마나 잘 여기되고 검출될 수 있는지, 그리고 다른 3가지 염료와 얼마나 잘 구별될 수 있는지에 의존한다. 발명의 일부 실시형태에서, FRET 또는 켄칭 효율과 같은 다른 특성도 또한 중요하다. 다행히도 여러 염료 제조업체와 선택할 수 있는 많은 염료 목록이 있다. 잘 작동할 수 있는 4가지 염료는 Atto 488, Cy3b, Atto 655 및 Cy7 또는 Alexa 594이다. 발명에 사용할 수 있는 또 다른 4가지 우수한 단일 분자 염료는 Sobhy et al[Rev. Sci. Instrum. 82, 113702(2011)에 나타나 있으며, 여기에서 각각 Atto 425, Atto 488, Cy3 및 Atto647N을 여기하기 위해 405nm, 488nm, 532nm 및 640nm 레이저가 사용될 수 있다. 각각의 표지는 상이한 염기 정체성을 나타낸다. 특정 염료는 트랩된 광물리학적 상태에서 방출하기 위해 그의 피크 여기 파장과 상이한 파장의 광의 펄스가 필요하다. 트롤록스, 베타-머캅탄올; 글루코스, 글루코스 옥시다제 및 카탈라제; 프로토카테츄산 및 프로토카테츄에이트-3,4-디옥시게나제; 메틸비올로겐 및 아스코르브산을 포함한 광물리학적 현상을 최소화하는 다수의 산화환원 시스템이 알려져 있다(Ha 및 Tinnefeld, Annu Rev Phys Chem. 2012; 63: 595-617 참조). 연속 조명의 대안으로, 일부 실시형태에서 샘플은 펄스 또는 스트로보스코프 조명을 받으며; 이것은 광탈색을 감소시킨다.
이미징
폴리뉴클레오티드의 이미지는 2-D 검출기(예를 들어, 전하-커플 장치(CCD) 카메라)의 어레이 상으로 투영되고, 이로부터 디지털화되어 메모리에 저장된다. 메모리에 저장된 이미지는 그 다음 이미지 분석 알고리즘을 따른다. 이들 알고리즘은 배경에서 신호를 구별하고, 신호 특성에서 변화를 모니터링하고, 기타 신호 처리 기능을 수행할 수 있다. 메모리 및 신호 처리는 컴퓨터에서 오프-라인으로 수행되거나 마이크로프로세서 또는 필드 프로그래머블 게이트 어레이(FPGA)에 의해 제어되는 특수 디지털 신호 처리(DSP) 회로에서 수행된다.
이미지 처리
형광 표지가 연장된 폴리뉴클레오티드에 일시적으로 결합된 경우, 그것은 2D 어레이 검출기로 이미지를 촬영함에 의해 검출될 수 있다. 다음 작업은 촬영한 이미지에서 시퀀싱 데이터를 추출하는 것이다. 2-D 어레이 검출기(예를 들어, CCD 또는 CMOS 센서)의 한 축을 따라 신장된 분자를 2D 어레이 검출기의 픽셀 행 또는 열을 따라 정렬하기 위한 노력이 이루어진다.
시간-지연 통합(TDI) 이미징 또는 라인 스캐너가 사용되는 경우에 연속 이미지 스트립이 획득된 경우(예를 들어, Hesse 외 Anal Chem. 2004 Oct 1;76(19):5960-4에 기술된 바와 같음.), 발명의 일 실시형태는 이미지 번역(또는 단계 번역)의 방향을 폴리뉴클레오티드의 선형 연장 방향과 일치시키는 것을 포함한다. 이는 그래서 길이가 100 미크론, 수 mm 또는 수십 mm인 매우 긴 폴리뉴클레오티드의 연속 이미지가 획득될 수 있고, 이미지 인터페이스에서 또한 오류를 초래할 수 있는 이미지를 스티칭하는 데 추가 계산 리소스가 할애되어야 필요가 없다는 것이다.
일부 실시형태에서, 발명의 시스템은 다음을 포함하는 중합체의 빠르고 정확한 긴-범위 이미지를 획득하는 방법을 포함한다:
i) 중합체를 일 방향으로 신장하는 것;
ii) 시간-지연 통합(TDI)이 장착된 2-D 검출기를 사용하는 것;
iii) DNA 신장의 방향에서 검출기와 관련하여 샘플을 번역하는 것; 및
iv) 단일 긴 이미지 스와스/스트립으로부터 긴 중합체 분자가 분석되는 번역의 방향에서 라인을 판독하는 것(별도의 프레임을 스티칭할 필요 없음).
일부 이러한 실시형태에서, 번역 속도는 판독 속도의 단편이다. 이것은 표면 상의 다음 위치가 센서에 의해 이미징되기 전에 센서 요소에 의해 각 위치에서 다중 신호 이벤트가 포획되도록 허용한다. 따라서, 특정 수의 연속 픽셀이 인접 장소에서 이벤트를 포획하기에 충분히 위치가 이전되기 전에 장소 주변의 잠정적 이벤트를 포획하는 다중 결합 이벤트가 검출될 수 있다.
다른 경우에 초장 폴리뉴클레오티드는 구불구불한 나노채널(Frietag et al 참조)에 가두어 구불구불한 패턴으로 접힌 다음 단일 CCD 또는 CMOS의 프레임 내에서 이미지화된다.
연장의 방향이 2-D 어레이 검출기의 축에 상응하지 않는 경우, 라인이 이미지의 축을 따라 정렬되도록 이미지를 변환하기 위해 제1 이미지 처리 단계가 수행된다. 발명의 일부 실시형태에서, 폴리뉴클레오티드가 단일 배향으로 직선으로 정렬되는 경우, 폴리뉴클레오티드의 장소는 선형 축을 따라 활성화된 픽셀을 관찰함에 의해 추적될 수 있다. 모든 픽셀이 활성화될 필요는 없으며, 표면에 대한 배경/비-특이적 결합을 통해 폴리뉴클레오티드를 추적할 수 있는 충분한 수만 있으면 된다. 축을 따라 떨어지지 않는 신호는 무시된다. 일부 실시형태에서, 폴리뉴클레오티드의 백본이 표지된다. 예를 들어 Sybr Gold와 같은 형광 염료의 결합을 사용하여 폴리뉴클레오티드를 추적할 수 있다. 전통적인 DNA 염색 대신 공액 양이온 중합체가 사용될 수 있다.
형광 수명 및 배경 산란 거부
상이한 결합 프로브(일시적으로 결합하는 프로브 포함)는 상이한 형광 수명을 갖는 발광 실체(예를 들어, 염료)로 코딩될 수 있다. 분자의 형광 수명은 형광 광자의 방출에 의해 기저 상태로 돌아가기 전에 분자가 여기 상태에서 보내는 평균 시간이다.
펄스 레이저 여기를 사용하여 그 다음 염료를 여기시킬 수 있고 시간 상관 단일 광자 검출기(또는 고분해능 시간 상관 검출이 가능한 다른 검출기)를 사용하여 각 염료의 형광 수명 프로필을 검출할 수 있다. 검출기는 강화 CCD(IMCCD)이다. 그것은 또한 광자의 도착 시간을 비닝할 수 있는 점 검출기의 어레이일 수도 있다. 부가하여 발광의 검출 시간을 게이팅하여 광 산란으로 인한 초기(피코초 범위) 형광을 게이팅하여 염료에 의해 발광된 형광이 배경 위에서 검출되도록 할 수 있다.
발명의 방법은 소멸 장이 있거나 없이 그리고 상대적으로 높은 농도의 올리고로 수행될 수 있지만, 산란으로 인한 배경 형광은 형광의 초기 시간 윈도우를 거부함에 의해 제거된다. 그래서 펄스 여기 및 시간 게이팅 또는 시간 상관 검출을 사용하면 하나의 돌로 두 마리의 새를 죽일 수 있다: 하나는 다른 형광 수명에 의해 구별되는 표지로 시퀀싱 조사 시약(뉴클레오티드, 올리고)을 코딩할 수 있고, 하나는 산란으로 인한 배경 형광을 거부할 수 있다.
용액에서 염료로 인한 배경 형광(산란 아님)은 여전히 남아 있지만, 이것은 여기를 위한 소멸 파, 제로 모드 도파관 및/또는 RET 기전을 사용하여 감소될 수 있다. 또는 시약은 켄칭될 수 있다(예를 들어, 분자 비콘 등).
예시적인 설정은 405nm 펄스 레이저 다이오드를 사용한 샘플의 조명을 갖는 광-시야 형광 수명 이미징 현미경(FLIM) 시스템을 포함하고 ICCD 카메라로 이전된 형광 신호를 수집한다. 200ps의 최단 게이팅 시간을 갖는 4 Picos 강화 CCD 카메라(Stanford computer optics)가 사용될 수 있다. 빔-스플리터는 현미경 내에서 레이저 펄스를 형광 신호로부터 분리하는 데 사용된다. 이 빔-스플리터는 405nm의 여기 파장을 반사하고 더 긴 파장으로 이전된 샘플의 형광 신호를 전송한다. 광 시야 FLIM 설정에는 펄스 레이저 다이오드와 강화 CCD 카메라의 트리거 동기화가 추가로 필요하다. 시간-분해 측정의 여기 소스는 펄스 또는 변조되어 형광 방출 및 역학을 측정할 수 있다. 시간 영역 형광 측정 방법은 일반적으로 형광 감쇠 곡선의 실제 표현을 생성하기 때문에 더 쉽게 이해될 수 있다. 전형적으로 시간 도메인 시스템은 빠른 응답 검출기와 커플링된 여기를 제공하는 펄스 광원으로 구성된다. 수명 결과는 다중-지수 감쇠 피팅을 고려하기 위해 시간 게이팅의 수를 증가시키고 피팅 알고리즘의 개발에 의해 개선될 수 있다. 시간-상관 검출은 단일 분자 국지화와 조합된다.
유체
발명은 유체 장치(유동 셀 또는 웰)에서 수행될 수 있다. 시약을 전달하고 교환하는 수단은 다양한 형태를 취할 수 있다. 주사기 펌프 또는 압력-구동 시스템, 음향 구동 시스템은 그것이 저장되는 시약을 시퀀싱이 완료된 다음 폐기물로 제거되는 장소로 이동하는 데 사용될 수 있다. 다중 프로브가 전달되어야 하는 경우(예를 들어, 1024개 올리고 각각), 다수의 올리고를 저장하고 발명의 방법을 실행하는 데 사용될 수 있는 시퀀싱 시스템으로 전달하기 위한 한 가지 수단이 Pihalk 외 Anal. Chem. 2005, 77, 64-71에 의해 기술되어 있다. 사용될 수 있는 또 다른 접근방식은 Linder 외 Anal. Chem. 2005, 77, 64-71에 의해 기술되어 있다). 다수의 다른 프로브 또는 프로브 세트를 전달하는 한 가지 간단한 방식은 각각 에어 갭으로 분리된 모세관 안으로 이들을 장입하는 것이다. 세정 용액도 산재될 수 있다. 그런 다음 루프는 적절한 속도로(예를 들어, 주사기 펌프에서 당김에 의함) 실행되어 각 프로브와 세정액이 발명에 필요한 이미징을 수행하기에 충분한 기간 동안 표면과 접촉한다.
서열 품질: 시퀀싱 오류 및 커버리지 바이어스 최소화
모든 시퀀싱 기술에는 일정 수준의 오류가 있으며, 상이한 시퀀싱 플랫폼은 상이한 종류의 오류에 취약하다. Schirmer 외 (Nucl. Acids Res. 2015;nar.gku1341)l에 따르면, Illumina MiSeq 원시 오류율은 2%이다. 이것은 라이브러리 준비, 클러스터 증폭, 사전-단계화(초기 통합의 오류) 및 단계화(후기 통합의 오류)에 의해 도입된 오류를 포함한다. 이것은 컨센서스를 구축하기 위해 판독을 트리밍하고 중첩함에 의해 감소될 수 있다.
본 발명의 실시형태에서 PCR이 수행되지 않으므로 PCR로 인한 커버리지 바이어스는 없고 PCR 동안 중합효소 오혼입으로 인한 오류가 없다. Illumina, ABI SOLID, Ion Torrent, Intelligent Biosystems 및 Complete Genomics 시퀀싱에서 라이브러리 준비 및 클론 증폭(예를 들어, DNA 나노볼, 폴로니 또는 클러스터 생성) 동안 증폭 오류가 발생될 수 있다.
차세대 시퀀싱에서 오류를 극복하기 위한 일반적인 수단은 게놈의 다중 개별(논-앰플리콘) 카피로부터 게놈의 동일한 세그먼트의 판독을 얻기 위해 증폭되지 않은 게놈의 다중 카피에 대해 시퀀싱을 수행하는 것이다. 그런 다음 서열은 많은 분자의 컨센서스로부터 할당된다. 2개의 서열이 우세하면 그것은 이형접합을 나타낼 수 있다. 이것은 시퀀싱이 단일 세포에서 수행되는 경우에는 옵션이 아니다. 또한 다중 카피가 얻어지는 조직이나 세포가 균질하지 않은 경우에도 문제가 된다. 예를 들어, 종양 내에는 다중 클론 모집단이 상호혼합되어 있을 수 있고 체세포 돌연변이가 존재한다. 게놈은 또한 면역 세포에서 변경되고 직접적인 단일 세포 시퀀싱이 필요하다. 발명의 방법은 단일 폴리뉴클레오티드 기준으로 이러한 경우에 적용된다.
일부 적용에서 세포의 모집단에서 발생한 체세포 돌연변이를 검출하는 것이 중요하다. 이 경우 오류를 진정한 희귀 돌연변이와 구별하기 어려울 수 있으므로 많은 분자에서 컨센서스 판독을 얻어 오류를 제거할 수 있는 능력에 의존하지 않는 것이 좋다. 이것의 또 다른 문제는 서로 다른 카피가 유사하다는 것으로, 그것은 작은 차이를 함유할 수 있으나, 게놈의 세그먼트의 서로 다른 듀플리콘(분절의 복제)에서 유래한다.
본 발명의 방법에 따라 시퀀싱이 수행될 때 다중 프로브 결합 이벤트에 의해 서열 호출을 강화함에 의해 원시 오류가 줄어들 수 있다.
Helicos 및 PacBio 시퀀싱에서 수행되는 바와 같이 단일 염료 분자로 표지된 뉴클레오티드의 혼입을 검출하는 것을 통해 단일 분자에 대한 시퀀싱을 할 때, 염료가 검출되지 않음으로 인해 오류가 도입될 수 있다. 이것은 염료가 광탈색되었거나, 검출된 누적 신호가 염료 깜박임으로 인해 약하거나, 염료가 너무 약하게 방출되거나, 염료가 길고 어두운 광물리적 상태에 들어가기 때문일 수 있다. 이것은 본 발명에서 다수의 방식으로 극복될 수 있다. 첫째는 유리한 광물리적 특성을 가진 강력한 개별 염료(예를 들어, Cy3B)로 염료를 표지하는 것이다. 다른 것은 광탈색 및 어두운 광물리적 상태를 감소시키는 완충 조건 및 첨가제(예를 들어, 베타 메르캅토에탄올, 트롤록스, 비타민 C 및 그 유사체, 산화환원 시스템)를 제공하는 것이다. 또 다른 것은 빛에 대한 노출을 최소화하는 것이다(예를 들어, 더 짧은 노출을 필요로 하는 더 민감한 검출기를 사용하거나 스트로보스코프 조명을 제공하는 것). 두번째는 단일 염료 대신 양자점(예를 들어, Qdot 655), 형광체, 플라즈몬 공명 입자, 광산란 입자 등과 같은 나노 입자로 표지하는 것이다. 다른 것은 단일 염료가 아닌 뉴클레오티드당 많은 염료를 갖는 것이다. 이 경우에 다중 염료는 그 자체-켄칭(예를 들어, 단단한 나노구조, 충분히 멀리 떨어져 있는 DNA 오리가미 사용) 또는 단단한 링커를 통한 선형 간격을 최소화하는 방식으로 조성된다. Genovoxx는 많은 형광단을 함유하는 뉴클레오티드를 통합할 수 있었고, Mir(WO2005040425)는 나노입자가 부착된 뉴클레오티드를 통합할 수 있었다.
그러나 본 발명과 가장 관련이 있는 염료 광물리학으로 인한 오류를 줄이는 가장 좋은 수단은 본 발명에서 기술된 바와 같이 일시적인 결합을 이용하는 것이다. 여기에서 이미징 단계 동안 판독값은 서로 다른 표지-담지 프로브의 많은 온/오프 상호작용의 집합체로 얻어지므로 한 표지가 광탈색되거나 어두운 상태에 있더라도 분자 상에 있는 다른 결합 프로브 상의 표지는 광탈색되거나 어두운 상태에 있지 않을 수 있다.
검출 오류율은 용액에 요소, 아스코르브산 또는 이의 염, 및 이소아스코르브산 또는 이의 염, 베타-메르캅토에탄올(BME), DTT, 산화 환원 시스템, 트롤록스로부터 선택되는 하나 이상의 화합물(들)의 존재에서 추가로 감소(및 신호 수명 증가)된다.
어레이 포획에 의한 판독 집계
다른 실시형태에서, 표면 또는 매트릭스에 배치된 특정 폴리뉴클레오티드 또는 폴리뉴클레오티드의 특정 세그먼트를 표적화하는 포획 시약은 표적 폴리뉴클레오티드를 포획하는데 사용된다. 일부 실시형태에서, 포획 프로브는 샘플의 모든 폴리뉴클레오티드 상에 존재하는 특정 일반 서열을 표적화하도록 설계된다. 예를 들어, 올리고(dT) 포획 시약은 모든 RNA를 표적화한다. 일부 실시형태에서, 공통 올리고 서열은 표적 폴리뉴클레오티드 상에 이식되어 이들이 포획될 수 있다. 상이한 포획 시약을 사용하여 상이한 폴리뉴클레오티드를 포획할 수 있고, 상이한 포획 시약을 마이크로어레이와 같은 공간적으로 어드레스할 수 있는 정렬된 어레이에 배치할 수 있다. 일단 폴리뉴클레오티드가 포획되면 유체 흐름 또는 전기영동 흐름에 의해 연장될 수 있다.
시퀀싱을 위한 센스-안티센스 단일-가닥 제작
일부 실시형태에서, 헤어핀은 이중 가닥 표적의 말단에 결찰되고 다른 말단 중 하나는 가닥 중 하나만을 통해 표면에 이동억제된다. 그런 다음 폴리뉴클레오티드는 변성되고 부착 지점으로부터 연장/신장된다. 그런 다음 폴리뉴클레오티드는 연장된 상태로 고정된다.
이는 표적이 단일 가닥임을 보장하는 방식을 제공한다. 더욱이 말단-상-말단 센스 및 안티센스 가닥에서 얻은 판독은 획득된 시퀀싱의 진성에 대한 내부 검증인 상보적 판독을 제공한다. 이러한 센스-안티센스 가닥은 또한 자연적으로 헤어핀을 만들어 제2 가닥을 합성하는 AMV 역전사효소를 사용하여 RNA 상에서 cDNA 합성을 수행함에 의해 제작될 수 있다. 일부 실시형태에서, 역전사용 프라이머는 표면에 부착을 허용하는 모이어티로 변형된다.
단일 가닥 어셈블리
본 발명의 일부 실시형태에서 샘플은 매우 근접한 천연 상보성 가닥이 없는 단일-가닥 폴리뉴클레오티드를 포함한다. 여기서, 폴리뉴클레오티드를 따라 레퍼토리의 각각의 올리고에 대한 결합 장소가 축적되는 경우 모든 서열 비트를 그의 장소에 따라 수집하고 함께 스티칭함에 의해 서열이 재구성될 수 있다. 사실 완전한 레퍼토리는 서열 비트의 타일링 시리즈를 제공한다. 현실 세계에서 패턴은 폴리뉴클레오티드 상의 불일치 및 비-특이적 결합에 의해 복잡해질 수 있다; 그러나 불일치는 그의 잠정적 결합 패턴으로 구별될 수 있으므로 서열 정보의 2차 레이어로 간주될 수 있다. 이 경우, 결합 신호가 그의 잠정적 결합 특성으로 인해 불일치인 것으로 판단되면 서열 비트를 생물정보학적으로 트리밍하여 추정 불일치 염기를 제거하고 나머지 서열 비트를 서열 재구성에 추가할 수 있다. 불일치는 올리고를 혼성화하는 말단에서 발생하기 쉬우므로, 잠정적 결합 특성에 따라 말단에서 하나 이상의 염기가 트리밍될 수 있다. 어떤 염기가 트리밍되는지는 동일한 서열 공간에 걸쳐 타일링되는 다른 올리고로부터의 정보에 의해 통지될 수 있다.
동시적 듀플렉스 컨센서스 어셈블리
본 발명의 일부 실시형태에서 이중 나선의 두 가닥 모두는 매우 근접하여 존재하고, 검출되는 일시적인 신호로부터 올리고가 결합된 가닥을 구별하는 것이 가능하지 않다. 그러나 폴리뉴클레오티드를 따라 레퍼토리의 각각의 올리고에 대한 결합 장소가 축적되는 경우 2개의 올리고 서열이 동일한 장소에 결합하는 것처럼 보일 수 있다. 이들 올리고는 서열에서 상보적이어야 한다. 단일 결합 이벤트가 한 가닥 또는 다른 가닥에 대한 것인지 여부를 결정하기 위해, 데이터는 전체적으로 고려되어 지며; 올리고의 2개의 타일링 시리즈는 해당하는 지역을 커버하고, 각 타일은 한 방향 또는 다른 방향에서 폴리뉴클레오티드의 길이를 따라 국지화에서 점진적 이전이되며; 신호가 속하는 2개의 타일링 시리즈 중 어느 것이 신호를 생성하는 올리고 서열이 중첩하는 시리즈에 기반하여 할당될 것이며; 이것은 도 28에 예시되어 있다. 일부 실시형태에서, 서열은 그 다음 2개의 타일링 시리즈 각각을 구성하기 위해 먼저 결합 및 서열 중첩의 장소를 사용함에 의해 재구성된다. 그런 다음 2개의 타일링 시리즈가 역보체로 정렬되고 두 가닥이 그들 장소의 각각에서 완벽한 역보체인 경우에만 각 장소에서 염기 할당이 허용된다(이는 듀플렉스 컨센서스 서열을 제공함). 임의의 불일치는 두 가지 가능성 중 하나가 독립적인 불일치 결합 이벤트로부터의 것과 같은 추가 정보의 레이어에 의해 확증되어야 하는 모호한 염기 호출인 것으로 플래깅된다. 일부 실시형태에서, 듀플렉스 컨센서스가 획득되면 기존(다중-분자) 컨센서스는, 개별 단상형을 혼합하지 않도록 주의하여, 게놈의 동일한 영역을 커버하는 다른 폴리뉴클레오티드로부터의 데이터를 비교함에 의해 결정된다(다중 세포로부터 DNA가 이용가능한 경우). 대안적으로, 일부 실시형태에서, 개별 가닥 컨센서스의 듀플렉스 컨센서스가 획득되기 전에 개별 가닥 컨센서스가 획득된다. 발명의 이러한 실시형태에서, 듀플렉스의 각각의 가닥의 서열은 현재 차세대 시퀀싱(NGS)에 이용가능한 바와 같이, 듀플렉스의 두 가닥을 분자 바코드로 차등적으로 태깅하는 것과 같은 추가의 샘플 준비 단계 없이 동시적으로 수득된다[J. Salk, 외 "Detection of ultra-rare mutations by next-generation sequencing". Proc. Natl. Acad. Sci., vol. 109 no. 36. 2012]. 또한, 이 동시 두 가닥(센스 및 안티센스) 서열 획득은 제2 가닥의 서열이 획득되기 전에 듀플렉스의 한 가닥에 대해 서열을 획득해야 하는 나노포어에 이용할 수 있는 2D 또는 1D2 컨센서스 시퀀싱과 유리하게 비교된다. 듀플렉스 컨센서스 시퀀싱은 106 범위에서의 정확도, 즉 100만 염기 중 하나의 오류를 제공할 수 있으며(다른 NGS 접근방식의 102-103 원시 정확도와 비교됨) 그리고 본 발명의 경우에 듀플렉스 컨센서스는 추가 샘플 준비 단계 없이 서열 획득의 본질적인 부분이다. 이는 조기 암 검출을 위해 순환하는 DNA를 검출하거나 종양 세포 모집단에서 낮은 빈도 서브-클론에서 DNA를 검출하려고 시도하는 경우 발생하는 희귀 변이체를 해결해야 할 필요성에 이 방법을 고도로 적합하게 만든다.
다중 폴리뉴클레오티드로부터 판독 통합
바람직하게는 연속적인 서열은 드 노보 어셈블리를 통해 획득된다. 그러나 참조 서열을 또한 사용하여 어셈블리를 용이하게 할 수 있다. 이것은 드 노보 어셈블리가 구성되도록 허용하지만, 단상형에 대한 정보를 제공하는 분자를 따라 조우되는 것이 필요한 충분한 장소인 매우 긴 거리의 개별 단상형을 분해하는 것이 더 어렵다. 완전한 게놈 시퀀싱이 게놈의 동일한 세그먼트에 걸쳐 있는 다중 분자(이상적으로는 동일한 모 염색체에서 유래된 분자)로부터 정보의 합성을 필요로 하는 경우 알고리즘은 다중 분자로부터 획득된 정보를 처리해야할 필요가 있다. 한 알고리즘은 다중 분자 사이에 공통된 서열을 기반으로 분자를 정렬하고 영역이 커버되는 공동-정렬된 분자에서 대치함에 의하여 각 분자에서의 간격을 채우는 종류의 알고리즘이다. 따라서 한 분자의 간격은 다른 분자(공동-정렬된 분자)에서의 판독에 의해 커버된다. 더욱이 Eugene Myers가 개발한 것과 같은 샷건 어셈블리 방법이 어셈블리를 실행하는데 적용될 수 있으며, 다수의 판독이 사전-어셈블리된다는 추가 이점이 있다(예를 들어, 서로에 대한 판독의 장소가 이미 알려져 있음, 판독 사이의 간격 길이가 공지되어 있음). Mishra 외(Bioinformatics, Oxford Journals, (2011) 27(2): 153-160)에 의해 기술된 SUTTA와 같은 다른 알고리즘 접근방식도 데이터의 어셈블리에 적용될 수 있다. 다양한 실시형태에서, 참조 게놈은 긴-범위 게놈 구조 또는 짧은-범위 폴리뉴클레오티드 서열 또는 둘 모두의 어셈블리를 용이하게 하기 위해 사용될 수 있다. 판독은 부분적으로 드-노보 어셈블리된 다음 참조에 정렬된 다음 참조-지원 어셈블리는 추가로 드-노보 어셈블리될 수 있다. 다양한 참조 어셈블리(예를 들어, 다른 인종 그룹으로부터의 것)를 사용하여 게놈 어셈블리에 대한 일부 지침을 제공할 수 있지만 실제 분자에서 얻은 정보(특히 2개 이상의 분자에 의해 확증되는 경우)는 참조로부터의 임의의 정보보다 가중치가 더 크다. 선행 기술은 복수의 개별적으로 시험된 단일 폴리뉴클레오티드 분자로부터 얻은 장소 서열을 정렬함에 의해 인접 서열이 재구성될 수 있다는 것을 보여주지 않는다.
참조 없는 시퀀싱
다양한 실시형태에서, 서열은 표적 폴리뉴클레오티드 분자의 또 다른 카피 또는 표적 폴리뉴클레오티드 분자에 대한 참조 서열을 사용하지 않고 결정된다. 이 경우에 대부분의 판독(예를 들어, 90%)이 병합될 것이고 병합되지 않은 이들 판독의 판독 간의 간격이 알려질 것이다. 간격 거리는 폴리뉴클레오티드의 선형 길이를 추적할 수 있고 간격 거리는 판독 사이의 픽셀 수를 계수하고 각 픽셀에 걸쳐 있는 DNA의 길이의 지식을 사용하여 결정할 수 있기 때문에 알려질 것이다.
단상형 분해된 시퀀싱
게놈 서열은 단상형 정보(단일 모 염색체로부터 유래된 단일 DNA 분자를 따른 대립유전자의 연관)가 긴 범위에 걸쳐 획득될 수 있다면 훨씬 더 큰 유용성을 가질 것이다.
다양한 양태 및 실시형태에서, 방법은 단상형을 시퀀싱하기 위해 사용될 수 있다. 단상형을 시퀀싱하는 것은 발명에 따른 방법을 사용하여 이배체 게놈의 단상형에 걸쳐 있는 제1 표적 폴리뉴클레오티드를 시퀀싱하는 단계; 발명에 따른 방법을 사용하여 이배체 게놈의 단상형 분지에 걸쳐 있는 제2 표적 폴리뉴클레오티드를 시퀀싱하는 단계로서, 여기서 제1 및 제2 표적 폴리뉴클레오티드는 상동 염색체의 상이한 카피로부터 유래하는 것인, 단계; 및 제1 및 제2 표적 폴리뉴클레오티드의 서열을 비교하고, 이에 의해 제1 및 제2 표적 폴리뉴클레오티드 상의 단상형을 결정하는 단계를 포함한다.
세포 모집단에서 단상형 다양성 및 빈도 결정
세포의 모집단에서 게놈의 이질성을 관찰하는 것이 목적인 많은 기존 방법에서, 기술적으로 까다로운 단일 세포 분석이 사용된다. 그러나, 본 발명의 현저한 특징은 분자가 충분히 긴 경우 세포의 모집단에 존재하는 상이한 염색체, 긴 염색체 세그먼트 또는 단상형을 결정할 수 있기 때문에 단일 세포의 내용물을 함께 유지할 필요 없이 모집단 내 게놈의 이질성이 분석될 수 있다는 것이다. 이것은 어떤 두 가지 단상형이 세포에 함께 존재하는지 나타내지는 않지만, 게놈 구조 유형(또는 단상형)의 다양성과 그 빈도 및 존재하는 비정상적인 구조적 변이체에 대해 보고한다. 이 실시형태는 다음 단계를 포함한다:
1. 2개 이상의 세포로부터 게놈 DNA를 추출하는 단계;
2. DNA를 연장하고 본 발명의 시퀀싱 방법을 수행하는 단계;
3. DNA 가닥이 상동체인지 결정하기 위한 데이터를 분석하는 단계;
4. 상동체 중에서 상이한 단상형을 결정하는 단계; 및
5. 상이한 단상형의 빈도를 결정하는 단계.
다른 시퀀싱 기술과의 시너지 효과
일부 실시형태에서, 본 발명의 방법은 완전한 게놈 시퀀싱에 미치지 못하고 Illumina로부터의 것과 같은 짧은 판독 시퀀싱을 위한 스캐폴드를 제공하는 데 사용된다. 이 경우에 게놈의 보다 균일한 적용범위를 얻기 위해 PCR 증폭 단계를 제외함에 의해 Illumina 라이브러리 준비를 수행하는 것이 유리하다. 필요한 시퀀싱의 적용범위를 줄이는 이들 실시형태 중 일부의 한 가지 이점은 예를 들어 약 40x에서 20x로 절반으로 줄어들 수 있다. 일부 실시형태에서, 이는 발명의 방법에 의해 수행된 시퀀싱 및 방법이 제공하는 장소 정보의 추가로 인한 것이다.
시퀀싱 패널
일부 실시형태에서, 특정 유전자 또는 유전자좌에 상응하는 게놈의 서브세트를 시퀀싱하는 것이 바람직하다. 이 경우에 게놈 DNA는 단일 가닥으로 만들어지고 서열-특이적 올리고는 관심있는 영역에 걸쳐 일시적으로 어닐링된다. 이 방식으로 시퀀싱을 표적화하는 한 가지 이점은 전체 게놈이 표면 상으로 늘어나더라도 표적화된 영역만 빛난다는 것이다. 따라서 광 검출가능한 표적 영역으로 직접적으로 이동하여 이미징 시간을 단축할 수 있다. 더욱이, 분자의 작은 하위-단편만 감지하면 되기 때문에 게놈은 정상보다 훨씬 더 높은 밀도로 표면 상에 어레이될 수 있다. 예로서, 인간 게놈의 BRCA1 영역은 BRCA1 서열에 상보적인 복수의 올리고뉴클레오티드를 어닐링함에 의해 시퀀싱될 수 있다. 게놈의 다른 부분은 감지되지 않은 채로 남아 있다.
무-세포 핵산
진단을 위한 가장 접근가능한 DNA 또는 RNA 중 일부는 체액 또는 대변에서 세포 외부에서 발견된다. 혈액에서 순환하는 DNA는 21번 염색체 삼체성 및 기타 염색체 및 게놈 장애에 대한 산전 검사에 사용된다. 또한 그것은 종양 유래 DNA 및 특정 병리학적 상태에 대한 마커인 기타 DNA 또는 RNA를 검출하는 수단이기도 하다. 그러나 분자는 전형적으로 혈액에서 ~200bp 길이 범위에 있고 소변에서 더 짧다. 게놈 영역의 카피 수는 게놈의 다른 부분과 비교하여 참조에 정렬하는 판독의 수와 비교하여 결정된다.
일부 경우에 핵산이 메틸화되었는지 여부를 서열-특이적 방식으로 결정하는 것이 유용하다. 예를 들어 태아를 모체 DNA와 구별하는 한 가지 방식은 전자가 관심있는 유전자좌에서 메틸화된다는 것이며; 이것은 비-침습적 산전 검사(NIPT)에 유용할 수 있다.
본 발명은 2가지 접근방식에 의해 무세포 핵산 서열의 열거 또는 분석에 적용될 수 있다. 첫째는 변성 전 또는 후에 짧은 핵산을 이동억제화하는 것을 포함한다. 일시적인 결합 시약을 사용하여 핵산의 정체성, 그 카피 수, 돌연변이 또는 특정 SNP 대립유전자의 존재 여부, 검출된 서열이 메틸화되었는지 또는 다른 변형(바이오마커)를 담지하는지 여부를 결정하기 위해 핵산을 조사할 수 있다.
이것은 다음을 포함한다:
1) 체액, 예를 들어 혈액으로부터 무세포 핵산을 단리하는 것;
2) 기판 상에 단리된 무세포 핵산을 이동억제화하는 것; 및
3) 이동억제된 무세포 핵산에 대한 프로브 결합에 의한 시퀀싱을 수행하는 것.
둘째는 먼저 작은 분획을 연결하여 연쇄체가 신장될 수 있도록 하는 것을 포함한다. 이것은 다음을 포함한다:
4) 혈액에서 무세포 DNA를 단리하는 것;
5) DNA를 연결하는 것; 및
6) 연결된 DNA 상의 프로브 결합에 의한 시퀀싱 수행하는 것.
일부 실시형태에서, 연결은 DNA의 말단을 연마하고 평활 말단-결찰을 수행함에 의해 실행된다. 대안적으로, 혈액 또는 무세포 DNA는 2개의 약수로 분할될 수 있으며, 하나의 약수는 폴리 A(터미널 트랜스퍼라제 사용)로 꼬리가 붙고 다른 약수는 폴리 T로 꼬리가 붙는다.
생성된 연쇄체는 그 다음 시퀀싱된다. 그런 다음 생성된 "수퍼" 서열 판독을 참조와 비교하여 개별 판독을 추출한다. 개별 판독은 계산적으로 추출된 다음 다른 짧은 판독과 동일한 방식으로 처리된다.
핵산은 또한 핵산을 분해할 수 있는 많은 수의 엑소뉴클레아제를 함유하는 배지인 대변에서 발견되며; 엑소뉴클레아제가 기능하는 데 필요한 다량의 2가 양이온의 킬레이터(예를 들어, EDTA)를 채용하여 DNA를 충분히 온전하게 유지하고 발명의 방법에 따라 서열화할 수 있다. DNA가 세포에서 배출되는 또 다른 방법은 엑소좀에 캡슐화하는 것을 통한 것이다. 엑소좀은 초원심분리에 의해 또는 스핀 컬럼(Qiagen)을 사용함에 의하여 단리될 수 있고, 그 안에 함유된 DNA 또는 RNA는 발명의 방법에 따라 수집 및 서열화될 수 있다.
일부 실시형태에서, 핵산에 대한 하나, 그러나 일반적으로 적어도 2개, 바람직하게는 몇 개의 올리고뉴클레오티드의 결합은 그 정체성 또는 핵산이 유래하거나 기원하는 게놈의 부분을 결정하기에 충분하다. 따라서, 전체 레퍼토리가 테스트되기 전에 불완전한 시퀀싱이 필요한 정보를 제공할 수 있다. 일부 실시형태에서, 상이한 염색체 또는 게놈 영역의 비율은 그의 게놈 기원에 따라 식별된 핵산 분자의 수를 계수함에 의해 결정된다. 일부 실시형태에서, 이는 샘플의 태아 분획에 대한 정보가 결정되도록 허용한다. 일부 실시형태에서, 핵산 분자의 정체성 또는 기원의 결정과 함께 단일 뉴클레오티드 변이체 또는 삽입결실의 발생은 하나 이상의 올리고의 결합을 분석함에 의해 결정된다.
올리고뉴클레오티드가 더 길게 결합될수록 핵산 분자의 정체성 또는 기원을 결정하는 데 필요한 올리고뉴클레오티드가 더 적다. 이와 관련하여, 특정 유전자 또는 유전자좌는 올리고뉴클레오티드 프로브 서열의 패널을 제공함에 의해 검출될 수 있으며, 이러한 프로브는 10개 뉴클레오티드 초과 올리고 길이 또는 길이가 <10nt인 다중 특이적 짧은 올리고뉴클레오티드이다. 따라서, 암 관련 프로브의 패널을 혈액에서 추출한 핵산 분자에 적용하여 암 관련 유전자를 식별한 다음 추가 올리고뉴클레오티드 결합을 사용하여 단일 뉴클레오티드 변이체 또는 삽입결실을 식별할 수 있다. 이에 대한 본 발명에 기술된 접근방식의 이점은 다중 결합 이벤트 및 일부 실시형태에서 변이체를 호출하는데 있어 더 큰 확신을 주기 위한 두 가닥의 프로빙을 포함한다.
RNA 시퀀싱
RNA의 길이는 전형적으로 게놈 DNA보다 짧지만 현재 기술을 사용하여 RNA를 일 말단에서 다른 말단으로 서열화하는 것이 어렵다. 그럼에도 불구하고, 대체 스플라이싱 때문에 mRNA의 전체 서열 구성을 결정하는 것이 매우 중요하다. 발명의 일부 실시형태에서 mRNA는 이동억제된 올리고 d(T)에 의한 그 폴리A 꼬리의 결합에 의해 포획될 수 있고, 그 2차 구조는 신장력 및 변성 조건에 의해 제거되어 표면 상에 연장될 수 있다. 그러면 이것은 결합 시약(엑손-특이적임)이 일시적으로 결합되도록 허용한다. RNA의 짧은 길이 때문에 엑손을 분해하고 분화시키기 위해 본 발명에 기술된 단일 분자 국지화 방법을 사용하는 것이 유리하다. 일부 실시형태에서, RNA를 가로질러 분산된 단지 몇 가지 결합 이벤트는 특정 mRNA 이소폼에 대한 mRNA에서 엑손의 순서 및 정체성을 결정하기에 충분하다.
분석 이전에 생체거대분자의 완전성 보존
생체분자를 천연 상태로 관찰하는 것은 생물학에서 반복되는 도전과제이다. 너무 자주, 그 천연 상태에서 생체분자의 정보를 검색하는 과정은 천연 상태의 일부 측면의 분쇄를 초래한다.
게놈의 경우에, 그 천연 염색체 상태에서 게놈의 정보 내용을 분석하는 것은 어려운 일이다. 인간 염색체에서 DNA 길이는 5천만 염기에서 2억 5천만까지 다양할 수 있지만 오늘날의 샷건 시퀀싱 기술은 수백 염기의 길이만 판독할 수 있다. 이것은 그럼에도 불구하고 DNA 서열의 장소와 카피 수가 표현형에 중요한 의미를 갖는다는 것이 점점 더 인식되고 있다.
분쇄의 대부분은 세포 및 조직으로부터 생체분자를 추출하는 과정과 분석될 수 있기 전에 생체분자의 후속적인 처리에서 발생한다. DNA의 경우에 그 무결성의 손실로 이어지는 그 취급 양태는 피펫팅, 와동, 동결-해동 및 과도한 가열을 포함한다. 기계적 응력이 최소화될 수 있다(예를 들어, ChemBioChem, 11:340-343(2010)에 기술된 바와 같음). 부가하여 고농도의 2가 양이온, EDTA, EGTA 또는 갈산 (및 그 유사체 및 유도체)는 뉴클레아제에 의한 분해를 억제한다. 실시형태에서, 샘플 대 2가 양이온 중량의 2:1 비율은 극도의 뉴클레아제 수준이 있는 대변과 같은 샘플에서도 뉴클레아제를 억제하기에 충분하다.
발명의 대안적인 양태가 해결하고자 하는 문제는 분석 이전에 생체거대분자의 천연 무결성을 보존하는 방법, 특히 게놈 DNA를 그 천연으로 또는 그 천연의 긴 길이에 다소 더 가깝게 보존하는 방법이다. 이것은 본 발명의 방법을 사용하는 시퀀싱 또는 다른 방법을 사용하는 것 둘 모두와 관련이 있다. 그것은 특히 나노포어 시퀀싱과 관련이 있다.
일부 실시형태에서, 발명은 다음을 포함하는 분석을 위한 생체거대분자를 전달하는 방법에 관한 것이다:
1) 생체거대분자를 포함하는 보호 실체를 제공하는 것으로, 상기 보호 실체는 생체거대분자를 그 천연 상태에 가깝게 보존하는 것;
2) 생체거대분자를 포함하는 보호 실체를 분석 영역의 부근에 배치하는 것; 및
3) 생체거대분자를 보호 실체로부터 분석 영역으로 방출하는 것.
일부 실시형태에서, 본 발명은 다음을 포함하는 분석을 위한 생체거대분자를 제조하는 방법에 관한 것이다:
1) 생체거대분자를 포함하는 보호 실체를 제공하는 것으로, 상기 보호 실체는 생체거대분자를 그 천연 상태에 가깝게 보존하는 것;
2) 생체거대분자를 포함하는 보호 실체를 분석 영역의 부근에 배치하는 것;
3) 생체거대분자를 보호 실체로부터 분석 영역으로 방출하는 것; 및
4) 생체거대분자를 분석 영역으로 전달하는 것.
일부 실시형태에서, 본 발명은 다음을 포함하는 분석을 위한 생체거대분자를 제조하는 방법에 관한 것이다:
1) 생체거대분자를 포함하는 보호 실체를 제공하는 것으로, 상기 보호 실체는 생체거대분자를 그 천연 상태에 가깝게 보존하는 것;
2) 생체거대분자를 포함하는 보호 실체를 분석 영역의 부근에 배치하는 것; 및
3) 생체거대분자를 보호 실체로부터 분석 영역으로 방출하는 것.
추가 실시형태에서, 본 발명은 다음을 포함하는 생체거대분자를 분석하는 방법에 관한 것이다:
1) 생체거대분자를 포함하는 보호 실체를 제공하는 것으로, 상기 보호 실체는 생체거대분자를 그 천연 상태에 가깝게 보존하는 것;
2) 생체거대분자를 포함하는 보호 실체를 분석 영역의 부근에 배치하는 것;
3) 생체거대분자를 보호 실체로부터 분석 영역으로 방출하는 것;
4) 생체거대분자를 분석 영역으로 전달하는 것; 및
5) 분석 영역에서 생체거대분자의 적어도 하나의 특징을 검출하는 것.
일부 실시형태에서, 본 발명은 다음을 포함하는 분석을 위한 게놈 DNA를 전달하는 방법에 관한 것이다:
1) 게놈 DNA를 포함하는 보호 실체를 제공하는 것으로, 상기 보호 실체는 게놈 DNA를 그 천연 상태에 가깝게 보존하는 것
2) 게놈 DNA를 포함하는 보호 실체를 분석 영역의 부근에 배치하는 것
3) 게놈 DNA를 보호 실체로부터 방출하는 것
4) 게놈 DNA를 분석 영역으로 전달하는 것
추가 실시형태에서 본 발명은 다음을 포함한다:
1) 게놈 DNA를 포함하는 아가로스 겔을 제공하는 것로서, 상기 아가로스 겔은 200Kb 초과의 길이로 게놈 DNA의 상당한 분획을 보존하는 것;
2) 게놈 DNA를 포함하는 아가로스를 DNA가 분석될 표면의 근처에 배치하는 것;
3) 게놈 DNA를 아가로스로부터 표면 상으로 방출하는 것; 및
4) DNA를 한 방향으로 연장하는 것.
일부 실시형태에서, 본 발명은 다음을 포함하는, 희귀 표적 분자가 검출되는 분석을 위한 생체거대분자를 제조하는 방법에 관한 것이다:
1) 기계적 스트레스를 최소화하는 환경을 함유하고/하거나 고농도의 2가 양이온/갈산을 함유하는 용기 및 (예를 들어, 립드 층을 통해) 부동태화되는 용기의 영역에서 생체거대분자를 추출하여 거대분자의 격리를 최소화하는 것;
2) 추출된 생체거대분자를 용기 내부의 표면 상에 이동억제화시키는 것; 및
3) 본 발명의 방법에 따라 추출되고 이동억제된 생체거대분자를 분석/시퀀싱하는 것.
일부 실시형태에서, 게놈 DNA 길이는 >50Kb, 100Kb, 200Kb, 400Kb, 800Kb이다. 일부 실시형태에서, DNA의 특정 분획은 길이가 대략 1Mb보다 크다. 일부 실시형태에서, DNA의 일부 분자는 길이가 5Mb보다 크다. 일부 실시형태에서, DNA의 표적 분자는 염색체의 실질적인 길이에 가깝다. 일부 실시형태에서, 텔로미어에서 텔로미어까지인, 염색체의 전체 길이가 보존되고 분석된다.
일부 실시형태에서, 아가로스 겔은 아가로스 비드의 형태이다. 일부 실시형태에서, DNA는 액적에 캡슐화된다. 일부 실시형태에서, DNA는 실질적으로 염색질로 남아 있다. 일부 실시형태에서, DNA는 염색체로 남아 있다. 일부 실시형태에서, 염색체는 세포 주기의 중기 단계에 있는 염색체이다. 일부 실시형태에서, 염색체는 세포 주기의 후기 단계에 있는 염색체이다.
일부 실시형태에서, 샘플은 단일 세포의 실질적으로 전체 DNA 함량을 포함한다. 일부 실시형태에서, 샘플은 단일 세포의 실질적으로 전체 RNA 함량을 포함한다. 일부 실시형태에서, 샘플은 단일 세포의 실질적으로 전체 단백질/폴리펩티드/펩티드 함량을 포함한다. 일부 실시형태에서, 샘플은 실질적으로 단일 세포의 전체 DNA 및 RNA 함량을 포함한다. 일부 실시형태에서, 샘플은 실질적으로 단일 세포의 전체 DNA, RNA, 단백질 함량을 포함한다.
일부 실시형태에서, 샘플은 단일 세포의 실질적으로 전체 세포질 함량을 포함한다. 일부 실시형태에서, 샘플은 단일 세포의 실질적으로 전체 핵 함량을 포함한다. 일부 실시형태에서, 샘플은 RNA의 전체 세포질 함량 및 DNA의 전체 핵 함량을 포함한다. 일부 실시형태에서, 샘플은 실질적으로 단백질의 전체 막 함량을 포함한다.
일부 양태에서 방법은 다음을 포함한다:
1. 생체거대분자를 분석 영역으로 전달하는 방법:
a. 생체거대분자를 포함하는 보호 실체를 제공하는 것으로, 상기 보호 실체는 생체거대분자를 그 자연 상태에 가깝게 보존하는 것;
b. 생체거대분자를 포함하는 보호 실체를 분석 영역의 근처에 배치하는 것;
c. 생체거대분자를 보호 실체로부터 방출하는 것;
d. 생체거대분자를 분석 영역 안으로 전달하는 것; 및
e. 분석 영역에서 생체거대분자의 적어도 하나의 특징을 검출할 수 있는 것.
2. 보호 실체는 분석 영역과 병치되는 1에 따른 방법.
3. 보호 실체는 생체거대분자의 천연 환경을 포함하는 1에 따른 방법.
4. 보호 실체는 염색체, 염색분체 또는 염색질을 포함하는 3에 따른 방법.
5. 보호 실체는 세포, 핵, 소기관, 소포, 엑소좀, 캡시드를 포함하는 3에 따른 방법.
6. 보호 실체는 압축된 구조에서 생체거대분자의 응축, 접힘 또는 기타 렌더링을 포함하는 1에 따른 방법.
7. 보호 실체는 액적, 비드 또는 겔인 1항에 따른 방법.
8. 보호 실체는 겔 비드, 겔 플러그, 겔 슬래브, 겔 모세관 또는 기타 겔 형성물인 5에 따른 방법.
9. 겔이 아가로스인 8에 따른 방법.
10. 생체거대분자는 양태 1의 단계 1 이전에 보호 실체 내에 싸이거나 이로 랩핑되는 이전 양태 1-9에 따른 방법.
11. 생체거대분자는 전기장의 인가를 통해 보호 실체로부터 방출되는 8에 따른 방법.
11a. 생체거대분자는 마이크로유체 구조 안으로 방출되는 방법.
11b. 마이크로유체 구조는 부동태화되는 11a에 따른 방법.
11c. 부동태화는 지질 코팅을 통한 것인 11b에 따른 방법.
12. 분석 영역이 나노포어, 나노갭 또는 기타 나노-규모 검출 스테이션/판독 헤드인 1항에 따른 방법.
12b. 나노포어 시퀀싱은 개별 폴리뉴클레오티드가 분석 영역 근처에서 방출된 후 개별 폴리뉴클레오티드 상에서 수행되는 12에 따른 방법.
13. 분석 영역은 표면인 1에 따른 방법.
14. 표면은 생체거대분자 상의 하나 이상의 부위에 결합할 수 있는 제제를 포함하는 12에 따른 방법.
15. 분석 영역은 나노채널, 나노그루브, 나노피트 또는 나노슬릿인 1에 따른 방법.
16. 생체거대분자는 분석 영역과 유체 접촉하는 구조 안으로 방출되는 1항에 따른 방법.
17. 생체거대분자는 분석 영역에 도달하기 전에 마이크로유체 채널을 통해 통과되는 15에 따른 방법.
18. 생체거대분자는 전기영동 또는 전기삼투를 통해 방출되는 1항에 따른 방법.
19. 분석 영역 안으로의 통과 속도는 분자 래칫, 분자 모터, 유체역학적 드래그, 전기장, 광학 핀셋, 자기 핀셋에 의해 제어되는 1에 따른 방법.
20. 생체거대분자는 보호 실체를 분쇄하는 제제에 의해 방출되는 1항에 따른 방법.
21. 분쇄 제제는 효소, 세제, 산 용액 또는 알칼리 용액인 20에 따른 방법.
22. 효소는 단백질분해효소인 21에 따른 방법.
23. 분쇄 제제는 초음파처리, 전하 스위치, 온도 변화, 열 충격, 저온 충격, 해동 등을 포함하는 20에 따른 방법.
24. 전단력으로부터 보호되는 1에 따른 방법.
25. 뉴클레아제, 단백질분해효소로부터 보호되는 1에 따른 방법.
26. 단계 e는 생체거대분자 상의 2개 이상의 장소에서 2개 이상의 특징을 검출하는 것을 포함하는 제1항에 따른 방법.
27. 생체거대분자는 중합체인 1에 따른 방법.
28. 천연 상태에 가까운 보존이 실질적으로 긴 길이에서 중합체의 보존을 포함하는 제27항에 따른 방법.
29. 중합체는 DNA 중합체이고 길이는 40Kb, 100Kb, 200Kb, 500Kb, 1Mb, 5Mb, 50Mb, 250Mb에 걸쳐 보존되는 28에 따른 방법.
30. 생체거대분자는 생체거대분자의 이동 방향에 수직인(교차흐름) 시약의 흐름에 의해 방출되는 1에 따른 방법.
31. 교차흐름은 RNAse, 단백질분해효소, 알칼리, 세제를 포함하는 30에 따른 방법.
32. 생체거대분자는 방출된 후 분석 영역 안으로 그의 진입 전에 기둥 또는 포스트의 어레이를 가로지르는 1에 따른 방법.
33. 보호 실체는 파라핀을 포함하는 1에 따른 방법.
34. 보호 실체는 포르말린 고정 파라핀 포매된 생체거대분자를 포함하는 33에 따른 방법.
35. 생체거대분자는 그 무결성을 보존하고 손상을 복구하는 용액에 노출되는 1에 따른 방법.
36. 생체거대분자는 DNA이고 용액은 복구 효소(예를 들어, NEB에 의한 PCR 복구 믹스)를 함유하는 35에 따른 방법.
35. 생체거대분자의 방출은 그 자연적 인케이싱으로부터 생체거대분자를 추출(예를 들어, 세포로부터 DNA의 추출)하는 과정인 양태 1-36에 따른 방법.
36. 생체거대분자가 보호 실체로부터 방출되면 마이크로-피펫팅, 와동 및/또는 원심분리를 사용하지 않고 단계가 수행하는 1에 따른 방법.
대안적인 실시형태
하나의 대안적인 실시형태에서, 프로브는 안정적으로 결합하지만 그의 일시적인 것은 환경을 오프 모드로 전환하는 외부 트리거에 의해 제어된다. 이러한 트리거는 프로브의 결합을 해제하는 열, pH, 전기장 또는 시약 교환이다. 그런 다음 환경이 다시 온 모드로 전환되어 프로브가 다시 결합될 수 있다. 일부 실시형태에서, 결합이 제1 라운드의 결합에서 모든 부위를 포화시키지 않는 경우, 제2 라운드는 제1 라운드 이외의 다른 부위를 차지할 수 있다. 이들 주기는 제어가능한 속도로 여러 번 수행될 수 있다.
대안적인 초-분해능 및 단일 분자 국지화 방법
대안적인 실시형태에서, 프로브는 비교적 안정적으로 결합되지만, 회절 한계보다 더 가까운 광 신호를 분해하기 위한 다수의 접근방식이 있다. 첫째, 양자점이나 염료와 같은 방출 표지의 광학적 특성이 알려진 경우, 실체의 점 확산 기능을 사용하여 폴리뉴클레오티드를 따라 밀접하게 떨어져 있는 두 신호를 분해하는 것이 가능하다. 이것은 밀접하게 떨어져 있는 두 신호가 다른 파장의 방출일 때 수행하기 더 쉽다. 둘째, 이들을 확률적 과정인 광탈색을 허용함에 의해 신호를 분해하는 것이 가능하다(J Biomed Opt. 2012 Dec;17(12):126008). 셋째, 기술되어 있고 상업적으로 이용가능한 다수의 하드웨어 접근방식이 있으며; 여기에는 주사 광학 현미경, 4Pi, STED 및 SIM이 포함된다. STED의 경우에 특정 호환 가능한 형광단의 세트가 사용되어야 한다. 잠정적으로 분리되는 밀접하게 이격된 신호를 기반으로 하는 다수의 분자 접근방식도 기술되었으며 여기에는 STORM(확률적 광학 재구성 현미경(STORM)에 의한 하위-회절 한계 이미징 M.J. Rust, M. Bates, X. Zhuang Nature Methods 3: 793-795(2006)이 포함되며; 이 경우에 특정 세트의 호환가능한 형광단이 사용되어야 한다.
단일 분자 국지화 방법인 DNA PAINT(Jungmann 외 Nano Lett. 2010, 10: 4756)가 또한 본 발명의 다양한 실시형태에서 사용될 수 있다. DNA PAINT의 경우, 각 결합 프로브는 상보적인 올리고 안티-태그가 일시적으로 결합하는 올리고 태그로 표지된다. 각각의 결합 프로브는 상이한 서열 상보체의 결합 파트너 쌍과 연관되어 있다. 구별하기 위해서는 각각의 결합 프로브와 연관된 안티-태그가 서로 구별될 수 있다. 그것들을 구별할 수 있게 하는 요소는 다른 파장 방출 표지(예를 들어, Atto 488, Cy3B, Alexa 594 및 Atto 655/647N), 다른 수명을 가진 표지일 수 있고 또는 상이한 안티-태그가 상이한 온/오프 결합 동력학을 갖도록 설계될 수 있다.
DNA PAINT를 사용하여 신호의 국지화의 좌표를 정확하게 할당할 수 있다. 국지화는 신호를 방출하는 형광단이 통합의 부위에 가깝게 남아 있을 때를 결정하는 것이 더 쉬우므로 파장 방출 모이어티(예를 들어, 형광단)을 염기에 연결하는 링커 또는 브리지의 유연성의 정도 및 길이는 제한되어야 하며, 예를 들어 일부 실시형태에서, 짧은 길이 및 강성 링커가 사용된다.
초해상도 이미지를 얻기 위한 다른 대안적인 수단은 확장에 의한 것이다(예를 들어, Chen, Tillberg, 및 Boyden Science 30 January 2015: Vol. 347 no. 6221 pp. 543-548에 의해 기술된 바와 같음). 여기에서 연장된 폴리뉴클레오티드는 겔로 되어 그 다음 확장되고 이에 의해 생물학적 물질이 신장된다. 폴리뉴클레오티드와 연관된 특정 표지는 팽윤성 중합체 네트워크에 공유적으로 앵커링된다. 폴리뉴클레오티드가 분쇄되더라도(또는 더 이상 연속적인 폴리포스페이트 백본을 갖지 않음) 팽윤 시, 단편의 순서는 유지되고 발명은 여전히 실시될 수 있다.
이러한 초해상도 접근방식은 일시적인 결합을 필요로 하지 않는다. 따라서, 각 주기의 프로브 결합은 표면(예를 들어, 커버 유리)을 레퍼토리의 다른 올리고 또는 올리고 세트를 운반하는 다른 트로프에 침지함에 의해 수행될 수 있다.
일시적인 결합의 이점
일시적인 결합 접근방법은 결합하는 형광단의 광탈색이 항상 새로운 형광단으로 대체되기 때문에 문제가 되지 않는다는 이점이 있다. 따라서 형광단의 선택, 변색방지의 제공, 산화환원 시스템은 그다지 중요하지 않으며 예를 들어 카메라의 시야에 있지 않은 분자의 조명을 방지하기 위해 f-스톱 없이 더 간단한 광학 시스템이 구성될 수 있는데, 이는 조명은 일시적으로 소멸파 안으로 들어오는 표지만 탈색하고 이들 탈색된 표지는 계속해서 벌크 용액으로부터 분자에 의해 대체되기 때문이다.
온-오프 결합의 이점은 단순히 단일 염료 분자로 표지된 프로브의 암 상태 또는 광탈색 문제를 피한다는 것이다. 특정 프로브 분자가 탈색되거나 암 상태인 경우 그 프로브의 결합 이벤트가 검출되지 않을 것이다. 그럼에도 불구하고, 표적화된 위치는 그 장소에 대한 다음 결합 이벤트에 의해 검출될 가능성이 높다.
일부 실시형태에서, 온-오프 결합의 이점은 그래서 검출에서 신뢰도를 증가시키기 위해 다중 측정이 이루어질 수 있다는 점이다. 예를 들어, 일부 경우에 분자 과정의 전형적인 확률론적 특성으로 인해 프로브가 바르지 않은 장소에 결합할 수 있지만 이러한 이상치는 폐기될 수 있고 다중 검출된 상호작용에 의해 확증될 수 있는 이들 결합 이벤트만 서열 결정을 위한 유효한 검출 이벤트로 허용된다.
발명의 일부 실시형태에서, 일시적인 결합 접근방식의 이점은 연장된 폴리뉴클레오티드를 따른 서열이 결정되는 방법에 대해 매우 중요하다. 이 이점은 일시적인 결합이 결합해야 하는 모든 프로브 장소가 동시에 결합되지 않는다는 것을 의미한다는 사실이다. 이를 통해 광의 회절 한계보다 더 가까운 부위에서 결합 이벤트를 검출하는 것을 허용한다. 예를 들어 서열 AAGCTT가 60개 염기 후에 반복되면 대략 20nm 거리(표적이 연장되고 신장되어 왓슨-크릭 거리=0.34nm일 때)는 일반적으로 광학 이미징에 의해 구별가능하지 않을 수 없다. 그러나, 이미징 동안 두 부위에 대한 프로브가 서로 다른 시간에 결합하면 그들은 개별적으로 검출될 수 있다. 이를 통해 나노스케일 지형의 포인트 축적(PAINT)으로 공지된 방법으로 결합 이벤트의 초해상도 이미징을 수행하는 것을 허용한다. 신호의 나노미터 또는 서브-나노미터 국지화를 허용하는 알고리즘(예를 들어, ThunderSTORM)이 사용될 수 있다. 이것으로 정확한 장소와 따라서 프로브의 결합의 정확한 순서를 결정할 수 있다. 나노미터 정밀도는 반복을 분해하고 그의 수를 결정하는 데 특히 중요하다.
10x Inc.에 의해 개발된 액적 기반 분할에 대한 접근방식 및 바코딩 접근방식의 이점은 추론에 의하거나 또는 컴퓨터 재구성에 의해서가 아닌 분자의 직접 시각화에 의해 게놈 구조 및 단상형 정보가 획득될 수 있다는 것이다. 이 방법의 독특한 이점은 효율적으로 수행될 때 단일 세포로부터 게놈이 서열화될 수 있고 그 안의 단상형이 분해될 수 있다는 것이다. 방법이 효율적이 아닌 경우에도 분자의 분할 및 바코딩이 필요한 접근방식에 필요한 것보다 훨씬 적은 수의 게놈 카피가 게놈의 드 노보 재구성에 필요하다. 또한, 훨씬 적은 수의 처리 단계가 필요할 뿐만 아니라 전반적인 시약 사용량도 줄어든다. 더욱이, 방법은 증폭 없이 게놈 DNA에 작용할 수 있기 때문에, 증폭 바이어스 및 오류가 없고, 후성유전적 마크가 보존되어 서열의 획득에 직교하여 검출될 수 있다. 탄소-5 (C5)의 알킬화는 포유류에서 C5-메틸시토신(5-mC), C5-하이드록시메틸시토신(5-hmC), C5-포르밀시토신 및 C5-카르복실시토신 같은 여러 시토신 변이체를 생성한다. 진핵생물과 원핵생물은 또한 아데닌을 N6-메틸아데닌(6-mA)으로 메틸화한다. 원핵생물에서는 N4-메틸시토신도 만연한다. 항체가 이용가능하거나 이들 변형의 각각에 대해 생성될 수 있다. 변형을 표적화하는 아피머, 나노바디 또는 압타머는 더 작은 풋프린트의 가능성으로 인해 특히 관련이 있다. 부가하여, 다른 자연 발생 DNA 결합 단백질, 예를 들어 메틸 단백질(MBD1, MBD2 등)이 사용될 수 있다.
따라서, 다양한 양태 및 실시형태에서, 본 발명은 후성유전체 정보를 포함하여 단일의 연장된 표적 폴리뉴클레오티드 분자를 시퀀싱하는 방법을 제공한다.
다양한 양태 및 실시형태에서, 방법은 단상형이 분해되는 단계적 시퀀싱에 사용될 수 있고, 선행 단락의 방법을 사용하여 이배체 게놈의 단상형 분지에 걸쳐 있는 제1 표적 폴리뉴클레오티드를 시퀀싱하는 단계; 선행 단락의 방법을 사용하여 이배체 게놈의 단상형 분지에 걸쳐 있는 제2 표적 폴리뉴클레오티드를 시퀀싱하는 단계로서, 제1 및 제2 표적 폴리뉴클레오티드는 상이한 상동 염색체로부터 유래하는 것인, 단계; 이에 의해 제1 및 제2 표적 폴리뉴클레오티드 상의 단상형(연결된 대립유전자)을 결정하는 단계를 포함할 수 있다.
본 발명의 이점은 대신에 짧은 올리고의 결합에 의해 획득된 연속적이거나 중첩하는 서열 정보를 함께 스티칭함에 의해 비용이 많이 들고 시간 소모적인 개별 긴 판독을 실제로 수행함이 없이 긴 판독을 얻을 수 있다는 것이다. 단일 폴리뉴클레오티드 분자의 길이를 따라 복수의 짧은, 3, 4, 5 또는 6개 염기 서열 정보의 비트가 동시적으로 획득되고, 따라서 그것이 모두 연결되고, 폴리뉴클레오티드가 온-오프 결합 올리고로 포화되었을 때 그의 나노미터 위치, 분해능 및 순서는 전체 분자의 서열을 밝힌다. 폴리뉴클레오티드의 시퀀싱은 분자에서 한 장소에서 다른 장소로의 SbS 반응(예를 들어, PacBio 시퀀싱)에 의해 단일 긴 판독이 획득되어 지는 것보다 다중 서열 정보의 비트가 동시적으로 획득되어 지기 때문에 현재 방법보다 시간이 덜 걸린다.
발명의 또 다른 주요 이점은 마이크로어레이 기반 기술, 현재의 지배적인 접근방식 및 해결법에서는 도전적인 균형된 카피 수 변이 및 역전과 마이크로어레이, 세포유전학 또는 기타 현재 시퀀싱 방법으로는 접근할 수 없는 규모를 포함하여, 작거나 크거나 상관없이 모든 유형의 구조적 변이를 검출할 수 있다는 것이다.
더욱이, 방법은 게놈의 반복 영역을 통한 시퀀싱을 허용한다. 기존 시퀀싱의 경우 게놈의 이러한 부분을 통한 판독에서의 문제는 첫째, 이러한 영역이 참조 게놈 및 드 노보 어셈블리가 아닌 참조로 정렬을 만듦에 의해 큰 게놈을 전형적으로 다루는 Illumina, Ion Torrent, Helicos/SeqLL 및 Complete Genomics와 같은 기술에서 잘 표현되지 않는다는 것이다. 둘째로, 판독이 반복 영역 전체에 걸쳐 실행되지 않으면 영역에 걸쳐 더 짧은 판독을 통해 영역을 어셈블리하기가 어렵다. 이는 한 분자에 대한 반복 영역과 다른 분자에 대한 반복 영역과의 사이에서 가능한 다중 정렬 중 어느 것이 올바른지 결정하기 어려울 수 있기 때문이다. 잘못된 정렬은 어셈블리에서 반복 영역을 줄이거나 늘릴 수 있다. 발명의 시퀀싱 방법에서, 동시에 또는 한 세트씩 차례로 수행하는 다중 판독에 의해 단일 분자의 완전하거나 거의 완전한 적용범위가 있는 경우, (폴리뉴클레오티드 그 자체가 반복 영역의 전체에 걸쳐 있는 경우) 반복 영역의 전체에 걸쳐 있는 어셈블리가 구성될 수 있다. 본 발명의 방법은 반복 영역에 걸쳐 있기에 충분히 긴 폴리뉴클레오티드에 적용될 수 있다. 1Mb에서 10Mb 사이의 폴리뉴클레오티드는 게놈에서 대부분의 반복 영역에 걸쳐 있기에 충분하다.
다양한 시퀀싱 메트릭에 대한 영향
속도에 미치는 영향 - 접근방식은, 긴 샘플 처리 단계나 주기 시간 없이 간단하다. 효소적 단계는 없고 단지 혼성화만 있으며 속도를 높이기 위한 여러 수단이 있다.
비용에 대한 영향 - 접근방식은 비용이 극히 낮으며, 필요한 유일한 시약은 극소량의 올리고, 예를 들어 0.5-3nM의 올리고 프로브이다.
판독-길이에 대한 영향 - 판독-길이는 잠재적으로 임의의 길이의 DNA의 분자(전체 염색체 포함)만큼 길다.
정확도에 대한 영향 - 제안된 기술이 가장 높은 정확도 시퀀싱 기술이 될 가능성이 있다. 몇 가지 이상치를 제외하고 짧은 올리고는 단지 하나의 염기의 불일치로 안정성이 크게 떨어지기 때문에 극히 구체적이다. 올바른 결합 조건이 주어지면 완벽한 일치는 대부분의 경우에 하나 이상의 염기의 불일치와 구별될 수 있으며; 이 능력은 각 서열 부위의 반복적인 조사에 의해 향상될 수 있다. 더욱이, 방법은 서열의 결정에서 불일치 정보를 활용할 수 있다. 더욱이, 듀플렉스의 양 가닥에서 동시적인 서열 획득은 정확도를 증가시킨다. 기술의 정확도 수준은 희귀 돌연변이를 검출하기에 충분할 것이다.
민감도에 대한 영향 - 방법은 단일 분자 기술이므로 정교하게 민감성일 가능성이 있다. 결찰과 같은 비효율적인 준비 단계가 없으므로 분자가 손실되지 않을 것이다. 추출이 시퀀싱의 부위에 가깝게 통합될 수 있기 때문에 용기에 달라붙어 분자가 손실되지 않고 마이크로유체 장치 자체의 내부 벽이 부동태화되어 분자의 격리를 방지할 수 있다. 또한 세포에서 방출되는 실질적으로 모든 분자는 유로 내에서 접근할 수 있다. 더욱이 방법은 단지 하나의 분자에서 전체 인접하는 판독을 얻을 수 있는 가능성이 있다. 이것은 방법이 전례 없는 적용범위와 낮은 대립유전자 드롭아웃을 허용하는 단일 세포로부터의 시퀀싱과 관련이 있다.
시퀀싱 적용 및 용도
일부 실시형태에서, 발명은 단일 연장된 폴리뉴클레오티드로부터 직접적으로 획득된 서열 정보의 사용을 포함하며, 여기서 긴 폴리뉴클레오티드(~100Kb에서 전체 염색체까지) 내에서 획득된 서열 판독의 상황은 보존된다. 상황 정보는 짧은 판독이 특정 폴리뉴클레오티드로부터 유래한다는 정보를 포함할 수 있다. 상황은 또한 폴리뉴클레오티드 내에서 시퀀싱 판독의 정확하거나 대략적인 장소를 아는 것으로 확장될 수 있다.
더욱이, 개별 폴리뉴클레오티드의 길이(하위-염색체 길이의 것인 경우)보다 더 긴-범위 정보도 폴리뉴클레오티드가 동일한 염색체(또는 다른 유형의 완전한 폴리뉴클레오티드, 예를 들어, RNA 전사체)에서 유래한 유사하거나 다른 길이의 복수의 폴리뉴클레오티드의 일부인 경우 획득될 수 있다. 일부 실시형태에서, 복수의 폴리뉴클레오티드 각각으로부터의 서열 판독은 복수의 폴리뉴클레오티드를 포함하는 다른 폴리뉴클레오티드로부터의 판독과 독립적으로 획득된다. 이 경우에, 복수의 폴리뉴클레오티드로부터 획득된 시퀀싱 데이터는 폴리뉴클레오티드가 원래 유래된 천연 폴리뉴클레오티드 서열 안으로 폴리뉴클레오티드를 재구성하거나 어셈블리하는 데 사용된다. 이것은 주어진 유형의 많은 세포에서 추출된 게놈 DNA에서 시퀀싱이 수행되는 경우일 수 있고, 많은 동일한 염색체 상동체로부터의 DNA가 존재한다는 것이 예상된다. 예를 들어, 백만 개의 세포로부터의 세포 추출(예를 들어, CEPH 패널로부터 림프모구양 세포주, 예를 들어, NA12878)에서 모계로부터 유래된 백만 개의 염색체 상동체와 부계로부터 유래된 백만 개의 염색체 상동체가 추출된 DNA에서 예상된다.
다른 실시형태에서 짧은 판독의 상황은 단리된 긴(~50-200Kb) 단일 폴리뉴클레오티드를 시퀀싱함에 의해 보존된다. 일부 실시형태에서, 짧은 판독의 상황은 연장된 폴리뉴클레오티드를 따라 시퀀싱함에 의해 보존된다. 일부 실시형태에서, 동일한 세그먼트(단상형 분해능이 있거나 없음)를 커버하는 단일 폴리뉴클레오티드의 많은 카피는 표적당 복수의 서열 판독을 얻기 위한 표적으로 사용되고, 서열 판독은 단일 폴리뉴클레오티드 중 하나에 의해 표시될 수 있는 폴리뉴클레오티드 세그먼트의 보다 긴 범위 서열을 재구성하는 데 사용된다. 따라서 게놈의 드 노보 어셈블리 또는 게놈의 많은 부분이 재구성될 수 있다. 단상형 분해된 드 노보 어셈블리를 만들기 위해, 폴리뉴클레오티드의 충분한 분획이 시퀀싱 판독로 커버될 때 하나의 상동 염색체 또는 다른 것(예를 들어, SNP 또는 그 안에서 발견된 구조적 변이체)으로부터의 세그먼트에 속하는 것으로 중첩하는 세그먼트를 구별하는 것이 가능하다. 발명의 방법은 현재의 시퀀싱 기술로 얻기 어려운 게놈에서 발견될 수 있는 다음 특징을 결정하거나 분해하는 데 사용될 수 있다.
역전
폴리뉴클레오티드를 따른 일련의 서열 판독의 배향은 역전 이벤트가 발생했는지 여부를 보고할 것이다. 참조와 비교하여 다른 판독에 대해 반대 배향에서 하나 이상의 판독은 역전을 나타낸다.
전좌
그 부근에서 다른 판독의 상황에서 예상되지 않는 하나 이상의 판독의 존재는 참조와 비교하여 재배열 또는 전좌를 나타낸다. 참조에서 판독의 장소는 게놈의 어느 부분이 다른 부분으로 전이했는지 나타낸다. 일부 경우에 그 새 장소에서 판독은 전좌보다는 복제이다.
카피 수 변형
특정 판독의 부재 또는 반복은 각각 결실 또는 증폭이 발생했음을 나타낸다. 본 발명의 방법은 특히 폴리뉴클레오티드에 다중 및/또는 복잡한 재배열이 있는 경우에 적용될 수 있다. 발명의 방법은 단일 폴리뉴클레오티드를 분석하는 것에 기반하기 때문에, 상기에서 기술된 구조적 변이체는 소수의 세포, 예를 들어 모집단에서 단지 1%의 세포에서 드물게 발생하도록 분해될 수 있다.
듀플리콘
세그먼트의 복제 또는 듀플리콘은 게놈에서 영속되고 체세포 돌연변이를 포함하는 개별 게놈에서 많은 구조적 변이를 시딩한다. 세그먼트의 듀플리콘은 게놈의 말단 부분에 존재할 수 있다. 현재의 차세대 시퀀싱에서 어떤 세그먼트의 듀플리콘에서 판독이 발생하는지 결정하기가 어렵다. 본 발명의 일부 실시형태에서, 판독이 긴 분자(예를 들어, 0.1-10메가베이스 길이 범위)에 대해 얻어지기 때문에, 통상적으로 단순히 판독을 사용하여 게놈의 어느 세그먼트가 듀플리콘에 상응하는 게놈의 특정 세그먼트에 측접해 있는지를 결정함에 의해 듀플리콘의 게놈 상황을 결정하는 것이 가능하다.
반복 영역
유사 변이를 수반하는 판독 또는 관련 판독의 반복된 발생은 게놈에서 다중 장소에서 발생하는 다중 또는 매우 유사한 판독으로서 (데이터 분석 후) 발명의 방법에 의해 관찰될 수 있다. 이들 다중 장소는 위성 DNA에서와 같이 함께 가깝게 팩킹되거나 유사유전자와 같은 게놈에 걸쳐서 분산된다. 발명의 방법은 짧은 탠덤 반복(STRS), 탠덤 반복의 가변성 수(VNTR), 트리뉴클레오티드 반복 등에 적용될 수 있다.
중단점 찾기
구조적 변이체의 중단점은 발명의 방법에 의해 정확히 지적될 수 있다. 발명은 게놈의 두 부분이 융합된 총 수준을 보여줄 뿐만 아니라 중단점이 발생한 정확한 개별 판독이 관찰될 수 있다. 판독은 두 융합된 영역의 키메라를 포함할 뿐만 아니라, 중단점의 한쪽에 있는 모든 서열은 융합된 세그먼트 중 하나에 상응할 거이고 다른 쪽은 융합된 세그먼트의 다른 쪽이다. 이는 중단점을 결정할 때 높은 신뢰도를 제공한다. 중단점 주변에서 구조가 복잡한 경우에도 발명의 방법은 구조를 분해할 수 있다. 일부 실시형태에서, 정확한 염색체 중단점 정보는 질병 기전의 이해에 사용되며, 특정 전좌의 발생을 검출하는 데 사용되고, 질병을 진단하는 데 사용된다.
단상형
일부 실시형태에서, 단상형의 분해는 개선된 유전 연구가 수행될 수 있게 한다. 다른 실시형태에서 단상형의 분해는 더 나은 조직 타이핑이 수행될 수 있게 한다. 일부 실시형태에서, 단상형의 분해 또는 특정 단상형의 검출은 진단이 이루어질 수 있게 한다.
다른 추론 또는 분할 및 태깅 단상형/단계화 접근방식과 비교하여, 본 발명은 가능한 단상형의 컴퓨터 재구성을 기반으로 하지 않는다. 발명에서 얻은 정보의 시각적 특성은 실제로 물리적으로 또는 시각적으로 특정 단상형을 나타낸다.
따라서, 본 발명의 실시형태로부터 얻어진 판독 및 어셈블리는 단상형-특이적인 것으로 분류될 수 있다. 단상형-특이적 정보가 긴 범위에 걸쳐 반드시 쉽게 얻어지지 않는 유일한 경우는 어셈블리가 간헐적일 때이며; 그럼에도 불구하고 판독의 장소가 제공된다. 여기에서도 다중 폴리뉴클레오티드가 게놈의 동일한 세그먼트를 커버하는 경우 단상형은 계산적으로 결정될 수 있다.
유기체의 식별
발명의 일 실시형태는 발명에 의해 제공된 서열, 에피- 및 구조적 정보를 기반으로 메타게놈 샘플과 같은 혼합 샘플에 존재하는 서로 다른 개별 유기체를 식별하는 것이다. 본 발명의 시퀀싱 방법은 단지 하나의 게놈의 카피로부터 게놈의 상당한 분획을 서열화할 수 있기 때문에 유기체의 다양한 메타게놈 혼합물을 서열화할 수 있다. 더욱이 하나 또는 몇 개 염기의 정보로부터 얻은 단일 분자의 지도만으로도 미생물을 식별하기에 충분하다.
세포주 식별 및 검증
일부 실시형태에서, 게놈 DNA는 배양된 세포로부터 추출되고, 신장되고, 메틸화 및/또는 서열 정보는 발명의 방법을 사용하여 신장된 분자로부터 추출된다. 이 정보는 세포주의 정체성을 검증하고 그 분자 표현형을 결정하고 계대의 과정을 통해 또는 실험이 수행될 때 후성유전체의 변화를 모니터링하는 데 사용될 수 있다(예를 들어, 성장 조건의 섭동).
질환 검출
일부 실시형태에서, 발명은 암의 조기 검출, 암의 진단, 암의 분류, 암 내 세포 이질성 분석, 암 병기결정, 암의 발달 모니터링, 약물 치료 적용, 사용할 약물 또는 약물의 조합 결정, 치료의 효과 모니터링, 재발 모니터링, 결과 예측을 위한 발명의 방법의 사용을 포함한다. 이들 각각의 경우에, 특정 서열, 에피- 또는 구조적 변이체를 포함하는 특정한 "바이오마커" 또는 바이오마커의 세트가 검색되거나, 단지 일반적으로 특정 역치 수준을 넘는 구조적 변이의 발생이 검출된다. 이 양태는 다음을 포함한다:
1. 스크리닝되는(예를 들어, 암의 초기 징후에 대해 스크리닝되는) 인간 환자 또는 개체로부터 샘플 생체적합물질을 얻는 것;
2. 발명의 방법에 따라 시퀀싱 및/또는 에피- 분석을 수행하는 것;
3. 참조와 비교하거나 개체/환자로부터 다른 신체 조직과 비교하여 데이터에서 서열, 에피- 및/또는 구조적 변이를 검색하는 것;
4. 변이의 양 및/또는 유형을 평가하고 선택적으로 점수를 제공하는 것; 및
5. 선택적으로 4에 기반하여 임상적 결정을 내리는 것.
동일한 5개 단계가 암 이외의 다른 질환 사례에 적용될 수 있고 가축, 개 및 고양이와 같은 인간 이외의 동물에 적용될 수 있다. 서열 데이터는 RNA 및 DNA 데이터를 포함할 수 있다. 일부 실시형태에서, 단지 서열, 단지 구조적 또는 단지 메틸화 또는 기타 변형 정보를 사용하여 임상적 결정을 내린다.
일부 실시형태에서, 단계 5는 착상-전 진단 또는 스크리닝에서 선택할 수정란을 결정하는 것을 포함할 수 있다. 일부 실시형태에서, FFPE 컬이 수득되고, DNA가 추출 및 이동억제화되고, 결합제의 일시적인 결합이 수행된다.
유전자형 대 표현형 상관관계
일부 실시형태에서, 본 발명의 방법은 다음에 의해 유전자형 대 표현형 상관관계를 만들기 위해 사용된다
1. 모집단, 코호트 또는 가족에서 개체로부터 샘플 생체적합물질(예를 들어, RNA 또는 DNA)을 획득하는 것;
2. 발명의 방법에 따라 시퀀싱 및/또는 에피- 분석을 수행하는 것;
3. 데이터에서 서열, 에피-마크 및/또는 구조적 변이체를 모색하고, 선택적으로 민족성, 표현형의 계층화 및 표현형의 오분류를 고려하면서 특정 질환, 표현형 또는 특성에 대한 사례 및 대조군 사이에서 이를 비교하는 것; 및
4. 어떤 서열, 에피- 및/또는 구조적 모티프 또는 마커 변이체가 표현형과 상관되는지 결정하는 것.
추가로, 표현형 상관 서열, 에피- 및/또는 구조적 변이체는 표현형에 대한 후보 바이오마커로서 선택될 수 있다. 선택적으로, 후보 바이오마커를 미세 조정하거나 검증하기 위해 추가 연구가 수행된다.
실험 방법의 상세한 설명
발명의 다양한 양태, 실시형태 및 특징이 하기에 더 상세히 제시되고 기술된다. 그러나, 전기 및 하기의 설명은 단지 예시적이고 설명적이며 청구된 바와 같이 발명을 제한하지 않는다.
일부 실시형태에서, 본 발명의 방법은 공정의 주요 기능 요소 사이에 다양한 세정 단계를 포함하며, 다양한 지점에서 세정 단계에 대한 필요성은 숙련된 기술자에 의해 인식될 것이다. 일반적으로 세정 완충액은 인산염 완충 식염수, 2xSSC, TE, TEN, HEPES를 포함할 수 있고 소량의 트윈 20, 트리톤 X, Sarkosyl 및/또는 SDS 등이 보충된다. 전형적으로 2-3 세정이 기능적 단계 사이에 삽입될 수 있다. 예를 들어, 일부 경우에 한 올리고를 다른 올리고로 교환할 때 세정 단계가 수행될 것이다.
대부분의 경우 특정 올리고 길이에 대해 기술된 것은 다른 올리고 길이에 대한 경우일 수도 있음을 이해해야 한다. 또한 식별, 분석, 측정과 같은 용어가 사용되는 경우 그것은 정신적 행위가 아니라 컴퓨터 알고리즘과 조합하여 사용되는 검출기 및 자동화 유체공학을 포함하는 기구의 사용 같이 기구에서 실행되는 행위임을 이해해야 한다.
표면 상의 메가베이스 범위 게놈 DNA 추출 및 연장
고분자량(HMW) 또는 긴 길이의 DNA를 추출 및 신장하기 위한 다수의 방법이 존재한다. 예를 들어, Allemand 외 Biophysical Journal 73:2064-2070 1997; Michalet 외 Science 277:1518-1523 (1999))를 참고한다. 일부 실시형태에서, Kaykov 등(Scientific Reports 6:19636 2016)에서 채택된 방법을 사용하여 메가-염기 범위의 평균 길이를 갖는 DNA를 추출 및 연장할 수 있다. 이러한 실시형태에서, 게놈 DNA는 1시간 동안 단백질가수분해효소 K를 사용하여 아가로스 블록(예를 들어, Biorad 또는 Genomic Vision 프로토콜을 사용하거나 Kaykov 외에 의해 기술된 바와 같음)에서 세포(블록당 1x104 내지 105개)로부터 추출되며, 세정 단계는 100mM NaCl을 포함하고, 아가로스 블록은 혼합하지 않고 42℃에서 연장된 기간(예를 들어, 16시간) 동안 Beta-Agarase(NEB, USA)를 사용하여 트로프에서 용해되고 소화된 다음 실온으로 된다. DNA는 pH 6에서 50mM MES 100mM의 NaCl을 함유하는 완충액에서 다듬어 진다. 트로프 중 기판(예를 들어, 커버슬립)을 끌어낼 수 있는 장치(예를 들어, Kaykov 등에 의해 기술된 바와 같음)를 사용하여 최소한의 진동으로 부드럽고 낮은 마찰 z 이동을 생성한다. 900?m/초의 다듬기 속도는 최소한의 파단으로 균일하게 신장된 DNA 분자에 사용된다. 분자의 대략 50%는 길이가 평균 2Mb이고 5%는 4MB를 넘어 1Mb보다 길다.
표면 상에서 신장하기 위한 여러 다른 방법이 사용될 수 있다(예를 들어, ACS Nano. 2015 Jan 27;9(1):809-16에 기술된 바와 같음). 대안적으로, Petit and Carbeck(Nano. Lett. 3: 1141-1146 (2003))에 의해 기술된 접근방식을 사용하는 것을 포함한 유동 셀에서 표면 상의 연장이 수행될 수 있으며, 이는 20-100uM 채널에서 조합에 대해 4-5μm/s의 유체 회수율은 잘 정렬된 단방향 폴리뉴클레오티드를 제공하는 평평한 공기-물 계면을 생성한다는 것을 나타낸다. 유체 접근방식에 부가하여, 폴리뉴클레오티드는 전기장을 사용하여 신장될 수 있다(예를 들어, Giess 외 Nature Biotechnology 26, 317 - 325 (2008)에 기술된 바와 같음. 폴리뉴클레오타이드가 표면에 부착되어 있지 않을 때 폴리뉴클레오타이드를 연장하기 위한 여러 접근방식이 이용가능하다(예를 들어, Frietag 외 Biomicrofluidics. 9(4):044114 (2015); 및 Marie 외 Proc Natl Acad Sci USA. 110:4893-8 (2013)에 기술된 바와 같음).
겔 플러그에서 DNA를 사용하는 것에 대한 대안으로서, 칩 상으로 장입하기에 적합한 염색체는 Cram 등 (L. S. Cram, C. S. Bell 및 J. J. Fawcett, Methods Cell Sci., 2002, 24, 27-35)에 의해 기술된 바와 같이 폴리 아민 방법에 의해 제조될 수 있고 장치 안으로 직접적으로 피펫팅될 수 있다. 염색체에서 DNA에 결합하는 단백질은 단백질분해효소를 사용하여 소화되어 실질적으로 네이키드 DNA를 방출할 수 있다.
분석 이전에 생체거대분자의 무결성 보존
분쇄의 대부분은 세포 및 조직으로부터 생체분자를 추출하는 과정과 분석될 수 있기 전에 생체분자의 후속하는 처리하는 과정에서 발생한다. DNA의 경우에 무결성의 손실로 이어지는 그 취급의 양태는 피펫팅, 와동, 동결-해동 및 과도한 가열을 포함한다. 기계적 스트레스는 최소화될 수 있다(ChemBioChem, 11:340-343 (2010). 부가하여 고농도의 2가 양이온, EDTA, EGTA 또는 갈산 (및 그의 유사체 및 유도체)은 뉴클레아제에 의한 분해를 억제한다. 일부 실시형태에서, 샘플 대 2가 양이온 중량의 2:1 비율은 극도의 뉴클레아제 수준이 있는 대변과 같은 샘플에서도 뉴클레아제를 억제하기에 충분하다.
단일 세포로부터 핵산 추출 및 단리
본 발명의 목적을 위해 생체고분자를 추출하는 데 사용될 수 있는 단일 세포 또는 핵으로부터 생체고분자를 추출하는 데 이용가능한 다수의 상이한 접근방식이 있다. 다수의 적절한 방법이 Kim 외 Integr Biol 2009 vol. 1 (10) pp. 574-86에서 검토된다. 세포를 KCL로 처리하여 세포막을 제거할 수 있다. 세포는 저장성 용액을 추가하여 파열될 수 있다. 다양한 상이한 화학적 및 물리적 용리 방법이 당업계에 공지된 바와 같이 구현될 수 있고 이전에 마이크로유체학에서 시험될 수 있다.
단일 세포용 트랩은 핵산 내용물이 방출되는 동안 세포를 유지하는 마이크로유체 구조로 설계될 수 있다. 그것은 WO/2012/056192, WO/2012/055415 ***의 장치 설계를 사용하는 것을 포함하지만, 본 발명에서는 DNA를 추출하고 나노채널에서 신장하는 대신 마이크로/나노유체 구조를 밀봉하는 데 사용되는 커버-유리 또는 호일이 폴리비닐 실란으로 코팅되어 (또는 유사하게 배치되어) Petit 외 Nano Letters 3:1141-1146(2003)에 의해 기술된 바와 같은 유체의 이동에 의해 분자 다듬기를 가능하게 한다. 유체 칩 내부의 부드러운 조건은 추출된 DNA를 긴 길이로 보존할 수 있도록 한다.
일부 실시형태에서, 발명의 방법은 Strijp 외 Sci Rep. 7:11030(2017)에 기술된 방법의 적응을 포함한다. 신장 이전에, 단일 세포의 핵 및 핵외 성분은 마이크로유체 장치의 공급 채널에 적어도 하나의 세포를 제공하고, 적어도 하나의 트래핑 구조에서 적어도 하나의 세포를 포획하고, 세포에 제1 용리 완충액을 공급함에 의해 세포의 핵의 무결성에 영향을 미치지 않으면서 적어도 하나의 트래핑 구조에 포획된 세포를 용해하는 것; 세포의 핵외 성분을 방출된 RNA가 이동억제된 유동 셀 안으로 방출하는 것; 핵에 제2 용리 완충액을 공급하여 세포의 핵을 용리시키는 것; 그것이 이동억제된 유동 셀 안으로 세포의 핵의 성분(예를 들어, 게놈 DNA)을 방출하는 것에 의해 개별적으로 추출된다. 세포-외 및 세포-내 성분은 동일한 유동 셀의 다른 장소 또는 장치 내의 다른 유동 셀에 이동억제된다.
포획용 어댑터
비-말단-변형된 폴리뉴클레오티드를 포획/이동억제화하는 것에 부가하여, 일부 실시형태에서 (특히 짧은 DNA가 분석되는 경우) DNA의 말단은 표면/매트릭스 상의 포획 분자와의 상호작용을 위해 적합화된다. 이는 말단 전이효소를 사용한 테일링, 예를 들어 폴리 A로 테일링 및 표면 또는 매트릭스 상의 올리고 d(T) 포획 프로브에 대한 결합을 포함한다. 올리고 d(T) 캅퓨 프로브의 길이는 20 내지 50nt 사이이다. 또한 결찰 또는 태그화를 사용하여 Illumina 시퀀싱용 어댑터를 폴리뉴클레오티드 상으로 도입하고 표면 또는 매트릭스 상의 상보적 서열로 포획하는 것을 포함한다. 이것은 사용자가 잘-확립된 Illumina 프로토콜을 사용하여 샘플을 준비할 수 있게 하여, 이는 그 다음 본 발명의 방법에 의해 포획되고 시퀀싱된다. 바람직하게는, 폴리뉴클레오티드는 오류 및 바이어스를 도입하는 경향이 있는, 증폭 전에 포획된다.
일부 실시형태에서, 무세포 DNA 또는 microRNA와 같은 짧은(~ <300nt) 또는 mRNA와 같은 비교적 짧은(<10,000nt) 폴리뉴클레오티드는 적절한 포획 분자를 사용하여 변형되거나 비-변형된 말단을 포획함에 의해 표면 상에 무작위로 이동억제된다. 폴리 A 꼬리를 수반하는 천연 mRNA는 표면 상의 올리고 d(T) 프로브 잔디 상에서 포획될 수 있다. 그런 다음 시퀀싱은 표면에서 "수직으로" 수행된다. 일부 실시형태에서, 짧거나 비교적 짧은 폴리뉴클레오티드는 표면과 다중 상호작용을 하고 시퀀싱은 "수평으로" 수행되며; 이것은 스플라이싱 이소폼의 조직이 분해되도록 허용하고, 예를 들어 일부 이소폼에서 반복되거나 셔플링되는 엑손의 장소가 묘사될 수 있다.
일부 실시형태에서, 폴리뉴클레오티드는 포획 프로브의 정렬된 어레이 상에 포획된다. 정렬된 어레이는 공간적으로 어드레스할 수 있는 어레이이다. 정렬된 어레이는 DNA 오리가미(Rothemund, Science) 접근방식을 사용하여 형성될 수 있는 것과 같은 분자 나노구조 어레이의 형태를 취할 수 있다. 정렬된 어레이는 DNA의 자가-어셈블리에 의해 형성될 수 있는 것과 같은 2D 분자 격자의 형태를 취할 수 있다(Woo 및 Rothemund, Nature Communications, 5: 4889). 정렬된 어레이는 시야당 더 높은 밀도의 분자(고밀도 어레이)를 허용하는 분자의 효율적인 하위-회절 패킹을 가능하게 하며; 발명의 단일 분자 국지화 방법은 고밀도 어레이(예를 들어, 40nm 점 대 점 거리) 내의 분자가 분해되도록 허용한다.
폴리뉴클레오티드 복구
폴리뉴클레오티드는 추출, 저장 또는 준비 중에 손상될 수 있다. 닉 및 부가물은 천연 이중 가닥 게놈 DNA 분자에서 형성될 수 있다. 이는 샘플 폴리뉴클레오티드가 FFPE 물질로부터 유래된 경우에 특히 그렇다. DNA가 이동억제화되기 전이나 후에 DNA 복구 용액이 도입된다. 이것은 겔 플러그에서 DNA 추출 후에 실행될 수 있다. 이러한 복구 용액은 DNA 엔도뉴클레아제, 키나아제 및 기타 DNA 변형 효소를 함유할 수 있다. 이러한 복구 용액은 폴리머라제 및 리가제를 포함할 수 있다. 이러한 복구 용액은 New England Biolabs로부터의 pre-PCR 키트이다. 다음 참고문헌은 그 전체가 본 명세서에 포함된다: Karimi-Busheri 외, Nucleic Acids Res. 1998 Oct 1;26(19):4395-400; 및 Kunkel 외 (1981) Proc. Natl Acad Sci. USA, 78, 6734-6738.
폴리뉴클레오티드 염색
선택적으로, 일부 실시형태의 경우, 폴리뉴클레오티드 DNA의 백본을 추적하기 위해 염색 및 기타 폴리뉴클레오티드 결합 시약이 사용될 수 있다. 개재하는 염료, 주요 홈 결합제, 표지된 비-특이적 DNA 결합 단백질 양이온성 접합된 중합체는 DNA에 결합될 수 있다. 개재하는 염료는 다양한 핵염기 대 염료 비율로 사용될 수 있다. 염료 대 염기 쌍 비율이 약 1:5-10인 다중 개재하는 염료 공여체의 사용은 성장하는 DNA 가닥을 따라 뉴클레오티드 추가를 위한 공여자로 역할을 하기에 충분한 염료 분자(예를 들어, Sybr Green 1, Sytox Green, YOYO-1)로 DNA를 표지할 수 있다. 일부 DNA 결합 시약은 폴리뉴클레오티드를 실질적으로 커버할 수 있다. 이들 DNA 염색은 또한 동종 또는 실시간 시퀀싱에서 FRET 파트너로 역할을 할 수 있다. YOYO-1과 같은 개재하는 염료가 추가되면 DNA를 어둠 속에 유지하고 BME와 같은 시약을 추가하여 DNA 닉킹을 방지하는 것이 도움이 된다. 일부 실시형태에서, 폴리뉴클레오티드는 사전-염색되지 않지만, 염색은 변성된 DNA에 대한 결합 과정 동안 추가된다. 폴리뉴클레오티드-올리고 듀플렉스가 형성되면 염료가 개재될 수 있고 프로브 상에 표지 없이 그 지점에서 형광이 검출된다. 일부 실시형태에서, 프로브, FRET 파트너 상에 표지가 있고 표지와 개재자 염료 사이에 FRET 상호작용이 있다.
일부 실시형태에서, 결합 프로브는 결합 프로브 사이의 듀플렉스가 형성될 때 개재되는 개재자 염료와 같은 FRET 공여체를 통해 여기될 수 있다. 몇 나노미터의 분해능을 얻는 것이 가능하다(예를 들어, Chemphyschem. 2014 Aug 25;15(12):2431-5에 기술된 바와 같음).
단일 분자 국지화를 사용하여 연장된 DNA를 따라 시퀀싱
일시적인 결합 개념은 반응 조건하에서 일시적으로 결합할 수 있는 한 다양한 유형의 결합 프로브로 확장될 수 있다. 결합 프로브는 다른 특질의 표지, 예를 들어, 다른 파장 방출을 갖는 형광단으로 표지될 수 있다.
일부 실시형태에서, 형광으로 변형된 DNA 올리고는 Biosynthesis에서 구입한다. 스트렙타비딘은 Invitrogen(카탈로그 번호: S-888)에서 구입한다. 소 혈청 알부민(BSA) 및 BSA-비오틴은 Sigma Aldrich(카탈로그 번호: A8549)에서 얻는다. 유리 슬라이드 및 커버슬립은 VWR에서 구입한다. 3개 완충액이 샘플 준비 및 이미징를 위해 사용된다: 완충액 A(10mM Tris-HCl, 100mM NaCl, 0.05% 트윈-20, pH 7.5), 완충액 B(5mM Tris-HCl, 10mM MgCl2, 1mM EDTA, 0.05% 트윈-20, pH 8) 및 완충액 C(1×인산염 완충 식염수, 500mM NaCl, pH 8).
일부 실시형태에서, 형광 이미징은 도립된 Nikon Eclipse Ti 현미경(Nikon Instruments)에서 퍼펙트 포커스 시스템을 사용하여, 오일 침지 대물렌즈(CFI Apo TIRF 100×, NA 1.49, 오일)를 갖는 Nikon TIRF 조명기를 사용하여 대물-유형 TIRF 구성을 적용하여 수행된다. 2D 이미징의 경우 107nm의 픽셀 크기에 상응하는 ?150-배의 최종 배율을 얻기 위해 추가 1.5 배율이 사용된다. 여기를 위해 3개 레이저가 사용된다: 488nm(200mW, Coherent Sapphire), 561nm(200mW, Coherent Sapphire) 및 647nm(300mW, MBP Communications). 레이저 빔은 클린업 필터(ZT488/10, ZET561/10 및 ZET640/20, Chroma Technology)를 통과하고 다중-대역 빔 스플리터(ZT488rdc/ZT561rdc/ZT640rdc, Chroma Technology)를 사용하여 현미경 대물렌즈에 결합된다. 형광 광은 방출 필터(ET525/50m, ET600/50m 및 ET700/75m, Chroma Technology)로 스펙트럼으로 필터링되고 EMCCD 카메라(iXon X3 DU-897, Andor Technologies)에서 이미지화된다.
일부 실시형태에서, 샘플 준비를 위해, 커버슬립(No. 1.5, 18×18 mm2, ?0.17mm 두께) 및 유리 슬라이드(3×1 인치2, 1mm 두께)가 양면 테이프의 2개 스트립에 의해 함께 샌드위치되어 ~20μL의 내부 부피를 갖는 유동 챔버를 형성한다. 먼저, 20μL의 비오틴-표지된 소 알부민(1mg/ml, 완충액 A에 용해됨)을 챔버 안으로 흐르게 하고 2분 동안 인큐베이션한다. 그런 다음 챔버를 40μL의 완충액 A를 사용하여 세정한다. 20μL의 스트렙타비딘(0.5mg/ml, 완충액 A에 용해됨)을 챔버를 통해 흐르게 하고 2분 동안 결합되도록 한다. 40μL의 완충액 A로 그리고 이어서 40μL의 완충액 B로 세정한 후, 완충액 B 내 20μL의 비오틴-표지된 DNA 올리고 주형과 프라이머(~300pM 단량체 농도) 및 DNA 오리가미 드리프트 마커(~100pM)를 최종적으로 챔버 안으로 흐르게 하고 5분 동안 인큐베이션했다.
이상적으로, 온도 및 올리고 서열은 혼입에 적합한 염 농도가 구현될 수 있도록 선택된다. CCD 판독 대역폭은 16비트 및 5.1 사전-증폭 이득에서 1MHz로 설정된다. 이미징은 561nm에서 294W/cm2의 여기 강도로 TIR 조명을 사용하여 수행된다.
더 빠른 이미징을 가능하게 하는 더 빠른 CMOS 카메라가 이용가능해지고 있으며, 예를 들어 Andor Zyla Plus는 USB 3.0 연결만으로 512x1024에 걸쳐 최대 398fps를 허용하고 관심있는 영역(ROI) 또는 CameraLink 연결에 걸쳐서는 더 빠르다. 따라서, 더 짧은 도킹/이미저 가닥으로 작동하거나 더 높은 온도 또는 더 낮은 염 농도에서 작동하면 짧은 기간 안에 필요한 분해능에 대해 충분한 정보를 수집할 수 있다; 이를 위해 레이저 전력은 바람직하게는 예를 들어 500mW로 높으며; 카메라 양자 수율은 바람직하게는 ~80%로 높고 염료 밝기는 바람직하게는 높다. 이를 통해 필요한 획득 시간을 수 초로 줄일 수 있다. 그러나 이것은 회절 한계 방법보다 >10배의 분해능 이득을 제공할 수 있다.
발명의 일 실시형태에서 CCD 또는 CMOS 카메라로 시간-지연된 통합을 사용하여 새로운 이미징의 방법이 구현되며, 여기서 샘플 스테이지는 잠정적인 분해능이 많은 픽셀에 걸쳐 확산되도록 카메라 판독-값과 동기화하여 변환된다. 이것은 표면 상의 한 장소에서 다른 장소로 이동하는 데 지연이 없으므로 이미지 획득 속도를 높인다. 결과적으로 컬럼에서 처음 1000픽셀은 한 장소의 10초 이미징을 나타내고 다음 1000픽셀은 다음 장소의 10초 이미징을 나타내는 것인 이미징 스트립이다. Appl Opt. 54:8632-6(2015)에 기술된 방법도 적용될 수 있다.
광산란 나노입자(예를 들어, 금 나노입자) 또는 반도체 나노결정이 사용되는 경우, 이들 입자의 더 밝고 거의 완전하지 않은 광학 응답때문에 속도가 실질적으로 추가로 향상된다. 다시 말하지만, 이러한 나노입자 표지를 사용할 때 최대 속도 향상을 얻기 위해 카메라 프레임 속도와 이미저 온/오프 속도가 조정될 필요가 있다.
일시적인 결합 접근방식 중 하나는 광탈색 또는 어두운 상태의 영향이 거의 없다는 것이고 조명을 제한하기 위해 정교한 필드 스톱 또는 포웰 렌즈가 필요하지 않는다는 것이다. 부가하여, 표면에 대한 비-특이적 결합의 효과는 비-특이적 부위에 대한 프로브 결합의 비-지속성이 지속되지 않고 일단 하나의 이미저가 비-특이적(즉, 표적 도킹 상에 있지 않음) 결합 부위를 점유함에 의해 완화되어 탈색될 수 있지만 그 장소에 대한 추가 결합을 차단하는 제자리에 남아 있다. 전형적으로, 표적 폴리뉴클레오티드에 대한 이미저 결합의 분해능을 방지하는 대부분의 비-특이적 결합 부위는 이미징의 초기 단계 내에서 점유되고 탈색되어, 폴리뉴클레오티드 부위에 대한 이미저에 대한 온/오프 결합이 이후에 쉽게 관찰되도록 남겨진다. 따라서 일 실시형태에서, 초기에 온-특이적 결합 부위를 차지하는 프로브를 탈색하기 위해 높은 레이저 출력이 사용되며, 선택적으로 이 단계 동안 이미지가 촬영되지 않고, 그 다음 레이저 출력이 선택적으로 감소되고 폴리뉴클레오티드에 대한 온-오프 결합을 포획하기 위해 이미징이 시작된다. 초기에 비-특이적 결합 후, 추가 비-특이적 결합은 덜 빈번하고(탈색된 프로브가 비-특이적 결합 부위에 달라붙은 채로 남아 있을 수 있기 때문임) 역치를 적용함에 의해, 예를 들어 도킹 부위에 대한 특이적 결합으로 간주되도록, 계산적으로 필터링될 수 있으며, 동일한 장소에 대한 결합은 지속적이어야 하며, 즉 동일한 부위에서 적어도 5회 또는 보다 바람직하게는 적어도 10회 발생해야 한다. 전형적으로 도킹 부위에 대한 대략 20번 특정 결합 이벤트가 검출된다.
본 발명자의 목적에 대해 비-특이적인 결합을 필터링하는 또 다른 수단은 신호가 선형 가닥을 염색하거나 다른 지속적인 결합 부위를 통해 선을 추적함에 의해 수행될 수 있는 표면 상에 신장된 선형 가닥과 상관관계가 있어야 한다는 것이다. 지속적이든 아니든 선을 따라 떨어지지 않는 신호는 폐기될 수 있다. 유사하게, 초분자 격자가 사용될 때 격자의 구조와 상관되지 않는 결합 이벤트는 폐기될 수 있다.
표면 상의 단일 세포 단리 및 DNA와 RNA 둘 모두 추출
폴리(L)리신(PLL)과 같은 양전하를 갖는 표면(예를 들어, Microsurfaces Inc.로부터 이용가능하거나 사내 코팅됨)은 세포막에 결합할 수 있는 것으로 알려져 있다. 낮은 높이(<30미크론)의 유로 높이가 사용될 것이어서 세포가 표면과 충돌할 가능성이 높아진다; 이는 난류가 도입될 유동 셀 천장에 헤링본 패턴을 사용하여 향상될 수 있다. 세포 부착은 세포가 표면 상에 낮은 밀도로 접종되어야 하므로 세포 사이에 충분한 공간이 있어 각 개별 세포에서 추출된 RNA와 DNA가 공간적으로 분리된 상태를 유지하도록 해야 하기 때문에 효율적일 필요가 없다. 단백질가수분해효소 처리를 사용하여 세포를 파열시켜 세포와 핵막 둘 모두가 분쇄되어 세포 내용물이 배지 안에 분출되고 단리된 세포의 주변에 표면에서 포획된다. 게놈 DNA의 경우 잘-확립된 세포유전학 기술 Fiber FISH에서 이 접근방식이 우선한다. 일단 이동억제화되면 DNA와 RNA는 신장될 수 있다. 신장 완충액은 커버글라스 표면을 가로질러 단방향으로 유동할 것이어서 DNA 및 RNA 폴리뉴클레오티드가 유체 흐름의 방향으로 신장하고 정렬하도록 유도한다. 온도, 신장 완충액의 조성 및 유동의 물리적인 힘으로 대부분의 RNA 2차/3차 구조가 제거될 수 있어 RNA가 항체에 대한 결합에 이용가능하다. RNA가 신장되면, 변성된 형태로 변성 완충액에서 결합 완충액으로 전환할 수 있다.
대안적으로, RNA는 먼저 세포막을 분쇄하고 한 방향으로의 유동을 유도함에 의해 추출되고 이동억제된다. 핵막은 다음에 단백질가수분해효소를 이용함에 의해 분쇄되고 반대 방향으로 유동이 유도된다. 일부 실시형태에서, DNA는 예를 들어 희귀-절단 제한 효소(예를 들어, NOT1, PMME1)를 사용하여 방출 전 또는 후에 단편화된다. 이 단편화는 DNA를 분리하는 데 도움이 되며 개별 가닥을 단리하고 다듬을 수 있다. 이동억제된 세포가 각 세포에서 추출된 RNA와 DNA가 함께-섞이지 않도록 충분히 멀리 떨어져 있도록 시스템 I을 설정하는 것이 보장된다. 이것은 세포의 파열 전, 후 또는 동안 액체에서 겔로 전이를 유도함에 의해 도움을 받을 수 있다.
RNA 신장
하전된 표면 상에 핵산의 신장은 용액 양이온 농도에 의해 영향을 받는다. 낮은 염 농도에서, 단일 가닥이 되고 그 백본을 따라 음전하를 띠는 RNA는 그 길이를 따라 무작위로 표면에 결합할 가능성이 높다.
이에 대한 한 가지 접근방식은 초기에 고염을 사용하여 그 구형 형태를 촉진하는 것이며, 이러한 경우에 말단, 특히 폴리 A 꼬리는 상호작용에 더 접근가능하다. 구형 형태로 결합되면 변성 완충액로 되는 다른 완충액이 유동 셀 안으로 적용될 수 있다. 대안적으로, 본 발명자들은 PLL을 올리고 d(T)로 사전-코팅하여 mRNA의 폴리 A 꼬리를 포획할 수 있는 옵션을 갖는다 다중 그룹은 mRNA의 폴리아데닐화된 3'에 대한 올리고(dT) 결합을 사용하여 표면에 mRNA의 결합을 입증했다(예를 들어, Ozsolak F, 외)[4]. 단독중합체 특성 폴리 A 꼬리는 그렇지 않으면 포획을 방해할 수 있는 2차 구조가 상대적으로 없어야 하는 영역임을 의미한다. 폴리 A 꼬리가 고등 진핵생물에서 상대적으로 길기 때문에(250-3000nt) 긴 올리고 d(T) 포획 프로브는 혼성화가 RNA에서 분자내 염기 쌍화의 상당한 분획을 용융하기에 충분한 상대적으로 높은 엄격성(온도, 염 조건)에서 수행될 수 있도록 설계될 수 있다. 올리고 d(T)는 결합의 안정성을 증가시키는 변형으로 테스트될 것이고, 결합 후 RNA를 포획 프로브에 고정하기 위해 가교하는 변형으로 테스트될 수 있다. 결합 후, RNA 구조의 나머지를 구형에서 선형 상태로 전환하는 것은 포획을 중단하기에 충분하지 않지만 RNA에서 그리고 유체 흐름 또는 전기영동력에 의해 분자내 염기-쌍화를 방해할 수 있는 변성 조건을 사용하여 수행될 수 있다.
시퀀싱 기기사용 및 장치
본 발명의 시퀀싱 방법은 공통의 기기사용 요건을 갖는다. 기본적으로 기기는 이미징 및 시약 교환이 가능해야 한다. 이미징 요건은 대물 렌즈, 중계 렌즈, 빔-스플리터, 거울, 필터 및 카메라 또는 점 검출기인 군에서 하나 이상을 포함한다. 카메라는 CCD 또는 어레이 CMOS 검출기를 포함한다. 점 검출기는 광전자증배관(PMT) 또는 애벌란시 광다이오드(APD)를 포함한다. 일부 세사에서 고속 카메라가 사용된다. 방법의 형식에 따라 다른 선택적 양태, 조명원(예를 들어, 램프, LED 또는 레이저) 및 기판 상에 조명을 결합하는 수단, 예를 들어, 프리즘, 격자, 졸-겔, 렌즈, 전환가능한 스테이지 또는 전환가능한 대물렌즈, 이미저와 관련하여 샘플 이동, 샘플 혼합/교반, 온도 제어 및 전기.
발명의 단일 분자 구현을 위해 조명은 바람직하게는 소멸파의 생성을 통해, 예를 들어 프리즘-기반 전반사, 대물렌즈-기반 전반사, 격자-기반 도파관, 하이드로겔 기반 도파관 또는 레이저 광을 적절한 각도로 기판의 가장자리로 가져와 생성된 소멸 도파관을 통해 되며; 도파관은 코어층 및 제1 클래딩층을 포함할 수 있다. 조명은 대안적으로 고도로 경사진 적층 광학(HILO) 조명 또는 광 시트를 포함할 수 있다. 일부 단일 분자 기기에서 광 산란의 효과는 펄스 조명과 시간-게이팅된 검출의 동기화를 사용하여 완화되며; 여기서 빛 산란이 차단된다. 일부 실시형태에서 암시야 조명이 사용된다. 일부에서 기기는 형광 수명 측정을 위해 설정된다.
일부 실시형태에서, 기기는 또한 세포, 핵, 소기관, 염색체 등으로부터 폴리뉴클레오티드의 추출을 위한 수단을 함유한다.
발명의 대부분의 실시형태에 적합한 기기는 Illumina로부터의 Genome Analyzer IIx이며; 이 기기는 프리즘-기반 TIR, 20x Dry Objective, 광 스크램블러, 532nm 및 660nm 레이저, 적외선 레이저 기반 포커싱 시스템, 방출 필터 휠, Photometrix CoolSnap CCD 카메라, 온도 제어 및 시약 교환을 위한 주사기 펌프-기반 시스템을 포함한다. 대안적인 카메라 조합으로 이 기기의 수정은 더 나은 단일 분자 시퀀싱을 가능하게 할 수 있다. 예를 들어, 센서는 바람직하게는 낮은 전자 노이즈, <2 e를 갖는다. 또한 센서는 많은 수의 픽셀을 가진다. 주사기-펌프 기반 시약 교환 시스템은 압력-구동 흐름에 기반한 것에 의해 대체될 수도 있다. 시스템은 호환되는 Illumina 유동 셀 또는 기기의 실제 또는 변형된 배관에 맞게 조정된 맞춤형-유동 셀과 함께 사용될 수 있다.
대안적으로, 레이저 베드(표지의 선택에 의존한 레이저) 또는 게놈 분석기로부터 레이저 시스템 및 광 스크램블러와 결합된 전동화된 Nikon Ti-E 현미경, EM CCD 카메라(예를 들어, Hamamatsu ImageEM) 또는 과학적 CMOS(예를 들어, Hamamatsu Orca FLASH) 및 선택적으로 온도 제어가 사용될 수 있다. 일부 실시형태에서, 과학적보다는 소비자 센서가 사용된다. 이것은 시퀀싱 비용을 극적으로 줄일 수 있는 가능성이 있다. 이것은 압력 구동식 또는 주사기 펌프 시스템 및 특별히 설계된 유동 셀과 결합된다. 유동 셀은 유리나 플라스틱으로 제작될 수 있으며 각각 장단점이 있다. 순환 올레핀 공중합체(COC), 예를 들어, TOPAS, 기타 플라스틱 또는 PDMS 또는 미세가공 방법을 사용하는 실리콘 또는 유리 내. 열가소성물질의 사출 성형은 산업적 규모 제조에 저렴한 라우터를 제공한다. 일부 광학적 구성에서 열가소성물질은 최소의 고유한 형광과 함께 우수한 광학 특성을 가질 필요가 있다. 방향족 또는 공액 시스템을 함유하는 것을 배제하는 중합체는 상당한 고유 형광을 가질 것으로 예상되므로 이상적으로 제외해야 한다. Zeonor 1060R, Topas 5013, PMMA-VSUVT(US 8057852 B2)는 녹색 및 적색 파장 범위(예를 들어, Cy3 및 Cy5)에서 합리적인 광학 특성을 갖는 것으로 보고되었으며, Zeonar 1060R이 가장 적합하다. 이러한 표면 중 일부에 프로브를 공유적으로 결합하는 방법이 이용가능하다. 열가소성물질의 결합하는 방법이 보고되었다(예를 들어, Microfluidics and Nanofluidics, 19(4), 913-922). 일부 실시형태에서, 생체고분자가 그 위에 부착된 유리 커버 유리는 열가소성 유체 구조에 결합된다. 유리는 우수한 광학적 특성뿐만 아니라 여러 다른 장점을 가지고 있지만 현재 이용가능한 옵션이 있지만 복잡한 마이크로유체 장치를 저렴한 비용으로 생산하기가 어려웠다(Scientific Reports 5: 13276(2015)).
대안적으로, 수동으로 작동되는 유동 셀은 현미경 상단에서 사용될 수 있다. 이것은 양면 점착 시트를 사용하여 유동 셀을 만들고 적절한 치수의 채널을 갖도록 레이저 절단하고 커버슬립과 유리 슬라이드 사이에 끼워서 쉽게 구성할 수 있다.
한 시약 교환 주기에서 다른 주기로 유동 셀은 프레임에서 프레임으로 등록하기 위해 기기/현미경 상에 남아 있을 수 있다. 리니어 인코더가 있는 전동화된 스테이지를 사용하여 넓은 영역을 이미징하는 동안 스테이지가 변환될 때 동일한 장소를 올바르게 다시 방문할 수 있도록 보장하며; 망선상 기준점 표시를 사용하여 올바른 등록을 확인할 수 있다. 대안적으로, 유동 셀을 각 이미징 라운드 후에 기기/현미경으로부터 제거하고 통합 반응을 다른 곳, 예를 들어, 평평한 블록이 있는 열순환기 상에서 수행하고 그 후 이미징의 다음 라운드를 위해 현미경으로 복귀된다(용어 이미징은 2-D 어레이 또는 2D 스캐닝 검출기를 포함하도록 사용된다). 이 경우에, 광학적으로 검출될 수 있는 유동 셀 또는 유동 셀 내의 표면 이동억제된 비드 내 에칭과 같은 망선상 기준점 표시를 갖는 것이 중요하다. 폴리뉴클레오티드 백본이 (예를 들어, YOYO-1에 의해) 염색된 경우 그의 고정된 위치 분포 장소를 사용하여 한 프레임에서 다음 프레임으로 이미지를 정렬할 수 있다.
일 실시형태에서, 레이저 또는 LED 조명을 사용하는 US 7175811 또는 Ramachandran 등(Scientific Reports 3:2133)에 기술된 조명 기전은 본 발명의 방법을 수행하기 위해 선택적인 온도 제어 기전 및 시약 교환 시스템과 결합될 수 있다. 일부 실시형태에서, 스마트폰 기반 이미징 설정(ACS Nano 7:9147)은 선택적인 온도 제어 모듈 및 시약 교환 시스템과 결합될 수 있으며; 주로 전화 상의 카메라가 사용되지만 iPhone의 조명 및 진동 기능과 같은 다른 양태도 또한 사용될 수 있다.
GAIIx와 같은 광학 시퀀싱 시스템의 다양한 현미경-유사 구성요소를 사용하는 대신, 시퀀싱을 위해 더 통합된 모놀리식 장치를 구성할 수 있다. 여기서 폴리뉴클레오티드는 센서 어레이 또는 센서 어레이에 인접한 기판 상에 직접적으로 부착되고 선택적으로 연장된다. 센서 어레이에 대한 직접 검출은 어레이에 대한 DNA 혼성화에 대해 입증되었다(Lamture 외 Nucleic Acid Research 22:2121-2125(1994)). 센서는 형광 염료로부터 방출에 비해 수명이 짧은 레이라이트 산란으로 인해 배경 형광을 감소시키기 위해 시간 게이팅될 수 있다.
일 실시형태에서, 센서는 CMOS 검출기이다. 일부 실시형태에서, 다중 색상이 검출된다(US20090194799). 일부 실시형태에서, 검출기는 포베온 검출기이다(예를 들어, US6727521). 센서 어레이는 삼중-접합 다이오드의 어레이일 수 있다(US9105537). 일부 실시형태에서, 올리고 또는 다른 결합 시약 상의 상이한 표지는 방출의 파장에 의해 코딩된다. 일부 실시형태에서, 상이한 표지는 형광 수명에 의해 코딩된다. 일부 실시형태에서, 상이한 표지는 형광 편광에 의해 코딩된다. 일부 실시형태에서, 상이한 표지는 파장, 형광 수명의 조합에 의해 코딩된다.
단일 파장을 광원으로 사용하고 필터를 사용할 필요가 없는 것은 설정의 단순성과 필터를 사용할 때 불가피하게 약간의 광 손실이 있기 때문에 유리하다. 일부 실시형태에서, 상이한 표지는 반복적인 온-오프 혼성화 동역학에 의해 코딩되며; 상이한 결합-해리 상수를 가진 상이한 결합 프로브가 사용된다. 일부 실시형태에서, 프로브는 형광 강도에 의해 코딩된다. 프로브는 서로 다른 수의 비-자기 소광 형광체가 부착되어 코딩된 형광 강도일 수 있다. 개별 형광단은 전형적으로 소광되지 않도록 잘 분리되어야 하고 적절한 거리에서 제자리에 유지되는 단단한 링커 또는 DNA 나노구조가 이를 달성하는 좋은 방법이다. 형광 강도에 의한 코딩을 위한 한 가지 대안적인 실시형태는 유사한 방출 스펙트럼을 갖지만 그 양자 수율 또는 기타 측정가능한 광학 특성이 다른 염료 변이체를 사용하는 것이며, 예를 들어 Cy3B (558/572)는 Cy3 (550/570)(양자 수율 0.15)보다 실질적으로 더 밝지만(양자 수율 0.67) 그러나 유사한 흡수/방출 스펙트럼을 가진다. 532nm 레이저를 사용하여 두 염료 모두를 여기시킬 수 있다. 사용할 수 있는 다른 염료는 Cy3.5(591/604)를 포함하며 이는 여기 및 방출 스펙트럼은 위로 전이하면서 그럼에도 불구하고 532nm 레이저에 의해 여기될 것이고 그러나 비록 둘 모두는 비슷한 양자 수율을 가지지만 Cy3.5가 차선의 파장에 의해 여기되기 때문에, cy3에서 방출을 선택하도록 설계된 대역통과 필터에서 덜 밝게 나타날 것이다. Atto 532(532/553)는 0.9의 양자 수율을 가지고 532nm 레이저가 그 스위트 스팟에 닿을 때 밝게 될 것으로 예상된다. 이들 기대에도 불구하고 사용되는 염료는 그 성능을 적절하게 측정하기 위해 경험적으로 테스트되어야 하며; 앞서 언급된 세트로부터 염료를 구별할 수 없는 경우 다른 염료가 테스트될 수 있다. 단일 여기 파장을 사용하여 다중 코드를 얻는 또 다른 접근방식은 염료의 방출 수명을 측정하는 것이다. 이를 위해 Alexa Fluor 546, Cy3B, Alexa Fluor 555 및 Alexa Fluor 555를 포함하는 세트뿐만 아니라 많은 기타 조합이 사용될 수 있다. 일부 실시형태에서, 코드의 레퍼토리는 FRET 쌍을 사용하고 또한 방출된 광의 편광을 측정함에 의해 확장될 수 있다. 따라서 파장, 수명, 편광 및 FRET 쌍의 조합으로 구별가능한 표지의 큰 레퍼토리를 만들 수 있다. 표지 수를 증가시키는 또 다른 수단은 다중 색상으로 코딩하는 것이다.
현재의 광학 시퀀싱 방법은 서열 신호가 이미지로부터 추출되는 이미지 처리 단계를 필요로 한다. 이것은 일반적으로 이미지의 각 프레임에서 관련 신호를 추출하는 것을 포함한다. 일 실시형태에서, 대안은 모든 주기를 통해 수직으로 모든 픽셀로부터 신호를 포획하는 것이고 알고리즘을 사용하여 서열을 계산하는 것이다. 이 접근방식의 한 가지 이점은 신호의 궤적을 주기를 통해 수직으로 관찰할 때 비-특이적 또는 배경 신호를 필터링하여 제거하기 쉽고 일반적으로 주기를 통해 동일한 장소에서 발생하지 않는 반면 실제 통합이 발생한다. 또한 일련의 픽셀을 통해 직선으로 추적될 수 있으므로 어떤 신호가 특정 연장된 분자에 속하는지를 결정하는 것이 쉽다.
지질 부동태화
나노유체 채널의 표면 상에 지질 이중층(LBL)을 생성하기 위해 본 발명자들은 형광 현미경으로 LBL 형성의 관찰을 가능하도록 추가된 트리에틸암모늄 염(로다민-DHPE) 지질인, 1% Lissamine™ 로다민 B 1,2-디헥사데카노일-sn-글리세로-3-포스포에탄올아민을 갖는 쯔비터이온성 POPC(1-팔미토일-2-올레오일-sn-글리세로-3-포스포콜린) 지질을 사용했다. 각 코팅 절차 이전에 대략 70nm 직경의 지질 소포가 압출에 의해 생성되었다(ESI 참조). 압출된 소포 용액은 유체 시스템의 마이크로채널 중 하나를 통해 플러싱되었다. 이어서, 지질 소포는 표면 상에 정착되고 파열되고 몇 분 이내에 연속 LBL에 연결되는 LBL의 패치를 형성하여 전체 마이크로채널을 코팅한다. LBL은 이어서 나노채널 안으로 자발적으로 확산되도록 허용되며 지질 소포의 흐름은 코팅된 마이크로채널에서 지속되어 소포의 꾸준한 공급을 보장한다. 코팅 과정 동안 나노채널을 통한 역류(~80μm/s)가 코팅된 마이크로채널 안으로 부과되어 나노채널에서 임의의 파편이나 소포를 회피한다. 대안적인 약간 더 빠른 방법이 또한 나노채널 내부에 지질 소포의 침착 및 파열을 초래하는 나노채널을 통한 LBL-코팅된 마이크로채널에서 지질 소포를 플러싱하는 것과 관련하여 시험되었다. 그러나, 이 방법을 사용하면 소포 및 기타 잔류물이 침착되어 나노채널을 잠재적으로 차단하는 것을 방지하기 위해 주의를 기울여야 한다.
에피-마킹 시약 및 표지 방법
폴리뉴클레오티드 상의 게놈 또는 후생적 변형(에피-마크)은 발명의 방법을 사용하여 검출될 수 있다. 이 명세서의 초점은 게놈 DNA 상의 메틸기에 결합에 대한 것이며, 이는 인간에서 5-메틸 사이토신의 형태로 그리고 일반적으로 CpG 모티프와 관련하여 발생한다. 그러나, 동일한 원리가 다양한 종류의 DNA 손상뿐만 아니라 하이드록실 메틸 C와 같은 다른 변형에도 적용될 수 있다. RNA에 대한 변형도 유사하게 표시될 수 있다. 합성 DNA와 RNA 및 RNA 모델 예컨대 하나 이상의 유형(올리고뉴클레오티드 합성에 다양한 변형이 이용가능함)의 다른 수의 변형을 함유하는 trRNAa는 상용 공급업체(예를 들어, IDT, Trilink)로부터 얻을 수 있다. DNA의 경우 게놈 메틸 C(Diagenode 등으로부터 이용가능함), 메틸 결합 단백질 1(MBD1) 및 MBD1의 펩타이드 단편(둘 모두 Abcam으로부터의 것)에 대한 항체의 친화성 결합을 테스트하고 최적화할 수 있다. 메틸아데노신(m6A)(Abcam에서 이용가능함) 및 m7G-cap(대조군으로 사용)(SySy.com에서 이용가능함)에 대한 것과 같은 RNA 항체를 테스트하고 최적화할 수 있다. 이들 변형을 함유하는 DNA 또는 RNA에 대한 결합의 효율은 2가지 측정기준으로 측정될 수 있다. 첫째, 올리고뉴클레오티드 서열의 변형 및 비변형 버전에 대한 친화성 시약의 결합뿐만 아니라 DNA 및 RNA 버전 둘 모두에 대한 결합은 예를 들어 여과지 상의 스포팅 및 결합을 사용하여 테스트될 수 있다. 표적 변형을 함유하거나, 비-표적 변형을 함유하거나 무 변형을 함유하는 합성 올리고뉴클레오티드에 대한 각 항체의 결합 효율 및 특이성은 확립될 수 있다. 항-메틸 항체의 경우 게놈 DNA를 제자리에서 변성시키는 것이 바람직하다.
국부적 고갈 및 층류 유동의 완화 효과
프로브의 국부적 고갈은 프로브 용액의 효율적인 혼합 또는 교반이 있는지 확인함에 의해 해결될 수 있다. 이것은 음파를 사용하여, 난류를 생성하는 용액에 입자를 포함함에 의해 및/또는 유동 셀을 구조화(예를 들어, 하나 이상의 표면 상의 헤링본 패턴)하여 난류를 생성함에 의해 수행될 수 있다. 부가하여, 유동 셀에서 층류로 인해 전형적으로 혼합이 거의 없고 표면에 가까운 용액이 벌크 용액과 거의 혼합되지 않을 수 있다. 이것은 표면에 가까운 시약/결합 프로브를 제거하고 신선한 시약/프로브를 표면으로 가져오는 데 문제를 만든다. 상기 난기류 생성 접근방식은 이를 방지하기 위해 구현될 수 있고, 및/또는 표면에 걸친 광범위한 유체 흐름/교환이 수행될 수 있다. 한 가지 접근방식은 표적 분자가 배열된 후 비-형광 비드 또는 구체가 표면에 부착되어, 표면 조경에 거친 질감을 제공하여 표면에 근접한 유체를 보다 효과적으로 혼합 및/또는 교환하는 데 필요한 와동 및 유동을 생성하는 것이다.
고속 이미징
단일-분자 국지화 현미경(SMLM) 방법은 높은 광자 수에 의존한다. 높은 광자 수는 가우시안 패턴의 형광단-생성 중심을 결정할 수 있는 정밀도를 개선하지만, 높은 광자 수에 대한 필요성은 또한 긴 이미지 획득과 연관되고 밝고 광안정적인 형광단에 대한 의존성과 연관된다. 과정의 속도는 높은 프레임 검출과 증가된 프로브의 농도를 결합함에 의해 증가될 수 있다. 그러나, 표지된 프로브의 농도가 높으면 표면 상의 신호 검출이 흐릴 수 있는 높은 배경 형광을 야기할 수 있다. 이것은 표면 상에 형성된 듀플렉스를 표지하기 위해 DNA 염색이나 개재하는 염료를 사용하여 해결할 수 있다. 염료는 표적이 단일 가닥일 때 개재되지 않거나 단일 가닥 프로브로 개재되지 않지만 듀플렉스가 그들 사이에 형성될 때 개재된다. 일부 실시형태에서, 프로브는 비표지되고 검출되는 신호는 개재하는 염료에만 기인한다. 일부 실시형태에서, 프로브는 개재하는 염료 또는 DNA 염색에 대한 FRET 파트너로 작용하는 표지로 표지된다. 개재하는 염료는 공여자일 수 있고 다른 파장의 수용체와 결합할 수 있으므로 프로브가 다중 형광단으로 인코딩되도록 허용한다.
추가 예
폴리뉴클레오티드 상의 에피-마크의 장소 검출
선택적으로 올리고 결합 과정 전(또는 때때로 후 또는 동안)에 후성유전체 결합 시약의 일시적인 결합이 수행된다. 사용되는 결합 시약에 따라 결합은 변성 전 또는 후에 수행된다. 일부 실시형태에서, 항-메틸 C 항체 결합은 변성된 DNA 상에 수행되는 반면 메틸 결합 단백질의 경우 결합은 임의의 변성 단계 전에 이중 가닥 DNA 상에 수행된다.
단계 1 - 메틸-결합 시약의 일시적인 결합.
변성 후 유동 셀을 PBS-세정으로 플러싱하고 Cy3B 표지된 항-메틸 항체 3D3 클론(Diagenode)을 일시적인 단백질 결합 시약에 첨가하고 결합을 이미지화한다.
대안적으로, 변성 전에 유동 셀을 인산염 완충 식염수로 플러싱하고 Cy3B-표지된 MBD1을 첨가하고 일시적인 단백질 결합 시약에서 이미지화한다. 일시적인 올리고 결합에 대해 상기에서 기술한 바와 같이 이미징을 수행한다.
일시적인 결합 완충액은 2.8 pH에서 용출 완충액이다. 50mM HEPES(pH7.9), 0.1M NaCl, 1.5mM MgCl2, 0.05% TritonX-10을 포함하는 전형적인 용출 완충액. 일시적인 상호작용은 또한 RT에서 0.2% SDS 및 0.1% 트윈-20에서 7분 수행될 수 있다. 더욱이, DNA와의 일시적인 단백질 상호작용은 0.1M 글리신.HCl, pH 2.5-3에서 수행될 수 있으며; 이 완충액은 단백질 구조에 영구적인 영향을 미치지 않으면서 대부분의 단백질 또는 항체 결합 상호작용을 효과적으로 해리한다. 그러나, 일부 항체와 단백질은 낮은 pH에 의해 손상되므로 용출된 단백질 분획은 1M Tris.HCl, pH 8.5 또는 PBS 완충액과 같은 알칼리 완충액의 1/10 부피의 추가에 의하여 즉시 가장 잘 중화된다.
일부 실시형태에서, PBS는 결합에 사용되고 일시적인 결합이 아닌 안정한 결합이 검출되고 장소가 기록된다.
단계 2 - 메틸-결합 시약 제거
전형적으로, 에피-분석은 시퀀싱 전에 수행되며, 따라서 선택적으로 메틸-결합 시약은 시퀀싱이 개시되기 전에 폴리뉴클레오티드 전에 플러싱된다. 이것은 PBS/PBST 및/또는 고염 또는 용출 완충액 및 SDS의 여러 주기를 통한 유동 다음 제거가 발생했음을 이미징에 의해 확인함에 의하여 수행될 수 있다. 무시할 수 있는 양 이상의 결합 시약이 남아 있는 것이 명백한 경우 카오트로픽 염인, GuCL과 같은 더 가혹한 처리를 통해 유동되어 잔존하는 시약을 제거할 수 있다.
단계 3 - 데이터 상관관계
시퀀싱 및 에피-게놈 데이터를 얻은 후, 시퀀싱 결합 장소의 장소 간에 상관관계가 만들어지고 메틸화 또는 오믹 정보의 서열 상황을 제공하기 위해 에피-결합 장소가 상관된다.
RNA의 제조
폴리 A RNA는 표면에 부착된(0.1-1uM) 올리고 dT에 혼성화된다. 올리고 dT는 RNA가 올리고 dT에 가교되도록 허용하는 하나 이상의 소랄렌 잔기를 포함한다. 그런 다음 RNA가 제자리에 고정되면 RNA는 유체 흐름, 후퇴하는 메니스커스를 사용하거나 또는 ny 2차 구조를 여는 데 도움이 되는 변성 용액에서 전기영동적으로 신장된다. 일단 RNA가 신장되거나 연장되면, 본 발명의 올리고 결합 접근방식이 적용된다.
롤링 서클 증폭을 사용한 긴 ssDNA의 제조
이중 가닥 DNA 표적을 원형화한 다음 회전 원형 증폭을 수행하여 듀플렉스 가닥 중 하나의 직렬 단일 가닥 카피를 생성한다. dsDNA는 T4 DNA 중합효소 1(Roche) 및 dNTP(Promega)를 사용하여 폴리싱되며; T4 폴리뉴클레오티드 키나제는 5' 수산기를 인산화한다. 줄기-루프(8-200개 염기 루프의 dT:dA 줄기는 GGTTTTTCGCCCTTTCACGTTGGA를 포함함)는 T4 DNA 리가제를 사용하여 폴리싱된 DNA의 양 말단에 결찰된다. 프라이밍은 닉 또는 줄기-루프 내에서 결합하는 프라이머로부터 발생할 수 있다.
회전 원형 증폭은 또한 프라이머를 사용하여 원형 단일 가닥 표적 상에서 수행될 수 있으며, 예를 들어 1μL의 1nM M13mp18 템플릿(NEB)이 아래 프로토콜에서 증폭될 수 있다. 프로토콜은 또한 양 말단에 부착된 줄기 루프로 이중 가닥 DNA에 적용될 수 있다. 이 경우 10μL의 10× 반응 완충액(10× phi29 DNA 중합효소 완충액(B7020, Enzymatics, 500mMTris-HCl, 100mM (NH4)2SO4, 40mM DTT, 100mM MgCl2, pH 7.5), , 2.5μL의 100nM 프라이머(TCCAACGTCAAAGGGCGAAAAACC, IDT) 및 1.6μL의 dNTP 혼합물(Enzymatics N2050L)을 물에서 48μL의 부피로 하였다. 혼합물을 95℃에서 1분 동안, 그 다음 60℃에서 1분 동안 인큐베이션한 다음 4℃로 하였다. 혼합물을 얼음 위에 놓고 2μL의 phi29 DNA 중합효소(10U/μL, Enzymatics P7020-LC-L)를 첨가하였다. 전체 혼합물을 30℃에서 4시간 동안 인큐베이션한 다음 4℃가 되도록 450μL의 1× PBS(pH 7.4)에 희석하였다. 그 다음 회수된 용액을 PBS에서 100× 희석한다. 시퀀싱 전에 저장된 용액을 회전 원형 앰플리콘에 상보적 서열, (GGTTTTTCGCCCTTTGACGTTGGA, IDT)을 함유하는 표면에 추가하여 앰플리콘을 그 길이를 따라 다중 상호작용을 통해 이동억제화되도록 한다.
대안적으로, 단일 가닥 오버행을 갖는 이중 가닥 DNA는 MES 완충액 pH 5.5에서 오버행에서 노출된 염기와 표면 사이의 소수성 상호작용을 통해 비닐실란 표면에 부착된다. 그런 다음 완충액이 변성 완충액(0.5M - 1M NaOH)으로 교환되고 비-이동억제된 가닥이 플러싱되어질 수 있도록 다수의 세정이 수행된다. 그런 다음 커버 유리를 다시 MES에 노출시키고 DNA가 후퇴하는 메니스커스에 의해 연장된다. 유사하게, DNA의 말단은 변형될 수 있고, 예를 들어, 단독중합체 꼬리는 말단 전이효소(NEB)에 의해 추가될 수 있고, 그 다음 DNA는 상보적 단독중합체 올리고뉴클레오티드 상에 포획될 수 있다. 이중 가닥 DNA의 포획되지 않은 가닥은 열 및/또는 화학적 변성을 사용하거나 가닥을 분리하는 헬리카제(예를 들어, Hel308)와 같은 모터 단백질을 사용하여 용융될 수 있다. 이를 위해 단독중합체 꼬리는 수십에서 수백 개의 뉴클레오티드가 될 수 있으며 포획 프로브는 유사하게 길 수 있다. 대안적으로, 다른 가닥이 변성되는 동안 꼬리가 달린 가닥을 제자리에 유지하기 위해 가교 시약이 제공된다. 꼬리가 달린 DNA는 이중 나선의 두 가닥을 연결하기 위해 다른 쪽 말단에서 줄기-루프로 결찰될 수 있어 DNA가 포획될 대 DNA의 두 가닥 모두가 서열화될 수 있으며; 이 경우에 일시적인 결합 완충액은 LNA 잔기를 포함하는 일시적으로 결합하는 올리고와의 상호작용과 비교하여 (그의 재형성을 방지하고 따라서 올리고의 결합을 방해하도록) 듀플렉스의 염기쌍을 약화시키도록 구성된다.
핵산에 대한 NNNXNNN 올리고뉴클레오티드 종의 결합
NNNXNNN을 사용한 시퀀싱의 경우(여기서 N은 축퇴 위치이고 X는 지정된 위치임), 각각의 4개 올리고뉴클레오티드 라이브러리 5' NNNANNN 3', 5' NNNCNNN 3', 5' NNNGNNN 3' 및 5' NNNANNN3'은 Atto488, Atto 542, Alexa 594, 및 Atto 655로 각각 다르게 표지되고 2.4-3.5M TMACl 또는 4X SSC 및 0.01-0.1% 트윈 20을 포함하는 15ul 액적으로 조합되고, 각각의 농도는 100nM에서 1uM이고, 핵산 분자가 연장되거나 신장되는 표면에 적용된다. 커버글라스는 에폭시, 카우 검 또는 네일 바니시를 사용하여 유리 슬라이드에 밀봉된다. 커버글라스를 Olympus 1X81 도립 현미경 상의 현미경 IX2 Nosepiece 스테이지 상으로 위치되고 4개의 결합된 레이저 라인(Agilent), 488nm, 532nm, 590 및 640nm를 사용하여 쿼드-밴드 TIRF 필터 큐브(Chroma) 및 1.45NA 올림푸스 TIRF 대물 렌즈를 통해 샘플을 동시적으로 조명한다. 선택적으로 섬유 광 스크램블러(Point Source)는 빔을 균질화하는 데 사용된다. 레이저 출력은 40 내지 150mW 사이의 각 파장에 대해 조정되어 동일한 신호 밝기를 제공한다. TIRF 각도가 또한 조정되어 각각의 조명 채널에 대해 최상의 대비 이미지를 제공한다. 방출은 95B Scientific CMOS 카메라(Photometrics) 상으로 투사되기 전에 Quad-view 장치(Photometrics)의 4개 사분면 상으로 분할된다. 대안적으로 방출 파장 4개의 4가지 염료가 일련의 이색성 및 반사 미러를 사용하여 다중 카메라 상으로 분할된다. 카메라 설정은 레이저 출력과 함께 조정되어 각 염료에 대해 거의 동일한 신호 강도를 얻는다; 그러나 수집된 결합 정보는 디지털이므로 4가지 염료로부터의 신호는 밝기가 정확히 동일할 필요는 없다. 각 신호의 정체성은 Quad-view 사분면 또는 다중 카메라의 서로 다른 방출 채널에 있는 각각의 염료의 방출 프로필을 고려하여 소프트웨어에 의해 결정된다. 이전에 결정된 방출 프로필은 그 다음 염료의 정체성을 결정하는 데 사용될 수 있다.
선택적으로, 1nM YOYO-1 또는 유사한 개재하는 염료가 또한 반응 혼합물에 추가되고 높은 카메라 프레임 속도와 결합된 높은 농도, 최대 1uM의 올리고가 사용된다. 여기서는 단일 488nm 레이저만 FRET 기전을 통해 4가지 염료를 여기하는 데 사용된다.
선택적으로, DNA PAINT 이미저와 함께 1uM DNA 오리가미 격자도 기점 마커로 15ul 혼합물의 일부로 추가된다.
이미징 데이터는 초-분해능 이미지 처리 패키지, 예를 들어 ImageJ/Fiji 또는 Picasso 안으로 플러그인 Thunderstorm을 사용하여 처리된다(J. Schnitzbauer*, M.T. Strauss*, T. Schlichthaerle, F. Schueder, R. Jungmann Super-Resolution Microscopy with DNA-PAINT. Nature Protocols (2017). 12: 1198-1228 DOI: https://doi.org/10.1038/nprot.2017.024).
그런 다음 초-분해능 이미지를 처리하여 핵산 가닥을 따라 결합 위치의 좌표를 찾고 상이한 정의된 뉴클레오티드에 상응하는 다른 색상으로부터의 데이터를 수집하여 각 핵산 가닥의 서열을 재-구성한다. 이미지 처리 및 서열 어셈블리에 대한 더 완전한 정보는 PCT 및 그 파생물에 기술되어 있다.
드리프트
최고의 국지화 정밀도(예를 들어, 수 나노미터 또는 서브-나노미터)를 얻기 위해 진동 및 드리프트(예를 들어, 열적 변동에 의해 야기됨)를 제어하는 것이 중요하다. 드리프트를 방지하기 위해 스테이지가 중지될 때 종종 잔류 움직임이 있어 몇 개 또는 수십 개의 픽셀이 드리프트되도록 하기 때문에 자동화된 스테이지를 사용해서는 안 된다. 기점 마커는 드리프트를 교정하는 데 사용할 수 있다. 형광 표지된 라텍스 입자뿐만 아니라, 금 또는 은 입자, 반도체 나노결정, 나노다이아몬드는 특히 유리한 나노입자 표지이다. 그들은 높은 양자 효율(QE)로 빛을 방출하고, 높은 광안정성, 긴 형광 수명(17ns)을 가지며, 이는 본 발명자들의 광산란/자가형광(1-2ns)을 타임 게이트하는 데 사용할 수 있고 작을 수 있다(예를 들어, 40nm).
드리프트는 또한 계산적으로 교정될 수 있다. 드리프트 교정은 각 무비의 지속시간 동안 각 마커의 위치를 추적하고 검출된 모든 마커의 궤적을 평균화하여 이미지의 드리프트를 전반적으로 교정하는 것을 포함한다. 또한 Fiji/ThunderSTORM뿐만 아니라 MatLab은 합리적으로 효과적이고 기점 마커가 필요하지 않은 고유한 드리프트 교정 알고리즘을 가지고 있지만 오히려 자기 상관관계에 의해 드리프트를 교정한다. Nikon Ti 현미경은 완전한 포커스를 가지고 Olympus는 Z 드리프트 보상 모듈(IX3-ZDC2)을 가진다. 또한 드리프트를 회피하기 위한 낮은 기술의 방법은 샘플 스테이지를 대물렌즈에 견고하게 부착하는 것이다(예를 들어, Olympus 노즈피스 스테이지). 또한 열적 환경이 잘 제어되면 드리프트는 무시할 수 있을 정도로 되고/되거나 몇 분 후에 안정화될 수 있다.
DNA 오리가미, 100nm 금 나노입자, (Sigma Aldrich; 완충액 C에서 10nM, 이미징 전에 첨가됨), 100nM Tetrasppeck 비드(Thermofisher) 또는 나노다이아몬드를 드리프트 및 정렬 마커로 사용할 수 있다. Photometrics Prime 95B와 같은 기성 카메라는 기점 마커를 초점에 유지하는 데 사용할 수 있는 입자 추적 가능성을 포함한다.
다른 경우에, 초점 위치의 드리프트는 맞춤형 초점 안정화에 의해 제거될 수 있다. 근-적외선 레이저(LP785-SF20, Thorlabs)는 커버-슬라이드와 샘플의 유리-물 계면에서 내부적으로 완전히 반사되었다. 빔 위치는 CMOS 카메라(UI-3240CP-NIR-GL, Imaging Development Systems, 독일 오버슐름 소재)에서 모니터링된다. LabVIEW 2015(National Instruments)에서 구현된 피드백 제어는 각각 레이저 스폿의 이미지와 참조 이미지의 교차-상관관계를 최대화했다. 축 샘플 위치는 따라서 200ms마다 조정된다(P737.2SL 및 E-709.SRG, Physikalische Instrumente). 샘플과 대물렌즈는 23℃로 안정화된 온도이다. (H101-CRYO-BL 안정화 장치, H101-MINI 샘플 챔버 및 OKO-MOC 대물 안정화 장치를 가짐, Okolab, 이탈리아 오타비아노 소재).
탈색, 삼중항 상태 및 광-손상을 최소화하기 위한 시스템
다음 시약은 올리고뉴셀티드를 표지하는 데 사용되는 염료에 의존하여 효과적이다:
(a) 피라노스 산화효소, 카탈라아제, 글루코스; (b) 프로토카테츄에이트-디옥시게나제,3,4-프로토카테츄산 (c) 카탈라아제, 글루코스 산화효소, 수크로스 또는 글루코스 (FluMaXx(Hypermol)의 높은 안정성 상용 버전이 이용가능함).
(d) 메틸렌 블루 및 디티오트롤(DTT); (e) 베타 메르캅토에탄올, TCEP 또는 디티오트롤(DTT)을 포함하는 환원제; (f) 트롤록스, 1,3,5,7 사이클로옥타테트라엔 및/또는 4-니트로벤질알콜을 포함하는 삼중항 상태 소광제/형광 촉진제.
산소 소거제로서 피라노스 산화효소, 카탈라제, 글루코스(PO+C)가 특히 효과적이고 다음과 같이 제조된다:
PO+C는 1× 트롤록스가 첨가된 PO+C 산소 소거제 시스템(1× PO, 1× C, 0.8% 글루코스)으로 측정 이전 1시간 동안 인큐베이션된다. 스톡 용액: 100× PO 용액은 26mg의 PO(P4234-250UN, Sigma-Aldrich Chemie GmbH, 독일 타우프키르켄 소재), 684μL의 효소 완충액으로 구성되며; 100× C 용액은 1ml 효소 완충액에 2mg 카탈라아제로 구성된다. 둘 모두는 원심분리 여과(Ultrafree MC-GV, Merck KGaA, 독일 다름슈타트 소재; 0.22μm)되고 액체 질소에서 급속동결되고 ?80℃에서 보관되었으며; 100× 트롤록스 용액은 3.2mL의 H2O 내 100mg의 트롤록스(Sigma-Aldrich 238813-1G), 430μL의 메탄올 및 345μL의 NaOH(1M)로 구성되고, ?20℃에서 보관된다);
형광 표지는 표적 DNA 상에 광손상을 유도하여 이를 최소화할 수 있다 하나 이상의 상기 첨가제를 첨가하는 것에 부가하여, 표적 DNA에서 형광 표지를 분리하는 것이 도움이 된다. 이것은 두 가지 방법 중 하나 또는 둘 모두로 수행된다. 첫째는 단순히 올리고뉴클레오티드 종과 형광성 표지 사이에 스페이서를 추가하는 것이다. 18-mer 스페이서는 올리고뉴클레오티드 프로브에 추가할 수 있고 표지가 Cy3B일 때 효과적이다. 둘째는 표지와 올리고뉴클레오티드 사이에 단백질 보호막을 추가하여 올리고뉴클레오티드가 표적 폴리뉴클레오티드/핵산에 결합할 때 단백질이 보호막 역할을 하여 기판 상의 핵산에 대한 산화 과정의 영향을 줄이는 것이다. 과다한 단백질이 보호막으로 사용될 수 있으며, 한 가지 예는 비오틴화된 올리고뉴클레오티드 종에 연결될 수 있고 하나 이상의 형광 염료로 표지될 수 있는 스트렙타비딘이다.
큰 영역 센서
긴 분자에 대한 큰 시야를 확보하기 위해 많은 수의 픽셀이 있는 카메라가 저배율 대물 렌즈와 연결된다. 1,200만개 3.5미크론 픽셀과 낮은 전자 노이즈를 포함하는 Sony IMX253 센서를 함유한 카메라가 사용될 수 있다. 이 센서는 빠른 데이터 전송을 위해 10GigE 인터페이스에 연결되어 있다(Emergent Vision Technologies(캐나다 소재)에 의한 HR1200에서 초당 80프레임 허용. 이 카메라는 20x 0.75NA Nikon 대물렌즈와 연결되어 있고 센서의 일 축에서 ~2메가베이스 길이의 신장된 DNA를 이미징할 수 있다.
온도 조절 및 시약 교환
온도 제어 및 시약 교환은 CherryTemp(프랑스 소재) 빠른 전환 및 정밀한 온도 제어 시스템을 포함하는 시스템, 및 고정된 연장된/신장된 핵산 및 다중 시약 유입구 및 압력 구동식 흐름 시스템에 연결된 하나 이상의 유출구를 포함하는 커버 유리 상으로 결합되는 관류 챔버(Elvesys, 프랑스 소재)를 사용하여 구현된다. 여러 시약을 전달하기 위해 Elvesys 압력 발생기는 전달될 시약의 튜브 안으로 압력을 가하는 분배기 안으로 파이핑되어, 밸브 안으로 시약을 밀어 넣은 다음 밸브가 전환되어 모세관을 통해 유동 셀로 특정 시약을 전달한다. 유동 센서는 유동 라인 안으로 통합되어 0 내지 80ul/분 사이의 유속을 측정하고 압력 발생기를 필요한 유속, 예를 들어, 10ul/분에 적절한 수준으로 다이얼링하도록 피드백을 제공한다.
본 발명은 명세서의 교시 및 그 안에 인용된 참고문헌에 비추어 가장 철저하게 이해된다. 명세서 내의 실시형태는 본 발명의 실시형태의 예시를 제공하고 본 발명의 범주를 제한하는 것으로 해석되지 않아야 한다. 당업자는 많은 다른 실시형태가 발명에 의해 포괄된다는 것을 쉽게 인식한다. 당업계의 통상인은 단지 일상적인 실험을 사용하여 본 명세서에 기술된 발명의 특정 실시형태에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 이러한 등가물은 청구범위(아래)에 의해 포괄되도록 의도된다.
추가 실시형태
1. 다음을 포함하는 단일 중합체 분자에서 서브-유닛의 서열을 식별하는 방법:
i. 중합체를 이동억제화하는 것;
ii. 중합체를 상기 중합체의 서브-유닛을 인식하는 분자 프로브와 접촉시키는 것;
iii. 분자 프로브의 결합의 부위를 국지화하는 것; 및
iv. 분자 프로브의 결합 장소를 결정함에 의해 서브유닛의 장소를 결정하는 것.
2. 단계 (ii) 및 (iii)을 여러 번 반복하는 것을 포함하는 1에 따른 방법.
3. 동일한 특이성의 프로브를 여러 번 결합하는 것을 포함하는 2에 따른 방법.
4. (ii)의 각 반복에서 상이한 특이성의 결합 프로브를 포함하는 2에 따른 방법.
5. 분자 프로브를 접촉시키는 것은 프로브(들)와 중합체의 다중 일시적인 결합 이벤트를 포함하는 1에 따른 방법.
6. 다음을 포함하는 단일 표적 폴리뉴클레오티드 상의 뉴클레오티드 변형 및/또는 염기를 시퀀싱하는 방법:
i. 표면 또는 매트릭스 상에 폴리뉴클레오티드를 이동억제화하는 것;
ii. 프로브가 그의 결합 부위에 일시적으로 결합하는 조건하에서 하나 이상의 프로브 종을 추가하는 것으로, 이러한 일시적인 것은 다중 프로브가 각각의 결합 부위에 차례로 결합하도록 허용하고, 표적 부위에 대한 결합은 (예를 들어, 결합 지속시간에서의 차이에 의해) 비-표적 부위에 대한 결합과 구별될 수 있는 것;
iii. 2D 검출기 상에 폴리뉴클레오티드를 연속적으로 이미징(또는 그의 다중 프레임 취함)하고 결합의 픽셀 좌표를 기록하여 임계 수의 결합 이벤트가 누적되도록 하는 것;
iv. ii의 프로브를 제거하는 것;
v. 상이한 하나 이상의 프로브 종으로 매번 단계 ii-iv를 반복하는 것;
vi. 프로브가 지속적으로 결합하는 각각의 결합 부위의 나노미터 또는 서브-나노미터 장소(예를 들어, 결합 부위에 대한 10개 이상의 결합 이벤트)를 제공하기 위해 단일 분자 국지화 알고리즘을 사용하여 단계 iii.의 각 반복으로부터 데이터를 축적하고 노미터로 국지화된 부위를 프로브 종의 정체성(예를 들어, 특정 올리고뉴클레오티드 서열 또는 특정 항체)과 상관시키는 것; 및
vii. vi를 사용하여 각각의 나노미터 장소에서 결합 종의 순서(서열)를 결정하여 폴리뉴클레오티드의 뉴클레오티드 변형 및/또는 염기 서열을 축적하는 것.
7. 신장하는 것뿐만 아니라 이동억제화하는 것을 포함하는 1 및 6에 따른 방법.
8. 각 특이성의 프로브의 정체성은 알려져 있거나 결정될 수 있는 1에 따른 방법.
9. 결합 프로브는 올리고뉴클레오티드인 1 및 6에 따른 방법.
10. 결합 프로브는 항체, 아피바디, 아피머, 나노바디, 압타머 또는 핵산 결합 단백질인 1 및 6에 따른 방법.
11. 프로브 종은 분화될 수 있는 6에 따른 방법.
12. 결합은 공간적으로 분해가능한 신호를 통해 검출되는 1 및 6에 따른 방법.
13. 공간적으로 분해가능한 신호는 프로브 상의 하나 이상의 표지로 인한 것인 12에 따른 방법.
14. 프로브의 정체성이 인코딩되는 13에 따른 방법.
15. 결합 프로브는 인식 서열의 완전한 레퍼토리, 예를 들어, 64 3mer, 245 4mer, 1024 5mer 또는 4096 6mer를 포함하고, 선택적으로 추가적인 축퇴 또는 범용 염기를 포함하는 9에 따른 방법.
16. 단일 표적 폴리뉴클레오티드는 염색체 또는 이의 일부이거나 또는 그로부터 유래되는, 6에 따른 방법.
17. 단일 표적 폴리뉴클레오티드는 길이가 약 102, 103, 104, 105, 106, 107, 108, 109개 염기인, 6에 따른 방법.
18. 폴리뉴클레오티드의 최소 섭동으로 세포, 소기관, 염색체, 바이러스, 엑소좀 또는 체액/물질로부터 단일 표적 폴리뉴클레오티드 분자를 추출하는 것을 추가로 포함하는 6의 방법.
19. 표적 중합체/폴리뉴클레오티드 분자는 표면 상에 이동억제화되는, 1 및 6의 방법.
20. 표적 중합체/폴리뉴클레오티드 분자는 겔 또는 매트릭스에 배치되는, 1 및 6의 방법.
21. 표적 중합체/폴리뉴클레오티드 분자는 마이크로- 또는 나노-유체 채널에 배치되는, 제1항 및 제6항의 방법.
22. 표적 중합체/폴리뉴클레오티드 분자는 실질적으로 온전한 것인, 제1항 및 제6항의 방법.
23. 서열은 표적 폴리뉴클레오티드 분자의 다른 카피 또는 표적 폴리뉴클레오티드 분자에 대한 참조 서열을 사용하지 않고 결정되는, 제6항의 방법.
24. 다음을 포함하는 이배체 또는 다배체 게놈의 단상형 분해 시퀀싱의 방법:
i. 1 또는 6의 방법을 사용하여 이배체/다수체 게놈의 제1 단상형을 나타내는 제1 표적 폴리뉴클레오티드를 시퀀싱하는 것
ii. 1 또는 6의 방법을 사용하여 이배체/다수체 게놈의 제2 단상형을 나타내는 제2 표적 폴리뉴클레오티드를 시퀀싱하는 것; 및
iii. 배수체 게놈의 경우, 제1항 또는 제6항의 방법을 사용하여 배수체 게놈의 추가 단상형을 나타내는 추가 표적 폴리뉴클레오티드를 시퀀싱하는 것으로; 여기서 제1 및 제2 및 추가 표적 폴리뉴클레오티드는 상이한 상동 염색체(염색체 상동체)로부터 유래하고; 그리고 이에 의해 게놈의 제1, 제2 및 추가 단상형을 결정하는 것.
25. 다음을 포함하는 긴-연속적 시퀀싱 판독를 획득하는 방법:
i. 프로브 결합 이벤트에 기반하여 제1 짧은 판독을 획득하는 것;
ii. 프로브 결합 이벤트에 기반하여 제1 판독에 인접한 제2 짧은 판독을 획득하는 것;
iii. 프로브 결합 이벤트에 기반하여 제1 또는 제2 짧은 판독에 가까운 추가 짧은 판독을 획득하는 것; 및
iv. 연속적 긴 판독을 획득하기 위해 적어도 2개의 짧은 판독을 함께 스티칭하는 것.
26. 단상형 분석 시퀀싱에 대한 판독의 일부는 각각의 상동체의 (예를 들어, 다중 세포로부터) 별도 폴리뉴클레오티드로부터 획득되는 25에 따른 방법.
27. 나노미터 국지화 또는 순서는 장소를 추론하기 위해 하나 이상의 참조 서열을 사용함에 의해 촉진되는 6에 따른 방법.
28. 표적 폴리뉴클레오티드가 겔 또는 매트릭스와 접촉되는 이전 청구항에 따른 방법.
29. 염기 시퀀싱이 염기 서열에 직교하는 에피-마크의 표지화에 의한 에피-마크의 분석(예를 들어, 메틸화)과 조합되는 1 및 10에 따른 방법.
30. 중합체를 연장시키는 것 및 복수의 잠정적으로 분해가능한 표지를 연장된 중합체를 따라 복수의 부위에 결합하는 것으로, 복수의 이들은 회절 제한 광학 이미징에 의해 분해가능하지 않은 것 및 나노미터 또는 서브-나노미터 정확도로 그의 장소를 결정하는 하는 것을 포함하는 중합체의 화학 구조를 결정하는 방법.
31. 일시적인 결합은 활성 결합해제를 포함하는 6에 따른 방법.
32. 결합은 안정한 결합을 포함하는 31에 따른 방법.
33. 활성적으로 결합해제는 열, pH에서 변화, 염 농도에서 변화, 프로브의 화학적 또는 생화학적 분해를 포함하는 수단에 의해 결합을 파괴하는 것을 포함하는 32에 따른 방법.
34. 결합 및 활성 결합해제는 균질한 반응에서 온도 순환을 사용하여 수행되는 31에 따른 방법.
35. 결합 프로브는 별도의 서열 비트(본 명세서에 따라 정의됨)에 결합하는 이전 청구항에 따른 방법.
36. 결합 프로브는 나노미터 정확도 및 정밀도로 국지화되는 이전 청구항에 따른 방법.
37. 결합 부위는 서브-나노미터 정확도 및 정밀도로 국지화되는 이전 청구항에 따른 방법.
38. 2개 이상의 결합 프로브가 결합하는 2개 이상의 서열 비트가 서로에 대해 초-분해되는 이전 청구항에 따른 방법.
39. 프로브는 직접적으로 표지되는 1-38에 따른 방법.
40. 프로브는 간접적으로 표지되는 1-38에 따른 방법.
41. 간접적으로 표지된 프로브는 표적 결합 도메인 및 적어도 하나의 표지화 도메인을 포함하는 40에 따른 방법.
42. 상기 표적 결합 도메인은 적어도 3개의 뉴클레오티드를 포함하고 표적 핵산에 일시적으로 결합할 수 있는 41에 따른 방법.
43. 상기 표지화 도메인은 표지된 상보적 핵산 분자를 안정적으로 결합할 수 있는 핵산 서열을 포함하는 41에 따른 방법.
44. 프로브는 표적 결합 도메인 및 다중 표지화 도메인을 포함하는 41에 따른 방법.
45. 상기 다중 표지화 도메인 각각은 표지된 상보적 핵산 분자를 안정적으로 결합할 수 있는 핵산 서열을 포함하는 44에 따른 방법.
46. 각각의 결합 도메인은 별개의 서열을 포함하는 44에 따른 방법.
47. 각각의 별개의 결합 도메인은 적어도 3개의 뉴클레오티드 중 하나에 상응하는 44에 따른 방법.
48. 적어도 3개의 뉴클레오티드 중 하나의 정체성은 별개의 표지에 의해 결정되는 47에 따른 방법.
49. 적어도 12개의 별개의 표지가 사용되거나 11개의 별개의 표지와 하나의 블랭크가 사용되는 48에 따른 방법.
50. 표적 결합 도메인은 적어도 3개의 뉴클레오티드 및 하나 이상의 축퇴 뉴클레오티드 위치를 포함하는 41 및 44에 따른 방법.
51. 표지는 파장, 수명, 밝기, 복사되거나 방출되거나 또는 산란된 광의 편광 등으로 인해 구별되는 48에 따른 방법.
52. 폴리뉴클레오티드가 말단에서 꼬리가 있고 꼬리에 상보적인 서열을 통해 포획되는, 이전 실시형태에 따른 방법.
53. 꼬리에 상보적인 서열은 정렬된 어레이에서 조직화되는 52에 따른 방법.
54. 정렬된 어레이는 꼬리에 상보적인 공간적으로 정렬된 서열을 포함하는 초-분자 격자(예를 들어, DNA 오리가미)를 포함하는 52에 따른 방법.
55. 폴리뉴클레오티드는 말단 트랜스퍼라제를 사용하여 꼬리가 있는 52에 따른 방법.
56. 표적 폴리뉴클레오티드는 짧은, 무-세포 또는 순환하는 핵산인 52에 따른 방법.
57. 표적 폴리뉴클레오티드는 mRNA이고 일 말단에서 이미 자연적으로 꼬리가 있는 52에 따른 방법.
58. 표적 폴리뉴클레오티드는 일 말단에서 이미 자연적으로 꼬리가 붙지 않은 RNA인 52에 따른 방법.
59. 중합체/폴리뉴클레오티드는 프로브 결합 이전에 변성되는, 이전 실시형태에 따른 방법.
60. 단일 중합체/폴리뉴클레오티드는 신장되거나 연장되는 이전 실시형태에 따른 방법.
61. 단일 중합체/폴리뉴클레오티드는 표면 상에 이동억제화되는, 이전 실시형태에 따른 방법.
62. 단일 중합체/폴리뉴클레오티드는 겔 또는 매트릭스에 이동억제화되는 이전 실시형태에 따른 방법.
63. 이종의 중합체에서 화학 구조를 식별하고 정렬하는 방법으로서 상기 방법은: 중합체를 연장하고 연장된 중합체를 따라 복수의 부위에서 화학 구조를 식별하는 복수의 프로브를 결합하는 것을 포함하며; 복수의 상기 부위는 회절 제한된 광학 이미징에 의해 분해될 수 있는 것보다 더 가깝지만 그의 표지화가 잠정적으로 분리되기 때문에 분해되고; 화학 구조를 식별하는 프로브의 결합의 장소는 나노미터(하위-회절) 정밀도로 결정되고 이에 의해 이종의 중합체에서 화학 구조의 공간적 순서가 결정되는, 방법.
64. 중합체의 서열은 중합체에 대한 분자 프로브의 레퍼토리의 결합 상호작용의 창발적 특성을 통해 결정되는 중합체를 시퀀싱하는 방법.
실시예
실시예 1: 시퀀싱을 위한 샘플 준비.
단계 1: 긴 길이의 게놈 DNA 추출.
NA12878 또는 NA18507 세포(Coriell Biorepository)를 배지에서 성장시키고 수확한다. 세포를 60℃로 가열된 낮은-용융 온도 아가로스와 혼합한다. 혼합물을 겔 몰드(예를 들어, Bio-Rad에서 구입) 안으로 붓고 겔 플러그 안으로 셋팅되도록 하여 약 4x107개 세포를 초래한다(이 수는 폴리뉴클레오티드의 원하는 밀도에 따라 더 높거나 낮음). 겔 플러그에서의 세포는 단백질가수분해효소 K를 함유하는 용액에 플러그를 담그면 용리된다. 겔 플러그는 TE 완충액에서 부드럽게 세정된다(예를 들어, 세정 완충액으로 충진되지만 혼합에 도움이 되도록 작은 거품이 남겨지고 튜브 회전자 상에 배치된 15mL 팔콘 튜브 내). 플러그를 대략 1.6mL 부피를 갖는 트로프에 넣고 DNA를 소화하기 위해 아가라제 효소를 사용하여 DNA를 추출한다. 0.5M MES pH 5.5 용액을 소화된 DNA에 적용한다. FiberPrep 키트(Genomic Vision, 프랑스 소재) 및 연관 프로토콜을 사용하여 이 단계를 수행하여 생성된 DNA 분자의 300Kb 평균 길이를 제공한다. 대안적으로, 이들 세포주로부터 추출된 게놈 DNA 자체는 Corriel에서 이용가능하고 넓은 내강 피펫을 사용하여 0.5M MES pH 5.5 용액 안으로 직접적으로 피펫팅한다(<1μM 평균 간격 제공하도록 1.2mL 내 ~10uL).
단계 2: 표면 상의 분자 신장.
단계 1의 마지막 부분은 0.5M MES pH 5.5 용액에서의 트로프에서 추출된 폴리뉴클레오티드를 부여한다. 비닐실란(예를 들어, Genomic Vision으로부터 CombiSlips)으로 코팅된 기판 커버 유리를 트로프에 침지하고 1-10분 동안 인큐베이션하도록 허용된다(필요한 표적 핵산의 밀도에 따라 다름). 그런 다음 커버 유리를 잡기 위해 클립이 부착된 주사기 펌프와 같은 기계적 풀러를 사용하여 커버 유리를 천천히 잡아당긴다(대안적으로 Genomic Vision으로부터의 FiberComb 시스템이 사용됨). 커버글라스 상의 DNA는 가교제(Stratagene, 미국 소재)를 사용하여 10,000마이크로 쥴의 에너지를 사용하여 표면에 가교된다. 이 과정을 주의 깊게 수행하면 평균 길이가 200-300Kb인 고분자량(HMW) 폴리뉴클레오티드가 표면에서 연장되고 폴리뉴클레오티드의 모집단 중에 존재하는 길이가 1Mb 초과 또는 더욱이 대략 10Mb인 분자가 생성된다. 더 많은 주의와 최적화를 통해 평균 길이가 메가베이스 범위로 전이한다(상기 메가-베이스 범위 다듬기 섹션 참조).
대안으로서, 상기에서 언급된 바와 같이, 사전-추출된 DNA(예를 들어, Novagen cat. No. 70572-3 또는 Promega로부터의 인간 남성 게놈 DNA)가 사용되고, 50Kb 초과의 게놈 분자의 양호한 비율을 포함한다. 여기에서 약 0.2 - 0.5ng/μL의 농도는 약 5분 동안의 침지로 회절 제한된 이미징을 사용하여 높은 분율이 개별적으로 분해되는 분자의 밀도를 제공하기에 충분하다.
단계 3: 유동 셀 만들기.
커버슬립은 이미 유리 슬라이드에 부착된 양면 점착성 3M 시트로 만들어진 유동 셀 개스킷 상으로 압착된다. 개스킷(양면 접착성 시트 상에 보호 층의 양면이 있는 상태)은 레이저 절단기를 사용하여 형성되어 하나 이상의 유로를 생성한다. 유로의 길이가 커버글라스의 길이보다 길어서 유로의 중앙에 커버글라스가 위치될 때 커버글라스로 덮이지 않는 채널의 각 말단에서 하나의 부분이 각각 유로 안팎으로 유체를 분배하기 위한 유입구 및 유출구로 사용된다. 유체는 비닐실란 표면 상에 부착된 연장된 폴리뉴클레오티드 상으로 통과한다. 유체는 일 말단에서 안전 면봉 스틱(Johnsons, 미국 소재)을 사용하여 채널을 통해 흐르게 하여 유체가 다른 쪽 말단에 피펫팅될 때 흡입을 생성한다. 채널은 인산염 완충 식염수-트윈 및 인산염 완충 식염수(PBS-세정)로 사전-습윤된다.
단계 4: 이중 가닥 DNA의 변성.
다음 표적 핵산을 추가하기 전에 이전 표적 핵산을 효율적으로 세정할 필요가 있으며; 이것은 완충액으로 최대 4회 교환하고 선택적으로 DMSO 또는 알칼리 용액과 같은 변성제를 사용하여 지속하는 결합을 제거함에 의해 수행할 수 있다). 이중-가닥 표적 핵산은 유동 셀을 통해 알칼리(0.5M NaOH)를 플러싱하고 실온에서 약 20-60분 동안 인큐베이션함에 의해 변성된다. 이것은 PBS/PBST 세정이 뒤따른다. 대안적으로, 인큐베이션은 또한 1시간 동안 1M HCL로 수행된 후 PBS/PBST로 세정이 뒤따른다.
단계 5: 부동태화.
선택적으로, BlockAid(Invitrogen, 미국 소재)와 같은 차단 완충액이 유입되고 ~ 5-15분 동안 인큐베이션된다. 이것은 PBS/PBST 세정이 뒤따른다.
실시예 2: 변성된 폴리뉴클레오티드에 대한 올리고뉴클레오티드의 일시적인 결합에 의한 시퀀싱
단계 1: 일시적인 결합 조건하에서 올리고뉴클레오티드 프로브 종 첨가.
유동 셀은 PBST 및 선택적으로 완충액 A(10mM Tris-HCl, 100mM NaCl, 0.05% 트윈-20, pH 7.5)로 사전-컨디셔닝된다. ~1-10nM의 각각의 올리고뉴클레오티드 프로브 종을 완충액 B(5mM Tris-HCl, 10mM MgCl2, 1mM EDTA, 0.05% 트윈-20, pH 8) 또는 완충액 B+ 5mM Tris-HCl, 10mM MgCl2, 1mM EDTA, 0.05% 트윈-20, pH 8, 1mM PCA, 1mM PCD, 1mM 트롤록스)에서 연장된 변성 표적 핵산에 적용한다. 올리고뉴클레오티드 프로브 종의 길이는 전형적으로 5 내지 7개의 뉴클레오티드의 범위이고 반응 온도는 올리고뉴클레오티드 프로브 종의 Tm에 따라 다르다. 본 발명자들이 사용한 일 프로브 유형은 일반식 5'-Cy3-NXXXXXN-3'(X는 특정 염기이고, N은 축퇴 위치임)의 것으로 위치 1, 2, 4, 6 및 7에 LNA 뉴클레오티드, 위치 3 및 5에 DNA 뉴클레오티드를 가지며; 프로브는 Sigma Proligo에서 구입했으며 이전에 Pihlak 등에 의해 사용된 바와 같다. 온도의 결합은 각 올리고뉴클레오티드 프로브 종 서열의 Tm에 연결되었다.
A+ 및 B+ 용액으로 세정한 후 올리고뉴클레오티드 프로브 종의 일시적인 결합은 LNA DNA 키메라 올리고뉴클레오티드 프로브 종 3004 NTgGcGN(여기서 대문자는 LNA이고 소문자는 DNA 뉴클레오티드임)에 대해 실온에서 B+ 용액에서 0.5 내지 100nM의 올리고(전형적으로 3nm 내지 10nm)로 수행된다. 그 Tm 및 결합 거동에 따라 상이한 올리고뉴클레오티드 프로브 종 서열에 대해 상이한 온도 및/또는 염 조건(뿐만 아니라 농도)이 사용된다. FRET 기전이 검출에 사용되는 경우 훨씬 더 높은 농도의 올리고, 최대 1uM이 사용될 수 있다. 일부 실시형태에서, FRET는 일시적으로 형성된 듀플렉스와 올리고 상의 표지 안으로 삽입되는 개재하는 염료 분자(개재하는 염료가 YOYO-1, Sytox Green, Sytox Orange, Sybr Gold 등으로부터 사용되는 것에 따라 순수 희석된 형태 1/1000 내지 1/10,000; Life Technologies) 사이에 있다. 일부 실시형태에서, 개재하는 염료는 FRET 없이 표지로 직접적으로 사용된다. 이 경우 올리고뉴클레오티드 프로브 종은 표지되지 않는다. 저렴할 뿐만 아니라 표지되지 않은 올리고뉴클레오티드 프로브 종은 표지된 올리고뉴클레오티드 프로브 종보다 더 높은 농도에서 사용될 수 있는데, 듀플렉스 형성 시 개재된 염료로부터의 배경이 개재하지 않는 염료보다 100-1000 더 밝기 때문이다(예를 들어, 개재물이 사용되는 것에 따라 다름).
단계 2: 이미징 - 다중 프레임 촬영.
유로는 완전한 포커스, TIRF 부착, 및 TIRF 대물 레이저와 Hamamatsu 512x512 Back-thinned EMCCD 카메라가 장착된 도립 현미경(예를 들어, Nikon Ti-E) 상에 배치된다. 프로브는 완충액 B+에 추가되고 선택적으로 이미징으로 보완된다.
표면 상에 배치된 폴리뉴클레오티드에 결합하는 프로브는 TIRF 부착이 있는 Nikon Ti-E 상에 1.49 NA 100x Nikon 오일 침지 대물렌즈를 통해 ~61.5°의 TIRF 각도에서 섬유 광 스크램블러(Point Source)를 통해 컨디셔닝된 75-400mW 레이저 광(예를 들어, 532nm에서 녹색 광)의 내부 전반사에 의해 생성된 소멸파에 의해 조명된다. 이미지는 동일한 렌즈를 통해 1.5배 더 확대하여 수집되고 2색성 거울과 방출 필터를 통해 Hamamatsu ImageEM 카메라로 투영된다. 완전한 포커스를 사용하여 100-140의 EM 게인으로 50-200밀리초의 5000-30,000 프레임을 촬영한다. 일부 실시형태에서, 초기 비-특이적 결합을 탈색하기 위해 초기에 높은 레이저 출력(예를 들어, 400 mW)이 사용되며, 이는 개별 결합 이벤트가 분해되는 더 낮은 밀도로 표면으로부터 신호의 거의 블랭킷을 감소시킨다. 그 후 레이저 출력은 선택적으로 낮아진다.
도 22a-22e는 표적 핵산에 일시적으로 결합하는 올리고뉴클레오티드 프로브종의 조명의 예를 예시한다. 이들 도면에서 표적 핵산은 인간 DNA이다. 어두운 반점은 프로브 형광의 영역을 나타내며, 더 어두운 반점은 올리고뉴클레오티드 프로브 종에 의해 더 자주 결합된 더 많은 영역을 나타낸다(예를 들어, 더 많은 광자가 수집되었음). 도 22a-22e는 하나의 표적 핵산의 시퀀싱 동안 포획된 시 계열로부터의 이미지(예를 들어, 비디오)이다. 점 2202, 2204, 2206, 2208은 (예를 들어, 올리고뉴클레오티드 프로브 종의 상이한 세트가 표적 핵산에 노출됨에 따라) 시간이 지남에 따라 더 많거나 더 적은 강도로 결합된 표적 핵산에서 영역의 예로서 시 계열 전체에 걸쳐 표시된다.
이미징 완충액이 추가된다. 이미징 완충액은 일부 실시형태에서 베타-메르캅토에탄올, 효소적 산화환원 시스템, 및/또는 아스코르브산염 및 갈산을 함유하는 완충액에 의해 보충되거나 대체된다. 형광단은 선을 따라 검출되어 올리고뉴클레오티드 프로브 종 결합이 발생했음을 나타낸다. 선택적으로, 유동 셀이 하나 초과의 채널로 만들어진 경우 채널 중 하나는 폴리뉴클레오티드의 밀도와 폴리뉴클레오티드 신장의 품질을 확인하기 위해 YOYO-1 개재하는 염료로 염색된다(예를 들어, Intensilight 또는 488nm 레이저 조명 사용).
단계 3: 이미징 - 다른 장소로 이동(선택적 단계).
Nikon Ti-e의 슬라이드 홀더 상에 장착된 커버 유리(유동 셀의 일부로 유리 슬라이드에 부착을 통함)는 대물 렌즈(따라서 CCD)에 관해 변환되어 별도의 장소가 이미지화된다. 이미징은 여러 다른 장소에서 수행되어 다른 장소(그 제1 위치에서 CCD의 시야 외부)에서 렌더링된 표적 핵산 또는 표적 핵산의 일부에 결합하는 올리고뉴클레오티드 프로브종이 이미지화된다. 각 장소로부터의 이미지 데이터는 컴퓨터 메모리에 저장된다.
단계 4: 올리고의 다음 세트 추가.
올리고뉴클레오티드 프로브 종의 다음 세트가 추가되고 표적 핵산 전체가 서열화될 때까지 단계 1-3이 반복된다.
단계 5: 결합의 장소 및 정체성 결정.
광학 활성의 각 경우의 장소가 결정되어, 결합된 표지된 올리고뉴클레오티드 프로브 종으로부터의 형광이 투사되는 픽셀 장소를 기록한다. 결합된 올리고뉴클레오티드 프로브 종의 정체성은 어떤 표지된 올리고뉴클레오티드 프로브 종이 형광단에 결합되었는지(예를 들어, 광학 필터에 의한 파장 선택 사용) 결정함에 의해 결정되고,다중 필터에 걸쳐 검출되고 그리고 이 경우에는 필터 세트에 걸쳐 각 형광단의 방출 시그니처가 형광단 및 따라서 올리고뉴클레오티드 프로브 종의 정체성을 결정하는 데 사용된다. 선택적으로, 유동 셀이 하나 초과의 채널로 만들어진 경우 채널 중 하나는 (예를 들어, Intensilight 또는 488nm 레이저 조명을 사용함에 의해) 표적 핵산의 밀도와 표적 핵산 신장의 품질을 검사하기 위해 YOYO-1 개재하는 염료로 염색된다. 올리고뉴클레오티드 프로브 종을 표지하는 데 사용되는 형광 파장의 각각에 대해 하나씩, 하나 이상의 이미지 또는 무비가 촬영된다.
6단계: 데이터 처리.
듀플렉스 표적 핵산의 양 가닥이 표면에 부착된 상태로 남아 있을 때, 올리고뉴클레오티드 프로브 종의 결합은 이중-가닥 표적 핵산의 양 가닥 상의 상보적 장소에 동시적으로 발생한다. 그런 다음 전체 데이터-세트를 분석하여 표적 핵산 상의 특정 위치에 밀접하게 국지화하는 신호를 제공하는 올리고뉴클레오티드 프로브 종의 세트를 찾고, 그의 장소는 폴리뉴클레오티드에서 선택된 지점에 상응하는 올리고뉴클레오티드 프로브 종 서열을 중첩함에 의해 확인되며; 그런 다음 이것은 각 지점에서 올리고뉴클레오티드 프로브 종의 2개의 중첩하는 타일링 시리즈를 밝힌다. 지역에서 다음 신호가 맞는 타일링 시리즈는 그것이 결합하는 가닥을 나타낸다.
표적 핵산 가닥이 표면 상에 고정된 채로 남아 있기 때문에, 각 올리고뉴클레오티드 프로브 종에 대해 기록된 결합 장소는 알고리즘을 실행하는 소프트웨어 스크립트를 사용하여 중첩될 수 있다. 이는 올리고뉴클레오티드 프로브 종 결합 장소가 변성된 듀플렉스 표적 핵산의 각 가닥에 대한 별도의 (그러나 상보적이어야 하는) 경로인 2개의 올리고뉴클레오티드 프로브 종 서열 타일링 경로의 프레임워크 내에 속한다는 것을 나타내는 신호를 초래한다. 각 타일링 경로는 완전한 경우 가닥의 전체 길이에 걸쳐 있다. 그런 다음 각 가닥에 대한 타일링된 서열을 비교하여 이중-가닥(2D로도 공지됨) 컨센서스 서열을 제공한다. 타일링 경로 중 하나에 갭이 있는 경우 상보적 타일링 경로의 서열이 취해진다. 일부 실시형태에서, 서열은 염기 할당을 돕고 갭을 메우기 위해 동일한 서열의 다중 카피 또는 참조와 비교된다.
실시예 3: 폴리뉴클레오티드 상의 에피-마크의 장소 검출.
선택적으로 올리고 결합 과정 전(또는 때때로 후 또는 도중)에, 후성유전체 결합 시약의 일시적인 결합이 수행된다. 사용되는 결합 시약에 따라 결합은 변성 전 또는 후에 수행된다. 항-메틸 C 항체의 경우 결합은 변성된 표적 핵산 상에서 수행되는 반면 메틸 결합 단백질의 경우, 결합은 임의의 변성 단계 전에 이중-가닥 표적 핵산 상에서 수행된다.
단계 1 - 메틸-결합 시약의 일시적인 결합.
변성 후, 유동 셀을 PBS-세정으로 플러싱하고 Cy3B 표지된 항-메틸 항체 3D3 클론(Diagenode)을 PBS에 첨가한다.
대안적으로, 변성 전에 유동 셀을 PBS로 플러싱하고 Cy3B-표지된 MBD1을 첨가한다.
일시적인 올리고뉴클레오티드 프로브 종 결합에 대해 상기 기재된 바와 같이 이미징를 수행한다.
단계 2: 메틸-결합 시약 조금씩 제거.
전형적으로 에피-분석은 시퀀싱 전에 수행된다. 따라서, 선택적으로 메틸-결합 시약은 표적 핵산의 시퀀싱이 개시되기 전에 플러싱된다. 이것은 PBS/PBST 및/또는 고염 완충액 및 SDS의 여러 주기를 통해 유동한 다음 제거가 발생했음을 이미징에 의해 확인함에 의해 수행된다. 무시할 수 있는 양보다 많은 결합 시약이 남아 있는 것이 분명한 경우 카오트로픽 염인, GuCL과 같은 더 가혹한 처리를 통해 유동되어 잔존하는 시약을 제거한다.
단계 3: 데이터 상관관계.
시퀀싱 에피-게놈 데이터를 얻은 후 시퀀싱 프로브 종 결합 장소의 장소 사이의 상관관계를 만들고 에피-결합 장소가 상관되어 메틸화의 서열 상황을 제공한다.
실시예 4: 람다 파지 DNA에서 일시적인 결합으로부터 수집된 형광.
도 23a, 23b 및 23c는 일시적인 결합 이벤트의 예를 예시한다. 그것들은 실온에서 완충액 B+ 내 1.5nM 농도로 Oligo I.D. Lin2621, Cy3 표지된 5' NAgCgGN 3'의 일시적인 결합을 집합적으로 예시한다. 표적 핵산은 MES pH 5.5 완충액 + 0.1 M NaCl에서 비닐실란 표면(Genomic Vision) 상에 수동으로 다듬은 람다 파지 게놈이다. 포인트 소스 섬유 광 스크램블러를 통한 400mW에서 레이저 532nm. 형광은 532nm 여기 밴드, TIRF 대물렌즈 100x, 1.49NA를 포함하고 추가 1.5X 배율을 갖는 TIRF 부착 및 다색성으로 수집되었다. 진동 단리는 구현되지 않았다. 이미지는 100EM 게인 설정으로 Hamamatsu ImageEM 512x512 상에서 완전한 포커스로 포획되었다. 100ms에 걸쳐 10000개 프레임이 수집되었다. 올리고뉴클레오티드 프로브 세트에서 Cy3의 농도는 약 250nM-300nM이었다. 도 23a는 ThunderSTORM에서 교차-상관 드리프트 교정 전에 수집된 형광을 표시한다. 도 23b는 스케일 바로 교차-상관 드리프트 교정 후에 수집된 형광을 표시한다. 도 23c는 도 23b의 확대된 영역에서 형광을 표시한다. 도 23c는 다중 장소에 대한 Lin2621의 지속적인 결합에 의해 추적된 긴 폴리뉴클레오티드 가닥을 도시한다. 이미지로부터 표적 핵산 가닥이 이동억제화되고 Cy3 방출의 회절 한계보다 가까운 거리에서 이미징 표면 상에 연장되었음이 명백하다.
실시예 5: 합성 DNA에서 일시적인 결합으로부터 수집된 형광
도 24는 3개의 상이한 폴리뉴클레오티드 가닥으로부터 수집된 형광 데이터의 예를 예시한다. 다중 프로빙 및 세정 단계는 합성 3킬로베이스 변성된 이중-가닥 DNA에 도시되어 있다. 합성 DNA를 비닐실란 표면 상에 MES pH 5.5에서 다듬고 변성시켰다. 일련의 결합 및 세정 단계를 수행하고 비디오를 녹화하고 ThunderSTORM을 사용하여 ImageJ에서 처리했다. 3개의 실시예 가닥(1, 2, 3)은 주변 온도에서 완충액 B+ 내 10nM 올리고로 수행된 다음 실험 시리즈에 대한 초-분해능 이미지에서 절단되었다: 올리고뉴클레오티드 프로브 종 3004 결합, 세정, 올리고 2879 결합, 세정, 올리고 3006 결합, 세정 및 올리고뉴클레오티드 프로브 종 3004 결합(다시). 이것은 결합 맵이 일시적인 결합에서 유도될 수 있고, 결합 패턴이 세정에 의해 지워질 수 있으며, 다른 결합 패턴이 그 다음 합성 DNA의 동일한 제1 및 제2 가닥 상에서 다른 올리고뉴클레오티드 프로브 종으로 획득될 수 있음을 나타낸다. 시리즈의 마지막 상의 올리고뉴클레오티드 프로브 종 3004로의 복귀와 시리즈에서 첫째로 사용될 때 패턴에 대한 그 유사성은 최적화에서 임의의 시도 없이도 과정의 견고성을 나타낸다.
실험적으로 결정된 결합 장소는 예상한 것과 일치하며, 듀플렉스 가닥 1 및 3은 4개의 가능한 완벽한 일치 결합 부위 중 3개를 나타내고 듀플렉스 가닥 2는 4개의 결합 장소 모두와 하나의 현저한 불일치 장소를 나타낸다. 올리고뉴클레오티드 프로브 종 3004로 제2 프로빙은 아마도 더 적은 불일치로 인해 더 깨끗한 신호를 나타내는 것으로 관찰된다. 이것은 레이저 광에 장기간 노출로부터의 가열로 인해 온도가 약간 상승할 가능성과 일치한다.
이 실험에 사용된 올리고 서열은 다음과 같다(대문자 염기는 잠금 핵산(LNA)임):
올리고뉴클레오티드 프로브 종 3004: 5' cy3 NTgGcGN
올리고뉴클레오티드 프로브 종 2879: 5' cy3 NGgCgAN
올리고뉴클레오티드 프로브 종 3006: 5' cy3 NTgGgCN:
3kbp 합성 템플릿의 서열에 대한 서열 목록(문서의 하단)은 다음과 같다:
(서열번호 2)
AAAAAAAAACCGGCCCAGCTTTCTTCATTAGGTTATACATCTACCGCTCGCCAGGGCGGCGACCTCGCGGGTTTTCGCTATTTATGAAAATTTTCCGGTTTAAGGCGTTTCCGTTCTTCTTCGTCATAACTTAATGTTTTTATTTAAAATACCCTCTGAAAAGATAGGATAGCACACGTGCTGAAAGCGAGGCTTTTTGGCCTCTGTCGTTTCCTTTCTCTGTTTTTGTCCGTGGAATGAACAATGGAAGTCAACAAAAAGCAGCTGGCTGACATTTTCGGTGCGAGTATCCGTACCATTCAGAACTGGCAGGAACAGGGAATGCCCGTTCTGCGAGGCGGTGGCAAGGGTAATGAGGTGCTTTATGACTCTGCCGCCGTCATAAAATGGTATGCCGAAAGGGATGCTGAAATTGAGAACGAAAAGCTGCGCCGGGAGGTTGAAGAACTGCGGTTCTTATACATCTAATAGTGATTATCTACATACATTATGAATCTACATTTTAGGTAAAGATTAATTGAGTACCAGGTTTCAGATTTGCTTCAATAAATTCTGACTGTAGCTGCTGAAACGTTGCGGTTGAACTATATTTCCTTATAACTTTTACGAAAGAGTTTCTTTGAGTAATCACTTCACTCAAGTGCTTCCCTGCCTCCAAACGATACCTGTTAGCAATATTTAATAGCTTGAAATGATGAAGAGCTCTGTGTTTGTCTTCCTGCCTCCAGTTCGCCGGGCATTCAACATAAAAACTGATAGCACCCGGAGTTCCGGAAACGAAATTTGCATATACCCATTGCTCACGAAAAAAAATGTCCTTGTCGATATAGGGATGAATCGCTTGGTGTACCTCATCTACTGCGAAAACTTGACCTTTCTCTCCCATATTGCAGTCGCGGCACGATGGAACTAAATTAATAGGCATCACCGAAAATTCAGGATAATGTGCAATAGGAAGAAAATGATCTATATTTTTTGTCTGTCCTATATCACCACAAAACCTGAAACTGGCGCGTGAGATGGGGCGACCGTCATCGTAATATGTTCTAGCGGGTTTGTTTTTATCTCGGAGATTATTTTCATAAAGCTTTTCTAATTTAACCTTTGTCAGGTTACCAACTACTAAGGTTGTAGGCTCAAGAGGGTGTGTCCTGTCGTAGGTAAATAACTGACCTGTCGAGCTTAATATTCTATATTGTTGTTCTTTCTGCAAAAAAGTGGGGAAGTGAGTAATGAAATTATTTCTAACATTTATCTGCATCATACCTTCCGAGCATTTATTAAGCATTTCGCTATAAGTTCTCGCTGGAAGAGGTAGTTTTTTCATTGTACTTTACCTTCATCTCTGTTCATTATCATCGCTTTTAAAACGGTTCGACCTTCTAATCCTATCTGACCATTATAATTTTTTAGAATGCGGCGTTTTCCGGAACTGGAAAACCGACATGTTGATTTCCTGAAACGGGATATCATCAAAGCCATGAACAAAGCAGCCGCGCTGGATGAACTGATACCGGGGTTGCTGAGTGAATATATCGAACAGTCAGGTTAACAGGCTGCGGCATTTTGTCCGCGCCGGGCTTCGCTCACTGTTCAGGCCGGAGCCACAGACCGCCGTTGAATGGGCGGATGCTAATTACTATCTCCCGAAAGAATCCGCATACCAGGAAGGGCGCTGGGAAACACTGCCCTTTCAGCGGGCCATCATGAATGCGATGGGCAGCGACTACATCCGTGAGGTGAATGTGGTGAAGTCTGCCCGTGTCGGTTATTCCAAAATGCTGCTGGGTGTTTATGCCTACTTTATAGAGCATAAGCAGCGCAACACCCTTATCTGGTTGCCGACGGATGGTGATGCCGAGAACTTTATGAAAACCCACGTTGAGCCGACTATTCGTGATATTCCGTCGCTGCTGTTAATTGAGTTTATAGTGATTTTATGAATCTATTTTGATGATATTATCTACATACGACTGGCGTGCCATGCTTGCCGGGATGTCAAATTTAATAAGGTGATAGTAAATAAAACAATTGCATGTCCAGAGCTCATTCGAAGCAGATATTTCTGGATATTGTCATAAAACAATTTAGTGAATTTATCATCGTCCACTTGAATCTGTGGTTCATTACGTCTTAACTCTTCATATTTAGAAATGAGGCTGATGAGTTCCATATTTGAAAAGTTTTCATCACTACTTAGTTTTTTGATAGCTTCAAGCCAGAGTTGTCTTTTTCTATCTACTCTCATACAACCAATAAATGCTGAAATGAATTCTAAGCGGAGATCGCCTAGTGATTTTAAACTATTGCTGGCAGCATTCTTGAGTCCAATATAAAAGTATTGTGTACCTTTTGCTGGGTCAGGTTGTTCTTTAGGAGGAGTAAAAGGATCAAATGCACTAAACGAAACTGAAACAAGCGATCGAAAATATCCCTTTGGGATTCTTGACTCGATAAGTCTATTATTTTCAGAGAAAAAATATTCATTGTTTTCTGGGTTGGTGATTGCACCAATCATTCCATTCAAAATTGTTGTTTTACCACACCCATTCCGCCCGATAAAAGCATGAATGTTCGTGCTGGGCATAGAATTAACCGTCACCTCAAAAGGTATAGTTAAATCACTGAATCCGGGAGCACTTTTTCTATTAAATGAAAAGTGGAAATCTGACAATTCTGGCAAACCATTTAACACACGTGCGAACTGTCCATGAATTTCTGAAAGAGTTACCCCTCTAAGTAATGAGGTGTTAAGGACGCTTTCATTTTCAATGTCGGCTAATCGATTTGGCCATACTACTAAATCCTGAATAGCTTTAAGAAGGTTATGTTTAAAACCATCGCTTAATTTGCTGAGATTAACATAGTAGTCAATGCTTTCACCTAAGGAAAAAAACATTTCAGGGAGTTGACTGAATTTTTTATCTATTAATGAATAAGTGCTTGACCTATTTCTTCATTACGCCATTATACATCTAGCCCACCGCTGCCAAAAAAAAA
실시예 6: 단일 세포의 통합된 단리, 핵산 추출 및 시퀀싱.
1단계: 마이크로유체 구조 설계 및 제작
마이크로채널은 15um의 전형적인 직경을 갖는 인간 암 세포주로부터 세포를 수용하도록 설계되어, 마이크로유체 네트워크는 33um의 최소 깊이와 폭을 갖는다. 장치는 세포용 유입구와 단일 채널로 병합되어 단일-세포 트랩에 공급되는 완충액용 유입구를 포함한다(도 17에 예시됨). 세포와 완충액 유입구 사이의 교차점에서 세포는 하나 이상의 트랩이 위치된 공급 채널의 측벽을 따라 정렬된다. 각 트랩은 인간 암 세포주에서 세포를 포획하기 위한 치수의 단순한 수축부이다. 세포 트래핑을 위한 수축은 사다리꼴 단면을 가지고 있다: 그것은 하단 폭 4.3um, 중간 깊이 6um, 상단 8um로 깊이 33um을 갖는다. 각 세포 트랩은 공급 채널을 분기점에 연결하며, 그 중 일 면은 폐기물 채널(도면 17에는 도시되지 않음)이고 다른 면은 각 세포에 대해 하나씩 흐름-신장 섹션(핵산 연장 및 시퀀싱용)을 포함하는 채널이다. 흐름-신장 섹션은 20um(또는 최대 2mm) 너비, 450um-길이, 100nm(또는 최대 2um-깊이) 채널로 구성된다. 일부 실시형태에서, 흐름-신장 채널은 시작하기에 더 좁고 명시된 치수로 넓어진다.
단계 2: 장치 제작
장치는 TOPAS 5013(TOPAS)의 사출 성형을 사용하여 니켈 심을 복제함에 의해 제작된다. 간단히 말해서, 실리콘 마스터는 UV 리소그래피 및 반응성 이온 에칭에 의해 생성된다. 100-nm NiV 시딩 층이 증착되고 니켈이 330um의 최종 두께로 전기도금된다. Si 마스터는 KOH에서 화학적으로 에칭된다. 사출 성형은 용융 온도 250℃, 금형 온도 120℃, 최대 유지 압력 1,500bar에서 2초, 20cm3/s 내지 45cm3/s 사이에서 변하는 사출 속도를 사용하여 수행된다. 마지막으로 커버글라스(1.5)가 장치에 접착되거나 150um TOPAS 포일이 최대 압력 0.51MPa 하에서 UV 및 열처리를 결합하여 장치를 밀봉하는 데 사용된다. 포일의 표면 거칠기는 장치를 밀봉하기 전에 실리콘 웨이퍼에서 전기도금된 2개의 평평한 니켈 판 사이에서 140℃ 및 5.1MPa에서 20분 동안 포일을 프레싱함에 의해 감소된다. 이렇게 하면 장치의 뚜껑이 광학적으로 평평하여 높은 NA 광학 현미경을 허용할 수 있다. 장치는 오일 TIRF 대물렌즈(100X /NA 1.49) 및 EMCCD 카메라 Hamamatsu ImageEM 512)가 장착된 도립 형광 현미경(Nikon Ti-E)에 장착된다. 유체는 0 내지 10mbar 범위인 압력에서 압력 컨트롤러(MFCS, Fluigent)를 사용하여 장치를 통해 구동된다. 장치는 에탄올로 프라이밍된 후 탈기되며 FACSFlow Sheath Fluid(BD Biosciences)는 흐름-신장 장치를 연결하는 마이크로채널을 제외한 모든 마이크로채널에 장입된다. 선택적 장입은, 흐름 신장 채널의 유출구에 양압을 가하는 동안, 용액이 도입되는 공급 채널의 유입구에서 양압을 유지하는 동안, 폐기 채널의 유출구에 음압 또는 흡입을 가하여 유효하게 된다. 단일-분자 이미징 및 전기영동에 적합한 완충액(0.5x TBE + 0.5% v/v Triton-X100 + 1% v/v 베타-메르캅토에탄올, BME)은 흐름-신장 장치의 채널에 장입된다. 이 완충액은 흐름-신장 섹션에서 DNA가 달라붙는 것을 방지하고 흐름-신장 섹션의 높이가 낮을 때 추출된 DNA의 도입을 방해할 수 있는 전기삼투 흐름을 억제한다.
단계 3: 세포 준비
LS174T 결장직장암 세포를 10% 소 태아 혈청(FBS; Autogen-Bioclear UK Ltd.) 및 1% 페니실린/스트렙토마이신(Lonza)이 있는 둘베코의 변형된 이글 배지(DMEM; Gibco)에서 배양한 후 FBS에서 10% DMSO에서 밀리리터당 1.7 106 세포의 농도로 동결한다. 해동 후, 세포 현탁액을 FACSFlow 완충액과 1:1로 혼합하고 28.8 x g(A-4-44, Eppendorf)에서 5분 동안 원심분리하고 FACSFlow 완충액에 재현탁한다. 마지막으로 세포를 1μM Calcein AM(Invitrogen)으로 염색하고 밀리리터당 0.35 106 세포로 칩에 장입한다. 약 5-10,000개 세포를 장입하고 각 트랩에 트랩된 제1 세포를 분석한다.
단계 4: 작동
세포와 완충액을 동시에 도입하여 트랩이 위치한 마이크로채널의 측벽을 따라 세포를 정렬한다. 최대 30nL/분의 트랩을 통한 완충액 흐름을 위해 단일 세포가 포획되고 트랩에 보관된다. 0.5x TBE + 0.5% v/v Triton-X100 + 0.1uM YOYO-1(Invitrogen)으로 구성된 용리 완충액을 유입구 중 하나에 장입하고 10분 동안 트랩을 통해 10nL/분으로 주입한다. 그런 다음 모든 웰에서 용액을 YOYO-1이 없는 완충액로 교환하여 염색을 중지한다. 다음으로, 세포 핵은 최대 300초 동안 1nW/(um)2의 청색 여기 광에 노출되어 DNA의 부분적 광자화를 유발한다(www.pnas.org/cgi/doi/10.1073/pnas.1804194115의 SI 부록 참조). 그런 다음 완충액을 BME(0.5x TBE + 0.5% v/v triton-X100 + 1% v/v BME)가 함유된 용액으로 변경하고 형광 램프의 강도를 여전히 형광 이미징이 허용되는 최소 강도로 낮춘다. 다음으로, 온도를 60℃로 올리고 단백질분해 용액(Proteinase K >200μg mL-1(Qiagen), 0.5x TBE + 0.5% v/v Triton-X100 + 1% v/v BME +200g/mL)이 도입되어 트랩을 통해 용해물을 밀어낸다. DNA는 인접한 흐름 신장 섹션을 통해 이동하고 오일 침지 대물렌즈는 단일 분자 이미징(100x, NA 1.49, 120-nm 픽셀 이미지 크기를 제공하는 추가 1.5x 배율을 가짐)을 위해 제자리로 이동된다. DNA 단편은 흐름-신장 섹션에 걸쳐 5 내지 10V의 전압을 적용함에 의해 전기영동을 사용하여 마이크로채널에서 흐름-신장 장치로 도입된다. DNA 단편의 양 말단이 반대 마이크로채널에 있으면 전압이 꺼진다. 100-150%로 신장된 분자의 450um 부분은 단일 세포에서 추출된 게놈 DNA의 > 1메가베이스 길이에 상응한다. 일부 실시형태에서, 단백질분해 후 DNA 내용물은 포획 완충액을 0.5xTBE로 대체함에 의해 장치를 통해 푸시되며; 이러한 실시형태에서 흐름 신장 섹션 치수는 선택적으로 더 커서 수천의 메가베이스 단편이 (소수성 또는 정전기적 상호작용에 의해) 동시적으로 포획되고 채널 내부에서 신장될 수 있다. 이것은 pH 완충액 8(예를 들어, HEPES)을 사용하여 수행되고 여기에서 결합된 커버글라스는 APTES 또는 폴리-리신과 같이 양으로 하전되거나 비닐실란 커버 유리가 결합되고 pH 5.5-5.7에서 0.5M MES 완충액은 DNA에서 유동하도록 사용되어 그 다음 MES 완충액이 공기와 함께 이어져 다듬어 진다. 또는 호일이 Zeonex를 포함하는 경우 분자 다듬기는 pH 5.7에서 0.6M MES 완충액으로 수행할 수 있다.
이중-가닥 표적 핵산이 이동억제화되면, 변성 용액, 0.5M NaOH 및/또는 6% DMSO가 이를 통해 흐른다. 그런 다음 단일 세포 샘플은 본 발명의 시퀀싱 방법을 위해 준비되며, 여기서 완전한 세트의 올리고뉴클레오티드 프로브 종이 이를 통해 흐르고 올리고뉴클레오티드 프로브 종 결합이 이미지화된다.
일부 실시형태에서, 세포 용리는 2단계이어서 RNA가 흐름 신장 섹션 내에서 오염되고 형광을 일으키지 않는다. 여기에서 제1 용리 완충액(예를 들어, DNA 개재 YOYO-1 염료가 추가된 0.5%(v/v) Triton X-100을 함유하는 0.5x TBE)이 적용된다. 이 완충액은 세포막을 용리하여 세포질 내용물을 10-20μl 뉴클레아제-유리 H2O로 채워진 트랩 유출구 안으로 방출하여 트랩에 DNA가 있는 핵을 남긴다(예를 들어, van Strijp 외 Sci Rep. 7:11030 (2017)에 기술된 바와 같음. 각 세포의 세포질 내용물은 용리 후 제거되고 폐기물 유출구 안으로 분로되거나 장치가 DNA에 대한 흐름 신장 섹션과 분리된 RNA에 대한 흐름-신장 섹션을 갖도록 설계된다. 일부 실시형태에서, RNA는 폴리A RNA를 포획하는 올리고 dT로 코팅된 별도의 흐름 신장 섹션으로 보내진다. 일부 실시양태에서, RNA에 대한 흐름 신장 섹션은 RNA가 포획되고 효소 시약을 사용하여, 예를 들어 말단 트랜스퍼라제에 의한 폴리A 추가를 사용하여, 포획 서열을 추가하는 나노웰 또는 나노피트를 포함한다(Marie 외, Nanoscale DOI: 10.1039/c7nr06016e) 2017). 핵 용리는 제2 완충액(0.5%(v/v) Triton X-100 및 단백질가수분해효소 K를 함유하는 0.5x TBE)으로 수행되고 DNA는 DNA에 대한 흐름-신장 섹션으로 분로된다.
핵산의 손실을 최소화하기 위해, 트랩 및 흐름 신장 섹션으로부터의 거리는 짧고, 장치 벽은 지질로 코팅함을 포함하여 잘 부동태화된다(예를 들어, Persson 외, Nanoletters 12:2260-5(2012)에 기술된 바와 같음).
인용된 참고문헌 및 대안적인 실시형태
본 명세서에 인용된 모든 참고문헌은 마치 각각의 개별 공보 또는 특허 또는 특허 출원이 모든 목적을 위해 그 전체가 참고로 포함되는 것으로 구체적이고 개별적으로 표시된 것처럼 모든 목적을 위해 그 전체가 참고로 본 명세서에 포함된다.
모든 표제 및 부-표제는 단지 편의를 위해 본 명세서에서 사용되며 어떤 식으로든 발명을 제한하는 것으로 해석되어서는 안된다.
본 명세서에 제공된 임의의 모든 예 또는 예시적인 언어(예를 들어, "예컨대")의 사용은 단지 발명을 더 잘 예시하기 위한 것이며 달리 청구되지 않는 한 범위를 제한하지 않는다. 명세서의 어떤 언어도 발명의 실행에 필수적인 것으로 청구되지 않은 임의의 요소를 나타내는 것으로 해석되어서는 안된다.
또한 제1, 제2 등의 용어가 다양한 요소를 기술하기 위해 본 명세서에서 사용되지만, 이들 요소는 이들 용어에 의해 제한되어서는 안된다는 것이 이해될 것이다. 이들 용어는 한 요소를 다른 요소와 구별하는 데만 사용된다. 예를 들어, 본 개시내용의 범주를 벗어나지 않으면서 제1 주제는 제2 주제로 명명될 수 있고, 유사하게 제2 주제도 제1 주제로 명명될 수 있다. 제1 주제와 제2 주제는 둘 다 주제이지만 동일한 주제는 아니다.
본 개시내용에서 사용된 용어는 단지 특정한 실시형태를 기술하기 위해 목적이고, 발명을 한정하려는 의도가 아니다. 설명 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥이 명백하게 달리 나타내지 않는 한 복수 형태도 포함하도록 의도된다. 또한 본 명세서에서 사용된 용어 "및/또는"은 연관된 열거된 항목 중 하나 이상의 임의의 및 모든 가능한 조합을 지칭하고 포함하는 것으로 이해될 것이다. 본 명세서에서 사용될 때 용어 "포함하다" 및/또는 "포함하는"은 명시된 특징, 정수, 단계, 작업, 요소 및/또는 성분의 존재를 특정하지만 하나 이상의 다른 특징, 정수, 단계, 연산, 요소, 성분 및/또는 이들의 군의 존재 또는 추가를 배제하지 않는다는 것이 추가로 이해될 것이다.
본 명세서에 사용된 바와 같이, 용어 "만약"은 문맥에 따라 "때" 또는 "시" 또는 "결정에 응답하여" 또는 "검출에 응답하여"를 의미하는 것으로 해석된다. 유사하게, 문구 "결정되는 경우" 또는 "[명시된 조건 또는 이벤트]가 검출되는 경우"는 문맥에 따라 "결정할 때" 또는 "결정에 응답하여" 또는 "(명시된 조건 또는 이벤트를) 검출할 때" 또는 "(명시된 조건 또는 이벤트를) 검출하는 것에 응답하여"를 의미하는 것으로 해석된다.
본 명세서에서 특허 문헌의 인용 및 통합은 편의를 위해서만 수행되며 이러한 특허 문헌의 유효성, 특허 가능성 및/또는 시행 가능성에 대한 견해를 반영하지 않는다.
본 발명은 비-일시적인 컴퓨터 판독 가능 저장 매체에 내장된 컴퓨터 프로그램 기전을 포함하는 컴퓨터 프로그램 제품으로 구현될 수 있다. 예를 들어, 컴퓨터 프로그램 제품은 도 1a의 임의의 조합에 도시된 프로그램 모듈을 함유할 수 있다. 이들 프로그램 모듈은 CD-ROM, DVD, 자기 디스크 저장 제품, USB 키 또는 임의의 기타 비-일시적인 컴퓨터 판독 가능 데이터 또는 프로그램 저장 제품에 저장할 수 있다.
명세서 내의 실시형태는 발명의 실시형태의 예시를 제공하며 발명의 범주를 제한하는 것으로 해석되어서는 안된다. 숙련된 기술자는 많은 다른 양태 및 실시형태가 본 발명의 방법에 포괄된다는 것을 인식할 것이다. 아래에 제공된 발명의 실시형태 및 기술적 세부사항은 숙련된 기술자에 의해 변경될 수 있고 과도한 실험 또는 재-발명 없이 테스트되고 체계적으로 최적화될 수 있다.
발명은 명세서의 교시 및 그 안에 인용된 참고문헌에 비추어 가장 철저하게 이해된다. 당업자에게 명백한 바와 같이, 그 사상 및 범주를 벗어나지 않고 많은 변형 및 변경이 이루어질 수 있다. 본 명세서에 기술된 특정 실시형태는 단지 예로서 제공되는 것이다. 실시형태는 원리 및 그 실제 적용을 가장 잘 설명하기 위해 선택되고 기술되어, 이에 의해 당업자가 발명 및 고려되는 특정 용도에 적합한 다양한 변형을 갖는 다양한 실시형태를 가장 잘 활용할 수 있도록 한다. 발명은 첨부된 청구범위의 관점에 의해서만 제한되며, 그러한 청구범위가 부여되는 등가물의 전체 범위와 함께 제한된다.

Claims (37)

  1. 핵산을 시퀀싱하는 방법으로서, 상기 방법은:
    (a) 테스트 기판 상에 선형화된 연장된/연신된 형태로 핵산을 고정하고 이에 의해 고정된 연장된/연신된 핵산을 형성하는 단계;
    (b) 고정된 연장된/연신된 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 노출시키는 단계로서, 여기서 올리고뉴클레오티드 프로브 종의 세트에서 각 올리고뉴클레오티드 프로브 종은 A, C, G, T 염기로부터 하나의 정의된 뉴클레오티드 및 하나 이상의 축퇴 위치를 포함하는 미리결정된 길이의 프로브 종의 라이브러리이며, 각각의 축퇴 위치는 A, C, G, T 염기 또는 보편적인 염기 유사체의 혼합물 중 하나를 포함하며, 상기 노출시키는 단계 (b)는 각각의 올리고뉴클레오티드 프로브 종의 개별 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 핵산의 하나 이상의 부분에 일시적이고 가역적으로 결합하고 이에 의해 광학 활성의 각각의 경우에 대해 증가를 제공할 수 있는 조건하에서 발생하는, 단계;
    (c) 이미징 장치를 사용하여 노출 (b) 동안 또는 후에 발생하는 각각의 광학 활성의 각각의 경우의 테스트 기판 상의 장소를 측정하는 단계;
    (d) 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복하고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득하는 단계로서, 테스트 기판 상의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종의 세트에서의 올리고뉴클레오티드 프로브 종에 상응하는, 단계; 및
    (e) 복수의 위치 세트에 의해 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계를 포함하는, 방법.
  2. 제1항에 있어서, 상기 광학 활성은 올리고뉴클레오티드 종 상의 표지에 기인하고, 상기 표지는 나노입자, 형광 분자 구조를 포함하는, 방법.
  3. 제2항에 있어서, 각 올리고뉴클레오티드 종은 다른 표지와 구별되도록 허용하는 별개의 표지로 표지되는, 방법.
  4. 제1항에 있어서, 상기 광학 활성은 하나 이상의 개재하는 염료 분자를 포함하는 듀플렉스 인식 모이어티에 의한 결합 상호작용의 표지화에 기인하는, 방법.
  5. 제1항에 있어서, 상기 광학 활성은 벌크 용액이 아닌 고정된 연장된/신장된 핵산 부근에서만 검출되는, 방법.
  6. 제5항에 있어서, 상기 광학 활성은 FRET를 통해 검출되거나, 표지는 고정된 연장된/신장된 핵산 부근에 있을 때까지 켄칭되거나 형광성인, 방법.
  7. 제5항에 있어서, 상기 올리고는 각 말단에 Cy3 모이어티를 포함하는 이중-표지된 상기 이중 표지화이며, 이는 염료-염료 상호작용에 의해 벌크 용액에서 실질적으로 켄칭되지만 결합시 형광을 발하는, 방법.
  8. 제1항에 있어서, 상기 고정된 연장된/신장된 핵산은 단일 가닥인, 방법.
  9. 제1항에 있어서, 드리프트는 기판 스테이지를 대물 렌즈에 잠금함에 의해 최소화되는, 방법.
  10. 제1항에 있어서, 상기 드리프트는 보정되는, 방법.
  11. 제1항에 있어서, 망선상 기준점 드리프트 보정 마커는 고정된 연장된/신장된 핵산 부근에서 기판 상에 제공되는, 방법.
  12. 제10항에 있어서, 상기 망선상 기준점 드리프트 보정 마커는 공간적으로 어드레스할 수 있는 형광 신호를 포함하는 오리가미 격자를 포함하는, 방법.
  13. 제11항에 있어서, 상기 공간적으로 어드레스할 수 있는 형광 신호는 일시적이고 PAINT 또는 DNA PAINT 방법에 따른 이미저의 결합에 기인하는, 방법.
  14. 제3항에 있어서, 상기 올리고 프로브 종의 세트는 고정된 연장된/신장된 핵산에 동시적으로 노출되고 이들을 다른 표지와 구별되도록 허용하는 그의 별개의 표지가 각각 검출되는, 방법.
  15. 제1항에 있어서, 각각 서열 5'NNNXNNN3'의 라이브러리를 포함하는 4개 프로브 종이 사용되며, 여기서 N은 축퇴 위치이고 X는 각각 차별적으로 표지된 4개 뉴클레오티드인, 방법.
  16. 핵산을 시퀀싱하는 방법으로서, 상기 방법은:
    (a) 테스트 기판 상에 선형화된 연장된/연신된 형태로 핵산을 고정하고 이에 의해 고정된 연장된/연신된 핵산을 형성하는 단계;
    (b) 상기 고정된 연장된/연신된 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 노출시키는 단계로서, 여기서 올리고뉴클레오티드 프로브 종의 세트에서 각 올리고뉴클레오티드 프로브 종은 각각 A, C, G, T 염기를 포함하는 2개 이상의 정의된 뉴클레오티드 위치 및 하나 이상의 축퇴 위치를 포함하는 미리결정된 길이의 프로브 종의 라이브러리이며, 각각의 축퇴 위치는 A, C, G, T 염기 또는 보편적인 염기 유사체의 혼합물을 포함하며, 노출 (b)는 각각의 올리고뉴클레오티드 프로브 종의 개별 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 핵산의 하나 이상의 부분에 일시적이고 가역적으로 결합하고 이에 의해 광학 활성의 각각의 경우에 대해 증가를 제공할 수 있는 조건하에서 발생하는, 단계;
    (c) 이미징 장치를 사용하여 노출 (b) 동안 또는 후에 발생하는 각각의 광학 활성의 각각의 경우의 테스트 기판 상의 장소를 측정하는 단계;
    (d) 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복하고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득하는 단계로서, 테스트 기판 상의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종의 세트에서의 올리고뉴클레오티드 프로브 종에 상응하는, 단계; 및
    (e) 복수의 위치 세트에 의해 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계를 포함하는, 방법.
  17. 핵산을 시퀀싱하는 방법으로서, 상기 방법은:
    (a) 테스트 기판 상에 선형화된 연장된/연신된 형태로 핵산을 고정하고 이에 의해 고정된 연장된/연신된 핵산을 형성하는 단계;
    (b) 상기 고정된 연장된/연신된 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 노출시키는 단계로서, 여기서 올리고뉴클레오티드 프로브 종의 세트에서 각 올리고뉴클레오티드 프로브 종은 각각 A, C, G, T 염기를 포함하는 2개 이상의 정의된 뉴클레오티드 위치 및 하나 이상의 축퇴 위치를 포함하는 미리결정된 길이의 프로브 종의 라이브러리이며, 각각의 축퇴 위치는 A, C, G, T 염기 또는 보편적인 염기 유사체의 혼합물을 포함하며, 노출 (b)는 각각의 올리고뉴클레오티드 프로브 종의 개별 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정된 핵산의 하나 이상의 부분에 안정적으로 결합하고 이에 의해 조명 시 고정된 핵산의 하나 이상의 부분에 상응하는 기판 상의 하나 이상의 장소에서 광학 활성의 각각의 경우에 대해 증가를 제공할 수 있는 조건하에서 발생하는, 단계;
    (c) 광학 활성의 경우를 탈색하여 광학 활성의 경우의 단계별 손실이 이미징 장치를 사용하여 측정/기록되도록 하는 단계;
    (d) 결합된 올리고뉴클레오티드 프로브가 비결합되도록 하는 조건에 고정된 연장된/신장된 핵산을 노출시키는 단계; 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복하고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득하는 단계로서, 테스트 기판 상의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종의 세트에서의 올리고뉴클레오티드 프로브 종에 상응하는, 단계
    (e) 광학 활성의 각 경우의 나노미터/미세-조정된 장소를 계산하기 위해 단일 분자 국지화 알고리즘을 사용하는 단계: 및
    (f) 복수의 위치 세트에 의해 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계를 포함하는, 방법.
  18. 제16항에 있어서, 상기 올리고뉴클레오티드 종은 하기를 포함하는, 방법:
    5'NNnNnNN3' 여기서 N 또는 n은 특정된 또는 축퇴 위치이고 N= LNA 모이어티 및 n= 데옥시리보스 모이어티임.
  19. 제16항에 있어서, 상기 올리고뉴클레오티드 종은 5' cy3 NTgGcGN 3', 5' cy3B NTgGcGN 3', 5'Atto 542 NTgGcGN 3'를 포함하는, 방법.
  20. 제16항에 있어서, 상기 핵산이 이중 가닥인 경우 두 가닥은 변성되고, 두 가닥 모두는 기판 상에 위치하고 개별 프로브가 결합하는 가닥은 기판에 결합하는 올리고뉴클레오티드 프로브 종의 서열에서 중첩으로부터 각 가닥에 대한 타일링 경로를 구성함에 의해 펼쳐지는, 방법.
  21. 핵산을 시퀀싱하는 방법으로서, 상기 방법은:
    (a) 테스트 기판에 핵산을 고정/이동억제화(fixing/immobilizing)하고 이에 의해 고정/이동억제된 핵산을 형성하는 단계;
    (b) 고정/이동억제된 핵산을 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 노출시키는 단계로서, 여기서 노출 (b)는 각각의 올리고뉴클레오티드 프로브 종의 개별 프로브가 각각의 올리고뉴클레오티드 프로브 종에 상보적인 고정/이동억제된 핵산의 하나 이상의 부분에 결합하고 이에 의해 광학 활성의 각각의 경우에 대해 증가를 제공할 수 있는 조건하에서 발생하는, 단계;
    (c) 이미징 장치를 사용하여 노출 (b) 동안 또는 후에 발생하는 각각의 광학 활성의 각각의 경우의 테스트 기판 상의 장소를 측정하는 단계;
    (d) 올리고뉴클레오티드 프로브 종의 세트에서 각각의 올리고뉴클레오티드 프로브 종에 대해 노출 (b) 및 측정 (c)를 반복하고, 이에 의해 테스트 기판 상의 복수의 위치 세트를 획득하는 단계로서, 테스트 기판 상의 위치의 각각의 각 세트는 올리고뉴클레오티드 프로브 종의 세트에서의 올리고뉴클레오티드 프로브 종에 상응하는, 단계; 및
    (e) 복수의 위치 세트에 의해 표시되는 테스트 기판 상의 위치를 축적함에 의해 테스트 기판 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계를 포함하는, 방법.
  22. 제20항에 있어서, 각 프로브 종의 다중 온-오프 결합 이벤트를 사용하여 테스트 기판 상의 위치의 세트를 획득하는, 방법.
  23. 제21항 또는 제22항에 있어서, 실질적인 수(예를 들어, >70%)의 이벤트는 하위-회절 정밀도에 국지화된 단일 분자인, 방법.
  24. 제21항에 있어서, 올리고뉴클레오티드는 하기 구조를 포함하는, 방법:
    프로브 서열-스페이서-차폐-표지, 여기서 프로브 서열은 축퇴 염기 위치 및/또는 특정 염기 위치를 포함하는 핵산 서열을 포함하고; 스페이서는 화학적 링커(예를 들어, 헥사에틸렌 글리콜의 여러 커플링) 또는 핵산 서열(예를 들어, 18mer 서열)을 포함하고, 상기 링커는 이작용성이고 프로브 서열을 차폐 또는 표지에 연결할 수 있고; 차폐는 단백질(예를 들어, 스트렙타비딘)을 포함하고; 표지는 형광 표지 또는, 형광 표지 또는 분자 이미저에 대한 도킹 부위로 작용하는 태그를 포함함.
  25. 제21항에 있어서, 상기 스페이서 및/또는 차폐는 부재인, 방법.
  26. 제21항에 있어서, 산소 소거/형광 촉진 분자 시스템이 이미징 동안 제공되고, 상기 시스템은 (a) 피라노스 산화효소, 카탈라제, 글루코스; (b) 프로토카테츄에이트-디옥시게나제,3,4-프로토카테츄산 (c) 카탈라제, 글루코스 산화효소, 수크로스 또는 글루코스 (d) 메틸렌 블루 및 디티오트롤(DTT); (e) 베타 메르캅토에탄올, TCEP 또는 디티오트롤(DTT)을 포함하는 환원제; (f) 트롤록스, 1,3,5,7 사이클로옥타테트라엔 및/또는 4-니트로벤질알콜을 포함하는 삼중항 상태 소광제/형광 촉진제를 포함하는, 방법.
  27. 제21항에 있어서, 상기 올리고는 형광으로 표지된 올리고뉴클레오티드의 고농도(>100nM)를 포함하고 이러한 고농도로 인한 배경은 FRET, 켄칭, 형광원성, 광-활성화, 형광 케이징을 포함하는 기전을 사용함에 의해 회피되는, 방법.
  28. 제20항에 있어서, 상기 핵산은 무세포 핵산인, 방법.
  29. 제27항에 있어서, 이동억제화는 ph5.5-6 MES의 존재에서 비닐 실란 또는 제오넥스 표면에 핵산의 말단 중 하나에서 무세포 염기의 결합을 포함하는 소수성 표면에 비변형된 핵산의 말단의 부착을 포함하는, 방법.
  30. 제27항에 있어서, 이동억제화는 말단 트랜스퍼라제를 사용하여 무세포 핵산의 말단을 뉴클레오티드로 테일링하는 단계 및 테일을 표면 이동억제된 상보적 핵산에 혼성화하는 단계를 포함하는, 방법.
  31. 제27항에 있어서, 이동억제화는 무세포 핵산을 원형화하는 단계 및 원형 증폭을 롤링함에 의해 증폭하고 단일-가닥 앰플리콘을 이동억제화하는 단계를 포함하는, 방법.
  32. 제21항 내지 제31항 중 어느 한 항에 있어서, 상기 앰플리콘은 기판 상에서 연장되거나 신장되는, 방법.
  33. 제30항에 있어서, 상기 앰플리콘은 볼-유사 구조로 응축되고 기판 상에 이동억제/고정되는, 방법.
  34. 제27항에 있어서, 상기 무세포 핵산의 게놈 기원은 하나 이상의 올리고뉴클레오티드 종의 결합에 의해 결정/식별되는, 방법.
  35. 제33항에 있어서, 상기 상이한 염색체 또는 게놈 영역의 비율은 그의 게놈 기원에 따라 식별된 핵산 분자의 수를 계수함에 의해 결정되는, 방법.
  36. 제34항에 있어서, 상기 샘플의 태아 분획이 결정되는, 방법.
  37. 제33항에 있어서, 단일 뉴클레오티드 변이체 또는 삽입결실(indel)은 그의 게놈 기원에 따라 식별된 핵산 분자에 대한 하나 이상의 올리고의 결합을 분석함에 의해 결정되는, 방법.
KR1020217042217A 2019-05-29 2020-05-27 출현에 의한 시퀀싱 KR20220034054A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/425,929 US11427867B2 (en) 2017-11-29 2019-05-29 Sequencing by emergence
US16/425,929 2019-05-29
PCT/US2020/034726 WO2020243187A1 (en) 2019-05-29 2020-05-27 Sequencing by emergence

Publications (1)

Publication Number Publication Date
KR20220034054A true KR20220034054A (ko) 2022-03-17

Family

ID=73553066

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020217042217A KR20220034054A (ko) 2019-05-29 2020-05-27 출현에 의한 시퀀싱

Country Status (7)

Country Link
EP (1) EP3976828A4 (ko)
JP (1) JP2022534920A (ko)
KR (1) KR20220034054A (ko)
CN (1) CN114207149A (ko)
AU (1) AU2020282704A1 (ko)
CA (1) CA3140900A1 (ko)
WO (1) WO2020243187A1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4320268A2 (en) * 2021-04-06 2024-02-14 XGenomes Corp. Systems, methods, and compositions for detecting epigenetic modifications of nucleic acids
EP4216220A1 (en) * 2022-01-25 2023-07-26 Leica Microsystems CMS GmbH Data storage device and method for storing data
WO2023250364A1 (en) * 2022-06-21 2023-12-28 Nautilus Subsidiary, Inc. Method for detecting analytes at sites of optically non-resolvable distances
CN116596933B (zh) * 2023-07-18 2023-09-29 深圳赛陆医疗科技有限公司 碱基簇检测方法及装置、基因测序仪及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2755149B1 (fr) * 1996-10-30 1999-01-15 Pasteur Institut Procede de diagnostic de maladies genetiques par peignage moleculaire et coffret de diagnostic
US7071324B2 (en) * 1998-10-13 2006-07-04 Brown University Research Foundation Systems and methods for sequencing by hybridization
AU2002367466A1 (en) * 2001-07-15 2003-10-08 Keck Graduate Institute Amplification of nucleic acid fragments using nicking agents
US7276338B2 (en) * 2003-11-17 2007-10-02 Jacobson Joseph M Nucleotide sequencing via repetitive single molecule hybridization
EP3411494A4 (en) * 2015-11-18 2020-03-11 Kalim U. Mir HIGH-RESOLUTION SEQUENCING
EP3717645A4 (en) * 2017-11-29 2021-09-01 XGenomes Corp. NUCLEIC ACID SEQUENCING BY EMERGENCE

Also Published As

Publication number Publication date
AU2020282704A1 (en) 2022-01-27
WO2020243187A1 (en) 2020-12-03
CA3140900A1 (en) 2020-12-03
EP3976828A1 (en) 2022-04-06
CN114207149A (zh) 2022-03-18
EP3976828A4 (en) 2023-06-28
JP2022534920A (ja) 2022-08-04

Similar Documents

Publication Publication Date Title
US20240117413A1 (en) Sequencing by emergence
US11427867B2 (en) Sequencing by emergence
JP7137595B2 (ja) 化学組成物とそれを利用する方法
KR20220034054A (ko) 출현에 의한 시퀀싱
US10233443B2 (en) Reducing adapter dimer formation
KR20190034164A (ko) 단일 세포 전체 게놈 라이브러리 및 이의 제조를 위한 조합 인덱싱 방법
US20100143932A1 (en) Single molecule sequencing of captured nucleic acids
US11827930B2 (en) Methods of sequencing with linked fragments
JP2020513741A (ja) 連結型ライゲーション
US20220359040A1 (en) Systems and methods for determining sequence
US10851411B2 (en) Molecular identification with subnanometer localization accuracy
US20200082913A1 (en) Systems and methods for determining sequence
US20210198731A1 (en) Linked target capture and ligation
US20220073980A1 (en) Sequencing by coalescence