KR20200105660A - 출현에 의한 핵산의 서열결정 - Google Patents

출현에 의한 핵산의 서열결정 Download PDF

Info

Publication number
KR20200105660A
KR20200105660A KR1020207018498A KR20207018498A KR20200105660A KR 20200105660 A KR20200105660 A KR 20200105660A KR 1020207018498 A KR1020207018498 A KR 1020207018498A KR 20207018498 A KR20207018498 A KR 20207018498A KR 20200105660 A KR20200105660 A KR 20200105660A
Authority
KR
South Korea
Prior art keywords
immobilized
strand
nucleic acid
optical activity
instance
Prior art date
Application number
KR1020207018498A
Other languages
English (en)
Inventor
카림 미어
Original Assignee
엑스게놈스 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엑스게놈스 코포레이션 filed Critical 엑스게놈스 코포레이션
Publication of KR20200105660A publication Critical patent/KR20200105660A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/113Heteroduplex formation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/173Nucleic acid detection characterized by the use of physical, structural and functional properties staining/intercalating agent, e.g. ethidium bromide

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Software Systems (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)

Abstract

핵산 서열결정을 위한 시스템 및 방법이 제공된다. 핵산은 시험 기질 상에 이중 가닥의 선형의 신장된 형태로 고정되고, 그 후 기질 상에 단일 가닥 형태로 변성되어 상기 핵산의 인접한 고정된 제1 가닥 및 제2 가닥이 수득된다. 상기 가닥은, 프로브가 상기 고정된 제1 가닥 또는 제2 가닥의 상응하는 상보성 부분과 헤테로듀플렉스 가닥을 형성함으로써 광학 활성의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출된다. 영상화기는 상기 광학 활성의 기질 상의 장소 및 지속기간을 측정한다. 상기 노출 및 측정은 상기 프로브의 세트 내의 프로브에 대해서 반복되어 복수의 위치 세트를 수득한다. 상기 핵산 서열은 상기 세트 내의 상기 위치의 컴파일링을 통해서 상기 복수의 위치 세트로부터 결정된다.

Description

출현에 의한 핵산의 서열결정
관련 출원의 상호 참조
본 출원은 미국 특허 출원 제62/591,850호(출원일: 2017년 11월 29일, 발명의 명칭: "Sequencing by Emergence")에 대한 우선권을 주장하며, 이 기초출원은 본 명세서에 참조에 의해 원용된다.
기술분야
본 개시내용은 일반적으로 하나 이상의 폴리뉴클레오타이드에 대한 프로브의 일시적인 결합을 통해서 핵산을 서열결정(sequencing)하기 위한 시스템 및 방법에 관한 것이다.
DNA 서열결정은 전기영동 기반 방법: 다이데옥시 쇄 종결 방법(예를 들어, 문헌[Sanger et al., Proc. Natl. Acad. Sci. 74:5463-5467, 1977]) 및 화학적 분해 방법(예를 들어, 문헌[Maxam et al., Proc. Natl. Acad. Sci. 74:560-564, 1977])를 사용하여 최초로 실현되었다. 이러한 뉴클레오타이드의 서열결정 방법은 시간 소모적이고, 고비용이었다. 그럼에도 불구하고, 전자는 최초로 인간 게놈의 서열결정으로 이어졌지만, 10년 초과 동안 수 억 달러가 소비되었다.
개인 맞춤 의학적 케어의 꿈이 실현될 수록, 개별 인간 게놈을 서열결정하기 위한 저비용인 대규모 방법에 대한 필요성이 증가하고 있다Mir, Sequencing Genomes: From Individuals to Populations, Briefings in Functional Genomics and Proteomics, 8: 367-378, 2009). 겔 전기영동을 회피하는(그리고 그 다음 저비용인) 몇몇 서열결정 방법이 "차세대 서열결정"으로서 개발되었다. (일루미나사에 의해서 실시된 바와 같은) 가역적 종결인자(reversible terminator)를 사용한 이러한 하나의 서열결정 방법이 우세하다. 생어(Sanger) 서열결정 및 현재 우세한 일루미나 기술의 가장 발달된 형태에서 사용되는 검출 방법은 형광을 포함한다. 단일 뉴클레오타이드 삽입물을 검출하는 다른 가능한 수단은 양성자 방출을 사용한(예를 들어, 전계 효과 트랜지스터, 나노기공을 통한 이온 전류 및 전자 현미경을 통한) 검출을 포함한다. 일루미나사의 화학은 가역적인 종결인자를 사용한 뉴클레오타이드의 주기적 첨가를 포함하며(Canard et al., Metzker Nucleic Acids Research 22:4259-4267, 1994), 이것은 형광 표지를 보유한다(Bentley et al., Nature 456:53-59, 2008). 일루미나 서열결정은 단일 게놈 분자를 클론에 의해서 증폭시키는 것으로 시작하고, 표적 게놈을, 이어서 클러스터로서 클론에 의해서 증폭되는 라이브러리로 전환시키기 위해서 실질적인 업프론트(upfront) 샘플 가공이 필요하다.
그러나, 서열결정 이전에 증폭에 대한 필요성을 회피하는 2가지 방법이 시장에 도달하였다. 새로운 방법 둘 다는 DNA의 단일 분자 상에서의 합성에 의한 형광 서열결정(Sequencing by Synthesis)(SbS)을 수행한다. 헬리코스바이오사(HelicosBio)(현재 SeqLL)로부터의 제1 방법은 가역적 종결을 사용한 단계식 SbS를 수행한다(Harris et al., Science, 320:106-9, 2008). 제2 방법인 퍼시픽 바이오사이언시스사(Pacific Biosciences)로부터의 SMRT 서열결정은 뉴클레오타이드를 혼입하는 반응의 자연 이탈기인 말단 포스페이트 상에 표지를 사용하는데, 이것이 서열결정을 연속적으로 그리고 시약 교환 필요성 없이 수행하는 것을 가능하게 한다. 이러한 접근법의 불리한 면 중 하나는, 검출기가 하나의 시야 상에 고정될 필요가 있기 때문에 처리량이 낮다는 것이다(예를 들어, 문헌[Levene et al., Science 299:682-686, 2003 및 Eid et al., Science, 323:133-8, 2009]). 퍼시픽 바이오사이언스사 서열결정과 다소 유사한 접근법은, 광학 방법을 통해서라기 보다는, 나노기공을 통해서 SbS를 검출함으로써 제니아사(Genia)(현재 로슈사(Roche)의 일부)에 의해서 개발된 방법이다.
가장 일반적으로 사용되는 서열결정 방법은 판독물 길이(read length)로 제한되는데, 이것은 서열결정 비용 및 생성된 판독물을 조립하는 어려움 둘 다를 증가시킨다. 생어 서열결정에 의해서 획득된 판독물 길이는 1000개 염기 길이이다(예를 들어, Kchouk et al., Biol. Med. 9:395, 2017). 로슈 454 서열결정 및 이온 토렌트(Ion Torrent) 둘 다는 수 백 개 염기 범위의 판독물 길이를 갖는다. 약 25개 염기의 판독물에서 먼저 시작된 일루미나 서열결정은 현재 전형적으로 150 내지 300개 염기쌍 판독물이다. 그러나, 판독물 길이의 각각의 염기를 위해서 새로운 시약이 공급될 필요가 있기 때문에, 25개보다 250개의 염기를 서열결정하는 것은 10x 초과의 시간 및 10x 초과의 고비용 시약이 필요하다. 최근에, 일루미나 장비의 표준 판독물-길이는 대략 150개 염기까지 감소되었는데, 아마도 그 이유는 이의 기술이 판독물이 더 길어짐에 따라서 오류를 도입하는 페이징(phasing)(클러스터 내의 분자가 동기화를 벗어남)에 적용되기 때문일 것이다.
상업적인 시스템에 가능한 가장 긴 판독물 길이는 옥스포드 나노포어 기술(Oxford Nanopores Technology: ONT) 및 퍼시픽 바이오사이언스(Pacific Bioscience: PacBio) 서열결정으로부터의 나노기공 가닥 서열결정에 의해서 획득된다(예를 들어, 문헌[Kchouk et al., Biol. Med. 9:395, 2017]). 후자는 평균 약 10,000개 염기 길이를 판독하였지만, 매우 드문 경우에 전자는 수 백 킬로베이스 길이인 판독물을 얻을 수 있다(예를 들어, 문헌[Laver et al., Biomol. Det. Quant. 3:1-8, 2015]). 이러한 더 긴 판독물 길이가 정렬의 관점에서 바람직하지만, 이것은 정확성을 희생시킨다. 정확성은 보통 너무 낮아서 대부분의 인간 서열결정 응용의 경우 이러한 방법은 독립형 서열결정 기술이 아닌 일루미나 서열결정의 보충수단으로서만 사용될 수 있다. 더욱이, 기존의 긴-판독물 기술의 처리량은 일상적인 인간 게놈 규모 서열결정의 경우에는 너무 낮다.
ONT 및 PacBio 서열결정뿐만 아니라, 그 자체는 서열결정 기술이 아닌 다수의 접근법이 존재하지만, 더 긴 판독물을 구축하기 위한 스캐폴드를 제공하기 위한 일루미나 짧은 판독물 서열결정 기술을 보충하는 샘플 제조 접근법이다. 이들 중에서, 하나는 10X 제노믹스사(10X Genomics)에 의해서 개발된 소적 기반 기술(droplet based technology)인데, 이것은 소적 내에 100 내지 200kb 단편(예를 들어, 추출 후 단편의 평균 길이 범위)을 단리시키고, 그것을 각각 그것이 기원한 100 내지 200kb에 특이적인 서열 식별자 태그를 함유하는 더 짧은 길이 단편의 라이브러리로 가공하며, 이것은 다수의 소적으로부터의 게놈을 서열결정할 때, 약 50 내지 200Kb 버킷(bucket)으로 디콘볼빙(deconvolving)될 수 있다(Goodwin et al., Nat. Rev. Genetics 17:333-351, 2016). 또 다른 접근법은 바이오나노 제노믹스사(Bionano Genomics)에 의해서 개발되었는데, 이것은 신장시키고, 니킹(nicking) 엔도뉴클레아제에 대한 노출을 통해서 DNA에서 닉(nick)을 유도한다. 이 방법은 니킹 지점을 형광에 의해서 검출하여 분자의 맵 또는 스캐폴드를 제공한다. 이 방법은 현재 게놈을 조립하는데 도움을 주기에 충분한 밀도를 갖도록 개발되지 않았지만, 그럼에도 불구하고 이 방법은 게놈의 직접 가시화를 제공하고, 큰 구조 변이를 검출하고, 긴 범위의 일배체형을 결정할 수 있다.
개발된 상이한 서열결정 방법 및 서열결정 비용을 감소시키는 일반적인 경향에도 불구하고, 인간 게놈의 크기는 환자에 대한 높은 서열결정 비용으로 계속 이어진다. 개별 인간 게놈은 46개의 염색체로 구성되는데, 이 중 가장 짧은 것은 약 50 메가베이스이고, 가장 긴 것은 250 메가베이스이다. NGS 서열결정 방법은, 분석을 위해서 필요한 시간을 실질적으로 증가시킬 수 있는 참조 게놈에 대한 신뢰도를 비롯하여, 성능에 영향을 미치는 다수의 문제를 여전히 갖는다(예를 들어, 문헌[Kulkarni et al., Comput Struct Biotechnol J. 15:471-477, 2017]에 논의됨).
상기 배경기술을 고려할 때, 당업계에서 필요한 것은 시약 및 시간 사용에서 효율적이고, 정확성의 손실 없이 긴 일배체형-리졸빙된(haplotype-resolved) 판독물을 제공하는 독립형 서열결정 기술을 제공하기 위한 장치, 시스템 및 방법이다.
본 배경기술 부분에 개시된 정보는 단지 일반적인 배경기술의 이해를 향상시키기 위함이며, 본 정보가 당업자에게 이미 공지된 선행 기술을 형성한다는 임의의 형태의 시사 또는 시인으로서 간주되어서는 안 된다.
본 개시내용은 개선된 핵산 서열결정 기술을 제공하기 위한 장치, 시스템 및 방법에 대한 당업계에서의 필요성을 다룬다. 넓은 일 양상에서, 본 개시내용은 분자 프로브를 분자의 하나 이상의 단위에 결합시킴으로써 다중-단위 분자의 적어도 하나의 단위를 식별하는 단계를 포함한다. 본 개시내용은 분자 프로브의 하나 이상의 종과 분자의 단일 분자 상호작용의 검출을 기초로 한다. 일부 실시형태에서 프로브는 분자의 적어도 하나의 단위에 일시적으로 결합한다. 일부 실시형태에서 프로브는 분자의 적어도 하나의 단위에 반복적으로 결합한다. 일부 실시형태에서 분자 엔티티(entity)는 나노분자, 표면 또는 매트릭스 상에 나노단위(nanometric) 정확성으로 국지화된다.
일 양상에서, 본 명세서에는 핵산의 서열결정 방법이 개시된다. 방법은 (a) 핵산을 시험 기질 상에 이중 가닥의 선형의 신장된 형태(double-stranded linearized stretched form)로 고정(fixing)시킴으로써 고정되고 신장된 이중 가닥 핵산을 형성하는 단계를 포함한다. 방법은 (b) 고정되고 신장된 이중 가닥 핵산을 시험 기질 상에 단일 가닥 형태로 변성(denaturing)시킴으로써 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 단계로서, 고정된 제2 가닥의 각자의 염기는 고정된 제1 가닥의 상응하는 상보성 염기에 인접하게 놓이는, 상기 단계를 포함한다. 방법은 (c) 고정된 제1 가닥 및 고정된 제2 가닥을 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀(pool)에 노출시키는 단계로서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖는, 상기 단계에 의해서 계속된다. 노출시키는 단계 (c)는 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥의 일부 또는 고정된 제2 가닥의 각각의 일부에 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 각자의 인스턴스(respective instance of optical activity)를 발생시키는 것을 허용하는 조건 하에서 일어난다. 방법은 (d) 2차원 영상화기를 사용하여 노출시키는 단계 (c) 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 시험 기질 상의 장소 및 지속기간을 측정하는 단계로 계속된다. 이어서, 방법은 (e) 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 노출시키는 단계 (c) 및 측정하는 단계 (d)를 반복함으로써, 시험 기질 상의 복수의 위치 세트를 획득하는 단계로 진행된다. 시험 기질 상의 각각의 각자의 위치 세트는 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응한다. 방법은 (f) 복수의 위치 세트에 의해서 표현된 시험 기질 상의 위치를 컴파일링함으로써 시험 기질 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계를 추가로 포함한다.
일부 실시형태에서, 노출시키는 단계 (c)는 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 개별 프로브에 상보성인 고정된 제1 가닥의 각각의 일부 또는 고정된 제2 가닥의 각각의 일부에 일시적으로 그리고 가역적으로 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어난다. 일부 실시형태에서, 노출시키는 단계 (c)는 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 개별 프로브에 상보성인 고정된 제1 가닥의 각각의 일부 또는 고정된 제2 가닥의 각각의 일부에 반복적으로 일시적으로 그리고 가역적으로 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 각자의 인스턴스를 반복적으로 발생시키는 것을 허용하는 조건 하에서 일어난다. 일부 이러한 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 표지(예를 들어, 염료, 형광 나노입자 또는 광 산란 입자)와 결합되어 있다.
일부 실시형태에서, 제1항의 방법에서, 노출시키는 단계는 인터칼레이팅 염료(intercalating dye)의 형태의 제1 표지의 존재 하에서 일어나고, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지와 결합되어 있고, 제1 표지 및 제2 표지는, 제1 표지 및 제2 표지가 서로에 인접하는 경우 제1 표지 및 제2 표지 중 하나가 형광을 내도록 하는 중첩된 공여자 방출 및 수용자 여기 스펙트럼을 갖고, 그리고 광학 활성의 각자의 인스턴스는 올리고뉴클레오타이드와 고정된 제1 가닥 또는 고정된 제2 가닥 간의 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래된다.
일부 실시형태에서, 노출시키는 단계는 인터칼레이팅 염료의 형태의 제1 표지의 존재 하에서 일어나고, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지와 결합되어 있고, 제1 표지는 제1 표지와 제2 표지가 서로 인접할 때 제2 표지가 형광을 내도록 하고, 광학 활성의 각자의 인스턴스는 올리고뉴클레오타이드와 고정된 제1 가닥 또는 고정된 제2 가닥 간의 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래된다.
일부 실시형태에서, 노출시키는 단계는 인터칼레이팅 염료의 형태의 제1 표지의 존재 하에서 일어나고, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지와 결합되어 있고, 제2 표지는 제1 표지와 제2 표지가 서로 인접할 때 제1 표지가 형광을 내도록 하고, 광학 활성의 각자의 인스턴스는 올리고뉴클레오타이드와 고정된 제1 가닥 또는 고정된 제2 가닥 간의 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래된다.
일부 실시형태에서, 노출시키는 단계는 인터칼레이팅 염료의 존재 하에서 일어나고, 광학 활성의 각자의 인스턴스는 올리고뉴클레오타이드와 고정된 제1 가닥 또는 고정된 제2 가닥 간의 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의 형광으로부터 유래된다. 이러한 실시형태에서 광학 활성의 각자의 인스턴스는 인터칼레이팅 염료가 각자의 헤테로듀플렉스를 인터칼레이팅하기 전의 인터칼레이팅 염료의 형광보다 더 크다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 하나 초과의 올리고뉴클레오타이드 프로브는 노출시키는 단계 (c)의 단일 인스턴스 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 노출시키는 단계 (c)의 단일 인스턴스 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되는 올리고뉴클레오타이드 프로브의 세트 내의 각각의 상이한 올리고뉴클레오타이드 프로브는 상이한 표지와 회합된다. 일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브의 제1 풀로서, 제1 올리고뉴클레오타이드 프로브는 제1 표지와 회합될, 제1풀은 노출시키는 단계 (c)의 단일 인스턴스 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 올리고뉴클레오타이드 프로브의 세트 내의 제2 올리고뉴클레오타이드 프로브의 제2 풀로서, 제2 올리고뉴클레오타이드 프로브는 제2 표지와 회합될, 제2풀은 노출시키는 단계 (c)의 단일 인스턴스 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 제1 표지 및 제2 표지는 상이하다. 대안적으로, 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브의 제1 풀로서, 제1 올리고뉴클레오타이드 프로브는 제1 표지와 회합될, 상기 제1풀은 노출시키는 단계 (c)의 단일 인스턴스 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 올리고뉴클레오타이드 프로브의 세트 내의 제2 올리고뉴클레오타이드 프로브의 제2 풀로서, 제2 올리고뉴클레오타이드 프로브는 제2 표지와 회합될, 상기 제2풀은 노출시키는 단계 (c)의 단일 인스턴스 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 올리고뉴클레오타이드 프로브의 세트 내의 제3 올리고뉴클레오타이드 프로브의 제3 풀로서, 제3 올리고뉴클레오타이드 프로브는 제3 표지와 회합될, 상기 제 3풀은 노출시키는 단계 (c)의 단일 인스턴스 동안 고정된 제1 가닥 및 고정된 제2 가닥에 노출되고, 그리고 제1 표지, 제2 표지 및 제3 표지는 각각 상이하다.
일부 실시형태에서, 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하는 단계 (e)는 올리고뉴클레오타이드 프로브의 세트 내의 각각의 단일 올리고뉴클레오타이드 프로브에 대해서 각각 수행된다.
일부 실시형태에서, 노출시키는 단계 (c)는 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 온도에서 수행되고, 노출시키는 단계 (c) 및 측정하는 단계 (d)를 반복하는 단계 (e)는 제2 온도에서 제1 올리고뉴클레오타이드에 대해서 노출시키는 단계 (c) 및 측정하는 단계 (d)를 수행하는 것을 포함한다.
일부 실시형태에서, 노출시키는 단계 (c)는 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 온도에서 수행되고, 노출시키는 단계 (c) 및 측정하는 단계 (d)를 반복하는 단계 (e)의 인스턴스는 복수의 상이한 온도 각각에서 제1 올리고뉴클레오타이드에 대해서 노출시키는 단계 (c) 및 측정하는 단계 (d)를 수행하는 것을 포함하고, 방법은 제1 온도 및 복수의 상이한 온도의 각각의 온도에 대해서 측정하는 단계 (d)에 의해서 기록된 광학 활성의 측정된 장소 및 지속기간을 사용하여 제1 올리고뉴클레오타이드 프로브에 대한 용융 곡선을 구축하는 것을 더 포함한다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트는 올리고뉴클레오타이드 프로브의 복수의 하위세트를 포함하되, 노출시키는 단계 (c) 및 측정하는 단계 (d)를 반복하는 단계 (e)는 올리고뉴클레오타이드 프로브의 복수의 하위세트 내의 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트에 대해서 수행된다. 일부 이러한 실시형태에서, 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트는 올리고뉴클레오타이드 프로브의 세트로부터의 2개 이상의 상이한 프로브를 포함한다. 대안적으로, 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트는 올리고뉴클레오타이드 프로브의 세트로부터의 4개 이상의 상이한 프로브를 포함한다. 일부 이러한 실시형태에서, 올리고뉴클레오타이드 프로브의 세트는 올리고뉴클레오타이드 프로브의 4개의 하위세트로 이루어진다. 일부 실시형태에서, 방법은 올리고뉴클레오타이드 프로브의 세트를 각각의 올리고뉴클레오타이드 프로브의 계산되거나 또는 실험적으로 도출된 용융 온도에 기초하여 올리고뉴클레오타이드 프로브의 상기 복수의 하위세트로 구분하는 단계를 더 포함하고, 여기서 유사한 용융 온도를 갖는 올리고뉴클레오타이드 프로브는 구분에 의해서 올리고뉴클레오타이드 프로브의 동일한 하위세트에 놓이고, 노출시키는 단계 (c)의 온도 또는 인스턴스의 지속기간은 올리고뉴클레오타이드 프로브의 상응하는 하위세트 내의 올리고뉴클레오타이드 프로브의 평균 용융 온도에 의해서 결정된다. 더 추가로, 일부 실시형태에서, 방법은 올리고뉴클레오타이드 프로브의 세트를 각각의 올리고뉴클레오타이드 프로브의 서열에 기초하여 올리고뉴클레오타이드 프로브의 상기 복수의 하위세트로 구분하는 단계를 더 포함하며, 여기서 중첩 서열을 갖는 올리고뉴클레오타이드 프로브는 상이한 하위세트에 놓인다.
일부 실시형태에서, 시험 기질 상의 상기 장소를 측정하는 단계는 광학 활성의 각자의 인스턴스를 식별하고, 피팅 함수에 피팅시켜 2차원 영상화기에 의해서 획득된 데이터의 프레임 내에서 광학 활성의 각자의 인스턴스의 중심을 식별 및 피팅시키는 단계를 포함하고, 그리고 광학 활성의 각자의 인스턴스의 중심은 시험 기질 상의 광학 활성의 각자의 인스턴스의 위치인 것으로 간주된다. 일부 이러한 실시형태에서, 피팅 함수는 가우시안 함수(Gaussian function), 제1 적률 함수(first moment function), 기울기 기반 접근법(gradient-based approach) 또는 푸리에 변환(Fourier Transform)이다.
일부 실시형태에서, 광학 활성의 각자의 인스턴스는 2차원 영상화기에 의해서 측정된 복수의 프레임에 걸쳐서 지속되고, 시험 기질 상의 장소를 측정하는 단계는 광학 활성의 각자의 인스턴스를 복수의 프레임에 걸쳐서 식별하고, 피팅 함수에 피팅시켜 복수의 프레임에 걸쳐서 광학 활성의 각자의 인스턴스의 중심을 식별하는 단계를 포함하고, 그리고 광학 활성의 각자의 인스턴스의 중심은 복수의 프레임에 걸쳐서 시험 기질 상의 광학 활성의 각자의 인스턴스의 위치인 것으로 간주된다. 일부 이러한 실시형태에서, 피팅 함수는 가우시안 함수, 제1 적률 함수, 기울기 기반 접근법 또는 푸리에 변환이다.
일부 실시형태에서, 시험 기질 상의 장소를 측정하는 단계는 2차원 영상화기에 의해서 측정된 데이터의 프레임을 훈련된 콘볼루션 신경망(trained convolutional neural network)에 투입하는 단계를 포함하고, 데이터의 프레임은 광학 활성의 복수의 인스턴스 중에서 광학 활성의 각자의 인스턴스를 포함하며, 광학 활성의 복수의 인스턴스 내의 광학 활성의 각자의 인스턴스는 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 결합하는 개별 프로브에 상응하고, 투입에 반응하여, 훈련된 콘볼루션 신경망은 광학 활성의 복수의 인스턴스 내의 광학 활성의 하나 이상의 인스턴스 각각의 상기 시험 기질 상의 위치를 식별한다.
일부 실시형태에서, 측정하는 단계는 광학 활성의 각자의 인스턴스의 중심을 적어도 20㎚, 적어도 2㎚, 적어도 60㎚ 또는 적어도 6㎚의 국지화 정밀도로 상기 시험 기질 상의 위치에 리졸빙하는 것을 포함한다.
일부 실시형태에서, 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 상기 시험 기질 상의 위치에 리졸빙하되, 상기 위치는 부분 회절 제한된 위치이다.
일부 실시형태에서, 광학 활성의 각자의 인스턴스의 시험 기질 상의 장소 및 지속 시간을 측정하는 단계 (d)는 위치에서 5000개 초과의 광자 또는 위치에서 50,000 초과의 광자 또는 위치에서 200,000개 초과의 광자를 측정하는 것을 포함한다.
일부 실시형태에서, 광학 활성의 각자의 인스턴스는 시험 기질에 대해서 관찰된 배경에 대한 미리 결정된 표준 편차의 수보다 더 크다(예를 들어, 3, 4, 5, 6, 7, 8, 9, 또는 10보다 큰 표준 편차).
일부 실시형태에서, 복수의 올리고뉴클레오타이드 프로브 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 고유한 N량체 서열을 포함하고, 여기서 N은 세트 {1, 2, 3, 4, 5, 6, 7, 8 및 9}의 정수이고, 길이 N의 모든 고유한 N량체 서열은 상기 복수의 올리고뉴클레오타이드 프로브로 표현된다. 일부 이러한 실시형태에서, 고유한 N량체 서열은 하나 이상의 축퇴 뉴클레오타이드 위치에 의해서 점유된 하나 이상의 뉴클레오타이드를 포함한다. 일부 이러한 실시형태에서, 하나 이상의 뉴클레오타이드 위치 내의 각각의 축퇴 뉴클레오타이드 위치는 범용 염기(예를 들어, 2'-데옥시이노신)에 의해서 점유된다. 일부 실시형태에서, 고유한 N량체 서열은 단일 축퇴 뉴클레오타이드 위치에 의해서 5' 측접되고, 단일 축퇴 뉴클레오타이드 위치에 의해서 3' 측접된다. 대안적으로, 5' 단일 축퇴 뉴클레오타이드 및 3' 단일 축퇴 뉴클레오타이드는 각각 2'-데옥시이노신이다.
일부 실시형태에서, 핵산은 적어도 140개 염기 길이이고, 결정하는 단계 (f)는 70% 초과의 핵산 서열의 서열의 커버리지를 결정한다. 일부 실시형태에서, 핵산은 적어도 140개 염기 길이이고, 결정하는 단계 (f)는 90% 초과의 핵산 서열의 서열의 커버리지를 결정한다. 일부 실시형태에서, 핵산은 적어도 140개 염기 길이이고, 결정하는 단계 (f)는 99% 초과의 핵산 서열의 서열의 커버리지를 결정한다. 일부 실시형태에서, 결정하는 단계 (f)는 99% 초과의 핵산 서열의 서열의 커버리지를 결정한다.
일부 실시형태에서, 핵산은 적어도 10,000개 염기 길이이거나 또는 적어도 1,000,000개 염기 길이이다.
일부 실시형태에서, 시험 기질을 노출시키는 단계 (c) 및 측정하는 단계 (d)를 반복하기 전에 세척함으로써, 시험 기질을 올리고뉴클레오타이드 프로브의 세트 내의 또 다른 올리고뉴클레오타이드 프로브에 노출시키기 전에 시험 기질로부터 각자의 올리고뉴클레오타이드 프로브를 제거한다.
일부 실시형태에서, 고정시키는 단계 (a)는 분자 코밍(molecular combing)(감소 메니스커스(receding meniscus)), 유동 신장 나노컨파인먼트(flow stretching nanoconfinement) 또는 전기-신장에 의해서 시험 기질 상에 핵산을 적용하는 것을 포함한다.
일부 실시형태에서, 광학 활성의 각각의 각자의 인스턴스는 미리 결정된 역치를 충족시키는 관찰 메트릭(observation metric)을 갖는다. 일부 이러한 실시형태에서, 관찰 메트릭은 지속기간, 신호 대 노이즈, 광자 수치 또는 강도를 포함한다. 일부 실시형태에서, 미리 결정된 역치는, (i) 고유한 N량체 서열의 각각의 잔기가 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥 내의 상보성 염기에 결합하는 제1 결합 형태와 (ii) 상기 고유한 N량체 서열과 각자의 올리고뉴클레오타이드 프로브가 결합하여 광학 활성의 각자의 인스턴스를 형성하는 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥 내의 서열 사이에 적어도 하나의 미스매치가 존재하는 제2 결합 형태를 구별한다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 그 자신의 상응하는 미리 결정된 역치를 갖는다. 일부 이러한 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 미리 결정된 역치는 트레이닝 데이터세트로부터 유래된다. 예를 들어, 일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 미리 결정된 역치는 상기 트레이닝 데이터세트로부터 유래되고, 트레이닝 세트는, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대해서, 참조 서열에 결합하여 각자의 올리고뉴클레오타이드 프로브의 고유한 N량체 서열의 각각의 잔기가 참조 서열 내의 상보성 염기에 결합할 때의 각자의 올리고뉴클레오타이드 프로브에 대한 관찰 메트릭의 측정치를 포함한다. 일부 이러한 실시형태에서, 참조 서열은 참조 기질 상에 고정된다. 대안적으로, 참조 서열은 상기 핵산과 함께 포함되고, 시험 기질 상에 고정된다. 일부 실시형태에서, 참조 서열은 PhiX174, M13, 람다 파지, T7 파지, 에쉐리키아 콜라이(Escherichia coli), 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 또는 사카로마이세스 폼베(Saccharomyces pombe)의 게놈의 전부 또는 일부를 포함한다. 일부 실시형태에서, 참조 서열은 공지된 서열의 합성 작제물이다. 일부 실시형태에서, 참조 서열은 토끼 글로빈 RNA의 전부 또는 일부를 포함한다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브는 고정된 제1 가닥의 상보성 부분에 대한 결합에 의해서 광학 활성의 제1 인스턴스를 산출하고, 고정된 제2 가닥의 상보성 부분에 대한 결합에 의해서 제2 광학 활성의 인스턴스를 산출한다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브는 고정된 제1 가닥의 2개 이상의 상보성 부분에 대한 결합에 의해서 광학 활성의 2개 이상의 제1 인스턴스를 산출하고, 고정된 제2 가닥의 2개 이상의 상보성 부분에 대한 결합에 의해서 2개 이상의 제2 광학 활성의 인스턴스를 산출한다.
일부 실시형태에서, 각자의 올리고뉴클레오타이드 프로브는 노출시키는 단계 (c) 동안 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 3회 이상 결합함으로써 광학 활성의 3개 이상의 인스턴스를 야기하고, 광학 활성의 각각의 인스턴스는 복수의 결합 사건에서 결합 사건을 나타낸다.
일부 실시형태에서, 각자의 올리고뉴클레오타이드 프로브는 노출시키는 단계 (c) 동안 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 5회 이상 결합함으로써 광학 활성의 5개 이상의 인스턴스를 야기하고, 광학 활성의 각자의 인스턴스는 복수의 결합 사건에서 결합 사건을 나타낸다.
일부 실시형태에서, 각자의 올리고뉴클레오타이드 프로브는 노출시키는 단계 (c) 동안 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 10회 이상 결합함으로써 광학 활성의 10개 이상의 인스턴스를 야기하고, 광학 활성의 각자의 인스턴스는 복수의 결합 사건에서 결합 사건을 나타낸다.
일부 실시형태에서, 노출시키는 단계 (c)는 5분 이하 동안, 2분 이하 동안 또는 1분 이하 동안 일어난다.
일부 실시형태에서, 노출시키는 단계 (c)는 2차원 영상화기의 1 이상의 프레임, 2차원 영상화기의 2 이상의 프레임, 2차원 영상화기 500 이상의 프레임 또는 2차원 영상화기의 5,000 이상의 프레임에 걸쳐서 일어난다.
일부 실시형태에서, 노출시키는 단계 (c)는 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 시간 기간 동안 수행되고, 노출시키는 단계 (c) 및 측정하는 단계 (d)를 반복하는 단계 (e)는 제2 올리고뉴클레오타이드에 대해서 제2 시간 기간 동안 노출시키는 단계 (c)를 수행하는 것을 포함하고, 그리고 제1 시간 기간은 제2 시간 기간보다 크다.
일부 실시형태에서, 노출시키는 단계 (c)는 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 상기 2차원 영상화기의 제1 프레임 수 동안 수행되고, 노출시키는 단계 (c) 및 측정하는 단계 (d)를 반복하는 단계 (e)는 제2 올리고뉴클레오타이드에 대해서 2차원 영상화기의 제2 프레임 수 동안 노출시키는 단계 (c)를 수행하는 것을 포함하고, 그리고 제1 프레임 수는 제2 프레임 수보다 크다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이를 갖는다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이 M을 갖되, M은 2 이상(예를 들어, M은 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 10 초과)의 양의 정수이고, 그리고 시험 기질 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계 (f)는 복수의 위치 세트에 의해서 표현된 올리고뉴클레오타이드 프로브의 중첩 서열을 더 사용한다. 일부 이러한 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 올리고뉴클레오타이드 프로브의 세트 내의 또 다른 올리고뉴클레오타이드 프로브와 M-1 서열 상동성을 공유한다. 일부 이러한 실시형태에서, 시험 기질 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계는 고정된 제1 가닥에 상응하는 제1 타일링 경로 및 고정된 제2 가닥에 상응하는 제2 타일링 경로를 결정하는 것을 포함한다. 일부 이러한 실시형태에서, 제1 타일링 경로 내의 브레이크(break)는 제2 타일링 경로의 상응하는 부분을 사용하여 리졸빙된다. 대안적으로, 제1 타일링 경로 또는 제2 타일링 경로 내의 브레이크는 참조 서열을 사용하여 리졸빙된다. 대안적으로, 제1 타일링 경로 또는 제2 타일링 경로 내의 브레이크는 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 리졸빙된다. 일부 이러한 실시형태에서, 서열의 서열 배정(sequence assignment)의 신뢰도(confidence)는 제1 타일링 경로 및 제2 타일링 경로의 상응하는 부분을 사용하여 증가된다. 대안적으로, 서열의 서열 배정의 신뢰도는 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 증가된다.
일부 실시형태에서, 노출시키는 단계 (c)의 인스턴스의 시간 길이는 노출시키는 단계 (c)의 인스턴스에서 사용된 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 예측된 용융 온도에 의해서 결정된다.
일부 실시형태에서, 방법은 (f) 고정된 이중 가닥 또는 고정된 제1 가닥 및 고정된 제2 가닥을 항체, 어피머(affimer), 나노바디, 압타머 또는 메틸-결합 단백질에 노출시킴으로써 핵산에 대한 변형을 결정하거나 또는 시험 기질 상의 복수의 위치 세트로부터 핵산의 일부의 서열과의 연관성을 보여주는 단계를 더 포함한다.
일부 실시형태에서, 시험 기질은 2차원 표면이다. 일부 이러한 실시형태에서, 2차원 표면은 겔 또는 매트릭스로 코팅된다.
일부 실시형태에서, 시험 기질은 세포, 3차원 매트릭스 또는 겔이다.
일부 실시형태에서, 시험 기질은 고정시키는 단계 (a) 이전에 서열-특이적 올리고뉴클레오타이드 프로브와 결합되어 있고, 그리고 고정시키는 단계 (a)는 시험 기질에 결합된 서열-특이적 올리고뉴클레오타이드 프로브를 사용하여 시험 기질 상에 핵산을 포획하는 것을 포함한다.
일부 실시형태에서, 핵산은 추가적인 복수의 세포 성분을 포함하는 용액 중에 존재하고, 고정시키는 단계 (a) 또는 변성시키는 단계 (b)는 핵산이 시험 기질에 고정된 후에 그리고 노출시키는 단계 (c) 이전에 시험 기질을 세척함으로써 핵산으로부터 추가적인 복수의 세포 성분을 정제시키는 것을 더 포함한다.
일부 실시형태에서, 시험 기질은 상기 노출시키는 단계 (c) 이전에 폴리에틸렌 글리콜, 소 혈청 알부민-바이오틴-스트렙타비딘, 카제인, 소 혈청 알부민(BSA), 1종 이상의 상이한 tRNA, 1종 이상의 상이한 데옥시리보뉴클레오타이드, 1종 이상의 상이한 리보뉴클레오타이드, 연어 정자 DNA, 플루로닉 F-127, Tween-20, 하이드로겐 실세스퀴옥산(hydrogen silsesquioxane: HSQ) 또는 이들의 임의의 조합물로 부동태화된다(passivized).
일부 실시형태에서, 시험 기질은 상기 고정시키는 단계 (a) 이전에 7-옥텐일트라이클로로실란을 포함하는 바이닐실란 코팅으로 코팅된다.
본 개시내용의 또 다른 양상은 핵산의 서열결정 방법을 제공하며, 이 방법은, (a) 핵산을 시험 기질 상에 선형의 신장된 형태로 고정시킴으로써 고정되고 신장된 핵산을 형성하는 단계; (b) 고정되고 신장된 핵산을 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출시키는 단계로서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖되, 노출시키는 단계 (b)는 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 핵산의 각각의 일부에 일시적이고 그리고 가역적으로 결합함으로써 광학 활성의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어나는, 상기 노출시키는 단계; (c) 2차원 영상화기를 사용하여 노출시키는 단계 (b) 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 시험 기질 상의 장소 및 지속기간을 측정하는 단계; (d) 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 노출시키는 단계 (b) 및 측정하는 단계 (c)를 반복함으로써, 시험 기질 상의 복수의 위치 세트를 획득하는 단계로서, 시험 기질 상의 각각의 각자의 위치 세트는 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응하는, 상기 단계; 및 (e) 복수의 위치 세트에 의해서 표현된 시험 기질 상의 위치를 컴파일링함으로써 시험 기질 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계를 포함한다. 일부 실시형태에서, 핵산은 이중 가닥 핵산이고, 방법은 고정된 이중 가닥 핵산을 시험 기질 상에 단일 가닥 형태로 변성시킴으로써 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 단계를 더 포함하고, 여기서 고정된 제2 가닥은 고정된 제1 가닥에 상보성이다. 일부 실시형태에서, 핵산은 단일 가닥 RNA이다.
본 개시내용의 또 다른 양상은 핵산의 분석 방법을 제공하며, 이 방법은, (a) 핵산을 시험 기질 상에 이중 가닥 형태로 고정시킴으로써 고정된 이중 가닥 핵산을 형성하는 단계; (b) 고정된 이중 가닥 핵산을 시험 기질 상에 단일 가닥 형태로 변성시킴으로써 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 단계로서, 고정된 제2 가닥은 고정된 제1 가닥에 상보성인, 상기 단계; (c) 고정된 제1 가닥 및 상기 고정된 제2 가닥을 하나 이상의 올리고뉴클레오타이드 프로브에 노출시키고, 하나 이상의 올리고뉴클레오타이드 프로브가 고정된 제1 가닥 또는 고정된 제2 가닥에 결합하는지의 여부를 결정하는 단계를 포함한다.
도 1A 및 도 1B는 본 개시내용의 다양한 실시형태에 따라서 결합 사건에 참여한 다수의 프로브를 갖는 중합체, 결합 사건의 국지화 및 서열 식별에 관련된 정보를 수집 및 저장하고, 이어서 분석을 추가로 수행하여 중합체 서열을 결정하기 위한 컴퓨터 저장 매체를 포함하는 예시적인 시스템 토폴로지를 총괄하여 도시한 도면.
도 2A 및 도 2B는 본 개시내용의 다양한 실시형태에 따라서 표적 중합체의 서열 및/또는 구조 특징을 결정하기 위한 방법의 공정 및 특징부의 흐름도를 총괄하여 제공한 도면.
도 3은 본 개시내용의 다양한 실시형태에 따라서 표적 중합체의 서열 및/또는 구조 특징을 결정하기 위한 추가 방법의 공정 및 특징부의 흐름도를 제공한 도면.
도 4는 본 개시내용의 다양한 실시형태에 따라서 표적 중합체의 서열 및/또는 구조 특징을 결정하기 위한 추가 방법의 공정 및 특징부의 흐름도를 제공한 도면.
도 5A, 도 5B 및 도 5C는 본 개시내용의 다양한 실시형태에 따라서 폴리뉴클레오타이드에 대한 프로브의 일시적인 결합의 예를 총괄하여 도시한 도면.
도 6A 및 도 6B는 본 개시내용의 다양한 실시형태에 따라서 표적 폴리뉴클레오타이드에 결합하는 상이한 k량체 길이의 프로브의 예를 총괄하여 도시한 도면.
도 7A, 도 7B 및 도 7C는 본 개시내용의 다양한 실시형태에 따라서 올리고뉴클레오타이드 세트의 연속적인 사이클을 갖는 참조 올리고를 사용한 예를 총괄하여 도시한 도면.
도 8A, 도 8B 및 도 8C는 본 개시내용의 다양한 실시형태에 따라서 단일 참조 분자에 구별되는 프로브 세트를 적용하는 예를 총괄하여 도시한 도면.
도 9A, 도 9B 및 도 9C는 본 개시내용의 다양한 실시형태에 따라서 다수의 유형의 프로브가 사용되는 경우에서 일시적인 결합의 예를 총괄하여 도시한 도면.
도 10A 및 도 10B는 수집된 일시적인 결합 사건의 수가 본 개시내용의 다양한 실시형태에 따라서 달성될 수 있는 프로브의 국지화 정도와 상관관계가 있음을 총괄하여 도시한 도면.
도 11A 및 도 11B는 본 개시내용의 다양한 실시형태에 따라서 타일링 프로브의 예를 총괄하여 도시한 도면.
도 12A, 도 12B 및 도 12C는 본 개시내용의 다양한 실시형태에 따라서 직접 표지된 프로브의 일시적인 결합의 예를 총괄하여 도시한 도면.
도 13A, 도 13B, 및13C는 본 개시내용의 다양한 실시형태에 따라서 인터칼레이팅 염료의 존재 하에서 일시적인 프로브 결합의 예를 총괄하여 도시한 도면.
도 14A, 도 14B, 도 14C, 도 14D 및 도 14E는 본 개시내용의 다양한 실시형태에 따른 상이한 프로브 표지 기술의 예를 총괄하여 도시한 도면.
도 15는 본 개시내용의 다양한 실시형태에 따른 변성, 코밍된(combed) 이중 가닥 DNA 상의 프로브의 일시적인 결합의 예를 도시한 도면.
도 16A 및 도 16B는 본 개시내용의 다양한 실시형태에 따른 세포 용해 및 핵산 부동화(immobilization) 및 연장(elongation)의 예를 총괄하여 도시한 도면.
도 17는 본 개시내용의 다양한 실시형태에 따라서 단일 세포를 포획하고, 세포로부터의 핵산의 추출, 연장 및 서열결정을 선택적으로 제공하는 예시적인 마이크로유체 구조물을 도시한 도면.
도 18는 본 개시내용의 다양한 실시형태에 따라서 구별되는 ID 태그를 개별 세포에 제공하는 예시적인 마이크로유체 구조물을 도시한 도면.
도 19는 본 개시내용의 다양한 실시형태에 따라서 개별 세포로부터의 폴리뉴클레오타이드를 서열결정하는 예를 도시한 도면.
도 20A 및 도 20B는 본 개시내용의 다양한 실시형태에 따라서 일시적인 프로브 결합의 영상화를 수행하기 위한 예시적인 장치 레이아웃을 총괄하여 도시한 도면.
도 21은 본 개시내용의 다양한 실시형태에 따라서 공기 갭에 의해서 분리된 시약을 함유하는 예시적인 모세관 튜빙을 도시한 도면.
도 22A, 도 22B, 도 22C, 도 22D 및 도 22E는 본 개시내용의 다양한 실시형태에 따라서 형광의 예를 총괄하여 도시한 도면.
도 23A, 도 23B 및 도 23C는 본 개시내용의 다양한 실시형태에 따라서 형광의 예를 총괄하여 도시한 도면.
도 24는 본 개시내용의 다양한 실시형태에 따른 합성의 변성된 이중 가닥 DNA 상의 일시적인 결합을 도시한 도면.
이제 실시형태를 상세하게 참고할 것이며, 이의 예는 첨부 도면에 도시되어 있다. 하기 상세하한 설명에서, 다수의 구체적인 설명은 본 개시내용의 철저한 이해를 제공하기 위해서 제시된다. 그러나, 본 개시내용은 이들 구체적인 상세 사항 없이 실시될 수 있다는 것은 당업자에게 자명할 것이다. 다른 예에서, 널리 공지된 방법, 절차, 성분 및 회로 및 네트워크는 실시형태의 양상을 불필요하게 모호하게 하지 않기 위해서 상세하게 설명되지 않는다.
정의
본 개시내용에 사용된 용어는 단지 특정 실시형태 설명하려는 목적을 위해서이며, 본 발명의 제한이도록 의도되지 않는다. 설명 및 첨부된 청구범위에 사용된 바와 같이, 단수 표현은 그 문맥이 달리 명확하게 나타내지 않는 한, 복수 형태도 또한 포함하도록 의도된다. 용어 "및/또는"은 본 명세서에서 사용되는 바와 같이 연관된 열거된 항목 중 하나 이상의 임의의 및 모든 가능한 조합을 지칭하고, 포함하도록 또한 이해될 것이다. 추가로, 용어 "포함하다" 및/또는 "포함하는"은 본 명세서에서 사용되는 경우 제시된 특징부, 정수, 단계, 작동, 요소 및/또는 성분의 존재를 명시하지만, 하나 이상의 다른 특징부, 정수, 단계, 작동 요소, 성분 및/또는 이의 군의 존재 또는 부가를 불가능하게 하지 않는다.
본 명세서에서 사용되는 바와 같이, 용어 "하면"은 문맥에 따라서, "하는 경우" 또는 "할 때" 또는 "결정하는 것에 반응하여" 또는 "검출하는 것에 반응하여"를 의미하는 것으로 이해될 수 있다. 유사하게, 구 "그것이 결정되면" 또는 "[언급된 조건 또는 사건]이 검출되면"은 "일단 결정하면" 또는 "결정하는 것에 반응하여" 또는 "[언급된 조건 또는 사건]을 일단 검출하면" 또는 "[언급된 조건 또는 사건]을 검출하는 것에 반응하여"를 의미하는 것으로 이해될 수 있다.
용어 "또는"은 예외의 "또는"이라기 보다는 포함의 "또는"을 의미하는 것으로 의도된다. 즉, 달리 명시되지 않는 한 또는 문맥으로부터 명백하지 않는 한, 구 "X는 A 또는 B를 사용한다"는 자연적인 포함 순열 중 임의의 것을 의미하도록 의도된다. 즉, 구 "X는 A 또는 B를 사용한다"는 하기 예 중 임의의 것에 의해서 충족된다: X는 A를 사용한다; X는 B를 사용한다; 또는 X는 A 및 B 둘 다를 사용한다. 또한, 본 명세서 및 첨부된 청구범위에서 사용되는 바와 같이 단수 표현은 달리 명시되거나 또는 단수 형태에 관한 것이라고 문맥으로부터 명백하지 않는 한 "하나 이상"을 의미하도록 일반적으로 이해되어야 한다.
용어 제1, 제2 등이 다양한 요소를 설명하기 위해서 본 명세서에서 사용될 수 있지만, 이들 요소는 이들 용어에 의해서 제한되지 않아야 한다는 것을 또한 이해할 것이다. 이들 용어는 하나의 요소를 또 다른 요소와 구별하기 위해서만 사용된다. 예를 들어, 본 개시내용의 범주로부터 벗어나지 않으면서 제1 필터는 제2 필터라고 지칭될 수 있고, 유사하게 제2 필터는 제1 필터라고 지칭될 수 있다. 제1 필터 및 제2 필터는 둘 다 필터이지만, 이들은 동일한 필터가 아니다.
본 명세서에서 사용되는 바와 같이, 용어 "약" 또는 "대략"은 당업자가 결정한 바와 같은 특정 값에 대해 허용 가능한 오차 범위 내를 의미할 수 있으며, 이는 값이 측정되거나 결정되는 방법, 예를 들어, 측정 시스템의 한계에 부분적으로 좌우될 수 있다. 예를 들어, "약"은 당업계의 실시에 따라서, 1 이내 또는 1 초과의 표준 편차를 의미할 수 있다. "약"은 주어진 값의 ±20%, ±10%, ±5% 또는 ±1%의 범위를 의미할 수 있다. 용어 "약" 또는 "대략"은 값의 5배 이내 또는 2배 이내의 차수 이내를 의미할 수 있다. 특정 값이 본 출원 및 청구범위에 기재된 경우, 달리 언급되지 않는 한, 특정 값에 대해 허용 가능한 오류 범위 이내를 의미하는 용어 "약"이 추정되어야 한다. 용어 "약"은 당업자에 의해서 일반적으로 이해되는 의미를 가질 수 있다. 용어 "약"은 ±10%를 지칭할 수 있다. 용어 "약"은 ±5%를 지칭할 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "핵산", "핵산 분자", 및 "폴리뉴클레오타이드"는 상호 교환 가능하게 사용된다. 이 용어는 임의의 조성 형태의 핵산, 예컨대, 데옥시리보핵산(DNA, 예를 들어, 상보성 DNA(cDNA), 게놈 DNA(gDNA) 등), 리보핵산(RNA, 예를 들어, 메신저 RNA(mRNA), 짧은 저해성 RNA(siRNA), 리보솜 RNA(rRNA), 전사 RNA(tRNA), 마이크로RNA, 태아 또는 태반에 의해서 고도로 발현되는 RNA 등), 및/또는 DNA 또는 RNA 유사체(예를 들어, 염기 유사체, 당 유사체 및/또는 비-네이티브 골격 등 함유), RNA/DNA 혼성체 및 폴리아마이드 핵산(PNA)을 지칭하고, 이들 모두는 단일 또는 이중 가닥 형태로 존재할 수 있다. 달리 제한되지 않는 한, 핵산은 자연 뉴클레오타이드의 공지된 유사체를 포함할 수 있고, 이들 중 일부는 자연 발생 뉴클레오타이드로서 유사한 방식으로 기능할 수 있다. 핵산은 본 명세서에서 공정을 수행하기에 유용한 임의의 형태(예를 들어, 선형, 원형, 슈퍼코일형, 이중 가닥 등)로 존재할 수 있다. 일부 예에서, 핵산은 특정 실시형태에서 시험관내에서 숙주 세포, 세포, 세포의 세포 핵 또는 세포질에서 복제하거나 복제될 수 있는 플라스미드, 파지, 자동 복제 서열(autonomously replicating sequence: ARS), 동원체, 인공 염색체, 염색체 또는 다른 핵산이거나 또는 이들로부터 유래된다. 일부 실시형태에서 핵산은 단일 염색체 또는 이의 단편(예를 들어, 이배체 유기체로부터 획득된 샘플의 하나의 염색체로부터의 핵산 샘플)으로부터 유래될 수 있다. 핵산 분자는 자연 폴리뉴클레오타이드(예를 들어, 긴 비-암호(long non-coding: lnc) RNA, mRNA, 염색체, 미토콘드리아 DNA 또는 폴리뉴클레오타이드 단편)의 완전한 길이를 포함할 수 있다. 폴리뉴클레오타이드 단편은 적어도 200개 염기 길이, 그러나 바람직하게는 적어도 수 천 개의 뉴클레오타이드 길이여야 한다. 보다 더 바람직하게는, 게놈 DNA의 경우, 폴리뉴클레오타이드 단편은 수 백 킬로베이스 내지 수 메가베이스 길이일 것이다.
특정 실시형태에서 핵산은 뉴클레오솜, 뉴클레오솜 또는 뉴클레오솜-유사 구조의 단편 또는 부분을 포함한다. 핵산은 때로는 단백질(예를 들어, 히스톤, DNA 결합 단백질 등)을 포함한다. 본 명세서에 기재된 방법에 의해서 분석된 핵산은 때로는 실질적으로 단리되고, 단백질 또는 다른 분자와 실질적으로 회합되지 않는다. 핵산은 또한 단일 가닥("센스" 또는 "안티센스", "플러스" 가닥 또는 "마이너스" 가닥, "정방향" 리딩 프레임 또는 "역방향" 리딩 프레임) 및 이중 가닥 폴리뉴클레오타이드로부터 합성된, 복제된 또는 증폭된 RNA 또는 DNA의 유도체, 변이체 및 유사체를 포함한다. 데옥시리보뉴클레오타이드는 데옥시아데노신, 데옥시사이티딘, 데옥시구아노신 및 데옥시티미딘을 포함한다. RNA의 경우, 염기 사이토신은 우라실로 대체되고, 당 2' 위치는 하이드록실 모이어티를 포함한다. 일부 실시형태에서, 핵산은 주형으로서 대상체로부터 획득된 핵산을 사용하여 제조된다.
본 명세서에서 사용되는 바와 같이 용어 "단부화 위치" 또는 "단부 위치"(또는 단지 "단부")는 무세포 DNA 분자, 예를 들어, 플라즈마 DNA 분자의 최외곽 염기, 예를 들어, 사지(extremities)의 게놈 코디네이트(genomic coordinate) 또는 게놈 아이덴티티 또는 뉴클레오타이드 아이덴티티를 지칭한다. 단부 위치는 DNA 분자의 양 단부에 상응할 수 있다. 이러한 방식으로, 하나가 DNA 분자의 출발 및 단부를 지칭하면, 둘 다는 단부화 위치에 상응할 수 있다. 일부 실시형태에서, 하나의 단부 위치는 분석 방법, 예를 들어, 대규모 병렬 서열결정 또는 차세대 서열결정, 단일 분자 서열결정, 이중 또는 단일 가닥 DNA 서열결정 라이브러리 제조 프로토콜, 중합효소 연쇄 반응(PCR) 또는 마이크로어레이에 의해서 검출 또는 결정되는 무세포 DNA 분자의 하나의 사지 상의 최외곽 염기의 게놈 코디네이트 또는 뉴클레오타이드 아이덴티티이다. 일부 실시형태에서, 이러한 시험관내 기술은 무세포 DNA 분자의 실제 생체내 물리적 단부(들)를 변경할 수 있다. 따라서, 각각의 검출 가능한 단부는 생물학적 실제 단부를 나타낼 수 있거나, 또는 단부는 내부의 하나 이상의 뉴클레오타이드이거나 또는 분자의 본래 단부로부터 연장된 하나 이상의 뉴클레오타이드, 예를 들어, 클레노브(Klenow) 단편에 의한 비-평활-단부 이중 가닥 DNA 분자의 오버행의 3' 충전(filling) 및 5' 평활(blunting)이다. 단부 위치의 게놈 아이덴티티 또는 게놈 코디네이트는 인간 참조 게놈, 예를 들어, hg19에 대한 서열 판독물의 정렬의 결과로부터 유래될 수 있다. 그것은 인간 게놈의 본래 코디네이트를 나타내는 인덱스 또는 코드의 카탈로그로부터 유래될 수 있다. 그것은 비제한적으로 표적-특이적 프로브, 미니-서열결정, DNA 증폭에 의해서 판독되는 무세포 DNA 분자 상의 위치 또는 뉴클레오타이드 아이덴티티를 지칭할 수 있다. 용어 "게놈 위치"는 폴리뉴클레오타이드(예를 들어, 유전자, 플라스미드, 핵산 단편, 바이러스 DNA 단편) 내의 뉴클레오타이드 위치를 지칭할 수 있다. 용어 "게놈 위치"는 게놈(예를 들어, 생식세포 또는 미생물, 또는 다세포 유기체의 각각의 세포 내의 염색체의 반수체 세트) 내의 뉴클레오타이드 위치에 제한되지 않는다.
본 명세서에서 사용되는 바와 같이, 용어 "돌연변이", "단일 뉴클레오타이드 변이체", "단일 뉴클레오타이드 다형성(polymorphism)" 및 "변이체"는 하나 이상의 세포의 유전자 물질 내의 검출 가능한 변화를 지칭한다. 특정 예에서, 하나 이상의 돌연변이가 발견될 수 있고, 이것은 암 세포(예를 들어, 드라이버(driver) 및 패신저(passenger) 돌연변이)를 식별할 수 있다. 돌연변이는 겉보기 세포에서 딸 세포로 전염될 수 있다. 당업자는, 모 세포 내의 유전자 돌연변이(예를 들어, 드라이버 돌연변이)가 딸 세포에서 추가적인 상이한 돌연변이(예를 들어, 패신저 돌연변이)를 유도할 수 있다는 것을 인지할 것이다. 돌연변이 또는 변이체는 일반적으로 핵산에서 일어난다. 특정 예에서, 돌연변이는 하나 이상의 데옥시리보핵산 또는 이의 단편 내의 검출 가능한 변화일 수 있다. 돌연변이는 일반적으로 핵산 내의 새로운 위치에 대해서 부가, 결실, 치환, 반전 또는 트랜스포징(transposing)된 뉴클레오타이드를 지칭한다. 돌연변이는 자발적 돌연변이 또는 실험적으로 유도된 돌연변이일 수 있다. 특정 조직의 서열 내의 돌연변이는 "조직-특이적 대립유전자"의 예이다. 예를 들어, 종양은 정상 세포에서 발생하지 않는 유전자좌에서 대립유전자를 발생시키는 돌연변이를 가질 수 있다. "조직-특이적 대립유전자"의 또 다른 예는 모계 조직이 아닌 태아 조직에서 일어나는 태아-특이적 대립유전자이다. 용어 "대립유전자"는 일부 예에서 돌연변이와 상호 교환 가능하게 사용될 수 있다.
용어 "일시적인 결합"은 결합 시약 또는 프로브가 폴리뉴클레오타이드 상의 결합 부위에 가역적으로 결합하고, 프로브가 대개 이의 결합 부위에 부착되어 유지되지 않는다는 것을 의미한다. 이것은 분석 과정 동안 결합 부위의 장소에 관한 유용한 정보를 제공한다. 전형적으로, 하나의 시약 또는 프로브가 부동화된 중합체에 결합하고, 이어서 일부 체류 시간 후에 중합체로부터 탈착된다. 이어서 동일한 시약 또는 또 다른 시약 또는 프로브가 또 다른 부위에서 중합체에 결합할 것이다. 일부 실시형태에서, 중합체를 따르는 다수의 결합 부위가 또한 동시에 다수의 시약 또는 프로브에 의해서 결합된다. 일부 예에서, 상이한 프로브는 중첩 결합 부위에 결합한다. 중합체에 가역적으로 결합하는 시약 또는 프로브의 이러한 과정은 분석 과정에 걸쳐서 수 회 반복된다. 이러한 결합 사건의 장소, 빈도, 체류 시간, 광자 방출은 결국 중합체의 화학적 구조의 맵을 야기한다. 실제로, 이러한 결합 사건의 일시적인 특징은 이러한 결합 사건의 증가된 수의 검출을 가능하게 한다. 프로브가 긴 시간 기간 동안 결합되어 유지되면, 각각의 프로브는 다른 프로브의 결합을 저해할 것이다.
용어 "반복적인 결합"은, 중합체 내의 동일한 결합 부위가 분석 과정 동안 동일한 결합 시약 또는 프로브 또는 결합 시약 또는 프로브의 동일한 종에 의해서 수 회 결합되는 것을 의미한다. 전형적으로, 중합체의 맵이 발달될 때까지, 하나의 시약이 부위에 결합하고, 이어서 해리되고, 또 다른 시약이 결합하고, 이어서 해리되고, 유사한 것이 일어난다. 반복적인 결합은 프로브로부터 획득된 정보의 민감성 및 정확성을 증가시킨다. 더 많은 광자가 축적되고, 다수의 독립적인 결합 사건이 실제 신호가 검출될 가능성을 증가시킨다. 신호가 단지 1회 검출될 때 배경 노이즈를 초과하게 콜링(calling)하기에 너무 낮은 경우에 민감도를 증가시킨다. 이러한 경우, 지속적으로 보일 때 신호는 콜링 가능해진다(예를 들어, 동일한 신호가 수 회 보일 때 신호가 실제일 신뢰도가 증가한다). 결합 부위 콜의 정확성이 증가하는데, 그 이유는 정보의 다수의 판독이 하나의 판독을 또 다른 것으로 확인하기 때문이다.
본 명세서에서 사용되는 바와 같이, 용어 "프로브"는 선택적인 형광 표지가 부착되지 않은 올리고뉴클레오타이드를 포함할 수 있다. 일부 실시형태에서, 프로브는 형광 염료 또는 형광 또는 광산란 입자로 선택적으로 표지된, 펩타이드 또는 폴리펩타이드이다. 이들 프로브는 핵산 또는 단백질 중 어느 하나에 대한 결합 부위의 국지화를 결정하는 데 사용된다.
본 명세서에서 사용되는 바와 같이, 용어 "올리고뉴클레오타이드" 및 "올리고"는 짧은 핵산 서열을 의미한다. 일부 예에서, 올리고는 정의된 크기를 갖고, 예를 들어, 각각의 올리고는 k개의 뉴클레오타이드 염기(본 명세서에서 "k량체"로서도 지칭됨) 길이이다. 전형적인 올리고 크기는 3량체, 4량체, 5량체, 6량체 등이다. 올리고는 본 명세서에서 N량체로서도 지칭된다.
본 명세서에서 사용되는 바와 같이, 용어 "표지"는 단일의 검출 가능한 엔티티(예를 들어, 파장 방출 엔티티) 또는 다수의 검출 가능한 엔티티를 포함한다. 일부 실시형태에서, 표지는 핵산에 일시적으로 결합하거나 또는 프로브에 결합된다. 상이한 유형의 표지는 형광 방출의 점멸(blink), 광자 방출의 변동 및 광-스위치 오프 및 온이다. 상이한 영상화 방법을 위해서 상이한 표지가 사용된다. 특히, 일부 표지는 상이한 유형의 형광 현미경에 고유하게 조정된다. 일부 실시형태에서, 형광 표지는 상이한 파장에서 형광을 내고, 또한 상이한 수명을 갖는다.  일부 실시형태에서, 배경 형광이 영상 시야(imaging field)에 존재한다. 일부 이러한 실시형태에서, 이러한 배경은 산란으로 인해서 형광의 초기 시간 윈도우를 거부함으로써 분석으로부터 제거된다.  표지가 프로브의 하나의 단부(예를 들어, 올리고 프로브의 3' 단부) 상에 존재하면, 국지화의 정확성은 프로브의 상기 단부(예를 들어, 프로브 서열의 3' 및 표적 서열의 5')에 상응한다. 표지의 명백한 일시적인, 변동 또는 점멸 거동은 부착된 프로브가 그의 결합 부위로부터 결합 온인지 오프인지를 구별할 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "플랩"(flap)은 제2 엔티티의 결합을 위한 수용체로서 작용하는 엔티티를 지칭한다. 2개의 엔티티는 분자 결합쌍을 포함할 수 있다. 이러한 결합쌍은 핵산 결합쌍을 포함할 수 있다. 일부 실시형태에서 플랩은 표지된 올리고뉴클레오타이드에 결합하는 올리고- 또는 폴리뉴클레오타이드 서열의 스트레치를 포함한다. 플랩과 올리고뉴클레오타이드 간의 이러한 결합은 표적에 결합하는 프로브의 부분의 일시적인 결합을 영상화하는 방법의 과정 동안 실질적으로 안정적이어야 한다.
용어 "연장된(elongated)", "확장된(extended)", "신장된", "선형화된" 및 "펴진(straightened)"은 상호 교환 가능하게 사용될 수 있다. 특히, 용어 "연장된 폴리뉴클레오타이드"(또는 "확장된 폴리뉴클레오타이드" 등)는 일부 방식으로 표면 또는 매트릭스에 부착된 후 선형 형태로 신장된 핵산 분자를 나타낸다. 일반적으로, 이러한 용어는 폴리뉴클레오타이드를 따르는 결합 부위가 그들 사이의 뉴클레오타이드의 수와 어느 정도 상관관계가 있는 물리적 거리만큼 분리된다는 것을 의미한다(예를 들어, 폴리뉴클레오타이드는 선형임). 물리적 거리가 연기의 수와 매칭되는 정도의 일부 부정확성은 용인될 수 있다.
용어 "영상화"는 본 명세서에서 사용되는 바와 같이, 2차원 어레이 또는 2차원 주사 검출기 둘 다를 포함한다. 대부분의 경우에, 본 명세서에서 사용되는 영상화 기술은 형광 활성인자(예를 들어, 적절한 파장의 레이저) 및 형광 검출기를 필수적으로 포함할 것이다.
본 명세서에서 사용되는 바와 같이, 용어 "서열 비트"는 서열의 하나 또는 수 개의 염기(예를 들어, 1 내지 9개 염기 길이)를 나타낸다. 특히, 일부 실시형태에서, 서열은 일시적인 결합을 위해서 사용되는 올리고(또는 펩타이드)의 길이에 상응한다. 따라서, 이러한 실시형태에서, 서열은 표적 폴리뉴클레오타이드의 영역을 지칭한다.
본 명세서에서 사용되는 바와 같이, 용어 "일배체형"은 전형적으로 콘서트(concert)에서 상속되는 변경 세트를 지칭한다. 이것은 변경 세트가 폴리뉴클레오타이드 또는 염색체 상에 인접하게 존재하기 때문이 일어난다. 일부 경우에, 일배체형은 하나 이상의 단일 뉴클레오타이드 다형성(SNP)을 포함한다. 일부 경우에, 일배체형은 하나 이상의 대립유전자를 포함한다.
본 명세서에서 사용되는 바와 같이, 용어 "메틸-결합 단백질"은 대략 70개 뉴클레오타이드 잔기를 포함하는 메틸-CpG-결합 도메인을 함유하는 단백질을 지칭한다. 이러한 도메인은 DNA의 비메틸화된 영역에 대해서 낮은 친화도를 갖고, 따라서 메틸화된 핵산 내의 장소를 식별하는 데 사용될 수 있다. 일부 공통 메틸-결합 단백질은 MeCP2, MBD1 및 MBD2를 포함한다. 그러나, 메틸-CpG-결합 도메인을 함유하는 다양한 상이한 단백질이 존재한다(예를 들어, 문헌[Roloff et al., BMC Genomics 4:1, 2003]에 기재된 바와 같음).
본 명세서에서 사용되는 바와 같이, 용어 "나노바디"는 소유권이 있는 중쇄 단독 항체 단편을 함유하는 단백질의 세트를 지칭한다. 이것은 고도로 안정적인 단백질이고, 다양한 인간 항체와 유사한 서열 상동성을 갖도록 설계될 수 있기 때문에, 신체 내의 세포 유형 또는 영역의 특이적 표적화가 가능하다. 나노바디 생물학의 검토는 문헌[Bannas et al., Frontiers in Immu. 8:1603, 2017]에서 찾아볼 수 있다.
본 명세서에서 사용되는 바와 같이, 용어 "어피머"는 비-항체 결합 단백질을 지칭한다. 이것은 일부 실시형태에서, 무작위화되어 목적하는 단백질 표적에 대한 친화도 및 특이성을 제공하는 2개의 펩타이드 루프 및 N-말단 서열을 갖는 고도로 주문 제조 가능한 단백질이다. 따라서, 일부 실시형태에서, 어피머는 단백질 내의 관심대상 서열 또는 구조 영역을 식별하는 데 사용된다. 일부 이러한 실시형태에서, 어피머는 단백질 발현, 국지화 및 상호작용의 다수의 상이한 유형을 식별하는 데 사용된다(예를 들어, 문헌[Tiede et al., ELife 6:e24903, 2017]에 기재된 바와 같음).
본 명세서에서 사용되는 바와 같이, 용어 "압타머"는 고도로 다용도이고 주문 제조 가능한 결합 분자의 또 다른 카테고리를 지칭한다. 압타머는 뉴클레오타이드 및/또는 펩타이드 영역을 포함한다. 가능한 압타머 서열의 무작위 세트를 제조하고, 이어서 관심대상 특이적 표적 분자에 결합하는 목적하는 서열에 대해서 선택하는 것이 전형적이다. 압타머는, 이것을 다른 카테고리 결합 단백질보다 바람직하게 하는 안정성 및 가요성을 능가하는 추가 특징을 갖는다(예를 들어, 문헌[Song et al., Sensors 12:612-631, 2012 and Dunn et al., Nat. Rev. Chem. 1:0076, 2017]에 기재된 바와 같음).
몇몇 양상이 설명을 위한 예시적인 적용을 참고로 하기에 기재되어 있다. 본 명세서에 기재된 특징에 대한 완전한 이해를 제공하기 위해서 다수의 특정 세부 사항, 관계 및 방법이 제시됨을 이해해야 한다. 그러나, 당업자는 본 명세서에 기재된 특징이 하나 이상의 특정 세부 사항 없이 또는 다른 방법으로 실시될 수 있다는 것을 이해할 것이다. 본 명세서에 기재된 특징은 도시된 행동 또는 사건의 순서에 의해 제한되지 않는데, 그 이유는 일부 행동이 다른 순서로 그리고/또는 다른 행동 또는 사건과 동시에 발생할 수 있기 때문이다. 또한, 본 명세서에 기재된 특징에 따라 방법을 구현하기 위해 도시된 모든 행동 또는 사건이 필요한 것은 아니다.
예시적인 시스템 실시형태.
이제 예시적인 시스템의 상세 사항을 도 1과 함께 설명한다. 도 1은 일부 실시형태에 따른 시스템(100)을 도시한 블록 다이어그램이다. 장치(100)는 일부 실시형태에서 하나 이상의 처리 유닛(CPU(들))(102)(프로세서 또는 프로세싱 코어라고도 지칭됨), 하나 이상의 네트워크 인터페이스(104), 사용자 인터페이스(106), 비-지속성 메모리(non-persistent memory)(111), 지속성 메모리(112) 및 이들 성분을 상호 접속하기 위한 하나 이상의 통신 버스(communication buse)(114)를 포함한다. 하나 이상의 통신 버스(114)는 시스템 성분들 간의 통신을 접속하고 제어하는 회로(때로는 칩세트로 불림)를 선택적으로 포함한다. 비-지속성 메모리(111)는 전형적으로 고속 랜덤 어세스 메모리, 예컨대, DRAM, SRAM, DDR RAM, ROM, EEPROM, 플래시 메모리를 포함하지만, 지속성 메모리(112)는 전형적으로 CD-ROM, 디지털 다목적 디스크(digital versatile disk: DVD) 또는 다른 광학 저장장치, 마그네틱 카세트, 마그네틱 테이프, 마그네틱 디스크 저장장치 또는 다른 마그네틱 저장 장치, 마그네틱 디스크 저장 장치, 광학 디스크 저장 장치, 플래시 메모리 장치 또는 다른 비휘발성 고체 상태 저장 장치를 포함한다. 지속성 메모리(112)는 CPU(들)(102)로부터 원격으로 위치된 하나 이상의 저장 장치를 선택적으로 포함한다. 지속성 메모리(112) 및 비-지속성 메모리(112) 내의 비휘발성 메모리 장치(들)는 비-일시적인 컴퓨터 판독 가능한 저장 매체를 포함한다. 일부 실시형태에서, 비-지속성 메모리(111) 또는 대안적으로 비-일시적인 컴퓨터 판독 가능한 저장 매체는 하기 프로그램, 모듈 및 데이터 구조, 또는 이의 하위 세트를 때로는 지속성 메모리(112)와 함께 저장한다:
Figure pct00001
다양한 기본 시스템 서비스를 취급하고 하드웨어 의존적인 작업을 수행하기 위한 절차를 포함하는 선택적인 작동 시스템(116);
Figure pct00002
시스템(100)을 다른 장치 또는 통신 네트워크와 접속하기 위한 선택적인 네트워크 통신 모듈(또는 명령어)(118);
Figure pct00003
각각의 표적 분자(130)에 대한 정보를 수집하기 위한 광학 활성 검출 모듈(120);
Figure pct00004
각각의 표적 분자(130)에 대한 복수의 결합 부위에서 각각의 각자의 결합 부위(140)에 대한 정보;
Figure pct00005
방출된 광자의 (i) 지속기간(144) 및 (ii) 수(146)를 적어도 포함하는 각각의 결합 부위(140)에 대한 복수의 결합 사건에서 각각의 각자의 결합 사건(142)에 대한 정보;
Figure pct00006
각각의 표적 분자(130)의 서열을 결정하기 위한 서열결정 모듈(150);
Figure pct00007
(i) 염기 콜(base call)(152) 및 (ii) 확률(154)을 적어도 포함하는 각각의 표적 분자(130)에 대한 복수의 결합 부위에서 각각의 각자의 결합 부위(140)에 대한 정보;
Figure pct00008
각각의 표적 분자(130)에 대한 참조 게놈(160)에 관한 선택적인 정보; 및
Figure pct00009
각각의 표적 분자(130)에 대한 상보성 가닥(170)에 관한 선택적인 정보.
다양한 구현예에서, 상기에 식별된 요소 중 하나 이상은 이미 언급된 메모리 장치 중 하나 이상에 저장되고, 상기에 기재된 기능을 수행하기 위한 명령어 세트에 상응한다. 상기에 식별된 모듈, 데이터 또는 프로그램(예를 들어, 명령어 세트)은 별개의 소프트웨어 프로그램, 절차, 데이터세트 또는 모듈로서 실현될 필요가 없기 때문에, 이들 모듈 및 데이터의 다양한 하위세트는 다양한 실시형태에서 조합되거나 달리 재배열될 수 있다. 일부 실시형태에서, 비-지속성 메모리(111)는 상기에서 식별된 모듈 및 데이터의 하위세트를 선택적으로 저장한다. 추가로, 일부 실시형태에서, 메모리는 상기에 기재되지 않은 추가 모듈 및 데이터 구조를 저장한다. 일부 실시형태에서, 상기에 식별된 요소 중 하나 이상은 시각화 시스템(100)에 의해서 주소 지정 가능한, 시각화 시스템(100)의 것 이외의, 컴퓨터 시스템에 저장되어, 시각화 시스템(100)은 필요에 따라서 이러한 데이터의 전부 또는 일부를 검색할 수 있다.
네트워크 통신 모듈(118)의 예는 World Wide Web(WWW), 인트라넷 및/또는 무선 네트워크, 예컨대, 휴대폰 네트워크, 무선 로컬 영역 네트워크(wireless local area network: LAN) 및/또는 대도시권 네트워크(metropolitan area network: MAN) 및 무선 통신에 의한 다른 장치를 포함하지만, 이들로 제한되지 않는다. 무선 통신은 선택적으로 이동 통신 글로벌 시스템(Global System for Mobile Communications: GSM), 향상된 데이터 GSM 환경(Enhanced Data GSM Environment: EDGE), 고속 다운링크 패킷 접속(high-speed downlink packet access: HSDPA), 고속 업링크 패킷 접속(high-speed uplink packet access: HSUPA), 이볼루션(Evolution), 데이터-온리(Data-Only: EV-DO), HSPA, HSPA+, Dual-Cell HSPA(DC-HSPDA), 장기간 이볼루션(long term evolution: LTE), 근거리 통신(near field communication: NFC), 광대역 코드 분할 다중 접속(wideband code division multiple access: W-CDMA), 코드 분할 다중 접속(code division multiple access: CDMA), 시간 분할 다중 접속(time division multiple access: TDMA), 블루투스, 무선 충실도(Wireless Fidelity: Wi-Fi)(예를 들어, IEEE 802.11a, IEEE 802.11ac, IEEE 802.11ax, IEEE 802.11b, IEEE 802.11g 및/또는 IEEE 802.11n), 음성 인터넷 프로토콜(voice over Internet Protocol: VoIP), Wi-MAX, 이메일용 프로토콜(예를 들어, 인터넷 메신저 접속 프로토콜(Internet message access protocol: IMAP) 및/또는 포스트 오피스 프로토콜(post office protocol: POP)), 인스턴트 메시징(instant messaging)(예를 들어, 확장 가능한 메시징 존재 프로토콜(extensible messaging presence protocol: XMPP), Session Initiation Protocol for Instant Messaging and Presence Leveraging Extensions(SIMPLE), Instant Messaging and Presence Service(IMPS)) 및/또는 Short Message Service(SMS) 또는 본 개시내용의 출원일 현재 아직 개발되지 않은 통신 프로토콜을 비롯한, 임의의 다른 적합한 통신 프로토콜을 포함하지만 이들로 제한되지 않는 복수의 통신 표준, 프로토콜 및 기술 중 임의의 것을 사용한다.
도 1은 "시스템(100)"을 도시하지만, 이 도면은 본 명세서에 기재된 실시형태의 국지적인 개략도로서라기 보다는 컴퓨터 시스템에 존재할 수 있는 다양한 특징부의 기능성 설명으로서 보다 의도된다. 실제로, 그리고 당업자에게 인식되는 바와 같이, 개별적으로 도시된 항목은 조합될 수 있고, 일부 아이템은 분리될 수 있다. 더욱이, 도 1은 비-지속성 메모리(111)의 특정 데이터 및 모듈을 도시하지만, 이들 데이터 및 모듈 중 일부 또는 모두는 지속성 메모리(112)에 존재할 수 있다. 추가로, 일부 실시형태에서, 메모리(111 및/또는 112)는 상기에 기재되지 않은 추가 모듈 및 데이터 구조를 저장한다.
본 개시내용에 따른 시스템이 도 1을 참고로 개시되어 있지만, 본 개시내용에 따른 방법을 이제 도 2A, 도 2B, 도 3 및 도 4를 참고로 보다 상세하게 설명될 것이다.
블록 202. 분자의 화학적 구조를 결정하는 방법이 제공된다. 본 개시내용의 목적은 핵산의 단일 뉴클레오타이드 분해능(resolution) 서열결정을 가능하게 하는 것이다. 일부 실시형태에서, 하나 이상의 프로브와 분자 간의 상호작용을 특징규명하는 방법이 제공된다. 방법은 하나 이상의 프로브 종이 분자에 일시적으로 결합하도록 하는 조건 하에서 하나 이상의 프로브 종을 분자에 첨가하는 것을 포함한다. 방법은 검출기 상에서 분자 상의 개별 결합 사건을 연속적으로 모니터링하고, 일정 시간 기간에 걸쳐서 각각의 결합 사건을 기록함으로써 진행된다. 각각의 결합 사건으로부터의 데이터를 분석하여 상호작용의 하나 이상의 특징을 결정한다.
일부 실시형태에서, 중합체의 아이덴티티를 결정하는 방법이 제공된다. 일부 실시형태에서, 세포 또는 조직의 아이덴티티를 결정하는 방법이 제공된다. 일부 실시형태에서, 유기체의 아이덴티티를 결정하는 방법이 제공된다. 일부 실시형태에서, 개체의 아이덴티티를 결정하는 방법이 제공된다. 일부 실시형태에서, 방법은 단일 세포 서열결정에 적용된다.
표적 중합체.
일부 실시형태에서, 분자는 핵산, 바람직하게는 네이티브 폴리뉴클레오타이드이다. 다양한 실시형태에서, 방법은 무손상 표적 폴리뉴클레오타이드로서 세포, 세포 소기관, 염색체, 바이러스, 엑소좀 또는 체액으로부터 단일 표적 폴리뉴클레오타이드 분자를 추출시키는 단계를 추가로 포함한다.
일부 실시형태에서, 중합체는 짧은 폴리뉴클레오타이드(예를 들어, 1 킬로베이스 미만 또는 300개 염기 미만)이다. 일부 실시형태에서, 짧은 폴리뉴클레오타이드는 체액, 예컨대, 소변 및 혈액에서 무세포 DNA에 대해서 관찰되는 바와 같이 100 내지 200개 염기, 150 내지 250개 염기, 200 내지 350개 염기 또는 100 내지 500개 염기 길이이다.
일부 실시형태에서, 핵산은 적어도 10,000개 염기 길이이다. 일부 실시형태에서, 핵산은 적어도 1,000,000개 염기 길이이다.
다양한 실시형태에서, 단일 표적 폴리뉴클레오타이드는 염색체이다. 다양한 실시형태에서, 단일 표적 폴리뉴클레오타이드는 약 102, 103, 104, 105, 106, 107, 108 또는 109개 염기 길이이다.
일부 실시형태에서, 방법은 표적 단백질 상의 아미노산 서열의 분석을 가능하게 한다. 일부 실시형태에서, 표적 폴리펩타이드 상의 아미노산 서열의 분석 방법이 제공된다. 일부 실시형태에서, 표적 폴리뉴클레오타이드 상의 아미노산 서열뿐만 아니라 펩타이드 변형의 분석 방법이 제공된다. 일부 실시형태에서 분자 엔티티는 적어도 5개 단위를 포함하는 중합체이다. 이러한 실시형태에서 결합 프로브는 올리고뉴클레오타이드, 항체, 어피머, 나노바디, 압타머 결합 단백질 또는 소분자 등을 포함하는 분자 프로브이다.
이러한 실시형태에서, 20개 아미노산 각각은 N-리코그닌(recognin), 나노바디, 항체, 압타머 등을 포함하는 상응하는 특이적인 프로브에 의해서 결합된다. 각각의 프로브의 결합은 폴리펩타이드 쇄 내의 각각의 상응하는 아미노산에 특이적이다. 일부 실시형태에서, 폴리펩타이드 내의 소단위의 순서가 결정된다. 일부 실시형태에서, 결합은 결합 부위의 대용체(surrogate)에 대한 것이다. 일부 실시형태에서, 대용체는 특정 아미노산 또는 펩타이드 서열에 부착된 태그이고, 일시적인 결합은 대용체에 대한 것일 것이다.
일부 실시형태에서, 분자는 이종 분자이다. 일부 실시형태에서, 이종 분자는 초분자 구조를 포함한다. 일부 실시형태에서, 방법은 이종 중합체에 대한 화학적 구조 단위를 식별 및 정렬하는 것을 가능하게 한다. 이러한 실시형태는 중합체를 연장시키고, 복수의 프로브에 결합시켜 연장된 중합체를 따르는 복수의 부위에서 화학 구조를 식별하는 것을 포함한다. 이종중합체의 연장은 프로브 결합 부위의 부분 회절 수준(예를 들어, 나노단위) 국지화를 허용한다.
일부 실시형태에서, 중합체의 소단위를 인식하는 프로브의 결합에 의해서 중합체를 서열결정하는 방법이 제공된다. 전형적으로, 하나의 프로브의 결합은 중합체를 서열결정하기에 충분하지 않다. 예를 들어, 도 1A는 중합체(130)의 서열결정이 프로브(182)의 레퍼토리와의 일시적인 상호작용(예를 들어, 변성된 폴리뉴클레오타이드와 올리고뉴클레오타이드의 레퍼토리의 상호작용 또는 변성된 폴리펩타이드와 나노바디 또는 어피머의 패널과의 상호작용)을 측정하는 것에 기초하는 실시형태를 도시한다.
표적 중합체의 추출 및/또는 제조.
일부 실시형태에서, 핵산 추출 전에 수행되지 않은 다른 세포로부터 관심대상인 세포를 분리할 필요가 있다. 이러한 일례에서, 순환 종양 세포 또는 순환 태아 세포가 혈액으로부터 단리된다(예를 들어, 친화도 포획을 위한 세포 표면 마커를 사용함으로써). 일부 실시형태에서, 인간 세포로부터 미생물 세포를 분리할 필요가 있고, 여기서 관심대상은 미생물 세포로부터의 폴리뉴클레오타이드를 검출 및 분석하는 것이다. 일부 실시형태에서, 옵소닌을 사용하여 광범위한 미생물을 친화도 포획하고, 그것을 포유동물 세포로부터 분리시킨다. 또한, 일부 실시형태에서, 차동 용해(differential lysis)가 수행된다. 포유동물 세포를 먼저 비교적 온화한 조건 하에서 용해시킨다. 미생물 세포는 전형적으로 포유동물 세포보다 더 단단하기 때문에, 그들은 포유동물 세포의 용해를 통해서 무손상으로 유지된다. 용해된 포유동물 세포 단편을 세척한다. 이어서 더 가혹한 조건을 사용하여 미생물 세포를 용해시킨다. 이어서 표적 미생물 폴리뉴클레오타이드를 선택적으로 서열결정한다.
일부 실시형태에서, 표적 핵산을 서열결정 이전에 세포로부터 추출시킨다. 대안적인 실시형태에서, (예를 들어, 염색체 DNA의) 서열결정은 세포 내부에서 수행되는데, 여기서 염색체 DNA는 간기 동안 콘볼루션된 경로를 따른다. 동소(in situ)에서 올리고의 안정적인 결합은 문헌[Beliveau et al., Nature Communications 6:7147 (2015)]에 의해서 입증되어 있다. 올리고의 이러한 동소 결합 및 3차원 공간에서의 이의 나노규모 국지화는 세포 내의 염색체 분자의 서열 및 국지적 배열의 결정을 가능하게 한다.
표적 폴리뉴클레오타이드는 보통 네이티브의 폴딩된 상태로 존재한다. 이러한 일례에서, 게놈 DNA는 염색체 내에서 고도로 축합되는 반면, RNA는 2차 구조를 형성한다. 일부 실시형태에서, (예를 들어, 폴리뉴클레오타이드의 실질적인 네이티브 길이를 보존함으로써) 폴리뉴클레오타이드의 긴 길이가 생물학적 샘플로부터의 추출 동안 획득된다. 일부 실시형태에서, 폴리뉴클레오타이드는 이의 길이를 따른 장소가 거의 모호하지 않거나 전혀 모호하지 않게 추적되도록 선형화된다. 이상적으로, 표적 폴리뉴클레오타이드는 선형화 전 또는 후에 펴지거나, 신장되거나 연장된다.
방법은 매우 긴 중합체 길이를 서열결정하는 데 특히 적합하고, 여기서 네이티브 길이 또는 이의 실질적인 비율은 보존된다(예를 들어, DNA의 경우 전체 염색체 또는 약 1 메가베이스 분율). 그러나, 일반적인 분자 생물학 방법은 DNA의 의도하지 않은 단편화를 야기한다. 예를 들어, 피펫팅 및 보텍싱이 DNA 분자를 파괴하는 전단력을 유발한다. 핵 오염물은 핵산이 분해되도록 할 수 있다. 일부 실시형태에서, 네이티브 길이 또는 네이티브 길이의 실질적인 고분자량(high molecular weight: HMW) 단편은 부동화, 신장 및 서열결정 개시 이전에 보존된다.
일부 실시형태에서, 폴리뉴클레오타이드는 서열결정이 시작되기 전에 비교적 균일한 긴 길이(예를 들어, 약 1Mb 길이)로 의도적으로 단편화된다. 일부 실시형태에서, 폴리뉴클레오타이드는 고정 또는 연장 동안 또는 그 후에 비교적 균일한 긴 길이로 단편화된다. 일부 실시형태에서, 단편화는 효소에 의해서 수행된다. 일부 실시형태에서, 단편화는 물리적으로 수행된다. 일부 실시형태에서, 물리적 단편화는 초음파처리를 통해서 일어난다. 일부 실시형태에서, 물리적 단편화는 이온 충격 또는 방사선을 통해서 일어난다. 일부 실시형태에서, 물리적 단편화는 전자기 방사선을 통해서 일어난다. 일부 실시형태에서, 물리적 단편화는 UV 조명을 통해서 일어난다. 일부 실시형태에서, UV 조명의 선량은 주어진 길이로 단편화를 수행하도록 제어된다. 일부 실시형태에서, 물리적 단편화는 UV 조명과 염료(예를 들어, YOYO-1)로의 염색의 조합을 통해서 일어난다. 일부 실시형태에서, 단편화 공정은 물리적 작용 또는 시약의 부가에 의해서 중단된다. 일부 실시형태에서, 단편화 공정에서의 중단을 수행하는 시약은 환원제, 예컨대, 베타-머캅토에탄올(beta-mercaptoethanol: BME)이다.
방사선의 투입 및 서열결정에 의한 단편화
2차원 센서의 관측 시야가 DNA의 완전한 메가베이스 길이를 센서의 1차원에서 관찰할 수 있게 하는 경우, 1Mb의 게놈 DNA 길이를 생성시키는 것이 효율적이다. 염색체 길이 단편의 크기를 감소시키는 것은 또한 가닥의 얽힘(tangling)을 최소화하고, 신장된 양호하게 단리된 형태로 DNA의 최대 길이를 얻는 것을 또한 주목해야 한다.
염색체의 긴 하위단편을 서열결정하기 위한 방법은 하기 단계를 포함한다:
i) 염색체 이중 가닥 DNA를 염료로 염색하는 단계로서, 상기 염료는 이중 가닥의 염기쌍 사이를 인터칼레이팅하는, 상기 단계
ii) 염색된 염색체 DNA를 미리 결정된 선량의 전자기 방사선에 노출시켜 목적하는 크기 범위 내의 염색체 DNA의 하위단편을 생성시키는 단계
iii) 염색된 염색체 하위단편 DNA를 표면 상에 연장 및 고정시키는 단계
iv) 염색된 염색체 하위단편을 변성시켜 염기쌍을 파괴함으로써 인터칼레이팅 염료를 방출시키는 단계
v) 생성된 탈염색된, 연장된, 고정된, 단일-가닥을 주어진 길이 및 서열의 올리고뉴클레오타이드의 레퍼토리에 노출시키는 단계
vi) 레퍼토리 내의 각각의 올리고뉴클레오타이드의 탈염색된 연장된 단일 가닥을 따르는 결합의 장소를 결정하는 단계
vii) 레퍼토리 내의 모든 올리고의 결합 장소를 컴파일링하여 염색체 하위단편의 완전 서열결정을 획득하는 단계.
상기 중 일부 실시형태에서, 염색은 염색체가 세포 내에 존재할 때 일어난다. 상기 중 일부 실시형태에서, 표지된 올리고뉴클레오타이드만 표지되는데, 그 이유는 듀플렉스가 형성될 때 더 많은 염색제가 첨가되고, 듀플렉스 내에 인터칼레이팅되기 때문이다. 상기 중 일부 실시형태에서, 선택적으로 변성에 더하여, 염색을 탈색시킬 수 있는 전자기 방사선의 투입이 적용된다. 상기 중 일부 실시형태에서, 상기 미리 결정된 투입은 노출 강도 및 지속기간의 조작 및 화학적 노출에 의한 단편화의 종결에 의해서 달성되는데, 여기서 상기 화학적 노출은 환원제, 예컨대, 베타-머캅토에탄올이다. 상기 중 일부 실시형태에서, 투입량을 미리 결정하여 대략 1Mb 길이의 단편의 프아송 분포를 생성시킨다.
고정 및 부동화 방법.
블록 204. 핵산은 시험 기질 상에 이중 가닥의 선형의 신장된 형태로 고정되어 고정되고 신장된 이중 가닥 핵산을 형성한다. 선택적으로, 분자는 표면 또는 매트릭스 상에 부동화된다. 일부 실시형태에서, 단편화된 중합체 또는 네이티브 중합체가 고정된다. 일부 실시형태에서, 고정된 이중 가닥의 선형 핵산은 직선형이 아니라, 곡선형 또는 굴곡진(tortuous) 경로를 따른다.
일부 실시형태에서, 고정시키는 단계는 분자 코밍(감소 메니스커스), 유동 신장 나노컨파인먼트 또는 전기-신장에 의해서 시험 기질 상에 핵산을 적용하는 것을 포함한다. 일부 실시형태에서, 핵산을 기질에 적용하는 것은 UV 가교 단계를 추가로 포함하는데, 여기서 핵산은 기질에 공유 결합된다. 일부 실시형태에서, 적용은 핵산의 UV 가교가 필요하지 않고, 핵산은 다른 수단(예를 들어, 예컨대, 소수성 상호작용, 수소 결합 등)을 통해서 기질에 결합된다.
폴리뉴클레오타이드를 단지 하나의 단부에 부동화(예를 들어, 고정)시키는 것은 폴리뉴클레오타이드가 신장하는 것을 허용하고, 비조직적 방식으로 연관된다. 따라서, 연장 방법이 사용되면 언제나, 중합체의 길이를 따르는 신장 정도는 표적 내의 임의의 특정 위치에 대해서 보장될 수 없다. 일부 실시형태에서, 중합체를 따르는 다수의 지점의 상대적인 장소는 변동 대상이 아니라는 것이 필수적이다. 이러한 실시형태에서, 연장된 분자는 이의 길이를 따라서 다수의 접촉 지점에 의해서 표면에 부동화되거나 고정되어야 하고(예를 들어, 문헌[Michalet et al, Science 277:1518-1523, 1997]의 분자 코밍 기술에서 수행되는 바와 같음; 또한 문헌[Molecular Combing of DNA: Methods and Applications, Journal of Self-Assembly and Molecular Electronics (SAME) 1:125-148] 참고), 표면 상의 신장을 위해서 사용될 수 있다(예를 들어, 문헌[ACS Nano. 2015 Jan 27;9(1):809-16)]).
일부 실시형태에서, 폴리뉴클레오타이드의 어레이는 표면 상에 부동화되고, 일부 실시형태에서, 어레이의 폴리뉴클레오타이드는 회절-제한 영상화에 의해서 개별적으로 리졸빙되기에 충분히 멀리 이격되어 있다. 일부 실시형태에서, 폴리뉴클레오타이드는 표면 상에 정렬된 방식이 되어, 분자는 주어진 표면적 내에서 최대한 패킹되고, 그것은 중첩되지 않는다. 일부 실시형태에서, 이것은 패턴화된 표면(예를 들어, 폴리뉴클레오타이드의 단부가 결합할 그러한 장소에서 소수성 패치 또는 스트립의 정렬된 배열)을 제조함으로써 수행된다. 일부 실시형태에서, 어레이의 폴리뉴클레오타이드는 회절 제한 영상화에 의해서 개별적으로 리졸빙되기에 충분하게 멀리 이격되어 있지 않고, 초고해상도 방법(super-resolution method)에 의해서 개별적으로 리졸빙된다.
일부 실시형태에서, 폴리뉴클레오타이드는 DNA 커튼(Curtain)에서 조직화된다(Greene et al., Methods Enzymol. 472:293-315, 2010). 이것은 긴 폴리뉴클레오타이드의 경우 특히 유용하다. 이러한 실시형태에서, 일시적인 결합은, 하나의 단부에 부착된 DNA 가닥이 유동력 또는 전기영동력에 의해서 연장되는 동안 또는 가닥의 양 단부가 포획된 후에 기록된다. 일부 실시형태에서, 동일한 서열의 다수의 카피가 DNA 커튼 내에 복수의 폴리뉴클레오타이드를 형성하는 경우, 이러한 서열은 하나의 폴리뉴클레오타이드라기 보다는 복수의 폴리뉴클레오타이드로부터의 응집물로 결합 패턴으로부터 조립된다. 일부 실시형태에서, 폴리뉴클레오타이드의 양 단부는 패드(예를 들어, 표면의 다른 섹션을 초과하는 폴리뉴클레오타이드에 부착할 표면의 영역)에 결합하고, 각각의 단부는 상이한 패드에 결합한다. 이러한 실시형태에서, 단일 선형 폴리뉴클레오타이드가 결합하는 2개의 패드는 폴리뉴클레오타이드의 신장된 입체구조를 제자리에 유지시키고, 동일하게 이격된 중첩되지 않거나 상호작용하지 않는 폴리뉴클레오타이드의 정렬된 어레이가 형성되는 것을 허용한다. 일부 실시형태에서, 단지 하나의 폴리뉴클레오타이드가 개별 패드를 점유한다. 일부 실시형태에서, 패드가 프아송 공정을 사용하여 존재하는 경우, 일부 패드는 폴리뉴클레오타이드에 의해서 점유되지 않고, 일부는 하나 그리고 일부는 하나 초과에 의해서 점유된다.
일부 실시형태에서, 표적 분자는 정렬된 초분자 스캐폴드(예를 들어, DNA 오리가미(Origami) 구조) 상에 포획된다. 일부 실시형태에서, 스캐폴드 구조는 표적 분자를 포획하기 위한 용액상 동역학을 이용하기 위해서 용액 중에 자유롭게 시작한다. 일단 이들이 점유되면, 스캐폴드는 표면 상에 정착하거나 자가 조립되고, 표면 상에 봉쇄된다. 정렬된 어레이는 분자의 효율적인 부분 회절 패킹을 가능하게 하여 관측 시야당 분자의 더 높은 밀도(고밀도 어레이)를 허용한다. 단일 분자 국지화 방법은 고밀도 어레이 내의 폴리뉴클레오타이드 슈퍼-리졸빙되는 것을 허용한다(예를 들어, 40㎚ 이하의 지점 대 지점 거리).
일부 실시형태에서, (선택적으로 핵산의 단부의 폴리싱(polishing) 후) 헤어핀은 듀플렉스 주형 단부 상에서 결찰된다. 일부 실시형태에서, 헤어핀은 핵산을 표면에 부동화하는 바이오틴을 함유한다. 대안적인 실시형태에서, 헤어핀은 듀플렉스의 두 가닥에 공유 연결되도록 기능한다. 일부 이러한 실시형태에서, 핵산의 다른 단부는 예를 들어, 올리오(olio) d(T)에 의한 표면 포획을 위해서 테일링(tailing)된다. 변성 후, 핵산의 두 가닥은 올리고와의 상호작용을 위해서 사용 가능하다.
일부 실시형태에서, 정렬된 어레이는 함께 연결되어 큰 DNA 격자를 형성하는 개별 스캐폴드의 형태를 취한다(예를 들어, 문헌[Woo and Rothemund, Nature Communications, 5: 4889]에 기재된 바와 같음). 일부 이러한 실시형태에서, 개별 작은 스캐폴드는 염기-짝지움에 의해서 서로에 봉쇄된다. 이어서 이들은 본 개시내용의 서열결정 단계를 위한 고도로 정렬된 나노구조 어레이를 제공한다. 일부 실시형태에서, 포획 부위는 정렬된 2차원 격자 내에 10㎚ 피치로 정렬된다. 완전 점유 시, 이러한 격자는 제곱 센티미터당 1조개 단위의 분자를 포획할 가능성을 갖는다.
일부 실시형태에서, 격자 내의 포획 부위는 정렬된 2차원 격자 내에 5㎚ 피치, 10㎚ 피치, 15㎚ 피치, 30㎚ 피치 또는 50㎚ 피치로 정렬된다. 일부 실시형태에서, 격자 내의 포획 부위는 정렬된 2차원 격자 내에 5㎚ 피치 내지 50㎚ 피치로 정렬된다.
일부 실시형태에서, 정렬된 어레이는 나노유체를 사용하여 생성된다. 이러한 일례에서, 나노해구(nanotrench) 또는 나노홈(nanogroove)(예를 들어, 폭 100㎚ 및 깊이 150㎚)이 표면 상에 질감을 부여하고, 긴 폴리뉴클레오타이드를 정렬하기 위해서 제공된다. 이러한 실시형태에서, 나노해구 또는 나노홈 내의 하나의 폴리뉴클레오타이드의 존재는 또 다른 폴리뉴클레오타이드의 도입을 배제한다. 또 다른 실시형태에서, 나노피트(nanopit) 어레이가 사용되는데, 여기서 긴 폴리뉴클레오타이드의 분절은 피트 내에 존재하고, 사이의 긴 분절은 피트 사이에 퍼져 있다.
일부 실시형태에서, 고밀도의 폴리뉴클레오타이드는 초고해상도 영상화 및 정밀 서열결정을 여전히 허용한다. 예를 들어, 일부 실시형태에서, 폴리뉴클레오타이드의 하위세트만 관심대상이다(예를 들어, 표적화 서열결정). 이러한 실시형태에서, 표적화 서열결정이 수행되는 경우 복잡한 샘플(예를 들어, 전체 게놈 또는 전사체)로부터의 폴리뉴클레오타이드의 하위세트만 분석될 필요가 있고, 폴리뉴클레오타이드는 일반적인 것보다 더 높은 밀도로 표면 및 매트릭스 상에 침착될 필요가 있다. 이러한 실시형태에서, 몇몇 폴리뉴클레오타이드가 회절 제한 공간 내에 존재하는 경우에도, 신호가 검출되는 경우, 그것이 표적화된 유전자좌 중 단지 하나로부터 유래되고, 이 유전자좌가 프로브에 동시에 결합되는 또 다른 그러한 유전자좌의 회절 제한된 거리 내에 존재하지 않을 확률이 높다. 표적화된 서열결정을 겪는 각각의 폴리뉴클레오타이드 사이의 요구되는 거리는 표적화되는 폴리뉴클레오타이드의 백분율과 상관관계가 있다. 예를 들어, 폴리뉴클레오타이드 중 5% 미만이 표적화되는 경우, 폴리뉴클레오타이드의 밀도는 전체 폴리뉴클레오타이드 서열이 바람직한 경우보다 20배 더 크다. 표적화된 서열결정의 일부 실시형태에서, 영상화 시간은, 전체 게놈이 분석되는 경우보다 더 짧다(예를 들어, 상기 예에서, 표적화된 서열결정 영상화는 전체 게놈 서열결정보다 10× 더 빠를 수 있다).
일부 실시형태에서, 시험 기질은 고정시키는 단계 이전에 서열-특이적 올리고뉴클레오타이드 프로브와 결합되어 있고, 그리고 고정시키는 단계는 시험 기질에 결합된 서열-특이적 올리고뉴클레오타이드 프로브를 사용하여 시험 기질 상에 핵산을 포획하는 것을 포함한다. 일부 실시형태에서, 핵산은 5'에서 결합된다. 일부 실시형태에서, 핵산은 3'에서 결합된다. 또 다른 실시형태에서, 기질 상에 2개의 별개의 프로브가 존재하는 경우, 하나의 프로브는 핵산의 제1 단부에 결합할 것이고, 나머지 프로브는 핵산의 제2 단부에 결합할 것이다. 이러한 경우, 2개의 프로브가 사용되는 경우, 또한 핵산의 길이에 대한 사전 정보를 가질 필요가 있다. 일부 실시형태에서, 핵산은 미리 결정된 엔도뉴클레아제를 사용한 제1 절단이다.
다양한 실시형태에서, 고정 이전에, 표적 폴리뉴클레오타이드는 겔 또는 매트릭스 중에서 추출되거나 내포된다(예를 들어, 문헌[Shag et al., Nature Protocols 7:467-478, 2012]에 기재된 바와 같음). 이러한 비제한적인 일례에서, 폴리뉴클레오타이드는 액체 대 겔 전이를 겪는 매질을 함유하는 유동 채널 내에 침착된다. 폴리뉴클레오타이드는 먼저 연장되고, 액체상 중에 분포되고, 이어서 (예를 들어, 가열에 의해서, 또는 폴리아크릴아마이드의 경우 보조인자의 첨가에 의해서 또는 시간에 따라서) 고체/겔 상으로의 상 변화에 의해서 고정된다. 일부 실시형태에서, 폴리뉴클레오타이드는 고체/겔 상에서 연장된다.
일부 대안적인 실시형태에서, 프로브 자체가 표면 또는 매트릭스 상에 부동화된다. 이러한 실시형태에서, 하나 이상의 표적 분자(예를 들어, 폴리뉴클레오타이드)가 용액 중에 현탁되고, 고정된 프로브에 일시적으로 결합한다. 일부 실시형태에서, 올리고뉴클레오타이드의 공간적으로 다룰 수 있는 어레이를 사용하여 폴리뉴클레오타이드를 포획한다. 일부 실시형태에서, 짧은 폴리뉴클레오타이드(예를 들어, 300개 미만의 뉴클레오타이드), 예컨대, 무세포 DNA 또는 마이크로RNA 또는 비교적 짧은 폴리뉴클레오타이드(예를 들어, 10,000개 미만의 뉴클레오타이드), 예컨대, mRNA는, 적절한 포획 분자를 사용하여 변형된 또는 비변형된 단부를 포획함으로써 표면 상에 무작위로 부동화된다. 일부 실시형태에서, 짧은 또는 비교적 짧은 폴리뉴클레오타이드는 표면과 다중으로 상호작용하고, 서열결정은 표면과 평행한 방향으로 수행된다. 이것은 스플라이싱 아이소폼 조직화가 리졸빙되게 한다. 예를 들어, 일부 아이소폼에서, 반복되거나 셔플링되는 엑손의 장소가 설명된다.
일부 실시형태에서, 부동화된 프로브는 폴리뉴클레오타이드에 어닐링된 공통 서열을 함유한다. 이러한 실시형태는, 표적 폴리뉴클레오타이드가 바람직하게는 하나 또는 두 단부에 공통 서열을 갖는 경우에 특히 유용하다. 일부 실시형태에서, 폴리뉴클레오타이드는 단일 가닥이고, 공통 서열, 예컨대, 폴리A 테일을 갖는다. 이러한 일례에서, 폴리A 테일을 보유하는 네이티브 mRNA는 표면 상의 올리고 d(T) 프로브의 론(lawn) 상에 포획된다. 일부 실시형태에서, 특히 짧은 DNA가 분석되는 경우, 폴리뉴클레오타이드의 단부는 표면/매트릭스 상의 포획 분자와의 상호작용을 위해서 개작된다.
일부 실시형태에서, 폴리뉴클레오타이드는 제한 효소에 의해서 생성된 점착성 단부를 갖는 이중 가닥이다. 일부 비제한적인 예에서, 드문 부위(예를 들어, Pmme1 또는 NOT1)를 갖는 제한 효소를 사용하여 폴리뉴클레오타이드의 긴 단편을 생성시키며, 각각의 단편은 공통 단부 서열을 함유한다. 일부 실시형태에서, 개작은 말단 트랜스퍼라제를 사용하여 수행된다. 다른 실시형태에서, 결찰 또는 태그먼트화(tagmentation)를 사용하여 일루미나 서열결정을 위한 어댑터를 도입한다. 이것은 사용자가 널리 확립된 일루미나 프로토콜을 사용하여 샘플을 제조하는 것을 가능하게 하며, 이어서 샘플은 본 명세서에 기재된 방법에 의해서 포획 및 서열결정된다. 이러한 실시형태에서, 폴리뉴클레오타이드는 바람직하게는 증폭 전에 포획되는데, 증폭은 오류 및 편향을 도입하는 경향이 있다.
연장 방법
대부분의 실시형태에서, 폴리뉴클레오타이드 또는 다른 표적 분자는 연장이 일어나기 위해서 표면 또는 매트릭스에 부착되어야 한다. 일부 실시형태에서, 핵산의 연장은 이의 결정학상 길이(예를 들어, 하나의 염기에서 그 다음까지 0.34㎚가 분리되어 있다고 공지된 경우)와 동일하거나, 더 길거나 더 짧도록 한다. 일부 실시형태에서, 폴리뉴클레오타이드는 결정학상 길이를 초과하게 신장된다.
일부 실시형태에서, 폴리뉴클레오타이드는 분자 코밍을 통해서 신장된다(예를 들어, 문헌[Michalet et al., Science 277:1518-1523, 1997 및 Deen et al., ACS Nano 9:809-816, 2015]에 기재된 바와 같음). 이것은 수 백 만 및 수 천 만 개의 분자가 평행하게 신장 및 단방향 정렬되게 한다. 일부 실시형태에서, 분자 코밍은, 목적하는 핵산을 함유하는 용액을 기질 상에서 세척하고, 이어서 용액의 메니스커스를 리트랙팅(retracting)함으로써 수행된다. 메니스커스의 리트랙팅 이전에, 핵산은 기질과 공유 또는 다른 상호작용을 형성한다. 용액이 제거됨에 따라서, 핵산은 (예를 들어, 표면 보유를 통해서) 메니스커스와 동일한 방향으로 당겨지지만; 핵산과 기질 간의 상호작용의 강도가 표면 보유력을 극복하기에 충분하면, 핵산은 감소 메니스커스의 방향으로 균일한 방식으로 신장된다. 일부 실시형태에서, 분자 코밍은 본 명세서에 전문이 참조에 의해 포함된 문헌[Kaykov et al., Sci Reports. 6:19636 (2016)]에 기재된 바와 같이 수행된다. 다른 실시형태에서, 분자 코밍은 문헌[Petit et al. Nano Letters 3:1141-1146 (2003)]에 기재된 방법 또는 그 방법의 변형된 버전을 사용하여 (예를 들어, 마이크로유체 장치의) 채널에서 수행된다.
공기/물 계면의 형상은 분자 코밍에 의해서 신장되는 연장된 폴리뉴클레오타이드의 방향을 결정한다. 일부 실시형태에서, 폴리뉴클레오타이드는 공기/물 계면에 수직으로 연장된다. 일부 실시형태에서, 표적 폴리뉴클레오타이드는 이의 말단 중 하나 또는 둘 다의 변형 없이 표면에 부착된다. 일부 실시형태에서, 이중 가닥 핵산의 단부가 소수성 상호작용에 의해서 포획되는 경우, 감소 메니스커스를 사용한 신장은 듀플렉스의 부분을 변성시키고, 추가로 표면과의 소수성 상호작용을 형성한다.
일부 실시형태에서, 폴리뉴클레오타이드는 분자 트레딩(threading)을 통해서 신장된다(예를 들어, 문헌[Payne et al., PLoS ONE 8(7):e69058, 2013]에 기재된 바와 같음). 일부 실시형태에서 분자 트레딩은 표적이 단일 가닥으로 변성된 후에 일어난다(예를 들어, 화학적 변성제, 온도 또는 효소에 의해서). 일부 실시형태에서 폴리뉴클레오타이드는 하나의 단부에 테더링되고, 이어서 유체 유동으로 신장된다(예를 들어, 문헌[Greene et al., Methods in Enzymology, 327: 293-315]에 제시된 바와 같음).
다양한 실시형태에서, 표적 폴리뉴클레오타이드 분자는 마이크로유체 채널 내에 존재한다. 이러한 일례에서, 폴리뉴클레오타이드는 마이크로유체 채널 내로 유동되거나 또는 하나 이상의 염색체, 엑소좀, 핵 또는 세포로부터 유동 채널 내에 추출된다. 일부 실시형태에서, 마이크로유체 또는 나노유체 플로우 셀을 통해서 나노채널 내에 폴리뉴클레오타이드를 인터칼레이팅하기 보다는, 폴리뉴클레오타이드는 채널의 벽이 형성된 표면이 전기 바이어싱되는 그러한 방식으로 채널을 구축함으로써 개방-상부 채널 내에 인터칼레이팅된다(예를 들어, 문헌[Asanov et al., Anal Chem. 1998 Mar. 15; 70(6):1156-6] 참고). 이러한 일례에서, 정 바이어스가 표면에 인가되어, 음으로 하전된 폴리뉴클레오타이드가 나노채널에 끌어당겨진다. 동시에, 채널 벽의 리지(ridge)는 바이어스를 함유하지 않아서, 폴리뉴클레오타이드는 리지 자체 상에 적게 침착될 것이다.
일부 실시형태에서, 연장은 유체역학적 드래그(hydrodynamic drag)로 인한 것이다. 이러한 일례에서, 폴리뉴클레오타이드는 나노슬릿 내의 직교류(crossflow)를 통해서 신장된다(Marie et al., Proc Natl Acad Sci USA 110:4893-8, 2013). 일부 실시형태에서, 핵산의 연장은 플로우 채널 내의 나노컨파인먼트로 인한 것이다. 유동 신장 나노컨파인먼트는 핵산을 일반적으로 마이크로유체 장치 내에서 수행되는, 유동 구배를 통해서 선형 입체구조로 신장시키는 것을 포함한다. 이러한 신장 방법의 나노컨파인먼트 부분은 전형적으로 마이크로유체 장치의 좁은 영역을 지칭한다. 좁은 영역 또는 채널의 사용은 분자 개별화(molecular individualism)의 문제점(예를 들어, 신장 동안 다수의 입체구조를 채택하는 개별 핵산 또는 다른 중합체의 경향성)의 극복을 돕는다. 유동 신장 방법의 하나의 문제점은 유동이 항상 핵산 분자를 따라서 동일하게 적용되는 것은 아니라는 것이다. 이는 광범위한 연장 길이를 나타내는 핵산을 야기할 수 있다. 일부 실시형태에서, 유동 신장 방법은 연장 유동 및/또는 유체역학적 드래그를 포함한다. 일부 실시형태에서 폴리뉴클레오타이드가 나노채널 내로 끌어당겨지는 경우, 하나 이상의 폴리뉴클레오타이드가 채널 내에서 나노컨파이닝되어(nanoconfined) 연장된다. 일부 실시형태에서, 나노컨파인먼트 후 폴리뉴클레오타이드는 바이어싱된 표면 상에 또는 코팅 상에 또는 표면 상의 매트릭스 상에 침착된다.
표면에 정 바이어스 또는 부 바이어스를 인가하는 다수의 방법이 존재한다. 이러한 일례에서, 표면은 비-파울링 특징을 갖는 물질로 제조되거나 코팅되거나, 지질(예를 들어, 지질 이중층), 소 혈청 알부민(bovine serum albumin: BSA), 카제인, 다양한 PEG 유도체 등으로 부동태화된다. 부동태화는 채널의 임의의 하나의 부분 내에서의 폴리뉴클레오타이드 격리를 예방하는 기능을 하여, 연장을 가능하게 한다. 일부 실시형태에서, 표면은 또한 인듐 주석 산화물(indium tin oxide: ITO)을 포함한다.
일부 실시형태에서, 나노유체 채널의 표면 상에 지질 이중층(지질 bilayer: LBL)을 생성시키기 위해서, 1% Lissamine(상표명) 로다민 B 1,2-다이헥사데칸오일-sn-글리세로-3-포스포에탄올아민을 함유한 쯔비터이온성(zwitterionic) POPC(1-팔미토일-2-올레오일-sn-글리세로-3-포스포콜린) 지질이 표면 상에 코팅된다. 트라이에틸암모늄염(로다민-DHPE) 지질의 첨가는 형광 현미경으로 LBL 형성을 관찰하는 것을 가능하게 한다. 본 개시내용의 일부 실시형태에서 사용되는 지질 이중층 부동태화 방법은 문헌[Persson et al., Nano Lett. 12:2260-2265, 2012]에 기재되어 있다.
일부 실시형태에서, 하나 이상의 폴리뉴클레오타이드의 연장은 전기영동을 통해서 수행된다. 일부 실시형태에서, 폴리뉴클레오타이드는 하나의 단부에 테더링되고, 이어서 전기장에 의해서 신장된다(예를 들어, 문헌[Giese et al., Nature Biotechnology 26: 317-325, 2008]에 기재된 바와 같음). 핵산의 전기-신장은 핵산이 고도로 음으로 하전된 분자라는 사실이 예측된다. 예를 들어, 문헌[Randall et al. 2006, Lab Chip. 6, 516-522]에 기재된 바와 같은 전기-신장 방법은 (핵산 분자의 배향을 유도하기 위해서) 전류에 의해서 마이크로채널을 통해서 핵산이 배출되는 것을 포함한다. 일부 실시형태에서, 전기-신장은 겔 내에서 겔 없이 수행된다. 겔을 사용하는 것의 하나의 이점은 핵산에 대해서 사용 가능한 3차원 공간을 제한하여 분자 개별화를 극복하는 것을 돕는다는 것이다. 압력-유도된 신장 방법, 예컨대, 나노컨파인먼트보다 전기-신장의 일반적인 장점은 핵산 분자를 파괴하는 전단력의 결여이다.
일부 실시형태에서, 복수의 폴리뉴클레오타이드가 하나의 표면 상에 존재하는 경우, 폴리뉴클레오타이드는 동일한 배향으로 정렬되지 않거나 선형이 아니다(예를 들어, 폴리뉴클레오타이드는 표면에 부착하거나 곡선형 경로로 겔을 통해서 빠져나간다). 이러한 실시형태에서, 복수의 폴리뉴클레오타이드 중 2개 이상이 중첩될 가능성이 증가하여, 각각의 폴리뉴클레오타이드의 길이를 따르는 프로브의 국지화에 관련된 혼동으로 이어진다. 직선형으로 양호하게 정렬된 분자로부터와 같이 동일한 서열결정 정보가 곡선 서열로부터 획득되지만, 곡선형 서열로부터의 서열결정 정보를 처리하는 영상 처리 작업은 직선형으로 양호하게 정렬된 분자로부터의 획득된 것보다 더 높은 계산력(computational power)이 필요하다.
하나 이상의 폴리뉴클레오타이드가 평면 표면에 평행한 방향으로 연장되는 실시형태에서, 이의 길이는 2차원 어레이 검출기, 예컨대, CMOS 또는 CCD 카메라에서 인접한 일련의 픽셀을 가로질러 영상화된다. 일부 실시형태에서, 하나 이상의 폴리뉴클레오타이드는 표면에 수직인 방향으로 연장된다. 일부 실시형태에서, 폴리뉴클레오타이드는 광 시트 현미경, 스피닝 디스크 공초점 현미경, 3차원 초고해상도 현미경, 3차원 단일 분자 국지화 또는 레이저 주사 디스크 공초점 현미경 또는 이들의 변형 장치를 통해서 영상화된다. 일부 실시형태에서, 폴리뉴클레오타이드는 표면에 대해서 비스듬한 각도로 연장된다. 일부 실시형태에서, 폴리뉴클레오타이드는 2차원 검출기를 통해서 영상화되고, 영상은 단일 분자 국지화 알고리즘 소프트웨어(예를 들어, 문헌[Ovesny et al., BioInform. 30:2389-2390, 2014]에 기재된 바와 같은 Fiji/ImageJ plug-in ThunderSTORM)를 통해서 처리될 수 있다.
고정 및 연장 전 단일 세포로부터의 DNA의 추출 및 단리.
일부 실시형태에서, (예를 들어, 국제 특허 공개 제WO/2012/056192호 또는 제WO/2012/055415호의 장치 설계를 사용함으로써) 핵산 내용물이 방출되는 동안 개별 세포를 한 곳에 보유하기 위해서 단일 세포를 위한 트랩이 마이크로유체 구조 내에 설계된다. 일부 실시형태에서, 폴리뉴클레오타이드를 나노채널 내에서 추출 및 신장시키는 것 대신에, 마이크로/나노유체 구조물을 밀봉시키는데 사용되는 커버-글라스 또는 포일을 폴리바이닐실란으로 코팅하여 (예를 들어, 문헌[Petit et al., Nano Letters 3:1141-1146. 2003]에 기재된 바와 같은 유체의 이동에 의해서) 분자 코밍이 가능해진다. 유체 칩 내에서의 온화한 조건은 폴리뉴클레오타이드가 긴 길이로 보존되는 것을 가능하게 한다.
단일 세포 또는 핵으로부터 생체중합체를 추출하기 위해서 다수의 상이한 접근법이 사용 가능하다(예를 들어, 일부 적합한 방법이 문헌[Kim et al., Integr Biol 1(10), 574-86, 2009]에 검토되어 있다). 일부 비제한적인 예에서, 세포를 KCL로 처리하여 세포막을 제거한다. 세포는 저장성(hypotonic) 용액을 첨가함으로써 용해된다. 일부 실시형태에서, 각각의 세포는 별개로 단리되고, 각각의 세포의 DNA는 별개로 추출되고, 이어서 DNA의 각각의 세트는 마이크로유체 용기 또는 장치에서 별개로 서열결정된다. 일부 실시형태에서, 추출은 하나 이상의 세포를 세제 및/또는 프로테아제로 처리함으로써 일어난다. 일부 실시형태에서, 킬레이팅제(예를 들어, EDTA)가 용해 용액에 제공되어 뉴클레아제에 의해서 요구되는 2가 양이온을 포획한다(그리고 따라서 뉴클레아제 활성도를 감소시킨다).
일부 실시형태에서, 단일 세포의 핵 및 추가의 핵 구성성분은 하기 방법에 의해서 별개로 추출된다. 하나 이상의 세포를 마이크로유체 장치의 공급 채널에 제공한다. 이어서 하나 이상의 세포를 포획하는데, 여기서 각각의 세포는 하나의 트래핑 구조에 의해서 포획된다. 제1 용해 완충제를 용액에 첨가하는데, 여기서 제1 용해 완충제는 세포막을 용해시키지만, 세포 핵의 온전성을 보존하는 것을 돕는다. 제1 용해 완충제의 첨가 후, 하나 이상의 세포의 추가의 핵 구성성분을 플로우 셀로 방출시키는데, 여기서 방출된 RNA는 부동화된다. 이어서, 제2 용해 완충제를 공급함으로써 하나 이상의 핵을 용해시킨다. 제2 용해 완충제의 첨가는 하나 이상의 핵(예를 들어, 게놈 DNA)이 플로우 셀로 방출되게 하는데, 그 다음 DNA가 부동화된다. 하나 이상의 세포의 추가 성분 및 세포내 성분은 동일한 플로우 셀의 상이한 장소에서 또는 동일한 장치 내의 상이한 플로우 셀에서 부동화된다.
도 16A 및 도 16B는 다수의 단일 세포를 포획 및 단리시키는 마이크로유체 구조물을 도시한다. 세포(1602)는 플로우 셀(2004) 내의 세포 트랩(1606)에 의해서 포획된다. 일부 실시형태에서, 세포가 포획된 후, 용해 시약이 유동된다. 용해 후, 이어서 폴리뉴클레오타이드는 다른 세포로부터 추출된 폴리뉴클레오타이드로부터의 단리된 채로 포획 영역에 인접하게 분포된다. 일부 실시형태에서, 도 16B에 도시된 바와 같이, (예를 들어, 전하(1610)에 의해서) 전기영동 유도가 수행되어 핵산을 조정한다. 용해는 핵산(1608)을 세포(1602) 및 핵(1604)으로부터 방출시킬 것이다. 핵산(1608)은 (예를 들어, 세포 트랩(1606)에 대해서) 세포(1602)가 트래핑되었을 때 세포가 존재하는 위치에 유지된다. 트랩은 단일 세포의 치수(예를 들어, 2 내지 10uM)이다. 일부 실시형태에서, 미세소적 및 세포를 접촉시키는 채널은 2uM 또는 10uM 초과이다. 일부 실시형태에서, 분기 채널과 트랩 사이의 거리는 1 내지 1000마이크론이다.
표면 상에서 고분자량 DNA의 추출 및 연장.
HMW 폴리뉴클레오타이드를 신장시키기 위한 다양한 방법이 상이한 실시형태에서 사용된다(예를 들어, ACS Nano. 9(1):809-16, 2015). 이러한 일례에서, 표면 상에서의 연장은 (예를 들어, 문헌[Petit and Carbeck in Nano. Lett. 3: 1141-1146, 2003]에 기재된 접근법을 사용함으로써) 플로우 셀에서 수행된다. 유체 접근법에 더하여, 일부 실시형태에서 폴리뉴클레오타이드는 예컨대, 문헌[Giess et al., Nature Biotechnology 26, 317 - 325 (2008)]에 개시된 전기장을 사용하여 신장된다. 폴리뉴클레오타이드가 표면에 부착되지 않은 경우 이들을 연장시키기 위해서 몇몇 접근법이 사용 가능하다(예를 들어, 문헌[Frietag et al., Biomicrofluidics, 9(4):044114 (2015); Marie et al., Proc Natl Acad Sci USA 110:4893-8, 2013]).
겔 플러그 내에서 DNA를 사용하는 것에 대한 대안으로서, 문헌[Cram et al., Methods Cell Sci., 2002, 24, 27-35]에 기재된 바와 같은 폴리 아민 방법에 의해서 칩 상에 로딩하기에 적합한 염색체를 제조하고, 장치에 직접 피펫팅한다. 일부 이러한 실시형태에서, 염색체 내의 DNA에 결합하는 단백질을 프로테아제를 사용하여 소화시켜 실질적으로 네이키드 DNA를 방출시키고, 이어서 이것을 상기에 기재된 바와 같이 고정 및 연장시킨다.
판독물의 장소 보존을 위한 샘플의 처리
매우 긴 영역 또는 중합체를 서열결정하려는 실시형태에서, 중합체의 임의의 분해는 전체 서열결정의 정확성을 상당히 감소시킬 가능성을 갖는다. 전체의 연장된 중합체의 보존을 용이하게 하는 방법이 하기에 제시되어 있다.
폴리뉴클레오타이드는 추출, 저장 또는 제조 동안 손상될 가능성이 있다. 닉(nick) 및 부가물이 네이티브 이중 가닥 게놈 DNA 분자에 형성될 수 있다. 이것은 특히 샘플 폴리뉴클레오타이드가 FFPE 물질로부터 유래되는 경우이다. 따라서, 일부 실시형태에서, DNA 수선 용액은 DNA가 부동화되기 전에 또는 부동화된 후에 도입된다. 일부 실시형태에서, 이것은 겔 플러그 내에서의 DNA 추출 후에 수행된다. 일부 실시형태에서, 수선 용액은 DNA 엔도뉴클레아제, 키나제 및 다른 DNA 변형 효소를 함유한다. 일부 실시형태에서, 수선 용액은 중합효소 및 리가제를 포함한다. 일부 실시형태에서, 수선 용액은 뉴 잉글랜드 바이오랩스사(New England Biolabs)로부터의 사전-PCR 키트 형태이다. 일부 실시형태에서, 이러한 방법은 문헌[Karimi-Busheri et al., Nucleic Acids Res. Oct 1;26(19):4395-400, 1998] 및 [Kunkel et al., Proc. Natl Acad Sci. USA, 78, 6734-6738, 1981]에 기재된 바와 같이 대량으로 수행된다.
일부 실시형태에서, 폴리뉴클레오타이드가 연장된 후, 겔 오버레이가 적용된다. 일부 이러한 실시형태에서, 표면 상에서의 연장 및 변성 후, (이중 가닥 또는 변성된) 폴리뉴클레오타이드는 겔 층으로 피복된다. 대안적으로, 폴리뉴클레오타이드는, 이미 겔 환경에 존재하는 동안(예를 들어, 상기에 기재된 바와 같음) 연장된다. 일부 실시형태에서, 폴리뉴클레오타이드가 연장된 후, 그것은 겔 중에서 캐스팅된다. 예를 들어, 일부 실시형태에서, 폴리뉴클레오타이드가 하나의 단부에서 표면에 부착되고, 유동 스트림에서 또는 전기영동 전류에 의해서 신장되는 경우, 주변 배지는 겔로 캐스팅된다. 일부 실시형태에서, 이것은 아크릴아마이드, 암모늄 퍼설페이트 및 TEMED를 유동 스트림 중에 포함시킴으로써 일어난다. 이러한 화합물은, 경화될 때, 폴리아크릴아마이드가 된다. 대안적인 실시형태에서, 열에 반응하는 겔이 적용된다. 일부 실시형태에서, 폴리뉴클레오타이드의 단부는, 아크릴아마이드와 중합되는 아크리다이트(acrydite)로 변형된다. 일부 이러한 실시형태에서, 네이티브 폴리뉴클레오타이드의 음성 골격이 제공되면, 양극을 향해서 폴리뉴클레오타이드를 연장시키는 전기장이 인가된다.
일부 실시형태에서, 핵산은 겔 플러그 또는 겔 층 내에서 세포로부터 추출되어 DNA의 온전성을 보존하고, 이어서 AC 전기장이 인가되어 겔 내에서 DNA를 신장시키고; 이것이 커버글라스 상부의 겔층에서 수행되는 경우, 본 발명의 방법을 신장된 DNA에 적용하여 일시적인 올리오 결합을 검출할 수 있다.
일부 실시형태에서, 샘플은 이의 환경의 매트릭스에 가교된다. 일례에서, 이것은 세포 환경이다. 예를 들어, 서열결정이 세포에서 동소에서 수행되는 경우, 폴리뉴클레오타이드는 이종이작용성 가교제를 사용하여 세포 매트릭스에 가교된다. 이는, 서열결정이 FISSEQ와 같은 기술을 사용하여 세포 내에서 직접 적용될 때 수행된다(Lee et al., Science 343:1360-1363, 2014).
세포 및 조직으로부터 생물분자를 추출하고, 그 다음 그것을 분석하기 전에 생물분자를 취급하는 과정에서 많은 파괴가 발생한다. DNA의 경우, 온전성의 손실로 이어지는 이러한 취급 양상은 피펫팅, 보텍싱, 동결-해동 및 과도한 열을 포함한다. 일부 실시형태에서, 기계적 스트레스는 예컨대, 문헌[ChemBioChem, 11:340-343 (2010)]에 개시된 방식으로 최소화된다. 또한, 2가 양이온, EDTA, EGTA 또는 갈산(및 이의 유사체 및 유도체)은 뉴클레아제에 의한 분해를 저해한다. 일부 실시형태에서, 2:1비의 샘플 대 2가 양이온 중량이 심지어는 뉴클레아제의 극한 수준이 존재하는 샘플, 예컨대, 대변에서 뉴클레아제를 저해하기에 충분하다.
핵산의 온전성을 보존하기 위해서(예를 들어, 작은 단편 내에 DNA 손상 또는 파괴를 유도하지 않기 위해서, 일부 실시형태에서 이의 자연적인 보호 환경, 예컨대, 염색체, 미토콘드리아, 세포, 핵, 엑소좀 등 내에 생물거대분자, 예컨대, DNA를 유지시키는 것이 바람직하다. 핵산이 이의 보호 환경 외부에 이미 존재하는 실시형태에서, 핵산을 보호 환경, 예컨대, 겔 또는 미세소적 내에 유지시키는 것이 바람직하다. 일부 실시형태에서 핵산은 그것이 서열결정될 장소(예를 들어, 서열결정 데이터가 획득될 유체 시스템 또는 플로우 셀의 부분)에 물리적으로 인접한 이의 보호 환경으로부터 방출된다. 따라서, 일부 실시형태에서, 생물거대분자(예를 들어 핵산, 단백질)는 보호 엔티티 내에 제공되는데, 상기 보호 엔티티는 네이티브 상태(예를 들어, 네이티브 길이)에 가깝게 생물거대분자를 보존하고, 생물거대분자를 포함하는 보호 엔티티를 그것이 서열결정된 장소에 인접하게 운반하고, 이어서 생물거대분자를 그것이 서열결정될 영역 또는 그것이 서열결정될 영역과 인접한 영역에 방출시킨다. 일부 실시형태에서, 본 발명은 게놈 DNA를 포함하는 아가로스 겔을 제공하는 것을 포함하며, 상기 아가로스 겔은 게놈 DNA의 실질적인 부분을 200Kb 초과의 길이까지 보존하고, 게놈 DNA를 포함하는 아가로스를 DNA가 서열결정될 환경(예를 들어, 표면, 겔, 매트릭스)에 인접하게 배치하고, 게놈 DNA를 아가로스로부터 환경에(또는 그것의 추가 수송 및 취급이 최소화되도록 환경에 가깝게) 방출시키고, 서열결정을 수행한다. 서열결정 환경 내로의 방출은 전기장의 인가에 의해서 또는 아가라제(agarase)에 의한 겔의 소화에 의해서 일어날 수 있다.
중합체 변성
블록 206. 그 다음 고정되고 신장된 이중 가닥 핵산을 시험 기질 상에 단일 가닥 형태로 변성시킴으로써, 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득한다. 고정된 제2 가닥의 각자의 염기는 고정된 제1 가닥의 상응하는 상보성 염기에 인접하게 놓인다. 일부 실시형태에서, 변성은 먼저 폴리뉴클레오타이드를 연장 또는 신장시키고, 이어서 변성 용액을 첨가하여 두 가닥을 분리시킴으로써 수행된다.
일부 실시형태에서, 변성은 1종 이상의 시약(예를 들어, 0.5M NaOH, DMSO, 폼아마이드, 유레아 등)을 포함하는 화학적 변성이다. 일부 실시형태에서, 변성은 (예를 들어, 샘플을 85℃ 이상까지 가열하는 것에 의한) 열 변성이다. 일부 실시형태에서, 변성은 예컨대, 헬리카제 또는 헬리카제 활성을 갖는 다른 효소의 사용을 통한 효소 변성을 통해서이다. 일부 실시형태에서, 폴리뉴클레오타이드는 표면과의 상호작용을 통해서 또는 물리적 과정, 예컨대, 임계 길이를 넘어선 신장에 의해서 변성된다. 일부 실시형태에서, 변성은 전체적이거나 부분적이다.
일부 실시형태에서, 중합체의 반복 단위 상의 변형에 프로브를 결합시키는 것(예를 들어, 폴리뉴클레오타이드 내의 뉴클레오타이드 또는 폴리펩타이드에 대한 포스포릴화)은 선택적인 변성 단계 이전에 수행된다.
일부 실시형태에서, 이중 가닥 폴리뉴클레오타이드의 선택적인 변성은 결국 수행되지 않는다. 일부 이러한 실시형태에서, 프로브는 듀플렉스 구조에 어닐링될 수 있어야 한다. 예를 들어, 일부 실시형태에서, 프로브는, 듀플렉스의 과도한 브레딩(breathing)을 유도함으로써, 변형된 아연-핑거 단백질을 통해서 듀플렉스 내의 서열을 인식함으로써 또는 Cas9 또는 가이드 RNA가 결합하는 것을 허용하는 듀플렉스를 용융시키는 유사한 단백질을 사용함으로써 (예를 들어, PNA 프로브를 사용하는) 가닥 침범을 통해서 듀플렉스의 개별 가닥에 결합한다. 일부 실시형태에서, 가이드 RNA는 인터로게이션(interrogation) 프로브 서열을 포함하고, 레퍼토리의 각각의 서열을 포함하는 gRNA가 제공된다.
일부 실시형태에서, 이중 가닥 표적은 닉(예를 들어, 자연적 닉 또는 DNase1 처리에 의해서 생성된 것)을 함유한다. 이러한 실시형태에서, 반응 조건 하에서, 하나의 가닥은 일시적으로 나머지 것으로부터 떨어지거나 박리(예를 들어, 일시적으로 변성)되거나, 또는 자연 염기쌍 브레딩이 일어난다. 이것은 프로브가 일시적으로 결합하는 것을 허용하고, 그 후 그것은 네이티브 가닥에 의해서 대체된다.
일부 실시형태에서, 단일 이중 가닥 표적 폴리뉴클레오타이드는 변성되어, 듀플렉스의 가닥 각각은 올리고에 의한 결합에 사용 가능하다. 일부 실시형태에서, 단일 폴리뉴클레오타이드는 변성 과정에 의해서 또는 서열결정 방법에서의 또 다른 단계에서 손상되고, (예를 들어, 적합한 DNA 중합효소의 부가에 의해서) 수선된다.
일부 바람직한 실시형태에서, (표면 상의 일시적인 결합을 위한 제조 시에) 이중 가닥 게놈 DNA의 부동화 및 선형화는 분자 코밍, DNA의 표면에 대한 UV 가교, 선택적인 습윤, 화학 변성제(예를 들어, 알칼리 용액, DMSO 등)에 대한 노출을 통한 이중 가닥 DNA의 변성, 세척 후 산성 용액에 대한 선택적인 노출 및 선택적인 사전 컨디셔닝 완충제에 대한 노출을 포함한다.
프로브의 어닐링.
블록 208. 선택적인 변성 단계 후, 방법은 고정된 제1 가닥 및 고정된 제2 가닥을 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출시키는 단계로서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖는, 상기 단계에 의해서 계속된다. 노출시키는 단계는 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥의 일부 또는 고정된 제2 가닥의 각각의 일부(또는 일부들)에 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어난다.
도 5A, 도 5B 및 도 5C는 하나의 중합체(502)에 대한 상이한 프로브의 일시적인 결합의 예를 도시한다. 각각의 프로브(예를 들어, 504, 506 및 508)는 특이적인 인터로게이션 서열(예를 들어, 뉴클레오타이드 또는 펩타이드 서열)을 포함한다. 프로브(504)를 폴리뉴클레오타이드(502)에 적용한 후, 프로브(504)를 1회 이상의 세척 단계로 세척하여 중합체(502)로부터 세척한다. 그 다음 유사한 단계를 사용하여 프로브(506 및 508)를 제거한다.
프로브 설계 및 표적
일부 실시형태에서, 프로브는 용액 중의 표적 폴리뉴클레오타이드에 제공된다. 용액이 표면 또는 매트릭스 상의 폴리뉴클레오타이드를 잠기게 하기에 충분한 부피를 갖는 경우, 프로브는 확산 및 분자 충돌을 통해서 폴리뉴클레오타이드와 접촉할 수 있다. 일부 실시형태에서, 용액을 교반하여 프로브를 하나 이상의 폴리뉴클레오타이드와 접촉시킨다. 일부 실시형태에서, 프로브 함유 용액을 교환하여 새로운 프로브를 표면에 제공한다. 일부 실시형태에서, 전기장을 사용하여 프로브를 표면으로 끌어당기고, 예를 들어, 정 바이어싱 표면은 음으로 하전된 올리고를 끌어당긴다.
일부 실시형태에서, 표적은 폴리뉴클레오타이드 서열을 포함하고, 프로브의 결합 부분은 예를 들어, 3량체, 4량체, 5량체 또는 6량체 올리고뉴클레오타이드 서열 인터로게이션 부분, 선택적으로 하나 이상의 축퇴 또는 범용 위치, 및 선택적으로 뉴클레오타이드 스페이서(예를 들어, 하나 이상의 T 뉴클레오타이드) 또는 염기성 또는 비-뉴클레오타이드 부분을 포함한다. 도 6A 및 도 6B에 도시된 바와 같이, 사용되는 올리고 프로브(예를 들어, 604 및 610)의 크기에 관계없이 유사한 결합이 폴리뉴클레오타이드(602)를 따라서 일어난다. 상이한 k량체 길이 올리고에 고유한 주요 차이점은 각각의 프로브에 의해서 결합될 결합 부위의 길이를 설정한다는 것이다(예를 들어, 3량체 프로브(604)는 3-뉴클레오타이드 길이 부위, 예컨대, (606)에 주로 결합할 것이고 및 5량체 프로브(610)는 5-뉴클레오타이드 길이 부위, 예컨대, (610)에 주로 결합할 것이다).
도 6A에서, 3량체 올리고 프로브는 상당히 짧다. 일반적으로 그러한 짧은 서열은 프로브로 사용되지 않는데, 그 이유는 그것이 매우 낮은 온도 및 긴 인큐베이션 시간이 사용되지 않는 한 안정적으로 결합할 수 없기 때문이다. 그러나, 그러한 프로브는, 본 명세서에 기재된 검출 방법에 의해서 필요한 경우 표적 폴리뉴클레오타이드에 대한 일시적인 결합을 형성한다. 추가로, 올리고뉴클레오타이드 프로브 서열이 짧을수록, 더 적은 올리고뉴클레오타이드가 레퍼토리에 존재한다. 예를 들어, 3량체 올리고의 완전한 레퍼토리를 위해서는 단지 64개의 올리고뉴클레오타이드 서열이 필요하지만, 완전한 4량체 레퍼토리를 위해서는 256 올리고뉴클레오타이드 서열이 필요하다. 추가로, 용융 온도를 증가시키기 위해서 초단(ultra-short) 프로브가 일부 실시형태에서 변형되고, 일부 실시형태에서, 축퇴(예를 들어, N) 뉴클레오타이드를 포함한다. 예를 들어, 4개의 N 뉴클레오타이드는 3량체 올리고의 안정성을 7량체의 안정성까지 증가시킬 것이다.
도 6B에서, 개략도는 5량체의 이의 완벽한 매치 위치(612-3), 1 염기 미스매치 위치(612-2) 및 2 염기 미스매치 위치(612-1)에 대한 결합을 도시한다.
임의의 하나의 프로브의 결합은 폴리뉴클레오타이드를 서열결정하기에 충분하지 않다. 일부 실시형태에서, 폴리뉴클레오타이드의 서열을 재구성하기 위해서 프로브의 완전한 레퍼토리가 필요하다. 올리고 결합 부위의 장소, 중첩 결합 부위에 대한 프로브의 일시적인 분리된 결합, 올리고와 표적 뉴클레오타이드 간의 미스매치의 부분적인 결합, 결합 빈도 및 결합의 지속기간에 대한 정보 모두 서열을 추론하는 데 기여한다. 연장된 또는 신장된 폴리뉴클레오타이드의 경우, 폴리뉴클레오타이드의 길이를 따르는 프로브 결합의 장소는 강력한 서열을 제조하는 데 기여한다. 이중 가닥 폴리뉴클레오타이드의 경우, 듀플렉스의 두 가닥(예를 들어, 두 개의 상보성 가닥)의 서열결정으로부터 더 높은 신뢰도의 서열이 나타낸다.
일부 실시형태에서 공통 참조 프로브 서열이 레퍼토리 내의 올리고뉴클레오타이드 프로브 각각과 함께 첨가된다. 예를 들어, 도 7A, 도 7B 및 도 7C에서, 공통 참조 프로브(704)는, 프로브 세트(예를 들어, 706, 712 및 716)에 포함된 추가 프로브에 관계없이, 표적 폴리뉴클레오타이드(702) 상의 동일한 결합 부위(708)에 결합한다. 참조 프로브(704)의 존재는 이의 각각의 결합 부위(예를 들어, 710, 714, 718, 720 및 722)에 대한 다른 프로브의 결합을 저해하지 않는다.
도 7C에 도시된 바와 같이, 결합 부위(718, 720 및 722)는 그러한 부위가 중첩된 경우에도 개별 프로브(716-1, 716-2 및 716-3)가 가능한 부위 모두에 결합하는 방법을 도시한다. 도 7A, 도 7B 및 도 7C에서, 프로브 서열이 3량체로 도시된다. 그러나, 4량체, 5량체, 6량체 등인 프로브를 사용하여 유사한 방법이 동등하게 양호하게 수행될 수 있다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트는 올리고의 완전한 레퍼토리(예를 들어, 주어진 길이의 모든 올리고)이다. 예를 들어, 1024개의 개별 5량체의 전체 세트가 암호화되고, 본 개시내용의 하나의 실시형태에 따라서 특정 레퍼토리에 포함된다. 일부 실시형태에서, 다양한 길이의 레퍼토리가 제공된다. 일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트는 올리고 프로브의 타일링 시리즈이다. 일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트는 올리고 프로브의 패널이다. 합성 생물학에서의 특정 적용(예를 들어, DNA 데이터 저장)의 경우, 서열결정은 서열의 특정 블록의 순서를 찾는 것을 포함하는데, 여기서 블록은 목적하는 데이터를 암호화하도록 설계된다.
도 8A, 도 8B 및 도 8C에 도시된 바와 같이, 일부 실시형태에서 다수의 프로브 세트(예를 들어, 804, 806 및 808)가 임의의 표적 중합체(802)에 적용된다. 각각의 프로브 유형은 이의 상보성 결합 부위에 우선적으로 결합할 것이다. 다수의 실시형태에서, 각각의 사이클 사이에서 완충제를 사용한 세척이 이전 세트 내의 프로브의 제거를 돕는다.
일부 실시형태에서, 핵산 서열결정을 위한 프로브는 올리고뉴클레오타이드이고, 에피-변형을 위한 프로브는 변형-결합 단백질 또는 펩타이드(예를 들어, 메틸 결합 단백질, 예컨대, MBD1) 또는 항-변형 항체(예를 들어, 항-메틸 C 항체)이다. 일부 실시형태에서, 올리고 프로브는 게놈 내의 특이적 부위(예를 들어, 공지된 돌연변이를 갖는 부위)를 표적으로 한다. 도 9A, 도 9B 및 도 9C에 도시된 바와 같이, 일부 실시형태에서 올리고뉴클레오타이드(예를 들어, 804, 806 및 808) 및 대안적인 프로브(예를 들어, 902) 둘 다는 폴리뉴클레오타이드 또는 중합체(802)에 동시(그리고 다수의 사이클을 통해서)에 적용된다. 관심대상 표적 부위를 결정하는 방법은 본 명세서에 참조에 의해 포함된 문헌[Liu et al., BMC Genomics 9: 509 (2008)]에 제공된다.
일부 실시형태에서, 레퍼토리의 프로브 또는 레퍼토리의 프로브의 하위 세트 각각은 하나씩 적용된다(예를 들어, 하나 또는 하위세트의 결합이 먼저 검출되고, 그 다음 그것이 제거된 후, 다음 것이 첨가되고, 검출되고, 제거되고, 이어서 그 다음 등). 일부 실시형태에서, 레퍼토리 내의 결합 프로브의 모두 또는 하위세트는 동시에 첨가되고, 각각의 결합 프로브는 이의 아이덴티티를 완전히 또는 부분적으로 암호화하는 표지에 테더링되고, 결합 프로브 각각에 대한 암호는 검출에 의해서 해독된다.
도 11A 및 도 11B에 도시된 바와 같이, 일부 실시형태에서 프로브의 타일링 시리즈를 사용하여 다수의 프로브의 결합 부위에 대한 정보를 얻는다. 도 11A에서, 제1 타일링 세트(1104)가 표적 폴리뉴클레오타이드(1102)에 적용된다. 제1 타일링 세트(1108)에서 프로브의 하위세트 내의 각각의 프로브는 하나의 염기(1108)를 함유함으로써, 표적 폴리뉴클레오타이드(1102) 내의 하나의 뉴클레오타이드의 5× 커버리지를 야기한다. 커버리지는 타일링 시리즈 내의 프로브의 k량체 길이에 비례할 것이다(예를 들어, 3량체 올리고의 세트는 표적 폴리뉴클레오타이드 내의 모든 염기의 3× 커버리지를 야기할 것이다).
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트가 표적 뉴클레오타이드를 따라서 타일링되는 경우, 타일링 경로에 브레이크가 존재할 때 경우 일어나는 문제점에 대한 가능성이 있다. 예를 들어, 5량체의 올리고뉴클레오타이드 세트의 경우, 5개 염기보다 더 긴 표적 분자 내의 서열의 하나 이상의 스트레치에 결합할 수 있는 올리고가 존재하지 않는다. 이러한 경우에, 일부 실시형태에서 하나 이상의 접근법이 취해진다. 첫 번째로, 표적 폴리뉴클레오타이드가 이중 가닥 핵산을 포함하면, 하나 이상의 염기 배정은 듀플렉스의 상보성 가닥으로부터 획득된 서열(들)을 따른다. 두 번째로, 표적 분자의 다중 카피가 입수 가능한 경우, 하나 이상의 염기 배정은 표적 분자의 다른 카피 상의 동일한 서열의 다른 카피에 좌우된다. 세 번째로, 일부 실시형태에서, 참조 서열이 사용 가능하면, 하나 이상의 염기 배정은 참조 서열을 따르고, 염기는 그들이 참조 서열로부터 인공적으로 이식됨을 나타내도록 주석이 달린다.
일부 실시형태에서, 특정 프로브는 다양한 이유로 인해서 레퍼토리로부터 누락된다. 예를 들어, 일부 프로브 서열은 그 자체와의 문제가 있는 상호작용(예컨대, 자가 상보성 또는 회문 서열), 레퍼토리 내의 다른 프로브와의 문제가 있는 상호작용 또는 폴리뉴클레오타이드와의 문제가 있는 상호작용(예를 들어, 공지된 확률적으로 난잡한 결합)을 나타낸다. 일부 실시형태에서, 정보성 프로브의 최소 수는 폴리뉴클레오타이드의 각각의 유형에 대해서 결정된다. 올리고의 완전한 레퍼토리 내에서, 올리고의 절반은 올리고의 나머지 절반에 완전히 상보성이다. 일부 실시형태에서, 이들 상보성 쌍(및 실질적인 상보성으로 인해서 문제가 있는 다른 것)은 동시에 폴리뉴클레오타이드에 첨가되지 않고, 오히려 프로브의 상이한 하위세트에 배정되는 것이 보장된다. 일부 실시형태에서, 센스 및 안티센스 단일-가닥 DNA 둘 다가 존재하는 경우, 서열결정은 각각의 올리고 상보성 쌍의 단지 하나의 구성원으로 수행된다. 센스 가닥 및 안티센스 가닥 둘 다로부터 획득된 서열결정 정보는 전체 서열을 생성시키기 위해서 조합된다. 그러나, 이 방법은 이중 가닥 폴리뉴클레오타이드의 두 가닥 다를 동시에 서열결정함으로써 부여되는 이점이 상실되기 때문에 바람직하지 않다.
일부 실시형태에서, 올리고는 맞춤형 마이크로어레이 합성을 사용하여 제조된 라이브러리를 포함한다. 일부 실시형태에서, 마이크로어레이 라이브러리는 게놈의 특이적 표적 부분에 체계적으로 결합하는 올리고를 포함한다. 일부 실시형태에서, 마이크로어레이 라이브러리는 폴리뉴클레오타이드를 가로질러 특정 거리만큼 떨어진 장소에 체계적으로 결합하는 올리고를 포함한다. 예를 들어, 1백만 개의 올리고를 포함하는 라이브러리는 대략 3000개 염기마다 결합하도록 설계된 올리고를 포함할 수 있다. 유사하게, 1천만 개의 올리고를 포함하는 라이브러리는 대략 300개 염기마다 결합하도록 설계될 수 있고, 3천만 개의 올리고를 포함하는 라이브러리는 100개 염기마다 결합하도록 설계될 수 있다. 일부 실시형태에서, 올리고의 서열은 참조 게놈 서열에 기초하여 계산적으로 설계된다.
일부 실시형태에서, 표적화된 게놈의 부분은 특이적 유전적 유전자좌이다. 다른 실시형태에서, 표적화된 게놈의 부분은 유전자좌(예를 들어, 암에 연결된 유전자)의 패널 또는 게놈-전체 연관 연구(genome-wide association study)에 의해 식별된 염색체 간격 내의 유전자이다. 일부 실시형태에서, 표적화된 유전자좌는 또한 게놈의 다크(dark) 물질, 전형적으로 반복적인 게놈의 이색성 영역뿐만 아니라 반복 영역 부근에 있는 복잡한 유전적 유전자좌이다. 이러한 영역은 텔로미어, 중심체, 아크로센트릭(acrocentric) 염색체의 짧은 아암 및 게놈의 다른 저 복잡성 영역을 포함하였다. 전통적인 서열결정 방법은 게놈의 반복적인 부분을 다룰 수 없지만, 나노단위 정밀도가 높은 경우, 방법은 이러한 영역을 포괄적으로 다룬다.
일부 실시형태에서, 복수의 올리고뉴클레오타이드 프로브 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 고유한 N량체 서열을 포함하고, 여기서 N은 세트 {1, 2, 3, 4, 5, 6, 7, 8 및 9}의 정수이고, 길이 N의 모든 고유한 N량체 서열은 상기 복수의 올리고뉴클레오타이드 프로브로 표현된다.
프로브를 제조하는 데 사용된 올리고 길이가 길수록, 효율적인 프로브로서 기능하기 위해 올리고에 영향을 미치는 회문 또는 폴드백 서열에 대한 가능성이 더 커진다. 일부 실시형태에서, 하나 이상의 축퇴 염기를 제거함으로써 이러한 올리고의 길이를 감소시킴으로써 결합 효율이 실질적으로 개선된다. 이러한 이유로, 더 짧은 인터로게이션 서열(예를 들어, 4량체)을 사용하는 것이 유리하다. 그러나, 더 짧은 프로브 서열은 또한 덜 안정적인 결합(예를 들어, 더 낮은 결합 온도)을 나타낸다. 일부 실시형태에서, 올리고의 결합 안정성은 특정 안정화 염기 변형 또는 올리고 접합체(예를 들어, 스틸벤 캡)를 사용하여 향상된다. 일부 실시형태에서, 완전히 변형된 3량체 또는 4량체(예를 들어, 잠금 핵산(locked nucleic acid: LNA))이 사용된다.
일부 실시형태에서, 고유한 N량체 서열은 하나 이상의 축퇴 뉴클레오타이드 위치에 의해서 점유된 하나 이상의 뉴클레오타이드를 포함한다. 일부 실시형태에서, 축퇴 위치는 4개의 뉴클레오타이드 중 하나를 포함하고, 4개의 뉴클레오타이드 각각의 버전이 반응 혼합물에 제공된다. 일부 실시형태에서, 하나 이상의 뉴클레오타이드 위치 내의 각각의 축퇴 뉴클레오타이드 위치는 범용 염기에 의해서 점유된다. 일부 실시형태에서, 범용 염기는 2'-데옥시이노신이다. 일부 실시형태에서, 고유한 N량체 서열은 단일 축퇴 뉴클레오타이드 위치에 의해서 5' 단부에 측접되고, 단일 축퇴 뉴클레오타이드 위치에 의해서 3' 측접된다. 일부 실시형태에서, 5' 단일 축퇴 뉴클레오타이드 및 3' 단일 축퇴 뉴클레오타이드는 각각 2'-데옥시이노신이다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이 M을 갖는다. 일부 실시형태에서, M은 2 이상의 양의 정수이다. 시험 기질 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계 (f)는 복수의 위치 세트에 의해서 표현된 올리고뉴클레오타이드 프로브의 중첩 서열을 추가로 사용한다. 일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 올리고뉴클레오타이드 프로브의 세트 내의 또 다른 올리고뉴클레오타이드 프로브와 M-1 서열 상동성을 공유한다.
프로브 표지.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 표지와 결합되어 있다. 도 14A 내지 도 14E는 프로브를 표지하는 상이한 방법을 도시한다. 일부 실시형태에서, 표지는 염료, 형광 나노입자 또는 광 산란 입자이다. 일부 실시형태에서 프로브(1402)는 표지(1406)에 직접 결합된다. 일부 실시형태에서, 프로브(1402)는 올리고(1408-A) 상의 서열에 성보성인 서열(1408-B)을 포함하는 플랩 서열(1410)을 통해서 간접적으로 표지된다.
바람직한 특징을 갖는 다양한 유형의 유기 염료가 표지를 위해서 사용 가능한데, 일부는 높은 광 안정성 및/또는 높은 광자 효율성 및/또는 최소한의 암흑 상태 및/또는 높은 용해도 및/또는 낮은 비-특이적 결합을 갖는다. Atto 542는 다수의 선호되는 특성을 갖는 선호되는 염료이다. Cy3B는 매우 밝은 염료이며, Cy3도 효과적이다. 일부 염료는 적색 염료 Atto 655 및 Atto 647N과 같이 세포 또는 세포 물질로부터의 자동 형광이 널리 퍼져있는 파장의 회피를 허용한다. 표지를 위해서 다수의 유형의 나노입자가 사용될 수 있다. 형광 표지된 라텍스 입자 이외에, 본 발명은 금 또는 은 입자, 반도체 나노결정 및 나노다이아몬드를 나노 입자 표지로서 사용한다. 일부 실시형태에서, 나노다이아몬드가 표지로서 특히 선호된다. 나노다이아몬드는 높은 양자 효율(QE)로 광을 방출하고, 높은 광 안정성, 긴 형광 수명(예를 들어, 20ns 정도)을 가지며, 이는 광 산란 및/또는 자동 형광에서 관찰된 배경을 감소시키는 데 사용될 수 있고, 작다(예를 들어, 직경이 대략 40㎚). DNA 나노구조 및 나노볼은 유기 염료를 구조에 혼입시키거나 인터칼레이팅 염료와 같은 표지를 제거함으로써 매우 밝은 표지가 될 수 있다.
일부 실시형태에서, 각각의 간접 표지는 프로브의 서열 인터로게이션 부분 내의 암호화될 염기의 아이덴티티를 명시한다. 일부 실시형태에서, 표지는 핵산 인터칼레이팅 염료의 하나 이상의 분자를 포함한다. 일부 실시형태에서, 표지는 염료 분자, 형광 나노입자 또는 광산란 입자 중 하나 이상의 유형을 포함한다. 일부 실시형태에서, 더 긴 영상화 시간을 허용하기 위해서, 표지가 신속하게 광표백되지 않는 것이 바람직하다.
도 12A, 도 12B 및 도 12C는 표적 폴리뉴클레오타이드(1206)에 부착된 형광 표지(1202)를 갖는 올리고뉴클레오타이드(1204)의 일시적인 온-오프 결합을 도시한다. 표지(1202)는 프로브(1204)가 표적 폴리뉴클레오타이드(1206) 상의 결합 부위에 결합하는지 여부에 관계없이 형광을 낼 것이다. 유사하게, 도 13A, 도 13B 및 도 13C는 비표지된 올리고뉴클레오타이드 프로브(1306)의 일시적인 온-오프 결합을 도시한다. 결합 사건은 용액(1302)으로부터 염료(예를 들어, YOYO-1)를 일시적으로 형성된 듀플렉스(1304) 내로 인터칼레이션시킴으로써 검출된다. 인터칼레이팅 염료는 용액 중에서 자유롭게 부유하는 것과 비교할 때 이중 가닥 핵산에 결합될 때 형광의 현저한 증가를 나타낸다.
일부 실시형태에서, 표적에 결합하는 프로브는 직접 표지되지 않는다. 일부 이러한 실시형태에서, 프로브는 플랩을 함유한다. 일부 실시형태에서, 올리고뉴클레오타이드를 구축하는 것(예를 들어, 이를 암호화하는 것)은 올리고뉴클레오타이드 세트 내에서 각각의 k량체의 하나의 단부(예를 들어, 플랩 서열)에 특이적인 서열 단위를 커플링시키는 것을 포함한다. 플랩의 암호화 서열의 각각의 유닛은 구별되는 형광 표지된 프로브를 위한 도킹 부위로서 작용한다. 5개 염기 프로브 서열을 암호화하기 위해서, 프로브상의 플랩은 5개의 구별되는 결합 장소를 함유하고, 예를 들어, 각각의 장소는 다음 장소에 직렬로 연결된 상이한 DNA 염기 서열이다. 예를 들어, 플랩 상의 제1 위치는 프로브 서열(폴리뉴클레오타이드 표적에 결합할 부분)에 인접하고, 제2 위치는 제1 위치에 인접하고, 기타 등등이다. 서열결정에서 프로브-플랩을 사용하기 전에, 각각의 다양한 프로브-플랩은 프로브 서열에 대한 고유한 식별자 태그를 생성시키기 위해서 형광 표지된 올리고 세트에 커플링된다. 일부 실시형태에서, 이는 플랩 상의 각각의 위치에 상보적인 4개의 구별되게 표지된 올리고 서열(예를 들어, 총 16개의 구별되는 표지)을 사용함으로써 수행된다.
일부 실시형태에서, A, C, T 및 G가 정의된 프로브는 표지가 올리고뉴클레오타이드 내의 특정 위치에서 단지 하나의 정의된 뉴클레오타이드에 대해서 보고하는 방식으로 암호화된다(그리고 위치 중 나머지는 축퇴된다). 이것은 뉴클레오타이당 하나의 색상으로 4가지 색상 암호만 필요하다.
일부 실시형태에서, 하나의 형광단 색상만 공정 전체에서 사용된다. 이러한 실시형태에서, 각각의 사이클은 4개의 서브 사이클로 분할되는데, 이들 각각에서 명시된 위치(예를 들어, 위치 1)에서 4개의 염기 중 하나가 다음 하나의 사이클이 추가되기 전에 개별적으로 추가된다. 각각의 사이클에서 프로브는 동일한 레이블을 보유한다. 이 실시형태서, 전체 레퍼토리는 20개 사이클로 소진되어, 시간이 상당히 절약된다.
일부 실시형태에서, 서열 내의 제1 염기는 플랩 내의 제1 유닛에 의해, 제2염기는 제2 유닛 등에 의해 암호화된다. 플랩 내의 유닛의 순서는 올리고 내의 염기 서열의 순서에 상응한다. 이어서, 구별되는 형광 표지를 유닛 각각 상에 도킹시킨다(상보성 염기 짝지움을 통해서). 일례에서, 제1 위치는 파장 500㎚ 내지 530㎚에서, 제2 위치는 550㎚ 내지 580㎚에서, 제2 위치는 600㎚ 내지 630㎚에서, 제4 위치는 650㎚ 내지 680㎚에서 그리고 제5 위치는 700㎚ 내지 730㎚에서 방출한다. 각 위치에서 염기의 아이덴티티는 예를 들어, 표지의 형광 수명에 의해 암호화된다. 그러한 일례에서, A에 상응하는 표지는 C보다 긴 수명을 갖고, 이것은 G보다 더 긴 수명을 갖고, 이것은 T보다 더 긴 수명을 갖는다. 상기 예에서, 1번 위치에서의 염기 A는 가장 긴 수명으로 500㎚ 내지 530㎚에서 방출하고, 3번 위치에서의 염기 G는 세 번째로 긴 수명으로 600㎚ 내지 630㎚를 방출할 것이고 그 등등이다.
도 14e에 도시된 바와 같이, 프로브(1402)는 서열 1408-B에 상응하는 서열 1408-A를 포함할 것이다. 서열 1408-B는 플랩 영역(1410)에 부착된다. 도 14E에서 전체 작제물을 초래할 수 있는 가능한 서열의 예로서, (1410) 내의 4개의 위치 각각은 각각 서열 AAAA(예를 들어, (1412)에 상보적인 위치), CCCC(예를 들어, (1414)에 상보적인 위치), GGGG(예를 들어, (1416)에 상보적인 위치) 및 TTTT(예를 들어, (1418)에 상보적인 위치)에 의해서 정의된다. 따라서, 전체 플랩 서열은 5'-AAAACCCCGGGGTTTT-3'일 것이다. 이어서, 각각의 위치는 특정 방출 파장에 의해 암호화되고, 그 위치에 존재할 수 있는 4개의 다른 염기가 4개의 상이한 형광 수명-표지된 올리고에 의해 암호화되고, 여기서 수명/밝기 비율은 프로브(1402) 자체에서의 특정 위치 및 염기 암호에 상응한다.
적합한 암호의 예는 하기이다:
Figure pct00010
위치 1-A 염기 암호-TTTT-방출 피크 510, 수명/밝기 #1
Figure pct00011
위치 1-C 염기 암호-TTTT-방출 피크 510, 수명/밝기 #2
Figure pct00012
위치 1-G 염기 암호-TTTT-방출 피크 510, 수명/밝기 #3
Figure pct00013
위치 1-T 염기 암호-TTTT-방출 피크 510, 수명/밝기 #4
Figure pct00014
위치 2-A 염기 암호-GGGG-방출 피크 560, 수명/밝기 #1
Figure pct00015
위치 2-C 염기 암호-GGGG-방출 피크 560, 수명/밝기 #2
Figure pct00016
위치 2-G 염기 암호-GGGG-방출 피크 560, 수명/밝기 #3
Figure pct00017
위치 2-T 염기 암호-GGGG-방출 피크 560, 수명/밝기 #4
Figure pct00018
위치 3-A 염기 암호-CCCC-방출 피크 610, 수명/밝기 #1
Figure pct00019
위치 3-C 염기 암호-CCCC-방출 피크 610, 수명/밝기 #2
Figure pct00020
위치 3-G 염기 암호-CCCC-방출 피크 610, 수명/밝기 #3
Figure pct00021
위치 3-T 염기 암호-CCCC-방출 피크 610, 수명/밝기 #4
Figure pct00022
위치 4-A 염기 암호-AAAA-방출 피크 660, 수명/밝기 #1
Figure pct00023
위치 4-C 염기 암호-GGGG-방출 피크 660, 수명/밝기 #2
Figure pct00024
위치 4-G 염기 암호-GGGG-방출 피크 660, 수명/밝기 #3
Figure pct00025
위치 4-T 염기 암호-GGGG-방출 피크 660, 수명/밝기 #4
대안적으로, 4개의 위치는 형광 수명에 의해서 암호화되고, 염기는 형광 방출 파장에 의해서 암호화된다. 일부 실시형태에서, 다른 측정 가능한 물리적 속성이 대안적으로 암호를 위해 사용되거나 상용성인 경우 파장 및 수명과 조합될 수 있다. 예를 들어, 플랩에 포함되는 것이 가능한 암호의 레퍼토리를 증가시키기 위해서 방출의 편광 또는 밝기를 측정할 수도 있다.
일부 실시형태에서, 토-홀드(toe-hold) 프로브(예를 들어, 문헌[Levesque et al., Nature Methods 10:865-867, 2013]에 기재된 바와 같음)가 사용된다. 이들 프로브는 부분적으로 이중 가닥이고, 미스매칭 표적에 결합될 때 경쟁적으로 불안정하다(예를 들어, 문헌[Chen et al., Nature Chemistry 5, 782-789, 2013]에 상술된 바와 같음. 일부 실시형태에서, 토-홀드 프로브는 단독으로 사용된다. 일부 실시형태에서, 토-홀드 프로브는 정확한 혼성화를 보장하기 위해서 사용된다. 일부 실시형태에서, 토-홀드 프로브는 표적 폴리뉴클레오타이드에 결합된 다른 프로브의 오프 반응을 용이하게 하기 위해서 사용된다.
공통 여기 라인에 의해 여기된 표지의 예는 양자점이다. 이러한 예에 따른 일부 이러한 실시형태에서, Qdot 525, Qdot 565, Qdot 605 및 Qdot 655가 4 개의 각각의 뉴클레오타이드인 것으로 선택된다. 대안적으로, 4개의 구별되는 레이저 선을 사용하여 4개의 구별되는 유기 형광단을 여기시키고, 영상 스플리터에 의해서 방출을 분할하여 검출한다. 일부 다른 실시형태에서, 방출 파장은 둘 이상의 유기 염료에 대해 동일하지만 형광 수명은 상이하다. 당업자는 과도한 노력 및 실험 없이 다수의 상이한 암호화 및 검출 방식을 예상할 수 있을 것이다.
일부 실시형태에서, 레퍼토리 내의 상이한 올리고는 개별적으로 첨가되지 않고, 오히려 함께 암호화 및 풀링된다. 한 번에 하나의 색상 및 하나의 올리고로부터의 가장 간단한 단계 설정은 한 번에 두 개의 색상 및 두 개의 올리고이다. 5개의 올리고 각각당 하나의 염료인 5개의 구별 가능한 단일 염료 향료의 직접 검출을 사용하여 한 번에 최대 대략 5개의 올리고를 풀링시킬 것이라고 기대하는 것이 합리적이다.
보다 복잡한 경우에, 향료 또는 암호의 수가 증가한다. 예를 들어, 3량체의 완전한 레퍼토리에서 각각의 염기를 개별적으로 암호화하기 위해서, 64개의 구별되는 암호가 요구된다. 또한, 예를 들어, 5량체의 완전한 레퍼토리에서 각각의 염기를 개별적으로 암호화하기 위해서, 1024개의 구별되는 암호가 요구된다. 이러한 많은 수의 암호는 다수의 염료 향료로 구성된 올리고당 암호를 가짐으로써 달성된다. 일부 실시형태에서, 레퍼토리(하위 레퍼토리)의 하위세트를 암호화하는 데 더 작은 암호 세트가 사용되고, 예를 들어, 일부 예에서, 64개의 암호가 5량체의 완전한 1024 서열 레퍼토리의 16개 하위세트를 암호화하는 데 사용된다.
일부 실시형태에서, 올리고 암호의 큰 레퍼토리가 다수의 방식으로 획득된다. 예를 들어, 일부 실시형태에서, 비드에는 암호-특이적 염료가 로딩되거나 DNA 나노 구조-기반 암호는 상이한 형광 파장 방출 염료의 최적 간격을 포함한다(예를 들어, 문헌[Lin et al., Nature Chemistry 4: 832-839, 2012] 참고). 예를 들어, 도 14C 및 도 14D는 형광 표지(1414)의 운반에서 비드 (1412)의 사용을 도시한다. 도 14C에서, 표지(1414)는 비드(1412) 상에 코팅된다. 도 14D에서, 표지(1414)은 비드(1412) 내에 캡슐화된다. 일부 실시형태에서, 각각의 표지(1414)는 상이한 유형의 형광 분자이다. 일부 실시형태에서, 모든 표지(1414)는 동일한 유형의 형광 분자(예를 들어, Cy3)이다.
일부 실시형태에서, 올리고 내의 염기의 위치 및 그의 아이덴티티를 설명하기 위해 모듈식 암호가 사용되는 암호 방식이 사용된다. 일부 실시형태에서, 이는 암호 아암을 프로브를 식별하는 표지의 조합물을 포함하는 프로브에 추가함으로써 구현된다. 예를 들어, 모든 가능한 5량체 올리고뉴클레오타이드 프로브의 라이브러리가 암호화되는 경우, 아암은 5량체 내의 5개의 핵염기 각각에 상응하는 5개의 부위를 각각 가지며, 5개 부위 각각은 5개의 구별 가능한 종에 결합된다. 이러한 일례에서, 특정 피크 방출 파장을 갖는 형광단은 각각의 위치에 상응하고(예를 들어, 1번 위치의 경우 500㎚, 2번 위치의 경우 550㎚, 3번 위치의 경우 600㎚, 4번 위치의 경우 650㎚ 및 5번 위치의 경우 700㎚), 4개의 형광단은 각각의 위치에서 4개의 염기 각각에 대해 동일한 파장이지만 상이한 형광 수명 암호를 갖는다.
일부 실시형태에서, 올리고 또는 다른 결합 시약 상의 상이한 표지가 방출 파장에 의해서 암호화된다. 일부 실시형태에서, 상이한 표지는 형광 수명에 의해서 암호화된다. 일부 실시형태에서, 상이한 표지는 형광 분극에 의해서 암호화된다. 일부 실시형태에서, 상이한 표지는 파장 및 형광 수명의 조합에 의해서 암호화된다.
일부 실시형태에서, 상이한 표지는 각자의 온-오프 혼성화 동역학에 의해서 암호화된다. 상이한 회합-해리 상수를 갖는 상이한 결합 프로브가 사용된다. 일부 실시형태에서, 프로브는 형광 강도에 의해서 암호화된다. 일부 실시형태에서, 프로브는 상이한 수의 비-자가-켄칭 형광단이 부착됨으로써 암호화된 형광 강도이다. 개별 형광단은 전형적으로 켄칭되지 않기 위해서 양호하게 분리될 필요가 있다. 일부 실시형태에서, 이것은 표지를 서로로부터 적합한 거리에 제자리에 유지시키기 위해서 단단한 링커 또는 DNA 나노구조를 사용하여 달성된다.
형광 강도에 의한 암호화를 위한 하나의 대안적인 실시형태는 유사한 방출 스펙트럼을 갖지만 양자 수율 또는 다른 측정 가능한 광학 특성이 상이한 염료 변이체를 사용하는 것이다. 예를 들어, 558/572의 여기/방출을 갖는 Cy3B는 550/570의 여기/방출 및 0.15의 양자 수율을 갖는 Cy3보다 실질적으로 더 밝지만(예를 들어, 양자 수율 0.67), 유사한 흡수/방출 스펙트럼을 갖는다. 이러한 일부 실시형태에서, 532㎚ 레이저를 사용하여 두 염료를 여기시킨다. 다른 적합한 염료는 상향 이동된 여기 및 방출 스펙트럼을 갖지만 532㎚ 레이저에 의해 여기될 Cy3.5(여기/방출 591/604㎚)를 포함한다. 그러나, 그 파장에서의 여기는 Cy3.5에 대해 차선책이며, 염료의 방출은 Cy3에 대한 대역통과 필터에서 덜 밝게 보일 것이다. 여기/방출 532/553을 갖는 Atto 532는 0.9의 양자 수율을 갖고, 532㎚ 레이저가 스위트 스폿에 부딪힐 때 밝아질 것이라고 예상될 것이다.
단일 여기 파장을 사용하는 다수의 암호를 획득하기 위한 접근법은 염료의 방출 수명을 측정하는 것이다. 이러한 실시형태에 따른 일례에서, Alexa Fluor 546, Cy3B, Alexa Fluor 555 및 Alexa Fluor 555를 포함하는 세트가 사용된다. 일부 예에서, 다른 염료 세트가 더 유용하다. 일부 실시형태에서, 암호의 레퍼토리는 FRET 쌍을 사용하고 또한 방출된 광의 편광을 측정함으로써 확장된다. 표지의 수를 증가시키는 또 다른 방법은 여러 색상으로 암호화하는 것이다.
도 15는 올리고뉴클레오타이드 프로브의 폴리뉴클레오타이드에 대한 일시적인 결합으로부터의 형광의 예를 도시한다. 시계열로부터 선택된 프레임(예를 들어, 프레임 번호 1, 20, 40, 60, 80, 100)은 특정 부위에서 신호의 존재(예를 들어, 어두운 점) 및 부재(예를 들어, 흰색 영역)를 나타내는데, 이것은 온-오프 결합을 나타낸다. 각각의 각자의 프레임은 폴리뉴클레오타이드를 따라서 다중 결합된 프로브의 형광을 나타낸다. 응집체 영상은 모든 이전의 프레임의 형광의 응집을 나타내며, 올리고뉴클레오타이드 프로브가 결합된 모든 부위를 나타낸다.
표적 폴리뉴클레오타이드에 대한 프로브의 일시적인 결합.
프로브의 결합은 동적 과정이며, 지속적으로 결합된 프로브는 다음 비결합 가능성을 일부 갖는다(예를 들어, 온도 및 염 농도를 비롯한 다양한 요인에 의해 결정됨). 따라서 항상 하나의 프로브를 또 다른 것으로 변위시킬 수 있는 기회가 있다. 예를 들어, 일 실시형태에서, 표면 상의 신장된 표적 DNA에 대한 어닐링과 용액 중의 보체와의 연속적인 경쟁을 야기하는 프로브 보체가 사용된다. 또 다른 실시형태에서, 프로브는 3개의 부분을 갖고, 제1 부분은 표적에 상보적이고, 제2 부분은 표적에 부분적으로 상보적이고, 용액 중의 올리고에 부분적으로 상보적이고, 제3 부분은 용액 중의 올리고에 상보적이다. 일부 실시형태에서, 화학 구조 단위의 정확한 공간 장소에 관한 정보를 수집하는 것이 거대 분자의 구조 및/또는 서열을 결정하는 데 도움이 된다. 일부 실시형태에서, 프로브 결합 부위의 장소는 (예를 들어, 단일 분자 국지화 결정 알고리즘을 사용함으로써) 나노단위 또는 나노단위 미만의 정밀도로 결정된다. 일부 실시형태에서, 물리적으로 더 가까운 복수의 관찰된 결합 부위는 리졸빙된 회절 제한 광학 영상화 방법에 의해서 리졸빙될 수 있는데, 그 이유는 결합 사건이 일시적으로 분리되기 때문이다. 핵산의 서열은 각각의 장소에 결합하는 프로브의 아이덴티티에 기초하여 결정된다.
노출시키는 단계는 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 개별 프로브에 상보성인 고정된 제1 가닥의 각각의 일부 또는 고정된 제2 가닥의 각각의 일부에 일시적으로 그리고 가역적으로 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어난다. 일부 실시형태에서 체류 시간(예를 들어, 특정 프로브에 의한 결합의 지속기간 및 지속성)은 결합 사건이 완벽한 매치, 미스매치 또는 비논리적인지를 결정하는 데 사용된다.
일부 실시형태에서, 노출시키는 단계는 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 개별 프로브에 상보성인 고정된 제1 가닥의 각각의 일부 또는 고정된 제2 가닥의 각각의 일부에 반복적으로 일시적으로 그리고 가역적으로 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 각자의 인스턴스를 반복적으로 발생시키는 것을 허용하는 조건 하에서 일어난다.
일부 실시형태에서, 서열결정은 연장된 폴리뉴클레오타이드를 순차적으로 제공된 프로브의 완전한 서열 레퍼토리 각각으로부터 일시적인 상호작용을 받는 것을 포함한다(하나의 프로브 서열을 보유하는 용액이 제거되고, 다음 프로브 용액을 보유하는 용액이 첨가됨). 일부 실시형태에서, 각각의 프로브의 결합은 프로브가 일시적으로 결합하는 것을 허용할 조건 하에서 수행된다. 예를 들어, 결합은 하나의 프로브의 경우 25℃에서 그리고 다음 것의 경우 30℃에서 수행될 것이다. 또한 프로브는 세트로 결합될 수 있는데, 예를 들어, 거의 동일한 방식으로 일시적으로 결합할 모든 프로브를 세트로 수집되어, 함께 사용될 수 있다. 이러한 일부 실시형태에서, 세트의 각각의 프로브 서열은 차별적으로 표지되거나 차별적으로 암호화된다.
일부 실시형태에서, 일시적인 결합은 소량의 2가 양이온을 갖지만 1가 양이온을 갖지 않는 완충제에서 수행된다. 일부 실시형태에서, 완충제는 5mM Tris-HCl, 10mM 염화마그네슘, mm EDTA, 0.05% Tween-20 및 pH 8을 포함한다. 일부 실시형태에서, 완충제는 1nM 미만, 5nM 미만, 10nM 미만 또는 15nM 미만의 염화 마그네슘을 포함한다.
일부 실시형태에서, 일시적인 결합을 촉진시키는 다수의 조건이 사용된다. 일부 실시형태에서, Tm에 따라서 하나의 프로브 종에 대해서 하나의 조건이 사용되고, Tm에 따라서 다른 프로브 종에 대해서 또 다른 조건이 사용되고, 프로브 종의 전체 레퍼토리, 예를 들어, 1024개의 가능한 5량체의 레퍼토리로부터의 각각의 5량체 종에 대해서도 상기와 같다. 일부 실시형태에서, 단지 512개의 비-상보적인 5량체가 제공된다(예를 들어, 두 표적 폴리뉴클레오타이드 가닥 모두가 샘플에 존재하기 때문). 일부 실시형태에서, 각각의 프로브 첨가는 5개의 특이적 염기 및 2개의 축퇴 염기(따라서 16개의 헵타머)를 포함하는 프로브의 혼합물을 포함하고, 이들 모두는 서열을 조사하는 능력의 관점에서 하나의 오량체로서 기능하는 동일한 표지로 표지된다. 축퇴 염기는 프로브 세트의 복잡성을 증가시키지 않으면서 안정성을 추가한다.
일부 실시형태에서, 동일하거나 유사한 Tm을 공유하는 복수의 프로브에 대해서 동일한 조건이 제공된다. 이러한 일부 실시형태에서, 레퍼토리 내의 각각의 프로브는 상이한 암호화 표지(또는 그것이 식별되는 것에 따른 표지)를 포함한다. 이러한 예에서, 온도는 동일하거나 유사한 Tm을 공유하는 다음 일련의 프로브에 대해 상승하기 전에 몇몇 프로브 교환을 통해 유지된다.
일부 실시형태에서, 프로브 결합 기간 동안, 하나 초과의 온도에서 프로브의 결합 거동이 결정되도록 온도가 변경된다. 일부 실시형태에서, 용융 곡선의 유사 방식이 수행되는데, 여기서 표적 중합체에 대한 결합 거동 또는 결합 패턴은 선택된 범위(예를 들어, 10℃ 내지 65℃ 또는 1℃ 내지 35℃)를 통해서 단계식 온도 세트와 상관관계가 있다.
일부 실시형태에서, Tm은, 예를 들어, 가장 가까운 이웃 파라미터에 의해서 계산된다. 다른 실시형태에서, Tm은 실험적으로 도출된다. 예를 들어, 최적의 용융 온도 범위는 용융 곡선(예를 들어, 온도 범위에 걸친 흡수에 의한 용융 정도 측정)을 수행함으로써 도출된다. 일부 실시형태에서, 프로브 세트의 조성은 실험적 시험에 의해 검증된 이론적으로 일치하는 Tm에 따라 설계된다. 일부 실시형태에서, 결합은 실질적으로 Tm 미만(예를 들어, 계산된 Tm 미만에서 33℃ 이하)의 온도에서 수행된다. 일부 실시형태에서, 각각의 올리고에 대해 실험적으로 정의된 최적 온도는 서열결정 시 각각의 올리고의 결합을 위해서 사용된다.
일부 실시형태에서, 상이한 Tm을 갖는 올리고뉴클레오타이드 프로브에 대한 온도를 변경시키는 것에 대한 대안으로 또는 이에 더하여, 프로브 및/또는 염의 농도가 변경되고/되거나 pH가 변경된다. 일부 실시형태에서, 프로브와 하나 이상의 표적 분자 간의 일시적인 결합을 능동적으로 촉진시키기 위해서 표면 상의 전기 바이어스가 양과 음 사이에서 반복적으로 전환된다.
일부 실시형태에서, 사용된 올리고의 농도는 올리고 서열의 AT 대 GC 함량에 따라 조정된다. 일부 실시형태에서, 더 높은 GC 함량을 갖는 올리고에 대해 더 높은 농도의 올리고가 제공된다. 일부 실시형태에서, 염기 조성물의 효과를 균등화시키는 완충제(예를 들어, CTAB, 베타 인 또는 테트라메틸 암모늄 클로라이드(Tetramethyl Ammonium Chloride: TMAC1)과 같은 샤토로프 시약(Chatoropic reagent)을 함유하는 완충제)는 2.5M 내지 4M의 농도로 사용된다.
일부 실시형태에서, 프로브는 서열결정 챔버의 설계(예를 들어, 모서리 내에서 또는 나노채널의 벽에 대해서 프로브를 트래핑하는 플로우 셀 내의 에디(eddy))의 확률적 효과 또는 양상으로 인해서 샘플(예를 들어, 유동 챔버, 슬라이드, 폴리뉴클레오타이드(들)의 길이 및/또는 폴리뉴클레오타이드의 정렬된 어레이)에 걸쳐 불균일하게 분포된다. 프로브의 국지적 고갈은 프로브 용액의 효율적인 혼합 또는 교반을 보장함으로써 해결된다. 일부 예에서, 이것은 난류를 생성시키는 용액 중에 입자를 포함시키고/시키거나 난류 유동을 생성시키기 위해 플로우 셀(예를 들어, 하나 이상의 표면 상의 헤링본 패턴)을 구조화함으로써 음파에 의해 수행된다. 또한, 플로우 셀에 존재하는 층류로 인해, 전형적으로 혼합이 거의 없고, 표면에 가까운 용액은 벌크 용액과 거의 혼합되지 않는다. 이것은 표면에 가까운 시약/결합 프로브를 제거하고 새로운 시약/프로브를 표면으로 이동시키는 데 문제를 생성시킨다. 이를 방지하기 위해 상기 난류 생성 접근법이 구현될 수 있고/있거나 표면에 상에서 광범위한 유체 흐름/교환이 수행될 수 있다. 일부 실시형태에서, 표적 분자가 배열된 후, 비-형광 비드 또는 구체가 표면에 부착되어 표면 조경에 거친 텍스처를 제공한다. 이것은 표면에 가까운 유체를 보다 효과적으로 혼합 및/또는 교환시키는 데 필요한 에디 및 전류를 생성시킨다.
일부 실시형태에서, 전체 레퍼토리 또는 하위세트가 함께 추가된다. 일부 이러한 실시형태에서, 염기 조성물 효과(예를 들어, TMACl 또는 구아니디늄 티오사이아네이트 및 기타, 미국 특허 출원 제2004/0058349호에 기재된 바와 같음)를 균등화하는 완충제가 사용된다. 일부 실시형태에서, 동일하거나 유사한 Tm을 갖는 프로브 종이 함께 첨가된다. 일부 실시형태에서, 함께 첨가된 프로브 종은 차별적으로 표지되지 않는다. 일부 실시형태에서, 함께 첨가된 프로브 종은 차별적으로 표지된다. 일부 실시형태에서, 차별적 표지는 예를 들어, 상이한 밝기, 수명 또는 파장 및/또는 이러한 물리적 특성의 조합을 갖는 방출을 갖는 표지이다.
일부 실시형태에서, 둘 이상의 올리고가 함께 사용되고, 상이한 올리고의 신호를 구별하기 위해 제공되지 않고 결합 장소가 결정된다(예를 들어, 올리고는 동일한 색상으로 표시된다). 이중 가닥의 두 가닥이 이용 가능할 때, 두 가닥으로부터 결합 부위 데이터를 획득하는 것은 조립 알고리즘의 일부로서 둘 이상의 올리고뉴클레오타이드 사이의 분화를 허용한다. 일부 실시형태에서, 하나 이상의 참조 프로브는 레퍼토리의 각각의 프로브와 함께 첨가되고, 이어서 어셈블리 알고리즘은 서열 어셈블리를 스캐폴드 또는 앵커링하기 위해 이러한 참조 프로브의 결합 장소를 사용할 수 있다.
대안의 일 실시형태에서, 프로브는 안정적으로 결합하지만 환경을 오프 모드로 전환시키는 외부 촉발인자는 그들의 일시성을 제어한다. 비제한적인 실시형태에서, 촉발인자는 프로브의 비결합을 야기하는 열, pH, 전기장 또는 시약 교환이다. 이어서 환경을 다시 온 모드로 전환시켜, 프로브가 다시 결합할 수 있다. 일부 실시형태에서, 결합이 제1 결합 라운드의 모든 부위를 포화시키지 않는 경우, 제2 결합 주기의 올리고는 제1 부위와 상이한 부위의 세트에 결합한다. 일부 실시형태에서, 이들 주기는 제어 가능한 속도로 수 회 수행된다.
일부 실시형태에서, 일시적인 결합은 1밀리초 이하, 50밀리초 이하, 500밀리초 이하, 1마이크로초 이하, 10마이크로초 이하, 50마이크로초 이하, 500마이크로초 이하, 1초 이하, 2초 이하, 5초 이하 또는 10초 이하 동안 지속된다.
새로운 프로브의 계속적인 공급을 보장하는 일시적인 결합 접근법으로, 형광단의 광 표백은 중요한 문제를 일으키지 않고, 정교한 필드 스톱 또는 파웰 렌즈가 조명을 제한하기 위해 필요하지 않다. 따라서, 형광단의 선택(또는 안티페이드(antifade), 산화환원 시스템의 제공)은 그다지 중요하지 않으며, 일부 이러한 실시형태에서 비교적 단순한 광학 시스템이 구축된다(예를 들어, 카메라의 시야에 존재하지 않는 분자의 조명을 방지하는 f-스톱은 높은 요구 사항이 아닐 것임).
일부 실시형태에서, 일시적 결합의 또 다른 이점은 폴리뉴클레오타이드를 따라 모든 결합 부위에서 다수의 측정이 이루어질 수 있어서 검출 정확도에 대한 신뢰도가 증가한다는 것이다. 예를 들어, 일부 경우에, 분자 과정의 전형적인 확률적 특성으로 인해서, 프로브가 잘못된 장소에 결합된다. 일시적으로 결합된 프로브, 예를 들어, 이상점(outlier)을 사용하면, 단리된 결합 사건이 폐기될 수 있고, 다수의 검출된 상호작용에 의해 확증된 결합 사건만 서열 결정의 목적을 위해서 유효한 검출 사건으로서 허용된다.
일시적인 결합 및 결합 부위의 국지화의 검출
일시적인 결합은 부분 회절 수준의 국지화를 가능하게 하는 필수 성분이다. 일시적으로 결합하는 프로브 세트의 각각의 프로브가 표적 분자에 결합되거나 용액 중에 존재할 가능성이 임의의 시기에 존재한다. 따라서, 결합 부위 모두가 한 번에 프로브에 의해 결합되는 것은 아니다. 이는 광의 회절 한계보다 가까운 부위(예를 들어, 표적 분자에서 단지 10㎚ 떨어져 있는 2개의 부위)에서 결합 사건을 검출할 수 있게 한다. 예를 들어, 60개의 염기 이후에 서열 AAGCTT가 반복되면, 이는 반복된 서열이 대략 20㎚ 이격될 것이라는 것을 의미한다(표적이 연장되고, 대략 0.34㎚의 왓슨-크릭 염기 길이로 펴지는 경우). 일반적으로 20나노미터는 광학 영상화에 의해서 구별될 수 없다. 그러나, 영상화 중에 프로브가 상이한 시간에 두 사이트에 결합하면, 이들은 개별적으로 검출된다. 이것은 결합 사건의 초고해상도 영상화를 허용한다. 나노단위 정밀도는 반복부를 리졸빙하고, 그 수를 결정하는 데 특히 중요하다.
일부 실시형태에서, 표적 내의 장소에 대한 다중 결합 사건은 단일 프로브 서열로부터의 것이 아니라, 레퍼토리로부터의 데이터를 분석하고, 부분적으로 중첩된 서열로부터 발생하는 사건을 고려함으로써 결정된다. 일례에서, 동일한(실제로 나노단위 미만으로 가까운) 장소는 프로브 ATTAAG 및 TTAAGC에 의해 결합되는데, 이것은 공통 5개의 염기 서열을 공유하고, 각각 다른 염기를 검증하고, 5개 염기의 양 면 상에서 서열을 하나의 염기로 확장시키는 6량체이다. 일부 경우에, 5개 염기 서열의 각각의 면 상의 염기는 미스매치(단부에서의 미스매치는 전형적으로 내부의 미스매치보다 더 허용될 것으로 예상됨)이며, 두 결합 사건에 존재하는 5개의 염기 서열만 검증된다.
일부 대안적인 실시형태에서, 일시적인 단일 분자 결합은 비-광학적 방법에 의해 검출된다. 일부 실시형태에서, 비-광학적 방법은 전기 방법이다. 일부 실시형태에서, 일시적인 단일 분자 결합은 직접적인 여기 방법이 없고, 오히려 생물발광 또는 화학발광 기전이 사용되는 비-형광 방법에 의해 검출된다.
일부 실시형태에서, 표적 핵산 내의 각각의 염기는 서열이 중첩되는 다수의 올리고에 의해 조사된다. 각각의 염기의 이러한 반복된 샘플링은 표적 폴리뉴클레오타이드에서 희귀한 단일 뉴클레오타이드 변이체 또는 돌연변이의 검출을 허용한다.
본 개시내용의 일부 실시형태는 각각의 올리고뉴클레오타이드가 분석 하에서 폴리뉴클레오타이드와 함께 갖는 결합 상호작용의 레퍼토리(역치 결합 지속기간 초과)를 고려한다. 일부 실시형태에서, 서열결정은 완벽한 매치로부터의 스티칭 또는 재구성 서열을 포함할 뿐만 아니라 각각의 올리고의 결합 과정을 먼저 분석함으로써 서열을 획득한다. 일부 실시형태에서, 일시적인 결합은 검출 수단으로서 기록되지만, 국지화를 개선하기 위해서 사용되지 않는다.
광학 활성을 검출하고, 결합 부위의 국지화를 결정하기 위한 영상화 기술.
블록 214. 2차원 영상화기를 사용하여 노출시키는 단계 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 시험 기질 상의 장소 및 지속기간을 측정한다.
시험 기질 상의 장소를 측정하는 단계는 2차원 영상화기에 의해서 측정된 데이터의 프레임을 훈련된 콘볼루션 신경망에 투입하는 단계를 포함한다. 데이터의 프레임은 광학 활성의 복수의 인스턴스 중에서 상기 광학 활성의 각자의 인스턴스를 포함한다. 광학 활성의 복수의 인스턴스 내의 광학 활성의 각각의 인스턴스는 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 결합하는 개별 프로브에 상응한다. 투입에 반응하여, 훈련된 콘볼루션 신경망은 광학 활성의 복수의 인스턴스 내의 광학 활성의 하나 이상의 인스턴스 각각의 시험 기질 상의 위치를 식별한다.
일부 실시형태에서, 검출기는 2차원 검출기이고, 결합 사건은 (예를 들어, 단일 분자 국지화 알고리즘을 사용함으로써) 나노미터 정확성으로 국지화된다. 일부 실시형태에서, 상호작용 특징은 각각의 결합 사건의 지속기간을 포함하는데, 이 것은 프로브(들)와 분자의 친화도에 상응한다. 일부 실시형태에서, 상기 특징은 표면 또는 매트릭스 상의 장소인데, 이것은 특정 분자(예를 들어, 특정 유전자 서열에 상응하는 폴리뉴클레오타이드)의 어레이 내의 위치에 상응한다.
일부 실시형태에서, 광학 활성의 각각의 각자의 인스턴스는 미리 결정된 역치를 충족시키는 관찰 메트릭(observation metric)을 갖는다. 일부 실시형태에서, 관찰 메트릭은 지속기간, 신호 대 노이즈, 광자 수치 또는 강도를 포함한다. 일부 실시형태에서, 미리 결정된 역치는, 광학 활성의 각자의 인스턴스가 하나의 프레임에 대해서 관찰된다. 일부 실시형태에서, 광학 활성의 각자의 인스턴스의 강도는 비교적 낮고, 미리 결정된 역치는, 광학 활성의 각자의 인스턴스가 하나의 프레임의 1/10 대해서 관찰된다.
일부 실시형태에서, 미리 결정된 역치는, (i) 고유한 N량체 서열의 각각의 잔기가 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥 내의 상보성 염기에 결합하는 제1 결합 형태와 (ii) 상기 고유한 N량체 서열과 각자의 올리고뉴클레오타이드 프로브가 결합하여 광학 활성의 각자의 인스턴스를 형성하는 핵산의 고정된 제1 가닥 또는 고정된 제2 가닥 내의 서열 사이에 적어도 하나의 미스매치가 존재하는 제2 결합 형태를 구별한다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 그 자신의 상응하는 미리 결정된 역치를 갖는다.
일부 실시형태에서, 미리 결정된 역치는 폴리뉴클레오타이드에 따르는 특정 장소에서 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상 또는 6개 이상의 결합 사건의 관찰에 기초하여 결정된다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 미리 결정된 역치는 트레이닝 데이터세트(예를 들어, 람다 파지를 서열결정하기 위한 방법을 적용함으로써 획득된 정보로부터 유래된 데이터세트)로부터 유래된다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 미리 결정된 역치는 트레이닝 데이터세트로부터 유래된다. 트레이닝 세트는, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대해서, 참조 서열에 결합하여 각자의 올리고뉴클레오타이드 프로브의 고유한 N량체 서열의 각각의 잔기가 참조 서열 내의 상보성 염기에 결합할 때의 각자의 올리고뉴클레오타이드 프로브에 대한 관찰 메트릭의 측정치를 포함한다.
일부 실시형태에서, 참조 서열은 참조 기질 상에 고정된다. 일부 실시형태에서, 참조 서열은 상기 핵산과 함께 포함되고, 시험 기질 상에 고정된다. 일부 실시형태에서, 참조 서열은 PhiX174, M13, 람다 파지, T7 파지, 에쉐리키아 콜라이, 사카로마이세스 세레비지애 또는 사카로마이세스 폼베의 게놈의 전부 또는 일부를 포함한다. 일부 실시형태에서, 참조 서열은 공지된 서열의 합성 작제물이다. 일부 실시형태에서, 참조 서열은 토끼 글로빈 RNA의 전부 또는 일부를 포함한다(예를 들어, 핵산이 RNA를 포함하거나 또는 폴리뉴클레오타이드의 단지 하나의 가닥이 서열결정되는 경우).
일부 실시형태에서, 노출시키는 단계는 인터칼레이팅 염료 형태의 제1 표지의 존재 하에서 일어난다. 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지와 결합되어 있다. 제1 표지 및 상기 제2 표지는, 제1 표지 및 제2 표지가 서로에 인접하는 경우 제1 표지 및 제2 표지 중 하나가 형광을 내도록 하는 중첩된 공여자 방출 및 수용자 여기 스펙트럼을 갖는다. 광학 활성의 각자의 인스턴스는 올리고뉴클레오타이드와 고정된 제1 가닥 또는 고정된 제2 가닥 간의 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래된다. 일부 실시형태에서, 노출 및 형광은 포스터 공명 에너지 전달(Foerster resonance energy transfer: FRET) 방법을 포함한다. 이러한 실시형태에서, 인터칼레이팅 염료는 FRET 공여자를 포함하고, 제2 표지는 FRET 수용자를 포함한다.
일부 실시형태에서, 신호는 인터칼레이팅 염료로부터 프로브 또는 표적 서열 상의 표지로의 FRET에 의해서 검출된다. 일부 실시형태에서, 표적이 부동화된 후, 모든 표적 분자의 단부는 예를 들어, FRE 파트너로서 작용하는 형광 표지된 뉴클레오타이드를 혼입한 말단 트랜스퍼라제에 의해서 표지된다. 일부 이러한 실시형태에서, 프로브는 Cy3B 또는 Atto 542 표지로 이의 단부 중 하나에서 표지된다.
일부 실시형태에서, FRET는 광 활성화에 의해서 대체된다. 이러한 실시형태에서, 공여자(예를 들어, 주형 상의 표지)는 광 활성화제를 포함하고, 수용자(예를 들어, 올리고뉴클레오타이드 상의 표지)는 비활성화된 또는 어두운 상태의 형광단이 된다(예를 들어, Cy5 표지는 형광 영상화 실험 이전에 20mM Tris(pH 7.5에서), 2mM EDTA 및 50mM NaCl 중의 1㎎/㎖ NaBH4를 사용한 케이징에 의해서 어두워질 수 있다). 이러한 실시형태에서, 어두워진 형광단의 형광은 활성화제에 인접할 때 온으로 변경된다.
일부 실시형태에서, 노출시키는 단계는 인터칼레이팅 염료(예를 들어, 광 활성화제) 형태의 제1 표지의 존재 하에서 일어난다. 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지(예를 들어, 어두워진 형광단)와 결합되어 있다. 제1 표지는, 제1 표지 및 제2 표지가 서로에 인접하는 경우 제2 표지가 형광을 내도록 한다. 광학 활성의 각자의 인스턴스는 올리고뉴클레오타이드와 고정된 제1 가닥 또는 고정된 제2 가닥 간의 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래된다.
일부 실시형태에서, 노출시키는 단계는 인터칼레이팅 염료(예를 들어, 어두워진 형광단) 형태의 제1 표지의 존재 하에서 일어난다. 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지(예를 들어, 광 활성화제)와 결합되어 있다. 제2 표지는, 제1 표지 및 제2 표지가 서로에 인접하는 경우 제1 표지가 형광을 내도록 한다. 광학 활성의 각자의 인스턴스는 올리고뉴클레오타이드와 고정된 제1 가닥 또는 고정된 제2 가닥 간의 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래된다.
일부 실시형태에서, 노출시키는 단계는 인터칼레이팅 염료의 존재 하에서 일어난다. 광학 활성의 각자의 인스턴스는 올리고뉴클레오타이드와 고정된 제1 가닥 또는 상기 고정된 제2 가닥 간의 상기 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의 형광으로부터 유래되고, 여기서 광학 활성의 각자의 인스턴스는 인터칼레이팅 염료가 각자의 헤테로듀플렉스를 인터칼레이팅하기 전의 인터칼레이팅 염료의 형광보다 더 크다. 듀플렉스 내에 인터칼레이팅된 1종 이상의 염료의 증가된 형광(100× 이상)은 단일 분자 국지화 알고리즘을 위한 점광원(point source)-유사 신호를 제공하고, 결합 부위의 장소의 정밀한 결정을 가능하게 한다. 인터칼레이팅 염료는 듀플렉스 내에 인터칼레이팅되어, 강력하게 검출되고, 정밀하게 국지화되는 각각의 결합 부위에 대한 상당한 수의 헤테로듀플렉스 결합 사건을 생성시킨다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브는 고정된 제1 가닥의 상보성 부분에 대한 결합에 의해서 광학 활성의 제1 인스턴스를 산출하고, 고정된 제2 가닥의 상보성 부분에 대한 결합에 의해서 제2 광학 활성의 인스턴스를 산출한다. 일부 실시형태에서, 고정된 제1 가닥의 일부는 이의 상보성 올리고뉴클레오타이드 프로브의 결합에 의해서 광학 활성의 인스턴스를 산출하고, 고정된 제1 가닥의 일부에 상보성인 고정된 제2 가닥은 이의 상보성 올리고뉴클레오타이드 프로브의 결합에 의한 광학 활성의 또 다른 인스턴스를 산출한다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브는 고정된 제1 가닥의 2개 이상의 상보성 부분에 대한 결합에 의해서 광학 활성의 2개 이상의 제1 인스턴스를 산출하고, 고정된 제2 가닥의 2개 이상의 상보성 부분에 대한 결합에 의해서 2개 이상의 제2 광학 활성의 인스턴스를 산출한다.
일부 실시형태에서, 각자의 올리고뉴클레오타이드 프로브는 노출시키는 단계 동안 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 3회 이상 결합함으로써 광학 활성의 3개 이상의 인스턴스를 야기하고, 광학 활성의 각각의 인스턴스는 복수의 결합 사건에서 결합 사건을 나타낸다.
일부 실시형태에서, 각자의 올리고뉴클레오타이드 프로브는 노출시키는 단계 동안 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 5회 이상 결합함으로써 광학 활성의 5개 이상의 인스턴스를 야기한다. 광학 활성의 각자의 인스턴스는 복수의 결합 사건에서 결합 사건을 나타낸다.
일부 실시형태에서, 각자의 올리고뉴클레오타이드 프로브는 노출시키는 단계 동안 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 10회 이상 결합함으로써 광학 활성의 10개 이상의 인스턴스를 야기하고, 광학 활성의 각자의 인스턴스는 복수의 결합 사건에서 결합 사건을 나타낸다.
일부 실시형태에서, 노출시키는 단계는 5분 이하, 4분 이하, 3분 이하, 2분 이하 또는 1분 이하 동안 일어난다.
일부 실시형태에서, 노출시키는 단계는 2차원 영상화기의 1개 이상의 프레임에 걸쳐서 일어난다. 일부 실시형태에서, 노출시키는 단계는 2차원 영상화기의 2개 이상의 프레임에 걸쳐서 일어난다. 일부 실시형태에서, 노출시키는 단계는 2차원 영상화기의 500개 이상의 프레임에 걸쳐서 일어난다. 일부 실시형태에서, 노출시키는 단계는 2차원 영상화기의 5,000개 이상의 프레임에 걸쳐서 일어난다. 일부 실시형태에서, 광학 활성이 희미한 경우(예를 들어, 프로브 결합의 인스턴스가 거의 없는 경우), 일시적인 결합의 하나의 프레임이 신호를 국지화시키기에 충분하다.
일부 실시형태에서, 노출시키는 단계의 인스턴스의 시간 길이는 노출시키는 단계의 인스턴스에서 사용된 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 예측된 용융 온도에 의해서 결정된다.
일부 실시형태에서, 광학 활성은 표지로부터의 형광 방출을 포함한다. 각각의 표지는 필터 휠 내의 구별되는 필터를 사용하여 별개로 검출되는 여기 및 상응하는 방출 파장이다. 일부 실시형태에서, 방출 수명은 형광 수명 영상화(fluorescence lifetime imaging: FLIM) 시스템을 사용하여 측정된다. 대안적으로, 파장은 단일 센서의 상이한 사분면 또는 4개의 개별 센서로 분할되어 투사된다. 프리즘을 사용하여 CCD의 픽셀에 걸쳐 스펙트럼을 분할하는 방법은 문헌[Lundquit et al., Opt Lett., 33:1026-8, 2008]에 기재되어 있다. 일부 실시형태에서, 분광사진기(spectrograph)가 또한 사용된다. 대안적으로, 일부 실시형태에서, 방출 파장은 결합 부위에서 프로브의 체류 시간에 관한 정보를 제공하기 위해서 밝기 수준과 조합된다.
스캐닝 프로브 현미경(고속 원자력 현미경 포함) 및 전자 현미경과 같은 몇몇 검출 방법은 폴리뉴클레오타이드 분자가 검출 평면에서 연장될 때 나노단위 거리를 리졸빙할 수 있다. 그러나, 이들 방법은 형광단의 광학 활성에 관한 정보를 제공하지는 않는다. 초고해상도 정밀도로 형광 분자를 검출하는 다수의 광학 영상화 기술이 존재한다. 이것은 자극 방출 고갈(stimulated emission depletion: STED), 확률적 광학 재구성 현미경(stochastic optical reconstruction microscop: STORM), 초고해상도 광학 변동 영상화(super-resolution optical fluctuation imaging: SOFI), 단일 분자 국지화 현미경(single molecule localization microscopy: SMLM) 및 전체 내부 반사 형광(total internal reflection fluorescence: TIRF) 현미경을 포함한다. 일부 실시형태에서, 나노스케일 토포그래피(PAINT)에서의 점 축적과 가장 유사한 SMLM 접근법이 바람직하다. 이들 방법은 전형적으로 형광단을 여기시키기 위한 하나 이상의 레이저, 포커스 검출/홀드 메커니즘, CCD 카메라에 적절한 대물 렌즈, 릴레이 렌즈 및 거울이 필요하다. 일부 실시형태에서, 검출 단계는 프로브의 결합-온 및 결합-오프를 기록하기 위해서 다수의 이미지 프레임(예를 들어, 영화 또는 비디오)을 찍는 것을 포함한다.
SMLM 방법은 높은 광자 수에 의존한다. 높은 광자 수는 가우시안 패턴의 형광단 생성된 중심이 결정되는 정밀도를 향상시키지만, 높은 광자 수의 필요성은 또한 긴 영상 획득 및 밝고 광 안정적인 형광단에 대한 의존에 연관된다. 켄칭된 프로브 분자 비콘을 사용하거나, 예를 들어, 올리고의 각 면에 하나씩 동일한 유형의 2개 이상의 표지를 가짐으로써 유해한 배경을 유발하지 않으면 서 높은 용액 농도의 프로브가 달성된다. 이러한 실시형태에서, 이들 표지는 염색-염료 상호작용을 통해 용액 중에서 켄칭된다. 그러나, 표적에 결합될 때, 표지는 분리되어 보다 밝게(예를 들어, 단일 염료보다 2배 더 밝게) 형광을 내어 보다 쉽게 검출될 수 있다.
일부 실시형태에서, 프로브의 온-레이트는 프로브 농도를 증가시키거나, 온도를 증가시키거나, 분자 군집을 증가시킴으로써(예를 들어, 용액 중에 PEG 400, PEG 800 등을 포함시킴으로써) 조작(예를 들어, 증가)된다. 화학 성분을 가공하거나, 탈안정화 부속물을 첨가하거나, 올리고뉴클레오타이드의 경우 길이를 줄임으로써 프로브의 열 안정성을 낮추면 오프-레이트(off-rate)가 증가할 수 있다. 일부 실시형태에서, 오프-레이트는 또한 온도를 증가시키거나, 염 농도를 감소시키거나(예를 들어, 엄격성을 증가시키거나), pH를 변경시킴으로써 가속화된다.
일부 실시형태에서, 사용되는 프로브의 농도는 프로브가 결합할 때까지 프로브를 본질적으로 비-형광성이게 함으로써 증가된다. 이를 수행하는 하나의 방식은 결합이 광 활성화 사건을 유도하는 것이다. 또 다른 하나는 결합이 일어날 때까지(예를 들어, 분자 비콘) 표지를 켄칭하는 것이다. 또 다른 하나는 신호를 에너지 전달 사건(예를 들어, FRET, CRET, BRET)의 결과로서 검출하는 것이다. 일 실시형태에서, 표면 상의 생체중합체는 공여자를 보유하고, 프로브는 수용자를 보유하거나 또는 그 반대이다. 다른 실시형태에서, 인터칼레이팅 염료가 용액에 제공되고, 표지된 프로브의 결합 시, 인터칼레이팅 염료와 프로브 사이에 FRET 상호작용이 존재한다. 인터칼레이팅 염료의 예는 YOYO-1이고, 프로브 상의 표지의 예는 ATTO 655이다. 다른 실시형태에서, 인터칼레이팅은 FRET 기전 없이 사용되며, 표면 상의 단일 가닥 표적 서열 및 프로브 서열 둘 다가 표지되지 않고, 결합이 인터칼레이팅 염료가 인터칼레이팅된 이중 가닥을 생성하는 경우에만 신호가 검출된다. 인터칼레이팅 염료는 아이덴티티에 따라서 DNA에 인터칼레이팅되지 않고, 용액 중에서 자유로울 때 100× 또는 1000× 덜 밝다. 일부 실시형태에서, TIRF 또는 고도로 경사진 적층 광학(highly inclined and laminated optical: HILO)(예를 들어, 문헌[Mertz et al., J. of Biomedical Optics, 15(1): 016027, 2010]에 기재됨) 현미경을 사용하여 용액 중의 인터칼레이팅 염료로부터 임의의 배경 신호를 제거한다.
그러나, 일부 실시형태에서, 고농도의 표지된 프로브는 높은 배경 형광을 유발하여 표면 상의 신호의 검출을 방해한다. 일부 실시형태에서, 이것은 표면 상에 형성된 듀플렉스를 표지하기 위한 DNA 염색 또는 인터칼레이팅 염료로 해결된다. 표적이 단일 가닥이거나 또는 단일 가닥 프로브를 갖는 경우 염료가 인터칼레이팅되지 않지만, 프로브와 표적 사이에 듀플렉스가 형성될 때 염료가 인터칼레이팅될 것이다. 일부 실시형태에서, 프로브는 표지되지 않으며, 검출되는 신호는 인터칼레이팅 염료에만 기인한다. 일부 실시형태에서, 프로브는 인터칼레이팅 염료 또는 DNA 염색에 대한 FRET 파트너로서 작용하는 표지로 표지된다. 일부 실시형태에서, 인터칼레이팅 염료는 공여자이고, 상이한 파장의 수용자와 결합하여, 프로브가 다수의 형광단으로 암호화될 수 있게 한다.
일부 실시형태에서, 검출 단계는 각각의 상보 부위에 대한 다수의 결합 사건을 검출하는 것을 포함한다. 일부 실시형태에서, 다수의 사건은 동일한 프로브 분자 결합 온 또는 오프로부터, 또는 동일한 특이성의 또 다른 분자(예를 들어, 동일한 서열 또는 분자 구조에 특이적임)로 대체되고, 이는 수 회 발생한다. 일부 실시형태에서, 결합 온- 또는 오프-레이트는 조건 변경에 의해 영향을 받지 않는다. 예를 들어, 결합-온 및 결합-오프는 동일한 조건(예를 들어, 염 농도, 온도 등) 하에서 발생하며, 이는 프로브-타깃 상호작용이 약하기 때문이다.
일부 실시형태에서, 서열결정은 더 짧거나, 동일한 길이 또는 프로브 길이의 규모 정도 이내인 단일 표적 폴리뉴클레오타이드 상의 다수의 위치에서 다수의 온-오프 결합 사건을 영상화함으로써 수행된다. 이러한 실시형태에서, 더 긴 표적 폴리뉴클레오타이드가 단편화되거나 단편의 패널이 표면 상에 미리 선택되고, 배열되어 각각의 폴리뉴클레오타이드 분자가 개별적으로 리졸빙 가능해진다. 이러한 경우에, 특정 장소에 대한 프로브 결합의 빈도 또는 지속기간을 사용하여 프로브가 표적 서열에 상응하는지의 여부를 결정한다. 프로브 결합의 빈도 또는 지속기간은 프로브가 표적 서열의 전부 또는 일부에 상응하는지(남은 염기가 일치하지 않는지)의 여부를 결정한다.
일부 실시형태에서, 표적 폴리뉴클레오타이드 사이의 나란한 오버랩의 존재는 DNA 염색으로부터의 형광 증가에 의해서 검출된다. 염색이 사용되지 않는 일부 실시형태에서, 중첩은 분절을 따르는 겉보기 결합 부위의 빈도의 증가에 의해 검출된다. 예를 들어, 회절-제한 분자가 광학적으로 중첩된 것으로 보이지만 실제로는 물리적으로 중첩되지 않은 일부 예에서, 이들은 본 개시내용의 다른 곳에 기재된 바와 같이 단일 분자 국지화를 사용하여 슈퍼-리졸빙된다. 엔드-투-엔드 오버랩이 발생하는 경우, 일부 실시형태에서, 폴리뉴클레오티타이의 단부를 마킹하는 표지를 사용하여 병치된 폴리뉴클레오타이드를 실제 연속 길이와 구별한다. 일부 실시형태에서, 이러한 광학 키메라는 게놈의 많은 카피가 예상되고, 겉보기 키메라의 하나의 존재만이 발견되는 경우 아티팩트로서 무시된다. 다시, 분자의 단부(회절-제한)가 광학적으로 중첩된 것으로 보이지만 물리적으로 중첩되지 않은 일부 실시형태에서, 이들은 본 개시내용의 방법에 의해 리졸빙된다. 일부 실시형태에서, 장소 결정은 매우 근접한 표지로부터 발생하는 신호가 리졸빙되도록 매우 정밀하다.
일부 실시형태에서, 서열결정은 프로브보다 더 긴 단일 표적 폴리뉴클레오타이드 상의 다수의 위치에서 다수의 온-오프 결합 사건을 영상화함으로써 수행된다. 일부 실시형태에서, 단일 폴리뉴클레오타이드 전체에서 프로브 결합 사건의 장소가 결정된다. 일부 실시형태에서, 단일 폴리뉴클레오타이드에 대한 프로브 결합 사건의 장소는 표적 폴리뉴클레오타이드를 연장시킴으로써 결정되어, 그 길이를 따라 상이한 장소가 검출되고 리졸빙된다.
일부 실시형태에서, 표적 분자에 결합된 프로브로부터 비결합된 프로브의 광학 활성을 분화시키는 것은 결합되지 않은 프로브로부터의 신호의 거부 또는 제거를 필요로 한다. 이러한 일부 실시형태에서, 이는 예를 들어, 조명을 위한 에바네센트 필드(evanescent field) 또는 도파관을 사용하거나, FRET 쌍 표지를 사용하거나, 특정 장소에서 프로브를 검출하기 위해서 광 활성화를 이용함으로써(예를 들어, 문헌[Hylkje et al., Biophys J. 2015; 108(4): 949-956J에 기재된 바와 같음) 수행된다.
일부 실시형태에서, 프로브는 표지되지 않지만, 표적과의 상호작용은 인터칼레이팅 염료(1302)와 같은 DNA 염색에 의해 검출되는데, 이는 듀플렉스에 인터칼레이팅되고, 결합이 발생하거나 발생했을 때 형광 내기(1304)를 시작한다(예를 들어, 도 13A 내지 도 13C에 도시된 바와 같음). 일부 실시형태에서, 하나 이상의 인터칼레이팅 염료는 아무 때나 듀플렉스에 인터칼레이팅된다. 일부 실시형태에서, 인터칼레이팅 염료가 인터칼레이팅될 때 그것에 의해 방출되는 형광은 용액 중에서 자유롭게 부유하는 인터칼레이팅 염료로 인한 형광보다 수 십 배 더 크다. 예를 들어, 인터칼레이팅된 YOYO-1 염료의 신호는 용액 중에서 자유로운 YOYO-1 염료의 신호보다 약 100× 더 크다. 일부 실시형태에서, 약하게 염색된(또는 부분적으로 광표백된) 이중 가닥 폴리뉴클레오타이드가 영상화될 때, 관찰되는 폴리뉴클레오타이드를 따른 개별 신호는 단일 인터칼레이팅 염료 분자에 상응할 가능성이 있다. 듀플렉스에서 YOYO-1 염료의 교환을 용이하게 하고 메틸 바이올로겐 및 아스코브산을 포함하는 밝은 신호 산화환원-산화 시스템(ROX)을 얻기 위해서, 일부 실시형태에서 결합 완충제에 제공된다.
일부 실시형태에서, 단일 염료 분자로 표지된 뉴클레오타이드의 혼입을 검출함으로써(예를 들어, Helicos 및 PacBio 서열결정에서와 같이) 단일 분자에 대한 서열결정은 염료가 검출되지 않을 때 오류를 도입한다. 일부 경우에, 이것은 염료가 광표백되었거나, 염료 점멸로 인해 검출된 누적 신호가 약하거나, 염료가 너무 약하게 방출되거나 염료가 긴 어두운 광물리적 상태로 진입하기 때문이다. 일부 실시형태에서, 이것은 다수의 대안적인 방식으로 극복된다. 첫 번째는 선호되는 광물리적 특성을 갖는 강력한 개별 염료(예를 들어, Cy3B)로 염료를 표지하는 것이다. 또 다른 하나는 광표백 및 어두운 광물리적 상태를 감소시키는 완충제 조건 및 첨가제(예를 들어, 베타-머캅토 에탄올, 트롤록스, 비타민 C 및 이의 유도체, 산화환원 시스템)를 제공하는 것이다. 또 다른 하나는 (예를 들어, 더 짧은 노출이 필요하거나 스트로보스코픽(stroboscopic) 조명을 제공하는 더 민감한 검출기를 갖는) 광에 대한 노출을 최소화하는 것이다. 두 번째는 단일 염료 대신, 양자점(예를 들어, Qdot 655), 형광구, 나노다이아몬드, 플라즈몬 공명 입자, 광산란 입자 등과 같은 나노입자로 표지하는 것이다. 또 다른 하나는 (예를 들어, 도 14C 및 도 14D에 도시된 바와 같이) 단일 염료보다는 뉴클레오타이드당 많은 염료를 갖는 것이다. 이 경우에, 다수의 염료(1414)는 (예를 들어, DNA 오리가미와 같은 충분히 멀리 떨어져 있는 강성 나노구조(1412)를 사용하여) 자체 강성을 최소화하거나 강성 링커를 통한 선형 간격을 최소화하는 방식으로 구성된다.
일부 실시형태에서, 유레아, 아스코브산 또는 이의 염, 및 아이소아스코브산 또는 이의 염, 베타-머캅토에탄올(BME), DTT, 산화환원 시스템 또는 트롤록스로부터 선택된 1종 이상의 화합물(들)의 용액 중에서의 존재 하에서 검출 오류율이 추가로 감소된다(그리고 신호 지속이 증가됨).
일부 실시형태에서, 표적 분자 단독에 대한 프로브의 일시적 결합은 염료 광물리학으로 인한 오류를 감소시키기에 충분하다. 영상화 단계에서 얻은 정보는 상이한 표지 보유 프로브의 다수의 온/오프 상호작용의 집합이다. 따라서, 하나의 표지가 광표백되거나 어두운 상태인 경우에도, 분자 상에 상주하는 다른 결합 프로브 상의 표지는 광표백되지 않거나 어두운 상태가 아니기 때문에, 일부 실시형태에서, 결합 부위의 장소에 대한 정보를 제공할 것이다.
일부 실시형태에서, 각각의 일시적인 결합 사건에서 표지로부터의 신호는 2D 검출기의 하나 초과의 픽셀을 커버하기 위해서 광학 경로(전형적으로, 배율을 제공함)를 통해 투사된다. 신호의 PSF(point spread function)가 플로팅되고, PSF의 중심이 신호의 정확한 장소로 간주된다. 일부 실시형태에서, 이 국지화는 부분 회절(예를 들어, 초고해상도) 및 나노미터 미만의 정확도까지 수행된다. 국지화 정확도는 수집된 광자 수에 반비례한다. 따라서, 형광 표지에 의해 초당 더 많은 광자가 방출되거나 광자가 더 오래 수집될 수록 정확도는 높아진다.
일례에서, 도 10a 및 도 10b에 도시된 바와 같이, 각각의 결합 부위에서의 결합 사건의 수 및 수집된 광자의 수 둘 다는 달성되는 국지화 정도와 상관관계가 있다. 표적 중합체(1002)의 경우, 가장 적은 수의 결합 사건(1004-1) 및 결합 부위에 대해 기록된 가장 적은 수의 광자(1008-1)는 각각 가장 덜 정밀한 국지화(1006-1 및 1010-1)와 상관관계가 있다. 결합 사건(1004-2, 1004-3)의 수 또는 기록된 광자의 수(1008-2, 1008-3)의 수가 결합 부위에 대해서 증가함에 따라, 국지화 정도는 각각 (1006-2, 1006-3 및 1010-2, 1010-3)으로 증가한다. 도 10A에서, 폴리뉴클레오타이드(1002) 상의 표지된 프로브의 상이한 수의 검출된 확률적 결합 사건(예를 들어, 1004-1, 1004-2, 1004-4)의 수의 변화는 프로브(1006-1, 1006-2, 1006-3)의 국지화 정도 변화를 야기하며, 여기서 더 큰 수의 결합 사건(예를 들어, 1004-2)은 더 높은 국지화 정도(예를 들어, 1006-2)와 상관관계가 있고, 더 적은 수의 결합 사건(예를 들어, 1004-1)은 더 낮은 국지화 정도(예를 들어, 1006-1)와 상관관계가 있다. 도 10B에서, 유사하게 검출된 광자 수의 변화(예를 들어, 1008-1, 1008-2 및 1008-3)는 국지화 정도의 변화(각각, 1010-1, 1010-2 및 1010-3)를 초래한다.
대안적인 실시형태에서, 각각의 일시적인 결합 사건에서 표지로부터의 신호는 광학 배율 경로를 통해서 투사되지 않는다. 대신, 기질(전형적으로 표적 분자가 상부에 존재하는 광학적으로 투명한 표면)은 2차원 검출기 어레이에 직접 커플링된다. 검출기 어레이의 픽셀이 작은 경우(예를 들어, 1제곱마이크론 이하), 표면 상의 신호의 일대일 투사는 결합 신호가 적어도 1-마이크론 정확성으로 국지화되는 것을 허용한다. 핵산이 충분히 신장된(예를 들어, 2킬로베이스의 폴리뉴클레오타이드가 1마이크론 길이로 신장된) 일부 실시형태에서, 단지 2킬로베이스 이격된 신호가 리졸빙된다. 예를 들어, 신호가 4096개의 염기 또는 2마이크론마다 발생할 것으로 예상되는 6량체 프로브의 경우, 이러한 분해능은 개별 결합 부위를 확실하게 국지화하기에 충분할 것이다. 2개의 픽셀 사이에 부분적으로 속하는 신호는 중간 장소를 제공한다(예를 들어, 신호가 2개의 픽셀 사이에 속하면 1제곱마이크론 픽셀에 대한 분해능은 500㎚일 수 있다). 일부 실시형태에서, 기질은 2차원 어레이 검출기와 관련하여 (예를 들어, 100㎚의 증분으로) 물리적으로 번역되어 더 높은 분해능을 제공한다. 이러한 실시형태에서, 장치는 렌즈 또는 렌즈 사이에 공간이 필요하지 않기 때문에 더 작다(또는 더 얇다). 일부 실시형태에서, 기질의 번역은 또한 분자 저장 판독치를 기존의 컴퓨터 및 데이터베이스와 보다 상용성인 전자 판독치로 직접 변환한다.
일부 실시형태에서, 고속 일시적 결합을 포획하기 위해서, 포획 프레임 레이트가 증가되고, 데이터 전송 속도는 표준 현미경 기술에 비해 증가된다. 일부 실시형태에서, 이러한 과정의 속도는 높은 프레임 검출과 프로브의 증가된 농도의 커플링에 의해서 증가된다. 그러나 개별 노출은 각각의 노출과 연관된 전자 노이즈를 감소시키기 위해서 최소 역치 노출로 유지된다. 200밀리초 노출의 누적 전자 노이즈는 2개 미만의 100밀리초 노출이다.
더 빠른 영상화를 가능하게 하는 더 빠른 CMOS 카메라가 이용 가능해지고 있다. 예를 들어 Andor Zyla Plus는 USB 3.0 연결로 512×1024 제곱픽셀에 걸쳐서 초당 최대 398프레임을 허용하고, 제한된 관심 영역(restricted regions of interest: ROI) 또는 CameraLink 연결보다 훨씬 빠르다.
빠른 영상화를 얻기 위한 대안적인 접근법은 갈보 미러(galvo mirror) 또는 디지털 마이크로미러를 사용하여 시간적으로 증분된 영상을 상이한 센서로 전송하는 것이다. 무비의 프레임의 정확한 순서는 획득 시간에 따라 서로 상이한 센서로부터 프레임을 인터리빙함으로써 재구성된다.
일시적인 결합 공정은 염 농도와 같은 다양한 생화학적 파라미터를 튜닝함으로써 가속화될 수 있다. 결합 속도를 매칭시키는데 사용할 수 있는 높은 프레임 속도의 다수의 카메라가 존재하며, 종종 픽셀의 하위세트에서 더 빠른 판독치를 얻도록 시야가 제한된다. 하나의 접근법은 검류계 미러를 사용하여 단일 센서의 상이한 영역 또는 별개의 센서에 연속적인 신호를 일시적으로 분배하는 것이다. 후자는 센서의 전체 시야를 활용할 수 있지만, 분산 신호가 컴파일링될 때 전체 시간 분해능을 증가시킨다.
다수의 결합 사건의 데이터세트의 빌딩.
블록 218. 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 노출시키는 단계 및 측정하는 단계를 반복함으로써, 시험 기질 상의 복수의 위치 세트를 획득하며, 시험 기질 상의 각각의 각자의 위치 세트는 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응한다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트는 올리고뉴클레오타이드 프로브의 복수의 하위세트를 포함하되, 노출시키는 단계 및 측정하는 단계를 반복하는 단계는 올리고뉴클레오타이드 프로브의 복수의 하위세트 내의 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트에 대해서 수행된다.
일부 실시형태에서, 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트는 올리고뉴클레오타이드 프로브의 세트로부터의 2개 이상의 상이한 프로브를 포함한다. 일부 실시형태에서, 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트는 올리고뉴클레오타이드 프로브의 세트로부터의 4개 이상의 상이한 프로브를 포함한다. 일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트는 올리고뉴클레오타이드 프로브의 4개의 하위세트로 이루어진다.
일부 실시형태에서, 방법은 올리고뉴클레오타이드 프로브의 세트를 각각의 올리고뉴클레오타이드 프로브의 계산 또는 실험적으로 유래된 용융 온도에 기초하여 올리고뉴클레오타이드 프로브의 복수의 하위세트로 구분하는 단계를 추가로 포함한다. 유사한 용융 온도를 갖는 올리고뉴클레오타이드 프로브는 구분하는 단계에 의해서 올리고뉴클레오타이드 프로브의 동일한 하위 세트에 배치된다. 추가로, 상기 노출시키는 단계의 인스턴스의 시간 또는 지속기간은 올리고뉴클레오타이드 프로브의 상응하는 하위세트 내의 올리고뉴클레오타이드 프로브의 평균 용융 온도에 의해서 결정된다.
일부 실시형태에서, 방법은 올리고뉴클레오타이드 프로브의 세트를 각각의 올리고뉴클레오타이드 프로브의 서열에 기초하여 올리고뉴클레오타이드 프로브의 상기 복수의 하위세트로 구분하는 단계를 더 포함하며, 여기서 중첩 서열을 갖는 올리고뉴클레오타이드 프로브는 상이한 하위세트에 놓인다.
일부 실시형태에서, 노출시키는 단계 및 측정하는 단계를 반복하는 단계는 올리고뉴클레오타이드 프로브의 세트 내의 각각의 단일 올리고뉴클레오타이드 프로브에 대해서 각각 수행된다.
일부 실시형태에서, 노출시키는 단계는 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 온도에서 수행되고, 노출시키는 단계 및 측정하는 단계를 반복하는 단계는 제2 온도에서 제1 올리고뉴클레오타이드에 대해서 노출시키는 단계 및 측정하는 단계를 수행하는 것을 포함한다.
일부 실시형태에서, 노출시키는 단계는 상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 온도에서 수행된다. 노출시키는 단계 (c) 및 측정하는 단계를 반복하는 단계의 인스턴스는 복수의 상이한 온도 각각에서 제1 올리고뉴클레오타이드에 대해서 노출시키는 단계 및 측정하는 단계를 포함한다. 방법은 제1 온도 및 복수의 상이한 온도의 각각의 온도에 대해서 측정하는 단계에 의해서 기록된 광학 활성의 측정된 장소 및 지속기간을 사용하여 제1 올리고뉴클레오타이드 프로브에 대한 용융 곡선을 구축하는 것을 더 포함한다.
일부 실시형태에서, 시험 기질을 노출시키는 단계 및 측정하는 단계를 반복하기 전에 세척함으로써, 시험 기질을 올리고뉴클레오타이드 프로브의 또 다른 세트에 노출시키기 전에 시험 기질로부터 하나 이상의 각자의 올리고뉴클레오타이드 프로브를 제거한다. 선택적으로, 제1 프로브는 1회 이상의 세척 용액으로 대체되고, 이어서 다음 프로브 세트가 첨가된다.
일부 실시형태에서, 시험 기질 상의 장소를 측정하는 단계는 광학 활성의 각자의 인스턴스를 식별하고, 피팅 함수에 피팅시켜 상2차원 영상화기에 의해서 획득된 데이터의 프레임 내에서 광학 활성의 각자의 인스턴스의 중심을 식별 및 피팅시키는 단계를 포함한다. 광학 활성의 각자의 인스턴스의 중심은 시험 기질 상의 광학 활성의 각자의 인스턴스의 위치인 것으로 간주된다.
일부 실시형태에서, 피팅 함수는 가우시안 함수, 제1 적률 함수, 기울기 기반 접근법 또는 푸리에 변환이다. 가우시안 피트는 단지 현미경의 PSF의 근사치일 것이지만, 일부 실시형태에서 스플라인(예를 들어, 입방 스플라인) 또는 푸리에 변환 접근법의 추가는 PSF의 질량 중심을 결정하는 정확도를 향상시키는 역할을 한다(예를 들어, 문헌[Babcock et al., Sci Rep. 7:552, 2017 및 Zhang et al., 46:1819-1829, 2007]에 기재된 바와 같음).
데이터 처리 후, 단일 분자 국지화는 (예를 들어, 검출된 색상으로 인해) 세트 1 내지 5로부터의 프로브 중 어느 것이 폴리뉴클레오타이드 상에 동일한 국지화 풋프린트를 갖는지(예를 들어, 동일한 나노단위 장소에 결합함)를 식별한다. 일례에서, 나노단위 장소는 1㎚ 중심(+/- 0.5㎚)의 정밀도로 정의되고, 따라서 PSF의 중심이 동일한 1㎚ 내에 있는 모든 프로브가 함께 비닝(binning)될 것이다. 각각의 단일 정의된 올리고 종은 나노미터(또는 나노미터 미만) 중심에 정확한 국지화를 가능하게 하도록 수 회(예를 들어, 방출 및 수집된 광자 수에 따라) 결합해야 한다.
일부 실시형태에서, 나노단위 또는 서브-나노단위 국지화는 예를 들어 5'-AGTCG-3'의 올리고 서열에 대한 제1 염기가 A이고, 제2 염기가 G이고, 제3 염기가 T이고, 제4 염기가 C이고, 제5 염기가 T인지를 결정한다. 이러한 패턴은 5'-CGACT-3'의 표적 서열을 시사한다. 따라서, 모든 단일-염기 정의된 1024개의 5량체 올리고 프로브는 단 5회 주기로 적용 또는 시험되며, 여기서 각각의 주기는 올리고 첨가 및 세척 단계 둘 다를 포함한다. 이러한 실시형태서, 세트 내의 각각의 특정 올리고의 농도는 단독으로 사용될 때보다 낮다. 이 경우, 역치 수의 결합 사건에 도달하기 위해 더 긴 시간 동안 데이터 획득이 수행된다. 또한, 일부 실시형태에서 특정 올리고보다 더 높은 농도의 축퇴 올리고가 사용된다. 일부 실시형태에서, 이러한 암호 방식은 프로브의 직접적인 표지, 예를 들어 올리고의 3' 또는 5'에서 표지를 합성 또는 접합시킴으로써 수행된다. 그러나, 일부 대안적인 실시형태에서, 이는 간접 표지에 의해서(예를 들어, 플랩 서열을 각각의 표지된 올리고에 부착함으로써) 수행된다.
일부 실시형태에서, 각각의 올리고의 장소는 그 장소에 대한 다수의 사건에 대한 PSF를 결정함으로써 정확하게 정의되고, 오프셋 사건(및 이용 가능한 경우, 듀플렉스의 상보성 가닥으로부터의 데이터)으로부터의 부분 서열 중첩에 의해 확증된다. 이러한 실시형태는 프로브 결합의 하나 또는 1 나노미터까지의 단일 분자 국지화에 크게 의존한다.
일부 실시형태에서, 광학 활성의 각자의 인스턴스는 2차원 영상화기에 의해서 측정된 복수의 프레임에 걸쳐서 지속된다. 시험 기질 상의 장소를 측정하는 단계는 광학 활성의 각자의 인스턴스를 복수의 프레임에 걸쳐서 식별하고, 피팅 함수에 피팅시켜 복수의 프레임에 걸쳐서 광학 활성의 각자의 인스턴스의 중심을 식별하는 단계를 포함한다. 광학 활성의 각자의 인스턴스의 중심은 복수의 프레임에 걸쳐서 시험 기질 상의 광학 활성의 각자의 인스턴스의 위치인 것으로 간주된다. 일부 실시형태에서, 피팅 함수는 개별적으로 복수의 프레임에서 각각의 프레임 상의 중심을 찾는다. 다른 실시형태에서, 피팅 기능은 대안적으로 복수의 프레임에 걸쳐 각각의 프레임 상의 중심을 찾는다.
일부 실시형태에서, 피팅은, 국지화가 다음 프레임 내에서 (예를 들어, 픽셀의 절반 내에) 바로 인접하면, 그것을 함께 평균내고, 그들이 얼마나 밝은지에 의해서 가중시키는 트래킹 단계를 포함하고; 이것은 동일한 결합 사건임을 가정한다. 그러나, 다수의 프레임으로 분리된(예를 들어, 결합 사건 사이에 적어도 5 프레임 갭, 적어도 10 프레임 갭, 적어도 25 프레임 갭, 적어도 50 프레임 갭 또는 적어도 100 프레임 갭) 사건이 존재하는 경우, 피팅 함수는 구별되는 결합 사건이라고 가정한다. 고유한 결합 사례를 추적하면 서열 배정에 대한 신뢰도 증가를 돕는다.
일부 실시형태에서, 측정하는 단계는 광학 활성의 각자의 인스턴스의 중심을 적어도 20㎚의 국지화 정밀도로 시험 기질 상의 위치에 리졸빙한다. 일부 실시형태에서, 측정하는 단계는 광학 활성의 각자의 인스턴스의 중심을 적어도 2㎚, 적어도 60㎚, 적어도 6㎚의 국지화 정밀도로 시험 기질 상의 위치에 리졸빙한다. 일부 실시형태에서, 측정하는 단계는 광학 활성의 각자의 인스턴스의 중심을 적어도 2㎚ 내지 100㎚의 국지화 정밀도로 시험 기질 상의 위치에 리졸빙한다. 일부 실시형태에서, 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 상기 시험 기질 상의 위치에 리졸빙하는 것을 포함하되, 상기 위치는 부분 회절 제한된 위치이다. 일부 실시형태에서, 분해능은 정밀도보다 더 제한적이다.
일부 실시형태에서, 광학 활성의 각자의 인스턴스의 시험 기질 상의 장소 및 지속기간을 측정하는 단계는 상기 위치에서 5000개 초과의 광자를 측정한다. 일부 실시형태에서, 광학 활성의 각자의 인스턴스의 시험 기질 상의 장소 및 지속기간을 측정하는 단계는 그 위치에서 50,000개 초과의 광자 또는 그 위치에서 200,000개 초과의 광자를 측정하는 것을 포함한다.
각각의 염료는 광자를 생성시키는 최대 속도(예를 들어, 1K㎐ 내지 1M㎐)를 갖는다. 예를 들어, 일부 염료의 경우, 1초에 200,000개의 광도를 측정하는 것만 가능하다. 염료에 전형적인 수명은 10나노초이다. 일부 실시형태에서, 광학 활성의 각자의 인스턴스의 시험 기질 상의 장소 및 지속기간을 측정하는 단계는 그 위치에서 1,000,000개 초과의 광자를 측정한다.
일부 예에서, 특정 이상점 서열은 비-왓슨 크릭 방식으로 결합하거나, 짧은 모티프는 과도하게 높은 온-레이트 또는 낮은 오프-레이트로 이어진다. 예를 들어, RNA와 DNA 간의 일부 퓨린-폴리피리미딘 상호작용은 매우 강하다(예를 들어, RNA 모티프, 예컨대, AGG). 이들은 더 낮은 오프 레이트를 가질 뿐만 아니라, 보다 안정적인 핵화 서열로 인해서 더 높은 온 레이트를 갖는다. 일부 경우에, 결합은 특정 공지된 규칙에 필수적으로 일치하는 것은 아닌 이상점으로부터 일어난다. 일부 실시형태에서, 알고리즘을 사용하여 이러한 이상점을 식별하거나 이러한 이상점의 제외를 고려한다.
일부 실시형태에서, 광학 활성의 각자의 인스턴스는 시험 기질에 대해서 관찰된 배경에 대한 미리 결정된 표준 편차의 수보다 더 크다(예를 들어, 3, 4, 5, 6, 7, 8, 9, 또는 10보다 큰 표준 편차).
일부 실시형태에서, 노출시키는 단계는 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 시간 기간 동안 수행된다. 일부 이러한 실시형태에서, 노출시키는 단계 및 측정하는 단계를 반복하는 단계는 제2 올리고뉴클레오타이드에 대해서 제2 시간 기간 동안 노출시키는 단계를 수행하는 것을 포함한다. 제1 시간 기간은 제2 시간 기간보다 크다.
일부 실시형태에서, 노출시키는 단계 (c)는 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 2차원 영상화기의 제1 프레임 수 동안 수행된다. 일부 이러한 실시형태에서, 노출시키는 단계 및 측정하는 단계를 반복하는 단계는 제2 올리고뉴클레오타이드에 대해서 2차원 영상화기의 제2 프레임 수 동안 노출시키는 단계를 수행하는 것을 포함한다. 제1 프레임 수는 제2 프레임 수보다 크다.
일부 실시형태에서, 하나 이상의 타일링 세트 내의 상보성 프로브를 사용하여 변성된 듀플렉스의 가닥 각각에 결합한다. 도 11B에 도시된 바와 같이, 시험 기질 상의 복수의 위치 세트로부터 핵산의 적어도 일부의 서열을 결정하는 단계는 고정된 제1 가닥(1110)에 상응하는 제1 타일링 경로(1114) 및 고정된 제2 가닥(1112)에 상응하는 제2 타일링 경로(1116)를 결정하는 것을 포함하는 것이 가능하다.
일부 실시형태에서, 제1 타일링 경로 내의 브레이크는 제2 타일링 경로의 상응하는 부분을 사용하여 리졸빙된다. 일부 실시형태에서, 제1 타일링 경로 또는 제2 타일링 경로 내의 브레이크는 참조 서열을 사용하여 리졸빙된다. 일부 실시형태에서, 제1 타일링 경로 또는 제2 타일링 경로 내의 브레이크는 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 리졸빙된다.
일부 실시형태에서, 각각의 결합 부위에 대한 서열의 서열 배정의 신뢰도는 제1 타일링 경로 및 제2 타일링 경로의 상응하는 부분을 사용하여 증가된다. 일부 실시형태에서, 서열의 서열 배정의 신뢰도는 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 증가된다.
서열의 정렬 또는 조립.
블록 222. 핵산의 적어도 일부의 서열은 복수의 위치 세트에 의해서 표현된 시험 기질 상의 위치를 컴파일링함으로써 시험 기질 상의 복수의 위치 세트로부터 결정된다.
바람직하게는 인접한 서열은 신규(de novo) 조립을 통해서 획득된다. 그러나, 일부 실시형태에서 조립을 가능하게 하기 위해서 참조 서열이 또한 사용된다. 이것은 신규 조립이 구축되는 것을 허용한다. 완전한 게놈 서열결정이 게놈의 동일한 분절에 걸쳐 있는 다수의 분자 (이상적으로 동일한 모 염색체로부터 유래된 분자)로부터 정보의 합성을 필요로 하는 경우, 알고리즘은 다수의 분자로부터 획득된 정보를 처리할 필요가 있다. 하나의 알고리즘은 다수의 분자 사이에서 공통인 서열에 기초하여 분자를 정렬하고, 영역이 커버되는 공동-정렬된 분자로부터의 전가에 의해서 각각의 분자의 갭을 채우는 부류이다(예를 들어, 하나의 분자의 갭은 또 다른 공동-정렬된 분자에 의해서 커버됨).
일부 실시형태에서, 샷건 조립 방법(예를 들어, [Schuler et al., Science 274:540-546, 1996]에 기재된 바와 같음)은 본 명세서에 기재된 바와 같이 수득된 서열 배정을 사용하여 조립을 수행하도록 구성된다. 샷건 서열결정에 비해 본 발명의 방법의 장점은, 전장 무손상 표적 분자로부터 수집될 때 다수의 판독물이 사전 조립된다는 것이다(예를 들어, 서로에 대한 판독물의 장소가 이미 알려져 있고, 판독물 사이의 갭의 길이가 알려져 있음). 다양한 실시형태에서, 참조 게놈은 긴-범위 게놈 구조 또는 짧은-범위 폴리뉴클레오타이드 서열 중 하나 또는 둘 다의 조립을 용이하게 하기 위해서 사용된다. 일부 실시형태에서, 판독물은 부분적으로 신규로 조립되고, 이어서 참조물에 정렬되고, 이어서 참조-보조 조립체는 추가로 신규로 조립된다. 일부 실시형태에서, 게놈 어셈블리에 대한 일부 지침을 제공하기 위해 다양한 참조 어셈블리가 사용된다. 그러나, 전형적인 실시형태에서, 실제 분자로부터 얻은 정보(특히, 2개 이상의 분자에 의해 확증된 경우)는 참조 서열로부터의 임의의 정보보다 가중된다.
일부 실시형태에서, 서열 비트가 획득된 표적은 표적 사이의 서열 중첩의 분절에 기초하여 정렬되고, 더 긴 인 실리코(in silico) 콘티그 및 궁극적으로 전체 염색체의 서열이 생성된다.
일부 실시형태에서, 폴리뉴클레오타이드의 아이덴티티는 길이에 따른 프로브 결합 패턴에 의해 결정된다. 일부 실시형태에서, 아이덴티티는 RNA 종 또는 RNA 아이소폼의 아이덴티티이다. 일부 실시형태에서, 아이덴티티는 폴리뉴클레오타이드가 대응하는 참조물에서의 장소이다.
일부 실시형태에서, 국지화 정확성 또는 정밀도는 서열 비트를 함께 스티칭하기에 충분하지 않다. 일부 실시형태에서, 프로브의 하위세트는 특정 국지성 내에서 결합하는 것으로 밝혀지지만, 국지화 데이터로부터 엄격하게 이의 순서는 일부 실시형태에서 신뢰도 있게 결정하기 어렵다. 일부 실시형태에서, 분해능은 회절 제한된다. 일부 실시형태에서, 국지성 또는 회절 제한 스팟 내의 짧은-범위 서열은 국지성 또는 스팟 내에 위치하는 프로브의 서열 중첩에 의해 조립된다. 따라서, 짧은-범위 서열은 예를 들어, 올리고 하위세트의 개별 서열이 어떻게 중첩되는지에 대한 정보를 사용함으로써 조립된다. 일부 실시형태에서, 이러한 방식으로 구축된 짧은 범위 서열은 이어서 폴리뉴클레오타이드 상의 순서에 기초하여 긴-범위 서열로 함께 스티칭된다. 따라서, 장거리-서열은 인접하거나 중첩되는 스폿들로부터 획득된 단거리 서열을 연결함으로써 얻어진다.
일부 실시형태에서(예를 들어, 본질적으로 이중 가닥인 표적 폴리뉴클레오타이드의 경우), 상보성 가닥에 대해 획득된 참조 서열 및 서열 정보는 서열 배정을 용이하게 하기 위해 사용된다.
일부 실시형태에서, 핵산은 적어도 140개 염기 길이이고, 결정하는 단계는 70% 초과의 핵산 서열의 서열의 커버리지를 결정한다. 일부 실시형태에서, 핵산은 적어도 140개 염기 길이이고, 결정하는 단계는 90% 초과의 핵산 서열의 서열의 커버리지를 결정한다. 일부 실시형태에서, 핵산은 적어도 140개 염기 길이이고, 결정하는 단계는 99% 초과의 핵산 서열의 서열의 커버리지를 결정한다. 일부 실시형태에서, 결정하는 단계는 99% 초과의 핵산 서열의 서열의 커버리지를 결정한다.
비특이적 또는 미스매칭 결합 사건.
일반적으로, 서열결정은 표적 폴리뉴클레오타이드가 결합된 것에 상보적인 뉴클레오타이드를 함유한다고 가정한다. 그러나, 항상 그런 것은 아니다. 결합 미스매치 오류는 이 가정이 유지되지 않는 경우의 예이다. 그럼에도 불구하고, 알려진 규칙 또는 거동에 따라 발생할 때 미스매칭은 표적의 서열을 결정하는 데 유용하다. 짧은 올리고뉴클레오타이드(예를 들어, 5량체)의 사용은 단일 염기 미스매치의 효과가 안정성에 큰 영향을 미친다는 것을 의미하는데, 그 이유는 하나의 염기가 5량체 길이의 20%이기 때문이다. 따라서, 적절한 조건에서, 짧은 올리고 프로브에 의해서 절묘한 특이성을 얻을 수 있다. 그럼에도 불구하고, 미스매치가 발생할 수 있고, 분자 상호작용의 확률적 특성으로 인해서, 일부 경우에 결합 지속기간이 5개의 염기가 모두 특이적인 결합과 구별되지 않을 수 있다. 그러나, 염기(또는 서열) 콜링(calling) 및 조립을 수행하는 데 사용되는 알고리즘은 종종 미스매치 존재를 고려한다. 많은 유형의 미스매치가 예측 가능하며, 특정 규칙을 준수한다. 이러한 규칙 중 일부는 이론적 고려사항에 의해 도출되는 반면, 다른 규칙은 실험적으로 도출된다(예를 들어, 문헌[Maskos and Southern, Nucleic Acids Res 21(20): 4663-4669, 2013; Williams et al., Nucleic Acids Res 22:1365-1367, 1994]에 기재된 바와 같음).
표면에 대한 비특이적 결합의 효과는 비특이적 부위에 대한 프로브 결합의 비-지속성에 의해 완화되지 않고, 일단 하나의 영상화기가 비특이적(예를 들어, 상보성 표적 서열이 아닌) 결합 부위를 점유하면, 표백될 수 있지만 일부 경우에 제자리에 유지되어, 그 위치에 대한 추가 결합을 차단한다(예를 들어, G-Quetet 형성으로 인한 상호작용). 전형적으로, 표적 폴리뉴클레오타이드에 대한 영상화기 결합의 분해능을 방지하는 대부분의 비특이적 결합 부위는 영상화의 초기 단계에서 점유되고 표백되어, 폴리뉴클레오타이드 부위에 영상화기의 대한 온/오프 결합을 유지시켜 그 후 쉽게 관찰된다. 따라서, 일 실시형태에서, 초기에 비특이적 결합 부위를 차지하는 프로브를 표백하기 위해 높은 레이저 전력이 사용되고, 선택적으로 이 단계 동안 영상이 촬영되지 않고, 이어서 레이저 전력이 선택적으로 감소되고, 폴리뉴클레오타이드에 결합에 대한 온-오프 결합을 캡처하기 위해서 영상화가 시작된다. 초기 비특이적 결합 후, 추가의 비특이적 결합은 덜 빈번하고(표백된 프로브가 종종 비특이적 결합 부위에 붙어있기 때문에), 일부 실시형태에서, 예를 들어, 역치를 적용함으로써 계산적으로 필터링되며, 예를 들어, 도킹 부위에 대한 특이적 결합으로서 간주되기 위해서, 동일한 장소에 대한 결합이 영구적이어야 하고, 예를 들어, 동일한 부위에서 적어도 5회, 보다 바람직하게는 적어도 10회 발생해야 한다. 전형적으로, 도킹 부위에 대한 약 20개의 특정 결합 사건이 검출된다.
비특이적인 결합을 필터링하기 위한 또 다른 수단은 형광단 신호가 표면에 신장된 표적 분자의 선형 가닥의 위치와 상관되어야 한다는 것이다. 일부 실시형태에서, 선형 가닥을 직접 염색하거나 또는 지속적인 결합 부위를 통해 선을 보간함으로써 선형 가닥의 위치를 결정할 수 있다. 일반적으로, 선을 따르지 않는 신호는 지속성이든 아니든 일부 실시형태에서 폐기된다. 유사하게, 초분자 격자가 사용되는 경우, 공지된 격자 구조와 상관관계가 없는 결합 사건이 일부 실시형태에서 폐기된다.
다중 결합 사건은 또한 특이성을 증가시킨다. 예를 들어, 단일 "콜" 상에서 검출될 모이어티 또는 서열의 아이덴티티를 확립하기보다는, 다수의 콜로부터 컨센서스(consensus)가 획득된다. 또한, 표적 모이어티 또는 서열에 대한 다중 결합 사건은 실제 장소에 대한 결합이 비특이적 결합 사건과 구별될 수 있게 하는데, 여기서 (역치 지속기간의) 결합은 동일한 위치에서 여러 번 일어날 가능성이 낮다. 또한, 시간에 따른 다중 결합 사건의 측정은 표면에 대한 비특이적 결합 사건의 축적이 표백될 수 있게 하고, 그 후 비특이적 결합은 다시 거의 검출되지 않는다. 그 이유는 비특이적 결합으로부터의 신호가 표백되더라도, 비특이적 결합 부위는 점유되거나 차단되어 있기 때문일 가능성이 있다.
일부 실시형태에서, 서열결정은 폴리뉴클레오타이드 상의 미스매치 및 비특이적 결합에 의해 복잡해진다. 비특이적 결합 또는 이상치 사건의 효과를 회피하기 위해서, 일부 실시형태에서, 방법은 그의 장소 및 지속성에 기초하여 신호를 우선 순위화한다. 장소로 인한 우선 순위는, 프로브가 격자 구조 내의 장소를 포함하여, 예를 들어 신장된 중합체 또는 초분자 격자(예를 들어, DNA 오리가미 그리드) 상에 공동-국지화되는지의 여부에 따라서 예측된다. 결합 지속성으로 인한 우선 순위는 결합 지속기간 및 결합 빈도와 관련이 있고, 우선 순위 목록을 사용하여 부분 매치 또는 비특이적 결합의 완전 매치 가능성을 결정한다. 패널 또는 레퍼토리에서 각각의 결합 프로브에 대해 확립된 우선 순위를 사용하여 신호의 정확성을 결정한다.
일부 실시형태에서, 우선 순위는 신호 지속기간이 미리 정의된 역치보다 큰지의 여부, 신호 반복 또는 빈도가 미리 결정된 역치보다 큰지의 여부, 신호가 표적 분자의 장소와 상관되는지의 여부 및/또는 수집된 광자의 수가 미리 정의된 역치보다 큰지의 여부를 결정함으로써 신호 검증 및 염기 콜링을 용이하게 하는 데 사용된다. 일부 실시형태에서, 이들 결정 중 임의의 것에 대한 대답이 참인 경우, 신호는 실제(예를 들어, 미스매치 또는 비특이적 결합 사건이 아님)로 받아 들여진다.
일부 실시형태에서, 미스 매치는 그들의 시간적 결합 패턴에 의해 구별되므로 서열 정보의 2차 층으로 간주된다. 이러한 실시형태에서, 결합 신호가 그의 시간적 결합 특성으로 인해서 미스매치인 것으로 판단되는 경우, 서열 비트는 추정 미스매치 염기를 제거하기 위해 생체정보학적으로 트리밍(trimming)되고, 나머지 서열 비트는 서열 재구성에 추가된다. 혼성화 올리고의 단부에서 미스매치가 발생할 가능성이 가장 높기 때문에, 시간적 결합 특성에 따라, 일부 실시형태에서 하나 이상의 염기가 단부로부터 트리밍된다. 일부 실시형태에서, 어느 염기가 트리밍되는지에 대한 결정은 동일한 서열 공간에 대한 다른 올리고 타일링으로부터의 정보에 의해 통지된다.
일부 실시형태에서, 가역적인 것으로 보이지 않는 신호는 비특이적 신호에 상응할 기회 또는 가능성의 정도를 갖기 때문에(예를 들어, 표면에 형광 오염 물질의 부착으로 인해) 가중된다.
블록 302 내지 304. 핵산을 시험 기질 상에 선형의 신장된 형태로 고정시킴으로써 고정되고 신장된 핵산을 형성하는 단계를 포함하는 핵산의 또 다른 서열결정 방법이 제공된다. 핵산은 상기에 기재된 방법 중 임의의 하나에 따라서 기질에 고정된다.
표면 상에서의 단일 세포의 단리 및 DNA 및 RNA 둘 다의 추출.
RNA 및 DNA 중 하나 또는 둘 다는 단일 세포로부터 단리되고, 서열결정될 수 있다. 일부 실시형태에서, 목표가 DNA를 서열결정하는 것인 경우, 서열결정이 시작되기 전에 RNAse를 샘플에 적용한다. 일부 실시형태에서, 목적이 RNA를 서열결정하는 것인 경우, 서열결정이 시작되기 전에 DNAse를 샘플에 적용한다. 일부 실시형태에서, 세포질 핵산 및 핵 핵산 둘 다가 분석될 경우, 이들은 차등적으로 또는 순차적으로 추출된다. 일부 실시형태에서, 먼저 세포막(및 핵막이 아님)을 파괴시켜 세포질 핵산을 방출시키고, 수집한다. 이어서, 핵 막을 파괴시켜 핵 핵산을 방출시킨다. 일부 실시형태에서, 단백질 및 폴리펩타이드는 세포질 분획의 일부로서 수집된다. 일부 실시형태에서, RNA는 세포질 분획의 일부로서 수집된다. 일부 실시형태에서, DNA는 핵 분획의 일부로서 수집된다. 일부 실시형태에서, 세포질 분획 및 핵 분획은 함께 추출된다. 일부 실시형태에서, 추출 후 mRNA 및 게놈 DNA는 별도로 포획된다. 예를 들어, mRNA는 표면에 부착된 올리고 dT 프로브에 의해서 포획된다. 이것은 플로우 셀의 제1 부분에서 발생할 수 있고, DNA의 단부가 포획될 수 있는 소수성 바이닐실란 코팅을 갖는 플로우 셀의 제2 부분에서 DNA가 포획된다(예를 들어, 아마도 소수성 상호작용으로 인해서).
양전하를 갖는 표면, 예컨대, 폴리(L) 라이신(PLL)(예를 들어, 마이크로서페이시즈사(Microsurfaces Inc.)로부터 입수 가능하거나 인하우스 코팅됨)은 세포막에 결합할 수 있는 것으로 공지되어 있다. 일부 실시형태에서, 세포가 표면과 충돌할 기회가 증가되도록 낮은 높이의 유동 채널(예를 들어, 30마이크론 미만)이 사용된다. 일부 실시형태에서, 난류를 도입하기 위해 플로우 셀 천장에 헤링본 패턴을 사용함으로써 충돌 횟수가 증가된다. 일부 실시형태에서, 이러한 실시형태에서 (예를 들어, 각각의 개별 세포로부터 추출된 RNA 및 DNA가 공간적으로 분리되어 유지될 것이도록 세포 사이에서 충분한 공간을 보장하기 위해서) 세포가 표면 상에 저밀도로 분산되는 것이 바람직하기 때문에, 세포 부착은 효율적일 필요는 없다. 일부 실시형태에서, (예를 들어, 세포 내용물이 배지로 방출되고 단리된 세포 부근의 표면에서 포획되도록) 세포는 프로테아제 처리를 사용하여 파열되어 세포 및 핵 막 둘 다가 파괴된다. 일단 부동화되면, 일부 실시형태에서 DNA 및 RNA가 신장된다. 일부 실시형태에서, 신장 완충제는 커버글라스 표면을 가로질러 단방향으로 유동된다(예를 들어, DNA 및 RNA 폴리뉴클레오타이드가 유체 유동 방향으로 신장 및 정렬되게 한다). 일부 실시형태에서, 조건(예를 들어, 예컨대, 온도, 신장 완충제의 조성 및 유동의 물리적 힘)의 조절은 RNA가 항체에 결합하기 위해 이용 가능하도록 대부분의 RNA 이차/삼차 구조를 변성시킨다. RNA가 신장되면, 변성된 형태로, 변성 완충제에서 결합 완충제로 전환할 수 있다.
대안적으로, 세포막을 파괴시키고, 유동을 단방향으로 유도함으로써 RNA를 추출 및 부동화시킨다. 다음으로 프로테아제를 사용하여 핵막을 파괴하고, 반대 방향으로 유동을 유도한다. 일부 실시형태에서, DNA는 예를 들어, 희귀-절단 제한 효소(예를 들어, NOT1, PMME1)를 사용함으로써 방출 전 또는 후에 단편화된다. 이 단편화는 DNA의 풀어짐을 돕고, 개별 가닥이 단리되고 코밍되도록 한다. 부동화된 세포가, 각각의 세포로부터 추출된 RNA 및 DNA가 함께 섞이지 않도록 충분히 멀리 떨어져 있도록 시스템이 설정되는 것이 보장된다. 일부 실시형태에서, 이는 세포의 파열 전, 파열 후 또는 파열 동안 액체 대 겔 전이를 유도함으로써 도움이 된다.
일부 실시형태에서, 핵산은 이중 가닥 핵산이다. 이러한 실시형태에서, 방법은 고정된 이중 가닥 핵산을 시험 기질 상에서 단일 가닥 형태로 변성시키는 단계를 추가로 포함한다. 서열결정을 진행하기 위해서 핵산은 단일 가닥 형태여야 한다. 일단 고정된 이중 가닥 핵산이 변성되면, 핵산의 고정된 제1 가닥 및 고정된 제2 가닥이 획득된다. 고정된 제2 가닥은 고정된 제1 가닥에 상보성이다.
일부 실시형태에서, 핵산은 단일 가닥(예를 들어, mRNA, lncRNA, 마이크로RNA)이다. 핵산이 단일 가닥 RNA인 일부 실시형태에서, 서열결정 방법이 진행되기 전에 변성이 필요하지 않다.
일부 실시형태에서, 샘플은 인접한 네이티브 상보성 가닥이 없는 단일 가닥 폴리뉴클레오타이드를 포함한다. 폴리뉴클레오타이드를 따라 레퍼토리의 각각의 올리고에 대한 결합 장소가 컴파일링되는 일부 실시형태에서, 서열은 위치에 따라 모든 서열 비트를 집계하고, 함께 스티칭함으로써 재구성된다.
RNA의 신장.
하전된 표면 상에서 핵산의 신장은 용액 양이온 농도에 의해 영향을 받는다. 낮은 염 농도에서, 단일 가닥이고 골격을 따라 음전하를 갖는 RNA는 길이를 따라 무작위로 표면에 결합한다.
RNA를 선형 형태로 변성 및 신장시키는 다수의 가능한 방법이 있다. 일부 실시형태에서, RNA는 초기에 (예를 들어, 높은 염 농도를 사용함으로써) 구형 형태가 되도록 권장된다. 일부 이러한 실시형태에서, 각각의 RNA 분자의 단부(예를 들어, 폴리A 테일)는 상호작용에 보다 접근 가능해진다. 일단 RNA가 구형 형태로 결합되면, 일부 실시형태에서 상이한 완충제(예를 들어, 변성 완충제)가 플로우 셀에 적용된다.
대안적인 실시형태에서, mRNA의 폴리A 테일을 포획하기 위해서 올리고 d(T)로 표면을 사전 코팅한다(예를 들어, 문헌[Ozsolak et al., Cell 143:1018-1029, 2010]에 기재된 바와 같음). 폴리A 테일은 전형적으로 (예를 들어, 그들이 동종중합체이기 때문에) 2차 구조가 비교적 없어야 하는 영역이다. 폴리A 테일은 고등 진핵 생물에서 비교적 길기(250 내지 3000개 뉴클레오타이드) 때문에, 일부 실시형태에서, 긴 올리고 d(T) 포획 프로브는 RNA에서 분자내 염기쌍 중 상당한 분획을 용융시키기에 충분한, 비교적 높은 엄격성(예를 들어, 고온 및/또는 염 조건)에서 혼성화가 수행되도록 설계된다. 결합 후, 일부 실시형태에서, RNA 구조의 나머지를 구형에서 선형 상태로 전이시키는 것은 포획을 폐지하기에는 충분하지 않지만 RNA에서 분자내 염기 짝지움을 방해하는 변성 조건을 사용함으로써 그리고 유체 흐름 또는 전기 영동에 의해 수행된다.
블록 310. 일부 실시형태에서, 고정되고 신장된 핵산은 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출된다. 각각의 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖되, 노출시키는 단계는 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 핵산의 각각의 일부에 일시적이고 그리고 가역적으로 결합함으로써 광학 활성의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어난다.
블록 312. 일부 실시형태에서, 2차원 영상화기를 사용하여 노출시키는 단계 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 시험 기질 상의 장소 및 지속기간을 측정한다.
블록 314. 일부 실시형태에서, 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 노출시키는 단계 및 측정하는 단계를 반복함으로써, 기질 상에 복수의 위치 세트를 획득하며, 시험 기질 상의 각각의 각자의 위치 세트는 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응한다.
블록 316. 일부 실시형태에서, 핵산의 적어도 일부의 서열은 복수의 위치 세트에 의해서 표현된 시험 기질 상의 위치를 컴파일링함으로써 시험 기질 상의 복수의 위치 세트로부터 결정된다.
RNA 서열결정.
RNA의 길이는 전형적으로 게놈 DNA보다 짧지만, 현재 기술을 사용하여 하나의 단부에서 다른 단부까지 RNA를 서열결정하는 것은 어렵다. 그럼에도 불구하고, 대안적인 스플라이싱 때문에 mRNA의 전체 서열 구성을 결정하는 것이 매우 중요하다. 일부 실시형태에서, mRNA는 부동화된 올리고 d(T)에 의한 폴리A 테일의 결합에 의해 포획되고, 이의 2차 구조는, 그것이 표면 상에서 연장되도록 하는 적용된 신장력(예를 들어, 400pN 초과) 및 변성 조건(예를 들어, 폼아마이드 및/또는 7M 또는 8M 유레아)에 의해 제거된다. 이어서, 이는 결합 시약(예를 들어, 엑손-특이적)이 일시적으로 결합될 수 있게 한다. RNA의 짧은 길이로 인해, 엑손을 리졸빙하고, 분화시키기 위해서 본 개시내용에 기재된 단일 분자 국지화 방법을 사용하는 것이 유리하다. 일부 실시형태에서, RNA에 걸쳐 산란된 단지 몇몇 결합 사건이 특정 mRNA 아이소폼 대한 mRNA에서 엑손의 순서 및 아이덴티티를 결정하기에 충분하다.
이중-가닥 컨센서스
샘플 분자로부터 서열 정보를 얻는 방법은 다음과 같다:
i) 제1 올리고에 제1 색상 표지를 제공한다. 제2 올리고에 제2 색상 표지를 제공하되, 제2 올리고는 제1 올리고에 서열에서 상보성이다.
ii) 이중 가닥 핵산 분자를 기질 상에 연장, 고정 및 변성시킨다.
iii) 제1 올리고 및 제2 올리고를 ii의 변성된 핵산에 노출시킨다.
iv) 제1 올리고 및 제2 올리고의 결합 장소를 결정한다.
v) 결합의 위치가 공동 국지화된 경우, 그 장소는 올바른 것으로 간주된다.
v) 연장된 핵산을 따라서 다수의 장소가 결합된다.
일부 실시형태에서, 올리고는 일시적으로 그리고 가역적으로 결합한다. 일부 실시형태에서, 제1 올리고 및 제2 올리고는 주어진 길이의 제1 올리고 및 제2 올리고의 경쟁 레퍼토리의 부분이고, 단계 ii 내지 단계 iii은 레퍼토리의 각각의 제1 올리고 및 제2 올리고 쌍에 대해 반복되어 전체 핵산을 서열결정한다.
일부 실시형태에서, 2개의 색상이 그들이 필요할 때 광학적으로 공동 국지화되는 것을 보장하기 위해서 다수의 보정이 이루어질 필요가 있다. 이것은 색수차(chromic aberration)에 대한 보정을 포함한다. 이러한 일부 실시형태에서, 쌍의 2 개의 올리고는 함께 첨가되지만 이들이 서로 어닐링되는 것을 방지하여 이들의 작용이 중화되기 위해서, 변형된 올리고뉴클레오타이드 화학은 비-자가-짝지움 유사체 염기와 함께 사용되는데, 여기서 변형된 G는 상보성 올리고뉴클레오타이드 내의 변형된 C와 짝을 이룰 수 없지만, 표적 핵산 상의 변형되지 않은 C와 짝을 이룰 수 있고, 변형된 A는 상보성 올리고뉴클레오타이드 내의 변형된 T와 짝을 이룰 수 없지만, 변형된 T와 짝을 이룰 수 있고, 그 등등이다. 따라서 이러한 실시형태에서 제1 올리고 및 제2 올리고는 제1 올리고가 제2 올리고와 염기 쌍을 형성할 수 없도록 변형된다.
일부 실시형태에서, 제1 올리고 및 제2 올리고는 함께 첨가되지 않지만 하나는 다른 것 이후에 첨가된다.
하나의 올리고가 다른 것 이후에 첨가되는 이러한 실시형태에서, 세척 단계는 그 사이에 수행되는데; 이 경우 상보적 쌍의 두 올리고는 동일한 색상으로 표시되고, 색수차를 보정할 필요가 없다. 또한, 2개의 올리고는 서로 결합할 가능성이 없다.
일부 실시형태에서, 올리고의 전체 레퍼토리가 소진될 때까지 핵산을 추가의 제1 올리고 및 제2 올리고에 노출시킨다.
일부 실시형태에서, 레퍼토리의 다른 올리고 쌍이 첨가되기 전에, 제2 올리고는 제1 올리고 이후 다음 올리고로서 첨가된다. 일부 실시형태에서, 제2 올리고는 레퍼토리의 다른 올리고 쌍이 첨가되기 전에 다음 올리고로서 첨가되지 않는다.
이러한 실시형태의 예는 하기와 같이 샘플로부터 서열 정보를 획득하는 방법을 포함한다:
i) 이중 가닥 핵산 분자를 기질 상에 연장, 고정 및 변성시킨다.
ii) 제1 표지된 올리고를 i)의 변성된 핵산에 노출시키고, 결합 장소를 검출 및 기록한다.
iii) 제1 표지된 올리고를 세척에 의해서 제거한다.
iv) 제2 표지된 올리고를 i)의 변성된 핵산에 노출시키고, 결합 장소를 검출 및 기록한다.
v) 선택적으로 ii) 및 iv)에서의 기록 사이의 드리프트(drift)를 위해서 보정한다.
vi) ii 내지 iv에서 획득된 기록된 결합 위치가 공동 국지화되는 경우, 그 장소의 서열에 대해서 이렇게 획득된 서열 정보는 올바른 것으로 간주된다.
일부 실시형태에서, 제1 올리고 및 제2 올리고는 주어진 길이의 제1 올리고 및 제2 올리고의 경쟁 레퍼토리의 부분이고, 단계 ii 내지 단계 iii은 레퍼토리의 각각의 제1 올리고 및 제2 올리고 쌍에 대해 반복되어 전체 핵산을 서열결정한다.
공동-국지화는 동일한 서열 유전자좌를 보고 있음을 알려준다. 또한, 센스 가닥을 표적화하는 프로브는 4개의 차별적으로 표지된 올리고를 사용하여 중심 염기를 구별하는 것으로 보일 수 있고, 안티센스 가닥을 표적화하는 프로브는 센스를 위해 프로브에 상보적인 서열을 갖는 4 개의 차별적으로 표지된 올리고를 사용하여 중심 염기를 구별하는 것으로 보일 수 있다. 중심 위치에 대한 검증된 염기 콜을 획득하기 위해서, 센스 가닥에 대한 데이터가 제2 가닥에 대한 데이터를 확증해야 한다. 중심 A 염기를 갖는 올리고가 센스 가닥에 결합하는 경우, 중심 T 염기를 갖는 올리고는 안티센스 가닥에 결합해야 한다.
센스 가닥 및 안티센스 가닥에 대한 이러한 확증 또는 컨센서스를 획득하는 것은 또한 G:T 또는 G:U 워블 염기 짝지움으로 인한 결합으로 인한 모호함을 극복하는데 도움이 된다. 이것이 센스 가닥에서 일어나는 경우, C:A가 염기쌍을 형성할 가능성이 낮기 때문에 안티센스 가닥 상의 신호를 산출하지 않을 것이다.
일부 실시형태에서, 워블 베이스-쌍의 형성을 방지하기 위해 변형된 G 염기 또는 T/U가 프로브에 사용될 수 있다. 일부 다른 실시형태에서, 재구성 알고리즘은 특히 C:G 염기쌍과의 확증이 상보성 가닥 상에서 부재하고, 그 장소가 A:T 염기쌍을 형성하는 상보성 가닥에 대한 올리고 결합과 상관관계가 있을 때, 워블 염기쌍의 형성 가능성을 고려한다. 일부 실시형태에서, 3이 아닌 단지 2 개의 수소 결합을 형성하는 능력을 갖는 7-데아자구아니신은, 그것이 형성하는 염기쌍의 안정성 및 G-쿼드라플렉스(quadraplex)의 발생 및 그의(그리고 그로 인한) 무차별 결합을 감소시키기 위해서 G 변형으로서 사용된다.
동시 듀플렉스 컨센서스 조립.
일부 실시형태에서, 이중 나선의 두 가닥이 모두 존재하고, 인접한 상태에서 상기에 기재된 바와 같이 올리고뉴클레오타이드에 노출된다. 일부 실시형태에서, 검출된 일시적인 광학 신호로부터, 각자의 올리고뉴클레오타이드 세트 내의 각각의 올리고가 2 개의 상보성 가닥 중 어느 것이 결합되었는지를 구별하는 것은 가능하지 않다. 예를 들어, 폴리뉴클레오타이드를 따르는 각자의 올리고뉴클레오타이드 세트의 올리고 각각을 대한 각각의 폴리뉴클레오타이드를 따르는 결합 장소가 컴파일링되는 경우, 상이한 서열의 2개의 프로브가 동일한 장소에 결합된 것처럼 보일 수 있다. 이들 올리고는 서열에서 상보적이어야 하고, 이어서 2개의 올리고 각각 중 어느 가닥에 결합하는지를 결정하는 것이 어려워지는데, 이는 폴리뉴클레오타이드에 대한 서열을 정확하게 컴파일링하기 위한 전제 조건이다.
단일 결합 사건이 하나 또는 나머지 가닥에 대한 것인지를 결정하기 위해서, 획득된 광학 활성 데이터의 완전한 세트가 고려되어야 한다. 예를 들어, 2개의 타일링 시리즈의 올리고가 해당 국지성을 커버하는 경우, 2개의 타일링 시리즈 중 어느 것이 속하는지는 신호를 생성시키는 올리고 서열이 어느 시리즈와 중첩되는지에 기초하여 배정될 것이다. 일부 실시형태에서, 이어서 서열은 2개의 타일링 시리즈 각각을 구성하기 위해서 먼저 결합 장소 및 서열 중첩을 사용함으로써 재구성된다. 그런 다음, 2개의 타일링 시리즈는 역 상보체로 정렬되고, 2개의 가닥이 그 위치 각각에서 완벽한 역 상보체인 경우에만(예를 들어, 따라서 이중 컨센서스 서열을 제공함) 각각의 위치에서의 염기 배정이 허용된다.
일부 실시형태에서, 서열결정 미스매치는 모호한 염기 콜인 것으로 플래그 지정되는데, 여기서 두 가능성 중 하나는 독립적인 미스매치 결합 사건으로부터의 것과 같은 추가 정보 층에 의해 확증될 필요가 있다. 일부 실시형태에서, 듀플렉스 컨센서스가 획득되면, 종래의(다분자) 컨센서스는 게놈의 동일한 영역을 커버하는 다른 폴리뉴클레오타이드로부터의 데이터를 비교함으로써 결정된다(예를 들어, 다중 세포로부터의 결합 부위 정보가 이용 가능한 경우). 이러한 접근법의 한 가지 문제점은 일배체형 서열을 함유하는 폴리뉴클레오타이드의 가능성이다.
대안적으로, 일부 실시형태에서, 개별 가닥 컨센서스의 듀플레스 컨센서스가 획득되기 전에 개별 가닥 컨센서스가 획득된다. 이러한 실시형태에서, 듀플렉스의 가닥 각각의 서열은 동시에 획득된다. 이는 일부 실시형태에서 현재의 NGS 방법(예를 들어, 문헌[Salk et al., Proc. Natl. Acad. Sci. 109(36), 2012]에 기재된 바와 같음)과 달리 분자 바코드로 듀플렉스의 2개의 가닥을 차별적으로 태그하는 것과 같은 추가적인 샘플 준비 단계를 요구하지 않고 수행된다.
센스 및 안티센스 가닥 둘 다의 동시 서열 획득은 나노기공에 이용 가능한 2D 또는 1D2 컨센서스 서열결정과 유리하게 비교된다. 이들 대안적인 방법은 제2 가닥의 서열이 획득되기 전에 듀플렉스의 하나의 가닥에 대해 서열이 얻어질 것을 요구한다. 일부 실시형태에서, 듀플렉스 컨센서스 서열결정은 예를 들어, 106 범위, 예를 들어, 백 만 개의 염기에서 하나의 오류(다른 NGS 접근법의 102 내지 103 원시 정확도에 비해서)의 정확도를 제공한다. 이는 이 방법이 암 병태(예를 들어, 무-세포 DNA에 존재하는 것 등)를 나타내거나 종양 세포 집단에서 낮은 빈도로 존재하는 희귀 변이체를 리졸빙할 필요성에 매우 적합하게 한다.
단일-세포 리졸빙된 서열결정.
다양한 실시형태에서, 방법은 단일 세포의 게놈을 서열결정하는 단계를 추가로 포함한다. 일부 실시형태에서, 단일 세포는 다른 세포로부터의 부착이 없다. 일부 실시형태에서, 단일 세포는 클러스터 또는 조직 내에서 다른 세포에 부착된다. 일부 실시형태에서, 이러한 세포는 개별 비-부착 세포로 분해된다.
일부 실시형태에서, 세포는 폴리뉴클레오타이드가 연장되는 구조(예를 들어, 플로우 셀 또는 마이크로 웰)의 유입구로 유동적으로 전달되기 전에 (예를 들어, 피펫을 사용하여) 분해된다. 일부 실시형태에서, 분해는 프로테아제, 초음파처리 또는 물리적 교반을 적용함으로써 세포를 피펫팅함으로써 수행된다. 일부 실시형태에서, 세포는 이들이 연장된 구조 내로 유동적으로 전달된 후에 분해된다.
일부 실시형태에서, 단일 세포는 단리되고, 폴리뉴클레오타이드는 단일 세포로부터 방출되어, 동일한 세포로부터 기원하는 모든 폴리뉴클레오타이드는 서로 가까이 그리고 다른 세포의 내용물이 배치된 장소와 구별되는 위치에 배치되어 유지된다. 일부 실시형태에서, 트랩 구조는 문헌[Di Carlo et al., Lab Chip 6:1445-1449, 2006]에 기재된 바와 같다.
일부 실시형태에서, 다수의 단일 세포를 포획 및 단리시키는 마이크로유체 구조물(예를 들어, 트랩이 분리된 경우, 예를 들어, 도 16A 및 도 16B에 도시된 바와 같음) 또는 다수의 비-단리된 세포(예를 들어, 트랩이 연속적인 경우)를 포획하는 구조물을 사용하는 것이 가능하다. 일부 실시형태에서, 트랩은 단일 세포의 치수(예를 들어, 2μM 내지 10μM)이다. 일부 실시형태에서, 플로우 셀의 길이는 수 백 마이크론 내지 밀리미터이고, 깊이는 약 30마이크론이다.
일부 실시형태에서, 예를 들어, 도 17에 도시된 바와 같이, 단일 세포는 전달 채널(1702)로 유동되고, 트래핑되고(1704), 뉴클레오타이드가 방출된 다음 신장된다. 일부 실시형태에서, 세포(1602)는 용해되고(1706), 이어서 세포 핵은 제2 용해 단계(1708)를 통해 용해되어, 세포외 및 세포내 폴리뉴클레오타이드(1608)를 순차적으로 방출시킨다. 선택적으로, 여분의 핵 및 핵내 폴리뉴클레오타이드 둘 다는 단일 용해 단계를 사용하여 방출된다. 방출 후, 폴리뉴클레오타이드(1608)는 플로우 셀(2004)의 길이를 따라 부동화되고 연장된다. 일부 실시형태에서, 트랩은 단일 세포의 치수(예를 들어, 폭 2μM 내지 10μM)이다. 일 실시형태에서, 트랩 치수는 바닥에서 4.3μM의 폭, 중간 깊이에서 6㎛ 및 33㎛의 깊이를 갖는 상부에서 8㎛이며, 장치는 사출 성형을 사용하여 환식 올레핀(cyclic olefin: COC)으로부터 제조된다.
일부 실시형태에서, 단일 세포는 개별 채널로 용해되고, 폴리뉴클레오타이드가 동일한 혼합물로 조합되고 서열결정되기 전에, 각각의 개별 세포는 트랜스포사제 매개된 통합을 통해 고유한 태그 서열과 반응된다. 일부 실시형태에서, 트랜스포사제 복합체는 세포에 형질주입되거나, 또는 세포를 함유하는 소적에 합쳐진 소적에 존재한다.
일부 실시형태에서, 응집체는 작은 세포 클러스터이고, 일부 실시형태에서, 전체 클러스터에는 동일한 서열결정 태그가 태깅되어 있다. 일부 실시형태에서, 세포는 응집되지 않으며, 순환 종양 세포(circulating tumor cell: CTC) 또는 순환 태아 세포와 같은 자유 부유 세포이다.
단일 세포 서열결정에서, 세포 용해 후 자발적 사이토신 탈아미노화에 의해 야기된 사이토신-티민 단일 뉴클레오타이드 변이체의 문제가 존재한다. 이는 서열결정 전에 우라실 N-글리코실라제(uracil N-glycosylase: UNG)로 샘플을 전처리함으로써 극복된다(예를 들어, 문헌[Chen et al., Mol Diagn Ther. 18(5): 587-593, 2014]에 기재된 바와 같음).
일배체형의 식별.
다양한 실시형태에서, 상기에 기재된 방법은 일배체형을 서열결정하기 위해서 사용된다. 일배체형의 서열결정은 본 명세서에 기재된 방법을 사용하여 이배체 게놈의 일배체형에 걸친 제1 표적 폴리뉴클레오타이드를 서열결정하는 단계를 포함한다. 이배체 게놈의 제2 일배체형 영역에 걸쳐 있는 제2 표적 폴리뉴클레오타이드도 서열결정되어야 한다. 제1 표적 폴리뉴클레오타이드 및 제2 표적 폴리뉴클레오타이드는 상동 염색체의 상이한 카피로부터 유래될 것이다. 제1 표적 폴리뉴클레오타이드 및 제2 표적 폴리뉴클레오타이드의 서열을 비교함으로써, 제1 표적 폴리뉴클레오타이드 및 제2 표적 폴리뉴클레오타이드 상의 일배체형을 결정한다.
따라서, 실시형태로부터 획득된 단일 분자 판독물 및 조립물은 일배체형-특이적인 것으로 분류된다. 일배체형-특이적인 정보가 긴 범위에 걸쳐 쉽게 얻어질 필요가 없는 유일한 경우는 조립이 간헐적인 경우이다. 이러한 실시형태에서, 그럼에도 불구하고 판독물의 장소는 제공된다. 이러한 상황에서도, 게놈의 동일한 분절을 커버하는 다수의 폴리뉴클레오타이드가 분석되면, 일배체형이 계산에 의해서 결정된다.
일부 실시형태에서, 상동성 분자는 일배체형 또는 모 염색체 특이성에 따라 분리된다. 본 발명의 방법에 의해 획득된 정보의 시각적 특성은 특정 일배체형을 실제로 물리적으로 또는 시각적으로 나타낼 수 있다. 일부 실시형태에서, 일배체형의 분해능은 개선된 유전자 또는 조상 연구가 수행될 수 있게 한다. 다른 실시형태에서, 일배체형의 분해능은 더 양호한 조직 타이핑이 수행될 수 있게 한다. 일부 실시형태에서, 일배체형의 분해능 또는 특정 일배체형의 검출은 진단이 수행될 수 있게 한다.
다수의 세포로부터의 폴리뉴클레오타이드의 동시 서열결정
다양한 실시형태에서, 상기에 기재된 방법은 각각의 폴리뉴클레오타이드가 그의 기원 세포의 정보를 보유하는 복수의 세포(또는 핵)로부터 폴리뉴클레오타이드를 서열결정하는데 사용된다.
특정 실시형태에서, 트랜스포존 매개된 서열 삽입은 세포 내부에서 매개되며, 각각의 삽입은 기원 세포에 대한 표지로서 고유한 ID 서열 태그를 포함한다. 다른 실시형태에서, 트랜스포존 매개된 삽입은 단일 세포가 단리된 용기, 예를 들어, 아가로스 비드, 유-수 소적(oil-water droplet) 등을 포함하는 용기 내에서 발생한다. 고유한 태그는, 태그를 보유하는 모든 폴리뉴클레오타이드가 동일한 세포로부터 유래해야 한다는 것을 나타낸다. 이어서, 모든 게놈 DNA 및/또는 RNA를 추출하고, 혼합하고, 연장시킨다. 이어서, 본 발명의 실시형태에 따른 서열결정(또는 임의의 다른 서열결정 방법)이 폴리뉴클레오타이드에 대해 수행될 때, ID 서열 태그의 판독은 폴리뉴클레오타이드가 기원하는 세포를 나타낸다. 세포 식별 태그를 짧게 유지하는 것이 바람직하다. (예를 들어, 종양 미세 검으로부터의) 10,000개 세포의 경우, 약 65,000개의 고유한 서열이 8개의 뉴클레오타이드 길이의 식별자 서열에 의해 제공되고, 약 백 만개의 고유한 서열이 10개 뉴클레오타이드 길이의 식별자 서열에 의해 제공된다.
일부 실시형태에서, 개별 세포는 아이덴티티(ID) 태그로 태깅된다. 도 19에 도시된 바와 같이, 일부 실시형태에서, 아이덴티티 태그는 테그먼트화에 의해 폴리뉴클레오타이드에 통합되며, 여기서 시약은 단일 세포 또는 세포(1802)와 병합되거나 세포를 에워싸는 미세소적에 직접 제공된다. 각각의 세포는 상이한 ID 태그(큰 레퍼토리(예를 들어, 백 만개 초과의 가능한 태그로부터)를 제공받는다. 미세소적 및 세포가 융합(1804)된 후, ID 태그는 개별 세포 내에서 폴리뉴클레오타이드에 통합된다. 개별 세포의 내용물은 플로우 셀(2004) 내에서 혼합된다. 이어서 (예를 들어, 본 명세서에 개시된 방법에 의한) 서열결정은 특정 폴리뉴클레오타이드가 기원한 세포를 드러낸다. 대안적인 실시형태에서, 미세소적은 세포를 삼켜서 태깅 시약을 세포로 (예를 들어, 세포 내로 확산시키거나 세포 내용물을 미세소적으로 파열시킴으로써) 전달한다.
이러한 동일한 인덱싱 원리는, 샘플을 혼합하고, 이들을 함께 서열결정하지만, 각각의 개별 샘플에 관한 서열 정보를 회수하는 것이 목적인 경우 (예를 들어, 상이한 개체로부터의) 세포 이외의 샘플에 적용된다.
또한, 다수의 세포가 서열결정될 때, 세포 집단에서 일배체형 다양성 및 빈도를 결정할 수 있다. 일부 실시형태에서, 분자가 충분히 길면, 세포 집단에 존재하는 상이한 염색체, 긴 염색체 분절 또는 일배체형 결정되기 때문에, 집단 내에서 게놈의 이질성은 단일 세포의 내용물을 함께 유지할 필요 없이 분석된다. 이것은 세포에 어느 2개의 일배체형이 함께 존재하는지를 나타내지는 않지만, 이것은 게놈 구조 유형(또는 일배체형)의 다양성 및 이의 빈도 및 어느 비정상적인 국지적 변이체가 존재하는지를 보고한다.
일부 실시형태에서, 폴리뉴클레오타이드가 RNA이고 cDNA 카피가 서열결정되는 경우, 태그의 첨가는 태그 서열을 함유하는 프라이머를 사용한 cDNA 합성을 포함한다. RNA가 직접 서열결정되는 경우, T4 RNA 리가제를 사용한 3 'RNA 말단에 대한 태그의 y 결찰에 의해서 태그가 첨가된다. 태그를 생성시키는 대안적인 방법은 4개의 A, C, G 및 T 염기 중 하나 초과의 뉴클레오타이드를 갖는 말단 트랜스퍼라제로 RNA 또는 DNA를 연장시켜서, 각각의 개별 폴리뉴클레오타이드가 확률적으로 상부에 테일링된 고유한 뉴클레오타이드 서열을 얻도록 하는 것이다.
일부 실시형태에서, 서열의 양을 짧게 유지시키기 위해서, 더 많은 서열 판독물이 폴리뉴클레오타이드 서열 자체를 서열결정하는데 전용되도록, 태그 서열이 다수의 부위에 걸쳐서 분포된다. 여기서, 다수의 짧은 식별자 서열, 즉 3개가 각각의 셀 또는 용기에 도입된다. 이어서, 폴리뉴클레오타이드의 기원은 폴리뉴클레오타이드를 따라 분포된 태그의 비트로부터 결정된다. 따라서 이 경우 하나의 위치로부터의 태그 판독물의 비트는 기원 세포를 결정하기에 충분하지 않지만, 다수의 태그 비트는 결정에 충분하다.
구조 변이체의 검출.
일부 실시형태에서, 검출된 서열과 참조 게놈 사이의 차이는 치환, 인델(indel) 및 구조 변이를 포함한다. 특히, 참조 서열이 본 개시내용의 방법에 의해 조립되지 않은 경우, 반복물은 압축되고, 재구성은 압축해제될 것이다.
일부 실시형태에서, 폴리뉴클레오타이드를 따르는 일련의 서열 판독물의 배향은 반전 사건이 발생했는지 여부를 보고할 것이다. 참조와 비교하여 다른 판독물과 반대 배향의 하나 이상의 판독물은 반전을 나타낸다.
일부 실시형태에서, 그 부근의 다른 판독물과 관련하여 예상되지 않은 하나 이상의 판독물의 존재는 참조와 비교할 때 재배열 또는 전좌를 나타낸다. 참조에서 판독물의 장소는 게놈의 어느 부분이 또 다른 부분으로 이동했는지를 나타낸다. 일부 경우에, 새로운 장소 내의 판독물은 전좌가 아니라 복제이다.
일부 실시형태에서, 반복 영역 또는 카피 수 변이를 검출하는 것이 또한 가능하다. 파라로그(paralogous) 변이를 갖는 판독물 또는 관련 판독물의 반복 존재는 게놈 내의 다수 장소에서 발생하는 다수 또는 매우 유사한 판독물로서 관찰된다. 이들 다수의 장소는 일부 경우에(예를 들어, 위성 DNA에서와 같이) 서로 밀집되어 있거나, 다른 경우에서(예를 들어, 의사 유전자에서와 같이) 게놈에 걸쳐 분산되어 있다. 본 개시내용의 방법은 짧은 탠덤 반복부(Short Tandem Repeats: STRS), 가변 수의 탠덤 반복부(VNTR: VNTR), 트라이뉴클레오타이드 반복부 등에 적용된다. 특정 판독물의 부재 또는 반복은 각각 결실 또는 증폭이 발생했음을 나타낸다. 일부 실시형태에서, 방법은 특히 폴리뉴클레오타이드에 다수 및/또는 복잡한 재배열이 존재하는 경우에 적용된다. 이 방법은 단일 폴리뉴클레오타이드 분석에 기초하기 때문에, 일부 실시형태에서, 상기에 기재된 구조 변이체는 소수의 세포, 예를 들어, 집단으로부터 세포의 단지 1%의 희귀한 발생으로 리졸빙된다.
유사하게, 일부 실시형태에서, 분절 복제 또는 듀플리콘은 게놈 내에 정확하게 국지화된다. 분절 듀플리콘은 전형적으로 거의 동일한 서열의 DNA 서열의 긴 영역(예를 들어, 1 킬로베이스 초과 길이)이다. 이러한 분절 복제는 체세포 돌연변이를 비롯한 개별 게놈에서 다수의 구조 변이를 일으킨다. 분절 듀플리콘은 게놈의 원위 부분에 존재할 수 있다. 현재 차세대 서열결정에서, 판독물이 어느 분절 듀플리콘으로부터 발생하는지를 결정하는 것은 어렵다(따라서 조립을 복잡하게 함). 본 개시내용의 일부 실시형태에서, 서열 판독물을 긴 분자(예를 들어, 0.1 내지 10메가베이스 길이 범위)에 걸쳐 획득하고, 게놈의 어느 분절이 듀플리콘에 상응하는 게놈의 특정 분절에 측접하는지를 결정하기 위해서 판독물을 사용함으로써 듀플리콘의 게놈 컨텍스트를 결정하는 것이 일반적으로 가능하다.
구조 변이체의 중단점은 본 개시내용의 일부 실시형태에서 정확하게 국지화된다. 일부 실시형태에서, 게놈의 두 부분이 융합된 것을 검출할 수 있고, 중단점이 발생한 정확한 개별 판독물이 결정된다. 본 명세서에 기재된 바와 같이 수집된 서열 판독물은 2개의 융합된 영역의 키메라를 포함하고, 중단점의 한 면 상의 모든 서열은 융합된 분절 중 하나에 상응할 것이고, 다른 면은 융합된 분절 중 다른 하나이다. 이는 그 구조가 중단점 주위에서 구조가 복잡한 경우에도 중단점을 결정하는 데 있어서 높은 신뢰도를 제공한다. 일부 실시형태에서, 정확한 염색체 중단점 정보는 질병 기전을 이해하거나, 특정 전좌의 존재를 검출하거나, 질환을 진단하는 데 사용된다.
후성유전학적 변형의 국지화.
일부 실시형태에서, 방법은 고정된 이중 가닥 또는 고정된 제1 가닥 및 고정된 제2 가닥을 항체, 어피머, 나노바디, 압타머 또는 메틸-결합 단백질에 노출시킴으로써 핵산에 대한 변형을 결정하거나 또는 시험 기질 상의 복수의 위치 세트로부터 핵산의 일부의 서열과의 연관성을 보여주는 단계를 더 포함한다. 일부 항체는 이중 가닥 또는 단일 가닥에 결합한다. 메틸 결합 단백질은 이중 가닥 폴리뉴클레오타이드에 결합할 것이라고 예상된다.
일부 실시형태에서, 네이티브 폴리뉴클레오타이드는 서열결정을 위해 디스플레이되기 전에 처리가 필요하지 않다. 이것은 방법이 후성유전학적 정보를 서열 정보와 통합할 수 있게 하는데, 그 이유는 DNA의 화학적 변형이 그대로 유지될 수 있기 때문이다. 바람직하게는 폴리뉴클레오타이드는 방향이 있게 잘 정렬되고, 따라서 영상화, 영상 처리, 염기 콜 및 조립이 비교적 용이하고; 서열 오류율이 낮고, 커버리지가 높다. 본 개시내용을 수행하기 위한 다수의 실시형태가 기재되어 있지만, 각각은 샘플 준비의 부담이 전체적으로 또는 거의 전체적으로 제거되도록 수행된다.
이들 방법은 증폭 없이 게놈 DNA에 대해 수행되기 때문에, 일부 실시형태에서, 증폭 편향 및 오류를 겪지 않으며, (예를 들어, 서열의 획득에 직교하여) 후성유전학적 마크가 보존되고 검출된다. 일부 경우에, 핵산이 메틸화되는지를 서열-특이적 방식으로 결정하는 것이 유용하다. 예를 들어, 태아를 모체 DNA와 구별하는 한 가지 방식은 전자가 관심대상 유전자좌에서 메틸화된다는 것이다. 이것은 비-침습적 산전 검사(non-invasive prenatal testing: NIPT)에 유용하다.
포유동물에서 몇몇 사이토신 변이체, C5-메틸사이토신(5-mC), C5-하이드록시메틸사이토신(5-hmC), C5-폼일사이토신 및 C5-카복실사이토신을 산출하는 탄소-5(C5)의 알킬화와 같은 여러 유형의 메틸화가 가능하다. 진핵 생물 및 원핵 생물 유기체는 또한 아데닌을 N6-메틸아데닌(6-mA)으로 메틸화시킨다. 원핵 생물에서, N4-메틸사이토신이 또한 널리 퍼져 있다.
항체는 이러한 변형 각각뿐만 아니라 관심대상인 것으로 해석되는 다른 변형에 대해 이용 가능하거나 제기된다. 변형을 표적으로 하는 어피머, 나노바디 또는 압타머는 더 작은 풋프린트의 가능성으로 인해 특히 관련이 있다. 본 발명에서 항체에 대한 임의의 언급은 어피머, 나노바디 압타머 및 임의의 유사한 시약을 포함하는 것으로 해석되어야 한다. 또한, 다른 자연 발생 DNA 결합 단백질, 예를 들어, 메틸 단백질(MBD1, MBD2 등)이 일부 실시형태에서 사용된다.
일부 실시형태에서 메틸화 분석은 서열결정에 직교하여 수행된다. 일부 실시형태에서, 이것은 서열결정 이전에 수행된다. 예로서, 항-메틸 C 항체 또는 메틸 결합 단백질(메틸 결합 도메인(MBD) 단백질 패밀리는 MeCP2, MBD1, MBD2 및 MBD4를 포함함) 또는 펩타이드(MBD1에 기초함)는 일부 실시형태에서 폴리뉴클레오타이드에 결합되고, 이들의 장소는 이들은 제거되기 전에 표지를 통해 검출된다(예를 들어, 고염 완충제, 카오트로픽 시약, SDS, 프로테아제, 유레아 및/또는 헤파린을 첨가함으로써). 바람직하게는, 온-오프 결합을 촉진시키는 일시적인 결합 완충제의 사용으로 인해서, 시약은 일시적으로 결합하거나, 시약은 일시적으로 결합하도록 조작된다. 항체가 이용 가능하거나 발생하는 하이드록시메틸화 또는 DNA 손상 부위와 같은 다른 폴리뉴클레오타이드 변형에 대해서 유사한 접근법이 사용된다. 변형의 장소가 검출되고, 변형 결합 시약이 제거된 후, 서열결정이 시작된다. 일부 실시형태에서, 표적 폴리뉴클레오타이드가 단일 가닥으로 변성된 후에 항-메틸 및 항-하이드록시메틸 항체 등이 첨가된다. 이 방법은 매우 민감하고, 긴 폴리뉴클레오타이드 상에서 단일 변형을 검출할 수 있다.
도 19는 단일 세포로부터의 DNA 및 RNA의 추출 및 신장, 및 DNA 및 RNA의 차별적 표지(예를 들어, 각각 mC 및 m6A에 대한 항체 사용)를 도시한다. 세포(1602)는 표면에 부동화된 후 용해된다(1902). 용해에 의해서 핵(1604)으로부터 방출된 핵산(1608)은 부동화 및 연장된다(1904). 이어서, 핵산은 첨부된 DNA 태그(1910 및 1912)를 갖는 항체에 노출되고 이에 의해 결합된다. 일부 실시형태에서, 태그는 DNA PAINT-기반 단일 분자 국지화를 위한 형광 염료 또는 올리고뉴클레오타이드 도킹 서열이다. 일부 실시형태에서, 태그 및 DNA PAINT를 사용하는 것 대신에, 항체 또는 다른 결합 단백질은 단일 형광 표지 또는 다중 형광 표지를 사용하여 직접 형광 표지된다. 항체가 암호화되는 경우, 표지의 일례는 도 14A, 도 14C 및 도 14D에 도시된 바와 같다. DNA 및 RNA 둘 다의 에피-변형 분석은 일부 실시형태에서 본 명세서에 기재된 서열결정 방법을 사용하여 이들의 서열과 커플링된다.
일부 실시형태에서, 결합 단백질에 의해서 메틸화를 검출하는 것에 더하여, 결합 부위에서의 메틸화의 존재는, 표적 핵산 부위에 변형이 존재하지 않는 경우와 비교할 때 표적 핵산 부위에 변형이 존재하는 경우 구별되는 올리고뉴클레오타이드 결합 거동에 의해 검출된다.
일부 실시형태에서, 바이설파이트 처리를 사용하여 메틸화를 검출한다. 레퍼토리를 통과한 후, 바이설파이트 처리를 사용하여 메틸화되지 않은 사이토신을 우라실로 전환하고, 이어서, 레퍼토리를 다시 적용한다. 바이설파이트 처리 전의 뉴클레오타이드 위치가 C로 판독되고, 바이설파이트 처리 후 U로 판독되면 그것은 메틸화되지 않은 것으로 간주될 수 있다.
메틸화와 같은 DNA 변형에 대한 참조 에피게놈(epigenome)은 존재하지 않는다. 유용하기 위해서, 미지의 폴리뉴클레오타이드의 메틸화 맵이 서열 기반 맵에 연결될 필요가 있다. 따라서, 일부 실시형태에서, 에피-매핑 방법(epi-mapping)은 에피-맵에 컨텍스트를 제공하기 위해 올리고 결합에 의해 획득된 서열 비트와 상관관계가 있다. 서열 판독에 더하여, 일부 실시형태에서 다른 부류의 메틸화 정보가 또한 커플링된다. 이것은 비제한적 예로서, 니킹 엔도뉴클레아제 기반 맵, 올리고-결합 기반 맵 및 변성 및 변성-변형 맵을 포함한다. 일부 실시형태에서, 하나 이상의 올리고의 일시적인 결합을 사용하여 폴리뉴클레오타이드를 매핑한다. 게놈에 대한 기능적 변형에 더하여, 일부 실시형태에서, DNA 손상 부위 및 단백질 또는 리간드 결합과 같은 게놈 상에 매핑되는 다른 특징에 동일한 접근법이 적용된다.
본 개시내용에서, 염기 서열결정 또는 후성유전학적 서열결정을 먼저 수행한다. 일부 실시형태에서, 둘 다는 동시에 수행된다. 예를 들어, 특정 에피-변형에 대한 항체는 일부 실시형태에서 올리고로부터 차별적으로 암호화된다. 이러한 실시형태에서, 두 프로브 유형의 일시적인 결합을 용이하게 하는 조건이 사용된다(예를 들어, 낮은 염 농도).
일부 실시형태에서, 폴리뉴클레오타이드가 염색체 또는 염색질을 포함하는 경우, 항체를 염색체 또는 염색질에 사용하여 DNA에 대한 변형 및 히스톤에 대한 변형(예를 들어, 히스톤 아세틸화 및 메틸화)을 검출한다. 이들 변형 장소는 염색체 또는 염색질 상의 장소에 대한 항체의 일시적인 결합에 의해 결정된다. 일부 실시형태에서, 항체는 올리고 태그로 표지되고, 일시적으로 결합하지 않고, 오히려 그의 결합 부위에 영구적으로 또는 반영구적으로 고정된다. 이러한 실시형태에서, 항체는 올리고 태그를 포함할 것이고, 이들 항체 결합 부위의 장소는 항체 태그 상의 올리고에 대한 상보성 올리고의 일시적 결합을 사용함으로써 검출된다.
무세포 핵산의 단리 및 분석.
진단을 위해 가장 접근하기 쉬운 DNA 또는 RNA 중 일부는 체액 또는 대변 내의 세포 외부에서 발견된다. 이러한 핵산은 종종 신체의 세포에 의해 탈락되었다. 혈액 내의 순환하는 무세포 DNA는 3염색체(trisomy) 21 및 기타 염색체 및 게놈 장애에 대한 산전 검사에 사용된다. 이것은 또한 특정 병리학적 병태에 대한 마커인 종양 유래 DNA 및 기타 DNA 또는 RNA를 검출하기 위한 수단이다. 그러나, 분자는 전형적으로 작은 분절(예를 들어, 혈액에서 약 200개 염기쌍 길이 범위, 심지어 소변에서는 더 짧음)로 존재한다. 게놈 영역의 카피 수는 게놈의 다른 부분과 비교하여 참조의 특정 영역에 정렬된 판독물 수와 비교하여 결정된다.
일부 실시형태에서, 본 개시내용의 방법은 2가지 접근법에 의한 무세포 DNA 서열의 열거 또는 분석에 적용된다. 첫 번째는 변성 전 또는 후에 짧은 핵산을 부도화하는 것을 포함한다. 일시적인 결합 시약을 사용하여 핵산의 아이덴티티, 이의 카피 수, 돌연변이 또는 특정 SNP 대립 유전자의 존재 여부 및 검출된 서열이 메틸화되었는지 또는 다른 변형(바이오 마커)을 보유하는지를 결정하기 위해서 핵산을 조사한다.
두 번째 접근법은 (예를 들어, 무세포 핵산이 생물학적 샘플로부터 단리된 후) 작은 핵산 단편을 연결시키는 것을 포함한다. 연결은 조합된 핵산의 신장을 가능하게 한다. 연결은 DNA의 단부를 연마하고, 평활 단부-결찰을 수행함으로써 수행된다. 대안적으로, 혈액 또는 무세포 DNA를 2개의 분취물로 나누고, 하나의 분취물은 (말단 전이 효소를 사용하여) 폴리A로 테일링되고, 다른 분취물은 폴리 T에 의해서 테일링된다.
이어서, 생성된 콘카타머를 서열결정한다. 생성된 "슈퍼" 서열 판독물을 개별 판독물을 추출하기 위해서 참조와 비교한다. 개별 판독물을 계산적으로 추출된 후 다른 짧은 판독물과 동일한 방식으로 처리된다.
일부 실시형태에서, 생물학적 샘플은 핵산을 분해하는 다수의 엑소뉴클레아제를 함유하는 배지인 대변을 포함한다. 이러한 실시형태에서, 기능을 수행하기 위해서 엑소뉴클레아제가 필요로 하는 2가 양이온의 킬레이터(예를 들어, EDTA)의 높은 농도를 사용하여 DNA를 충분히 무손상으로 유지시키고, 서열결정을 가능하게 한다. 일부 실시형태에서, 무세포 핵산은 엑소좀에서 캡슐화를 통해 세포로부터 탈락된다. 엑소좀은 초원심분리 또는 스핀 칼럼(퀴아젠사(Qiagen))을 사용하여 단리되고, 내부에 함유된 DNA 또는 RNA가 수집되고 서열결정된다.
일부 실시형태에서, 메틸화 정보는 상기에 기재된 방법에 따라서 무세포 핵산으로부터 수득된다.
서열결정 기술의 조합.
일부 실시형태에서, 본 명세서에 기재된 방법은 다른 서열결정 기술과 조합된다. 일부 실시형태에서, 일시적인 결합에 의한 서열결정 후, 제2 방법에 의한 서열결정은 동일한 분자 상에서 개시된다. 예를 들어, 보다 안정적인 올리고뉴클레오타이드가 합성에 의한 서열결정을 개시하도록 결합된다. 일부 실시형태에서, 방법은 완전한 게놈 서열결정을 멈추고, 일루미나사로부터의 것과 같은 짧은 판독물 서열결정을 위한 스캐폴드를 제공하는데 사용된다. 이 경우, 게놈의 보다 균일한 커버리지를 얻기 위해서 PCR 증폭 단계를 배제함으로써 일루미나 라이브러리 준비를 수행하는 것이 유리하다. 이들 실시형태 중 일부의 하나의 이점은 요구되는 서열결정의 배수 커버리지가 예를 들어 약 40× 내지 20×로 반감된다는 것이다. 일부 실시형태에서, 이는 이 방법에 의해 수행된 서열결정 및 방법이 제공하는 장소 정보의 추가로 인한 것이다. 일부 실시형태에서, 선택적으로 광학적으로 표지된 더 길고 더 안정적인 올리고는 표적에 결합되어 짧은 서열결정 올리고를 사용하여 서열결정 과정의 부분 또는 전체를 통해서 이전에 또는 동시에 게놈에서 특정 관심대상 영역(예를 들어, BRCA1 유전자좌)을 표시할 수 있다(바람직하게는 상이하게 표지됨).
기계 학습 방법.
일부 실시형태에서, 공지된 서열의 중합체(예를 들어, 폴리뉴클레오타이드)에 대해 시험되는 경우 그리고/또는 폴리뉴클레오타이드의 서열이 또 다른 방법의 데이터와 교차 검정되는 경우 인공 지능 또는 기계 학습을 사용하여 레퍼토리의 구성원의 거동을 학습한다. 일부 실시형태에서, 학습 알고리즘은 하나 이상의 조건 또는 맥락에서 프로브에 대한 결합 부위를 함유하는 하나 이상의 폴리뉴클레오타이드 표적에 대한 특정 프로브의 전체 거동을 고려한다. 동일하거나 상이한 샘플에서 더 많은 서열결정이 수행됨에 따라, 기계 학습으로부터의 학습이 보다 강력해진다. 기계 학습으로부터 학습한 것은, 다양한 다른 검정, 특히 올리고와 올리고/폴리뉴클레오타이드의 상호작용(예를 들어, 혼성화에 의한 서열결정)에 관여되는 것뿐만 아니라 일시적인 결합-기반 긴급 서열결정에 적용된다.
일부 실시형태에서, 인공 지능 또는 기계 학습은 공지된 서열의 하나 이상의 폴리뉴클레오타이드에 대한 짧은 올리고(예를 들어, 3량체, 4량체, 5량체 또는 6량체)의 완전한 레퍼토리의 결합을 위해 실험적으로 획득된 결합 패턴의 데이터를 제공함으로써 훈련된다. 각각의 올리고에 대한 훈련 데이터는 결합 장소, 결합 지속기간 및 주어진 기간에 걸친 결합 사건의 수를 포함한다. 이러한 훈련 후에, 기계 학습 알고리즘을 결정될 서열의 폴리뉴클레오타이드에 적용하고, 그 학습에 기초하여 폴리뉴클레오타이드의 서열을 조립할 수 있다. 일부 실시형태에서, 기계 학습 알고리즘은 또한 참조 서열을 제공받는다.
일부 실시형태에서, 서열 조립 알고리즘은 기계 학습 요소 및 비-기계 학습 요소 둘 다를 포함한다.
일부 실시형태에서, 실험적으로 수득된 결합 패턴으로부터 학습하는 컴퓨터 알고리즘 대신에, 결합 패턴은 모의실험을 통해 획득된다. 예를 들어, 일부 실시형태에서, 공지된 서열의 폴리뉴클레오타이드에 대한 레퍼토리의 올리고의 일시적인 결합에 대한 모의실험이 수행된다. 모의실험은 실험 또는 공개 데이터에서 얻은 각각의 올리고의 거동 모델을 기반으로 한다. 예를 들어, 결합 안정성의 예측은 가장 가까운 이웃 방법(예를 들어, 문헌[SantaLucia et al., Biochemistry 35, 3555-3562 (1996) and Breslauer et al., Proc. Natl. Acad. Sci. 83: 3746-3750, 1986]에 기재된 바와 같음)에 따라서 입수 가능하다. 일부 실시형태에서, 미스매칭 거동은 공지되어 있거나(예를 들어, A에 대한 G 미스매치 결합은 T 대 A보다 강하거나 더 강한 상호작용일 수 있음) 또는 실험적으로 도출된다. 추가로, 일부 실시형태에서, 올리고의 짧은 하위서열(예를 들어, GGA 또는 ACC)의 상당히 높은 결합 강도가 공지되어 있다. 일부 실시형태에서, 기계 학습 알고리즘은 모의실험된 데이터에 대해 학습되고, 이어서 짧은 올리고의 완전 레퍼토리에 의해 조사될 때 미지의 서열의 서열을 결정하는데 사용된다.
일부 실시형태에서, 레퍼토리 또는 패널의 올리고의 데이터(장소, 결합 지속기간, 신호 강도 등)는 하나 이상의 바람직하게는(수 십, 수 백 또는 수 천 개의) 공지된 서열에 대해서 훈련된 기계 학습 알고리즘에 연결된다. 이어서 기계 학습 알고리즘을 적용하여 해당 서열로부터 데이터 세트를 생성시키고, 기계 학습 알고리즘은 해당 미지의 서열의 서열을 생성시킨다. 유기체의 서열결정을 위한 알고리즘의 훈련은 그 유형의 유기체, 비교적 더 작거나 덜 복잡한 게놈(예를 들어, 박테리아, 박테리오파지 등에 대해서)에 대해서 수행되어야 한다. 더 크고 더 복잡한 게놈을 갖는 유기체(예를 들어, 에스. 폼베(S. pombe) 또는 인간), 특히 반복적인 DNA 영역을 가진 유기체의 경우, 훈련은 그 유형의 유기체에 대해서 수행되어야 한다. 전체 염색체 길이에 대한 메가베이스 단편의 긴-범위 조립의 경우, 일부 실시형태에서, 유사한 유기체에 대해서 훈련이 수행되어, 게놈의 특정 양상이 훈련 동안 제시된다. 예를 들어, 인간 게놈은 이배체이고, 분절 복제를 갖는 큰 서열 영역을 나타낸다. 다른 관심대상 게놈, 특히 많은 농업적으로 중요한 식물 종은 매우 복잡한 게놈을 갖는다. 예를 들어, 밀 및 다른 곡물은 고도의 배수성 게놈을 가지고 있다.
일부 실시형태에서, 기계 학습 기반 서열 재구성 접근법은 (a) 하나 이상의 훈련 데이터 세트로부터 수집된 레퍼토리에서 각각의 올리고의 결합 거동에 관한 정보를 제공하는 단계 및 (b) 물리적 결합을 위해서 서열 결정될 폴리뉴클레오타이드에 대한 레퍼토리의 각각의 올리고를 제공하는 단계 및 (c) 결합 장소 및/또는 결합 지속기간 및/또는 각각의 올리고에 대한 각각의 장소에서 일어나는 결합 횟수에 대한 정보를 제공하는 단계를 포함한다.
일부 실시형태에서, 특정 실험의 서열은 먼저 비-기계 학습 알고리즘에 의해 처리된다. 이어서, 제1 알고리즘의 출력 서열을 사용하여 기계 학습 알고리즘을 훈련하여, 훈련은 동일한 정확한 분자의 실제 실험적으로 유래된 서열에서 일어난다. 일부 실시형태에서, 서열 조립 알고리즘은 베이지안 접근법을 포함한다. 일부 실시형태에서, 본 개시내용의 방법으로부터 유래된 데이터는 국제 특허 공개 제WO2010075570호에 기재된 유형의 알고리즘으로 제공되고, 선택적으로 다른 유형의 게놈 또는 서열결정 데이터와 조합된다.
일부 실시형태에서, 서열은 다수의 방식으로 데이터로부터 추출된다. 서열 재구성 방법의 스펙트럼의 하나의 단부에서, 단량체 또는 단량체의 스트링의 국지화는 매우 정확하여(나노단위 또는 나노단위 미만), 단지 단량체 또는 스트링을 정렬함으로써 서열이 획득된다. 스펙트럼의 다른 단부에서, 데이터를 사용하여 서열에 대한 다양한 가설을 배제한다. 예를 들어, 한 가설은 서열이 공지된 개별 게놈 서열에 상응한다는 것이다. 알고리즘은 데이터가 개별 게놈으로부터 분기되는 위치를 결정한다. 또 다른 경우에, 가설은 서열이 "정상" 체세포에 대한 공지된 게놈 서열에 상응한다는 것이다. 알고리즘은 추정 종양 세포로부터의 데이터가 "정상" 체세포의 서열로부터 분기되는 위치를 결정한다.
본 개시내용의 일 실시형태에서, 하나 이상의 공지된 표적 폴리뉴클레오타이드(들)(예를 들어, 람다 파지 DNA 또는 레퍼토리 내의 각각의 올리고에 대한 상보체를 포함하는 슈퍼 서열을 포함하는 합성 작제물)를 포함하는 훈련 세트를 레퍼토리로부터의 각각의 올리고뉴클레오타이드의 시험되는 반복적인 결합을 위해서 사용한다. 일부 실시형태에서 올리고머 프로브의 결합 및 미스매칭 특징을 결정하기 위해 기계 학습 알고리즘을 사용한다. 따라서, 반직관적으로, 미스매치 결합은 서열을 조립하고/하거나 신뢰도를 추가하는 데 사용되는 추가 데이터를 제공하는 방법으로 인지된다.
서열결정 장비 및 장치.
서열결정 방법은 공통의 계측 요건을 갖는다. 기본적으로 장비는 시약을 영상화하고 교환할 수 있어야 한다. 영상화 요건은 대물 렌즈, 릴레이 렌즈, 빔 스플리터, 거울, 필터 및 카메라 또는 포인트 검출기의 군 중 하나 이상을 포함한다. 카메라는 CCD 또는 어레이 CMOS 검출기를 포함한다. 포인트 검출기는 PhotoMultiplier Tube(PMT) 또는 Avalanche Photodiode(APD)를 포함한다. 일부 경우에, 고속 카메라를 사용한다. 다른 선택적인 양상은 방법의 형식에 따라 조정된다. 예를 들어, 조명 공급원(예를 들어, 램프, LED 또는 레이저), 기판 상의 조명의 커플링(예를 들어, 프리즘, 격자, 졸-겔, 렌즈, 번역 가능 스테이지 또는 번역 가능한 대물 렌즈), 샘플을 영상화기에 대해서 이동시키기 위한 메커니즘, 샘플 혼합/교반, 온도 제어 및 전기 제어는 본 명세서에 개시된 상이한 실시형태에 대해서 각각 독립적으로 조정된다.
단일 분자 구현의 경우, 조명은 바람직하게는 에바네센트파의 생성을 통해서, 예를 들어, 프리즘-기반 전체 내부 반사, 대물-기반 전체 내부 반사, 격자-기반 도파관, 하이드로겔 기반 도파관 또는 적합한 각으로 기판의 모서리에 레이저를 제공함으로써 생성된 에바네센트 도파관을 통해서 일어난다. 일부 실시형태에서, 도파관은 코어층 및 제1 클래딩층(cladding layer)을 포함한다. 조명은 대안적으로 HILO 조명 또는 가벼운 시트를 포함한다. 일부 단일 분자 장비에서, 펄싱된 조명 및 시간-게이팅 검출의 동기화를 사용함으로써 광 산란기의 효과를 완화시키고; 여기서 광 산란은 게이팅 아웃된다. 일부 실시형태에서, 암시야 조명이 사용된다. 일부 장비는 형광 수명 측정을 위해 설정된다.
일부 실시형태에서, 장비는 세포, 핵, 세포 소기관, 염색체 등으로부터 폴리뉴클레오타이드를 추출하기 위한 수단을 또한 함유한다.
대부분의 실시형태에 적합한 장비는 일루미나사의 Genome Analyzer IIx이다. 이 장비는 프리즘 기반 TIR, 20× Dry Objective, 광 스크램블러, 532㎚ 및 660㎚ 레이저, 적외선 레이저 기반 포커싱 시스템, 방출 필터 휠, Photometrix CoolSnap CCD 카메라, 온도 제어 및 시약 교환을 위한 주사기 펌프-기반 시스템을 포함한다. 교번하는(alternative) 카메라 조합으로 이 장비를 변형시키면 일부 실시형태에서 더 양호한 단일 분자 서열결정이 가능하다. 예를 들어, 센서는 바람직하게는 2e 미만의 전자 노이즈를 갖는다. 또한 센서는 다수의 픽셀을 갖는다. 주사기- 펌프 기반 시약 교환 시스템을 일부 실시형태에서 압력 구동식 유동에 기반한 것으로 대체한다. 이 시스템은 호환 가능한 일루미나 플로우 셀 또는 일부 실시형태에서 장비의 실제 또는 변형된 배관에 맞도록 개작된 맞춤형 플로우 셀과 함께 사용된다.
대안적으로, 레이저 베드(표지의 선택에 따른 레이저) 또는 레이저 시스템 및 게놈 분석기로부터의 광 스크램블러, EM CCD 카메라(예를 들어, Hamamatsu ImageEM) 또는 과학적 CMOS(예를 들어, Hamamatsu Orca FLASH) 및 선택적으로 온도 제어와 커플링된 전동(motorized) Nikon Ti-E 현미경이 사용된다. 일부 실시형태에서, 과학적 센서보다는 컨슈머(consumer)가 사용된다. 이것은 서열결정 비용을 극적으로 줄일 수 있는 잠재력이 있다. 이것은 압력 구동 또는 주사기 펌프 시스템 및 특별하게 설계된 플로우 셀과 커플링된다. 일부 실시형태에서, 플로우 셀은 유리 또는 플라스틱으로 제조되며, 각각은 장점 및 단점을 갖는다. 일부 실시형태에서, 플로우 셀은 환식 올레핀 공중합체(COC), 예를 들어 TOPAS, 다른 플라스틱 또는 PDMS를 사용하여 또는 미세제조 방법을 사용하여 실리콘 또는 유리로 제조된다. 일부 실시형태에서, 열가소성 물질의 사출 성형은 산업 규모의 제조에 저렴한 라우터를 제공한다. 일부 광학 구성에서, 열가소성 물질은 최소 고유 형광을 갖는 양호한 광학 특성을 가질 필요가 있다. 방향족 또는 공액 시스템을 함유하지 않는 중합체는 상당한 고유 형광을 가질 것으로 예상되기 때문에 이상적으로는 배제되어야 한다. Zeonor 1060R, Topas 5013 및 PMMA-VSUVT(예를 들어, 미국 특허 제8,057,852호에 기재된 바와 같음)는 녹색 및 적색 파장 범위(예를 들어, Cy3 및 Cy5의 경우)에서 적절한 광학 특성을 갖는 것으로 보고되어 있고, Zeonar 1060R이 가장 유리한 특성을 갖는다. 일부 실시형태에서, 마이크로유체 장치의 넓은 영역에 걸쳐 열가소성 물질을 결합시키는 것이 가능하다(예를 들어, 문헌[Sun et al., Microfluidics and Nanofluidics, 19(4), 913-922, 2015]에 보고된 바와 같음). 일부 실시형태에서, 생체중합체가 상부에 부착된 유리 커버 글라스는 열가소성 유체 구조물에 결합된다.
대안적으로, 수동 작동식 플로우 셀이 현미경 상부에 사용된다. 이것은 일부 실시형태에서, 양면 점착 시트를 사용하여 플로우 셀을 제조하고, 레이저 절단하여 적절한 치수의 채널을 갖도록 하고, 커버슬립과 유리 슬라이드 사이에 샌드위치시킴으로써 구성된다. 하나의 시약 교환 주기에서 또 다른 시약 교환 주기까지 플로우 셀은 장비/현미경에 남아 프레임마다 등록될 수 있다. 일부 실시형태에서, 선형 엔코더를 갖는 전동 스테이지는 스테이지가 넓은 면적의 영상화 동안 언제 변환되는지를 보장하기 위해 사용된다. 동일한 장소가 올바르게 재방문된다. 수광성(fiduciary) 마커를 사용하여 올바른 등록을 유지한다. 이 경우, 광학적으로 검출되는 플로우 셀 내의 에칭 또는 플로우 셀 내의 표면 고정 비드와 같이 수광성 마킹을 갖는 것이 바람직하다. 폴리뉴클레오타이드 골격이 (예를 들어, YOYO-1에 의해) 염색되고, 고정되면, 알고 있는 위치를 사용하여 영상을 하나의 프레임에서 다음 프레임으로 정렬한다.
일 실시형태에서, 레이저 또는 LED 조명을 사용하는 조명 메커니즘(예를 들어, 미국 특허 제7,175,811호 및 문헌[Ramachandran et al., Scientific Reports 3:2133, 2013]에 기재된 것과 같음)이 선택적인 메커니즘 및 시약 교환 시스템과 커플링되어 본 명세서에 기재된 방법을 수행한다. 일부 실시형태에서, 스마트폰 기반 영상화 설정(ACS Nano 7:9147)이 선택적 온도 제어 모듈 및 시약 교환 시스템과 커플링된다. 이러한 실시형태에서, 그것이 주로 사용되는 전화 상의 카메라이지만, iPhone 또는 다른 스마트폰 장치의 조명 및 진동 기능과 같은 다른 양상도 사용될 수 있다.
도 20a 및 도 20b는 플로우 셀(2004) 및 통합된 광학 레이아웃을 사용하여, 본 명세서에 기재된 바와 같은 일시적인 프로브 결합의 영상화를 수행하기 위한 가능한 장치를 도시한다. 시약은 공기 갭(2022)에 의해 분리된 시약/완충제(2008)의 패킷으로서 전달된다. 도 20A는 프리즘(2016)(예를 들어, TIRF 설정)을 통해 투과되는 커플링 레이저 광(2014)을 통해 에바네센트파(2010)가 생성되는 예시적인 레이아웃을 도시한다. 일부 실시형태에서, 반응 온도는 통합된 열 제어(2012)에 의해 제어된다(일례에서, 투명한 기판(2024)은 전기적으로 커플링되어 전체 기판(2024)의 온도를 변경하는 인듐 주석 산화물을 포함한다). 시약은 시약/완충제(2008)의 연속적인 유동으로서 전달된다. 격자, 도파관(2020) 또는 광자 구조를 사용하여 레이저 광(2014)을 커플링시켜 에바네센트 필드(2010)를 생성시킨다. 일부 실시형태에서, 열 제어는 공간을 커버하는 블록(2026)으로부터 유래된다.
도 20A에 기재된 레이아웃의 양상은 도 20B에 기재된 레이아웃의 양상과 상호 교환 가능하다. 예를 들어, 대물 스타일 TIRF, 광 가이드 TIRF, 콘덴서 TIRF가 대안적으로 사용될 수 있다. 연속식 또는 공기-갭핑 시약 전달은 일부 실시형태에서 주사기 펌프 또는 압력 구동식 유동에 의해 제어된다. 공기-갭핑 방법은 모든 시약(2008)이 모세관/튜빙(2102)(예를 들어, 도 21에 도시된 바와 같음) 또는 채널에 미리 로딩되고, 주사기 펌프 또는 압력 제어 시스템으로부터의 밀거나 당김에 의해 전달될 수 있게 한다. 공기-갭핑 방법은 모든 시약이 모세관/튜빙 또는 채널에 미리 로딩되고, 주사기 펌프 또는 압력 제어 시스템으로부터의 밀거나 당김에 의해 전달될 수 있게 한다. 공기 갭(2022)은 공기 또는 기체, 예컨대, 질소 또는 수용액과 비혼화성인 액체를 포함한다. 공기 갭(2022)은 또한 분자 코밍뿐만 아니라 시약 전달을 수행하는데 사용될 수 있다. 유체 장치(예를 들어, 유체 용기, 카트리지 또는 칩)는 폴리뉴클레오타이드 부동화 및 선택적으로 연장이 수행되는 플로우 세포 면적, 시약 저장, 유입구, 유출구 및 폴리뉴클레오타이드 추출뿐만 아니라 에바네센트 필드를 형성화하기 위한 선택적인 구조를 포함한다. 일부 실시형태에서, 장치는 유리, 플라스틱 또는 유리와 플라스틱의 복합물로 만들어진다. 일부 실시형태에서, 열 및 전기 전도성 요소(예를 들어, 금속성)는 유리 및/또는 플라스틱 성분에 통합된다. 일부 실시형태에서, 유체 용기는 웰이다. 일부 실시형태에서, 유체 용기는 플로우 셀이다. 일부 실시형태에서, 표면은 하나 이상의 화학층, 생화학층(예를 들어, BSA- 바이오틴, 스트렙타비딘), 지질층, 하이드로겔 또는 겔층으로 코팅된다. 바이닐 실란(BioTechniques 45:649-658, 2008 또는 게노믹 비전사(Genomic Vision)로부터 입수 가능함)으로 코팅된 22×22㎜ 커버 글라스 또는 클로로벤젠 용액 중의 1.5% Zeonex로 스핀 코팅된 커버 글라스. 기질은 또한 2% 3-아미노프로필트라이에톡시실란(APTES) 또는 폴리 라이신으로 코팅될 수 있고, 신장은 HEPES 완충제에서 pH 7.5 내지 8에서 정전기적 상호 작용을 통해 일어난다. 대안적으로, 실란화된 커버글라스를 비스-아크릴아마이드를 함유한 1 내지 8% 폴리아크릴아마이드 용액으로 스핀- 또는 딥-코팅하고, 테밍한다(temed). 이를 위해서 그리고 바이닐실란 코팅된 커버글라스를 사용하기 위해서, 커버글라스를 1시간 동안 아세톤 중의 10% 3-메타크릴옥시프로필트라이메톡시 실란(Bind Silane; 파마시아 바이오테크사(Pharmacia Biotech))(v/v)으로 코팅할 수 있다. 폴리아크릴아마이드 코팅은 또한 기재된 바와 같이 얻을 수 있다(Liu Q et al. Biomacromolecules, 2012, 13 (4), pp 1086-1092). 사용될 수 있는 다수의 하이드로 겔 코팅은 문헌[Mateescu et al. Membranes 2012, 2, 40-69]에 기재되고, 참조되어 있다.
교류(AC) 전기장을 인가함으로써 아가로스 겔에서 핵산을 연장시킬 수도 있다. DNA 분자는 겔 내로 전기영동될 수 있거나 DNA는 용융된 아가로스와 혼합되고, 이어서 아가로스와 함께 경화될 수 있다. 이어서 대략 약 10㎐의 주파수를 갖는 AC 전계가 인가되고, 200 내지 400V/㎝의 전계 강도가 사용된다. 신장은 0.5 내지 3%의 아가로스 겔 농도 범위에서 수행될 수 있다. 일부 경우에 표면은 유동 채널 또는 웰에서 BSA-바이오틴으로 코팅된 후, 스트렙타비딘 또는 뉴트라비딘이 첨가된다. 이러한 코팅된 커버글라스는 pH 7.5 완충제에서 DNA를 먼저 결합시킨 다음 pH 8.5 완충제에서 DNA를 신장시킴으로써 이중 가닥 게놈 DNA를 신장시키기 위해서 사용될 수 있다. 일부 경우에, 스트렙타비딘 코팅된 커버글라스는 핵산 가닥을 포획 및 부동화시키는 데 사용되지만, 신장은 수행되지 않는다. 따라서, 한 단부에 핵산이 부착되고, 다른 단부에 용액이 존재한다.
GAIIx와 같은 광학 서열결정 시스템의 다양한 현미경 유사 성분을 사용하는 것보다는, 일부 실시형태에서, 보다 통합된 모놀리틱(monolithic) 장치가 서열결정을 위해서 구성된다. 이러한 실시형태에서, 폴리뉴클레오타이드는 센서 어레이 또는 센서 어레이에 인접한 기판 상에 직접 부착되고, 선택적으로 연장된다. 센서 어레이 상에서의 직접 검출은 어레이에 대한 DNA 혼성화에 대해서 입증되었다(예를 들어, 문헌[Lamture et al., Nucleic Acid Research 22:2121-2125, 1994]에 기재된 바와 같음). 일부 실시형태에서, 센서는 형광 염료로부터의 방출과 비해서 수명이 짧은 레일리 산란(Rayleigh scattering)으로 인한 배경 형광을 감소시키기 위해 시간 게이팅된다.
일 실시형태에서, 센서는 CMOS 검출기이다. 일부 실시형태에서, 다수의 색상이 검출된다(예를 들어, 미국 특허 출원 제2009/0194799호에 기재된 바와 같음). 일부 실시형태에서, 검출기는 포베온(Foveon) 검출기(예를 들어, 미국 특허 제6,727,521호에 기재된 바와 같음)이다. 일부 실시형태에서, 센서 어레이는 삼중-접합 다이오드의 어레이이다(예를 들어, 미국 특허 제9,105,537호에 기재된 바와 같음).
일부 실시형태에서, 시약/완충제는 단일 용량(예를 들어, 블리스터 팩을 통해)으로 플로우 셀에 전달된다. 팩 내의 각각의 블리스터는 올리고뉴클레오타이드의 레퍼토리와 다른 올리고를 함유한다. 올리고들 사이에 어떠한 혼합 또는 오염도 없으면, 제1 블리스터가 관통되고, 핵산이 그 내용물에 노출된다. 일부 실시형태에서, 세척 단계는 일련의 다음 블리스터로 이동하기 전에 적용된다. 이것은 상이한 올리고뉴클레오타이드 세트를 물리적으로 분리시키는 역할을 하기 때문에, 이전 세트로부터의 올리고가 영상화 시야에 남아있는 경우 배경 노이즈를 감소시킨다.
일부 실시형태에서, 서열결정은 세포가 배치되고/되거나 폴리뉴클레오타이드가 추출된 동일한 장치 또는 모노리틱 구조에서 발생한다. 일부 실시형태에서, 분석을 시작하기 전에 방법을 수행하는데 필요한 모든 시약을 유체 장치에 사전 로딩한다. 일부 실시형태에서, 시약(예를 들어, 프로브)은 장치 내에 건조 상태로 존재하고, 반응이 진행되기 전에 습윤 및 용해된다.
실시예
실시예 1: 서열결정을 위한 샘플의 제조.
단계 1: 긴 길이의 게놈 DNA를 추출한다.
NA12878 또는 NA18507 세포(코리엘 바이오레포시토리사(Coriell Biorepository))를 배양액에서 성장시키고, 수거한다. 세포를 60℃까지 가열된 저융점 온도 아가로스와 혼합한다. 혼합물을 겔 몰드(예를 들어, 바이오라드사(Bio-Rad)에서 구입)에 붓고, 겔 플러그 내에서 경화시켜, 대략 4×107개 세포(이 수치는 폴리뉴클레오타이드의 목적하는 밀도에 따라 더 높거나 더 낮음)를 생성시켰다. 프로테이나제 K를 함유한 용액 중에 플러그를 침지시킴으로써 겔 플러그 중의 세포를 용해시킨다. 겔 플러그를 TE 완충제(예를 들어, 세척 완충제가 충전된 15㎖ 팔콘 튜브에서, 혼합을 돕기 위해서 작은 기포는 남기고, 튜브 회전기 상에 배치) 중에서 약하게 세척한다. 플러그를 약 1.6㎖ 부피의 트로프에 넣고, 아가레이즈 효소를 사용하여 DNA를 분해시킴으로써 DNA를 추출한다. 0.5M MES pH 5.5 용액을 소화된 DNA에 적용한다. FiberPrep 키트(게노믹 비전사(Genomic Vision), 프랑스 소재) 및 관련 프로토콜을 사용하여 이 단계를 수행하여 생성된 DNA 분자의 평균 길이 300Kb를 제공한다. 대안적으로, 이들 세포주로부터 추출된 게놈 DNA는 코릴사(Corriel)로부터 입수할 수 있고, 넓은 보어 피펫(1.2㎖ 중의 약 10uL는 1μM 미만의 평균 간격을 제공함)을 사용하여 0.5M MES pH 5.5 용액 중에 직접 피펫팅한다.
단계 2: 분자를 표면 상에서 신장시킨다.
단계 1의 마지막 부분은 추출된 폴리뉴클레오타이드를 0.5M MES pH 5.5 용액 중에서 트로프 내에 제공한다. 바이닐실란(예를 들어, 게노믹 비전사의 CombiSlips)으로 코팅된 기판 커버 글라스를 트로프에 담그고, 1 내지 10분 동안 인큐베이션시킨다(필요한 폴리뉴클레오타이드의 밀도에 좌우됨). 이어서, 기계식 풀러(puller), 예컨대, 커버 글라스를 움켜잡기 위해서 클립이 부착된 주사기 펌프를 사용하여 커버 글라스를 서서히 당긴다(대안적으로, 게노믹 비전사로부터의 FiberComb 시스템을 사용함). 커버 글라스 상의 DNA를 가교제(스트라타젠사(Stratagene), 미국 소재)를 사용하여 10,000마이크로 줄의 에너지를 사용하여 표면에 가교시킨다. 공정이 신중하게 수행되면, 표면 상에서 연장된 평균 길이가 200 내지 300Kb인 고분자량(HMW) 폴리뉴클레오타이드가 생성되고, 1Mb 또는 심지어 대략 10Mb 길이보다 큰 분자가 폴리뉴클레오타이드의 집단 사이에 존재한다. 보다 세심한 주의와 최적화를 통해, 평균 길이는 메가베이스 범위로 이동된다(상기 메가베이스 범위 코밍 섹션 참조).
대안으로서, 상기에 언급된 바와 같이, 사전 추출된 DNA(예를 들어, 노바겐 카탈로그 번호 70572-3 또는 프로메가사(Promega)의 Human Male Genomic DNA)가 사용되며, 50Kb보다 큰 게놈 분자의 양호한 비율을 포함한다. 여기서, 대략 5분 동안 침지시키면서 대략 0.2 내지 0.5ng/㎕의 농도는 회절 제한 영상화를 사용하여 높은 분율이 개별적으로 리졸빙되는 분자의 밀도를 제공하기에 충분하다.
단계 3: 플로우 셀을 제조한다.
커버슬립을 유리 슬라이드에 이미 부착된 양면 점착 3M 시트로 만들어진 플로우 셀 가스킷 상에 가압한다. 레이저 커터를 사용하여 가스킷(양면 점착 시트 상에 양면 보호층을 가짐)을 만들어 하나 이상의 유동 채널을 생성시킨다. 유동 채널의 길이는 커버 글라스의 길이보다 길기 때문에, 커버 글라스가 유동 채널의 중앙에 위치될 때, 커버글라스에 의해서 피복되지 않는 각각의 단부에 하나인 채널의 부분이 각각 유체를 유동 채널 내부 및 유동 채널 외부로 분배시키기 위한 유입구 및 유출구로서 각각 사용된다. 유체는 바이닐실란 표면에 부착된 연장된 폴리뉴클레오타이드 위를 통과한다. 유체는 한쪽 단부에서 안전한 면봉 스틱(존슨사(Johnsons), 미국 소재)을 사용하여 다른 쪽 단부에서 유체가 피펫팅될 때 흡입을 생성시킴으로써 채널을 통해 유동된다. 채널을 Phosphate Buffered Saline-Tween 및 Phosphate Buffered Saline(PBS-세척수)로 사전 습윤시킨다.
단계 4: 이중 가닥 DNA를 변성시킨다.
다음 올리고를 첨가하기 전에, 이전 올리고를 효율적으로 세척할 필요가 있으며; 이는 완충제를 사용하여 최대 4회 그리고 선택적으로 변성제, 예컨대, DMSO 또는 알칼리 용액을 사용하여 지속적인 결합을 제거함으로써 수행될 수 있다. 플로우 셀을 통해 알칼리(0.5M NaOH)를 플러싱하고, 실온에서 약 20 내지 60분 동안 인큐베이션시킴으로써 이중 가닥 DNA를 변성시킨다. 이어서 PBS/PBST 세척이 이어진다. 대안적으로, 1시간 동안 1M HCL과 함께 인큐베이션을 수행한 후 PBS/PBST 세척을 수행한다.
단계 5: 부동태화.
선택적으로, 차단 완충제, 예컨대, BlockAid(인비트로젠사(Invitrogen), 미국 소재)를 유입시키고, 약 5 내지 15분 동안 인큐베이션시킨다. 이어서 PBS/PBST 세척이 이어진다.
실시예 2: 변성된 폴리뉴클레오타이드에 대한 올리고뉴클레오타이드의 일시적인 결합에 의한 서열결정
단계 1: 일시적인 결합 조건 하에서 올리고를 첨가한다.
플로우 셀을 PBST 및 선택적으로 완충제 A(10mM Tri-HCl, 100mM NaCl, 0.05% Tween-20, pH 7.5)로 사전 컨디셔닝시킨다. 약 1 내지 10nM의 각각의 올리고를 완충제 B(5mM Tris-HCl, 10mM MgCl2, 1mM EDTA, 0.05% Tween-20, pH 8) 또는 완충제 B + 5mM Tris-HCl, 10mM MgCl2, 1mM EDTA, 0.05% Tween-20, pH 8, 1mM PCA, 1mM PCD, 1mM Trolox) 중의 연장된 변성 폴리뉴클레오타이드에 적용한다. 올리고의 길이는 전형적으로 5 내지 7개의 뉴클레오타이드 범위이고, 반응 온도는 올리고의 Tm에 좌우된다. 본 발명자들이 사용한 하나의 프로브 유형은 화학식 5'-Cy3-NXXXXXN-3'(X는 명시된 염기이고, N은 축퇴 위치임)이며, 1, 2, 4, 6 및 7번 위치에 LNA 뉴클레오타이드를 갖고; 3 및 5번 위치의 DNA 뉴클레오타이드는 시그마 프롤리고사(Sigma Proligo)로부터 구입하였고 이전에 Pihlak 등에 의해서 사용된 바와 같았다. 온도의 결합은 각각의 올리고 서열의 Tm에 관련되었다.
A+ 및 B+ 용액으로 세척한 후, LNA DNA 키메라 올리고 3004 NTgGcGN의 경우 실온에서 B+ 용액 중의 0.5 내지 100nM의 올리고(전형적으로 3㎚ 내지 10㎚)를 사용하여 올리고뉴클레오타이드의 일시적인 결합을 수행한다(여기서 대문자는 LNA이고, 소문자는 DNA 뉴클레오타이드임). 상이한 온도 및/또는 염 조건(및 농도)을 Tm 및 결합 거동에 따라서 상이한 올리고 서열을 위해서 사용한다. FRET 메커니즘이 검출에 사용되는 경우, 훨씬 더 높은 농도의 올리고, 최대 1uM을 사용할 수 있다. 일부 실시형태에서, FRET가 인터칼레이팅 염료 분자(YOYO-1, Sytox Green, Sytox Orange, Sybr Gold 등; 라이프 테크놀로지스사(Life Technologies)로부터의 어느 인터칼레이팅 염료가 사용되는지에 따라서 1000 중의 1 내지 10,000 중의 1로 희석된 형태의 니트(neat)) 사이에 존재하는데, 이것은 일시적으로 형성된 듀플렉스 내에 인터칼레이팅되어, 올리고를 표지한다. 일부 실시형태에서, 인터칼레이팅 염료는 FRET 없이 표지로서 직접 사용된다. 이 경우, 올리고는 표시되지 않는다. 더 저비용일 뿐만 아니라, 비표지된 올리고는 표지된 올리고보다 더 높은 농도로 사용될 수 있는데, 그 이유는 헤테로듀플렉스 형성 시에 인터칼레이팅 염료로부터의 배경이 비인터칼레이팅된 염료보다 100 내지 1000배 더 밝기 때문이다(예를 들어, 어느 인터칼런트가 사용되는지에 따라서).
단계 2: 영상화 - 다중 프레임의 촬영.
유동 채널을 퍼펙트 포커스, TIRF 부착 및 TIRF 대물 레이저 및 Hamamatsu 512x512 백-씨닝(Back-thinned) EMCCD 카메라가 장착된 도립 현미경(inverted microscope)(예를 들어, Nikon Ti-E) 상에 배치한다. 프로브를 완충제 B+에 첨가하고, 선택적으로 영상화를 보충한다.
표면 상에 배치된 폴리뉴클레오타이드에 결합하는 프로브를 약 1500의 TIRF 각에서 TIRF가 부착된 Nikon Ti-E 상의 1.49 NA 100× Nikon 오일 침지 대물 렌즈를 통해서 광섬유 스크램블러(Point Source)를 통해서 컨디셔닝된 75 내지 400mW 레이저 광(예를 들어, 532㎚의 녹색 광)의 내부 전반사에 의해 생성된 에바네센트파에 의해 조명한다. 1.5× 추가 배율을 갖는 동일한 렌즈를 통해 영상을 수집되고, 이색성 거울 및 방출 필터를 통해서 Hamamatsu ImageEM 카메라에 투사시킨다. 퍼펙트 포커스를 사용하여 100 내지 140의 EM 게인으로 50 내지 200밀리초의 5000 내지 30,000 프레임을 촬영한다. 바람직하게는, 초기 비특이적 결합을 표백하기 위해서 초기 초 단위에 높은 레이저 출력(예를 들어, 400mW)을 사용하는데, 이것은 표면으로부터 대부분의 신호의 블랭킷을 개별 결합 사건이 리졸빙되는 더 낮은 밀도까지 감소시킴). 그 후, 레이저 출력을 선택적으로 감소시킨다.
도 22A 내지 도 22E는 표적 폴리뉴클레오타이드에 일시적으로 결합하는 프로브의 조명의 예를 도시한다. 이들 도면에서, 표적 폴리뉴클레오타이드는 인간 DNA로부터 유래된다. 어두운 스팟은 프로브 형광 영역을 나타내며, 더 어두운 스팟은 프로브에 의해 더 자주 결합된 더 많은 영역을 나타낸다(예를 들어, 더 많은 광자가 수집됨). 도 22A 내지 도 22E는 하나의 표적 폴리뉴클레오타이드의 서열결정 동안 포획된 시계열(예를 들어, 비디오)로부터의 영상이다. 지점(2202, 2204, 2206, 2208)은 시간에 따라 다소의 강도로 결합된 (예를 들어, 상이한 세트의 올리고뉴클레오타이드가 표적 폴리뉴클레오타이드에 노출됨에 따라) 폴리뉴클레오타이드의 영역의 예로서 시계열 전체에 걸쳐 제시된다.
영상화 완충제를 첨가한다. 일부 실시형태에서, 영상화 완충제는 일부 실시형태에서 베타-머캅토에탄올, 효소 산화환원 시스템 및/또는 아스코르베이트 및 갈산을 함유하는 완충제로 보충되거나 대체된다. 형광단을 라인을 따라서 검출하는데, 이것은 결합이 발생하였음을 나타낸다. 선택적으로, 플로우 셀이 하나 초과의 채널로 제조되는 경우, 폴리뉴클레오타이드의 밀도 및 폴리뉴클레오타이드 신장의 품질(예를 들어, Intensilight 또는 488㎚ 레이저 조명을 사용하여)을 확인하기 위해 채널 중 하나를 YOYO-1 인터칼레이팅 염료로 염색한다.
단계 3: 영상화 - 다른 장소로의 이동(선택적인 단계).
(플로우 셀의 일부로서 유리 슬라이드에 대한 부착을 통해) Nikon Ti-e의 슬라이드 홀더에 장착된 커버 유리를 대물 렌즈(따라서 CCD)에 대해 변환시켜 별개의 장소를 영상화한다. 다른 장소(제1 장소에서 CCD의 관측 시야 밖)에 제공된 폴리뉴클레오타이드 또는 폴리뉴클레오타이드의 부분에 결합하는 프로브가 영상화되도록 다수의 장소에서 영상화를 수행한다. 각각의 장소로부터의 영상 데이터를 컴퓨터 메모리에 저장한다.
단계 4: 다음 올리고 세트를 추가한다.
다음 세트의 올리고를 첨가하고, 폴리뉴클레오타이드 전체가 서열결정될 때까지 단계 1 내지 3을 반복한다.
단계 5: 결합 장소 및 아이덴티티를 결정한다.
각각의 형광 점 신호의 장소를 검출하고, 상부에 결합된 표지로부터의 형광이 투사되는 픽셀 장소를 기록한다. 예를 들어, 광학 필터에 의한 파장 선택을 사용하여 어느 표지된 올리고뉴클레오타이드가 결합되었는지를 결정함으로써 결합된 올리고뉴클레오타이드의 아이덴티티를 결정하고, 형광단은 다수의 필터에 걸쳐 검출되며, 이 경우에 필터 세트에 걸친 각각의 형광단의 방출 서명을 사용하여 형광단 및 그에 따른 올리고뉴클레오타이드의 아이덴티티를 결정한다. 선택적으로, 플로우 셀이 하나 초과의 채널로 제조되는 경우, 폴리뉴클레오타이드의 밀도 및 폴리뉴클레오타이드 신장의 품질(예를 들어, Intensilight 또는 488㎚ 레이저 조명을 사용함으로써)을 확인하기 위해 채널 중 하나를 YOYO-1 인터칼레이팅 염료로 염색한다. 올리고뉴클레오타이드를 표지하기 위해 사용되는 각각의 형광 파장마다 하나씩, 하나 이상의 영상 또는 무비를 촬영한다.
단계 6: 데이터 처리.
이중 가닥의 두 가닥이 표면에 부착된 상태로 유지되는 경우, 올리고의 결합은 이중 가닥의 두 가닥 상의 상보성 장소에 대해서 동시에 일어난다. 이어서, 전체 데이터 세트를 분석하여 핵산 상의 특정 위치에 근접하여 국지화 신호를 제공하는 올리고 세트를 찾고, 그 장소는 폴리뉴클레오타이드에서 선택된 지점에 상응하는 올리고 서열을 중첩시킴으로써 확인되고; 이어서 이것은 두 개의 중첩된 타일링 올리고 시리즈를 각각 보여준다. 국지성의 다음 신호의 어느 타일링 시리즈가 피팅하는지는 피팅하는 타일링 시리즈는 그것이 어느 가닥에 결합하는지를 나타낸다.
가닥이 표면에 고정된 상태로 유지됨에 따라, 각각의 올리고에 대해 기록된 결합 장소는 알고리즘을 실행하는 소프트웨어 스크립트를 사용하여 중첩될 수 있다. 이는 올리고 결합 장소가 변성된 듀플렉스의 각 가닥에 대한 별개의(그러나 상보성이어야 함) 경로인 2개의 올리고뉴클레오타이드 서열 타일링 경로의 프레임워크 내에 속한다는 것을 나타내는 신호를 초래한다. 완결되면 각각의 타일링 경로는 가닥의 전체 길이에 걸쳐있다. 이어서 각각의 가닥에 대한 타일링 서열을 비교하여 이중 가닥(2D로도 알려짐) 컨센서스 서열을 제공한다. 타일링 경로 중 하나에 갭이 존재하면, 상보성 타일링 경로의 서열을 취한다. 일부 실시형태에서, 염기 배정 및 간극을 폐쇄하기 위해, 서열을 동일한 서열의 다수의 카피 또는 참조 서열과 비교한다.
실시예 3: 폴리뉴클레오타이드 상의 에피-마크의 장소의 검출.
선택적으로, 올리고 결합 공정 전에(또는 때때로 그 후에 또는 그 동안) 후성유전학적 결합 시약의 일시적인 결합을 수행한다. 어느 결합 시약이 사용되는지에 따라서, 변성 전 또는 후에 결합을 수행한다. 항-메틸 C 항체의 경우, 변성 DNA상에서 결합을 수행한 반면, 메틸 결합 단백질의 경우, 임의의 변성 단계 전에 이중 가닥 DNA상에서 결합을 수행한다.
단계 1 - 메틸-결합 시약의 일시적인 결합.
변성 후, 플로우 셀을 PBS-세척액으로 플러싱시키고, Cy3B 표지된 항-메틸 항체 3D3 클론(다이아지노드사(Diagenode))을 PBS에 첨가한다.
대안적으로, 변성 전에, 플로우 셀을 PBS로 플러싱시키고, Cy3B- 표지된 MBD1을 첨가한다.
일시적인 올리고 결합에 대해 상기에 기재된 바와 같이 영상화를 수행한다.
단계 2: 메틸-결합 시약을 제거한다.
전형적으로, 에피-분석을 서열결정 전에 수행한다. 따라서, 선택적으로 메틸-결합 시약을 플러싱시키고, 그 후에 폴리뉴클레오타이드를 플러싱시키고, 그 후에 서열결정을 시작한다. 이것은 다수의 사이클의 PBS/PBST 및/또는 고염 완충제 및 SDS를 통과시키고, 이어서 제거가 발생했는지를 영상화함으로써 확인하여 수행된다. 무시해도 될 정도보다 더 많은 양의 결합 시약이 남아있는 것이 명백하면, 더 가혹한 처리제, 예컨대, 카오트로픽염, GuCL을 유동시켜 남아있는 시약을 제거한다.
단계 3: 데이터 상관.
서열결정 후 에피-게놈 데이터를 획득하고, 서열결정 결합 장소 및 에피-결합 장소 간의 상관관계를 만들고 메틸화의 서열 컨텍스트를 제공한다.
실시예 4: 람다 파지 DNA에서의 일시적 결합으로부터 수집된 형광.
도 23A, 도 23B 및 도 23C는 일시적인 결합 사건의 예를 도시한다. 이들은 실온에서 완충제 B+ 중의 1.5nM 농도에서 올리고 I.D. Lin2621, Cy3 표지된 5 'NAgCgGN 3'의 일시적인 결합을 총괄적으로 도시한다. 표적 폴리뉴클레오타이드는 MES pH 5.5 완충제 + 0.1M NaCl 중의 바이닐 실란 표면(게노믹 비전사) 상에 수동으로 코밍된 람다 파지 게놈이다. Point Source Fiber Optic 스크램블러를 통해서 400 mW에서의 레이저 532㎚. 형광은 532㎚ 여기 밴드, TIRF 대물 100×, 1.49NA 및 여분의 1.5× 배율을 포함하는 TIRF 부착 및 다색으로 수집되었다. 진동 단리를 구현하지 않았다. 100 EM 게인 설정으로 Hamamatsu ImageEM 512×512 상의 퍼펙트 포커스를 사용하여 영상을 캡처하였다. 10000 프레임을 100ms에 걸쳐 수집하였다. 올리고뉴클레오타이드 프로브 세트에서 Cy3의 농도는 대략 250nM 내지 300nM이었다. 도 23A는 ThunderSTORM에서 교차-상관 드리프트 보정 전에 수집된 형광을 디스플레이한다. 도 23B는 스케일 막대를 사용하여 교차-상관 드리프트 보정 후에 수집된 형광을 디스플레이한다. 도 23C는 도 23B의 확대된 영역에서 형광을 디스플레이한다. 도 23C는 Lin2621의 다수의 위치에 대한 지속적인 결합에 의해 추적된 긴 폴리뉴클레오타이드 가닥을 나타낸다. 영상으로부터, 표적 폴리뉴클레오타이드 가닥이 Cy3 방출의 회절 한계보다 가까운 거리에서 영상화 표면 상에 부동화되고 연장되었다는 것이 명백하다.
실시예 5: 합성 DNA에서 일시적인 결합으로부터 수집된 형광
도 24는 3개의 상이한 폴리뉴클레오타이드 가닥으로부터 수집된 형광 데이터의 예를 도시한다. 다중 프로빙 및 세척 단계를 합성 3킬로베이스 변성 이중 가닥 DNA에 대해서 나타낸다. 바이닐실란 표면 상의 MES pH 5.5에서 합성 DNA를 코밍하고, 변성시켰다. 일련의 결합 및 세척 단계를 수행하였고, 비디오를 ThunderSTORM을 사용하여 ImageJ에서 기록 및 처리하였다. 주변 온도에서 완충제 B+에서 10nM 올리고로 수행된 하기 실험 시리즈에 대한 초고해상도 영상으로부터 3개의 예시적인 가닥(1, 2, 3)을 절제하였다: 올리고 3004 결합, 세척, 올리고 2879 결합, 세척, 올리고 3006 결합, 세척 및 올리고 3004 결합(다시). 이는 결합 맵이 일시적 결합으로부터 유래될 수 있고, 결합 패턴이 세척에 의해 소거될 수 있고, 이어서 합성 DNA의 동일한 제1 가닥 및 제2 가닥 상에 상이한 올리고를 갖는 상이한 결합 패턴이 수득된다는 것을 나타낸다. 시리즈의 마지막에서 올리고 3004로의 복귀 및 시리즈에서 첫 번째로 사용될 때 패턴과의 유사성은 어떠한 최적화도 시도하지 않고 공정의 견고성을 나타낸다.
실험적으로 결정된 결합 장소는 예상된 것에 상응하는데, 듀플렉스 가닥 1 및 3은 4개의 가능한 완벽한 매치 결합 중 3개를 나타내고, 듀플렉스 가닥 2는 4개의 결합 장소 모두 및 하나의 현저한 미스매치 장소를 나타낸다. 올리고 3004를 사용한 제2 프로빙은 아마도 더 적은 미스매치로 인해서, 더 깨끗한 신호를 나타내는 것으로 보인다. 이것은 레이저광에 장기간 노출되어 가열되어 온도가 약간 상승할 가능성과 일관된다.
본 실험에 사용된 올리고 서열은 다음과 같다(대문자 염기는 잠금 핵산 LNA임):
올리고 3004: 5' cy3 NTgGcGN
올리고 2879: 5' cy3 NGgCgAN
올리고 3006: 5' cy3 NTgGgCN:
3kbp 합성 주형의 서열에 대한 서열 목록(문헌의 마지막)은 다음과 같다:
Figure pct00026
Figure pct00027
실시예 6: 단일 세포의 통합 분리, 핵산 추출 및 서열결정.
단계 1: 마이크로유체 구조물의 설계 및 제조
마이크로채널은 전형적인 직경 15um의 인간 암 세포주로부터의 세포를 수용하도록 설계되어, 마이크로유체 네트워크는 최소 깊이 및 폭이 33um이다. 이 장치는 단일 세포 트랩을 공급하기 위해 단일 채널로 병합되는 세포용 유입구 및 완충제용 유입구를 포함한다(도 17에 도시됨). 셀 유입구와 완충제 유입구 사이의 교차점에서, 세포는 하나 이상의 트랩이 위치된 공급 채널의 측벽을 따라 정렬된다. 각각의 트랩은 인간 암 세포주로부터 세포를 포획하도록 하는 치수의 단순 수축이다. 세포 트래핑을 위한 수축은 사다리꼴 단면을 갖는다: 그것은 바닥에서 폭이 4.3um, 중간 깊이에서 6um, 상부에서 8um이고, 깊이는 33um이다. 각각의 세포 트랩은 공급 채널을 분기(bifurcation)에 연결하는데, 한 면은 폐기물 채널(도 17에 나타내지 않음)이고, 나머지 면은 유동-스트레치 섹션(핵산 연장 및 서열결정용)을 포함하는 채널(각각의 셀에 대해서 하나)이다. 유동-스트레치 섹션은 20um(또는 최대 2㎜) 폭, 450um 길이, 100㎚(또는 최대 2um 깊이) 채널로 이루어진다. 일부 실시형태에서, 유동-스트레치 채널은 더 좁게 시작되고, 언급된 치수로 넓어진다.
단계 2: 장치 제조
장치는 TOPAS 5013(TOPAS)의 사출 성형을 사용하여 니켈 심을 복제함으로써 제조된다. 간략하면, 규소 마스터는 UV 리쏘그래피(lithography) 및 반응성 이온 에칭에 의해서 제조된다. 100-㎚ NiV 시딩층을 증착시키고, 니켈을 최종 두께 330um로 전기 도금한다. Si 마스터를 KOH 중에서 화학적으로 에칭한다. 사출 성형은 250℃의 용융 온도, 120℃의 주형 온도, 2초 동안 최대 유지 압력 1,500bar 및 20㎝3/s 내지 45㎝3/s의 사출 속도를 사용하여 수행된다. 마지막으로, 커버글라스(1.5)를 장치에 결합하거나 150um TOPAS 포일을 사용하여 0.51㎫의 최대 압력 하에서 조합된 UV 및 열처리에 의해서 장치를 밀봉한다. 장치를 밀봉하기 전에 규소 웨이퍼로부터 전기 도금된 2개의 편평한 니켈 플레이트 사이에 포일을 140℃ 및 5.1㎫에서 20분 동안 가압함으로써 포일의 표면 조도를 감소시킨다. 이는, 장치의 덮개가 광학적으로 편평해지는 것을 보장하여, 고-NA 광학 현미경이 가능해진다. 이 장치를 오일 TIRF 대물 렌즈(100×/NA 1.49) 및 EMCCD 카메라(Hamamatsu ImageEM 512)가 장착된 역 형광 현미경(Nikon Ti-E) 상에 장착한다. 유체는 0 내지 10mbar 범위의 압력에서 압력 컨트롤러(MFCS, 풀루이전트사(Fluigent))를 사용하여 장치를 통해 구동된다. 이 장치를 에탄올로 프라이밍 한 후, 가스를 제거하고, FACSFlow Sheath Fluid(비디 바이오사이언시스사(BD Biosciences))를 유동-스트레치 장치를 연결하는 마이크로채널을 제외한 모든 마이크로 채널에 로딩한다. 유동 스트레치 채널의 유출구에 양압을 가하면서, 그리고 용액이 도입되는 공급 채널의 유입구에 양압을 유지하면서, 폐기물 채널의 유출구에 음압 또는 흡입을 가함으로써 선택적인 로딩을 달성한다. 단일-분자 영상화 및 전기영동에 적합한 완충제(0.5× TBE + 0.5 % v/v Triton-X100 + 1% v/v 베타-머캅토에탄올, BME)을 유동-스트레치 장치의 채널에 로딩한다. 이 완충제는 유동-스트레치 섹션에서의 DNA 점착을 방지하고, 유동-스트레치 섹션의 높이가 낮은 경우 추출된 DNA의 도입을 방해할 수 있는 전기 삼투 유동을 억제한다.
단계 3: 세포 제조
LS174T 결장직장암 세포를 10% 우태아 혈청(FBS; 오토젠-바이오클리어사(Autogen-Bioclear UK Ltd.)) 및 1% 페니실린/스트렙토마이신(론자사(Lonza))을 함유한 둘베코 변형 이글 배지(Dulbecco's modified Eagle's medium: DMEM; 깁코사(Gibco))에서 배양한 후, FBS 중의 10% DMSO에서 밀리리터당 1.7 106개 세포의 농도로 동결시킨다. 해동 후, 세포 현탁액을 FACSFlow 완충제과 1:1로 혼합하고, 28.8×g(A-4-44, 에펜토르프사(Eppendorf))에서 5분 동안 원심분리시키고, FACSFlow 완충제에 재현탁시켰다. 마지막으로, 세포를 1uM Calcein AM(인비트로젠사)으로 염색하고 밀리리터당 0.35 106개 세포로 칩에 로딩한다. 대략 5 내지 10,000개의 세포를 로딩하고, 각각의 트랩에 트래핑된 첫 번째 세포를 분석한다.
단계 4: 작동
세포와 및 완충제를 동시에 도입하여, 트랩이 위치한 마이크로채널의 측벽을 따라 세포가 정렬된다. 단일 세포가 포획되고, 30nL/분까지 트랩을 통한 완충제 유동을 위해서 트랩에 유지된다. 0.5× TBE + 0.5 % v/v Triton-X100 + 0.1uM YOYO-1(인비트로젠사)로 구성된 용해 완충제를 유입구 중 하나에 로딩하고, 10nL/분으로 트랩을 통해 10분 동안 주입한다. 이어서, 용액을 모든 웰 내에서 YOYO-1이 없는 완충제로 교환시켜 염색을 중단시킨다. 다음으로, 세포핵은 1nW/(um)2의 선량으로 최대 300초 동안 청색 여기광에 노출되어, DNA의 부분적인 포토니킹(photonicking)을 유발한다(www.pnas.org/cgi/doi/10.1073/pnas.1804194115의 SI 부록 참조). 이어서, 완충제가 BME(0.5× TBE + 0.5% v/v triton-X100 + 1% v/v BME)를 함유하는 용액으로 변경되고, 형광 램프의 강도는 여전히 형광 영상화를 허용하는 최소 강도로 감소된다. 다음으로, 온도가 60℃로 증가되고, 단백질분해 용액(200㎍㎖-1 초과의 프레테이나제 K(퀴아젠사(Qiagen)), 0.5× TBE + 0.5% v/v Triton-X100 + 1% v/v BME + 200g/㎖)이 도입되고, 트랩을 통해 용해물이 배출된다. DNA는 인접한 유동 신장 섹션을 통해 이동하고, 단일 분자 영상화(100×, NA 1.49, 120-㎚ 픽셀 크기를 제공하는 추가 1.5× 배율)를 위해 오일 침지 대물 렌즈가 제자리로 이동된다. 유동-스트레치 섹션을 가로질러 5 내지 10V의 전압을 인가함으로써 전기영동을 사용하여 DNA 단편이 마이크로채널로부터 유동-스트레치 장치로 도입된다. DNA 단편이 반대 마이크로채널 내에 양 단부를 갖는 경우, 전압이 꺼진다. 100 내지 150%로 신장된 분자의 450um 부분은 단일 세포로부터의 추출된 게놈 DNA의 1메가베이스 초과의 길이에 상응한다. 일부 실시형태에서, 단백질분해 후, 포획 완충제 대신 0.5×TBE로 대체함으로써 장치를 통해 DNA 내용물이 밀려나고; 이러한 실시형태에서, 유동 신장 섹션 치수는 선택적으로 더 커서, 수 천 메가베이스 단편이 동시에 (소수성 또는 정전기적 상호작용에 의해서) 포획되고, 채널 내부에서 신장될 수 있다. 이것은 pH 완충제 8(예를 들어, HEPES)을 사용하여 수행되며, 여기서 결합된 커버글라스는 APTES 또는 폴리-라이신과 같은 양전하를 보유하거나, 바이닐실란 커버글라스가 결합되고, pH 5.5 내지 5.7에서 0.5M MES 완충제를 사용하여 DNA로 유동하고, 이어서 이것은 공기와 함께 MES 완충제를 따름으로써 코밍된다. 포일이 Zeonex를 포함하면, 분자 코밍은 pH 5.7에서 0.6M MES 완충제로 수행될 수 있다.
이중 가닥 핵산이 부동화되면, 변성 용액, 0.5M NaOH 및/또는 6% DMSO가 유동된다. 이어서, 단일 세포 샘플은 본 발명의 서열결정 방법을 위해 준비되며, 여기서 올리고 레퍼토리가 흐르고 올리고 결합이 영상화된다.
일부 실시형태에서, 세포 용해는 2 단계이므로, RNA가 흐름 신장 섹션 내에서 오염되지 않고 형광을 유발하지 않는다. 여기서, 제1 용해 완충제(예를 들어, DNA 인터칼레이팅 YOYO-1 염료가 첨가된 0.5%(v/v) Triton X-100을 함유하는 0.5× TBE)가 적용된다. 이 완충제는 세포막을 용해시켜 10 내지 20㎕의 뉴클레아제-무함유 H2O로 충전된 트랩 유출구로 사이토졸 내용물을 방출하고, 트랩에 DNA가 있는 핵을 남긴다(예를 들어, 문헌[Strijp et al. Sci Rep. 7:11030 (2017)]에 기재된 바와 같음). 각각의 세포의 사이토졸 내용물이 용해되고 폐기물 유출구로 분로되거나, 또는 장치는 DNA를 위한 유동 스트레치 섹션과 분리된 RNA를 위한 유동-스트레치 섹션을 갖도록 설계된다. 일부 실시형태에서, RNA는 폴리A RNA를 포획하는 올리고 dT로 코팅된 별도의 유동 스트레치 섹션으로 보내진다. 일부 실시형태에서, RNA를 위한 유동 스트레치 섹션은 나노웰 또는 나노피트를 포함하는데(Marie et al, Nanoscale DOI: 10.1039/c7nr06016e) 2017), 여기서 RNA가 트래핑되고, 효소 시약을 사용하여 예를 들어, 폴리A 중합효소를 포획한다. 핵 용해는 제2 완충제(0.5% (v/v) Triton X-100 및 프로테이나제 K를 함유하는 0.5x TBE)으로 수행되고, DNA는 DNA를 위한 유동-스트레치 섹션으로 분로된다.
핵산의 손실을 최소화하기 위해서, 트랩 및 유동 스트레치 섹션으로부터의 거리는 짧고, 장치 벽은 지질로의 코팅에 의한 것을 포함하여, 양호하게 부동태화된다(예를 들어, 문헌[Persson et al, Nanoletters 12 :2260-5 (2012)]에 기재된 바와 같음).
인용된 참고문헌 및 대안적인 실시형태
본 명세서에 인용된 모든 참고 문헌은 각각의 개별 간행물 또는 특허 또는 특허 출원이 모든 목적을 위해 그 전체가 참조에 의해 포함되는 것으로 구체적이고 개별적으로 지시된 것과 동일한 정도로 전체적으로 그리고 모든 목적을 위해 본 명세서에 참조에 의해 포함된다.
모든 표제 및 부제목은 본 명세서에서 편의를 위해서 사용되며, 어떠한 방식으로든 본 발명을 제한하는 것으로 해석되어서는 안 된다.
본 명세서에 제공된 임의의 및 모든 예 또는 예시적인 언어(예를 들어, "예컨대")의 사용은 단지 본 발명을 더 잘 설명하기 위한 것이며 달리 청구되지 않는 한 범주에 제한을 두지 않는다. 본 명세서의 어떤 언어도 본 발명의 실시에 필수적인 것으로 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안 된다.
용어 제1, 제2 등이 다양한 요소를 설명하기 위해서 본 명세서에서 사용될 수 있지만, 이들 요소는 이들 용어에 의해서 제한되지 않아야 한다는 것을 또한 이해할 것이다. 이들 용어는 하나의 요소를 또 다른 요소와 구별하기 위해서만 사용된다. 예를 들어, 본 개시내용의 범주로부터 벗어나지 않으면서 제1 대상체는 제2 대상체라고 지칭될 수 있고, 유사하게 제2 대상체는 제1 대상체라고 지칭될 수 있다. 제1 대상체 및 제2 대상체는 둘 다 대상체이지만, 이들은 동일한 대상체가 아니다.
본 개시내용에 사용된 용어는 단지 특정 실시형태 설명하려는 목적을 위해서이며, 본 발명의 제한이도록 의도되지 않는다. 설명 및 첨부된 청구범위에 사용된 바와 같이, 단수 표현은 그 문맥이 달리 명확하게 나타내지 않는 한, 복수 형태도 또한 포함하도록 의도된다. 용어 "및/또는"은 본 명세서에서 사용되는 바와 같이 연관된 열거된 항목 중 하나 이상의 임의의 및 모든 가능한 조합을 지칭하고, 포함하도록 또한 이해될 것이다. 추가로, 용어 "포함하다" 및/또는 "포함하는"은 본 명세서에서 사용되는 경우 제시된 특징부, 정수, 단계, 작동, 요소 및/또는 성분의 존재를 명시하지만, 하나 이상의 다른 특징부, 정수, 단계, 작동 요소, 성분 및/또는 이의 군의 존재 또는 부가를 불가능하게 하지 않는다.
본 명세서에서 사용되는 바와 같이, 용어 "하면"은 문맥에 따라서, "하는 경우" 또는 "할 때" 또는 "결정하는 것에 반응하여" 또는 "검출하는 것에 반응하여"를 의미하는 것으로 이해될 수 있다. 유사하게, 구 "그것이 결정되면" 또는 "[언급된 조건 또는 사건]이 검출되면"은 "일단 결정하면" 또는 "결정하는 것에 반응하여" 또는 "(언급된 조건 또는 사건)을 일단 검출하면" 또는 "(언급된 조건 또는 사건)을 검출하는 것에 반응하여"를 의미하는 것으로 이해될 수 있다.
본 명세서에서 특허 문헌의 인용 및 혼입은 단지 편의를 위해서 수행되며, 이러한 특허 문헌의 유효성, 특허성 및/또는 시행 가능성의 어떠한 견해도 반영하지 않는다.
본 발명은 비일시적 컴퓨터 판독 가능 저장 매체에 내장된 컴퓨터 프로그램 메커니즘을 포함하는 컴퓨터 프로그램 제품으로서 구현될 수 있다. 예를 들어, 컴퓨터 프로그램 제품은 도 1의 임의의 조합으로 도시된 프로그램 모듈을 포함할 수 있다. 이들 프로그램 모듈은 CD-ROM, DVD, 자성 디스크 저장 제품, USB 키, 또는 임의의 다른 비-일시적인 컴퓨터 판독 가능한 데이터 또는 프로그램 저장 제품 상에 저장될 수 있다.
본 발명은 본 명세서의 교시 및 인용된 참고 문헌에 비추어 가장 철저하게 이해된다. 당업자에게 명백한 바와 같이, 그 사상 및 범주를 벗어나지 않고 많은 수정 및 변형이 이루어질 수 있다. 본 명세서에 기재된 구체적인 실시형태는 단지 예의 방식으로 제공된다. 실시형태는 원리 및 그 실제 응용을 가장 잘 설명하기 위해 선택 및 기재되어, 당업자가 본 발명 및 다양한 실시형태가 고려된 특정 용도에 적합한 다양한 변형으로 최대한 활용할 수 있게 한다. 본 발명은 첨부된 청구범위의 조건에 의해서만, 그리고 그러한 청구범위가 부여되는 등가물의 전체 범위에 의해서만 제한된다.

Claims (208)

  1. 핵산의 서열결정(sequencing) 방법으로서,
    (a) 상기 핵산을 시험 기질 상에 이중 가닥의 선형의 신장된 형태(double stranded linearized stretched form)로 고정(fixing)시킴으로써 고정되고 신장된 이중 가닥 핵산을 형성하는 단계;
    (b) 상기 고정되고 신장된 이중 가닥 핵산을 상기 시험 기질 상에 단일 가닥 형태로 변성(denaturing)시킴으로써 상기 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 단계로서, 상기 고정된 제2 가닥의 각자의 염기는 상기 고정된 제1 가닥의 상응하는 상보성 염기에 인접하게 놓이는, 상기 변성시키는 단계;
    (c) 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥을 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀(pool)에 노출시키는 단계로서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖되, 상기 노출시키는 단계 (c)는 상기 각자의 올리고뉴클레오타이드 프로브의 상기 각자의 풀의 개별 프로브가 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 상기 고정된 제1 가닥의 일부 또는 상기 고정된 제2 가닥의 일부와 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써 광학 활성의 각자의 인스턴스(respective instance of optical activity)를 발생시키는 것을 허용하는 조건 하에서 일어나는, 상기 노출시키는 단계;
    (d) 2차원 영상화기를 사용하여 상기 노출시키는 단계 (c) 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 상기 시험 기질 상의 장소 및 지속기간을 측정하는 단계;
    (e) 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복함으로써, 상기 시험 기질 상의 복수의 위치 세트를 획득하는 단계로서, 상기 시험 기질 상의 각각의 각자의 위치 세트는 상기 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응하는, 상기 반복하는 단계; 및
    (f) 상기 복수의 위치 세트에 의해서 표현된 상기 시험 기질 상의 상기 위치를 컴파일링(compiling)함으로써 상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계
    를 포함하는, 핵산의 서열결정 방법.
  2. 제1항에 있어서, 상기 노출시키는 단계 (c)는 상기 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 상기 개별 프로브에 상보성인 상기 고정된 제1 가닥의 일부 또는 상기 고정된 제2 가닥의 일부에 일시적으로 그리고 가역적으로 결합하고, 이와 상기 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어나는, 핵산의 서열결정 방법.
  3. 제1항에 있어서, 상기 노출시키는 단계 (c)는 상가 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 상기 개별 프로브에 상보성인 상기 고정된 제1 가닥의 일부 또는 상기 고정된 제2 가닥의 일부에 일시적으로 그리고 가역적으로 반복적으로 결합하고, 이와 상기 각자의 헤테로듀플렉스를 형성함으로써, 상기 광학 활성의 각자의 인스턴스를 반복적으로 발생시키는 것을 허용하는 조건 하에서 일어나는, 핵산의 서열결정 방법.
  4. 제1항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 표지와 결합되어 있는, 핵산의 서열결정 방법.
  5. 제1항에 있어서,
    상기 노출시키는 단계는 염료 형태의 제1 표지의 존재 하에서 일어나고,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지와 결합되어 있고, 그리고
    상기 제1 표지는, 상기 제1 표지 및 상기 제2 표지가 서로에 인접하는 경우 제2 표지가 형광을 내도록 하는, 핵산의 서열결정 방법.
  6. 제1항에 있어서,
    상기 노출시키는 단계는 인터칼레이팅 염료(intercalating dye)의 존재 하에서 일어나고, 그리고
    상기 광학 활성의 각자의 인스턴스는 상기 올리고뉴클레오타이드와 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 간의 상기 각자의 헤테로듀플렉스 내에 인터칼레이팅된 인터칼레이팅 염료의 형광으로부터 유래되되, 상기 광학 활성의 각자의 인스턴스는 상기 인터칼레이팅 염료가 상기 각자의 헤테로듀플렉스를 인터칼레이팅하기 전의 상기 인터칼레이팅 염료의 형광보다 더 큰, 핵산의 서열결정 방법.
  7. 제1항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 하나 초과의 올리고뉴클레오타이드 프로브는 상기 노출시키는 단계 (c)의 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되는, 핵산의 서열결정 방법.
  8. 제7항에 있어서,
    상기 노출시키는 단계 (c)의 상기 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되는 상기 올리고뉴클레오타이드 프로브의 세트 내의 상이한 올리고뉴클레오타이드 프로브는 상이한 표지와 회합되는(associated), 핵산의 서열결정 방법.
  9. 제1항에 있어서, 상기 노출시키는 단계 (c)는 상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 온도에서 수행되고, 상기 노출시키는 단계 (c) 및 측정하는 단계 (d)를 반복하는 단계 (e)는 상기 제1 올리고뉴클레오타이드에 대해서 제2 온도에서 노출시키는 단계 (c) 및 측정하는 단계 (d)를 수행하는 것을 포함하는, 핵산의 서열결정 방법.
  10. 제1항에 있어서,
    상기 노출시키는 단계 (c)는 상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 온도에서 수행되고,
    상기 노출시키는 단계 (c) 및 상기 측정하는 단계를 반복하는 단계 (e)의 인스턴스는 복수의 상이한 온도 각각에서 상기 제1 올리고뉴클레오타이드에 대해서 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 포함하고,
    상기 제1 온도 및 상기 복수의 상이한 온도의 각각의 온도에 대해서 측정하는 단계 (d)에 의해서 기록된 광학 활성의 상기 측정된 장소 및 지속기간을 사용하여 상기 제1 올리고뉴클레오타이드 프로브에 대한 용융 곡선을 구축하는 것을 더 포함하는, 핵산의 서열결정 방법.
  11. 제1항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트는 상기 올리고뉴클레오타이드 프로브의 복수의 하위세트를 포함하되, 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하는 단계 (e)는 상기 올리고뉴클레오타이드 프로브의 복수의 하위세트 내의 올리고뉴클레오타이드의 각각의 각자의 하위세트에 대해서 수행되는, 핵산의 서열결정 방법.
  12. 제1항에 있어서,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 광학 활성의 각자의 인스턴스를 식별하고, 피팅 함수에 피팅시켜 상기 2차원 영상화기에 의해서 획득된 데이터의 프레임 내에서 상기 광학 활성의 각자의 인스턴스의 중심을 식별 및 피팅시키는 단계를 포함하고, 그리고
    상기 광학 활성의 각자의 인스턴스의 상기 중심은 상기 시험 기질 상의 상기 광학 활성의 각자의 인스턴스의 상기 위치인 것으로 간주되는, 핵산의 서열결정 방법.
  13. 제1항에 있어서,
    상기 광학 활성의 각자의 인스턴스는 상기 2차원 영상화기에 의해서 측정된 복수의 프레임에 걸쳐서 지속되고,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 광학 활성의 각자의 인스턴스를 상기 복수의 프레임에 걸쳐서 식별하고, 피팅 함수에 피팅시켜 상기 복수의 프레임에 걸쳐서 상기 광학 활성의 각자의 인스턴스의 중심을 식별하는 단계를 포함하고, 그리고
    상기 광학 활성의 각자의 인스턴스의 상기 중심은 상기 복수의 프레임에 걸쳐서 상기 시험 기질 상의 상기 광학 활성의 각자의 인스턴스의 상기 위치인 것으로 간주되는, 핵산의 서열결정 방법.
  14. 제1항에 있어서,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 2차원 영상화기에 의해서 측정된 데이터의 프레임을 훈련된 콘볼루션 신경망(trained convolutional neural network)에 투입하는 단계를 포함하고,
    상기 데이터의 프레임은 광학 활성의 복수의 인스턴스 중에서 상기 광학 활성의 각자의 인스턴스를 포함하며,
    상기 광학 활성의 복수의 인스턴스 내의 광학 활성의 각각의 인스턴스는 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥의 일부에 결합하는 개별 프로브에 상응하고,
    상기 투입에 반응하여, 상기 훈련된 콘볼루션 신경망은 상기 광학 활성의 복수의 인스턴스 내의 광학 활성의 하나 이상의 인스턴스 각각의 상기 시험 기질 상의 위치를 식별하는, 핵산의 서열결정 방법.
  15. 제12항 내지 제14항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 20㎚의 국지화 정밀도(localization precision)로 상기 시험 기질 상의 위치에 리졸빙(resolving)하는 것을 포함하는, 핵산의 서열결정 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계 (d)는 상기 위치에서 5000개 초과의 광자를 측정하는, 핵산의 서열결정 방법.
  17. 제1항 내지 제16항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스는 상기 시험 기질에 대해서 관찰된 배경에 대한 미리 결정된 표준 편차의 수보다 더 큰, 핵산의 서열결정 방법.
  18. 제17항에 있어서, 상기 미리 결정된 표준 편차의 수는 3 표준 편차보다 더 큰, 핵산의 서열결정 방법.
  19. 제1항 내지 제18항 중 어느 한 항에 있어서, 상기 복수의 올리고뉴클레오타이드 프로브 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 고유한 N량체 서열을 포함하되, N은 세트 {1, 2, 3, 4, 5, 6, 7, 8, 9 및 10}의 정수이고, 길이 N의 모든 고유한 N량체 서열은 상기 복수의 올리고뉴클레오타이드 프로브로 표현되는, 핵산의 서열결정 방법.
  20. 제19항에 있어서, 상기 고유한 N량체 서열은 하나 이상의 축퇴 뉴클레오타이드 위치에 의해서 점유된 하나 이상의 뉴클레오타이드 위치를 포함하는, 핵산의 서열결정 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 상기 핵산은 적어도 140개 염기 길이이고, 상기 결정하는 단계 (f)는 70% 초과의 상기 핵산 서열의 상기 서열의 커버리지(coverage)를 결정하는, 핵산의 서열결정 방법.
  22. 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 핵산은 적어도 10,000개 염기 길이인, 핵산의 서열결정 방법.
  23. 제1항 내지 제22항 중 어느 한 항에 있어서, 상기 핵산의 길이는 대략 1,000,000개 염기 길이에서 프아송 분포(Poisson distribution)인, 핵산의 서열결정 방법.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 상기 시험 기질을 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하기 전에 세척함으로써, 상기 시험 기질을 상기 올리고뉴클레오타이드 프로브의 세트 내의 또 다른 올리고뉴클레오타이드 프로브에 노출시키기 전에 상기 시험 기질로부터 각자의 올리고뉴클레오타이드 프로브를 제거하는, 핵산의 서열결정 방법.
  25. 제1항 내지 제24항 중 어느 한 항에 있어서, 상기 고정시키는 단계 (a)는 분자 코밍(molecular combing)(감소 메니스커스(receding meniscus)), 유동 신장 나노컨파인먼트(flow stretching nanoconfinement) 또는 전기-신장에 의해서 상기 시험 기질 상에 상기 핵산을 적용하는 것을 포함하는, 핵산의 서열결정 방법.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 광학 활성의 각각의 각자의 인스턴스는 미리 결정된 역치를 충족시키는 관찰 메트릭(observation metric)을 갖는, 핵산의 서열결정 방법.
  27. 제26항에 있어서, 상기 관찰 메트릭은 지속기간, 신호 대 노이즈, 광자 수치, 픽셀 풋프린트 또는 강도를 포함하는, 핵산의 서열결정 방법.
  28. 제26항에 있어서, 상기 미리 결정된 역치는,
    (i) 상기 고유한 N량체 서열의 각각의 잔기가 상기 핵산의 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 내의 상보성 염기에 결합하는 제1 결합 형태와,
    (ii) 상기 고유한 N량체 서열과 상기 각자의 올리고뉴클레오타이드 프로브가 결합하여 상기 광학 활성의 각자의 인스턴스를 형성하는 상기 핵산의 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 내의 서열 사이에 적어도 하나의 미스매치가 존재하는 제2 결합 형태를 구별하는, 핵산의 서열결정 방법.
  29. 제26항 또는 제28항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 그 자신의 상응하는 미리 결정된 역치를 갖는, 핵산의 서열결정 방법.
  30. 제29항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 상기 미리 결정된 역치는 트레이닝 데이터세트(training dataset)로부터 유래되는, 핵산의 서열결정 방법.
  31. 제30항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 상기 미리 결정된 역치는 상기 트레이닝 데이터세트로부터 유래되고,
    상기 트레이닝 세트는, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대해서, 참조 서열에 결합하여 상기 각자의 올리고뉴클레오타이드 프로브의 상기 고유한 N량체 서열의 각각의 잔기가 상기 참조 서열 내의 상보성 염기에 결합할 때의 상기 각자의 올리고뉴클레오타이드 프로브에 대한 상기 관찰 메트릭의 측정치를 포함하는, 핵산의 서열결정 방법.
  32. 제31항에 있어서, 상기 참조 서열은 상기 핵산과 함께 포함되고, 상기 시험 기질 상에 고정되는, 핵산의 서열결정 방법.
  33. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브는,
    상기 고정된 제1 가닥의 상보성 부분에 대한 결합에 의해서 광학 활성의 제1 인스턴스를 산출하고,
    상기 고정된 제2 가닥의 상보성 부분에 대한 결합에 의해서 광학 활성의 제2 인스턴스를 산출하는, 핵산의 서열결정 방법.
  34. 제1항 내지 제32항 중 어느 한 항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브는,
    상기 고정된 제1 가닥의 2개 이상의 상보성 부분에 대한 결합에 의해서 광학 활성의 2개 이상의 제1 인스턴스를 산출하고,
    상기 고정된 제2 가닥의 2개 이상의 상보성 부분에 대한 결합에 의해서 광학 활성의 2개 이상의 제2 인스턴스를 산출하는, 핵산의 서열결정 방법.
  35. 제1항 내지 제34항 중 어느 한 항에 있어서, 상기 각자의 올리고뉴클레오타이드 프로브는 상기 노출시키는 단계 (c) 동안 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 3회 이상 결합함으로써 광학 활성의 3개 이상의 인스턴스를 야기하고, 광학 활성의 각각의 인스턴스는 상기 복수의 결합 사건에서 결합 사건을 나타내는, 핵산의 서열결정 방법.
  36. 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 상기 2차원 영상화기의 1개 이상의 프레임에 걸쳐서 일어나는, 핵산의 서열결정 방법.
  37. 제1항 내지 제35항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 상기 2차원 영상화기의 2개 이상의 프레임에 걸쳐서 일어나는, 핵산의 서열결정 방법.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이를 갖는, 핵산의 서열결정 방법.
  39. 제1항 내지 제37항 중 어느 한 항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이 M을 갖되,
    M은 2 이상의 양의 정수이고, 그리고
    상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계 (f)는 상기 복수의 위치 세트에 의해서 표현된 상기 올리고뉴클레오타이드 프로브의 중첩 서열을 더 사용하는, 핵산의 서열결정 방법.
  40. 제39항에 있어서, 상기 시험 기질 상의 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계는 상기 고정된 제1 가닥에 상응하는 제1 타일링 경로(tiling path) 및 상기 고정된 제2 가닥에 상응하는 제2 타일링 경로를 결정하는 것을 포함하는, 핵산의 서열결정 방법.
  41. 제40항에 있어서, 상기 제1 타일링 경로 내의 브레이크(break)는 상기 제2 타일링 경로의 상응하는 부분을 사용하여 리졸빙되는, 핵산의 서열결정 방법.
  42. 제40항에 있어서, 상기 제1 타일링 경로 또는 상기 제2 타일링 경로 내의 브레이크는 상기 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 리졸빙되는, 핵산의 서열결정 방법.
  43. 제40항에 있어서, 상기 서열의 서열 배정(sequence assignment)의 신뢰도(confidence)는 상기 제1 타일링 경로 및 상기 제2 타일링 경로의 상응하는 부분을 사용하여 증가되는, 핵산의 서열결정 방법.
  44. 제40항에 있어서, 상기 서열의 서열 배정의 신뢰도는 상기 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 증가되는, 핵산의 서열결정 방법.
  45. 제1항 내지 제44항 중 어느 한 항에 있어서, 상기 시험 기질은 2차원 표면인, 핵산의 서열결정 방법.
  46. 제1항 내지 제45항 중 어느 한 항에 있어서, 상기 시험 기질은 상기 고정시키는 단계 (a) 이전에 7-옥텐일트라이클로로실란을 포함하는 바이닐실란 코팅으로 코팅되는, 핵산의 서열결정 방법.
  47. 핵산의 서열결정 방법으로서,
    (a) 상기 핵산을 시험 기질 상에 선형의 신장된 형태로 고정시킴으로써 고정되고 신장된 핵산을 형성하는 단계;
    (b) 상기 고정되고 신장된 핵산을 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출시키는 단계로서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖되, 상기 노출시키는 단계 (b)는 상기 각자의 올리고뉴클레오타이드 프로브의 상기 각자의 풀의 개별 프로브가 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 핵산의 일부에 일시적이고 그리고 가역적으로 결합함으로써 광학 활성의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어나는, 상기 노출시키는 단계;
    (c) 2차원 영상화기를 사용하여 상기 노출시키는 단계 (b) 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 상기 시험 기질 상의 장소 및 지속기간을 측정하는 단계;
    (d) 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 상기 노출시키는 단계 (b) 및 상기 측정하는 단계 (c)를 반복함으로써, 상기 시험 기질 상의 복수의 위치 세트를 획득하는 단계로서, 상기 시험 기질 상의 각각의 각자의 위치 세트는 상기 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응하는, 상기 반복하는 단계; 및
    (e) 상기 복수의 위치 세트에 의해서 표현된 상기 시험 기질 상의 상기 위치를 컴파일링함으로써 상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계
    를 포함하는, 핵산의 서열결정 방법.
  48. 핵산의 분석 방법으로서,
    (a) 상기 핵산을 시험 기질 상에 이중 가닥 형태로 고정시킴으로써 고정된 이중 가닥 핵산을 형성하는 단계;
    (b) 상기 고정된 이중 가닥 핵산을 상기 시험 기질 상에 단일 가닥 형태로 변성시킴으로써 상기 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 단계로서, 상기 고정된 제2 가닥은 상기 고정된 제1 가닥에 상보성인, 상기 변성시키는 단계;
    (c) 상기 고정된 제1 가닥을 노출시키는 단계
    를 포함하는, 핵산의 분석 방법.
  49. 핵산의 서열결정 방법으로서,
    (a) 상기 핵산을 시험 기질 상에 이중 가닥의 선형의 신장된 형태로 고정시킴으로써 고정되고 신장된 이중 가닥 핵산을 형성하는 단계;
    (b) 상기 고정되고 신장된 이중 가닥 핵산을 상기 시험 기질 상에 단일 가닥 형태로 변성시킴으로써 상기 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 단계로서, 상기 고정된 제2 가닥의 각자의 염기는 상기 고정된 제1 가닥의 상응하는 상보성 염기에 인접하게 놓이는, 상기 변성시키는 단계;
    (c) 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥을 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출시키는 단계로서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖되, 상기 노출시키는 단계 (c)는 상기 각자의 올리고뉴클레오타이드 프로브의 상기 각자의 풀의 개별 프로브가 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 상기 고정된 제1 가닥의 일부 또는 상기 고정된 제2 가닥의 일부와 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써 광학 활성의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어나는, 상기 노출시키는 단계;
    (d) 2차원 영상화기를 사용하여 상기 노출시키는 단계 (c) 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 상기 시험 기질 상의 장소 및 지속기간을 측정하는 단계;
    (e) 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복함으로써, 상기 시험 기질 상의 복수의 위치 세트를 획득하는 단계로서, 상기 시험 기질 상의 각각의 각자의 위치 세트는 상기 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응하는, 상기 반복하는 단계; 및
    (f) 상기 복수의 위치 세트에 의해서 표현된 상기 시험 기질 상의 상기 위치를 컴파일링함으로써 상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계
    를 포함하는, 핵산의 서열결정 방법.
  50. 제49항에 있어서, 상기 노출시키는 단계 (c)는 상기 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 상기 개별 프로브에 상보성인 상기 고정된 제1 가닥의 일부 또는 상기 고정된 제2 가닥의 일부에 일시적으로 그리고 가역적으로 결합하고, 이와 상기 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어나는, 핵산의 서열결정 방법.
  51. 제49항에 있어서, 상기 노출시키는 단계 (c)는 상기 각자의 올리고뉴클레오타이드 프로브의 각자의 풀의 개별 프로브가 상기 개별 프로브에 상보성인 상기 고정된 제1 가닥의 일부 또는 상기 고정된 제2 가닥의 일부에 일시적으로 그리고 가역적으로 반복적으로 결합하고, 이와 상기 각자의 헤테로듀플렉스를 형성함으로써, 광학 활성의 각자의 인스턴스를 반복적으로 발생시키는 것을 허용하는 조건 하에서 일어나는, 핵산의 서열결정 방법.
  52. 제49항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 표지와 결합되어 있는, 핵산의 서열결정 방법.
  53. 제52항에 있어서, 상기 표지는 염료, 형광 나노입자 또는 광 산란 입자인, 핵산의 서열결정 방법.
  54. 제49항에 있어서,
    상기 노출시키는 단계는 인터칼레이팅 염료 형태의 제1 표지의 존재 하에서 일어나고,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지와 결합되어 있고,
    상기 제1 표지 및 상기 제2 표지는, 상기 제1 표지 및 상기 제2 표지가 서로에 인접하는 경우 상기 제1 표지 및 상기 제2 표지 중 하나가 형광을 내도록 하는 중첩된 공여자 방출 및 수용자 여기 스펙트럼을 갖고, 그리고
    상기 광학 활성의 각자의 인스턴스는 상기 올리고뉴클레오타이드와 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 간의 상기 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래되는, 핵산의 서열결정 방법.
  55. 제49항에 있어서,
    상기 노출시키는 단계는 인터칼레이팅 염료 형태의 제1 표지의 존재 하에서 일어나고,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지와 결합되어 있고,
    상기 제1 표지는, 상기 제1 표지 및 상기 제2 표지가 서로에 인접하는 경우 제2 표지가 형광을 내도록 하고, 그리고
    상기 광학 활성의 각자의 인스턴스는 상기 올리고뉴클레오타이드와 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 간의 상기 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래되는, 핵산의 서열결정 방법.
  56. 제49항에 있어서,
    상기 노출시키는 단계는 인터칼레이팅 염료 형태의 제1 표지의 존재 하에서 일어나고,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 제2 표지와 결합되어 있고,
    상기 제2 표지는, 상기 제1 표지 및 상기 제2 표지가 서로에 인접하는 경우 제1 표지가 형광을 내도록 하고, 그리고
    상기 광학 활성의 각자의 인스턴스는 상기 올리고뉴클레오타이드와 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 간의 상기 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의, 제2 표지에 대한 근접성으로부터 유래되는, 핵산의 서열결정 방법.
  57. 제49항에 있어서,
    상기 노출시키는 단계는 인터칼레이팅 염료의 존재 하에서 일어나고, 그리고
    상기 광학 활성의 각자의 인스턴스는 상기 올리고뉴클레오타이드와 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 간의 상기 각자의 헤테로듀플렉스를 인터칼레이팅하는 인터칼레이팅 염료의 형광으로부터 유래되되, 상기 광학 활성의 각자의 인스턴스는 상기 인터칼레이팅 염료가 상기 각자의 헤테로듀플렉스를 인터칼레이팅하기 전의 상기 인터칼레이팅 염료의 형광보다 더 큰, 핵산의 서열결정 방법.
  58. 제49항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 하나 초과의 올리고뉴클레오타이드 프로브는 상기 노출시키는 단계 (c)의 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되고, 그리고
    상기 노출시키는 단계 (c)의 상기 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되는 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 상이한 올리고뉴클레오타이드 프로브는 상이한 표지와 회합되는, 핵산의 서열결정 방법.
  59. 제58항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브의 제1 풀로서, 상기 제1 올리고뉴클레오타이드 프로브는 제1 표지와 회합될, 상기 제1풀은 상기 노출시키는 단계 (c)의 상기 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되고,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 제2 올리고뉴클레오타이드 프로브의 제2 풀로서, 상기 제2 올리고뉴클레오타이드 프로브는 제2 표지와 회합될, 상기 제2풀은 상기 노출시키는 단계 (c)의 상기 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되고, 그리고
    상기 제1 표지와 상기 제2 표지는 상이한, 핵산의 서열결정 방법.
  60. 제58항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브의 제1 풀로서, 상기 제1 올리고뉴클레오타이드 프로브는 제1 표지와 회합될, 상기 제1풀은 상기 노출시키는 단계 (c)의 상기 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되고,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 제2 올리고뉴클레오타이드 프로브의 제2 풀로서, 상기 제2 올리고뉴클레오타이드 프로브는 제2 표지와 회합될, 상기 제2풀은 상기 노출시키는 단계 (c)의 상기 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되고,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 제3 올리고뉴클레오타이드 프로브의 제3 풀로서, 상기 제3 올리고뉴클레오타이드 프로브는 제3 표지와 회합될, 상기 제 3풀은 상기 노출시키는 단계 (c)의 상기 단일 인스턴스 동안 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥에 노출되고, 그리고
    상기 제1 표지, 상기 제2 표지 및 상기 제3 표지는 서로 상이한, 핵산의 서열결정 방법.
  61. 제49항에 있어서, 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하는 단계 (e)는 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 단일 올리고뉴클레오타이드 프로브에 대해서 수행되는, 핵산의 서열결정 방법.
  62. 제49항에 있어서, 상기 노출시키는 단계 (c)는 상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 온도에서 수행되고, 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하는 단계 (e)는 상기 제1 올리고뉴클레오타이드에 대해서 제2 온도에서 노출시키는 단계 (c) 및 측정하는 단계 (d)를 수행하는 것을 포함하는, 핵산의 서열결정 방법.
  63. 제49항에 있어서,
    상기 노출시키는 단계 (c)는 상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 온도에서 수행되고,
    상기 노출시키는 단계 (c) 및 상기 측정하는 단계를 반복하는 단계 (e)의 인스턴스는 복수의 상이한 온도 각각에서 상기 제1 올리고뉴클레오타이드에 대해서 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 포함하고,
    상기 제1 온도 및 상기 복수의 상이한 온도의 각각의 온도에 대해서 측정하는 단계 (d)에 의해서 기록된 광학 활성의 상기 측정된 장소 및 지속기간을 사용하여 상기 제1 올리고뉴클레오타이드 프로브에 대한 용융 곡선을 구축하는 것을 더 포함하는, 핵산의 서열결정 방법.
  64. 제49항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트는 상기 올리고뉴클레오타이드 프로브의 복수의 하위세트를 포함하되, 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하는 단계 (e)는 상기 올리고뉴클레오타이드 프로브의 복수의 하위세트 내의 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트에 대해서 수행되는, 핵산의 서열결정 방법.
  65. 제64항에 있어서, 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트는 상기 올리고뉴클레오타이드 프로브의 세트로부터의 2개 이상의 상이한 프로브를 포함하는, 핵산의 서열결정 방법.
  66. 제64항에 있어서, 올리고뉴클레오타이드 프로브의 각각의 각자의 하위세트는 상기 올리고뉴클레오타이드 프로브의 세트로부터의 4개 이상의 상이한 프로브를 포함하는, 핵산의 서열결정 방법.
  67. 제64항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트는 올리고뉴클레오타이드 프로브의 4개의 하위세트로 이루어진, 핵산의 서열결정 방법.
  68. 제64항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트를 각각의 올리고뉴클레오타이드 프로브의 계산되거나 또는 실험적으로 도출된 용융 온도에 기초하여 올리고뉴클레오타이드 프로브의 상기 복수의 하위세트로 구분하는 단계를 더 포함하되, 유사한 용융 온도를 갖는 올리고뉴클레오타이드 프로브는 상기 구분에 의해서 올리고뉴클레오타이드 프로브의 동일한 하위세트에 놓이고, 상기 노출시키는 단계 (c)의 온도 또는 인스턴스의 지속기간은 올리고뉴클레오타이드 프로브의 상기 상응하는 하위세트 내의 상기 올리고뉴클레오타이드 프로브의 평균 용융 온도에 의해서 결정되는, 핵산의 서열결정 방법.
  69. 제64항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트를 각각의 올리고뉴클레오타이드 프로브의 서열에 기초하여 올리고뉴클레오타이드 프로브의 상기 복수의 하위세트로 구분하는 단계를 더 포함하되, 중첩 서열을 갖는 올리고뉴클레오타이드 프로브는 상이한 하위세트에 놓이는, 핵산의 서열결정 방법.
  70. 제49항에 있어서,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 광학 활성의 각자의 인스턴스를 식별하고, 피팅 함수에 피팅시켜 상기 2차원 영상화기에 의해서 획득된 데이터의 프레임 내에서 상기 광학 활성의 각자의 인스턴스의 중심을 식별 및 피팅시키는 단계를 포함하고, 그리고
    상기 광학 활성의 각자의 인스턴스의 상기 중심은 상기 시험 기질 상의 상기 광학 활성의 각자의 인스턴스의 상기 위치인 것으로 간주되는, 핵산의 서열결정 방법.
  71. 제70항에 있어서, 상기 피팅 함수는 가우시안 함수(Gaussian function), 제1 적률 함수(first moment function), 기울기 기반 접근법(gradient-based approach) 또는 푸리에 변환(Fourier Transform)인, 핵산의 서열결정 방법.
  72. 제49항에 있어서,
    상기 광학 활성의 각자의 인스턴스는 상기 2차원 영상화기에 의해서 측정된 복수의 프레임에 걸쳐서 지속되고,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 광학 활성의 각자의 인스턴스를 상기 복수의 프레임에 걸쳐서 식별하고, 피팅 함수에 피팅시켜 상기 복수의 프레임에 걸쳐서 상기 광학 활성의 각자의 인스턴스의 중심을 식별하는 단계를 포함하고, 그리고
    상기 광학 활성의 각자의 인스턴스의 상기 중심은 상기 복수의 프레임에 걸쳐서 상기 시험 기질 상의 상기 광학 활성의 각자의 인스턴스의 상기 위치인 것으로 간주되는, 핵산의 서열결정 방법.
  73. 제72항에 있어서, 상기 피팅 함수는 가우시안 함수, 제1 적률 함수, 기울기 기반 접근법 또는 푸리에 변환인, 핵산의 서열결정 방법.
  74. 제49항에 있어서,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 2차원 영상화기에 의해서 측정된 데이터의 프레임을 훈련된 콘볼루션 신경망에 투입하는 단계를 포함하고,
    상기 데이터의 프레임은 광학 활성의 복수의 인스턴스 중에서 상기 광학 활성의 각자의 인스턴스를 포함하며,
    상기 광학 활성의 복수의 인스턴스 내의 광학 활성의 각각의 인스턴스는 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥의 일부에 결합하는 개별 프로브에 상응하고,
    상기 투입에 반응하여, 상기 훈련된 콘볼루션 신경망은 상기 광학 활성의 복수의 인스턴스 내의 광학 활성의 하나 이상의 인스턴스 각각의 상기 시험 기질 상의 위치를 식별하는, 핵산의 서열결정 방법.
  75. 제70항 내지 제74항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 20㎚의 국지화 정밀도로 상기 시험 기질 상의 위치에 리졸빙하는, 핵산의 서열결정 방법.
  76. 제70항 내지 제74항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 2㎚의 국지화 정밀도로 상기 시험 기질 상의 위치에 리졸빙하는, 핵산의 서열결정 방법.
  77. 제70항 내지 제74항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 60㎚의 분해능(resolution)으로 상기 시험 기질 상의 위치에 리졸빙하는, 핵산의 서열결정 방법.
  78. 제70항 내지 제74항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 6㎚의 분해능으로 상기 시험 기질 상의 위치에 리졸빙하는, 핵산의 서열결정 방법.
  79. 제70항 내지 제74항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 상기 시험 기질 상의 위치에 리졸빙하되, 상기 위치는 부분 회절 제한된 위치(sub-diffraction limited position)인, 핵산의 서열결정 방법.
  80. 제49항 내지 제78항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계 (d)는 상기 위치에서 5000개 초과의 광자를 측정하는, 핵산의 서열결정 방법.
  81. 제49항 내지 제78항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계 (d)는 상기 위치에서 50,000개 초과의 광자를 측정하는, 핵산의 서열결정 방법.
  82. 제49항 내지 제78항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계 (d)는 상기 위치에서 200,000개 초과의 광자를 측정하는, 핵산의 서열결정 방법.
  83. 제49항 내지 제82항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스는 상기 시험 기질에 대해서 관찰된 배경에 대한 미리 결정된 표준 편차의 수보다 더 큰, 핵산의 서열결정 방법.
  84. 제83항에 있어서, 상기 미리 결정된 표준 편차의 수는 3 표준 편차인, 핵산의 서열결정 방법.
  85. 제83항에 있어서, 상기 미리 결정된 표준 편차의 수는 6 표준 편차인, 핵산의 서열결정 방법.
  86. 제49항 내지 제85항 중 어느 한 항에 있어서, 상기 복수의 올리고뉴클레오타이드 프로브 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 고유한 N량체 서열을 포함하되, N은 세트 {1, 2, 3, 4, 5, 6, 7, 8 및 9}의 정수이고, 길이 N의 모든 고유한 N량체 서열은 상기 복수의 올리고뉴클레오타이드 프로브로 표현되는, 핵산의 서열결정 방법.
  87. 제86항에 있어서, 상기 고유한 N량체 서열은 하나 이상의 축퇴 뉴클레오타이드에 의해서 점유된 하나 이상의 뉴클레오타이드 위치를 포함하는, 핵산의 서열결정 방법.
  88. 제87항에 있어서, 상기 하나 이상의 뉴클레오타이드 위치 내의 각각의 축퇴 뉴클레오타이드 위치는 범용 염기에 의해서 점유되는, 핵산의 서열결정 방법.
  89. 제88항에 있어서, 상기 범용 염기는 2'-데옥시이노신인, 핵산의 서열결정 방법.
  90. 제86항에 있어서, 상기 고유한 N량체 서열은 단일 축퇴 뉴클레오타이드 위치에 의해서 5' 측접되고, 단일 축퇴 뉴클레오타이드 위치에 의해서 3' 측접되는, 핵산의 서열결정 방법.
  91. 제90항에 있어서, 상기 5' 단일 축퇴 뉴클레오타이드 및 상기 3' 단일 축퇴 뉴클레오타이드는 각각 2'-데옥시이노신인, 핵산의 서열결정 방법.
  92. 제49항 내지 제91항 중 어느 한 항에 있어서, 상기 핵산은 적어도 140개 염기 길이이고, 상기 결정하는 단계 (f)는 70% 초과의 상기 핵산 서열의 상기 서열의 커버리지를 결정하는, 핵산의 서열결정 방법.
  93. 제49항 내지 제91항 중 어느 한 항에 있어서, 상기 핵산은 적어도 140개 염기 길이이고, 상기 결정하는 단계 (f)는 90% 초과의 상기 핵산 서열의 상기 서열의 커버리지를 결정하는, 핵산의 서열결정 방법.
  94. 제49항 내지 제91항 중 어느 한 항에 있어서, 상기 핵산은 적어도 140개 염기 길이이고, 상기 결정하는 단계 (f)는 99% 초과의 상기 핵산 서열의 상기 서열의 커버리지를 결정하는, 핵산의 서열결정 방법.
  95. 제49항 내지 제91항 중 어느 한 항에 있어서, 상기 결정하는 단계 (f)는 99% 초과의 상기 핵산 서열의 상기 서열의 커버리지를 결정하는, 핵산의 서열결정 방법.
  96. 제49항 내지 제95항 중 어느 한 항에 있어서, 상기 핵산은 적어도 10,000개 염기 길이인, 핵산의 서열결정 방법.
  97. 제49항 내지 제95항 중 어느 한 항에 있어서, 상기 핵산은 적어도 1,000,000개 염기 길이인, 핵산의 서열결정 방법.
  98. 제49항 내지 제97항 중 어느 한 항에 있어서, 상기 시험 기질을 상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하기 전에 세척함으로써, 상기 시험 기질을 상기 올리고뉴클레오타이드 프로브의 세트 내의 또 다른 올리고뉴클레오타이드 프로브에 노출시키기 전에 상기 시험 기질로부터 각자의 올리고뉴클레오타이드 프로브를 제거하는, 핵산의 서열결정 방법.
  99. 제49항 내지 제98항 중 어느 한 항에 있어서, 상기 고정시키는 단계 (a)는 분자 코밍(감소 메니스커스), 유동 신장 나노컨파인먼트 또는 전기-신장에 의해서 상기 시험 기질 상에 상기 핵산을 적용하는 것을 포함하는, 핵산의 서열결정 방법.
  100. 제49항 내지 제98항 중 어느 한 항에 있어서, 광학 활성의 각각의 각자의 인스턴스는 미리 결정된 역치를 충족시키는 관찰 메트릭을 갖는, 핵산의 서열결정 방법.
  101. 제100항에 있어서, 상기 관찰 메트릭은 지속기간, 신호 대 노이즈, 광자 수치 또는 강도를 포함하는, 핵산의 서열결정 방법.
  102. 제100항에 있어서, 상기 미리 결정된 역치는,
    (i) 상기 고유한 N량체 서열의 각각의 잔기가 상기 핵산의 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 내의 상보성 염기에 결합하는 제1 결합 형태와,
    (ii) 상기 고유한 N량체 서열과 상기 각자의 올리고뉴클레오타이드 프로브가 결합하여 상기 광학 활성의 각자의 인스턴스를 형성하는 상기 핵산의 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 내의 서열 사이에 적어도 하나의 미스매치가 존재하는 제2 결합 형태를 구별하는, 핵산의 서열결정 방법.
  103. 제100항 또는 제102항에 있어서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 그 자신의 상응하는 미리 결정된 역치를 갖는, 핵산의 서열결정 방법.
  104. 제103항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 상기 미리 결정된 역치는 트레이닝 데이터세트로부터 유래되는, 핵산의 서열결정 방법.
  105. 제104항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 상기 미리 결정된 역치는 상기 트레이닝 데이터세트로부터 유래되고,
    상기 트레이닝 세트는, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대해서, 참조 서열에 결합하여 상기 각자의 올리고뉴클레오타이드 프로브의 상기 고유한 N량체 서열의 각각의 잔기가 상기 참조 서열 내의 상보성 염기에 결합할 때의 상기 각자의 올리고뉴클레오타이드 프로브에 대한 상기 관찰 메트릭의 측정치를 포함하는, 핵산의 서열결정 방법.
  106. 제105항에 있어서, 상기 참조 서열은 참조 기질 상에 고정된, 핵산의 서열결정 방법.
  107. 제105항에 있어서, 상기 참조 서열은 상기 핵산과 함께 포함되고, 상기 시험 기질 상에 고정되는, 핵산의 서열결정 방법.
  108. 제105항에 있어서, 상기 참조 서열은 PhiX174, M13, 람다 파지, T7 파지, 에쉐리키아 콜라이(Escherichia coli), 사카로마이세스 세레비지애(Saccharomyces cerevisiae) 또는 사카로마이세스 폼베(Saccharomyces pombe)의 게놈의 전부 또는 일부를 포함하는, 핵산의 서열결정 방법.
  109. 제105항에 있어서, 상기 참조 서열은 공지된 서열의 합성 작제물인, 핵산의 서열결정 방법.
  110. 제105항에 있어서, 상기 참조 서열은 토끼 글로빈 RNA의 전부 또는 일부를 포함하는, 서열결정 방법.
  111. 제49항 내지 제110항 중 어느 한 항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브는,
    상기 고정된 제1 가닥의 상보성 부분에 대한 결합에 의해서 광학 활성의 제1 인스턴스를 산출하고,
    상기 고정된 제2 가닥의 상보성 부분에 대한 결합에 의해서 광학 활성의 제2 인스턴스를 산출하는, 핵산의 서열결정 방법.
  112. 제49항 내지 제110항 중 어느 한 항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브는,
    상기 고정된 제1 가닥의 2개 이상의 상보성 부분에 대한 결합에 의해서 광학 활성의 2개 이상의 제1 인스턴스를 산출하고,
    상기 고정된 제2 가닥의 2개 이상의 상보성 부분에 대한 결합에 의해서 광학 활성의 2개 이상의 제2 인스턴스를 산출하는, 핵산의 서열결정 방법.
  113. 제49항 내지 제112항 중 어느 한 항에 있어서, 상기 각자의 올리고뉴클레오타이드 프로브는 상기 노출시키는 단계 (c) 동안 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 3회 이상 결합함으로써 광학 활성의 3개 이상의 인스턴스를 야기하고, 광학 활성의 각각의 인스턴스는 상기 복수의 결합 사건에서 결합 사건을 나타내는, 핵산의 서열결정 방법.
  114. 제49항 내지 제112항 중 어느 한 항에 있어서, 상기 각자의 올리고뉴클레오타이드 프로브는 상기 노출시키는 단계 (c) 동안 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 5회 이상 결합함으로써 광학 활성의 5개 이상의 인스턴스를 야기하고, 광학 활성의 각자의 인스턴스는 상기 복수의 결합 사건에서 결합 사건을 나타내는, 핵산의 서열결정 방법.
  115. 제49항 내지 제112항 중 어느 한 항에 있어서, 상기 각자의 올리고뉴클레오타이드 프로브는 상기 노출시키는 단계 (c) 동안 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 제1 가닥 또는 고정된 제2 가닥의 일부에 10회 이상 결합함으로써 광학 활성의 10개 이상의 인스턴스를 야기하고, 광학 활성의 각자의 인스턴스는 상기 복수의 결합 사건에서 결합 사건을 나타내는, 핵산의 서열결정 방법.
  116. 제49항 내지 제115항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 5분 이하 동안 일어나는, 핵산의 서열결정 방법.
  117. 제49항 내지 제115항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 2분 이하 동안 일어나는, 핵산의 서열결정 방법.
  118. 제49항 내지 제115항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 1분 이하 동안 일어나는, 핵산의 서열결정 방법.
  119. 제49항 내지 제115항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 상기 2차원 영상화기의 1개 이상의 프레임에 걸쳐서 일어나는, 핵산의 서열결정 방법.
  120. 제49항 내지 제115항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 상기 2차원 영상화기의 2개 이상의 프레임에 걸쳐서 일어나는, 핵산의 서열결정 방법.
  121. 제49항 내지 제115항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 상기 2차원 영상화기의 500개 이상의 프레임에 걸쳐서 일어나는, 핵산의 서열결정 방법.
  122. 제49항 내지 제115항 중 어느 한 항에 있어서, 상기 노출시키는 단계 (c)는 상기 2차원 영상화기의 5,000개 이상의 프레임에 걸쳐서 일어나는, 핵산의 서열결정 방법.
  123. 제49항 내지 제122항 중 어느 한 항에 있어서,
    상기 노출시키는 단계 (c)는 상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 제1 시간 기간 동안 수행되고,
    상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하는 단계 (e)는 제2 올리고뉴클레오타이드에 대해서 제2 시간 기간 동안 노출시키는 단계 (c)를 수행하는 것을 포함하고, 그리고
    상기 제1 시간 기간은 상기 제2 시간 기간보다 큰, 핵산의 서열결정 방법.
  124. 제49항 내지 제122항 중 어느 한 항에 있어서,
    상기 노출시키는 단계 (c)는 상기 올리고뉴클레오타이드 프로브의 세트 내의 제1 올리고뉴클레오타이드 프로브에 대해서 상기 2차원 영상화기의 제1 프레임 수 동안 수행되고,
    상기 노출시키는 단계 (c) 및 상기 측정하는 단계 (d)를 반복하는 단계 (e)는 제2 올리고뉴클레오타이드에 대해서 상기 2차원 영상화기의 제2 프레임 수 동안 상기 노출시키는 단계 (c)를 수행하는 것을 포함하고, 그리고
    상기 제1 프레임 수는 상기 제2 프레임 수보다 큰, 핵산의 서열결정 방법.
  125. 제49항 내지 제124항 중 어느 한 항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이를 갖는, 핵산의 서열결정 방법.
  126. 제49항 내지 제124항 중 어느 한 항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이 M을 갖되,
    M은 2 이상의 양의 정수이고, 그리고
    상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계 (f)는 상기 복수의 위치 세트에 의해서 표현된 상기 올리고뉴클레오타이드 프로브의 상기 중첩 서열을 더 사용하는, 핵산의 서열결정 방법.
  127. 제126항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 상기 올리고뉴클레오타이드 프로브의 세트 내의 또 다른 올리고뉴클레오타이드 프로브와 M-1 서열 상동성을 공유하는, 핵산의 서열결정 방법.
  128. 제126항에 있어서, 상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계는 상기 고정된 제1 가닥에 상응하는 제1 타일링 경로 및 상기 고정된 제2 가닥에 상응하는 제2 타일링 경로를 결정하는 것을 포함하는, 핵산의 서열결정 방법.
  129. 제128항에 있어서, 상기 제1 타일링 경로 내의 브레이크는 상기 제2 타일링 경로의 상응하는 부분을 사용하여 리졸빙되는, 핵산의 서열결정 방법.
  130. 제128항에 있어서, 상기 제1 타일링 경로 또는 상기 제2 타일링 경로 내의 브레이크는 참조 서열을 사용하여 리졸빙되는, 핵산의 서열결정 방법.
  131. 제128항에 있어서, 상기 제1 타일링 경로 또는 상기 제2 타일링 경로 내의 브레이크는 상기 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 리졸빙되는, 핵산의 서열결정 방법.
  132. 제128항에 있어서, 상기 서열의 서열 배정의 신뢰도는 상기 제1 타일링 경로 및 상기 제2 타일링 경로의 상응하는 부분을 사용하여 증가되는, 핵산의 서열결정 방법.
  133. 제128항에 있어서, 상기 서열의 서열 배정의 신뢰도는 상기 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 증가되는, 핵산의 서열결정 방법.
  134. 제49항에 있어서, 상기 노출시키는 단계 (c)의 인스턴스의 시간 길이는 상기 노출시키는 단계 (c)의 상기 인스턴스에서 사용된 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 예측된 용융 온도에 의해서 결정되는, 핵산의 서열결정 방법.
  135. 제49항 내지 제134항 중 어느 한 항에 있어서,
    (f) 상기 고정된 이중 가닥 또는 고정된 제1 가닥 및 상기 고정된 제2 가닥을 항체, 어피머(affimer), 나노바디, 압타머 또는 메틸-결합 단백질에 노출시킴으로써 상기 핵산에 대한 변형을 결정하거나 또는 상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 일부의 서열과의 연관성을 보여주는 단계를 더 포함하는, 핵산의 서열결정 방법.
  136. 제49항 내지 제135항 중 어느 한 항에 있어서, 상기 시험 기질은 2차원 표면인, 핵산의 서열결정 방법.
  137. 제136항에 있어서, 상기 2차원 표면은 겔 또는 매트릭스로 코팅되는, 핵산의 서열결정 방법.
  138. 제49항 내지 제135항 중 어느 한 항에 있어서, 상기 시험 기질은 세포, 3차원 매트릭스 또는 겔인, 핵산의 서열결정 방법.
  139. 제49항 내지 제138항 중 어느 한 항에 있어서, 상기 시험 기질은 상기 고정시키는 단계 (a) 이전에 서열-특이적 올리고뉴클레오타이드 프로브와 결합되어 있고, 그리고 상기 고정시키는 단계 (a)는 상기 시험 기질에 결합된 서열-특이적 올리고뉴클레오타이드 프로브를 사용하여 상기 시험 기질 상에 상기 핵산을 포획하는 것을 포함하는, 핵산의 서열결정 방법.
  140. 제49항 내지 제139항 중 어느 한 항에 있어서, 상기 핵산은 추가적인 복수의 세포 성분을 포함하는 용액 중에 존재하고, 상기 고정시키는 단계 (a) 또는 변성시키는 단계 (b)는 상기 핵산이 상기 시험 기질에 고정된 후에 그리고 상기 노출시키는 단계 (c) 이전에 상기 시험 기질을 세척함으로써 상기 핵산으로부터 상기 추가적인 복수의 세포 성분을 정제시키는 것을 더 포함하는, 핵산의 서열결정 방법.
  141. 제49항 내지 제140항 중 어느 한 항에 있어서, 상기 시험 기질은 상기 노출시키는 단계 (c) 이전에 폴리에틸렌 글리콜, 소 혈청 알부민-바이오틴-스트렙타비딘, 카제인, 소 혈청 알부민(BSA), 1종 이상의 상이한 tRNA, 1종 이상의 상이한 데옥시리보뉴클레오타이드, 1종 이상의 상이한 리보뉴클레오타이드, 연어 정자 DNA, 플루로닉 F-127, Tween-20, 하이드로겐 실세스퀴옥산(hydrogen silsesquioxane: HSQ) 또는 이들의 임의의 조합물로 부동태화되는(passivized), 핵산의 서열결정 방법.
  142. 제49항 내지 제141항 중 어느 한 항에 있어서, 상기 시험 기질은 상기 고정시키는 단계 (a) 이전에 7-옥텐일트라이클로로실란을 포함하는 바이닐실란 코팅으로 코팅되는, 핵산의 서열결정 방법.
  143. 컴퓨터로서, 시험 기질 상에 이중 가닥의 선형의 신장된 형태로 먼저 고정되어 고정되고 신장된 이중 가닥 핵산을 형성하고, 그 다음 상기 시험 기질 상에서 단일 가닥 형태로 변형되어 상기 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 핵산을 서열결정하기 위한 것이되, 상기 고정된 제2 가닥의 각자의 염기는 상기 고정된 제1 가닥의 상응하는 상보성 염기에 인접하게 놓이며, 상기 컴퓨터는,
    적어도 하나의 프로세서; 및
    메모리를 포함하고, 상기 메모리는 상기 적어도 하나의 프로세서에 의한 실행을 위해서 적어도 하나의 프로그램을 저장하되, 상기 적어도 하나의 프로그램은,
    (a) 2차원 영상으로부터, 노출 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 상기 시험 기질 상의 각자의 장소 및 각자의 지속기간의 측정치를 획득하는 단계로서, 상기 노출 동안, 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥은 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출되고, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖되, 상기 노출은 상기 각자의 올리고뉴클레오타이드 프로브의 상기 각자의 풀의 개별 프로브가 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 상기 고정된 제1 가닥의 일부 또는 상기 고정된 제2 가닥의 일부와 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써 광학 활성의 각각의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어나는, 상기 획득하는 단계;
    (b) 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 상기 획득하는 단계 (a)를 반복함으로써, 상기 시험 기질 상의 복수의 위치 세트를 획득하는 단계로서, 상기 시험 기질 상의 각각의 각자의 위치 세트는 상기 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응하는, 상기 반복하는 단계; 및
    (c) 상기 복수의 위치 세트에 의해서 표현된 상기 시험 기질 상의 상기 위치를 컴파일링함으로써 상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계
    를 위한 명령어를 포함하는, 컴퓨터.
  144. 제143항에 있어서,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 광학 활성의 각자의 인스턴스를 식별하고, 피팅 함수에 피팅시켜 상기 2차원 영상화기에 의해서 획득된 데이터의 프레임 내에서 상기 광학 활성의 각자의 인스턴스의 중심을 식별 및 피팅시키는 단계를 포함하고, 그리고
    상기 광학 활성의 각자의 인스턴스의 상기 중심은 상기 시험 기질 상의 상기 광학 활성의 각자의 인스턴스의 상기 위치인 것으로 간주되는, 컴퓨터.
  145. 제144항에 있어서, 상기 피팅 함수는 가우시안 함수, 제1 적률 함수, 기울기 기반 접근법 또는 푸리에 변환인, 컴퓨터.
  146. 제143항에 있어서,
    상기 광학 활성의 각자의 인스턴스는 상기 2차원 영상화기에 의해서 측정된 복수의 프레임에 걸쳐서 지속되고,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 광학 활성의 각자의 인스턴스를 상기 복수의 프레임에 걸쳐서 식별하고, 피팅 함수에 피팅시켜 상기 복수의 프레임에 걸쳐서 상기 광학 활성의 각자의 인스턴스의 중심을 식별하는 단계를 포함하고, 그리고
    상기 광학 활성의 각자의 인스턴스의 상기 중심은 상기 복수의 프레임에 걸쳐서 상기 시험 기질 상의 상기 광학 활성의 각자의 인스턴스의 상기 위치인 것으로 간주되는, 컴퓨터.
  147. 제146항에 있어서, 상기 피팅 함수는 가우시안 함수, 제1 적률 함수, 기울기 기반 접근법 또는 푸리에 변환인, 컴퓨터.
  148. 제143항에 있어서,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 2차원 영상화기에 의해서 측정된 데이터의 프레임을 훈련된 콘볼루션 신경망에 투입하는 단계를 포함하고,
    상기 데이터의 프레임은 광학 활성의 복수의 인스턴스 중에서 상기 광학 활성의 각자의 인스턴스를 포함하며,
    상기 광학 활성의 복수의 인스턴스 내의 광학 활성의 각각의 인스턴스는 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥의 일부에 결합하는 개별 프로브에 상응하고,
    상기 투입에 반응하여, 상기 훈련된 콘볼루션 신경망은 상기 광학 활성의 복수의 인스턴스 내의 광학 활성의 하나 이상의 인스턴스 각각의 상기 시험 기질 상의 위치를 식별하는, 컴퓨터.
  149. 제144항 내지 제148항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 20㎚의 국지화 정밀도로 상기 시험 기질 상의 위치에 리졸빙하는, 컴퓨터.
  150. 제144항 내지 제148항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 2㎚의 국지화 정밀도로 상기 시험 기질 상의 위치에 리졸빙하, 컴퓨터.
  151. 제144항 내지 제148항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 60㎚의 분해능으로 상기 시험 기질 상의 위치에 리졸빙하는, 컴퓨터.
  152. 제144항 내지 제148항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 6㎚의 분해능으로 상기 시험 기질 상의 위치에 리졸빙하는, 컴퓨터.
  153. 제144항 내지 제148항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 상기 시험 기질 상의 위치에 리졸빙하되, 상기 위치는 부분 회절 제한된 위치인, 컴퓨터.
  154. 제143항 내지 제153항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계는 상기 위치에서 5000개 초과의 광자를 측정하는, 컴퓨터.
  155. 제143항 내지 제153항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계는 상기 위치에서 50,000개 초과의 광자를 측정하는, 컴퓨터.
  156. 제143항 내지 제153항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계는 상기 위치에서 200,000개 초과의 광자를 측정하는, 컴퓨터.
  157. 제143항 내지 제156항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스는 상기 시험 기질에 대해서 관찰된 배경에 대한 미리 결정된 표준 편차의 수보다 더 큰, 컴퓨터.
  158. 제157항에 있어서, 상기 미리 결정된 표준 편차의 수는 3 표준 편차인, 컴퓨터.
  159. 제157항에 있어서, 상기 미리 결정된 표준 편차의 수는 6 표준 편차인, 컴퓨터.
  160. 제143항 내지 제159항 중 어느 한 항에 있어서, 광학 활성의 각각의 각자의 인스턴스는 미리 결정된 역치를 충족시키는 관찰 메트릭을 갖는, 컴퓨터.
  161. 제160항에 있어서, 상기 관찰 메트릭은 지속기간, 신호 대 노이즈, 광자 수치 또는 강도를 포함하는, 컴퓨터.
  162. 제160항에 있어서, 상기 미리 결정된 역치는,
    (i) 상기 고유한 N량체 서열의 각각의 잔기가 상기 핵산의 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 내의 상보성 염기에 결합하는 제1 결합 형태와,
    (ii) 상기 고유한 N량체 서열과 상기 각자의 올리고뉴클레오타이드 프로브가 결합하여 상기 광학 활성의 각자의 인스턴스를 형성하는 상기 핵산의 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 내의 서열 사이에 적어도 하나의 미스매치가 존재하는 제2 결합 형태를 구별하는, 컴퓨터.
  163. 제160항 또는 제162항에 있어서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 그 자신의 상응하는 미리 결정된 역치를 갖는, 컴퓨터.
  164. 제163항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 상기 미리 결정된 역치는 트레이닝 데이터세트로부터 유래되는, 컴퓨터.
  165. 제164항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 상기 미리 결정된 역치는 상기 트레이닝 데이터세트로부터 유래되고,
    상기 트레이닝 세트는, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대해서, 참조 서열에 결합하여 상기 각자의 올리고뉴클레오타이드 프로브의 상기 고유한 N량체 서열의 각각의 잔기가 상기 참조 서열 내의 상보성 염기에 결합할 때의 상기 각자의 올리고뉴클레오타이드 프로브에 대한 상기 관찰 메트릭의 측정치를 포함하는, 컴퓨터.
  166. 제143항 내지 제165항 중 어느 한 항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이 M을 갖되,
    M은 2 이상의 양의 정수이고, 그리고
    상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계 (f)는 상기 복수의 위치 세트에 의해서 표현된 상기 올리고뉴클레오타이드 프로브의 중첩 서열을 더 사용하는, 컴퓨터.
  167. 제166항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 상기 올리고뉴클레오타이드 프로브의 세트 내의 또 다른 올리고뉴클레오타이드 프로브와 M-1 서열 상동성을 공유하는, 컴퓨터.
  168. 제166항에 있어서, 상기 시험 기질 상의 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계는 상기 고정된 제1 가닥에 상응하는 제1 타일링 경로 및 상기 고정된 제2 가닥에 상응하는 제2 타일링 경로를 결정하는 것을 포함하는, 컴퓨터.
  169. 제168항에 있어서, 상기 제1 타일링 경로 내의 브레이크는 상기 제2 타일링 경로의 상응하는 부분을 사용하여 리졸빙되는, 컴퓨터.
  170. 제168항에 있어서, 상기 제1 타일링 경로 또는 상기 제2 타일링 경로 내의 브레이크는 참조 서열을 사용하여 리졸빙되는, 컴퓨터.
  171. 제168항에 있어서, 상기 제1 타일링 경로 또는 상기 제2 타일링 경로 내의 브레이크는 상기 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 리졸빙되는, 컴퓨터.
  172. 제168항에 있어서, 상기 서열의 서열 배정의 신뢰도는 상기 제1 타일링 경로 및 상기 제2 타일링 경로의 상응하는 부분을 사용하여 증가되는, 컴퓨터.
  173. 제168항에 있어서, 상기 서열의 서열 배정의 신뢰도는 상기 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 증가되는, 컴퓨터.
  174. 비-일시적인 비컴퓨터 판독 가능한 저장 매체(non-transitory computer readable storage medium)로서, 시험 기질 상에 이중 가닥의 선형의 신장된 형태로 먼저 고정되어 고정되고 신장된 이중 가닥 핵산을 형성하고, 그 다음 상기 시험 기질 상에서 단일 가닥 형태로 변형되어 상기 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 형성하는 핵산을 서열결정하기 위한 것이되, 상기 고정된 제2 가닥의 각자의 염기는 상기 고정된 제1 가닥의 상응하는 상보성 염기에 인접하게 놓이며,
    상기 비-일시적인 컴퓨터 판독 가능한 저장 매체는 컴퓨팅 장치 상에 저장되고, 상기 컴퓨팅 장치는 하나 이상의 프로세서 및 메모리를 포함하며,
    상기 메모리는 상기 하나 이상의 프로세서에 의한 실행을 위해서 하나 이상의 프로그램을 저장하되, 상기 하나 이상의 프로그램은,
    (a) 2차원 영상으로부터, 노출 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 상기 시험 기질 상의 각자의 장소 및 각자의 지속기간의 측정치를 획득하는 단계로서, 상기 노출 동안, 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥은 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출되고, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖되, 상기 노출은 상기 각자의 올리고뉴클레오타이드 프로브의 상기 각자의 풀의 개별 프로브가 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 상기 고정된 제1 가닥의 일부 또는 상기 고정된 제2 가닥의 일부와 결합하고, 이와 각자의 헤테로듀플렉스를 형성함으로써 광학 활성의 각각의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어나는, 상기 획득하는 단계;
    (b) 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 상기 획득하는 단계 (a)를 반복함으로써, 상기 시험 기질 상의 복수의 위치 세트를 획득하는 단계로서, 상기 시험 기질 상의 각각의 각자의 위치 세트는 상기 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응하는, 상기 반복하는 단계; 및
    (c) 상기 복수의 위치 세트에 의해서 표현된 상기 시험 기질 상의 상기 위치를 컴파일링함으로써 상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계
    를 포함하는 방법을 실행하기 위한 명령어를 단일적으로 또는 집합적으로 포함하는, 비-일시적인 컴퓨터 판독 가능한 저장 매체.
  175. 제174항에 있어서,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 광학 활성의 각자의 인스턴스를 식별하고, 피팅 함수에 피팅시켜 상기 2차원 영상화기에 의해서 획득된 데이터의 프레임 내에서 상기 광학 활성의 각자의 인스턴스의 중심을 식별 및 피팅시키는 단계를 포함하고, 그리고
    상기 광학 활성의 각자의 인스턴스의 상기 중심은 상기 시험 기질 상의 상기 광학 활성의 각자의 인스턴스의 상기 위치인 것으로 간주되는, 컴퓨터 판독 가능한 저장 매체.
  176. 제175항에 있어서, 상기 피팅 함수는 가우시안 함수, 제1 적률 함수, 기울기 기반 접근법 또는 푸리에 변환인, 컴퓨터 판독 가능한 저장 매체.
  177. 제174항에 있어서,
    상기 광학 활성의 각자의 인스턴스는 상기 2차원 영상화기에 의해서 측정된 복수의 프레임에 걸쳐서 지속되고,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 광학 활성의 각자의 인스턴스를 상기 복수의 프레임에 걸쳐서 식별하고, 피팅 함수에 피팅시켜 상기 복수의 프레임에 걸쳐서 상기 광학 활성의 각자의 인스턴스의 중심을 식별하는 단계를 포함하고, 그리고
    상기 광학 활성의 각자의 인스턴스의 상기 중심은 상기 복수의 프레임에 걸쳐서 상기 시험 기질 상의 상기 광학 활성의 각자의 인스턴스의 상기 위치인 것으로 간주되는, 컴퓨터 판독 가능한 저장 매체.
  178. 제177항에 있어서, 상기 피팅 함수는 가우시안 함수, 제1 적률 함수, 기울기 기반 접근법 또는 푸리에 변환인, 컴퓨터 판독 가능한 저장 매체.
  179. 제174항에 있어서,
    상기 시험 기질 상의 상기 장소를 측정하는 단계는 상기 2차원 영상화기에 의해서 측정된 데이터의 프레임을 훈련된 콘볼루션 신경망에 투입하는 단계를 포함하고,
    상기 데이터의 프레임은 광학 활성의 복수의 인스턴스 중에서 상기 광학 활성의 각자의 인스턴스를 포함하며,
    상기 광학 활성의 복수의 인스턴스 내의 광학 활성의 각각의 인스턴스는 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥의 일부에 결합하는 개별 프로브에 상응하고,
    상기 투입에 반응하여, 상기 훈련된 콘볼루션 신경망은 상기 광학 활성의 복수의 인스턴스 내의 광학 활성의 하나 이상의 인스턴스 각각의 상기 시험 기질 상의 위치를 식별하는, 컴퓨터 판독 가능한 저장 매체.
  180. 제175항 내지 제179항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 20㎚의 국지화 정밀도로 상기 시험 기질 상의 위치에 리졸빙하는, 컴퓨터 판독 가능한 저장 매체.
  181. 제175항 내지 제179항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 2㎚의 국지화 정밀도로 상기 시험 기질 상의 위치에 리졸빙하는, 컴퓨터 판독 가능한 저장 매체.
  182. 제175항 내지 제179항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 60㎚의 분해능으로 상기 시험 기질 상의 위치에 리졸빙하는, 컴퓨터 판독 가능한 저장 매체.
  183. 제175항 내지 제179항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 적어도 6㎚의 분해능으로 상기 시험 기질 상의 위치에 리졸빙하는, 컴퓨터 판독 가능한 저장 매체.
  184. 제175항 내지 제179항 중 어느 한 항에 있어서, 상기 측정하는 단계는 상기 광학 활성의 각자의 인스턴스의 상기 중심을 상기 시험 기질 상의 위치에 리졸빙하되, 상기 위치는 부분 회절 제한된 위치인, 컴퓨터 판독 가능한 저장 매체.
  185. 제174항 내지 제184항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계는 상기 위치에서 5000개 초과의 광자를 측정하는, 컴퓨터 판독 가능한 저장 매체.
  186. 제174항 내지 제184항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계는 상기 위치에서 50,000개 초과의 광자를 측정하는, 컴퓨터 판독 가능한 저장 매체.
  187. 제174항 내지 제184항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스의 상기 시험 기질 상의 상기 장소 및 상기 지속기간을 측정하는 단계는 상기 위치에서 200,000개 초과의 광자를 측정하는, 컴퓨터 판독 가능한 저장 매체.
  188. 제174항 내지 제184항 중 어느 한 항에 있어서, 상기 광학 활성의 각자의 인스턴스는 상기 시험 기질에 대해서 관찰된 배경에 대한 미리 결정된 표준 편차의 수보다 더 큰, 컴퓨터 판독 가능한 저장 매체.
  189. 제188항에 있어서, 상기 미리 결정된 표준 편차의 수는 3 표준 편차인, 컴퓨터 판독 가능한 저장 매체.
  190. 제188항에 있어서, 상기 미리 결정된 표준 편차의 수는 6 표준 편차인, 컴퓨터 판독 가능한 저장 매체.
  191. 제174항 내지 제190항 중 어느 한 항에 있어서, 광학 활성의 각각의 각자의 인스턴스는 미리 결정된 역치를 충족시키는 관찰 메트릭을 갖는, 컴퓨터 판독 가능한 저장 매체.
  192. 제191항에 있어서, 상기 관찰 메트릭은 지속기간, 신호 대 노이즈, 광자 수치 또는 강도를 포함하는, 컴퓨터 판독 가능한 저장 매체.
  193. 제191항에 있어서, 상기 미리 결정된 역치는,
    (i) 상기 고유한 N량체 서열의 각각의 잔기가 상기 핵산의 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 내의 상보성 염기에 결합하는 제1 결합 형태와,
    (ii) 상기 고유한 N량체 서열과 상기 각자의 올리고뉴클레오타이드 프로브가 결합하여 상기 광학 활성의 각자의 인스턴스를 형성하는 상기 핵산의 상기 고정된 제1 가닥 또는 상기 고정된 제2 가닥 내의 서열 사이에 적어도 하나의 미스매치가 존재하는 제2 결합 형태를 구별하는, 컴퓨터 판독 가능한 저장 매체.
  194. 제191항 또는 제193항에 있어서, 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브는 그 자신의 상응하는 미리 결정된 역치를 갖는, 컴퓨터 판독 가능한 저장 매체.
  195. 제194항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 상기 미리 결정된 역치는 트레이닝 데이터세트로부터 유래되는, 컴퓨터 판독 가능한 저장 매체.
  196. 제195항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대한 상기 미리 결정된 역치는 상기 트레이닝 데이터세트로부터 유래되고,
    상기 트레이닝 세트는, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 각자의 올리고뉴클레오타이드 프로브에 대해서, 참조 서열에 결합하여 상기 각자의 올리고뉴클레오타이드 프로브의 상기 고유한 N량체 서열의 각각의 잔기가 상기 참조 서열 내의 상보성 염기에 결합할 때의 상기 각자의 올리고뉴클레오타이드 프로브에 대한 상기 관찰 메트릭의 측정치를 포함하는, 컴퓨터 판독 가능한 저장 매체.
  197. 제174항 내지 제196항 중 어느 한 항에 있어서,
    상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 동일한 길이 M을 갖되,
    M은 2 이상의 양의 정수이고, 그리고
    상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계 (f)는 상기 복수의 위치 세트에 의해서 표현된 상기 올리고뉴클레오타이드 프로브의 상기 중첩 서열을 더 사용하는, 컴퓨터 판독 가능한 저장 매체.
  198. 제197항에 있어서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 상기 올리고뉴클레오타이드 프로브의 세트 내의 또 다른 올리고뉴클레오타이드 프로브와 M-1 서열 상동성을 공유하는, 컴퓨터 판독 가능한 저장 매체.
  199. 제197항에 있어서, 상기 시험 기질 상의 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계는 상기 고정된 제1 가닥에 상응하는 제1 타일링 경로 및 상기 고정된 제2 가닥에 상응하는 제2 타일링 경로를 결정하는 것을 포함하는, 컴퓨터 판독 가능한 저장 매체.
  200. 제199항에 있어서, 상기 제1 타일링 경로 내의 브레이크는 상기 제2 타일링 경로의 상응하는 부분을 사용하여 리졸빙되는, 컴퓨터 판독 가능한 저장 매체.
  201. 제199항에 있어서, 상기 제1 타일링 경로 또는 상기 제2 타일링 경로 내의 브레이크는 참조 서열을 사용하여 리졸빙되는, 컴퓨터 판독 가능한 저장 매체.
  202. 제199항에 있어서, 상기 제1 타일링 경로 또는 상기 제2 타일링 경로 내의 브레이크는 상기 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 리졸빙되는, 컴퓨터 판독 가능한 저장 매체.
  203. 제199항에 있어서, 상기 서열의 서열 배정의 신뢰도는 상기 제1 타일링 경로 및 상기 제2 타일링 경로의 상응하는 부분을 사용하여 증가되는, 컴퓨터 판독 가능한 저장 매체.
  204. 제199항에 있어서, 상기 서열의 서열 배정의 신뢰도는 상기 핵산의 또 다른 인스턴스로부터 획득된 제3 타일링 경로 또는 제4 타일링 경로의 상응하는 부분을 사용하여 증가되는, 컴퓨터 판독 가능한 저장 매체.
  205. 핵산의 서열결정 방법으로서,
    (a) 상기 핵산을 시험 기질 상에 선형의 신장된 형태로 고정시킴으로써 고정되고 신장된 핵산을 형성하는 단계;
    (b) 상기 고정되고 신장된 핵산을 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브의 각자의 풀에 노출시키는 단계로서, 상기 올리고뉴클레오타이드 프로브의 세트 내의 각각의 올리고뉴클레오타이드 프로브는 미리 결정된 서열 및 길이를 갖되, 상기 노출시키는 단계 (b)는 상기 각자의 올리고뉴클레오타이드 프로브의 상기 각자의 풀의 개별 프로브가 상기 각자의 올리고뉴클레오타이드 프로브에 상보성인 고정된 핵산의 일부에 일시적이고 그리고 가역적으로 결합함으로써 광학 활성의 각자의 인스턴스를 발생시키는 것을 허용하는 조건 하에서 일어나는, 상기 노출시키는 단계;
    (c) 2차원 영상화기를 사용하여 상기 노출시키는 단계 (b) 동안 발생한 광학 활성의 각각의 각자의 인스턴스의 상기 시험 기질 상의 장소 및 지속기간을 측정하는 단계;
    (d) 상기 올리고뉴클레오타이드 프로브의 세트 내의 각자의 올리고뉴클레오타이드 프로브에 대해서 상기 노출시키는 단계 (b) 및 상기 측정하는 단계 (c)를 반복함으로써, 상기 시험 기질 상의 복수의 위치 세트를 획득하는 단계로서, 상기 시험 기질 상의 각각의 각자의 위치 세트는 상기 올리고뉴클레오타이드 프로브의 세트 내의 올리고뉴클레오타이드 프로브에 상응하는, 상기 반복하는 단계; 및
    (e) 상기 복수의 위치 세트에 의해서 표현된 상기 시험 기질 상의 상기 위치를 컴파일링함으로써 상기 시험 기질 상의 상기 복수의 위치 세트로부터 상기 핵산의 적어도 일부의 상기 서열을 결정하는 단계
    를 포함하는, 핵산의 서열결정 방법.
  206. 제205항에 있어서, 상기 핵산은 이중 가닥 핵산이고, 상기 고정된 이중 가닥 핵산을 시험 기질 상에 단일 가닥 형태로 변성시킴으로써 상기 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 단계를 더 포함하되, 상기 고정된 제2 가닥은 상기 고정된 제1 가닥에 상보성인, 핵산의 서열결정 방법.
  207. 제205항에 있어서, 상기 핵산은 단일 가닥 RNA인, 핵산의 서열결정 방법.
  208. 핵산의 분석 방법으로서,
    (a) 상기 핵산을 시험 기질 상에 이중 가닥 형태로 고정시킴으로써 고정된 이중 가닥 핵산을 형성하는 단계;
    (b) 상기 고정된 이중 가닥 핵산을 상기 시험 기질 상에 단일 가닥 형태로 변성시킴으로써 상기 핵산의 고정된 제1 가닥 및 고정된 제2 가닥을 획득하는 단계로서, 상기 고정된 제2 가닥은 상기 고정된 제1 가닥에 상보성인, 상기 변성시키는 단계;
    (c) 상기 고정된 제1 가닥 및 상기 고정된 제2 가닥을 하나 이상의 올리고뉴클레오타이드 프로브에 노출시키고, 상기 하나 이상의 올리고뉴클레오타이드 프로브가 상기 고정된 제1 가닥에 결합하는지 또는 상기 고정된 제2 가닥에 결합하는지의 여부를 결정하는 단계
    를 포함하는, 핵산의 분석 방법.
KR1020207018498A 2017-11-29 2018-11-29 출현에 의한 핵산의 서열결정 KR20200105660A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762591850P 2017-11-29 2017-11-29
US62/591,850 2017-11-29
PCT/US2018/063162 WO2019108853A1 (en) 2017-11-29 2018-11-29 Sequencing of nucleic acids by emergence

Publications (1)

Publication Number Publication Date
KR20200105660A true KR20200105660A (ko) 2020-09-08

Family

ID=66664243

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020207018498A KR20200105660A (ko) 2017-11-29 2018-11-29 출현에 의한 핵산의 서열결정

Country Status (9)

Country Link
US (3) US10982260B2 (ko)
EP (1) EP3717645A4 (ko)
JP (1) JP2021503969A (ko)
KR (1) KR20200105660A (ko)
CN (1) CN111566211A (ko)
AU (1) AU2018375160A1 (ko)
CA (1) CA3084554A1 (ko)
SG (1) SG11202004649SA (ko)
WO (1) WO2019108853A1 (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11427867B2 (en) * 2017-11-29 2022-08-30 Xgenomes Corp. Sequencing by emergence
US20200059506A1 (en) * 2018-08-14 2020-02-20 Triad National Security, Llc Data transmission framing
US11519033B2 (en) 2018-08-28 2022-12-06 10X Genomics, Inc. Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample
SG11202105824RA (en) 2018-12-10 2021-06-29 10X Genomics Inc Imaging system hardware
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
EP3963091A4 (en) * 2019-04-29 2023-07-19 Nautilus Biotechnology, Inc. METHODS AND SYSTEMS FOR ON-CHIP INTEGRATED SINGLE MOLECULE DETECTION
WO2020243187A1 (en) * 2019-05-29 2020-12-03 Xgenomes Corp. Sequencing by emergence
EP3976820A1 (en) 2019-05-30 2022-04-06 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
CN110760574B (zh) * 2019-10-14 2023-06-06 芯盟科技有限公司 测定碱基的装置及方法
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
EP3891300B1 (en) * 2019-12-23 2023-03-29 10X Genomics, Inc. Methods for spatial analysis using rna-templated ligation
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
WO2021216708A1 (en) 2020-04-22 2021-10-28 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
EP4153775A1 (en) 2020-05-22 2023-03-29 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
EP4153776A1 (en) 2020-05-22 2023-03-29 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021242834A1 (en) 2020-05-26 2021-12-02 10X Genomics, Inc. Method for resetting an array
WO2021252499A1 (en) 2020-06-08 2021-12-16 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
WO2021263111A1 (en) 2020-06-25 2021-12-30 10X Genomics, Inc. Spatial analysis of dna methylation
US11981960B1 (en) 2020-07-06 2024-05-14 10X Genomics, Inc. Spatial analysis utilizing degradable hydrogels
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11981958B1 (en) 2020-08-20 2024-05-14 10X Genomics, Inc. Methods for spatial analysis using DNA capture
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
WO2022140028A1 (en) 2020-12-21 2022-06-30 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
EP4196605A1 (en) 2021-09-01 2023-06-21 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
CN113881753B (zh) * 2021-12-08 2022-02-18 南京邮电大学 一种非诊断目的的基因定位方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2755149B1 (fr) * 1996-10-30 1999-01-15 Pasteur Institut Procede de diagnostic de maladies genetiques par peignage moleculaire et coffret de diagnostic
US7071324B2 (en) * 1998-10-13 2006-07-04 Brown University Research Foundation Systems and methods for sequencing by hybridization
US6221592B1 (en) 1998-10-20 2001-04-24 Wisconsin Alumi Research Foundation Computer-based methods and systems for sequencing of individual nucleic acid molecules
NO986133D0 (no) * 1998-12-23 1998-12-23 Preben Lexow FremgangsmÕte for DNA-sekvensering
US7585964B2 (en) * 2001-05-14 2009-09-08 Cancer Genetics, Inc. Methods of analyzing chromosomal translocations using fluorescence in situ hybridization (FISH)
US20040058349A1 (en) 2001-10-01 2004-03-25 Jeffrey Van Ness Methods for identifying nucleotides at defined positions in target nucleic acids
EP2159285B1 (en) 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US7276338B2 (en) * 2003-11-17 2007-10-02 Jacobson Joseph M Nucleotide sequencing via repetitive single molecule hybridization
GB201017905D0 (en) 2010-10-25 2010-12-01 Mir Kalim U Preparation and analysis of samples
EP3411494A4 (en) 2015-11-18 2020-03-11 Kalim U. Mir HIGH-RESOLUTION SEQUENCING

Also Published As

Publication number Publication date
CN111566211A (zh) 2020-08-21
WO2019108853A1 (en) 2019-06-06
SG11202004649SA (en) 2020-06-29
EP3717645A1 (en) 2020-10-07
CA3084554A1 (en) 2019-06-06
AU2018375160A1 (en) 2020-05-28
US20190233880A1 (en) 2019-08-01
US20220064712A1 (en) 2022-03-03
US10982260B2 (en) 2021-04-20
JP2021503969A (ja) 2021-02-15
EP3717645A4 (en) 2021-09-01
US20240117413A1 (en) 2024-04-11

Similar Documents

Publication Publication Date Title
US20240117413A1 (en) Sequencing by emergence
US11427867B2 (en) Sequencing by emergence
US20200147610A1 (en) Addressable flow cell using patterned electrodes
JP2023514749A (ja) 統合型インサイチュ空間的アッセイのための方法および組成物
CA3062190C (en) Methods and devices for single-molecule whole genome analysis
KR20220034054A (ko) 출현에 의한 시퀀싱
WO2012056192A1 (en) Preparation and analysis of samples in micro-/nano-fluidic devices
US20220359040A1 (en) Systems and methods for determining sequence
KR20160003814A (ko) 순차적 하이브리드화 바코딩에 의한 분자의 멀티플렉스 표지화
US10851411B2 (en) Molecular identification with subnanometer localization accuracy
US20200082913A1 (en) Systems and methods for determining sequence
EP3887545A1 (en) Sequencing by coalascence
US20230374572A1 (en) Multiomic analysis device and methods of use thereof
Nyblom Single DNA Molecule Analysis–New Tools for Medical Diagnosis
WO2023092139A2 (en) Systems and methods for isolation of desired nucleic acid strands
Bauer Preparing and sequencing ultra-long DNA molecules from single chromosomes

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal