KR20220106153A - 표적 분석과 관련된 조성물, 세트, 및 방법 - Google Patents

표적 분석과 관련된 조성물, 세트, 및 방법 Download PDF

Info

Publication number
KR20220106153A
KR20220106153A KR1020227020588A KR20227020588A KR20220106153A KR 20220106153 A KR20220106153 A KR 20220106153A KR 1020227020588 A KR1020227020588 A KR 1020227020588A KR 20227020588 A KR20227020588 A KR 20227020588A KR 20220106153 A KR20220106153 A KR 20220106153A
Authority
KR
South Korea
Prior art keywords
read
barcode
region
molecule
molecules
Prior art date
Application number
KR1020227020588A
Other languages
English (en)
Inventor
후이 꾸옥 응우옌
샤암타누 샤토라지
차오-팅 우
Original Assignee
프레지던트 앤드 펠로우즈 오브 하바드 칼리지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 filed Critical 프레지던트 앤드 펠로우즈 오브 하바드 칼리지
Publication of KR20220106153A publication Critical patent/KR20220106153A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6832Enhancement of hybridisation reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/137Metal/ion, e.g. metal label
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/155Particles of a defined size, e.g. nanoparticles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 명세서에 기술된 기술은 표적 분자를 분석, 검출 및/또는 시각화하기 위한 조성물, 세트 및 방법에 관한 것이다. 한 양태에서, 적어도 하나의 표적 분자에 혼성화된 적어도 하나의 올리고뉴클레오티드 태그의 아이덴티티를 결정하기 위한 판독 분자의 세트가 본 명세서에 기술된다. 또 다른 양태에서, 상기 판독 분자의 세트를 이용하여 적어도 하나의 표적 분자에 결합된 상기 올리고뉴클레오티드 태그를 검출하는 방법이 본 명세서에 기술된다.

Description

표적 분석과 관련된 조성물, 세트, 및 방법
관련 출원에 대한 상호 참조
본 출원은 2019년 11월 26일에 출원된 미국 가출원 제62/940,638호에 대해 35 U.S.C. § 119(e)에 따른 이익을 주장하며, 상기 가출원의 전문은 본 명세서에 참조로 통합된다.
정부 지원
본 발명은 미국 국립 보건원(National Institutes of Health)이 수여한 HG008525에 따른 정부 지원으로 이루어졌다. 정부는 본 발명에 대한 특정 권리를 갖는다.
서열 목록
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출된 서열 목록을 포함하며, 그의 전문이 본 명세서에 참조로 통합된다. 상기 ASCII 사본은 2020년 11월 23일에 생성되었고 002806-095230WOPT_SL.txt으로 명명되었으며 크기는 5,053바이트이다.
기술분야
본 명세서에 기술된 기술은 표적 분자를 분석, 검출 및/또는 시각화하기 위한 조성물, 세트, 및 방법에 관한 것이다.
복제, 유전 및 발생적으로 조절되는 유전자 발현은 모든 염색체에 걸쳐 동시에 발생하는 모든 게놈-차원의(genome-wide) 과정이다. 실제로, 게놈-차원의 조정이 붕괴하면 게놈 손상, 염색체 파손 및 손실, 이수성(aneuploidy), 유전자의 심한 오발현, 및 질병으로 이어질 수 있다. 이와 같이, 게놈을 전체로 조회하는 잠재력이 있는 기술에 대한 수요가 증가하고 있다. 이러한 다양한 방법 중에서, 게놈의 공간적 조직화에 관한 정보를 제공하는 방법은, 염색체의 3차원(3D) 배열이 게놈 기능 및 안정성과 강한 상관관계가 있다는 증거가 급증하고 있기 때문에, 특히 유용하다. Hi-C 및 기타 염색체 형태 캡처 기술을 비롯한 GAM(Genome Architecture Mapping)과 같은, 근접성-기반 캡처(proximity-based capture)를 이용하는 분석은, 게놈 영역이 핵의 동일한 서브섹션에서 상호작용하고/하거나 발견되는 빈도를 보고할 수 있다. 이러한 게놈-차원의 방법은 인핸서와 프로모터 간의 시스 상호 작용에서 활성 및 비활성 염색질의 염색체-내 및 염색체-간 구획화에 이르기까지 전체 게놈이 조직화되는 계층적 방식을 밝혀냈다.
그러나, 게놈을 제자리(in situ) 맵핑하는 방법은 제한적이다. 게놈의 좌위(loci)가 3D 핵 내부에 국재화되는, 공간 유전체학(Spatial genomics)은, DNA의 공간적 국재화가 발현, 복구, 복제, 및 기능에 중요한 역할을 한다는 사실과 관련하여 새롭게 떠오르는 분야이다. 현재 게놈 시각화 방법은, 순차 라벨링 체계 및 신호 생성으로 인해, 처리량을 비롯한 표적 검출에 어려움을 겪고 있다. 공간 유전체학은 한 번에 4 내지 5가지 색상을 감지하는 기존 현미경의 능력으로 인해 제한되기 때문에, 대부분의 기술은 표적의 순차적 시각화에 의존한다. 이러한 방법은 선형적으로 확장되고, ∼25,000개의 인간 유전자를 모두 시각화하는 데 현실적이지 않다. 공간 정보를 제공하면서 또한 전체 게놈을 수용하기 위해서는, 검출가능한 표적의 수가 증가하고 분해능이 증가된 라벨링 기술이 필요하다.
본 명세서에 기술된 기술은, 표적 분자를 분석, 검출 및/또는 시각화하기 위한 올리고뉴클레오티드 조성물 및 세트, 및 상응하는 방법에 관한 것이다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 표적 분자에 결합된 적어도 하나의 올리고뉴클레오티드 태그(예를 들어, 바코딩된 올리고페인트)의 아이덴티티(identity)는, 판독 분자의 세트로 결정된다. 이러한 올리고뉴클레오티드 태그 및 판독 분자의 세트는, 각각, 제한된 수의 바코드 영역 및 바코드-혼성화 영역을 포함한다. 다른 방법(예를 들어, SOLiD 화학)과 비교할 때, 이러한 판독 분자의 세트 및 시퀀싱법(본 명세서에서 "저스트 이너프 바코드(Just Enough Barcodes)"(JEB) 또는 "정확한 바코드(Exact Barcodes)"로 지칭됨)은 단순화되며, 불필요한 올리고를 버리고, 더 높은 시퀀싱 신호를 초래한다. 또한, 본 명세서에 기술된 바와 같은 세트 및 방법은, 다른 조성물 및 방법과 비교하여, 다음의 적어도 2가지 이점을 입증한다: (1) 이들은 표적 분자로부터 충분한 신호를 생성하는 데 필요한 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 수를 감소시키고, (2) 이들은 검출될 수 있는 바코드 비트 수를 증가시키므로, 고유하게 식별될 수 있는 표적의 수가 증가된다. 궁극적으로, 본 명세서에 기술된 바와 같은 세트 및 방법은, 전체 인간 게놈의 이미지화를 허용한다.
게놈의 3D 구성(configuration)의 복잡성 및 생물학적 중요성을 밝히기 위해, 게놈 이미지화 및 차세대 시퀀싱에 JEB 바코드를 적용하는 것이 본 명세서에 설명되어 있다. JEB 바코드는 형광성 인시투 시퀀싱(in situ sequencing)을 활용하여 게놈에 혼성화된 임의의 수의 바코드화된 올리고페인트 올리고뉴클레오티드를 동시에 표적화, 위치화, 및 시각화하는 방법인 OligoFISSEQ와 함께 사용할 수 있다. OligoFISSEQ를 사용하여, 46개 좌위가 수백 개의 개별 인간 세포에서 X 염색체를 따라, 뿐만 아니라, 36개 좌위(loci)가 6개 염색체에 걸쳐, 공간적으로 맵핑되었고, >75%를 넘는 바코드 회수율(recovery rate)이 달성되었으며, 고해상도 공간 맵과 염색체 추적이 생성되었다. 이러한 데이터는 8 라운드의 시퀀싱으로 모든 인간 유전자를 맵핑하는 OligoFISSEQ 및 JEB 바코드의 능력을 입증한다. 전체 게놈을 제자리에서 동시에 시각화하는 것은 게놈 조직화 및 기능을 조절하는 메커니즘을 조사하는 데 필수적이다. 단일 세포에서 수많은 게놈 표적을 표적화하고 시각화하며, 게놈에 대한 이해를 향상시키기 위해 JEB 바코드를 사용하여 상세한 3D 맵을 생성할 수 있다.
한 양태에서 적어도 2개의 판독 분자의 세트가 본 명세서에 기술되며, 각각의 판독 분자가, (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 (d) 광학적으로 검출가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 라벨이 형광 라벨이다.
임의의 양태의 일부 실시형태에서, 상기 광학적으로 검출가능한 라벨이, 비오틴, 아민, 금속, 금속 나노클러스터, 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조(origami structures)를 포함하거나 또는 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 상기 라벨이, 판독 분자의 5' 말단에 위치한다.
임의의 양태의 일부 실시형태에서, 상기 세트가, 4개의 구별가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 세트가, 적어도 2개의 구별가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 세트가, 적어도 3개의 구별가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 세트가, 적어도 4개의 구별가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 제1의 3' 영역을 포함하는 각 세트의 판독 분자가, 제1 구별가능한 라벨만을 포함한다.
임의의 양태의 일부 실시형태에서, 임의의 선택된 3' 영역을 포함하는 각 세트의 판독 분자가, 상응하는 주어진 구별가능한 라벨만을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 3' 영역이, 그 길이가 적어도 1개의 뉴클레오티드 또는 이의 유사체이다.
임의의 양태의 일부 실시형태에서, 상기 3' 영역이, 그 길이가 5개의 뉴클레오티드 또는 이의 유사체이다.
임의의 양태의 일부 실시형태에서, 상기 5' 영역이, 범용(universal) 뉴클레오티드 염기만을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 5' 영역이, 데옥시이노신 뉴클레오티드만을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 5' 영역이, 그 길이가 적어도 1개의 뉴클레오티드 또는 이의 유사체이다.
임의의 양태의 일부 실시형태에서, 상기 5' 영역이, 그 길이가 3개의 뉴클레오티드 또는 이의 유사체이다.
임의의 양태의 일부 실시형태에서, 상기 적어도 2개의 판독 분자가, DNA 및/또는 RNA를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 2개의 판독 분자가, DNA 및/또는 RNA로 구성되거나 본질적으로 구성된다.
임의의 양태의 일부 실시형태에서, 상기 적어도 2개의 판독 분자가, 폴리펩티드를 포함한다.
한 양태에서, 적어도 2개의 판독 분자의 세트가 본 명세서에 기술되며, 각각의 판독 분자가, (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; 및 (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형을 포함한다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 상기 5' 비-바코드-혼성화 영역이, 올리고뉴클레오티드에 특이적으로 혼성화한다.
임의의 양태의 일부 실시형태에서, 상기 올리고뉴클레오티드가, 적어도 하나의 검출가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 올리고뉴클레오티드가, 적어도 하나의 다른 올리고뉴클레오티드에 특이적으로 혼성화한다.
임의의 양태의 일부 실시형태에서, 상기 올리고뉴클레오티드가, 증폭 프라이머이다.
임의의 양태의 일부 실시형태에서, 상기 올리고뉴클레오티드가, 시퀀싱 프라이머이다.
임의의 양태의 일부 실시형태에서, 상기 올리고뉴클레오티드가, 초해상도 현미경 검사법을 위한 이미저 가닥(imager strand)이다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 상기 5' 비-바코드-혼성화 영역이, 적어도 5개의 뉴클레오티드의 길이이다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 상기 5' 비-바코드-혼성화 영역이, 적어도 10개의 뉴클레오티드의 길이이다.
임의의 양태의 일부 실시형태에서, 상기 5' 비-바코드-혼성화 영역이, 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자가, 광학적으로 검출가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 라벨이, 형광 라벨이다.
임의의 양태의 일부 실시형태에서, 상기 광학적으로 검출가능한 라벨이, 형광단, 비오틴, 아민, 금속, 금속 나노클러스터, 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조를 포함하거나 또는 추가로 포함한다.
한 양태에서, 본 명세서에는 (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 판독 분자의 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 독특한 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; (d) 광학적으로 검출가능한 라벨; 및 (e) 나노입자,를 포함하는 판독 분자가 기술된다.
한 양태에서, 본 명세서에는 (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 판독 분자의 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유의 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 (d) 금속 나노입자,를 포함하는 판독 분자가 기술된다.
한 양태에서, 본 명세서에는 (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 (d) 금속 나노입자,를 포함하는 판독 분자가 기술된다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자가 광학적으로 검출가능한 라벨을 추가로 포함한다.
한 양태에서 본 명세서에는 적어도 2개의 판독 분자의 세트가 기술되며, 각각의 판독 분자가, (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유의 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; (d) 광학적으로 검출가능한 라벨을 포함하고; 여기서 적어도 하나의 판독 분자는 나노입자를 추가로 포함한다.
한 양태에서 본 명세서에는 적어도 2개의 판독 분자의 세트가 기술되며, 각각의 판독 분자가, (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유의 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; 및 (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형을 포함하고; 여기서 적어도 하나의 판독 분자는 나노입자를 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자가, 광학적으로 검출가능한 라벨을 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 상기 광학적으로 검출가능한 라벨이, 형광단을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 상기 세트의 적어도 2개의 판독 분자에 연결된다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 금속 나노입자를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 금속 나노입자가, Au, Ag, Ni, Co, Pt, Pd, Cu, Ti, 및 Al 나노입자로 이루어진 군으로부터 선택된다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 금 나노입자를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 금 나노막대(nanorod)를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 약 1.2 nm의 직경을 갖는다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 약 3 nm의 직경을 갖는다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 약 5 nm의 직경을 갖는다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 약 10 nm의 직경을 갖는다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 약 30 nm의 직경을 갖는다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 약 50 nm의 직경을 갖는다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 판독 분자의 3' 말단에 있다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 검출가능한 라벨로부터 적어도 20 뉴클레오티드에 있다.
임의의 양태의 일부 실시형태에서, 상기 나노입자가, 검출가능한 라벨로부터 적어도 30 뉴클레오티드에 있다.
한 양태에서, 본 명세서에는 (a) 적어도 하나의 표적 분자의 검출; (b) 신호 증폭; (c) 분지 반응(branch reaction); (d) 혼성화 연쇄 반응(HCR; hybridization chain reaction); (e) 교환 반응에 의한 신호 증폭(SABER; signal amplification by exchange reaction); (f) 롤링 서클 증폭(RCA; rolling circle amplification); (g) 인시투 시퀀싱; (h) 매트릭스 부착; 또는 (i) 초해상도 현미경 검사법을 위한, 판독 분자 또는 이의 세트의 사용이 기술된다.
한 양태에서, 본 명세서에는 샘플에서 적어도 하나의 표적 분자를 검출하는 방법이 기술되며, 상기 방법은, (a) 상기 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는, (i) 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (ii) 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,를 포함함; (b) 상기 샘플을 본 명세서에 기술된 것과 같은 판독 분자의 세트와 접촉시키는 단계; 및 (c) 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계,를 포함하고, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 된다.
임의의 양태의 일부 실시형태에서, 상기 바코드 영역이 각각의 올리고뉴클레오티드 태그에 고유하다.
임의의 양태의 일부 실시형태에서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수보다 적다.
임의의 양태의 일부 실시형태에서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수의 10% 미만이다.
임의의 양태의 일부 실시형태에서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수의 1% 미만이다.
임의의 양태의 일부 실시형태에서, 고유 바코드 비트의 총 수가, 적어도 2개의 고유 바코드 비트이다.
임의의 양태의 일부 실시형태에서, 고유 바코드 비트의 총 수가, 10개 이하의 고유 바코드 비트이다.
임의의 양태의 일부 실시형태에서, 상기 바코드-혼성화 영역이, 각각의 판독 분자에 고유하다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트에 사용된 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수보다 적다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 10% 미만이다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 1% 미만이다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 적어도 2개의 고유 바코드-혼성화 영역을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 10개 이하의 고유 바코드-혼성화 영역을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 스트리트가, 시퀀싱 프라이머를 어닐링하기 위한 프라이머 결합 영역을 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 상기 검출 단계가 시퀀싱법으로 수행된다.
임의의 양태의 일부 실시형태에서, 상기 시퀀싱법이, 라이게이션에 의한 시퀀싱, 합성에 의한 시퀀싱, 혼성화에 의한 시퀀싱, 및/또는 순환 가역적 중합 혼성화 연쇄 반응에 의한 시퀀싱을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 라이게이션에 의한 시퀀싱이, 효소-기반 라이게이션을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 라이게이션에 의한 시퀀싱이, 화학적 라이게이션, 구리 보조 라이게이션, 무 구리 클릭 반응, 아민-EDC 기반 커플링, 또는 티올-말레이미드 마이클 부가를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 스트리트에 대한 판독 분자의 특이적 혼성화가, 바코드 영역 및 바코드-혼성화 영역의 아이덴티티에 의해 결정된다.
임의의 양태의 일부 실시형태에서, 상기 광학적으로 검출가능한 라벨이, 형광단이다.
임의의 양태의 일부 실시형태에서, 상기 검출이 형광 현미경 검사법으로 수행된다.
임의의 양태의 일부 실시형태에서, 상기 광학적으로 검출가능한 라벨이, 비오틴, 아민, 금속, 금속 나노클러스터, 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조를 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 상기 검출이, 적어도 단일 세포 해상도로 수행된다.
임의의 양태의 일부 실시형태에서, 상기 검출이, 적어도 단일 핵 해상도로 수행된다.
임의의 양태의 일부 실시형태에서, 적어도 2개의 표적 분자가 동시에 검출된다.
임의의 양태의 일부 실시형태에서, 적어도 3개의 표적 분자가 동시에 검출된다.
임의의 양태의 일부 실시형태에서, 적어도 10개의 표적 분자가 동시에 검출된다.
임의의 양태의 일부 실시형태에서, 적어도 20개의 표적 분자가 동시에 검출된다.
임의의 양태의 일부 실시형태에서, 상기 표적 분자가 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 표적 분자가 DNA 및/또는 RNA를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 표적 분자가 폴리펩티드를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 표적 분자가 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질에, 공유적으로 또는 비-공유적으로 연결된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 세포, 세포 배양물, 또는 조직 샘플이다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 오르가노이드를 포함한다.
한 양태에서, 본 명세서에는 샘플에서 적어도 하나의 표적 분자를 검출하는 향상된 방법이 기술되며, 상기 방법은, (a) 상기 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는, (i) 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (ii) 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트를 포함하는, 단계; (b) 상기 샘플을 본 명세서에 기술된 것과 같은 판독 분자 또는 이의 세트와 접촉시키는 단계; 및 (c) 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계를 포함하고, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 된다.
임의의 양태의 일부 실시형태에서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 1.5배 증가된다.
임의의 양태의 일부 실시형태에서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 3배 증가된다.
임의의 양태의 일부 실시형태에서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 10배 증가된다.
임의의 양태의 일부 실시형태에서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 50배 증가된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 인간 세포 핵을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 임의의 유기체의 세포로부터의 핵을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 중기 염색체 스프레드(spreads)를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 중기 염색체가 배양된 세포 핵으로부터 수득된다.
임의의 양태의 일부 실시형태에서, 상기 중기 염색체가 조직 절편, 오르가노이드, 또는 생검 표본으로부터 추출된 핵으로부터 수득된다.
임의의 양태의 일부 실시형태에서, 상기 검출가능한 라벨이 전자 현미경, 형광 현미경, 암시야(dark field) 현미경, 또는 이들의 임의의 조합을 사용하여 검출된다.
한 양태에서 본 명세서에는 생물학적 샘플의 핵형 분석 방법이 기술되며, 상기 방법은, (a) 상기 샘플을 적어도 하나의 염색체에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는, (i) 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (ii) 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,를 포함하는, 단계; (b) 상기 샘플을 본 명세서에 기술된 것과 같은 판독 분자의 세트와 접촉시키는 단계; (c) 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 적어도 하나의 표적 분자에 혼성화되고, 이로써 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계; 및 (d) 적어도 하나의 염색체에 특이적인 적어도 하나의 올리고뉴클레오티드 태그의 아이덴티티(identity)에 따라 적어도 하나의 염색체의 아이덴티티를 결정하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 p 암(arm)에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 q 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 p 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그, 및 적어도 하나의 염색체의 q 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 p 암 또는 q 암에 특이적인 적어도 2개의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 p 암 또는 q 암에 특이적인 적어도 3개의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 각각의 염색체 암에 특이적인 최대 6개의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 각 염색체 암에 특이적인 최대 10개의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 각 염색체 암에 특이적인 최대 20개의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 인간 세포 핵을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 임의의 유기체의 세포로부터의 핵을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 중기 염색체 스프레드를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 중기 염색체가 배양된 세포 핵으로부터 수득된다.
임의의 양태의 일부 실시형태에서, 상기 중기 염색체가 조직 절편, 오르가노이드, 또는 생검 표본으로부터 추출된 핵으로부터 수득된다.
한 양태에서, 본 명세서에는 샘플에서 적어도 하나의 표적 분자의 고해상도 이미지를 생성하는 방법이 기술되며, 상기 방법은, (a) 적어도 한 라운드의 고해상도 이미지화 방법을 사용하여 적어도 하나의 표적 분자를 이미지화하는 단계; 및 (b) (i) 각각의 올리고뉴클레오티드 태그가, (A) 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (B) 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트를 포함하는, 적어도 하나의 올리고뉴클레오티드 태그와 상기 샘플을 접촉시키는 단계; (ii) 상기 샘플을 본 명세서에 기술된 것과 같은 판독 분자의 세트와 접촉시키는 단계; 및 (iii) 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계,를 포함하는, 적어도 하나의 이미지화된 표적 분자의 아이덴티티를 결정하는 단계를 포함하고, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 된다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 2개의 표적 분자를 이미지화하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 12개의 표적 분자를 이미지화하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 66개의 표적 분자를 이미지화하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 258개의 표적 분자를 이미지화하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 500개의 표적 분자를 이미지화하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 5000개의 표적 분자를 이미지화하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 표적 분자 모두가 한 번에 이미지화된다.
임의의 양태의 일부 실시형태에서, 상기 표적 분자의 적어도 절반이 한 번에 이미지화된다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 2 라운드의 고해상도 이미지화 방법을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 3 라운드의 고해상도 이미지화 방법을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 5 라운드의 고해상도 이미지화 방법을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 20 라운드의 고해상도 이미지화 방법을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 고해상도 이미지화 방법이, 다음으로 이루어진 군으로부터 선택된다: 올리고 확률적 광학 재구성 현미경 검사법(OligoSTORM; Oligo Stochastic Optical Reconstruction Microscopy); 구조 조명 현미경(SIM; structured ill㎛ination microscopy); 자극 방출 고갈(STED; Stimulated emission depletion) 현미경 검사법; 및 나노규모 토폴로지에서 올리고 DNA 포인트 축적(DNA-PAINT; Oligo DNA point acc㎛ulation in nanoscale topology).
임의의 양태의 일부 실시형태에서, 상기 고해상도 이미지화 방법이, 올리고 확률적 광학 재구성 현미경 검사법(OligoSTORM)을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 2 라운드의 샘플을 판독 분자의 세트와 접촉시키는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 3 라운드의 샘플을 판독 분자의 세트와 접촉시키는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 5 라운드의 샘플을 판독 분자의 세트와 접촉시키는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 10 라운드의 샘플을 판독 분자의 세트와 접촉시키는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 20 라운드의 샘플을 판독 분자의 세트와 접촉시키는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 1 kb 핵산을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 15 kb 핵산을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 50 kb 핵산을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 100 kb 핵산을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 1 Mb 핵산을 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 염색체를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 게놈을 포함한다.
도 1a-1f는 OligoFISSEQ 방법 모음을 보여주는 일련의 개략도 및 이미지이다. 도 1a는 OligoFISSEQ에 사용된 올리고페인트 올리고의 개략도를 나타낸다. 라이게이션 기반 표적 조사(LIT; Ligation based Interrogation of Targets) 프라이머 사이트 및 바코드의 일부뿐만 아니라 합성 기반 표적 조사(SIT; Synthesis based Interrogation of Targets) 프라이머 부위 및 바코드를 혼성화 기반 표적 조사(HIT; Hybridization based Interrogation of Targets) 브릿지 결합 부위로 사용했다. 도 1b는 OligoFISSEQ 워크플로우를 보여주는 개략도이다. 도 1c는 LIT 워크플로우를 보여주는 개략도이다. LIT 프라이머는 인산화되어 있다(회색 "P"). 각 8mer(즉, 8-nt 길이의 핵산)의 처음 2개의 뉴클레오티드(nts)는 특정 형광단에 해당하고, "N"은 A, C, T 또는 G의 혼합물을 나타내고, "Z"는 범용 염기를 나타낸다. 8-mer는 바코드 영역의 일부에 혼성화한다(예를 들어, SEQ ID NO: 5, ACTGTGAATCGC). 도 1d는 SIT 워크플로우를 나타내는 개략도이다. 도 1e는 HIT 워크플로우를 나타내는 개략도이다. 도 1f는 PGP1f 상의 Chr19-20K 라이브러리를 사용한 4 라운드의 OligoFISSEQ LIT, OligoFISSEQ SIT, 및 OligoFISSEQ HIT의 대표적인 이미지를 보여준다. 각 이미지는 OligoFISSEQ의 각 라운드에 대한 라벨을 나타낸다. 이미지는 복수의 z 슬라이스의 최대 강도 z-투영(projection)이다. 이미지는 바코드 특정 형광 채널에서 가져온 것이다. SIT의 첫 번째 라운드는 2 채널의 조합이다: 보라색 및 녹색 형광(즉, 흰색 신호를 생성). 세포 당 표준 편차가 있는 바코드 검출율이 Chr19-20K 라이브러리 상의 LIT, SIT, 및 HIT에 대해 표시된다. 4개의 기술적 복제물(replicates)에서의 세포 당 바코드 검출율에 관한 총 세포 = HIT의 경우 79, LIT의 경우 85, SIT의 경우 66. 스케일 바 = 10 ㎛.
도 2a-2d는 36plex-5K 라이브러리 상의 OligoFISSEQ-LIT를 보여주는 일련의 개략도 및 이미지이다. 도 2a는 36plex-5K 라이브러리 표적의 레이아웃을 보여주는 개략도이다. 염색체 번호는 다른 라벨로 표시되어 있다. 이 개략도는 축척도는 아니다. 도 2b는 36plex-5K가 특정 염색체를 라벨링함을 보여주는 일련의 이미지이다. 상단 이미지는 36plex-5K 라이브러리와 혼성화된 정상 인간 남성 림프모세포(lymphoblasts)의 중기 염색체 스프레드를 보여준다. 하단 이미지는 36plex-5K 라이브러리와 혼성화된 PGP1f 세포를 보여준다. 라벨은 도시된 도 2a의 염색체 코드에 해당한다. Chr 19(Chr19-20K)의 영역을 표적화하는 올리고페인트가 또한 중기 스프레드(예를 들어, 밝은 신호) 내에 염색되어 있다. 이미지는 최대 z-투영이다. 스케일 바 = 모든 이미지에 대해 10 ㎛. 도 2c는 36plex-5K 라이브러리의 메인스트리트 및 백스트리트 시퀀싱의 4 라운드의 OligoFISSEQ-LIT로부터의 PGP1f 핵(남성)의 이미지를 보여준다. 이미지는 디콘볼루션된 5-라벨 병합 최대 z-투영에서 취해진 것이다. 도 2d는 4 라운드의 O-LIT로 시퀀싱된 3개의 세포를 포함하는 시야(FOV; field of view)의 3-D 표현을 보여준다. FOV에서 가장 큰 세포는 도 2c의 세포에 해당한다. 각 라운드는 z-축에 표시되며, 첫 번째 라운드는 핵 DAPI 윤곽선(검정색)에 가장 가깝다. 각 라운드의 시퀀싱 신호의 최대 z-투영을 취해서, 복제하고(더 나은 시각화를 위해 총 2개 이미지) 서로 겹쳐 쌓아서 이미지를 형성한다.
도 3a-3f는 36plex-5K에서 모든-픽셀(every-pixel) 분석 파이프라인을 보여주는 일련의 이미지, 개략도 및 그래프이다. 도 3a는 모든-픽셀 자동화 분석 파이프라인을 보여주는 개략도이다. 다양한 음영은 다른 염색체 표적에 해당한다. 확대보기(예를 들어, 패널 2)는 디코딩되고, 맵핑되고, 추적된 Chr2(6개 표적)의 상동체(homolog)를 보여준다. 도 3b는 티어(Tier) 2 이후의 36plex-5K 메인스트리트-백스트리트(MSBS) 표적 검출을 보여주는 막대 그래프이다. 표적의 80.2 ± 7.3%가 13개의 복제물에 걸쳐 638개 세포에서 검출된다. x-축 상의 카툰 염색체는 표적 염색체를 나타낸다. 3qR3 및 5pR3 표적은 동일한 바코드를 공유하며, 불포함되어 있음에 유의해야 한다. 도 3c는 티어 2 이후에 디코딩된 표적을 사용한 패널 a 핵(도 2a-2d)의 염색체 추적을 보여주는 이미지이다. 64/66(97%) 36plex-5K 표적이 검출되었다. 이미지는 표적 아이덴티티(identity)가 오버레이된 LIT의 첫 번째 라운드에서 얻은 것이다. 다른 선은 검출된 표적 간의 염색체 추적을 나타낸다. 도 3d는 도 3b-3c에서 핵의 3-D 표현이다. 염색체 표적은 나타낸 바와 같이 색상이 부여된다. 검은 구체는 비검출된 표적이다. 도 3e (도 3ea∼3eb)는 도 3b-3c에서 티어 2의 핵 검출 후 단일-세포 페어와이즈(pairwise) 공간 거리 매트릭스를 보여주는 이미지이다. 표적은 각각의 상동체가 분리된 x-축 상에 표시되어 있다. 비검출된 표적은 회색 선으로 표시되어 있다. 도 3f는 36plex-5K 집단 페어와이즈 공간 거리 측정을 보여주는 이미지이다. 세포 집단으로부터의 평균 페어와이즈 공간 거리(n = 638개 세포)는 티어 1 검출 후에 표시된다. 상동성 표적으로부터의 측정치를 합하였다.
도 4a-4d는 OligoFISSEQ-eLIT를 보여주는 일련의 이미지, 개략도 및 그래프이다. 도 4a는 OligoFISSEQ-정확한 바코드 라이게이션 기반 표적 조사(eLIT)와 함께 사용되는 저스트 이너프 바코트(JEB) 기술에 대한 개략도를 보여준다. JEB 라벨링된 8-머(mers)가 회색 상자에 상세히 제시되어 있다. 각 8-머(mer)의 3' 말단은 5-nt eLIT 바코드 비트와 완전히 상보적이다. 5' 말단의 "I"는 데옥시이노신("범용 염기")일 수 있다. 도 4a에 도시된 바와 같이, JEB 올리고는 (5'에서 3'으로 표시됨) 다음을 포함할 수 있다: nnnTGACT(서열번호: 6), nnnAGACC(서열번호: 7), nnnGACCA(서열번호: 8), 및/또는 nnnGAGCG(서열번호: 9), 여기서 "n"은 범용 뉴클레오티드 염기(예를 들어, 데옥시이노신)를 포함하고, 그리고 올리고는 뉴클레오티드 3과 4 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형을 추가로 포함한다. JEB 올리고는 라벨링된 8-머(mers)의 풀을 4개로 감소시킨다. 도 4b는 JEB가 있는 OligoFISSEQ-eLIT에 대한 개략도를 보여준다. JEB 올리고(예를 들어, 도 4a 참조)는 eLIT 바코드 비트와 완전한 상보성(5-nt)을 공유한다. 도 4b는 바코드 영역(예를 들어, 서열번호: 10, TGGTCGGTCTAGTCA)의 일부와 혼성화하는 JEB 올리고(예를 들어, 서열번호: 8 또는 7)를 보여준다. 도 4c는 OligoFISSEQ-eLIT PGP1f 세포를 사용하여 5 라운드 시퀀싱된 36plex-1K 라이브러리의 일련의 이미지를 보여준다. 상단 이미지는 1차 시퀀싱 후 세포의 잘라낸(cropped) 시야를 보여준다. 하단 패널은 라벨링된 2차 올리고(T)가 있는 모든 표적을 검출하는 "토토 하이브(toto hybe)"로 5 라운드 시퀀싱된 핵(상단 이미지의 정사각형)을 확대한 모습을 보여준다. 핵외 반점(extranuclear puncta)은 기준 사면체 비드(fiducial tetraspeck beads)이다. 이미지는 디콘볼루션된 최대 z-투영이다. 스케일 바 = 10 ㎛. 도 4d는 티어 2 검출 후 36plex-1K 라이브러리의 표적 검출 효율을 보여주는 막대 그래프이며, SOLiD 시약으로 O-LIT(밝은 회색) 또는 JEB로 eLIT(진회색)를 5 라운드한 것이다. 평균 검출: SOLiD = 54.6%(n = 1개 복제물에서 41개 세포), JEB = 76.4 ± 8.6%(n = 8개 복제물에서 439개 세포). 오차 막대 = 모집단 표준 편차.
도 5a-5f는 염색체 X를 따라 46개 영역의 추적을 보여주는 일련의 이미지, 개략도 및 그래프이다. 도 5a는 PGP1f에서 LIT 시퀀싱의 첫 번째 라운드에서 적출한 시야에 오버레이된 ChrX-46plex-2K 라이브러리의 레이아웃이다. 현미경 사진은 디컨볼루션된 최대 강도 z-투영이다. 도 5b는 OligoFISSEQ-eLIT로 메인스트리트 및 백스트리트의 5 라운드로부터 혼성화되고 시퀀싱된 ChrX-46plex-2K 라이브러리가 있는 확대-보기 세포(시야 도 5a의 정사각형)의 이미지를 보여준다. 흰색 숫자는 시퀀싱 라운드를 나타낸다. 왼쪽 패널은 1차 라운드 시퀀싱에 따른 전체 핵(DAPI)에 대한 보기를 나타내고, 오른쪽의 작은 패널은 라벨링된 2차 올리고(T)가 있는 모든 표적을 검출하는 "토토 하이브"로의 각 시퀀싱 라운드의 확대-보기를 나타낸다. 이미지는 디콘볼루션된 최대 z-투영이다. 도 5c는 PGP1f에서 티어 2 검출 및 5 라운드의 eLIT(MS 및 MSBS) 후 ChrX-46plex-2K 라이브러리의 표적 검출 효율을 보여주는 막대 그래프이다. 평균 검출 = 74.6 ± 2.5%(n = 5개 복제물에서 146개 세포). 오차 막대 = 모집단 표준 편차. 도 5d-5e는 도 5b의 세포의 내삽(interpolation) 후 ChrX-46plex-2K 맵핑 및 추적(도 5d) 및 3-D 시각화(도 5e)를 보여주는 일련의 이미지이다. 도 5f는 도 5b로부터의 핵에 대해 내삽 후 페어와이즈 거리 매트릭스를 보여주는 이미지이다. 도 5g는 ChrX-46plex(MS 및 MSBS) 집단쌍 공간 거리 측정을 보여주는 이미지이다. 티어 1 검출 후 세포 집단의 평균 페어와이즈 공간 거리 매트릭스(n = 2개의 복제물에서 61개 세포).
도 6a-6d는 OligoFISSEQ 확장 및 응용을 보여주는 일련의 이미지, 개략도 및 그래프이다. 도 6a는 단일 유전자 표적의 OligoFISSEQ 검출 및 유전자 표적의 개략도를 나타내는 이미지이다. 샘플 시야는 PGP1f 상의 O-eLIT 1차 라운드에서 가져온 것이다. 사각형은 5 라운드 후 특정 유전자 표적을 개략적으로 나타낸다. 숫자는 11개 중에서 검출된 표적의 백분율을 반영한다. 이미지는 디콘볼루션된 최대 z-투영이다. 도 6b는 티어 2 검출 및 메인스트리트 및 백스트리트에 대한 5 라운드의 O-eLIT 오프로부터의 6개-유전자 라이브러리로부터의 표적 검출 효율을 보여주는 막대 그래프이다. n = 2개의 복제물에서 61개 세포. 오차 막대 = 세포 집단 간의 표준 편차. 도 6c는 OligoFISSEQ-LIT와 면역형광을 합친 이미지이다. 36plex-5K 라이브러리를 OligoFISSEQ-LIT에 이어 면역형광법으로 4 라운드 동안 시퀀싱하였다. 이미지는 오버레이된 염색체 추적이 있는 최대 강도 z 투영이다. 도 6d(도 6da∼6db)는 초고해상도 현미경으로 게놈 시각화를 다중화하기 위해 OligoSTORM과 OligoFISSEQ-LIT(O-LITSTORM)의 조합을 보여주는 일련의 이미지이다. Chr2-6plex-5K 라이브러리를 PGP1f 세포에 혼성화하고 1 라운드의 OligoSTORM을 준비하여 모든 표적을 동시에 시각화하고, 이어서 2 라운드의 O-LIT로 표적을 디코딩하였다. 왼쪽 패널은 DBSCAN 이후의 OligoSTORM 이미지를 보여주며, 이 시점에서 클러스터의 아이덴티티는 알 수 없다. 중간 패널은 1차 O-LIT의 현미경 사진을 보여준다. 이미지는 디콘볼루션된 최대 z-투영이다. 오른쪽 가운데 패널은 디코딩된 대상의 확대된(magnified) 보기를 나타낸다. 오른쪽 패널은 OligoSTORM으로부터의 표적을 확대하여 보여준다. 하단 패널은 각 표적에 대한 회절-제한 및 STORM 이미지를 나타낸다.
도 7은 염색체 추적 프로세스의 워크플로우 차트이다.
도 8은 연속 좌위 36plex 사이의 거리에 대한 일련의 히스토그램이다.
도 9는 연속 좌위 ChrX-46plex 사이의 거리의 히스토그램이다.
도 10a-10h는 표적에 대한 고도로 다중화된 제자리 시각화 및 식별을 위한 방법을 보여주는 일련의 개략도, 이미지 및 그래프이다. 도 10a는 특이적 절단을 허용하는 올리고뉴클레오티드 변형의 개략도이다. 비제한적 예로서, 이 도면에는 포스포로티올레이트 변형된 올리고뉴클레오티드가 제시되어 있다. 설파이드 변형은 별표(*)로 표시된 올리고뉴클레오티드 포스페이트 백본에서 가교 산소를 대체한다. 온화한 조건(50mM AgNO3)에서 중금속으로 처리하면 설파이드 치환(가위 기호로 표시됨)에서 올리고뉴클레오티드의 절단이 초래되어, 올리고뉴클레오티드가 2부분으로 분리되고 5' 포스페이트(PO4)가 생성된다. 이 설파이드 변형은 올리고뉴클레오티드 내부의 임의의 뉴클레오티드 위치에 배치될 수 있어, 유연성이 나타냄에 유의할 필요가 있다. 도 10b는 효소-매개 라이게이션, 표적화된 절단, 및 올리고뉴클레오티드 연장을 위한 포스포로티올레이트 올리고의 예시적인 용도를 보여주는 개략도이다. 5' 포스페이트를 포함하는 프라이머는 포스포로티올레이트 올리고와의 라이게이션에 의해 연장된다. AgNO3 매개 절단은 사용자-지정 위치(*로 표시됨)에서 발생하여, 연장된 올리고의 절단과 5' PO4의 재생을 초래한다. 올리고는 다른 설파이드 변형된 올리고의 도입으로 더 연장될 수 있다. 도 10c는 형광 인시투 시퀀싱 (FISSEQ) 특이성 및 신호를 개선하기 위한 포스포로티올레이트 올리고 화학의 사용을 보여주는 개략도이다. 이 개략도는 SOLiD(Sequencing by Oligonucleotide Ligation and Detection)에서 사용하는 4개의 라벨 시퀀싱(SBL) 방식을 보여준다. 여기에 나타낸 바와 같이, 8-nt(뉴클레오티드) 형광 라벨된 올리고를 사용할 수 있다. SOLiD는 3'에서 5' 말단으로 이염기(di-base) 체계를 사용한다: nt 1과 2는 특정 형광단(표의 음영 원)에 해당하고; nt 3 내지 5는 A, C, T 및 G의 혼합물이고; nt 6에서 8은 범용 염기이며, nt 5와 6 사이에 포스포로티올레이트가 있다(*로 표시됨). SOLiD 올리고의 풀은 1,024개의 서로 다른 올리고 종으로 구성된다. 이에 비해, 본 명세서에 기술된 "저스트 이너프 바코드"(JEB) 체계 및 화학은 올리고 종의 수를, 예를 들어, 4로 감소시키며, nt 1에서 5를 특정 서열로 제한하고 데옥시이노신 뉴클레오티드("범용 염기")로 nt 6-8을 갖도록 한다. JEB에서의 5nt 서열 제한은 비제한적인 예시 적용이라는 점에 유의할 필요가 있다. 포스포로티올레이트 변형 올리고는 지정된/제한된 nt의 임의의 조합에 적용이능하다. 또한, 형광단 접합은 유연하고 다수의 다양한 형광단 또는 검출가능한 라벨과 호환가능하다. 도 10d는 OligoFISSEQ를 개선하기 위한 JEB 화학의 사용을 보여주는 개략도이다. 여기에는 SBL과 호환가능한 바코드화된 올리고페인트가 도시되어 있다. 도 10e는 JEB를 사용한 OligoFISSEQ의 개략도이다. 먼저, 5' 포스포릴화된(phosphorylated) 라이게이션 프라이머는 올리고페인트 스트리트의 라이게이션 시퀀싱 프라이머 결합 부위에 혼성화한다. 다음으로, JEB 올리고는 DNA 라이게이즈와 함께 유입된다. 바코드(예를 들어, 서열번호: 11, TGGTCGGTCTAGTCACGCTCGGTCT)에 대한 상보성을 갖는 JEB 올리고(예를 들어, 서열번호: 6 내지 9)는 혼성화 및 라이게이션된다. 라이게이션되지 않은 JEB를 씻어내고, 이미지를 캡처한다. JEB 올리고는 nt 5와 6 사이에서 절단되어, 형광단을 방출하고 5' PO4를 노출시킨다. 전체 바코드가 시퀀싱될 때까지 사이클이 반복된다. 라이게이션된 올리고의 예시적인 부분은 서열번호: 2(GACCA), 서열번호: 12(nnnAGACCGACCA, 여기서 n은 범용 뉴클레오티드 염기(예를 들어, 데옥시이노신)를 포함하고, 여기서 올리고는 뉴클레오티드 3과 4 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형을 추가로 포함함) 또는 서열번호: 13(AGACCGAGCGTGACTAGACCGACCA)을 포함한다. 도 10f(도 10fg의 도 10f)는 JEB 올리고가 있는 OligoFISSEQ가 SOLiD 올리고에 비해 개선된 신호를 나타냈음을 보여주는 일련의 이미지이다. 여기에는 Chr19(염색체 19) 상의 2.4 Mb 영역을 표적으로 하는 9,000개의 바코드화된 올리고페인트 시퀀싱의 첫 번째 라운드의 대표적인 이미지가 나타나 있다. 각 이미지에는 두 개의 핵이 존재하였다. 이미지화 조건(예를 들어, 노출, 여기 등)은 두 이미지에 대해 동일하였다. 도 10g(도 10fg의 도 10g)는 JEB 올리고가 있는 OligoFISSEQ가 SOLiD 올리고에 비해 4배 이상 더 높은 신호 대 노이즈비(SNR)를 나타내었음을 보여주는 막대 그래프이다. 히스토그램은 도 10f의 이미지에서 시퀀싱 신호의 SNR을 비교한다. SNR은 도 10f 이미지의 z-투영에서 각 시퀀싱 초점에서 가장 밝은 픽셀을 측정하고 평균 핵 배경 강도(즉, 시퀀싱 신호가 존재하지 않는 영역)로 나누어 계산하였다. 그런 다음 값은 SOLiD를 사용하여 SNR로 정규화되었다. 도 10h는 다중화된 게놈 시각화를 위한 워크플로우를 보여주는 개략도이다. 1차(primary) 올리고페인트 라이브러리(작은 회색 원)는 고정된 세포에 혼성화된다. 그 다음, 각 표적은 복수의 라운드(예를 들어, 본 명세서에 도시된 바와 같이 3회)에 걸쳐 시퀀싱될 수 있다. 시퀀싱이 완료된 후, 키(key)와, 식별된 특정 바코드와 비교하여 각 초점을 디코딩할 수 있다.
도 11a-11e는 "JEB(Just Enough Barcodes)" 오버행을 보여주는 일련의 개략도 및 이미지이다. 도 11a(도 11ab의 도 11a)는 Chr2-6plex-1K 라이브러리 컬러 바코드의 개략도를 보여준다. 6개의 게놈 영역(도 11a에서 A-F로 표시됨)은 게놈 영역당 1,000개의 올리고페인트 올리고에 의해 인간 염색체 2를 따라 표적화되었다. 각 게놈 영역은 특정 바코드를 포함하며; 여기(예를 들어, 도 11a-11e)에서 한 라운드가 나타나 있다. 도 11b(도 11ab의 도 11b)는 PGP1f 세포에서 Chr2-6plex-1K 라이브러리를 시각화하는 JEB로의 OligoFISSEQ-eLIT의 한 라운드를 보여준다. JEB 중 하나(화살표로 나타냄)는 형광단 대신 올리고뉴클레오티드(올리고) 오버행을 포함하고 이미지(예를 들어, Cy3)에서 시각화되어 있지 않다. 이미지는 최대 강도 z-투영을 보여준다. 스케일 바는 10 ㎛이다. 도 11c(도 11cd의 도 11c)는 JEB 상의 올리고 오버행에 상보적인 형광단 라벨링된 올리고의 혼성화 후 도 11b에서와 동일한 핵을 보여준다. Cy3 신호가 나타나 있다. 도 11d(도 11cd의 도 11d)에서, JEB 오버행에 혼성화된 형광단-라벨링된 올리고는 60% 포름아미드로 세척된다. Cy3 신호는 사라진다. 도 11e에서, 새로운 이중 형광단 라벨링된 올리고는 JEB 오버행에 혼성화된다. Cy3 신호가 다시 나타난다.
도 12a-12b는 인간 남성 말초 림프구로부터의 중기 스프레드에 대한 129plex 올리고페인트 FISH를 보여주는 일련의 이미지 및 그래프이다.
도 13은 JEB 올리고를 사용하는 인간 남성 말초 림프구에 대한 4 라운드의 OligoFISSEQ를 보여주는 일련의 이미지이다.
도 14는 인간 남성 말초 림프구로부터의 중기 스프레드에 대한 3 라운드의 OligoFISSEQ를 사용한 디코딩을 보여주는 이미지이다.
도 15는 인간 남성 말초 림프구로부터의 중기 스프레드에 대한 4 라운드의 OligoFISSEQ를 사용한 핵형 분석을 보여주는 이미지이다.
도 16은 금 나노 입자(Au-NP)에 의한 인시투 시퀀싱 신호의 형광 신호 증강을 보여주는 일련의 이미지와 그래프이다. 메인 스트리트 및 백 스트리트 시퀀싱 프라이머는 50 nm Au-NP 및 30 nm Au-NP로 라벨링되었다. 표적은 Chr 19 내의 6개 스폿이다: ∼ 0.5kb, 스폿당 15개 올리고. TxR은 "텍사스 레드(Texas Red)" 형광단을 나타낸다.
도 17a-17b는 게놈 초해상도 이미지화를 가속화하기 위한 OligoSTORM 및 OligoFISSEQ의 조합을 보여주는 일련의 이미지와 그래프이다. 도 17a에서, 36plex-5K 라이브러리는 PGP1f 세포에 혼성화되고 1 라운드의 OligoSTORM(2시간)으로 이미지화되어 모든 66개 표적이 동시에 시각화되고, 이어서 4 라운드의 OligoFISSEQ(라운드 당 2 내지 3시간)로 표적이 디코딩된다. 도 17b(도 17ba 내지 도 17bc)는 별도로 나타낸 OligoSTORM으로 이미징된 각 염색체 영역을 보여주며; 방향은 도 17a와 다를 수 있다.
상세한 설명
본 명세서에 기술된 기술의 실시형태는 올리고뉴클레오티드 조성물 및 세트, 그리고 표적 분자를 분석, 검출 및/또는 시각화하기 위한 상응하는 방법을 포함한다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 표적 분자에 결합된 적어도 하나의 올리고뉴클레오티드 태그(예를 들어, 바코드화된 올리고페인트)의 아이덴티티는 판독 분자의 세트로 결정된다. 이러한 올리고뉴클레오티드 태그 및 판독 분자의 세트는, 각각, 제한된 수의 바코드 영역 및 바코드-혼성화 영역을 포함한다. 다른 방법(예를 들어, SOLiD 화학)과 비교하여, 본 명세서에서 "저스트 이너프 바코드"(JEB) 또는 "정확한 바코드"로 지칭되는, 이러한 판독 분자의 세트 및 시퀀싱법은 단순화되고, 불필요한 올리고는 폐기되고, 더 높은 시퀀싱 신호를 생성한다. 또한, 본 명세서에 기술된 바와 같은 세트 및 방법은 다른 조성물 및 방법과 비교하여 다음의 적어도 2가지 이점을 입증한다: (1) 이들은 표적 분자로부터 충분한 신호를 생성하는 데 필요한 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 수를 감소시키고, (2) 이들은 검출될 수 있는 바코드 비트 수를 증가시키므로, 고유하게 식별될 수 있는 표적의 수가 증가한다. 궁극적으로, 본 명세서에 기술된 바와 같은 세트 및 방법은 전체 인간 게놈의 이미지화를 허용한다.
따라서, 한 양태에서 본 명세서에는 적어도 하나의 판독 분자의 세트가 기술되며, 각각의 판독 분자는, (a) 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함하는 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역; (b) 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함하는 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 (d) 광학적으로 검출가능한 라벨을 포함한다.
또 다른 양태에서 본 명세서에는 샘플에서 적어도 하나의 표적 분자를 검출(및/또는 분석)하는 방법이 기술되며, 이 방법은, (a) 상기 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는, (i) 검출(및/또는 분석)하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (ii) 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,를 포함함; (b) 본 명세서에 기술된 것과 같은 판독 분자의 세트와 상기 샘플을 접촉시키는 단계; 및 (c) 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계,를 포함하고, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 된다.
본 명세서에 사용된, 용어 "판독 분자(readout molecule)"는 적어도 1) 검출 가능한 라벨 및 2) 바코드-혼성화 영역을 포함하는 분자를 지칭하며, 이는 적어도 하나의 올리고뉴클레오티드 태그의 적어도 일부에 상보적이고/이거나 적어도 하나의 올리고뉴클레오티드 태그의 적어도 일부와 특이적으로 혼성화하는 올리고뉴클레오티드 서열을 지칭한다. 본 명세서에 사용된, 용어 "올리고뉴클레오티드 태그"는 인식 도메인 및/또는 적어도 하나의 스트리트를 포함하는 올리고뉴클레오티드이다. 인식 도메인은 검출하고자 하는 표적 분자에 특이적으로 결합하고, 스트리트는 적어도 하나의 바코드 비트(또는 유닛)를 포함하는 바코드 영역을 포함한다. 각 바코드-혼성화 영역은 올리고뉴클레오티드 태그의 특정 바코드 비트에 혼성화한다. 임의의 양태의 일부 실시형태에서, 고유 바코드 비트 및/또는 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드 비트 비트의 총 수보다 유의하게 적다. 이러한 제한된 수는 필요한 판독 분자의 총 수를 감소시키고, 검출 동안 판독 분자의 신호 대 노이즈비를 증가시킨다.
본 명세서에는 판독 분자 및 이의 세트가 기술된다. 본 명세서에 사용된, 용어 "판독 분자"는 적어도 1) 검출가능한 라벨 및 2) 적어도 하나의 올리고뉴클레오티드 태그의 적어도 일부에 상보적이고/거나 적어도 하나의 올리고뉴클레오티드 태그의 적어도 일부와 특이적으로 혼성화하는 올리고뉴클레오티드 서열을 포함하는 분자를 지칭한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 적어도 하나의 올리고뉴클레오티드 태그의 적어도 일부(예를 들어, 바코드 영역)에 상보적이고 올리고뉴클레오티드 태그의 적어도 일부에 혼성화하는 바코드-혼성화 영역을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 하나의 바코드-혼성화 영역 및 적어도 하나의 다른 영역(예를 들어, 비-바코드-혼성화 영역)을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 하나의 바코드-혼성화 영역 및 적어도 하나의 변형을 포함한다. 임의의 양태의 일부 실시양태에서, 판독 분자는 단일 바코드-혼성화 영역을 포함한다. 임의의 양태의 일부 실시양태에서, 판독 분자는 단일 라벨, 또는 단일 광학적으로 검출가능한 라벨, 또는 단일 광학적으로 검출가능한 신호를 제공하는 단일 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자는 DNA 및/또는 RNA이다. 임의의 양태의 일부 실시형태에서, 판독 분자는 DNA 및/또는 RNA를 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 DNA 및/또는 RNA로 구성되거나 본질적으로 구성된다. 임의의 양태의 일부 실시형태에서, 판독 분자는 폴리펩티드를 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 3' 바코드-혼성화 영역, (b) 5' 비-바코드-혼성화 영역, (c) 3' 영역 및 5' 영역 사이의 변형, 및 (d) 검출 가능한 라벨(예를 들어, 도 10c 참조)을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 5' 바코드-혼성화 영역, (b) 3' 비-혼성화 영역, (c) 3' 영역과 5' 영역 사이의 변형, 및 (d) 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 바코드-혼성화 영역, (b) 적어도 하나의 비-바코드-혼성화 영역, (c) 바코드-혼성화 영역과 적어도 하나의 비-바코드-혼성화 영역, 및 (d) 검출가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함하는 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역; (b) 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함하는 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 (d) 광학적으로 검출가능한 라벨(예를 들어, 도 10c 참조)을 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 3' 바코드-혼성화 영역, (b) 5' 비-바코드-혼성화 영역, (c) 3' 영역 및 5' 영역 사이의 변형, 및 선택적으로 (d) 검출가능한 라벨(예를 들어, 도 10c 또는 도 11a-11e 참조)를 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 5' 바코드-혼성화 영역, (b) 3' 비-혼성화 영역, (c) 3' 영역과 5' 영역 사이의 변형, 및 선택적으로 (d) 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 바코드-혼성화 영역, (b) 적어도 하나의 비-바코드-혼성화 영역, (c) 바코드-혼성화 영역과 적어도 하나의 비-바코드-혼성화 영역, 및 선택적으로 (d) 검출가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자는 다음을 포함한다: (a) 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함하는 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역; (b) 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함하는 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 (d) 광학적으로 검출가능한 라벨(예를 들어, 도 10c 또는 도 11a-11e 참조).
임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 3' 바코드-혼성화 영역, (b) 5' 비-바코드-혼성화 영역, 및 (c) 3' 영역 및 5' 영역 사이의 변형(예를 들어, 도 10c 또는 도 11a-11e 참조)을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 5' 바코드-혼성화 영역, (b) 3' 비-혼성화 영역, 및 (c) 3' 영역과 5' 영역 사이의 변형을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자가, (a) 바코드-혼성화 영역, (b) 적어도 하나의 비-바코드-혼성화 영역, 및 (c) 바코드-혼성화 영역과 적어도 하나의 비-바코드-혼성화 영역 사이의 변형을 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자는 다음을 포함한다: (a) 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함하는 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; 및 (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형.
임의의 양태의 일부 실시형태에서, 판독 분자는 다음을 포함한다: (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; (d) 광학적으로 검출가능한 라벨; 및 (e) 나노입자.
임의의 양태의 일부 실시형태에서, 판독 분자는 다음을 포함한다: (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 (d) 금속 나노입자.
임의의 양태의 일부 실시형태에서, 판독 분자는 다음을 포함한다: 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역; 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 금속 나노입자. 임의의 양태의 일부 실시형태에서, 판독 분자는 광학적으로 검출가능한 라벨을 추가로 포함한다.
본 명세서에 사용된, 용어 "바코드-혼성화 영역(barcode-hybridizing region)"은 올리고뉴클레오티드 태그의 바코드 영역의 적어도 일부에, 상보적이고 이에 따라 혼성화하는, 서열을 포함하는 판독 분자의 영역을 지칭한다. 임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 판독 분자의 3' 말단 상에 있고, 따라서 "3' 바코드-혼성화 영역"으로 지칭된다. 임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 판독 분자의 5' 말단 상에 있고, 따라서 "5' 바코드-혼성화 영역"으로 지칭된다. 임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 판독 분자의 5' 말단과 3' 말단 사이에 있고, "바코드-혼성화 영역"으로 지칭된다.
임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 비-바코드 혼성화 영역의 3'이다. 임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 비-바코드 혼성화 영역의 5'이다. 임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 라벨의 3'이다. 임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 라벨의 5'이다.
임의의 양태의 일부 실시형태에서, 바코드 혼성화 영역(예를 들어, 3' 바코드 혼성화 영역)은 길이가 적어도 1개의 뉴클레오티드(또는 이의 유사체)이다. 임의의 양태의 일부 실시형태에서, 바코드 혼성화 영역(예를 들어, 3' 바코드 혼성화 영역)은 길이가 5개의 뉴클레오티드(및/또는 이의 유사체)이다. 비제한적인 예로서, 바코드 혼성화 영역(예를 들어, 3' 바코드 혼성화 영역)은 길이가 1개 뉴클레오티드, 2개 뉴클레오티드, 3개 뉴클레오티드, 4개 뉴클레오티드, 5개 뉴클레오티드, 6개 뉴클레오티드, 7개 뉴클레오티드, 8개 뉴클레오티드, 9개 뉴클레오티드, 또는 적어도 10개의 뉴클레오티드이다. 임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역의 길이는 올리고뉴클레오티드 태그의 바코드 영역의 비트 크기에 상응하며, 여기서 용어 "비트(bit)"는 올리고뉴클레오티드 태그의 바코드 영역의 별개의 유닛을 지칭하고, 여기서 비트는 적어도 1개의 뉴클레오티드(또는 이의 유사체) 길이이다.
임의의 양태의 일부 실시형태에서, 각각의 바코드-혼성화 영역은 판독 분자의 세트 내의 모든 다른 판독 분자의 바코드-혼성화 영역 서열과 구별되는 고유 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 각각의 바코드-혼성화 영역은 판독 분자의 세트 내의 적어도 하나(예를 들어, 적어도 1, 적어도 2, 적어도 3, 적어도 4 등)의 다른 판독 분자(들)의 바코드-혼성화 영역 서열과 구별되는 고유 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 각각의 유형의 판독 분자는 세트 내의 다른 유형의 판독 분자의 다른 유형의 바코드-혼성화 영역 각각과 최대로 상이한 바코드-혼성화 영역 서열을 포함한다. 바코드 혼성화 영역 서열 간의 차이는 해밍(Hamming) 거리와 같은 메트릭으로 측정하거나 정량화할 수 있다. 비제한적인 예로서, 바코드-혼성화 영역은 적어도 2개의 염기쌍, 적어도 3개의 염기쌍, 적어도 4개의 염기쌍, 적어도 5개의 염기쌍, 적어도 6개의 염기쌍, 적어도 7개의 염기쌍, 적어도 8개의 염기쌍, 적어도 9개의 염기쌍, 또는 적어도 10개의 염기쌍의 해밍 거리만큼 서로 상이하다.
임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 본 명세서에 추가로 기술된 바와 같이 뉴클레오티드 및/또는 뉴클레오티드 유사체를 포함한다. 바코드-혼성화 영역 서열의 비제한적인 예는 다음을 포함한다(5'에서 3'로): GAGCG(서열번호: 1); GACCA(서열번호: 2); AGACC(서열번호: 3); 및 TGACT(서열번호: 4); 예를 들어, 도 10c를 참조. 바코드-혼성화 영역 서열의 추가의 비제한적인 예는 다음을 포함한다: GCGAG(서열번호: 14); ACCAG(서열번호: 15); CCAGA(서열번호: 16); 및 TCAGT(서열번호: 17). 각각의 바코드-혼성화 영역이 판독 분자의 세트에서 다른 모든 바코드-혼성화 영역과 구별되고 구별될 수 있는 한, 뉴클레오티드 또는 뉴클레오티드 유사체의 임의의 주어진 서열은 바코드-혼성화 영역일 수 있는 것으로 예상된다.
임의의 양태의 일부 실시형태에서, 판독 분자는 바코드-혼성화 영역에 추가하여 적어도 하나의 다른 영역을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 3' 바코드-혼성화 영역 및 5' 비-바코드-혼성화 영역을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 5' 바코드-혼성화 영역 및 3' 비-바코드-혼성화 영역을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 바코드-혼성화 영역, 5' 비-바코드-혼성화 영역, 및 3' 비-바코드-혼성화 영역을 포함한다.
임의의 양태의 일부 실시형태에서, 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역)은 본 명세서에 추가로 기재된 바와 같은 뉴클레오티드 및/또는 뉴클레오티드 유사체를 포함한다. 임의의 양태의 일부 실시형태에서, 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역)은 판독 분자의 세트 내의 다른 모든 판독 분자의 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역) 서열과 동일한 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역)은 판독 분자의 세트 내의 적어도 하나(예를 들어, 적어도 1개, 적어도 2개, 적어도 5개, 적어도 4개 등)의 다른 판독 분자(들)의 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역) 서열과 동일한 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역)은 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역) 세트 내의 적어도 하나(예를 들어, 적어도 1개, 적어도 2개, 적어도 5개, 적어도 4개 등)의 다른 판독 분자(들) 다른 판독 분자의 비바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역) 서열과 동일하지 않은 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 비-바코드-혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역 및/또는 3' 영역-바코드-혼성화 영역)은 범용 뉴클레오티드 염기만을 포함한다. 임의의 양태의 일부 실시형태에서, 비-바코드-혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역 및/또는 3'-바코드-혼성화 영역)은 데옥시이노신 뉴클레오티드만을 포함한다.
임의의 양태의 일부 실시형태에서, 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역)은 길이가 적어도 1개의 뉴클레오티드(또는 이의 유사체)이다. 임의의 양태의 일부 실시형태에서, 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역)은 길이가 3개의 뉴클레오티드(및/또는 이의 유사체)이다. 비제한적인 예로서, 비-바코드 혼성화 영역(예를 들어, 5' 비-바코드-혼성화 영역)은 길이가 1개 뉴클레오티드, 2개 뉴클레오티드, 3개 뉴클레오티드, 4개 뉴클레오티드, 5개 뉴클레오티드, 6개 뉴클레오티드, 7개 뉴클레오티드, 8개 뉴클레오티드, 9개 뉴클레오티드, 또는 적어도 10개 뉴클레오티드이다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 비-바코드-혼성화 영역은 검출가능한 라벨에 연결되지 않는다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 비-바코드-혼성화 영역은 올리고뉴클레오티드에 특이적으로 혼성화한다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드가, 적어도 하나의 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드가, 적어도 하나의 다른 올리고뉴클레오티드에 특이적으로 혼성화한다(예를 들어, 분지화 반응). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드가, 증폭 프라이머이다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드가, 시퀀싱 프라이머이다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드가, 초해상도 현미경 검사법(예를 들어, DNA-PAINT)을 위한 이미저 가닥이다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 비-바코드-혼성화 영역은 그 길이가 적어도 5개의 뉴클레오티드이다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 비-바코드-혼성화 영역은 그 길이가 적어도 10개의 뉴클레오티드이다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 판독 분자의 비-바코드-혼성화 영역은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 25개, 적어도 30개, 적어도 35개, 적어도 40개, 적어도 45개, 또는 적어도 50개의 뉴클레오티드 길이이다. 임의의 양태의 일부 실시형태에서, 비-바코드-혼성화 영역은 세트 내의 모든 다른 판독 분자의 비-바코드-혼성화 영역 서열과 동일한 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자는 바코드-혼성화 영역과 비-바코드-혼성화 영역 사이의 변형을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 바코드-혼성화 영역과 비-바코드-혼성화 영역 사이의 포스페이트 백본의 변형을 포함하며, 예를 들어, 백본 화학은 핵산의 자연적으로 발생하는 포스페이트 백본 이외의 것이다. 임의의 양태의 일부 실시형태에서, 판독 분자는 3' 바코드-혼성화 영역과 5' 비-바코드-혼성화 영역 사이의 변형을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자는 5' 바코드-혼성화 영역과 3' 비-바코드-혼성화 영역 사이의 변형을 포함한다. 일부 실시양태에서, 판독 분자는 바코드-혼성화 영역의 5' 말단과 비-바코드-혼성화 영역의 3' 말단 사이의 변형을 포함한다. 일부 실시양태에서, 판독 분자는 바코드-혼성화 영역의 3' 말단과 비-바코드-혼성화 영역의 5' 말단 사이의 변형을 포함한다.
임의의 양태의 일부 실시형태에서, 변형은 판독 분자의 포스페이트 골격의 가교 산소를 대신하여 황 변형을 포함한다(예를 들어, 도 10a 참조). "황 변형"은 추가 또는 대체 모이어티로서 포스페이트 골격에 적어도 하나의 황 원자를 부가하는 것을 의미한다. 임의의 양태의 일부 실시형태에서, 변형은 포스포로티올레이트 절단 부위를 포함한다. 임의의 양태의 일부 실시형태에서, 변형은 골격에서 절단가능한 변형을 포함한다(예를 들어, 다음 문헌 참조: US 2014/0349294; Xu and Kool, Nucleic Acids Res. 1998 Jul 1, 26(13):3159-64; 이들 각각의 내용은 그 전문이 본 명세서에 참조로 통합된다. 임의의 양태의 일부 실시형태에서, 판독 분자는 본 명세서에 추가로 기술된 바와 같은 임의의 절단가능한 변형을 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자는 nnnTGACT(서열번호: 6), nnnAGACC(서열번호: 7), nnnGACCA(서열번호: 8), 또는 nnnGAGCG(서열번호: 9)을 포함한다. 임의의 양태의 일부 실시형태에서, "n"(예를 들어, 서열번호: 6 내지 9 중 하나에서)은 범용 뉴클레오티드 염기(예를 들어, 데옥시이노신)를 포함한다. 임의의 양태의 일부 실시형태에서, (예를 들어, 서열번호: 6 내지 9 중 하나에서) 올리고는 뉴클레오티드 3 및 4 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형을 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 판독 분자는 검출가능한 라벨, 예를 들어, 광학적으로 검출가능한 분자, 즉, 광 또는 다른 전자기 파장을 통해 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, (예를 들어, 판독 분자의 세트의) 적어도 하나의 판독 분자는 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, (예를 들어, 판독 분자의 세트의) 적어도 하나의 판독 분자는 광학적으로 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 형광 라벨이다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 형광단이고, 검출은 형광 현미경 검사법으로 수행된다. 임의의 양태의 일부 실시형태에서, 판독 분자는 광학적으로 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 비오틴, 아민, 금속, 금속 나노클러스터(예를 들어, 금, 은 또는 구리), 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조를 포함한다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 DNA 오리가미 구조(즉, 비-임의적(non-arbitrary) 2-차원 및 3-차원 형상을 생성하기 위한 DNA의 나노규모 폴딩)를 포함하며; 예를 들어, 다음 문헌 참조: Rothemund, "Folding DNA to create nanoscale shapes and patterns", Nature 440, 297-302 (2006). 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 전자 현미경 검사법, 형광 현미경 검사법, 암시야 현미경 검사법, 또는 이들의 임의의 조합을 사용하여 검출된다. 임의의 양태의 일부 실시형태에서, 판독 분자는 임의의 검출가능한 라벨을 포함할 수 있다. 검출가능한 라벨, 형광단, 및 검출 기술의 비제한적인 예는 본 명세서에서 추가로 설명된다. 임의의 양태의 일부 실시형태에서, 각각의 판독 분자는 적어도 하나의 검출가능한 라벨을 포함한다. 비제한적 예로서, 각각의 판독 분자는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개의 검출가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 판독 분자의 5' 말단에 연결될 수 있고, 검출가능한 라벨은 판독 분자의 3' 말단에 연결될 수 있거나, 또는 검출가능한 라벨은 판독 분자의 5' 말단 및 3' 말단에 연결된다. 임의의 양태의 일부 실시형태에서, 판독 분자의 5' 말단에 연결된 검출가능한 라벨은 판독 분자의 3' 말단에 연결된 검출가능한 라벨과 동일한 유형의 검출가능한 라벨이다. 임의의 양태의 일부 실시형태에서, 판독 분자의 5' 말단에 연결된 검출가능한 라벨은 판독 분자의 3' 말단에 연결된 검출가능한 라벨과 상이한 유형의 검출가능한 라벨이다.
임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 판독 분자의 5' 말단에 위치하고 5' 비-바코드-혼성화 영역에 연결된다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 판독 분자의 3' 말단에 위치하고 3' 비-바코드-혼성화 영역에 연결된다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 검출 후 판독 분자로부터 절단된다.
임의의 양태의 일부 실시형태에서, 적어도 2개의 판독 분자가, 집합적으로 적어도 2개의 구별가능한 검출가능한 라벨을 포함한다. 비제한적인 예로서, 2개의 판독 분자는 집합적으로 2개의 구별가능한 검출가능한 라벨을 포함하고, 3개의 판독 분자는 집합적으로 3개의 구별가능한 검출가능한 라벨을 포함하고, 4개의 판독 분자는 집합적으로 4개의 구별가능한 검출가능한 라벨을 포함하거나, 또는 적어도 5개의 판독 분자는 집합적으로 적어도 5개의 구별가능한 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 판독 분자의 풀은 식별가능한 검출가능한 표지보다 더 많은 판독 분자를 포함하며, 예를 들어, 동일한 검출가능한 표지가 복수의 판독 분자 상에 존재할 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 판독 분자의 세트는 2개 이상의 라벨을 포함하고, 여기서 세트 내의 3' 영역 및 라벨은 상응하는 쌍으로 조직화되어, 제1의 3' 영역을 포함하는 임의의 판독 분자는 또한 상응하는 제1 라벨을 포함하고, 제2의 3' 영역을 포함하는 임의의 판독 분자는 또한 상응하는 제2 라벨을 포함하고, 각 판독 분자는 3' 영역에 해당하지 않는 라벨을 포함하지 않는다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 4개의 구별가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 적어도 2개의 구별가능한 표지, 적어도 3개의 구별가능한 표지, 또는 적어도 4개의 구별가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 5, 6, 7, 8, 9, 10개, 또는 그 초과의 구별가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 4개 초과의 구별가능한 라벨을 포함하며, 추가 라벨(예를 들어, 4개 초과의 구별가능한 형광단), 추가 바코드 비트(예를 들어, 4개 초과의 고유 바코드 비트) 및 판독 분자의 추가 바코드 하이브리드 영역(예를 들어, 4개 초과의 고유 바코드-혼성화 영역, 여기서 각각의 고유 바코드-혼성화 영역은 4개 초과의 고유 바코드 비트 중 하나와 혼성화됨)을 사용하여 달성될 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 판독 분자는 광학적으로 검출가능한 표지 및 나노입자를 포함한다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 판독 분자는 금속 입자 나노입자를 포함한다. 나노입자(예를 들어, 금속 나노입자)는 거리 의존 방식으로 플라스몬 강화 커플링(Plasmon enhanced coupling)을 통해 검출가능한 라벨의 형광을 증강시킨다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 본 명세서에 기술된 바와 같은 적어도 하나의 판독 분자에 연결된다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)에 연결된 적어도 하나의 판독 분자는 (예를 들어, 나노입자에 대한 연결과 비교하여 판독 분자의 원위 말단에서) 광학적으로 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 본 명세서에 기술된 바와 같은 동일하거나 상이한 판독 분자일 수 있는 적어도 2개의 판독 분자에 연결된다. 비제한적인 예로서, 나노입자(예를 들어, 금속 나노입자)는 본 명세서에 기술된 바와 같이 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 15개, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 60개, 적어도 70개, 적어도 80개, 적어도 90개, 또는 적어도 100개의 판독 분자에 연결된다. 적어도 2개의 판독 분자에 대한 나노입자의 이러한 연결은 신호를 증폭할 수 있다. 따라서, 전체 신호 증폭은 나노입자(예를 들어, 금속 나노입자)에 연결된 복수의 판독 분자 및/또는 (예를 들어, 금속 나노입자와 같은 나노입자와, 형광단과 같은 광학적으로 검출가능한 표지 간의) 형광의 플라스몬 증강으로부터 초래될 수 있다.
임의의 양태의 일부 실시형태에서, 광학적으로 검출가능한 라벨은 형광단(예를 들어, TexasRed, FITC, 또는 본 명세서에 추가로 기재된 바와 같은 다른 형광단)을 포함한다. 임의의 양태의 일부 실시형태에서, 나노입자가, 금속 나노입자를 포함한다. 금속 나노입자의 비제한적인 예는 Au, Ag, Ni, Co, Pt, Pd, Cu, Ti, 및 Al 나노입자 및 이들의 조합을 포함하지만 이에 제한되지 않는다. 임의의 양태의 일부 실시형태에서, 나노입자가, 금 나노입자를 포함한다. 임의의 양태의 일부 실시형태에서, 나노입자가, 금 나노막대를 포함한다.
임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 약 1.2 nm의 직경을 갖는다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 약 3 nm의 직경을 갖는다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 약 5 nm의 직경을 갖는다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 약 10 nm의 직경을 갖는다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 약 30 nm의 직경을 갖는다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 약 50 nm의 직경을 갖는다. 임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)는 적어도 1 nm, 적어도 2 nm, 적어도 3 nm, 적어도 4 nm, 적어도 5 nm, 적어도 10 nm, 적어도 15 nm, 적어도 20 nm, 적어도 25 nm, 적어도 30 nm, 적어도 35 nm, 적어도 40 nm, 적어도 45 nm, 적어도 50 nm, 적어도 55 nm, 적어도 60 nm, 적어도 65 nm, 적어도 70 nm, 적어도 75 nm, 적어도 80 nm, 적어도 85 nm, 적어도 90 nm, 적어도 95 nm, 또는 적어도 100 nm의 직경을 갖는다.
임의의 양태의 일부 실시형태에서, 나노입자가, 판독 분자의 3' 말단에 있다. 임의의 양태의 일부 실시형태에서, 나노입자가, 판독 분자의 5' 말단에 있다. 임의의 양태의 일부 실시형태에서, 나노입자가, 판독 분자의 3' 말단 및 5'에 있다. 임의의 양태의 일부 실시형태에서, 나노입자가, 판독 분자의 3' 말단에 있고 광학적으로 검출가능한 라벨은 판독 분자의 5' 말단에 있다. 임의의 양태의 일부 실시형태에서, 나노입자가, 판독 분자의 5' 말단에 있고, 광학적으로 검출가능한 라벨은 판독 분자의 3' 말단에 있다.
임의의 양태의 일부 실시형태에서, 나노입자가, 검출가능한 표지로부터의 적어도 20개의 뉴클레오티드이다. 임의의 양태의 일부 실시형태에서, 나노입자가, 검출가능한 표지로부터의 적어도 30개의 뉴클레오티드이다. 임의의 양태의 일부 실시형태에서, 나노입자가, 검출가능한 표지로부터의 적어도 5개의 뉴클레오티드, 적어도 10개의 뉴클레오티드, 적어도 15개의 뉴클레오티드, 적어도 20개의 뉴클레오티드, 적어도 25개의 뉴클레오티드, 적어도 30개의 뉴클레오티드, 적어도 35개의 뉴클레오티드, 적어도 40개의 뉴클레오티드, 적어도 45개의 뉴클레오티드, 적어도 50개의 뉴클레오티드, 적어도 55개의 뉴클레오티드, 적어도 60개의 뉴클레오티드, 적어도 65개의 뉴클레오티드, 적어도 70개의 뉴클레오티드, 적어도 75개의 뉴클레오티드, 적어도 80개의 뉴클레오티드, 적어도 85개의 뉴클레오티드, 적어도 90개의 뉴클레오티드, 적어도 95개의 뉴클레오티드, 또는 적어도 100개의 뉴클레오티드이다.
한 양태에서, 판독 분자의 세트가 본 명세서에 기술된다. 임의의 양태의 일부 실시형태에서, 세트가, 본 명세서에 기술된 것과 같이, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개 이상, 또는 적어도 10개의 판독 분자를 포함한다. 임의의 양태의 일부 실시형태에서, 세트가, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 또는 적어도 10개의 별도의 구별가능한 유형의 판독 분자를 포함한다.
한 양태에서, 적어도 2개의 판독 분자의 세트가 본 명세서에 기술되며, 각각의 판독 분자가, (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5'와 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 (d) 광학적으로 검출가능한 라벨을 포함한다.
한 양태에서, 적어도 2개의 판독 분자의 세트가 본 명세서에 기술되며, 각각의 판독 분자가, (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5'와 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및 선택적으로 (d) 광학적으로 검출 가능한 라벨을 포함한다.
한 양태에서, 적어도 2개의 판독 분자의 세트가 본 명세서에 기술되며, 각각의 판독 분자는, (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; 및 (c) 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형을 포함한다.
한 양태에서, 적어도 2개의 판독 분자의 세트가 본 명세서에 기술되며, 각각의 판독 분자는, (a) 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함; (b) 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 이 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; (c) 5'와 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; (d) 광학적으로 검출 가능한 라벨을 포함하며, 여기서 적어도 하나의 판독 분자는 나노입자를 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 제1 바코드 혼성화 영역(예를 들어, 3' 바코드 혼성화 영역)을 포함하는 각각의 세트의 판독 분자는 제1 구별가능한 표지만을 포함한다. 즉, 각 바코드 혼성화 영역은 임의의 다른 바코드-혼성화 영역의 라벨과 구별가능한 라벨에 해당한다. 임의의 양태의 일부 실시형태에서, 임의의 선택된 바코드 혼성화 영역(예를 들어, 3' 바코드 혼성화 영역)을 포함하는 각 세트의 판독 분자는 상응하는 주어진 구별가능한 라벨만을 포함한다.
임의의 양태의 일부 실시형태에서, 제1 구별가능한 라벨은 판독 분자의 제1 바코드 혼성화 영역(예를 들어, 3' 바코드 혼성화 영역)만을 포함한다. 즉, 각 라벨은 다른 바코드-혼성화 영역과 구별가능한 하나의 바코드 혼성화 영역에 해당한다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨의 수와 바코드-혼성화 영역의 유형(즉, 판독 분자의 유형) 사이에 일대일 관계가 존재한다. 비제한적인 예로서, 판독 분자의 세트는 4개의 구별가능한 광학적으로 검출가능한 표지 및 4개의 구별가능한 바코드 혼성화 영역을 포함할 수 있으며, 여기서 판독 분자의 각 유형은 4개의 구별가능한 표지 중 1개를 포함하고 세트 내의 판독 분자의 다른 유형은 해당 라벨을 포함하지 않으며, 여기서 각 유형의 판독 분자는 4개의 바코드-혼성화 영역 중 1개를 포함하고 세트 내 판독 분자의 다른 유형은 해당 바코드-혼성화 영역을 포함하지 않는다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 2개의 구별가능한 표지 및 2개의 구별가능한 바코드 혼성화 영역을 포함하고, 여기서 각각의 라벨은 하나의 바코드 혼성화 영역에 대응하고, 각각의 바코드 혼성화 영역은 하나의 표지에 대응한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 3개의 구별가능한 표지 및 3개의 구별가능한 바코드 혼성화 영역을 포함하고, 여기서 각각의 라벨은 하나의 바코드 혼성화 영역에 대응하고, 각각의 바코드 혼성화 영역은 하나의 표지에 대응한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 4개의 구별가능한 표지 및 4개의 구별가능한 바코드 혼성화 영역을 포함하고, 여기서 각각의 라벨은 하나의 바코드 혼성화 영역에 대응하고, 각각의 바코드 혼성화 영역은 하나의 표지에 대응한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 5개의 구별가능한 표지 및 5개의 구별가능한 바코드 혼성화 영역을 포함하고, 여기서 각각의 라벨은 하나의 바코드 혼성화 영역에 대응하고, 각각의 바코드 혼성화 영역은 하나의 표지에 대응한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 6개의 구별가능한 표지 및 6개의 구별가능한 바코드 혼성화 영역을 포함하고, 여기서 각각의 라벨은 하나의 바코드 혼성화 영역에 대응하고, 각각의 바코드 혼성화 영역은 하나의 표지에 대응한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 7개의 구별가능한 표지 및 7개의 구별가능한 바코드 혼성화 영역을 포함하고, 여기서 각각의 라벨은 하나의 바코드 혼성화 영역에 대응하고, 각각의 바코드 혼성화 영역은 하나의 표지에 대응한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 8개의 구별가능한 표지 및 8개의 구별가능한 바코드 혼성화 영역을 포함하고, 여기서 각각의 라벨은 하나의 바코드 혼성화 영역에 대응하고, 각각의 바코드 혼성화 영역은 하나의 표지에 대응한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 n개의 구별가능한 표지 및 n개의 구별가능한 바코드 혼성화 영역을 포함하고, 여기서 각각의 라벨은 하나의 바코드 혼성화 영역에 대응하고, 각각의 바코드 혼성화 영역은 하나의 표지에 대응한다.
임의의 양태의 일부 실시형태에서, 제1 구별가능한 라벨은 바코드 혼성화 영역(예를 들어, 3' 바코드 혼성화 영역)의 제한된 풀을 포함한다. 즉, 각 라벨은 적어도 하나의 바코드 하이브리드 영역에 대응하며, 각각은 다른 바코드 혼성화 영역과 구별된다. 비제한적인 예로서, 각각의 구별 가능한 라벨은 2, 3, 4, 5, 6, 7, 8, 9, 또는 적어도 10개의 별개의 바코드 혼성화 영역에 해당하고, 다른 구별 가능한 라벨은 이러한 바코드 혼성화 영역에 해당하지 않는다. 일부 실시양태에서, 각각의 구별가능한 라벨은 256개 미만의 별개의 바코드 혼성화 영역, 예를 들어, 200개 미만, 100개 미만, 50개 미만, 25개 미만, 10개 미만, 또는 5개 미만의 별개의 바코드 혼성화 영역에 상응한다. 이러한 제한된 수의 바코드 혼성화 영역(및 따라서 올리고뉴클레오티드 태그의 바코드 영역)은 각 세트에 필요한 판독 분자의 수를 감소시키고 본 명세서에 기술된 검출 방법의 신호 출력을 증가시킨다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트에서 판독 분자의 각 유형은 3' 혼성화 영역의 3' 말단에 별개의 뉴클레오티드 또는 뉴클레오티드 유사체를 포함한다. 비제한적인 예로서, 4가지 유형의 판독 분자의 세트에서; 1 판독 분자는 3' 바코드-혼성화 영역의 첫 번째 뉴클레오티드(nt) 위치(즉, 3'-가장끝(most) 뉴클레오티드)에 아데닌(A)이 있는 3' 바코드-혼성화 영역을 포함하고; 1 판독 분자는 3' 바코드-혼성화 영역의 첫 번째 nt 위치에 티민(T)이 있는 3' 바코드-혼성화 영역을 포함하고; 1 판독 분자는 3' 바코드-혼성화 영역의 첫 번째 nt 위치에 시토신(C)이 있는 3' 바코드-혼성화 영역을 포함하고; 1개의 판독 분자는 3' 바코드-혼성화 영역의 첫 번째 nt 위치에 구아닌(G)이 있는 3' 바코드-혼성화 영역을 포함한다.
임의의 양태의 일부 실시형태에서, 뉴클레오티드 및 뉴클레오티드 유사체를 포함하는 판독 분자의 세트에서, 3' 혼성화 영역의 제1 nt 위치는 A, T, C, G, 우라실(U), 5-메틸시토신(5-me-C), 5-하이드록시메틸 시토신, 크산틴, 하이포잔틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 기타 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조우라실, 시토신 및 티민, 5-우라실(슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-하이드록실 기타 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌, 7-다아자아데닌, 3-데아자구아닌, 3-데아자아데닌, 또는 본 명세서에 기술된 임의의 다른 뉴클레오티드 유사체를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 세트의 적어도 2개의 판독 분자는 DNA 및/또는 RNA이다. 임의의 양태의 일부 실시형태에서, 세트의 적어도 2개의 판독 분자는 DNA 및/또는 RNA를 포함한다. 임의의 양태의 일부 실시형태에서, 세트 분자의 적어도 2개의 판독 분자는 DNA 및/또는 RNA로 구성되거나 본질적으로 구성된다. 임의의 양태의 일부 실시형태에서, 세트의 적어도 2개의 판독 분자는 폴리펩티드를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 서열번호: 6 내지 9 중 적어도 하나를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 서열번호: 6 내지 9 중 적어도 2개를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 서열번호: 6 내지 9 중 3개 이상을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트는 서열번호: 6 내지 9를 포함한다.
한 양태에서, 하기를 위한, 본 명세서에 기술된 바와 같은, 판독 분자 또는 이의 세트의 사용이 기술된다: 적어도 하나의 표적 분자의 검출; 신호 증폭; 분지 반응; 혼성화 연쇄 반응(HCR); 교환 반응에 의한 신호 증폭(SABER); 롤링 서클 증폭(RCA); 인시투 시퀀싱; 매트릭스 부착; 또는 초해상도 현미경. 임의의 양태의 일부 실시형태에서, 판독 분자 또는 이의 세트는 핵 매트릭스, 세포 매트릭스, 또는 하이드로겔을 포함하지만 이에 제한되지 않는 매트릭스에 부착될 수 있다.
한 양태에서 샘플에서 하나 이상의 표적 분자를 검출하는 방법이 본 명세서에 기술된다. 임의의 양태의 일부 실시형태에서, 상기 방법은 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 각각의 올리고뉴클레오티드 태그는 검출될 표적 분자에 특이적으로 결합하는 인식 도메인 및 바코드 영역을 포함하는 스트리트를 포함한다.
본 명세서에 사용된 용어 "올리고뉴클레오티드 태그"는 인식 도메인 및/또는 적어도 하나의 스트리트를 포함하는 올리고뉴클레오티드이다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그는 올리고페인트, 다중화 오류-강건 형광 인시튜 혼성화(MERFISH; multiplexed error-robust fluorescence in situ hybridization) 올리고, seqFISH 올리고, 표적의 RNA 순차 프로빙(SPOT) 올리고, 고범위 현미경-기반 기술(Hi-M) 올리고, 또는 염색질 구조의 광학적 재구성(ORCA) 올리고 또는 FISH 방법에 사용되는 임의의 올리고뉴클레오티드 및/또는 표적 분자, 예를 들어, 올리고뉴클레오티드 서열, DNA 서열의 일부, 또는 특정 염색체 또는 특정 염색체의 하위 염색체 영역에 상보적인 서열(예를 들어, 인식 도메인)을 갖는 임의의 올리고뉴클레오티드를 포함하나 이에 제한되지 않는 올리고뉴클레오티드를 포함하거나 이로 구성된다. 더 자세한 내용은, 예를 들어, 각각의 내용이 그 전문으로 본 명세서에 참조로 통합되는, 다음 문헌 참조: Cardozo et al., Mol Cell. 2019 Apr 4;74(1):212-222; Mateo et al., Nature. 2019 Apr;568(7750):49-54; Wang et al., Scientific Reports vol㎛e 8, Article n㎛ber: 4847 (2018); Shah et al., Neuron, Vol㎛e 92, Issue 2, 19 October 2016, Pages 342-357; Eng et al., Nat Methods. 2017 Dec;14(12):1153-1155.
본 명세서에 사용된 용어 "스트리트(street)"는 표적 서열과 동일성(identity)을 갖지 않거나 표적 서열에 혼성화하지 않는 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 일부를 지칭한다. 임의의 양태의 일부 실시형태에서, 스트리트는 바코드 영역을 포함한다. 본 명세서에 사용된 바와 같이, "바코드 영역"은 적어도 1개의 뉴클레오티드를 포함하는 카세트의 영역을 지칭한다. 비제한적인 예로서, 바코드 영역은 1개의 뉴클레오티드, 2개의 뉴클레오티드, 3개의 뉴클레오티드, 4개의 뉴클레오티드, 5개의 뉴클레오티드, 6개의 뉴클레오티드, 7개의 뉴클레오티드, 8개의 뉴클레오티드, 9개의 뉴클레오티드, 또는 10개의 뉴클레오티드를 포함한다. 임의의 양태의 일부 실시형태에서, 바코드 영역의 적어도 하나의 뉴클레오티드는 본 명세서에 추가로 기술된 바와 같이 변형된 핵염기 염기를 포함한다.
임의의 양태의 일부 실시형태에서, 바코드 영역은 각각의 올리고뉴클레오티드 태그에 고유하다. 본 명세서에 기술된 바와 같이, 올리고뉴클레오티드 태그의 각각의 바코드 영역은 적어도 하나의 비트 또는 유닛을 포함하고, 각각의 비트는 비트의 적어도 일부에 상보적인 적어도 하나의 바코드-혼성화 영역에 상응한다. 비제한적인 예로서, 올리고뉴클레오티드 태그 바코드 영역의 각 비트는 판독 분자의 1개의 바코드-혼성화 영역, 2개의 판독 분자의 2개의 바코드-혼성화 영역, 3개의 판독 분자의 3개의 바코드-혼성화 영역, 4개의 판독 분자의 4개의 바코드-혼성화 영역, 또는 적어도 5개의 판독 분자의 적어도 5개의 바코드-혼성화 영역에 상응하며, 여기서 각각의 바코드-혼성화 영역은 올리고뉴클레오티드 태그의 바코드 영역 비트의 적어도 일부에 상보적이고 혼성화하는 고유 서열을 포함한다.
임의의 양태의 일부 실시형태에서, 비트는 길이가 1개 뉴클레오티드, 2개 뉴클레오티드, 3개 뉴클레오티드, 4개 뉴클레오티드, 5개 뉴클레오티드, 6개 뉴클레오티드, 7개 뉴클레오티드, 8개 뉴클레오티드, 9개 뉴클레오티드, 또는 적어도 10개 뉴클레오티드이다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그의 바코드 영역은 적어도 1 비트를 포함한다. 비제한적인 예로서, 올리고뉴클레오티드 태그의 바코드 영역은 1 비트, 2 비트, 3 비트, 4 비트, 5 비트, 6 비트, 7 비트, 8 비트, 9 비트 또는 적어도 10 비트를 포함한다.
임의의 양태의 일부 실시형태에서, 바코드 영역의 서열은 바코드 비트의 선택 및/또는 순서가 각각의 올리고뉴클레오티드 태그에 고유하다는 점에서 다른 올리고뉴클레오티드 태그의 바코드 영역과 상이하다. 임의의 양태의 일부 실시형태에서, 각각의 모든 올리고뉴클레오티드 태그는 상이한 바코드 영역, 예를 들어, 바코드 비트 및/또는 뉴클레오티드의 상이한 서열을 갖는 바코드 영역을 갖는다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그의 스트리트는 적어도 2개의 바코드 영역을 포함하고, 스트리트 내의 각각의 그리고 모든 바코드 영역은 스트리트 내의 다른 바코드 영역, 예를 들어, 상이한 서열의 바코드 비트 및/또는 뉴클레오티드를 지니는 바코드 영역과 상이하다. 임의의 양태의 일부 실시형태에서, 바코드 영역의 서열은 동일하고 다른 올리고뉴클레오티드 태그의 적어도 하나의 바코드 영역과 공유된다.
임의의 양태의 일부 실시형태에서, 각각의 올리고뉴클레오티드 태그의 스트리트는 바코드 영역 또는 바코드 비트의 정렬된 세트로 인해 다른 올리고뉴클레오티드 태그의 스트리트에 비해 고유하다. 임의의 양태의 일부 실시형태에서, 각각의 올리고뉴클레오티드 태그의 스트리트는 적어도 스트리트 내의 바코드 비트의 공간적 순서가 다르다는 점에서 다른 올리고뉴클레오티드 태그의 스트리트에 비해 고유하다. 비제한적인 예로서, 공간 순서 5'-A-B-C-3'로 3개의 바코드 비트(예를 들어, 바코드 비트 "A", "B" 및 "C")를 포함하는 바코드는, 5'-A-C-B-3', 5'-B-A-C 3', 5'-B-C-A 3', 5'-C-A-B 3' 또는 5'-C-B-A 3'에서 선택된 바코드 비트의 공간적 순서를 포함하는 임의의 다른 스트리트와 비교하여 상이한 바코드 비트의 고유의 공간적 순서를 가지며, 앞서 언급한 스트리트 각각은 고유하고 이들의 바코드 비트의 공간적 순서에 있어 서로 상이하다.
임의의 양태의 일부 실시형태에서, 각각의 올리고뉴클레오티드 태그(예를 들어, 올리고페인트) 스트리트는 적어도 스트리트 내의 바코드 비트의 공간적 순서가 다르다는 점에서 다른 올리고뉴클레오티드 태그의 스트리트에 비해 고유하고, 각각의 올리고뉴클레오티드 태그의 스트리트는 적어도 스트리트 내의 바코드 영역 또는 바코드 영역들이 다르다는 점에서 다른 올리고뉴클레오티드 태그의 스트리트에 비해 고유하다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그의 스트리트는 시퀀싱 프라이머를 어닐링하기 위한 프라이머 결합 영역을 추가로 포함한다. 임의의 양태의 일부 실시형태에서, 시퀀싱 프라이머는 DNA 또는 RNA이고, 뉴클레오티드 및/또는 뉴클레오티드 유사체를 포함한다. 임의의 양태의 일부 실시형태에서, 시퀀싱 프라이머는 적어도 5개의 뉴클레오티드, 적어도 10개의 뉴클레오티드, 적어도 15개의 뉴클레오티드, 16개의 뉴클레오티드, 17개의 뉴클레오티드, 18개의 뉴클레오티드, 19개의 뉴클레오티드, 20개의 뉴클레오티드, 21개의 뉴클레오티드, 22개의 뉴클레오티드, 23개의 뉴클레오티드, 24개 뉴클레오티드, 또는 적어도 25개의 뉴클레오티드 길이이다. 임의의 양태의 일부 실시형태에서, 시퀀싱 프라이머는 5' 포스페이트를 포함한다. 임의의 양태의 일부 실시형태에서, 프라이머 결합 영역은 적어도 5개의 뉴클레오티드, 적어도 10개의 뉴클레오티드, 적어도 15개의 뉴클레오티드, 16개의 뉴클레오티드, 17개의 뉴클레오티드, 18개의 뉴클레오티드, 19개의 뉴클레오티드, 20개의 뉴클레오티드, 21개의 뉴클레오티드, 22개의 뉴클레오티드, 23개 뉴클레오티드, 24개 뉴클레오티드, 또는 적어도 25개의 뉴클레오티드 길이이다.
임의의 양태의 일부 실시형태에서, 프라이머 결합 영역은 올리고뉴클레오티드 태그의 바코드 영역에 대해 5'에 위치한다. 임의의 양태의 일부 실시형태에서, 프라이머 결합 영역은 올리고뉴클레오티드 태그의 바코드 영역에 대해 바로 5'에 위치한다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)는 인식 도메인을 포함한다. 본 명세서에 사용된 "인식 도메인(recognition domain)"은 분석할 표적 분자 및/또는 서열에 특이적으로 결합하는 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 도메인이다. 비제한적인 예로서, 인식 도메인은 표적 분자 및/또는 서열, 예를 들어, 염색체의 영역에 상보적인 핵산 서열일 수 있다. 따라서, 인식 도메인의 서열은 원하는 표적의 아이덴티티에 따라 달라질 것이다. 예를 들어, 이 목적을 위해 광범위하고 자유롭게 사용할 수 있는 소프트웨어(예를 들어, Primer3 또는 PrimerBank, 둘 다 월드 와이드 웹 상에서 입수가능함)를 사용하여, 특정 조건 하에서 임의의 주어진 표적에 특이적으로 혼성화할 인식 도메인을 설계하는 것은 당해 기술 분야의 기술 범위 내에 있다. 임의의 양태의 일부 실시형태에서, 인식 도메인은 표적 분자 및/또는 표적 서열의 일부와 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일성(identity)을 가질 수 있다. 임의의 양태의 일부 실시형태에서, 인식 도메인은 "게놈 상동성(genomic homology)"의 도메인 또는 게놈의 특정 영역에 특이적으로 결합하는 도메인을 포함한다. 임의의 양태의 일부 실시형태에서, 동일하거나 상이한 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)에서 발견되는 다중 인식 도메인은 단일 표적 분자 및/또는 표적 서열에 특이적으로 결합할 수 있다. 비제한적 예로서, 적어도 2개의 인식 도메인, 적어도 3개의 인식 도메인, 적어도 4개의 인식 도메인, 적어도 5개의 인식 도메인, 적어도 10개의 인식 도메인, 적어도 20개의 인식 도메인, 적어도 30개의 인식 도메인, 적어도 40개의 인식 도메인, 또는 적어도 50개의 인식 도메인은 표적 분자 및/또는 표적 서열에 특이적으로 결합할 수 있다.
임의의 양태의 일부 실시형태에서, 복수의 올리고뉴클레오티드 태그가 존재할 때, 복수의 인식 도메인 서열은 각각 존재하는 다른 인식 도메인에 비해 고유할 수 있다. 임의의 양태의 일부 실시형태에서, 복수의 올리고뉴클레오티드 태그가 존재할 때, 복수의 인식 도메인 서열은 중첩되지 않는다.
임의의 양태의 일부 실시형태에서, 인식 도메인은 올리고페인트, 다중화 오류-강건 형광 제자리 혼성화(MERFISH) 올리고, seqFISH 올리고, 표적의 RNA 순차 프로빙(SPOT) 올리고, 고범위 현미경-기반 기술(Hi-M) 올리고, 또는 염색질 구조의 광학적 재구성(ORCA) 올리고 또는 또는 FISH 방법에 사용되는 임의의 올리고뉴클레오티드 및/또는 표적 분자, 예를 들어, 올리고뉴클레오티드 서열, DNA 서열의 일부, 또는 특정 염색체 또는 특정 염색체의 하위-염색체 영역에 상보적인 서열(예를 들어, 인식 도메인)을 갖는 임의의 올리고뉴클레오티드를 포함하나 이에 제한되지 않는 올리고뉴클레오티드를 포함하거나 이로 구성된다. 더 자세한 내용은, 각각이 그 전문으로 본 명세서에 참조로 통합되는, 다음 문헌 참조: Cardozo et al., Mol Cell. 2019 Apr 4;74(1):212-222; Mateo et al., Nature. 2019 Apr;568(7750):49-54; Wang et al., Scientific Reports vol㎛e 8, Article n㎛ber: 4847 (2018); Shah et al., Neuron, Vol㎛e 92, Issue 2, 19 October 2016, Pages 342-357; Eng et al., Nat Methods. 2017 Dec;14(12):1153-1155.
임의의 양태의 일부 실시형태에서, 인식 도메인은 비핵산, 예를 들어, DNA-결합 폴리펩티드와 같은 임의의 핵산 결합 조성물을 포함한다. 비제한적인 예로서, 인식 도메인은 서열-특이적 단일-가닥 DNA 결합 단백질 또는 인자, 서열-특이적 이중-가닥 DNA 결합 단백질 또는 인자, DNA-RNA 결합 단백질 또는 인자, 또는 RNA 결합 단백질 또는 인자를 포함한다. 이러한 핵산-결합 조성물의 비제한적 예는 전사 인자, 제한 효소, 전사 활성화인자-유사 효과기 뉴클레이즈(TALEN), CRISPR-Cas-유형 인자 등을 포함하지만 이에 제한되지 않는다. 임의의 양태의 일부 실시형태에서, 핵산-결합 조성물은 뉴클레이즈 활성이 결여되어 있다.
임의의 양태의 일부 실시형태에서, 표적 분자는 비핵산, 예를 들어, 폴리펩티드를 포함한다. 따라서, 인식 도메인은 표적 폴리펩티드에 특이적으로 결합하는 임의의 조성물을 포함한다. 이러한 폴리펩티드-결합 인식 도메인의 비제한적인 예는 항체(예를 들어, 나노바디), 앱타머, 소분자, 리간드, 특정 폴리펩티드의 공지된 결합 파트너 등을 포함하지만 이에 제한되지 않는다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그가 인식 도메인에 연결되지 않지만 관심 대상의 올리고뉴클레오티드-태깅된 개체를 검출하기 위한 개체에 연결된다는 점에서, 올리고뉴클레오티드 태그는 표적 분자를 특이적으로 인식하지 아니한다. 올리고뉴클레오티드 태그는 적어도 하나의 앵커 영역 및 적어도 바코드 영역을 포함하지만, 예를 들어, 인식 도메인이 결여된 핵산일 수 있다. 비제한적인 예로서, 이러한 올리고뉴클레오티드-태그된 엔티티는 소분자(예를 들어, 약물 스크리닝의 목적을 위한 것), 폴리펩티드, 세포, 또는 비생물학적 물질(예를 들어, 금속, 화학물질 등)을 포함할 수 있다. 이러한 올리고뉴클레오티드-태깅된 엔티티를 검출하는 방법은 본 명세서에 기술된 바와 같은 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)를 검출하기 위해 사용되는 것(예를 들어, 올리고뉴클레오티드 태그 내의 특정 카세트 유형에 혼성화하는 판독 분자의 풀과 접촉시키는 것)과 동일할 수 있다. 임의의 양태의 일부 실시형태에서, 복수 유형의 표적 분자 및/또는 태깅된 엔티티 유형은, 예를 들어, DNA를 인식하는 적어도 하나의 올리고뉴클레오티드 태그(예를 들어, 올리고페인트), 폴리펩티드를 인식하는 적어도 하나의 올리고뉴클레오티드 태그, 및/또는 적어도 하나의 올리고뉴클레오티드-태깅된 엔티티를 인식한다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)는 적어도 하나의 스트리트를 포함한다. 본 명세서에 사용된 바와 같이, 용어 "스트리트"는 표적 서열과 동일성(identity)을 갖지 않거나 또는 표적 서열에 혼성화하지 않는 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 일부를 지칭한다. 스트리트는 검출 영역 및/또는 증폭 영역을 포함한다. 비제한적 예로서, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)는 2개의 스트리트를 포함한다. 임의의 양태의 일부 실시형태에서, 스트리트는 "메인스트리트" 및/또는 "백스트리트" 중 하나 이상일 수 있다. 비제한적인 예로서, 메인스트리트는 인식 도메인에 대해 5', 메인스트리트는 백스트리트에 대해 5', 및/또는 메인스트리트는 인식 도메인 및 백스트리트에 대해 5'이다. 비제한적인 예로서, 백스트리트는 인식 도메인에 대해 3', 백스트리트는 메인스트리트에 대해 3', 및/또는 백스트리트는 인식 도메인 및 메인스트리트에 대해 3'이다. 비제한적인 예로서, 메인스트리트는 인식 도메인에 대해 3', 메인스트리트는 백스트리트에 대해 3', 및/또는 메인스트리트는 인식 도메인 및 백스트리트에 대해 3'이다. 비제한적인 예로서, 백스트리트는 인식 도메인에 대해 5', 백스트리트는 메인스트리트에 대해 5', 및/또는 백스트리트는 인식 도메인 및 메인스트리트에 대해 5'이다.
임의의 양태의 일부 실시형태에서, 스트리트(예를 들어, 메인스트리트 및/또는 백스트리트)는 하나 이상의 바코드 영역 및/또는 하나 이상의 범용 프라이머 결합 영역을 포함한다. 본 명세서에 사용된, "범용 프라이머 결합 영역"은 범용 프라이머(예를 들어, 범용 정방향 프라이머, 범용 역방향 프라이머)에 결합하는 영역을 의미한다. 본 명세서에 사용된, "범용 프라이머"는 복수의 개별 올리고뉴클레오티드 태그(예를 들어, 올리고페인트) 또는 올리고뉴클레오티드 태그 세트에 사용되는 프라이머를 의미한다. 범용 프라이머는, 예를 들어, 올리고뉴클레오티드 태그 또는 올리고뉴클레오티드 태그 세트의 생성을 위해, 예를 들어, PCR로 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)를 증폭할 목적으로 사용할 수 있다. 임의의 양태의 일부 실시형태에서, 각각의 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 범용 프라이머 결합 영역은 나머지 올리고뉴클레오티드 태그, 예를 들어, 샘플이 접촉되는 임의의 다른 올리고뉴클레오티드 태그의 범용 프라이머 결합 영역과 동일하다.
임의의 양태의 일부 실시형태에서, 스트리트는 하나 이상의 범용 프라이머 결합 영역 및/또는 하나 이상의 바코드 영역을 포함한다. 비제한적인 예로서, 범용 프라이머 결합 영역은 적어도 바코드 영역의 5'이다. 비제한적인 예로서, 범용 정방향 프라이머에 특이적으로 결합하는 범용 정방향 프라이머 결합 영역은 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 5' 말단에 있다. 비제한적 예로서, 범용 프라이머 결합 영역은 적어도 하나의 바코드 영역의 3'이다. 비제한적인 예로서, 범용 역방향 프라이머에 특이적으로 결합하는 범용 역방향 프라이머 결합 영역은 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 3' 말단에 있다. 임의의 양태의 일부 실시형태에서, 범용 프라이머 결합 영역은 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)에 존재하는 임의의 바코드 영역(5' 및 3' 둘 다)에 측접한다. 임의의 양태의 일부 실시형태에서, 범용 역방향 프라이머 결합 영역은 예를 들어, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)가 NE에 노출될 때 단일 가닥이 되도록 하기 위해 닉킹 엔도뉴클레이즈(NE)에 대한 인식 부위를 포함한다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)는 (예를 들어, PCR 및/또는 범용 프라이밍 영역을 통해) 반드시 증폭되지는 않는다. 임의의 양태의 일부 실시형태에서, 기재된 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)는 새로(de novo) 합성될 수 있고 "튜브로부터 바로(straight from the tube)" 사용할 수 있다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그는 라이게이션-기반 표적 식별(LIT) 프라이머 결합 부위 및 LIT 바코드 영역을 포함하고; 다시 말해서, 올리고뉴클레오티드 태그는 본 명세서에 기술된 바와 같은 라이게이션에 의한 시퀀싱(SBL) 방법을 사용하여 검출되는 프라이머 결합 부위 및 바코드 영역을 포함한다(예를 들어, 도 1a, 도 1c, 도 4a, 도 10d 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 메인스트리트는 LIT 프라이머 결합 부위 및 LIT 바코드를 포함한다(예를 들어, 도 1a, 도 4a, 도 10d 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 백스트리트는 LIT 프라이머 결합 부위 및 LIT 바코드 영역을 포함한다(예를 들어, 도 1a, 도 4a, 도 10d 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 메인스트리트 및 백스트리트 각각은 LIT 프라이머 결합 부위 및 LIT 바코드 영역을 포함한다(예를 들어, 도 1a, 도 4a, 도 10d 참조).
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그는 정확한 라이게이션 기반 표적 식별(eLIT) 프라이머 결합 부위 및 eLIT 바코드 영역을 포함하고; 다시 말해서, 올리고뉴클레오티드 태그는 본 명세서에 기술된 바와 같은 판독 분자의 세트를 포함하는 라이게이션에 의한 시퀀싱(SBL) 방법을 사용하여 검출되는 프라이머 결합 부위 및 바코드 영역을 포함한다(예를 들어, 도 1a, 도 1c, 도 4a, 도 10d 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 메인스트리트는 LIT 프라이머 결합 부위 및 eLIT 바코드 영역을 포함한다(예를 들어, 도 1a, 도 4a, 도 10d 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 백스트리트는 eLIT 프라이머 결합 부위 및 eLIT 바코드 영역을 포함한다(예를 들어, 도 1a, 도 4a, 도 10d 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 메인스트리트 및 백스트리트 각각은 eLIT 프라이머 결합 부위 및 eLIT 바코드 영역을 포함한다(예를 들어, 도 1a, 도 4a, 도 10d 참조).
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그는 합성 기반 표적 식별(SIT) 프라이머 결합 부위 및 SIT 바코드 영역을 추가로 포함하고; 다시 말해서, 올리고뉴클레오티드 태그는 본 명세서에 기술된 바와 같은 합성에 의한 시퀀싱(SBS) 방법을 사용하여 검출되는 프라이머 결합 부위 및 바코드 영역을 추가로 포함한다(예를 들어, 도 1a, 도 1d 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 메인스트리트는 eLIT 프라이머 결합 부위 및 eLIT 바코드 영역을 포함하고, 올리고뉴클레오티드 태그 백스트리트는 SIT 프라이머 결합 부위 및 SIT 바코드 영역을 포함한다(예를 들어, 도 1a 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 백스트리트는 eLIT 프라이머 결합 부위 및 eLIT 바코드 영역을 포함하고, 올리고뉴클레오티드 태그 메인스트리트는 SIT 프라이머 결합 부위 및 SIT 바코드 영역을 포함한다(예를 들어, 도 1a 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 메인스트리트는 eLIT 프라이머 부위, eLIT 바코드 영역, SIT 프라이머 결합 부위 및 SIT 바코드 영역을 포함한다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 백스트리트는 eLIT 프라이머 부위, eLIT 바코드 영역, SIT 프라이머 결합 부위 및 SIT 바코드 영역을 포함한다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그는 HIT(혼성화-기반 표적 식별) 올리고뉴클레오티드 결합 부위 및 HIT 바코드 영역을 추가로 포함하고; 다시 말해서, 올리고뉴클레오티드 태그는 본 명세서에 기술된 바와 같은 혼성화에 의한 시퀀싱(SBH) 방법을 사용하여 검출되는 올리고뉴클레오티드 결합 부위 및 바코드 영역을 추가로 포함한다(예를 들어, 도 1a, 도 1e 참조). 임의의 양태의 일부 실시형태에서, HIT 올리고뉴클레오티드 결합 부위 및 HIT 바코드를 포함하는 올리고뉴클레오티드 태그를 검출하는 방법이 2019년 7월 30일에 출원된 미국 가출원 제62/880,216호에 추가로 기재되어 있으며, 상기 가출원의 내용은 그 전문이 본 명세서에 참조로 통합된다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그는 HIT 올리고뉴클레오티드 결합 부위를 추가로 포함하고, 2차 올리고뉴클레오티드는 HIT 바코드 영역을 포함한다(예를 들어, 도 1a, 도 1e 참조). 임의의 양태의 일부 실시형태에서, HIT 올리고뉴클레오티드 결합 부위를 포함하는 올리고뉴클레오티드 태그를 검출하는 방법은 올리고뉴클레오티드 태그를 2차 올리고뉴클레오티드(본 명세서에서 브릿지 올리고뉴클레오티드 또는 "브릿지"로도 지칭됨)와 접촉시키는 단계를 포함하고, 여기서 2차 올리고뉴클레오티드는 적어도 하나의 바코드 영역 및 올리고뉴클레오티드 태그의 올리고뉴클레오티드 결합 부위에 상보적이고 혼성화하는 적어도 하나의 영역을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법은 2차 올리고뉴클레오티드를 적어도 2개의 판독 분자와 접촉시키는 단계를 추가로 포함하고, 여기서 각각의 판독 분자는 2차 올리고뉴클레오티드 및 검출가능한 라벨과 특이적으로 혼성화하는 올리고뉴클레오티드를 포함한다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 메인스트리트는 eLIT 프라이머 결합 부위 및 eLIT 바코드 영역을 포함하고, 올리고뉴클레오티드 태그 백스트리트는 HIT 올리고뉴클레오티드 결합 부위 및 HIT 바코드 영역을 포함한다(예를 들어, 도 1a 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 백스트리트는 eLIT 프라이머 결합 부위 및 eLIT 바코드 영역을 포함하고, 올리고뉴클레오티드 태그 메인스트리트는 HIT 올리고뉴클레오티드 결합 부위 및 HIT 바코드 영역을 포함한다(예를 들어, 도 1a 참조). 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 메인스트리트는 eLIT 프라이머 결합 부위, eLIT 바코드 영역, HIT 올리고뉴클레오티드 결합 부위 및 HIT 바코드 영역을 포함한다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그 백스트리트는 eLIT 프라이머 결합 부위, eLIT 바코드 영역, HIT 올리고뉴클레오티드 결합 부위 및 HIT 바코드 영역을 포함한다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그(예를 들어, 메인스트리트 및/또는 백스트리트)는, 아래 표 1에 나타낸 바와 같은, eLIT(또는 LIT) 프라이머 결합 부위, eLIT(또는 LIT) 바코드 영역, SIT 프라이머 결합 부위, SIT 바코드 영역, HIT 올리고뉴클레오티드 결합 부위, 및 HIT 바코드 영역을 포함하며, 여기서 "X"는 올리고뉴클레오티드 태그가 부위 또는 영역을 포함함을 나타낸다.
프라이머 결합 부위(들) 및 바코드 영역(들)의 예시적인 조합
eLIT (또는 LIT) 프라이머 결합 부위 eLIT (또는 LIT) 바코드 영역 SIT 프라이머 결합 부위 SIT 바코드 영역 HIT 올리고뉴클레오티드 결합 부위 HIT 바코드 영역
X
X
X X
X
X X
X X
X X X
X
X X
X X
X X X
X X
X X X
X X X
X X X X
X
X X
X X
X X X
X X
X X X
X X X
X X X X
X X
X X X
X X X
X X X X
X X X
X X X X
X X X X
X X X X X
X
X X
X X
X X X
X X
X X X
X X X
X X X X
X X
X X X
X X X
X X X X
X X X
X X X X
X X X X
X X X X X
X X
X X X
X X X
X X X X
X X X
X X X X
X X X X
X X X X X
X X X
X X X X
X X X X
X X X X X
X X X X
X X X X X
X X X X X
X X X X X X
본 명세서에는 샘플에서 표적 분자를 검출하는 방법이 기술된다. 따라서, 한 양태에서, 본 명세서에는 샘플에서 적어도 하나의 표적 분자를 검출하는 방법이 기술되며, 상기 방법은 (a) 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는, (i) 검출될 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (ii) 바코드 영역을 포함하는 스트리트를 포함하는 것인, 단계; (b) 샘플을 본 명세서에 기술된 판독 분자의 세트와 접촉시키는 단계; 및 (c) 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출 가능한 라벨의 상대적 순서를 검출하는 단계를 포함하고, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 하나 이상의 유형의 올리고뉴클레오티드 태그(즉, 동일한 인식 도메인을 포함함)와 접촉된다. 비제한적 예로서, 샘플은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 또는 적어도 5개 유형의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 샘플은, 염색체를 "페인트(paint)"하기 위해, 여러 세트의 올리고뉴클레오티드 태그 세트와 접촉된다. 따라서, 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 500개, 적어도 750개, 적어도 1,000개, 적어도 2,000개, 적어도 3,000개, 적어도 4,000개, 적어도 5,000개, 적어도 6,000개, 적어도 7,000개, 적어도 8,000개, 적어도 9,000개, 적어도 10,000개, 적어도 20,000개, 적어도 30,000개, 적어도 40,000개, 적어도 50,000개, 적어도 60,000개, 적어도 70,000개, 적어도 80,000개, 적어도 90,000개, 적어도 100,000개 유형의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그를 사용하여 다중화된 방식으로 적어도 하나의 표적 분자, 즉 동일한 샘플에서 동시에 사용되는 적어도 2개의 상이한 올리고뉴클레오티드 태그를 검출하는 데 사용될 수 있다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 판독 분자의 적어도 하나의 세트와 접촉된다. 비제한적인 예로서, 샘플은 1개의 판독 분자의 세트, 2개의 판독 분자의 세트, 3개의 판독 분자의 세트, 4개의 판독 분자의 세트, 또는 적어도 5개의 판독 분자의 세트와 접촉된다.
임의의 양태의 일부 실시형태에서, 검출 단계는 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 판독 분자의 상대적 공간 순서를 검출하는 단계를 포함한다. 판독 분자의 다른 라벨(예를 들어, 색상)은 하나 이상의 바코드 영역과 상관관계가 있으며, 상이한 판독 분자의 공간적 순서는 단일 올리고뉴클레오티드 태그에서 바코드 영역의 순서에 대한 정보를 제공하여, 다수의 상이한 올리고뉴클레오티드 태그가 판독 분자 그룹에 의해 제공되는 바코드 신호에 의해 구별되도록 허용한다. 따라서, 임의의 양태의 일부 실시형태에서, 검출가능한 라벨의 상대적인 공간적 순서는 어느 올리고뉴클레오티드 태그가 해당 위치에서 표적 분자에 혼성화되는지에 대한 식별이 가능하게 된다.
임의의 양태의 일부 실시형태에서, 바코드 영역은 각각의 올리고뉴클레오티드 태그에 고유하고, 각각의 바코드 영역은 본 명세서에 추가로 기재된 바와 같이 적어도 1개의 바코드 비트를 포함한다. 임의의 양상의 일부 실시예에서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수보다 적다. 본 명세서에 사용된 바와 같이, "가능한 고유 바코드 비트의 총 수(total n㎛ber of unique barcode bits possible)"라는 문구는 비트에서 뉴클레오티드 및/또는 뉴클레오티드 유사체 위치의 수(즉, 바코드 비트의 길이)의 거듭제곱으로 사용할 수 있는 잠재적인 뉴클레오티드 및/또는 뉴클레오티드 유사체의 수를 나타낸다. 비제한적인 예로서, 4개의 상이한 뉴클레오티드로 구성되고 5개의 뉴클레오티드 길이인 바코드 비트에서, 가능한 고유 바코드 비트의 총 수가, 4^5 또는 4*4*4*4*4 또는 1024이다.
임의의 양태의 일부 실시형태에서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트 비트의 총 수의 10% 미만이다. 비제한적인 예로서, 4개의 상이한 뉴클레오티드로 구성되고 5개의 뉴클레오티드 길이인 바코드 비트에서, 고유 바코드 비트의 총 수가, 100(∼1024*0.1) 미만이다. 임의의 양상의 일부 실시예에서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트 비트의 총 수의 1% 미만이다. 비제한적인 예로서, 4개의 상이한 뉴클레오티드로 구성되고 5개의 뉴클레오티드 길이인 바코드 비트에서, 고유 바코드 비트의 총 수가, 10(1024*0.01) 미만이다.
임의의 양상의 일부 실시예에서, 고유 바코드 비트의 총 수가, 적어도 2개의 고유 바코드 비트이다. 비제한적인 예로서, 고유 바코드 비트의 총 수가, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10의 고유 바코드 비트이다. 임의의 양상의 일부 실시예에서, 고유 바코드 비트의 총 수가, 10 이하의 고유 바코드 비트이다. 비제한적인 예로서, 고유 바코드 비트의 총 수가, 최대 2, 최대 3, 최대 4, 최대 5, 최대 6, 최대 7, 최대 8, 최대 9 또는 최대 10의 고유 바코드 비트이다. 임의의 양태의 일부 실시형태에서, 고유 바코드 비트의 총 수가, 10 이하의 고유 바코드 비트이다.
임의의 양태의 일부 실시형태에서, 바코드-혼성화 영역은 각각의 판독 분자에 고유하다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트에 사용된 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수보다 적다. 본 명세서에 사용된 바와 같이, "가능한 고유 바코드-혼성화 영역의 총 수"라는 문구는 바코드-혼성화 영역에서 사용할 수 있는 뉴클레오티드 및/또는 뉴클레오티드 유사체의 수를 비트 내의 뉴클레오티드 및/또는 뉴클레오티드 유사체 위치의 수(즉, 영역의 길이)의 거듭제곱으로 나타낸 것이다. 비제한적인 예로서, 4개의 다른 뉴클레오티드로 구성되고 5개의 뉴클레오티드 길이인 바코드-혼성화 영역에서, 가능한 고유 바코드-혼성화 영역의 총 수는 4^5 또는 4*4*4*4*4 또는 1024이다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 10% 미만이다. 비제한적인 예로서, 4개의 상이한 뉴클레오티드로 구성되고 5개의 뉴클레오티드 길이인 바코드-혼성화 영역에서, 고유 바코드-혼성화 영역의 총 수는 100 미만이다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트 내의 고유한 바코드 혼성화 영역의 총 수가, 가능한 고유 바코드 혼성화 영역의 총 수의 1% 미만이다. 비제한적인 예로서, 4개의 상이한 뉴클레오티드로 구성되고 5개의 뉴클레오티드 길이인 바코드-혼성화 영역에서, 고유 바코드-혼성화 영역의 총 수는 10 미만이다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수는 적어도 2의 고유 바코드-혼성화 영역이다. 비제한적인 예로서, 고유 바코드-혼성화 영역의 총 수는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 고유 바코드-혼성화 영역이다. 임의의 양태의 일부 실시형태에서, 고유 바코드-혼성화 영역의 총 수는 10 이하의 고유 바코드-혼성화 영역이다. 비제한적인 예로서, 고유 바코드-혼성화 영역의 총 수는 최대 2, 최대 3, 최대 4, 최대 5, 최대 6, 최대 7, 최대 8, 최대 9, 또는 최대 10의 고유 바코드-혼성화 영역이다. 임의의 양태의 일부 실시형태에서, 고유 바코드-혼성화 영역의 총 수는 10 이하의 고유 바코드-혼성화 영역이다.
임의의 양태의 일부 실시형태에서, 검출 단계는 시퀀싱법으로 수행된다. 임의의 양태의 일부 실시형태에서, 시퀀싱법은 라이게이션에 의한 시퀀싱(SBL), 합성에 의한 시퀀싱(SBS), 혼성화에 의한 시퀀싱(SBH), 및/또는 순환 가역적 중합 혼성화 연쇄 반응에 의한 시퀀싱을 포함한다. 임의의 양태의 일부 실시형태에서, 라이게이션에 의한 시퀀싱은 효소 기반 라이게이션을 포함한다. 임의의 양태의 일부 실시형태에서, 라이게이션에 의한 시퀀싱은 화학적 라이게이션, 구리 보조 라이게이션, 무 구리 클릭 반응, 아민-EDC 기반 커플링, 또는 티올-말레이미드 마이클 부가를 포함한다. 예를 들어, 각각의 각각의 내용이 본 명세서에 참조로 통합되는, 다음 문헌 참조: Shendure et al., Science 309 (5741): 1728-32; 2005; Guo et al., 2008, Proc Natl Acad Sci U S A. 2008 Jul 8, 105(27):9145-50; Lee et al. 2014, Science 343 (6177): 1360-1363; Chen et al. 2018, Nucleic Acids Research 46 (4): e22-e22; Wang et al. 2018, Science 361 (6400): eaat5691; 특허 공개공보 WO 2013/055995, US 2014/0349294, WO 2008/151127; 미국 특허 US 제8,481,258호.
임의의 양태의 일부 실시형태에서, 검출 방법은 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시킨 후 샘플을 적어도 하나의 시퀀싱 프라이머와 접촉시키는 단계를 추가로 포함한다. 임의의 양태의 일부 실시형태에서, 검출 방법은 샘플을 판독 분자의 세트와 접촉시키기 전에 샘플을 적어도 하나의 시퀀싱 프라이머와 접촉시키는 것을 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 샘플을 판독 분자의 세트와 접촉시킨 후(혼성화를 허용하는 조건 하에), 검출 방법은 판독 분자의 3' 말단을 5' 포스페이트 기를 갖는 인접한 뉴클레오티드에 라이게이션시키는 것을 추가로 포함한다. 임의의 양태의 일부 실시형태에서, 광학적으로 검출가능한 라벨은 샘플이 판독 분자의 세트와 접촉된 후에 검출된다. 임의의 양태의 일부 실시형태에서, 광학적으로 검출가능한 표지 또는 광학적으로 검출가능한 라벨을 포함하는 임의의 영역(예를 들어, 5' 비-바코드-혼성화 영역)은 절단 단계를 통해 판독 분자로부터 제거된다. 임의의 양태의 일부 실시형태에서, 검출 방법은 본 명세서에 기술된 임의의 단계 사이에, 적어도 하나의 세척 단계를 추가로 포함한다.
임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트와의 접촉, 라이게이션, 검출 및 절단 단계는 전체 바코드 영역이 검출될 때까지 반복적으로 반복된다. 임의의 양태의 일부 실시형태에서, 상기 판독 분자의 세트와의 접촉, 라이게이션, 검출 및 절단 단계의 반복 횟수는 올리고뉴클레오티드 태그의 바코드 영역 내의 바코드 비트의 수에 상응한다. 비제한적인 예로서, 바코드 영역이 8개의 바코드 비트를 포함하는 경우, 판독 분자의 세트와의 접촉, 라이게이션, 검출, 및 절단 단계가 8회 반복적으로 반복된다.
따라서, 한 양태에서 본 명세서에는 샘플에서 하나 이상의 표적 분자를 검출하는 방법이 기술되며, 이 방법은 (a) 샘플을 하나 이상의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는 (i) 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (ii) 바코드 영역을 포함하는 스트리트를 포함하는 것인, 단계; (b) 샘플을 적어도 하나의 시퀀싱 프라이머와 접촉시키는 단계로서, 여기서 시퀀싱 프라이머는 적어도 하나의 올리고뉴클레오티드 태그에 혼성화되는, 단계; (c) 샘플을 본 명세서에 기술된 것과 같은 판독 분자의 세트와 접촉시키는 단계; (d) 판독 분자의 3' 말단을 5' 포스페이트 그룹(예를 들어, 시퀀싱 프라이머 또는 다른 판독 분자의 것)에 연결하는 단계; (e) 광학적으로 검출가능한 라벨을 검출하는 단계; (f) (예를 들어, 광학적으로 검출가능한 라벨을 포함하는) 판독 분자의 5' 영역 절단; (g) 전체 바코드 영역이 검출될 때까지 단계 (c) 내지 (f)를 반복하는 단계; (h) 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계를 포함하고, 여기서 적어도 하나의 올리고뉴클레오티드 태그는 적어도 하나의 표적 분자에 혼성화되고, 이로써 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 표적 분자에 혼성화되는지에 대한 식별이 가능하게 된다. 예를 들어, 도 10b 또는 도 10e 참조.
임의의 양태의 일부 실시형태에서, 상기 샘플이 본 명세서에서 세트, "판독 세트", 또는 "판독 풀"이라고도 지칭되는, 판독 분자의 세트와 접촉된다. 임의의 양태의 일부 실시형태에서, 각각의 판독 풀은 올리고뉴클레오티드 태그의 바코드 영역 내의 특정 위치에서 바코드 비트의 아이덴티티를 결정하는 것에 관한 것이다. 비제한적인 예로서, 샘플은 바코드 영역의 적어도 하나의 바코드 비트를 검출하기 위해 적어도 하나의 판독 세트와 순차적으로 또는 동시에 접촉된다. 비제한적 예로서, 샘플은 하나 이상의 스트리트에서 제1 및 제2 바코드 비트를 검출하기 위해 적어도 하나의 판독 세트와 순차적으로 접촉된다. 임의의 양태의 일부 실시형태에서, 판독 세트는 2개의 판독 분자, 3개의 판독 분자, 4개의 판독 분자, 또는 적어도 5개의 판독 분자를 포함한다. 임의의 양태의 일부 실시형태에서, 판독 세트는 2개의 별개의 검출가능한 표지, 3개의 별개의 검출가능한 표지, 4개의 별개의 검출가능한 표지, 또는 적어도 5개의 별개의 검출가능한 라벨을 포함한다.
임의의 양태의 일부 실시형태에서, 판독 세트는 동일한 유형의 검출가능한 표지에 연결된 판독 분자의 서브세트를 포함한다. 비제한적인 예로서, 동일한 유형의 검출가능한 라벨에 연결된 판독 분자의 서브세트는 바코드-혼성화 영역의 한 위치에 동일한 뉴클레오티드 및 (1) 바코드-혼성화 영역의 다른 위치에 다른 뉴클레오티드, (2) 바코드-혼성화 영역의 다른 위치에서 축퇴된 세트, 또는 (3) 바코드-혼성화 영역의 다른 위치에 범용 뉴클레오티드 중 적어도 하나를 포함한다. 범용 뉴클레오티드는 임의의 뉴클레오티드에 결합할 수 있는 범용 염기를 포함한다. 범용 염기의 비제한적인 예는 이노신, 데옥시이노신, 하이포잔틴, 니트로아졸, 이소카르보스티릴 유사체, 아졸 카복사미드, 또는 방향족 트리아졸 유사체를 포함한다(예를 들어, 다음 문헌 참조: Loakes et al., Nucleic Acids Res. 2001 Jun 15;29(12):2437-47; Berger et al., Nucleic Acids Res. 2000 Aug 1; 28(15): 2911-2914; Liang et al., RSC Advances 3(35); June 2013).
임의의 양태의 일부 실시형태에서, 판독 세트는 판독 분자의 적어도 2개의 서브세트를 포함하고, 여기서 각 서브세트는, 판독 분자의 다른 서브세트(들)에 연결된 검출가능한 라벨과 구별되는, 동일한 유형의 검출가능한 라벨에 연결되고, 그리고 각 서브세트는, 판독 분자의 다른 서브세트(들)에 의해 검출되는 바코드 영역의 동일한 위치 내의 뉴클레오티드와 구별되는, 바코드 영역 내의 동일한 바코드 비트를 검출한다. 임의의 양태의 일부 실시형태에서, 판독 세트는 판독 분자의 1개의 서브세트, 2개의 서브세트, 3개의 서브세트, 4개의 서브세트, 또는 적어도 5개의 서브세트를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 올리고뉴클레오티드 태그의 바코드 영역의 첫 번째 비트를 인식하는 첫 번째 판독 세트와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 올리고뉴클레오티드 태그의 바코드 영역의 제2 비트를 인식하는 제2 판독 세트와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 올리고뉴클레오티드 태그의 바코드 영역의 제3 비트를 인식하는 제3 판독 세트와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 올리고뉴클레오티드 태그의 바코드 영역의 제4 비트를 인식하는 제4 판독 세트와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 올리고뉴클레오티드 태그의 바코드 영역의 제5 비트를 인식하는 제5 판독 세트와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 올리고뉴클레오티드 태그의 바코드 영역의 n번째 비트를 인식하는 n번째 판독 세트와 접촉되며, 여기서 n은 1 내지 10의 정수에 상응한다. 임의의 양태의 일부 실시형태에서, 판독 분자의 각 세트는 동일하다. 임의의 양태의 일부 실시형태에서, 판독 분자의 각각의 세트는 모든 다른 판독 세트와 상이하다. 임의의 양태의 일부 실시형태에서, 판독 분자의 적어도 하나의 세트는 모든 다른 판독 세트와 상이하다. 임의의 양태의 일부 실시형태에서, 판독 분자의 적어도 하나의 세트는 적어도 하나의 다른 판독 세트와 동일하다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 각 판독 세트와 순차적으로 접촉된다. 임의의 양태의 일부 실시형태에서, 샘플을 n번째 판독 세트 및 (n+1)번째 판독 세트와 접촉시키는 단계 사이에, 판독 세트는 본 명세서에 기술된 바와 같이 검출되고, n번째 판독 세트는 세척된다(예를 들어, 혼성화 반응에 사용하기에 적합한 임의의 완충제, 예를 들어, 2XSSCT 중의 60% 포름아미드, 여기서 SSC는 식염수-소듐시트레이트 완충제를 나타내고 T는 TWEEN을 나타냄).
임의의 양태의 일부 실시형태에서, 상기 샘플이 동시에 적어도 2개의 판독 세트와 접촉된다. 비제한적인 예로서, 샘플은 적어도 2개의 판독 세트, 적어도 3개의 판독 세트, 적어도 4개의 판독 세트, 또는 적어도 5개의 판독 세트와 동시에 접촉된다. 샘플을 하나의 판독 세트와 접촉시키는 것과 비교하여, 동시에 적어도 2개의 판독 세트와 시료를 접촉시키는 것은, 이로만 제한되는 것은 아니지만, 신호 증폭, 추가 광학적으로 검출 가능한 마커의 도입(예를 들어, 상이한 형광단의 가색(psuedocolor) 조합), 및 프로세스 속도 증가를 포함하는 추가적인 이점을 제공할 수 있다.
임의의 양태의 일부 실시형태에서, 샘플에서 적어도 하나의 표적 분자를 검출하는 방법은, 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 샘플을 적어도 하나의 판독 세트와 접촉시키는 단계, 판독 분자의 상대적 공간 순서를 검출하는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그에 대한 판독 분자의 특이적 혼성화는, 바코드 영역의 아이덴티티(identity)에 의해 결정되거나 이에 의존한다.
임의의 양태의 일부 실시형태에서, 검출은 적어도 단일 세포 해상도로 수행된다. 임의의 양태의 일부 실시형태에서, 검출은 세포이하(subcellular) 해상도로 수행된다. 임의의 양태의 일부 실시형태에서, 검출은 적어도 단일 핵 해상도로 수행된다. 비제한적인 예로서, 검출은 적어도 200 nm, 적어도 300 nm, 적어도 400 nm, 적어도 500 nm, 적어도 600 nm, 적어도 700 nm, 적어도 800 nm, 적어도 900 nm, 적어도 1 ㎛, 적어도 2 ㎛, 적어도 3 ㎛, 적어도 4 ㎛, 적어도 5 ㎛, 적어도 6 ㎛, 적어도 7 ㎛, 적어도 8 ㎛, 적어도 9 ㎛, 또는 적어도 10 ㎛의 해상도로 수행될 수 있다. 임의의 양태의 일부 실시형태에서, 검출은 개별 표적 분자, 예를 들어, 염색체를 구별할 수 있는 해상도로 수행된다. 임의의 양태의 일부 실시형태에서, 검출은 초해상도로 수행된다. 비제한적인 예로서, 검출은 적어도 10 nm, 적어도 20 nm, 적어도 30 nm, 적어도 40 nm, 적어도 50 nm, 적어도 60 nm, 적어도 70 nm, 적어도 80 nm, 적어도 90 nm, 적어도 100 nm, 적어도 110 nm, 적어도 120 nm, 적어도 130 nm, 적어도 140 nm, 적어도 150 nm, 적어도 160 nm, 적어도 170 nm, 적어도 180 nm, 적어도 190 nm, 적어도 200 nm, 적어도 210 nm, 적어도 220 nm, 적어도 230 nm, 적어도 240 nm, 또는 적어도 250 nm의 초해상도로 수행될 수 있다.
한 양태에서 샘플에서 적어도 하나의 표적 분자를 검출하는 향상된 방법이 본 명세서에 기술되며, 이 방법은 (a) 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는, (i) 검출될 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (ii) 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트를 포함하는 것인, 단계; (b) 샘플을 본 명세서에 기술된 바와 같은 판독 분자 또는 이의 세트와 접촉시키는 단계(예를 들어, 여기서 적어도 하나의 판독 분자는 나노입자, 예를 들어, 금속 나노입자를 포함하고/거나, 적어도 하나의 판독 분자는 광학적으로 검출가능한 표지, 예를 들어, 형광단를 포함함); 및 (c) 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계를 포함하고, 여기서 적어도 하나의 올리고뉴클레오티드 태그는 적어도 하나의 표적 분자에 혼성화되고, 이로써 광학적으로 검출가능한 라벨은 어떤 올리고뉴클레오티드 태그가 해당 위치에서 표적 분자에 혼성화되는지에 대한 식별이 가능하게 된다. 임의의 양태의 일부 실시형태에서, 상기 방법은 전체 신호 증폭으로 인해 나노입자(예를 들어, 금속 나노입자)에 의해 향상된다. 이러한 신호 증폭은 나노입자(예를 들어, 금속 나노입자)에 연결된 복수의 판독 분자 및/또는 (예를 들어, 금속 나노입자와 같은 나노입자와, 형광단과 같은 광학적으로 검출 가능한 표지 사이의) 형광의 플라스몬 향상으로 야기될 수 있다.
임의의 양태의 일부 실시형태에서, 나노입자(예를 들어, 금속 나노입자)를 포함하는 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호는 나노입자를 포함하지 않는 동일한 판독 분자의 검출가능한 라벨의 신호와 비교하여, 적어도 1.5배 증가된다. 임의의 양태의 일부 실시형태에서, 나노입자를 포함하는 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호는 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 3배 증가된다. 임의의 양태의 일부 실시형태에서, 나노입자를 포함하는 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호는 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 10배 증가된다. 임의의 양태의 일부 실시형태에서, 나노입자를 포함하는 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호는 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 50배 증가된다. 임의의 양태의 일부 실시형태에서, 나노입자를 포함하는 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호는 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100배 증가된다.
한 양태에서, 생물학적 샘플의 핵형 분석 방법이 본 명세서에 기술되어 있으며, 이 방법은 (a) 샘플을 적어도 하나의 염색체에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는 (i) 검출될 표적 분자에 특이적으로 결합하는 인식 도메인, 및 (ii) 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트를 포함하는 것인, 단계; (b) 샘플을 본 명세서에 기술된 것과 같은 판독 분자의 세트와 접촉시키는 단계; (c) 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출 가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 적어도 하나의 올리고뉴클레오티드 태그는 적어도 하나의 표적 분자에 혼성화되고, 이로써 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계; 및 (d) 적어도 하나의 염색체에 특이적인 적어도 하나의 올리고뉴클레오티드 태그의 아이덴티티에 따라 적어도 하나의 염색체의 아이덴티티를 결정하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 p 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 q 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 p 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그, 및 적어도 하나의 염색체의 q 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 하나 이상의 염색체의 p 암 또는 q 암에 특이적인 적어도 2개의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 적어도 하나의 염색체의 p 암 또는 q 암에 특이적인 적어도 3개의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 각 염색체 암에 특이적인 최대 6개의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 각각의 염색체 암에 특이적인 최대 10개의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 각각의 염색체 암에 특이적인 최대 20개의 올리고뉴클레오티드 태그와 접촉된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 각 염색체 암에 특이적인 최대 5개, 최대 10개, 최대 15개, 최대 20개, 최대 25개, 최대 30개, 최대 35개, 최대 40개, 최대 45개, 각각에 특이적인 최대 50개, 최대 55개, 최대 60개, 최대 65개, 최대 70개, 최대 75개, 최대 80개, 최대 85개, 최대 90개, 최대 95개, 또는 최대 또는 100개의 올리고뉴클레오티드 태그와 접촉된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 방법은 면역형광(예를 들어, 도 6c 참조), 또는 OligoSTORM(예를 들어, 도 6d, 도 17a-17b 참조)을 포함하나 이에 제한되지 않는, 추가 방법과 순차적으로 또는 동시에 수행될 수 있다.
한 양태에서, 샘플에서 적어도 하나의 표적 분자의 고해상도 이미지를 생성하는 방법이 본 명세서에 기술되어 있으며, 이 방법은 (a) 고해상도 이미지화 방법의 적어도 1 라운드를 사용하여 적어도 하나의 표적 분자를 이미지화하는 단계; 및 (b) 적어도 하나의 이미지화된 표적 분자의 아이덴티티(identity)를 결정하는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 이미지화된 표적 분자의 아이덴티티를 결정하는 단계는, (i) 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는, (A) 검출될 표적 분자에 특이적으로 결합하는 인식 도메인, (B) 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트를 포함하는 것인, 단계; (ii) 샘플을 본 명세서에 기술된 것과 같은 판독 분자의 세트와 접촉시키는 단계; 및 (iii) 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 적어도 하나의 올리고뉴클레오티드 태그는 적어도 하나의 표적 분자에 혼성화되고, 이로써 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 2개의 표적 분자를 이미지화하는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 12개의 표적 분자를 이미지화하는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 66개의 표적 분자를 이미지화하는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 258개의 표적 분자를 이미지화하는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 500개의 표적 분자를 이미지화하는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 5000개의 표적 분자를 이미지화하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 방법이 적어도 5, 적어도 10, 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 55, 적어도 60, 적어도 65, 적어도 70, 적어도 75, 적어도 80, 적어도 85, 적어도 90, 적어도 95, 적어도 100, 적어도 110, 적어도 120, 적어도 130, 적어도 140, 적어도 150, 적어도 160, 적어도 170, 적어도 180, 적어도 190, 적어도 200, 적어도 210, 적어도 220, 적어도 230, 적어도 240, 적어도 250, 적어도 260, 적어도 270, 적어도 280, 적어도 290, 적어도 300, 적어도 310, 적어도 320, 적어도 330, 적어도 340, 적어도 350, 적어도 360, 적어도 370, 적어도 380, 적어도 390, 적어도 400, 적어도 410, 적어도 420, 적어도 430, 적어도 440, 적어도 450, 적어도 460, 적어도 470, 적어도 480, 적어도 490, 적어도 500, 적어도 1000, 적어도 1500, 적어도 2000, 적어도 2500, 적어도 3000, 적어도 3500, 적어도 4000개, 적어도 4500개, 또는 적어도 5000개의 표적 분자를 이미지화하는 단계를 포함한다.
임의의 양태의 일부 실시형태에서, 모든 표적 분자는 한 번에 이미지화된다. 임의의 양태의 일부 실시형태에서, 표적 분자의 적어도 절반이 한 번에 이미지화된다. 임의의 양태의 일부 실시형태에서, 표적 분자의 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100%가 한 번에 이미지화된다.
임의의 양태의 일부 실시형태에서, 상기 방법은 고해상도 이미지화 방법의 적어도 2 라운드를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법은 고해상도 이미지화 방법의 적어도 3 라운드를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법은 고해상도 이미지화 방법의 적어도 5 라운드를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법은 고해상도 이미지화 방법의 적어도 20 라운드를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 방법은 고해상도 이미지화 방법의 적어도 1 라운드, 적어도 2 라운드, 적어도 3 라운드, 적어도 4 라운드, 적어도 5 라운드, 적어도 10 라운드, 적어도 15 라운드, 적어도 20 라운드, 적어도 25, 적어도 30 라운드, 적어도 35 라운드, 적어도 40 라운드, 적어도 45 라운드, 적어도 50 라운드, 적어도 55 라운드, 적어도 60 라운드, 적어도 65 라운드, 적어도 70 라운드, 적어도 75 라운드, 적어도 80 라운드, 적어도 85 라운드, 적어도 90 라운드, 적어도 95 라운드, 또는 적어도 100 라운드를 포함한다.
임의의 양태의 일부 실시형태에서, 고해상도 이미지화 방법은 다음으로 이루어진 군으로부터 선택된다: 올리고 확률적 광학 재구성 현미경 검사법(OligoSTORM); 구조 조명 현미경(SIM); 자극 방출 고갈(STED) 현미경 검사법; 및 나노규모 토폴로지(DNA-PAINT)에서 올리고 DNA 포인트 축적. 임의의 양태의 일부 실시형태에서, 고해상도 이미지화 방법은 올리고 확률적 광학 재구성 현미경(OligoSTORM)을 포함한다. 임의의 양태의 일부 실시형태에서, 고해상도 이미지화 방법은 구조적 조명 현미경(SIM)을 포함한다. 임의의 양태의 일부 실시형태에서, 고해상도 이미지화 방법은 STED(Stimulated emission depletion) 현미경을 포함한다. 임의의 양태의 일부 실시형태에서, 고해상도 이미지화 방법은 나노규모 토폴로지(DNA-PAINT)에서 올리고 DNA 포인트 축적을 포함한다. 예를 들어, 이들 각각의 내용이 그 전문으로 본 명세서에 참조로 통합되는 다음 문헌 참조: Wu and Shroff, Faster, sharper, and deeper: structured ill㎛ination microscopy for biological imaging, Nature Methods 15, 1011-1019 (2018); Vicidomini et al. STED super-resolved microscopy. Nat Methods 15, 173-182 (2018); Beliveau et al. In situ super-resolution imaging of genomic DNA with OligoSTORM and OligoDNA-PAINT. Methods Mol Biol 2017 1663:231-252.
임의의 양태의 일부 실시형태에서, 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계는 샘플을 판독 분자의 세트와 접촉시키는 적어도 2 라운드를 포함한다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계는 샘플을 판독 분자의 세트와 접촉시키는 적어도 3 라운드를 포함한다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계는 샘플을 판독 분자의 세트와 접촉시키는 적어도 5 라운드를 포함한다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계는 샘플을 판독 분자의 세트와 접촉시키는 적어도 10 라운드를 포함한다. 임의의 양태의 일부 실시형태에서, 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계는 샘플을 판독 분자의 세트와 접촉시키는 적어도 20 라운드를 포함한다.
임의의 양태의 일부 실시형태에서, 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계는 샘플을 판독 분자의 세트와 접촉시키는 적어도 1 라운드, 적어도 2 라운드, 적어도 3 라운드, 적어도 4 라운드, 적어도 5 라운드, 적어도 10 라운드, 적어도 15 라운드, 적어도 20 라운드, 적어도 25 라운드, 적어도 30 라운드, 적어도 35 라운드, 적어도 40 라운드, 적어도 45 라운드, 적어도 50 라운드, 적어도 55 라운드, 적어도 60 라운드, 적어도 65 라운드, 적어도 70 라운드, 적어도 75 라운드, 적어도 80 라운드, 적어도 85 라운드, 적어도 90 라운드, 적어도 95 라운드, 또는 적어도 100 라운드를 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 조성물 및 방법은 올리고페인트 기술과 관련된 조성물 및 방법의 개선을 포함한다. 본 명세서에 사용된 용어 "올리고페인트(Oligopaint)"는 표적 분자에 상보적인 서열, 예를 들어, 올리고뉴클레오티드 서열, DNA 서열의 일부, 또는 특정 염색체 또는 특정 염색체의 서브염색체 영역을 갖는 폴리뉴클레오티드를 지칭한다.
전형적으로, 형광 제자리 혼성화(FISH) 프로브는 복제된 게놈 영역 또는 흐름-분류된 염색체에서 유래하며, 이는 형광단-접합 뉴클레오티드의 존재 하에 닉 번역 또는 PCR을 통해 직접 표지되거나 또는 뉴클레오티드-접합 합텐, 예컨대 비오틴 및 디곡시제닌으로 간접적으로 표지된 다음, 2차 검출 시약으로 시각화된다. 기존의 FISH 프로브는 반복적인 서열과 다양한 효능으로 인해 제한된다. 또한, 표적 영역은 클론의 가용성과 게놈 삽입물의 크기에 의해 제한된다. 기존의 FISH 프로브를 사용하여 더 큰 영역을 표적으로 삼는 것이 가능하지만, 각각의 클론이 혼성화를 위해 별도로 제조되고 최적화되어야 하기 때문에, 이 접근 방식은 종종 어렵고 많은 비용을 요한다.
올리고페인트는 개선된 FISH 기술이며, 올리고 라이브러리는 대량 병렬 합성에 의해 생성될 수 있으며 프로브의 재생가능한 공급원으로 사용될 수 있다. 올리고 라이브러리는 (선택적으로 형광단-접합 프라이머로) PCR 증폭될 수 있다. 증폭 생성물은 수십 킬로베이스에서 메가베이스에 이르는 영역을 시각화할 수 있는 고효율 단일-가닥, 가닥-특이적 프로브를 생성하기 위해 효소적으로 처리될 수 있다. 올리고페인트는, 선택적으로 전산적으로(computationally) 패턴화되고/되거나 전산적으로 설계된 합성 프로브 및 어레이를 포함할 수 있다.
올리고페인트 및 관련 기술에 관한 간행물은, 예를 들어, 이들 각각의 내용이 그 전문으로 본 명세서에 참조로 통합되는, 다음 문헌 참조: Beliveau et al. OligoMiner provides a rapid, flexible environment for the design of genome-scale oligonucleotide in situ hybridization probes. Proc. Nat. Acad. Sci. USA 2018 115:E2183-E2192; Beliveau et al. In situ super-resolution imaging of genomic DNA with OligoSTORM and OligoDNA-PAINT. Methods Mol Biol 2017 1663:231-252; Wang et al. Spatial organization of chromatin domains and compartments in single chromosomes. Science 2016 353:598-602; Boettiger et al. Super-resolution imaging reveals distinct chromatin folding for different epigenetic states. Nature. 2016 529:418-22; Schmidt et al. Scalable amplification of strand subsets from chip-synthesized oligonucleotide libraries. Nat Commun 2015 Nov 16;6:8634; Murgha et al. Combined in vitro transcription and reverse transcription method to amplify and label complex synthetic oligonucleotide probe libraries. BioTechniques 2015 58:301-7; Beliveau et al. Single-molecule super-resolution imaging of chromosomes and in situ haplotype visualization using Oligopaint FISH probes. Nat Commun 2015 6:7147; Beliveau et al. Visualizing genomes with Oligopaint FISH probes. Curr Protocols Mol Biol 2014 14.23; Beliveau et al. A versatile design and synthesis platform for visualizing genomes with Oligopaint FISH probes. Proc. Nat. Acad. Sci. USA 2012 109:21301-6; US 2010/0304994 A1; US 2018/0223347 A1; WO 2018/045186 A1; US 2014/0364333 A1; US 2019/0032121 A1; US 2013/0143208 A1; US 10,119,160 B2; US 2018/0057867 A1; US 2019/0127786 A1; US 2018/0292318 A1; WO 2017/189525 A1; WO 2018/183851 A1; WO 2018/183860 A1; WO 2018/045181 A1; US 2016/0040235 A1.
본 명세서에 사용된 용어, "올리고페인팅된(Oligopainted)" 및 "올리고페인팅된 영역(Oligopainted region)"은, 각각, 하나 이상의 올리고페인트와의 혼성화를 갖는, 표적 뉴클레오티드 서열(예를 들어, 염색체) 또는 표적 뉴클레오티드 서열의 영역(예를 들어, 하위염색체 영역)을 지칭한다. 올리고페인트는 표적 뉴클레오티드 서열, 예를 들어, 간기, 전전기(preprophase), 전기, 전중기, 중기, 후기, 말기 및 세포질분열(cytokinesis)을 포함하지만 이에 제한되지 않는 세포 주기의 다양한 시기 동안 염색체 및 염색체의 서브-염색체 영역을 표지하는 데 사용할 수 있다.
본 명세서에는 OligoFISSEQ, 즉 형광 인시투 시퀀싱으로 디코딩된 바코드를 포함하는 올리고페인트를 포함하는 방법이 기술되어 있다. OligoFISSEQ 방법 및 조성물은 공개특허 WO 2017/161251 및 US 2019/0032121에 추가로 설명되어 있으며, 이들 각각의 전문은 본 명세서에 참조로 통합된다.
임의의 양태의 일부 실시형태에서, FISH 방법은 올리고페인트, 다중화 오류-강건 형광 제자리 혼성화(MERFISH), seqFISH, 표적의 RNA 순차 프로빙(SPOT), 고범위 현미경-기반 기술(Hi-M), 또는 염색질 구조의 광학적 재구성(ORCA) 또는 표적 분자, 예를 들어 올리고뉴클레오티드 서열, DNA 서열의 일부, 또는 특정 염색체 또는 특정 염색체의 하위-염색체 영역에 상보적인 서열(예를 들어, 인식 도메인)을 갖는 올리고뉴클레오티드와 샘플을 접촉시키는 단계를 포함하는 임의의 방법을 포함할 수 있다. 더 상세한 내용은, 예를 들어, 각각의 전문이 본 명세서에 참조로 통합되는, 다음 문헌 참조: Cardozo et al., Mol Cell. 2019 Apr 4;74(1):212-222; Mateo et al., Nature. 2019 Apr;568(7750):49-54; Wang et al., Scientific Reports vol㎛e 8, Article n㎛ber: 4847 (2018); Shah et al., Neuron, Vol㎛e 92, Issue 2, 19 October 2016, Pages 342-357; Eng et al., Nat Methods. 2017 Dec;14(12):1153-1155.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 세트 및 방법은 샘플에서 적어도 하나의 표적 분자를 검출하는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 표적 분자는 핵산, 폴리펩티드, 세포 표면 분자, 및/또는 무기 물질을 포함한다. 임의의 양태의 일부 실시형태에서, 표적 분자는 게놈 DNA, 염색체로서 조직화된 게놈 DNA, 또는 상보적 DNA(cDNA)를 포함하나 이에 제한되지 않는 DNA를 포함한다. 임의의 양태의 일부 실시형태에서, 표적 분자는 전령 RNA(mRNA) 또는 리보솜 RNA(rRNA)를 포함하나 이에 제한되지 않는 RNA를 포함한다. 임의의 양태의 일부 실시형태에서, 표적 분자는 DNA 및/또는 RNA이다. 임의의 양태의 일부 실시형태에서, 표적 분자는 DNA 및/또는 RNA를 포함한다. 임의의 양태의 일부 실시형태에서, 표적 분자는 DNA 및/또는 RNA로 구성되거나 본질적으로 구성된다. 임의의 양태의 일부 실시형태에서, 표적 분자는 폴리펩티드를 포함한다.
임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 1kb 핵산을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 15kb 핵산을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 50kb 핵산을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 100kb 핵산을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 1 Mb 핵산을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 염색체를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 게놈을 포함한다.
임의의 양태의 일부 실시형태에서, 표적 분자(들), 올리고뉴클레오티드 태그(들), 판독 분자(들), 및 시퀀싱 프라이머(들)는 DNA 및 RNA의 임의의 조합일 수 있다. 비제한적인 예로서, 표적 분자(들), 올리고뉴클레오티드 태그(들), 판독 분자(들), 및 시퀀싱 프라이머(들)는 모두 DNA일 수 있다. 비제한적 예로서, 표적 분자(들), 올리고뉴클레오티드 태그(들), 판독 분자(들), 및 시퀀싱 프라이머(들)는 모두 RNA일 수 있다. 비제한적인 예로서, 표적 분자(들)는 DNA일 수 있고; 올리고뉴클레오티드 태그(들), 판독 분자(들) 및 시퀀싱 프라이머(들)는 RNA일 수 있다. 비제한적인 예로서, 표적 분자(들)는 RNA일 수 있고; 올리고뉴클레오티드 태그(들), 판독 분자(들) 및 시퀀싱 프라이머(들)는 DNA일 수 있다. DNA 및 RNA의 임의의 다른 조합도 마찬가지로 사용될 수 있다. 임의의 양태의 일부 실시형태에서, 표적 분자(들), 올리고뉴클레오티드 태그(들), 판독 분자(들), 및/또는 시퀀싱 프라이머(들)는 DNA 및/또는 RNA로 구성되거나 또는 본질적으로 구성된다.
임의의 양태의 일부 실시형태에서, 표적 분자는 세포내 단백질, 막관통 단백질, 또는 세포외 단백질을 포함하나 이에 제한되지 않는 폴리펩티드를 포함한다. 임의의 양태의 일부 실시형태에서, 표적 분자는 막관통 단백질, 막 지질, 막 수용체 또는 막관통 수용체를 포함하나 이에 제한되지 않는 세포 표면 분자를 포함한다. 임의의 양태의 일부 실시형태에서, 표적 분자는 유리, 세라믹, 금속(예를 들어, 회로 기판, 금속을 포함하는 표면), 또는 다른 고체 기질. 임의의 양태의 일부 실시형태에서, 표적 분자는 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질에, 공유적으로 또는 비-공유적으로 연결된다. 이러한 링커 및 연결 모이어티의 비제한적인 예는 본 명세서에 추가로 기재되어 있다.
임의의 양태의 일부 실시형태에서, 하나의 표적 분자가 검출된다. 임의의 양태의 일부 실시형태에서, 적어도 2개의 표적 분자가 동시에 검출된다. 비제한적인 예로서, 적어도 2개의 표적 분자, 적어도 3개의 표적 분자, 적어도 4개의 표적 분자, 적어도 5개의 표적 분자, 적어도 6개의 표적 분자, 적어도 7개의 표적 분자, 적어도 8개의 표적 분자, 적어도 9개의 표적 분자, 적어도 10개의 표적 분자, 적어도 20개의 표적 분자, 적어도 20개의 표적 분자, 적어도 30개의 표적 분자, 적어도 40개의 표적 분자, 적어도 50개의 표적 분자, 적어도 60개의 표적 분자, 적어도 70개의 표적 분자, 적어도 80개의 표적 분자, 적어도 90개의 표적 분자, 또는 적어도 100개의 표적 분자가 동시에 검출된다.
임의의 양태의 일부 실시형태에서, 표적 분자의 하나 초과의 영역이 동시에 검출된다. 비제한적인 예로서, 표적 분자 또는 표적 분자들의, 적어도 2개 영역, 적어도 3개 영역, 적어도 4개 영역, 적어도 5개 영역, 적어도 6개 영역, 적어도 7개 영역, 적어도 8개 영역, 적어도 9개 영역, 적어도 10개 영역, 적어도 20개의 영역, 적어도 30개의 영역, 적어도 40개의 영역, 적어도 50개의 영역, 적어도 60개의 영역, 적어도 70개의 영역, 적어도 80개의 영역, 적어도 90개의 영역, 또는 적어도 100개의 영역이 검출된다.
임의의 양태의 일부 실시형태에서, 상기 샘플이 세포, 세포 배양물 또는 조직 샘플이다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 오르가노이드(즉, 줄기 세포로부터 유래된 자가-조직화된 3차원 조직 배양물)를 포함한다. 비제한적인 예로서, 세포, 세포 배양물, 또는 조직 샘플은 개별 염색체가 구별될 수 있는 시간 또는 조건, 예를 들어, 유사분열에서 채취된다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 인간 세포 핵을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 임의의 유기체의 세포로부터의 핵을 포함한다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 중기 염색체를 포함한다. 임의의 양태의 일부 실시형태에서, 상기 샘플이 중기 염색체 스프레드를 포함한다. 임의의 양태의 일부 실시형태에서, 중기 염색체는 배양된 세포 핵으로부터 수득된다. 임의의 양태의 일부 실시형태에서, 중기 염색체는 조직 절편, 오르가노이드, 또는 생검 표본으로부터 추출된 핵으로부터 수득된다.
본 명세서에 사용된 용어 "샘플(sample)" 또는 "테스트 샘플(test sample)"은 생물학적 유기체, 예를 들어, 대상체의 혈액 또는 조직 시료에서 채취하거나 분리한 시료를 지칭한다. 임의의 양태의 일부 실시형태에서, 본 발명은 생물학적 샘플의 여러가지 예들을 포함한다. 임의의 양태의 일부 실시형태에서, 생물학적 샘플은 세포, 또는 조직, 또는 말초 혈액, 또는 체액이다. 예시적인 생물학적 샘플에는 생검, 종양 샘플, 생체 유체 샘플; 혈액; 혈청; 혈장; 소변; 정액; 점액; 조직 생검; 장기 생검; 활액; 담즙액; 뇌척수액; 점막 분비물; 유출; 땀; 타액; 및/또는 조직 샘플 등을 포함한다. 상기 용어는 또한 상기 언급된 샘플의 혼합물을 포함한다. 용어 "테스트 샘플"은 또한 미처리 또는 전처리(또는 사전-가공)된 생물학적 시료를 포함한다. 임의의 양태의 일부 실시형태에서, 테스트 샘플은 대상체로부터의 세포를 포함한다.
임의의 양태의 일부 실시형태에서, 하나 이상의 표적 분자가 샘플의 하나 이상의 세포에서 검출된다. 임의의 양태의 일부 실시형태에서, 상기 적어도 하나의 표적 분자가, 샘플 내의 적어도 2개의 세포에서 동시에 검출된다. 비제한적 샘플로서, 적어도 하나의 표적 분자는 샘플 내의 적어도 2개의 세포, 적어도 5개의 세포, 적어도 10개의 세포, 적어도 20개의 세포, 적어도 30개의 세포, 적어도 40개의 세포, 적어도 50개의 세포, 적어도 60개 세포, 적어도 70개 세포, 적어도 80개 세포, 적어도 90개 세포, 적어도 100개 세포, 적어도 200개 세포, 적어도 300개 세포, 적어도 400개 세포, 적어도 500개 세포, 적어도 600개 세포 , 적어도 700개 세포, 적어도 800개 세포, 적어도 900개 세포, 적어도 1,000개 세포, 적어도 1,000개 세포, 적어도 1,000개 세포, 적어도 2,000개 세포, 적어도 3,000개 세포, 적어도 4,000개 세포, 적어도 5,000개 세포, 적어도 6,000개의 세포, 적어도 7,000개의 세포, 적어도 8,000개의 세포, 적어도 9,000개의 세포, 또는 적어도 10,000개의 세포에서 동시에 검출된다.
테스트 샘플은 대상체로부터 샘플을 제거하여 얻을 수 있지만, 이전에 분리된 샘플(예를 들어, 이전 시점에서 분리되고, 같은 사람 또는 다른 사람에 의해 분리된 것)을 사용하여 얻을 수도 있다.
임의의 양태의 일부 실시형태에서, 테스트 샘플은 미처리 테스트 샘플일 수 있다. 본 명세서에 사용된 바와 같이, "미처리된 테스트 샘플(untreated test sample)"이라는 문구는 용액에 희석 및/또는 현탁을 제외하고는 어떠한 사전 샘플 전처리도 하지 않은 테스트 샘플을 지칭한다. 테스트 샘플을 처리하기 위한 예시적인 방법은 원심분리, 여과, 초음파 처리, 균질화, 가열, 동결 및 해동, 및 이들의 조합을 포함하지만 이에 제한되지는 않는다. 임의의 양태의 일부 실시형태에서, 테스트 샘플은 동결된 테스트 샘플, 예를 들어, 동결된 조직일 수 있다. 동결된 샘플은 본 명세서에 기술된 방법, 분석 및 시스템을 사용하기 전에 해동될 수 있다. 해동 후, 동결된 샘플은 본 명세서에 기술된 방법, 분석 및 시스템에 적용되기 전에 원심분리될 수 있다. 임의의 양태의 일부 실시형태에서, 테스트 샘플은, 예를 들어, 정화된 테스트 샘플을 포함하는 상청액의 원심분리 및 수집에 의한 정화된 테스트 샘플이다. 임의의 양태의 일부 실시형태에서, 테스트 샘플은 사전-가공된 테스트 샘플, 예를 들어, 원심분리, 여과, 해동, 정제, 및 이들의 임의의 조합으로 이루어진 군으로부터 선택된 처리로부터 생성된 상청액 또는 여과액일 수 있다. 임의의 양태의 일부 실시형태에서, 테스트 샘플은 화학적 및/또는 생물학적 시약으로 처리될 수 있다. 화학적 및/또는 생물학적 시약은 가공 중에 생체분자(예를 들어, 핵산 및 단백질)를 포함하는 샘플의 안정성을 보호 및/또는 유지하기 위해 사용될 수 있다. 하나의 예시적인 시약은 처리 동안 단백질의 안정성을 보호하거나 유지하기 위해 일반적으로 사용되는 프로테아제 억제제이다. 당업자는 본 명세서에 기술된 바와 같은 발현 산물의 수준을 결정하는 데 필요한 생물학적 샘플의 사전-가공에 적절한 방법 및 프로세스를 잘 알고 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 방법, 검정, 및 시스템은 대상체로부터 테스트 샘플을 획득하거나 획득한 단계를 추가로 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 대상체는 인간 대상체일 수 있다.
뉴클레오티드 또는 이의 유사체(예를 들어, 올리고뉴클레오티드 태그, 판독 분자, 2차 올리고뉴클레오티드, 프라이머 등)를 포함하는 조성물이 본 명세서에 기술되어 있다. 뉴클레오티드는 포스페이트 백본, 오탄당 당(예를 들어, 리보스, 데옥시리보스) 및 핵염기(예를 들어, 아데닌, 시토신, 구아닌, 티민, 우라실)를 포함한다. 본 명세서에 사용된 용어 "유사체"(뉴클레오티드, 즉, 뉴클레오티드 유사체, 뉴클레오사이드 유사체, 핵산 유사체 등과 관련하여)는 포스페이트 백본, 5탄당 및/또는 핵염기에서 적어도 하나의 변형을 포함하는 뉴클레오티드-유사 조성물을 지칭한다. 뉴클레오티드 유사체의 비제한적인 예는 본 명세서에 추가로 기술되어 있지만, 본 명세서에 기술된 바와 같은 핵산 (예를 들어, 올리고뉴클레오티드 태그, 판독 분자, 2차 올리고뉴클레오티드, 및/또는 프라이머)은 당업계에 공지된 임의의 뉴클레오티드 유사체를 포함할 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 것과 같은 핵산(예를 들어, 올리고뉴클레오티드 태그, 판독 분자, 2차 올리고뉴클레오티드, 및/또는 프라이머)는 안정성 또는 다른 유익한 특성을 향상시키기 위해 화학적으로 변형된다. 본 명세서에 기술된 핵산은, 본 명세서에 참조로 통합되는 문헌["Current protocols in nucleic acid chemistry," Beaucage, S.L. et al. (Edrs.), John Wiley & Sons, Inc., New York, NY, USA"]에 기재된 것과 같은, 당업계에 잘 확립된 방법에 의해 합성 및/또는 변형될 수 있다. 변형은, 예를 들어, (a) 말단 변형, 예를 들어, 5' 말단 변형(인산화, 접합(conjugation), 역전된 결합(inverted linkages) 등) 3' 말단 변형(접합, DNA 뉴클레오티드, 역전된 결합 등), (b) 염기 변형, 예를 들어, 안정화 염기, 불안정화 염기, 또는 확장된 레퍼토리의 파트너와 염기쌍을 이루는 염기로의 교체, 염기(무염기성 뉴클레오티드)의 제거, 또는 접합된 염기, (c) 당 변형(예를 들어, 2' 위치 또는 4' 위치) 또는 당의 대체, 뿐만 아니라 (d) 포스포디에스테르 결합의 변형 또는 대체를 포함하는, 백본 변형을 포함한다. 본 명세서에 기술된 실시형태에서 유용한 핵산 화합물의 특정 예는 변형된 골격을 함유하거나 천연 뉴클레오시드간 연결을 함유하지 않는 핵산을 포함하지만 이에 제한되지는 않는다. 변형된 골격을 갖는 핵산은 무엇보다도 골격에 인 원자를 갖지 않는 것을 포함한다. 본 명세서의 목적을 위해, 그리고 때때로 당업계에서 참조되는 바와 같이, 뉴클레오사이드간 골격에 인 원자를 갖지 않는 변형된 핵산은 또한 올리고뉴클레오사이드인 것으로 간주될 수 있다. 임의의 양태의 일부 실시형태에서, 변형된 핵산은 이의 뉴클레오시드간 골격에 인 원자를 가질 것이다.
변형된 핵산 백본은, 예를 들어, 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3'-알킬렌 포스포네이트 및 키랄 포스포네이트를 포함하는 메틸 및 다른 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포아미데이트 및 아미노알킬포스포아미데이트를 포스포아미데이트, 티오노포스포아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 및 정상적인 3'-5' 연결을 갖는 보라노포스페이트(boranophosphate), 이들의 2'-5' 연결된 유사체, 및 역 극성을 갖는 것)(여기서 인접한 쌍의 뉴클레오시드 단위는 3'-5'에서 5'-3'로 또는 2'-5'에서 5'-2'로 연결됨)을 포함할 수 있다. 다양한 염, 혼합 염 및 유리산 형태가 또한 포함된다. 내부에 인 원자를 포함하지 않는 변형된 핵산 골격은 단쇄 알킬 또는 사이클로알킬 뉴클레오사이드간 연결, 혼합된 헤테로원자 및 알킬 또는 사이클로알킬 뉴클레오사이드간 연결, 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로사이클릭 뉴클레오사이드간 연결에 의해 형성된 골격을 갖는다. 이들은 모르폴리노 연결(뉴클레오사이드의 당 부분에서 부분적으로 형성됨)을 갖는 것; 실록산 골격; 설파이드, 설폭사이드 및 설폰 골격; 포름아세틸 및 티오포름아세틸 골격; 메틸렌 포름아세틸 및 티오포름아세틸 골격; 알켄 함유 골격; 설파메이트 골격; 메틸렌이미노 및 메틸렌히드라지노 골격; 설포네이트 및 설폰아미드 골격; 아미드 골격; 혼합된 N, O, S 및 CH2 구성 부분을 갖는 것, 및 헤테로원자 골격을 갖는 올리고뉴클레오사이드, 특히 --CH2--NH--CH2--, --CH2--N(CH3)--O--CH2--[메틸렌(메틸이미노) 또는 MMI 백본으로 알려짐], --CH2--O--N(CH3)--CH2--, --CH2--N(CH3)--N(CH3)--CH2-- 및 --N(CH3)--CH2--CH2--[여기서, 천연 포스포디에스테르 골격은 --O--P--O--CH2--로 표시됨]을 포함한다.
변형된 핵산은 또한 하나 이상의 치환된 당 모이어티를 함유할 수 있다. 본 명세서에 기술된 핵산은 2' 위치에서 하기 중 하나를 포함할 수 있다: OH; F; O-, S- 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬, 여기서 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있음. 예시적인 적합한 변형은 O[(CH2)nO]mCH3, O(CH2)·nOCH3, O(CH2)nNH2, O(CH2)nCH3, O(CH2)nONH2, 및 O(CH2)nON[(CH2)nCH3)]2를 포함하고, 여기서 n 및 m은 1 내지 약 10이다. 임의의 양태의 일부 실시형태에서, dsRNA는 2' 위치에 다음 중 하나를 포함한다: C1 내지 C10 저급 알킬, 치환된 저급 알킬, 알카릴, 아르알킬, O-알크아릴 또는 O-아랄킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, 헤테로사이클로알킬, 헤테로사이클로알카릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 그룹, 리포터 그룹(reporter group), 인터칼레이터(intercalator), 핵산의 약동학적 특성을 개선하기 위한 그룹, 또는 핵산의 약력학적 특성을 개선하기 위한 그룹, 및 유사한 특성을 갖는 기타 치환기를 포함한다. 임의의 양태의 일부 실시형태에서, 변형은 2' 메톡시에톡시(2'-O--CH2CH2OCH3, 2'-O-(2-메톡시에틸) 또는 2'-MOE로도 공지됨)(Martin et al., Helv. Chim. Acta, 1995, 78:486-504) 즉, 알콕시-알콕시 그룹을 포함한다. 또 다른 예시적인 변형은 2'-디메틸아미노옥시에톡시, 즉, 하기 본 명세서의 실시예에 기재된 바와 같은 2'-DMAOE로도 알려진 O(CH2)2ON(CH3)2 그룹, 및 2'-디메틸아미노에톡시에톡시(또한 당업계에 2'-O-디메틸아미노에톡시에틸 또는 2'-DMAOEE로도 알려짐), 즉 하기 본 명세서의 실시예에 기재된 바와 같은 2'-O--CH2--O--CH2--N(CH2)2를 포함한다.
다른 변형은 2'-메톡시(2'-OCH3), 2'-아미노프로폭시(2'-OCH2CH2CH2NH2) 및 2'-플루오로(2'-F)를 포함한다. 유사한 변형이 또한 핵산 상의 다른 위치, 특히 3' 말단 뉴클레오티드 상의 당의 3' 위치 또는 2'-5' 연결된 dsRNA 및 5' 말단 뉴클레오티드의 5' 위치에서 이루어질 수 있다. 핵산은 또한 펜토푸라노실 당을 대신하여 사이클로부틸 모이어티와 같은 당 모방체를 가질 수 있다.
핵산은 또한 핵염기(당업계에서 간단히 "염기(base)"라고 함) 변형 또는 치환을 포함할 수 있다. 본 명세서에 사용된 "비변형된(unmodified)" 또는 "천연(natural)" 핵염기는 퓨린 염기 아데닌(A) 및 구아닌(G), 및 피리미딘 염기 티민(T), 시토신(C) 및 우라실(U)을 포함한다. 변형된 핵염기는 5-메틸시토신(5-me-C), 5-하이드록시메틸 시토신, 크산틴, 하이포크산틴, 2-아미노아데닌, 6-메틸 및 아데닌과 구아닌의 기타 알킬 유도체, 아데닌과 구아닌의 2-프로필 및 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실(슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-하이드록실 및 기타 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-다자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함하지만 이에 제한되지 않는 합성 및 천연 핵염기를 포함할 수 있다. 이들 핵염기 중 특정 핵염기는 본 발명에서 특징으로 하는 억제성 핵산의 결합 친화도를 증가시키는 데 특히 유용하다. 이들에는 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 0-6 치환된 퓨린이 포함되며, 이에는 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신이 포함된다. 5-메틸시토신 치환은 핵산 이중나선 안정성을 0.6 내지 1.2℃ 증가시키는 것으로 나타났고(Sanghvi, Y. S., Crooke, S. T. and Lebleu, B., Eds., dsRNA Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278), 이것은 더욱 더 특별하게는 2'-O-메톡시에틸 당 변형과 조합되는 경우 예시적인 염기 치환이다. 임의의 양태의 일부 실시형태에서, 변형된 핵염기는 d5SICS 및 dNAM을 포함할 수 있으며, 이는 염기쌍으로서 개별적으로 또는 함께 사용될 수 있는 비천연 핵염기의 비제한적 예이다(예를 들어, Leconte et. al. J. Am. Chem. Soc.2008, 130, 7, 2336-2343; Malyshev et. al. PNAS. 2012. 109 (30) 12005-12010). 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 것과 같은 핵산(예를 들어, 올리고뉴클레오티드 태그, 판독 분자, 2차 올리고뉴클레오티드, 및/또는 프라이머)는 당업계에 공지된 임의의 변형된 핵염기, 즉, 비변형 및/또는 천연 핵염기로부터 변형된 임의의 핵염기를 포함한다.
위에 기술된 변형된 핵산, 골격, 및 핵염기의 제조는 당업계에 잘 알려져 있다.
본 발명에서 특징으로 하는 핵산의 또 다른 변형은 핵산의 활성, 세포 분포, 약동학적 특성, 또는 세포 흡수를 향상시키는 하나 이상의 리간드, 모이어티 또는 접합체에 핵산을 화학적으로 연결하는 것을 포함한다. 이러한 모이어티는, 이로만 제한되는 것은 아니지만, 지질 모이어티, 예컨대 콜레스테롤 모이어티(Letsinger et al., Proc. Natl. Acid. Sci. USA, 1989, 86: 6553-6556), 콜산(Manoharan et al., Biorg. Med. Chem. Let., 1994, 4:1053-1060), 티오에테르, 예를 들어, 베릴-S-트리틸티올(Manoharan et al., Ann. NY Acad. Sci., 1992, 660:306-309; Manoharan et al. al., Biorg. Med. Chem. Let., 1993, 3:2765-2770), 티오콜레스테롤(Oberhauser et al., Nucl. Acids Res., 1992, 20:533-538), 지방족 쇄, 예를 들어, 도데칸디올 또는 운데실 잔기(Saison-Behmoaras et al., EMBO J, 1991, 10:1111-1118; Kabanov et al., FEBS Lett., 1990, 259:327-330; Svinarchuk et al., 15 Biochimie :49-54), 인지질, 예를 들어, 디-헥사데실-rac-글리세롤 또는 트리에틸-암모늄 1,2-디-O-헥사데실-rac-글리세로-3-포스포네이트(Manoharan et al., Tetrahedron Lett., 1995 , 36:3651-3654; Shea et al., Nucl. Acids Res., 1990, 18:3777-3783), 폴리아민 또는 폴리에틸렌 글리콜 쇄(Manoharan et al., Nucleosides & Nucleotides, 1995, 14:969-973), 또는 아다만탄 아세트산(Manoharan et al., Tetrahedron Lett., 1995, 36:3651-3654), 암미틸 모이어티(Mishra et al., Biochim. Biophys. Acta, 1995, 1264:229-237), 또는 옥타데실아민 또는 헥실아미노-카르보닐옥시콜레스테롤 모이어티(Crooke et al., J. Pharmacol. Exp. Ther., 1996, 277:923-937)를 포함한다.
임의의 양태의 일부 실시형태에서, 각각의 판독 분자는 절단가능한 변형을 포함한다. 본 개시의 특정 양태에 따르면, 절단가능한 연결 또는 절단가능한 변형으로도 지칭되는 절단가능한 뉴클레오티드 모이어티는 판독 분자에서 바코드-혼성화 영역을 비-바코드 혼성화 영역으로부터 분리하는 데 사용된다. 절단가능한 모이어티는 당업자에게 공지되어 있으며 화학적으로 분열성인 뉴클레오시드간 연결을 포함하며, 이는 화학 물질로 처리하거나 산화 또는 환원 환경에 적용하여 절단될 수 있다. 이러한 절단가능한 모이어티는 질산은 용액과 같은 다양한 금속 이온에 의해 절단될 수 있는 포스포로티오에이트, 포스포로티올레이트를 포함한다. 이러한 절단가능한 모이어티는 아세트산을 포함하는 용액과 같은 산성 조건에서 절단될 수 있는 포스포로아미데이트를 포함한다. 연결을 절단할 수 있는 적합한 화학물질은 가교-포스포로티오에이트 연결을 절단할 수 있고 뉴클레오티드 및/또는 올리고뉴클레오티드로부터 포스포라미다이트 링커를 제거하여, 절단 부위에서 뉴클레오티드 및/또는 올리고뉴클레오티드 상에 유리 포스페이트 기를 남길 수 있는 화학물질을 포함한다. 적합한 화학 물질은, 이로만 제한되는 것은 아니지만, AgNO3, AgCH3COO, AgBrO3, Ag2SO4, 또는 Ag2+, HgCl2, I2, Br2, I-, Br- 등을 전달하는 임의의 화합물을 포함한다.
절단가능한 모이어티는 또한 당업자에게 공지된 뉴클레이즈에 의해 절단될 수 있는 것들을 포함한다. 이러한 뉴클레이즈는 유형 I, 유형 II, 유형 III 및 유형 IV와 같은 제한 엔도뉴클레이즈, 엔도뉴클레이즈 I-VIII와 같은 엔도뉴클레이즈, 리보뉴클레이즈 및 AP 엔도뉴클레이즈 활성을 갖는 효소와 같은 다른 뉴클레이즈, AP 리아제 활성을 갖는 효소 및 우라실 DNA 글리코실라제와 같은 글리코실라제 활성을 갖는 효소를 포함한다.
절단가능한 모이어티는 또한 특정 파장의 빛에 의해 절단될 수 있는 부분을 포함한다. 이러한 절단가능한 모이어티는 광불안정한 연결로 지칭되며 문헌[Olejnik et al., Photocleavable biotin derivatives: a versatile approach for the isolation of biomolecules, Proc. Natl. Acad. Sci. U.S.A., vol. 92, p. 7590-7594 (1995)]에 개시되어 있다. 이러한 광절단가능한 링커는 수초 내지 30분의 기간, 예컨대 약 1분 동안 약 275 내지 약 375 nm의 파장 사이의 UV 조명에 의해 절단될 수 있다. 예시적인 파장은 약 300 nm 내지 약 350 nm를 포함한다.
dGTP, dCTP 및 dTTP와 같은 특정 뉴클레오티드는 절단가능한 연결로 사용하기 위해 통합되기 전에 반응하여, 뉴클레이즈 또는 화학물질에 의한 추가 절단에 특이적으로 민감하게 만들 수도 있다. 한 양태에 따르면, 주어진 주형 비-혼성화 핵산 내의 하나 또는 다수의 데옥시구아노신은, 검출(예를 들어, 시퀀싱) 반응에 첨가되기 전에, 2-니트로프로판에 의해 8-옥소-데옥시구아노신으로 산화될 수 있고, 이어서 8-옥소구아닌 DNA 글리코실라제(예를 들어, Fpg, hOGG1)를 사용하여 절단될 수 있다. 유사하게, 데옥시시토신은 비설파이트 또는 아질산을 사용하여 5-하이드록시시토신을 형성하도록 사전-반응될 수 있으며, 그런 다음 hNEIL1과 같은 특정 DNA-글리코실라제에 의해 처리될 수 있다. 절단될 수 있는 다른 뉴클레오티드는 우라실, 데옥시우리딘, 이노신 및 데옥시이노신을 포함한다.
추가 실시양태는 뉴클레오티드를 변형하여 절단에 더 민감하게 만드는 첫번째 단계 이후 뉴클레오티드가 절단되는 두 번째 단계와 같은 2-단계 방법으로 절단될 수 있는 뉴클레오티드를 포함한다. 이러한 시스템은 USER 시스템(Enzymatics(#Y918L) 또는 New England Biolabs(#M5505L)에서 상업적으로 입수 가능함)을 포함하며, 다른 엔도뉴클레이즈가 사용될 수 있지만 일반적으로 UDG와 엔도뉴클레이즈 VIII의 조합이다. 효소 UDG 및 엔도뉴클레이즈는 상업적으로 입수 가능하다. 또한, 변형된 뉴클레오티드는 절단을 용이하게 하기 위해, 결합과 같이 뉴클레오티드의 특징이 변형된 절단가능한 뉴클레오티드일 수 있다. 예로는 탈염기성(abasic) 염기, 탈피리미딘성(apyrimidic) 염기, 탈퓨린성(apurinic) 염기, 포스포로티오에이트, 포스포로티올레이트 및 8-옥소-데옥시구아노신으로 산화될 수 있는 데옥시구아노신과 같은 산화되는 염기를 포함한다.
따라서, 뉴클레오티드간 결합은 화학적, 열적 또는 광 기반 절단에 의해 절단될 수 있다. 본 명세서에 기술된 방법에 사용하기 위한 예시적인 화학적으로 절단가능한 뉴클레오티드간 연결은, 예를 들어, β-시아노 에테르, 5'-데옥시-5'-아미노카바메이트, 3'데옥시-3'-아미노카바메이트, 우레아, 2'시아노-3',5'-포스포디에스테르, 3'-(S)-포스포로티오에이트, 5'-(S)-포스포로티오에이트, 3'-(N)-포스포아미데이트, 5'-(N)-포스포아미데이트, α-아미노 아미드, 비시날 디올, 리보뉴클레오사이드 삽입, 2'-아미노-3',5'-포스포디에스테르, 알릴 술폭시드, 에스테르, 실릴 에테르, 디티오아세탈, 5'-티오-푸르말, α-하이드록시-메틸-포스폰산 비스아미드, 아세탈, 3'-티오-푸르말, 메틸포스포네이트 및 포스포트리에스를 포함한다. 트리알킬실릴 에테르 및 디알콕시실란과 같은 뉴클레오사이드간 실릴 그룹은 불화물 이온 처리에 의해 절단된다. 염기-절단가능한 부위는 β-시아노 에테르, 5'-데옥시-5'-아미노카바메이트, 3'-데옥시-3'-아미노카바메이트, 우레아, 2'-시아노-3',5'-포스포디에스테르, 2'-아미노- 3',5'-포스포디에스테르, 에스테르 및 리보스를 포함한다. 3'-(S)-포스포로티오에이트 및 5'-(S)-포스포로티오에이트와 같은 티오-함유 뉴클레오티드간 결합은 질산은 또는 염화수은으로 처리하여 절단된다. 산 절단 가능한 부위는 3'-(N)-포스포르아미데이트, 5'-(N)-포스포르아미데이트, 디티오아세탈, 아세탈 및 포스폰산 비스아미드를 포함한다. α-아미노아미드 뉴클레오시드간 결합은 이소티오시아네이트로 처리하여 절단할 수 있으며, 티타늄을 사용하여 2'-아미노-3',5'-포스포디에스테르-O-오르토-벤질 뉴클레오시드간 결합을 절단할 수 있다. 비시날(vicinal) 디올 연결은 과요오드산염 처리에 의해 절단될 수 있다. 열적으로 절단가능한 그룹은 알릴 설폭사이드 및 사이클로헥센을 포함하고 광-불안정(photo-labile) 연결은 니트로벤질에테르 및 티미딘 이량체를 포함한다. 화학적으로 절단가능한, 열적으로 절단가능한, 및 광-불안정한 기를 함유하는 핵산을 합성 및 절단하는 방법은, 예를 들어, 미국 특허 제5,700,642호에 기술되어 있다.
따라서, 뉴클레오티드간 결합은 효소 절단을 사용하여 절단될 수 있다. 본 명세서에 기술된 핵산 서열은 제한 엔도뉴클레이즈 절단 부위를 포함하도록 설계될 수 있다. 핵산은 절단을 야기하기 위해 제한 엔도뉴클레이즈와 접촉될 수 있다. 특이적 결합 및/또는 절단 부위를 갖는 매우 다양한 제한 엔도뉴클레이즈는, 예를 들어, New England Biolabs(Ipswich, MA)로부터 상업적으로 입수가능하다. 다양한 실시형태에서, 3' 오버행, 5' 오버행 또는 평활(blunt) 말단을 생성하는 제한 엔도뉴클레이즈가 사용될 수 있다. 돌출부를 생성하는 제한 엔도뉴클레이즈를 사용하는 경우, 엑소뉴클레이즈(예를 들어, RecJf, 엑소뉴클레이즈 I, 엑소뉴클레이즈 T, S1 뉴클레이즈, P1 뉴클레이즈, 녹두 뉴클레이즈, CEL I 뉴클레이즈 등)를 사용하여 평활 말단을 생성할 수 있다. 예시적인 실시양태에서, 유형 IIS 제한 엔도뉴클레이즈에 대한 결합 및/또는 절단 부위를 함유하는 직교 프라이머/프라이머 결합 부위를 사용하여 임시 직교(orthogonal) 프라이머 결합 부위를 제거할 수 있다.
본 명세서에 사용된 용어 "제한 엔도뉴클레이즈 인식 부위"는, 이로만 제한되는 것은 아니지만, 하나 이상의 제한 효소가 결합하여, 제한 엔도뉴클레이즈 인식 서열 자체에서, 또는 제한 엔도뉴클레이즈 인식 서열의 원위 서열에서 DNA 분자의 절단이 초래되는, 특정 핵산 서열을 포함하도록 의도된다. 제한 효소는, 이로만 제한되는 것은 아니지만, 유형 I 효소, 유형 II 효소, 유형 IIS 효소, 유형 III 효소 및 유형 IV 효소를 포함한다. REBASE 데이터베이스는 제한 효소, DNA 메틸트랜스퍼라제 및 제한-변형에 관여하는 관련 단백질에 대한 포괄적인 정보 데이터베이스를 제공한다. 여기에는 제한 엔도뉴클레이즈 인식 부위와 제한 엔도뉴클레이즈 절단 부위, 동일전달제한효소(isoschizomer), 상업적 이용이능성, 결정 및 서열 데이터에 대한 정보가 포함된 공개 및 미공개 작업이 모두 포함되어 있다(모든 목적을 위해 그 전문이 본 명세서에 참조로 통합되는, 다음 문헌 참조: Roberts et al. (2005) Nucl. Acids Res. 33:D230).
특정 양태에서, 본 발명의 프라이머는 유형 IIS 효소가 핵산을 제한 엔도뉴클레이즈 인식 서열의 3'에서 여러 염기쌍으로 절단할 수 있게 하는 하나 이상의 제한 엔도뉴클레이즈 인식 부위를 포함한다. 본 명세서에 사용된 용어 "유형 IIS"는 이의 인식 서열로부터 멀리 떨어진 부위에서 절단하는 제한 효소를 지칭한다. 유형 IIS 효소는 이들의 인식 부위로부터 0에서 20개 염기쌍 범위의 거리에서 절단하는 것으로 알려져 있다. 예를 들어, 유형 II 엔도뉴클레이즈의 예는, 예를 들어, Bsr I, Bsm I, BstF5 I, BsrD I, Bts I, Mnl I, BciV I, Hph I, Mbo II, Eci I, Acu I, Bpm I, Mme I, BsaX I, Bcg I, Bae I, Bfi I, TspDT I, TspGW I, Taq II, Eco57 I, Eco57M I, Gsu I, Ppi I, 및 Psr I와 같은 3' 오버행을 생성하는 효소; 예를 들어, BsmA I, Ple I, Fau I, Sap I, BspM I, SfaN I, Hga I, Bvb I, Fok I, BceA I, BsmF I, Ksp632 I, Eco31 I, Esp3 I, Aar I와 같은, 5' 돌출부를 생성하는 효소; 및 예를 들어, Mly I 및 Btr I과 같은 평활 말단을 생성하는 효소를 포함한다. Type-IIs 엔도뉴클레이즈는 상업적으로 입수가능하고 당업계에 널리 알려져 있다(New England Biolabs, Beverly, MA). 유형 IIs 엔도뉴클레이즈를 사용한 절단(digestion)을 위한 인식 부위, 절단 부위 및 조건에 대한 정보는, 예를 들어, 월드와이드 웹 상의 neb.com/nebecomm/enzymefindersearch bytypeIIs.asp에서 찾을 수 있다. 제한 엔도뉴클레이즈 서열 및 제한 효소는 당업계에 널리 알려져 있고 제한 효소는 상업적으로 입수가능하다(New England Biolabs, Ipswich, MA).
특정 양태에 따르면, 절단가능한 모이어티는 올리고뉴클레오티드(예를 들어, 판독 분자) 내에 있을 수 있고 제자리(in situ) 합성 동안 도입될 수 있다. 매우 다양한 절단가능한 모이어티가 고체상 및 마이크로어레이 올리고뉴클레오티드 합성 분야에서 이용이능하다(예를 들어, 다음 문헌 참조: Pon, R., Methods Mol. Biol. 20:465-496 (1993); Verma et al., Ann. Rev. Biochem. 67:99-134 (1998); 미국 특허 제5,739,386호, 제5,700,642호 및 제5,830,655호; 및 미국 공개특허 제2003/0186226호 및 제2004/0106728호).
절단가능한 부위는 올리고뉴클레오티드 골격, 예를 들어, 리보스, 디알콕시실란, 포스포로티오에이트, 및 포스포라미데이트 뉴클레오티드간 연결과 같은 포스포디에스테르 기 중 하나를 대신하여 변형된 3'-5' 뉴클레오티드간 연결을 따라 위치할 수 있다. 절단가능한 올리고뉴클레오티드 유사체는 또한 7-데아자구아노신, 5-메틸시토신, 이노신, 우리딘 등과 같은 염기 또는 당 중 하나에 대한 치환체, 또는 이의 대체를 포함할 수 있다.
한 실시양태에서, 변형된 올리고뉴클레오티드(예를 들어, 판독 분자) 내에 함유된 절단가능한 부위는 화학적으로 절단가능한 기, 예컨대, 디알콕시실란, 3'-(S)-포스포로티오에이트, 5'-(S)-포스포로티오에이트, 3' -(N)-포스포르아미데이트, 5'-(N)포스포르아미데이트 및 리보스를 포함할 수 있다. 화학적으로 절단가능한 올리고뉴클레오티드의 합성 및 절단 조건은 미국 특허 제5,700,642호 및 제5,830,655호에 기술되어 있다. 예를 들어, 도입될 절단가능한 부위의 선택에 따라, 관능화된 뉴클레오사이드 또는 변형된 뉴클레오사이드 이량체가 우선 제조되고, 그런 다음 올리고뉴클레오타이드 합성 과정 동안 성장하는 올리고뉴클레오타이드 단편 내로 선택적으로 도입될 수 있다. 디알콕시실란의 선택적 절단은 플루오라이드 이온 처리에 의해 수행될 수 있다. 포스포로티오에이트 뉴클레오타이드간 연결은 온화한 산화 조건에서 선택적으로 절단될 수 있다. 포스포라미데이트 결합의 선택적 절단은, 80% 아세트산과 같은 온화한 산 조건 하에서 수행될 수 있다. 리보스의 선택적 절단은 희석된 수산화암모늄으로 처리하여 수행될 수 있다.
또 다른 실시양태에서, 미국 특허 출원 공개공보 제2003/0186226호에 기재된 바와 같이 포스포라미다이트 또는 H-포스포네이트 올리고뉴클레오티드 합성 전에 특수 포스포라미다이트를 하이드록실기에 커플링함으로써 절단불가능한 하이드록실 링커를 절단가능한 링커로 전환시킬 수 있다. 올리고뉴클레오타이드 합성 완료 시 화학적 인산화제의 절단은 3' 말단에 포스페이트 기를 보유하는 올리고뉴클레오타이드(예를 들어, 판독 분자)를 생성한다. 3'-포스페이트 말단은 당업자에 의해 일상적으로 수행되는, 화학물질 또는 알칼리성 포스파타제와 같은 효소로의 처리에 의해 3' 하이드록실 말단으로 전환될 수 있다.
또 다른 실시양태에서, 절단가능한 연결 모이어티는 TOPS(합성 당 2개의 올리고뉴클레오티드) 링커일 수 있다(예를 들어, PCT 공개공보 WO 93/20092 참조). 예를 들어, TOPS 포스포라미다이트는 고체 지지체 상의 절단불가능한 하이드록실기를 절단가능한 링커로 전환시키는데 사용될 수 있다. TOPS 시약의 바람직한 실시형태는 Universal TOPS™ 포스포라미다이트이다. Universal TOPS™ 포스포라미다이트 제조, 커플링 및 절단을 위한 조건은, 예를 들어, 문헌[Hardy et al. Nucleic Acids Research 22(15):2998-3004(1994)]에 기술되어 있다. Universal TOPS™ 포스포르아미다이트는, 연장된 암모니아 및/또는 암모니아/메틸아민 처리와 같은 염기성 조건에서 제거될 수 있는 고리형 3' 포스페이트를 생성하여, 천연 3' 하이드록시 올리고뉴클레오티드를 초래한다.
또 다른 실시양태에서, 절단가능한 연결 모이어티는 아미노 링커일 수 있다. 포스포라미다이트 연결을 통해 링커에 결합된 생성된 올리고뉴클레오티드는 80% 아세트산으로 절단되어 3'-인산화된 올리고뉴클레오티드를 생성할 수 있다.
다른 실시형태에서, 절단가능한 연결 모이어티는 오르토-니트로벤질 광절단가능한 링커와 같은 광절단가능한 링커일 수 있다. 고체 지지체 상의 광불안정성 올리고뉴클레오티드의 합성 및 절단 조건은, 예를 들어, 다음 문헌에 기재되어 있다: Venkatesan et al., J. Org. Chem. 61:525-529 (1996), Kahl et al., J. Org. Chem. 64:507-510 (1999), Kahl et al., J. Org. Chem. 63:4870-4871 (1998), Greenberg et al., J. Org. Chem. 59:746-753 (1994), Holmes et al., J. Org. Chem. 62:2370-2380 (1997), 및 미국 특허 제5,739,386호. 하이드록시메틸, 하이드록시에틸, 및 Fmoc-아미노에틸 카르복실산 링커와 같은 오르토-니트로벤질-기반 링커도 상업적으로 획득할 수 있다.
임의의 양태의 일부 실시형태에서, 각각의 판독 분자는 광학적으로 검출가능한 라벨을 포함한다. 임의의 양태의 일부 실시형태에서, 표적 분자, 예를 들어, DNA 표적 분자, RNA 표적 분자, 또는 폴리펩티드 표적 분자의 측정, 및/또는 검출은 대상체로부터 얻은 샘플을 본 명세서에 기술된 것과 같은 시약 또는 시약들과 접촉시키는 단계를 포함한다. 임의의 양태의 일부 실시형태에서, 시약은 검출가능하게 라벨된다. 임의의 양태의 일부 실시형태에서, 시약은 검출가능한 신호를 생성할 수 있다. 임의의 양태의 일부 실시형태에서, 시약은 표적 분자가 존재할 때 검출가능한 신호를 생성한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 시약 중 하나 이상은 검출가능한 라벨을 포함할 수 있고/있거나 (예를 들어, 화합물을 검출가능한 생성물로 전환시키는 촉매 반응에 의해) 검출가능한 신호를 생성하는 활성을 포함할 수 있다. 검출가능한 라벨은, 예를 들어, 광-흡수 염료, 형광 염료, 또는 방사성 라벨을 포함할 수 있다. 검출가능한 라벨, 이를 검출하는 방법, 및 본 명세서에 기술된 시약에 이들을 혼입하는 방법은 당업계에 잘 알려져 있다.
임의의 양태의 일부 실시형태에서, 검출가능한 라벨, 분자 및/또는 모이어티는 분광학적, 광화학적, 생화학적, 면역화학적, 전자기적, 방사선화학적, 또는 화학적 수단, 예컨대 형광, 화학형광, 또는 화학발광, 또는 기타 적절한 수단에 의해 검출될 수 있는 것을 포함할 수 있다. 본 명세서에 기술된 방법에 사용된 검출가능한 라벨은 1차 라벨(여기서 라벨은 직접적으로 검출가능하거나 직접적으로 검출가능한 모이어티를 생성하는 모이어티를 포함함) 또는 2차 라벨(여기서 검출가능한 라벨은 다른 모이어티에 결합하여 검출가능한 신호를 생성하며, 예를 들어, 2차 및 3차 항체를 사용한 면역학적 라벨에서 흔히 볼 수 있는 것과 같음)일 수 있다. 검출 가능한 라벨은 공유 또는 비공유 수단에 의해 시약에 연결될 수 있다. 대안적으로, 검출가능한 라벨은 리간드-수용체 결합 쌍 배열 또는 다른 이러한 특이적 인식 분자를 통해 시약에 대한 결합을 달성하는 분자를 직접 라벨함으로써 연결될 수 있다. 검출가능한 라벨은, 이로만 제한되는 것은 아니지만, 방사성 동위원소, 생물발광 화합물, 발색단, 항체, 화학발광 화합물, 형광 화합물, 금속 킬레이트, 및 효소를 포함할 수 있다.
다른 실시형태에서, 검출 시약은 형광성 화합물이 있는 라벨이다. 형광적으로 라벨링된 시약이 적절한 파장의 빛에 노출되면, 형광으로 인해 그 존재를 감지할 수 있다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은 형광 염료 분자, 또는 이로만 제한되는 것은 아니지만, 플루오레세인, 피코에리트린, 피코시아닌, o-프탈알데히드, 플루오레스카민, Cy3™, Cy5™, 알로피코시아닌, 텍사스 레드, 페리디닌 클로로필, 시아닌, 피코에리쓰린(phycoerythrin)-Cy5™, 녹색 형광 단백질, 로다민, 플루오레세인 이소티오시아네이트(FITC) 및 오레곤 그린(Oregon Green)™과 같은 탠덤 접합체, 로다민 및 유도체(예를 들어, 텍사스 레드 및 테트라로디민 이소티오시아네이트(TRITC)), 비오틴, AMCA, CyDyes™,, 6-카르복시플루오레세인(일반적으로 약어 FAM 및 F로 알려짐), 6-카르복시-2',4',7',4,7-헥사클로로플루오레세인(HEX), 6-카르복시-4',5'-디클로로-2',7'-디메톡시플루오레세인(JOE 또는 J), N,N,N',N'-테트라메틸-6카르복시로다민(TAMRA 또는 T), 6-카르복시-X-로다민(ROX 또는 R), 5-카르복시로다민-6G(R6G5) 또는 G5), 6-카르복시로다민-6G(R6G6 또는 G6), 및 로다민 110; 시아닌 염료, 예를 들어, Cy3, Cy5 및 Cy7 염료; 쿠마린, 예를 들어, 움벨리페론; 벤즈이미드 염료, 예를 들어, 훽스트(Hoechst) 33258; 페난트리딘 염료, 예를 들어, 텍사스 레드; 에티듐 염료; 아크리딘 염료; 카바졸 염료; 페녹사진 염료; 포르피린 염료; 폴리메틴 염료, 예를 들어, Cy3, Cy5 등과 같은 시아닌 염료; BODIPY 염료 및 퀴놀린 염료를 포함하는, 형광단일 수 있다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은, 이로만 제한되는 것은 아니지만, 3H, 125I, 35S, 14C, 32P, 및 33P를 포함하는 방사성 라벨일 수 있다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은, 이로만 제한되는 것은 아니지만, 양고추냉이 퍼옥시다제 및 알칼리성 포스파타제를 포함하는 효소일 수 있다. 효소 라벨은, 예를 들어, 화학발광 신호, 색상 신호 또는 형광 신호를 생성할 수 있다. 항체 시약을 검출가능하게 라벨하기 위해 사용되는 것으로 고려되는 효소는, 이로만 제한되는 것은 아니지만, 말산 탈수소효소, 포도상구균 뉴클레이즈, 델타-V-스테로이드 이성질화효소, 효모 알코올 탈수소효소, 알파-글리세로포스페이트 탈수소효소, 트리오스 포스페이트 이성질화효소, 양고추냉이 퍼옥시다제, 알칼리성 포스파타제, 아스파라기나제, 글루코스 옥시다제, 베타-갈락토시다제, 리보뉴클레이즈, 우레아제, 카탈라제, 글루코스-VI-포스페이트 탈수소효소, 글루코아밀라제 및 아세틸콜린에스테라제를 포함한다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은, 이로만 제한되는 것은 아니지만, 루시게닌, 루미놀, 루시페린, 이소루미놀, 테마릭 아크리디늄 에스테르, 이미다졸, 아크리디늄 염 및 옥살레이트 에스테르를 포함하는 화학발광성 라벨이다. 임의의 양태의 일부 실시형태에서, 검출가능한 라벨은, 이로만 제한되는 것은 아니지만, 콜로이드성 금 또는 착색 유리 또는 플라스틱(예를 들어, 폴리스티렌, 폴리프로필렌, 및 라텍스) 비드를 포함하는 스펙트럼 비색 라벨일 수 있다.
임의의 양태의 일부 실시형태에서, 검출 시약은 또한 c-Myc, HA, VSV-G, HSV, FLAG, V5, HIS, 또는 비오틴과 같은 검출가능한 태그로 라벨링될 수 있다. 다른 검출 시스템, 예를 들어, 비오틴-스트렙타비딘 시스템도 사용할 수 있다. 이 시스템에서, 관심 있는 바이오마커와 면역반응성(즉, 특이적)인 항체는 비오틴화된다. 바이오마커에 결합된 비오틴화된 항체의 양은 스트렙타비딘-퍼옥시다제 접합체 및 발색 기질을 사용하여 결정된다. 이러한 스트렙타비딘 퍼옥시다제 검출 키트는 상업적으로, 예를 들어, DAKO(Carpinteria, CA)에서 입수가능하다. 시약은 또한 152Eu 또는 란탄족 계열의 다른 금속과 같은 형광 방출 금속을 사용하여 검출가능하게 라벨링될 수 있다. 이러한 금속은 디에틸렌트리아민펜타아세트산(DTPA) 또는 에틸렌디아민테트라아세트산(EDTA)과 같은 금속 킬레이트 그룹을 사용하여 시약에 부착될 수 있다.
사용된 검출 방법(들)은 판독 분자에 사용된 특정 검출 가능한 라벨에 따라 달라질 수 있다. 특정 예시적인 실시형태에서, 하나 이상의 올리고뉴클레오티드 태그(예를 들어, 올리고페인트) 및/또는 이에 결합된 판독 분자를 갖는 염색체 및/또는 염색체 영역은 현미경, 분광 광도계, 튜브 발광계 또는 플레이트 발광계, x-선 필름, 신틸레이터, 형광 활성화 세포 분류(FACS) 장치, 미세 유체 장치 등을 사용하기 위해 선택 및/또는 스크리닝될 수 있다.
임의의 양태의 일부 실시형태에서, 검출가능한 분자는 형광단 또는 형광 화합물을 포함한다. 형광 측정을 위한 시스템 및 장치는 당업계에 잘 알려져 있다. 형광 측정은 적절한 흡수 또는 여기 파장을 포함하는 빛을 방출하는 광원을 필요로 한다. 본 명세서에 기술된 화합물의 흡수 또는 여기 파장은 대략 300 내지 800 nm이다. 임의의 양태의 일부 실시형태에서, 광원은 300 내지 870 nm의 파장을 포함하거나, 본질적으로 이루어지거나, 이로 이루어진 광을 방출한다. 빛은 샘플과 접촉하여 샘플 내의 특정 물질(형광단이라고도 함)의 전자를 여기시키고, 물질이 형광 형태로 빛(발광)을 방출하도록 유발한다.
형광 측정을 위한 시스템 또는 디바이스는 이후 방출된 빛을 검출한다. 일부 실시형태에서, 시스템 또는 디바이스는 원하는 파장의 광만이 시스템 또는 장치의 검출기에 도달하도록 필터 또는 모노크로메이터를 포함할 수 있다. 임의의 양태의 일부 실시형태에서, 시스템 또는 디바이스는 300-800 nm의 파장을 포함하거나, 본질적으로 구성되거나, 이로 구성된 광을 검출하도록 구성된다. 임의의 양태의 일부 실시형태에서, 시스템 또는 디바이스는 300-800 nm의 파장을 포함하거나, 본질적으로 구성되거나, 이로 구성된 광을 검출하도록 구성된다. 적합한 시스템 및 디바이스는 상업적으로 이용이능하며, 예를 들어, CRAIC(San Dimas, CA)의 20/30 PV™ Microspectrometer 또는 508 PV™ Microscope Spectrometer, Duetta™, FluoroMax™, Fluorolog™, QuantaMaster 8000™, DeltaFlex™, DeltaPro, 또는 Horiba(Irvine, CA)의 Nanolog™, 또는 SP8 Lightning™, SP8 Falcon™, SP8 Dive™, TCS SPE™, HCS A™, 또는 Leica(Buffalo Grove, IL)의 TCS SP8 X™ 을 포함할 수 있다.
임의의 양태의 일부 실시형태에서, 형광 현미경법을 사용하여 당업계에 공지된 일상적인 방법을 사용하여 제자리 혼성화의 결과를 검출하고 기록할 수 있다. 대안적으로, 이미지-처리 기능이 있는 디지털(컴퓨터 구현) 형광 현미경을 사용할 수 있다. 복수의 컬러 라벨이 결합된 염색체의 FISH를 이미지화하기 위한 2개의 잘 알려진 시스템은 다중(multiplex)-FISH(M-FISH) 및 스펙트럼 핵형 분석(SKY)을 포함한다. 다음 문헌 참조: Schrock et al. (1996) Science 273:494; Roberts et al. (1999) Genes Chrom. Cancer 25:241; Fransz et al. (2002) Proc. Natl. Acad. Sci. USA 99:14584; Bayani et al. (2004) Curr. Protocol. Cell Biol. 22.5.1-22.5.25; Danilova et al. (2008) Chromosoma 117:345; 미국 특허 제6,066,459호; 및 염색체 페인팅 및 페인팅된 염색체 검출을 위한 방법에 대한 리뷰를 위한 FISH TAG™ DNA 멀티컬러 키트 사용설명서(Molecular probes).
특정 예시적인 실시형태에서, 형광 라벨된 염색체의 이미지는 변형(예를 들어, 소프트웨어, Chroma 84000 필터 세트 및 향상된 필터 휠)이 있는 Applied Imaging Corporation CytoVision™ System과 같은 컴퓨터 이미징 시스템을 사용하여 검출 및 기록된다. 다른 적절한 시스템은 문헌[Ried et al. (1992) Proc. Natl. Acad. Sci. USA 89:1388]에 의해 기재된 대로 처리된 이미지가 있는, Zeiss Axiohot™ 현미경에 결합된 쿨드(cooled) CCD 카메라(Photometrics, Kodak™ KAF 1400 CCD가 장착된 NU200 시리즈)를 사용하는 컴퓨터 이미징 시스템을 포함한다. 다른 적절한 이미징 및 분석 시스템은 위의 문헌[Schrock et al. (전게서) 및 Speicher et al. (1996) Nature Genet. 12:368]에 설명되어 있다. 임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)는 초해상도 현미경(예를 들어, 확률적 광학 재구성 현미경 검사법(STORM) 이미지화)으로 시각화된다.
본 명세서에 기술된 제자리 혼성화 방법은 세포 주기의 임의의(또는 모든) 단계(들)(예를 들어, 유사분열, 감수분열, 간기, G0, G1, S 및/또는 G2)에 있는 세포에서, 다양한 생물학적 또는 임상적 샘플에 대해 수행될 수 있다. 예에는 모든 유형의 세포 배양물, 동물 또는 식물 조직, 말초 혈액 림프구, 협측 도말, 배양되지 않은 원발성 종양에서 제조된 접촉 제조물, 암세포, 골수, 생검에서 얻은 세포 또는 체액(예를 들어, 혈액, 소변, 가래 등) 중의 세포, 양수로부터의 세포, 모체 혈액으로부터의 세포(예를 들어, 태아 세포), 고환 및 난소로부터의 세포 등을 포함한다. 샘플은 통상적인 기술을 사용하여 본 발명의 분석을 위해 준비되며, 일반적으로 샘플 또는 표본이 채취되는 출처에 따라 달라진다. 이러한 예는 본 명세서에 기술된 방법 및/또는 조성물에 적용이능한 샘플 유형을 제한하는 것으로 해석되어서는 아니된다.
표적 염색체 서열에 대한 본 발명의 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)의 혼성화는 표준 제자리 혼성화(ISH) 기술에 의해 달성될 수 있다(예를 들어, 다음 문헌 참조: Gall and Pardue (1981) Meth. Enzymol. 21:470; Henderson (1982) Int. Review of Cytology 76:1). 일반적으로 ISH는 다음 주요 단계를 포함한다: (1) 검출하고자 하는 생물학적 구조의 고정(예를 들어, 염색체 스프레드), (2) 표적 DNA의 접근성을 증가시키기 위한 생물학적 구조의 사전 하이브리드화 처리(예를 들어, 열 또는 알칼리로의 변성), (3) (예를 들어, 반복 서열의 혼성화 능력을 차단함으로써) 비특이적 결합을 감소시키기 위한 선택적 사전-혼성화 처리, (4) 생물학적 구조 또는 조직의 핵산에 대한 핵산 혼합물의 혼성화; (5) 혼성화 시 결합되지 않은 핵산 단편을 제거하기 위한 혼성화 후 세척 및 (6) 혼성화된 라벨된 올리고뉴클레오티드(예를 들어, 혼성화된 올리고뉴클레오티드 태그, 예를 들어, 올리고페인트)의 검출. 이러한 각 단계에서 사용되는 시약과 이들의 사용 조건은 특정 상황에 따라 다르다. 예를 들어, 단계 3은 본 명세서에 기술된 인식 도메인이 반복적인 서열을 피하도록 설계될 수 있기 때문에 항상 필요한 것은 아니다). 혼성화 조건은 또한 미국 특허 제5,447,841호에 기재되어 있다. 제자리 혼성화 프로토콜 및 조건의 다양한 변형이 공지되어 있고 본 명세서에 제공된 지침에 따라 실시자에 의해 본 발명과 함께 사용될 수 있음이 이해될 것이다.
본 명세서에 사용된 용어 "혼성화(hybridization)"는 2개의 단일 가닥 폴리뉴클레오티드가 비공유적으로 결합하여 안정한 이중-가닥 폴리뉴클레오티드를 형성하는 과정을 지칭한다. 용어 "혼성화"는 또한 삼중-가닥 혼성화를 지칭할 수도 있다. 생성된 (일반적으로) 이중-가닥 폴리뉴클레오티드는 "하이브리드(hybrid)" 또는 "이중나선(duplex)"이다. "혼성화 조건(hybridization conditions)"은 일반적으로 약 1 M 미만, 보다 일반적으로 약 500 mM 미만, 훨씬 더 일반적으로 약 200 mM 미만의 염 농도를 포함할 것이다. 혼성화 온도는 5℃만큼 낮을 수 있지만, 전형적으로 22℃ 초과, 보다 전형적으로 약 30℃ 초과, 종종 약 37℃ 초과일 수 있다. 혼성화는 일반적으로 엄격한 조건, 즉, 프로브가 이의 표적 하위서열에 혼성화되는 조건 하에 수행된다. 엄격한 조건은 서열-의존적이며 상황에 따라 다르다. 더 긴 단편은 특이적 혼성화를 위해 더 높은 혼성화 온도가 필요할 수 있다. 염기 조성 및 상보적 가닥의 길이, 유기 용매의 존재 및 염기 불일치 정도를 비롯한, 다른 요인이 혼성화의 엄격성에 영향을 미칠 수 있으므로, 파라미터의 조합이 임의의 하나 단독의 절대 척도보다 더 중요하다. 일반적으로, 엄격한 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 Tm보다 약 5℃ 낮도록 선택된다. 예시적인 엄격한 조건은 pH 7.0 내지 8.3 및 적어도 25℃의 온도에서 적어도 0.01 M 내지 1 M 이하의 Na 이온 농도(또는 다른 염)의 염 농도를 포함한다. 예를 들어, 5×SSPE(750 mM NaCl, 50 mM Na 포스페이트, 5 mM EDTA, pH 7.4) 및 25-30℃의 온도의 조건이 대립유전자 특이적 프로브 혼성화에 적합하다. 엄격한 조건에 대해서는, 예를 들어, 다음 문헌 참조: Sambrook, Fritsche and Maniatis, Molecular Cloning A Laboratory Manual, 2nd Ed. Cold Spring Harbor Press (1989) and Anderson Nucleic Acid Hybridization, 1st Ed., BIOS Scientific Publishers Limited (1999). "에 특이적으로 혼성화하는(hybridizing specifically to)" 또는 "에 특이적으로 혼성화하는(specifically hybridizing to)" 또는 유사한 표현은 해당 서열이 복잡한 혼합물(예를 들어, 전체 세포) DNA 또는 RNA 중에 존재하는 경우 엄격한 조건 하에서 특정 뉴클레오티드 서열 또는 서열들에 실질적으로 또는 이에만 결합, 이중나선화, 또는 혼성화하는 것을 지칭한다.
본 명세서에 사용된 용어 "특이적 결합"은 2개의 분자, 화합물, 세포 및/또는 입자 사이의 화학적 상호작용을 지칭하며, 여기서 제1 엔티티는 비-표적 제3 엔티티에 결합하는 것에 비해 더 큰 특이성 및 친화도로 제2, 표적 엔티티에 결합한다. 일부 실시양태에서, 특이적 결합은 제2 표적 엔티티에 대한 제1 엔티티의 친화도를 지칭할 수 있으며, 이는 제3의 비-표적 엔티티에 대한 친화도에 비해 적어도 10배, 적어도 50배, 적어도 100배, 적어도 500배, 적어도 1000배 또는 그 이상이다. 주어진 표적에 대해 특이적인 시약은 이용되는 분석 조건 하에서 해당 표적에 대한 특이적 결합을 나타내는 것이다.
본 명세서에 사용된 용어 "올리고뉴클레오티드(oligonucleotide)"는 일반적으로 합성 수단에 의해 제조된, 단일-가닥 DNA 또는 RNA 분자를 포함하는 것으로 의도되지만, 이에 제한되는 것은 아니다. 본 발명의 뉴클레오티드는 전형적으로 아데노신, 구아노신, 우리딘, 시티딘 및 티미딘으로부터 유래된 뉴클레오티드와 같은 자연 발생 뉴클레오티드일 것이다. 올리고뉴클레오티드가 "이중-가닥(double-stranded)"으로 언급되는 경우, 한 쌍의 올리고뉴클레오티드가, 예를 들어, DNA와 전형적으로 결합된 수소 결합된 나선 어레이에 존재한다는 것이 당업자에 의해 이해된다. 이중-가닥 올리고뉴클레오티드의 100% 상보적 형태에 추가하여, 본 명세서에 사용된 용어 "이중-가닥"은 벌지(bulges) 및 루프(loops)와 같은 구조적 특징을 포함하는 형태도 포함하는 것을 의미한다(본 명세서에 그 전문이 모든 목적을 위해 참조로 통합되는, 문헌[Stryer, Biochemistry, Third Ed. (1988)] 참조). 본 명세서에 사용된 용어 "폴리뉴클레오티드(polynucleotide)"는 (예를 들어, 혼성화, 라이게이션, 중합 등에 의해) 함께 연결된 2개 이상의 올리고뉴클레오티드를 포함하는 것으로 의도되지만, 이로만 제한되는 것은 아니다.
핵산 및 리보핵산(RNA) 분자는, 당업계에 잘 알려진, 다수의 절차 중 임의의 것을 사용하여 특정 생물학적 시료에서 분리할 수 있으며, 특정 분리 절차는 특정 생물학적 시료에 적합하도록 선택된다. 예를 들어, 동결-해동 및 알칼리 용해 절차는 고체 물질로부터 핵산 분자를 얻는 데 유용할 수 있고; 열 및 알칼리 용해 절차는 소변에서 핵산 분자를 얻는 데 유용할 수 있고; 단백질분해효소 K 추출은 혈액으로부터 핵산을 얻는 데 사용될 수 있다(Roiff, A et al. PCR: Clinical Diagnostics and Research, Springer (1994)).
특정 예시적인 실시형태에서, 범용 프라이머를 사용하여, 예를 들어, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)와 같은 핵산 서열을 증폭할 수 있다. 용어 "범용 프라이머(universal primers)"는 복수의 폴리뉴클레오티드의 사슬 연장/증폭에 사용될 수 있는 프라이머 세트(예를 들어, 정방향 및 역방향 프라이머)를 지칭하며, 예를 들어, 프라이머는 복수의 폴리뉴클레오티드에 공통적인 부위에 혼성화한다. 예를 들어, 범용 프라이머는 단일 풀에서 모든, 또는 본질적으로 모든 폴리뉴클레오티드의 증폭에 사용될 수 있다. 임의의 양태의 일부 실시형태에서, 정방향 프라이머 및 역방향 프라이머는 동일한 서열을 갖는다. 임의의 양태의 일부 실시형태에서, 정방향 프라이머의 서열은 역방향 프라이머의 서열과 상이하다. 또 다른 양태에서, 복수의 범용 프라이머, 예를 들어, 수십개, 수백개, 수천개 또는 그 이상의 것이 제공된다.
임의의 양태의 일부 실시형태에서, 범용 프라이머는 효소적 또는 화학적 절단을 통한 증폭 후에 제거될 수 있는 임시적인 프라이머일 수 있다. 임의의 양태의 일부 실시형태에서, 범용 프라이머는 효소적 또는 화학적 절단을 통한 증폭 후에 제거될 수 있는 임시적인 프라이머일 수 있다. 다른 실시형태에서, 범용 프라이머는 사슬 연장 시 폴리뉴클레오티드 분자에 통합되는 변형을 포함할 수 있다. 예시적인 변형은, 예를 들어, 3' 또는 5' 말단 캡, 라벨(예를 들어, 플루오레세인), 또는 태그(예를 들어, 비오틴 등과 같은 폴리뉴클레오티드의 고정화 또는 단리를 용이하게 하는 태그)를 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 개시된 방법은, 예를 들어, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)를 포함하는 올리고뉴클레오티드 서열의 증폭을 포함한다. 증폭 방법은 혼성화 및 사슬 연장을 촉진하는 조건 하에서 핵산에 특이적으로 혼성화하는 하나 이상의 프라이머(예를 들어, 범용 프라이머)와 핵산을 접촉시키는 단계를 포함할 수 있다. 핵산 증폭을 위한 예시적인 방법은 중합효소 연쇄 반응(PCR)(예를 들어, Mullis et al. (1986) Cold Spring Harb. Symp. Quant. Biol. 51 Pt 1:263 and Cleary et al. (2004) Nature Methods 1:241; 및 미국 특허 제4,683,195호 및 제4,683,202호 참조), 앵커 PCR, RACE PCR, 라이게이션 연쇄 반응(LCR)(예를 들어, Landegran et al.(1988) Science 241:1077-1080; 및 Nakazawa et al. al.(1994) Proc. Natl. Acad. Sci. USA 91:360-364), 자가 지속 서열 복제(Guatelli et al. (1990) Proc. Natl. Acad. Sci. USA 87:1874), 전사 증폭 시스템(Kwoh et al.(1989) Proc. Natl. Acad. Sci. USA 86:1173), Q-베타 복제효소(Lizardi et al.(1988) BioTechnology 6:1197), 재귀적(recursive) PCR(Jaffe et al.(2000) J. Biol. Chem. 275:2619, 및 Williams et al.(2002) J. Biol. Chem. 277:7790), 미국 특허 제6,391,544호, 제6,365,375호, 제6,294,323호, 제6,261,797호, 제6,124,090호 및 제5,612,199호에 기재된 증폭 방법, 또는 당업자에게 잘 알려진 기술을 사용하는 임의의 다른 핵산 증폭 방법을 포함한다. 예시적인 실시형태에서, 본 명세서에 개시된 방법은 PCR 증폭을 이용한다.
일반적으로, PCR 절차는 (i) 핵산 샘플 또는 라이브러리 내의 특정 유전자 또는 서열에 대한 프라이머의 서열-특이적 혼성화, (ii) 열안정성 DNA 중합효소를 사용한 어닐링, 신장, 및 변성, 및 (iii) 정확한 크기의 밴드에 대해 PCR 생성물을 스크리닝한다. 사용된 프라이머는 중합 개시를 제공하기에 충분한 길이와 적절한 서열의 올리고뉴클레오티드이며, 즉, 각 프라이머는 증폭될 게놈 좌위의 가닥에 상보적이도록 특별히 설계된다. 대안적인 실시형태에서, 본 명세서에 기술된 유전자 발현 생성물의 mRNA 수준은 역전사(RT) PCR 및 정량적 RT-PCR(QRT-PCR) 또는 실시간 PCR 방법에 의해 결정될 수 있다. RT-PCR 및 QRT-PCR 방법은 당업계에 잘 알려져 있다.
임의의 양태의 일부 실시형태에서, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)는 (예를 들어, PCR 및/또는 범용 프라이밍 영역을 통해) 반드시 증폭되지는 않는다. 임의의 양태의 일부 실시형태에서, 기재된 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)는 새로(de novo) 합성될 수 있고, "튜브로부터 바로" 사용할 수 있다. 올리고뉴클레오티드를 새롭 합성하는 방법은 당업자에게 잘 알려져 있다. 본 명세서에 사용된 "올리고뉴클레오티드 합성"은 정의된 화학 구조를 갖는 비교적 짧은 핵산 단편의 화학적 합성을 지칭한다. 비제한적인 예로서, 올리고뉴클레오티드 합성 방법은 포스포라미다이트 고상 합성, 포스포라미다이트 합성, 포스포디에스테르 합성, 포스포트리에스테르 합성, 또는 포스파이트 트리에스테르 합성을 포함한다. 예를 들어, 다음 문헌 참조: Beaucage et al. Tetrahedron Vol㎛e 48, Issue 12, 20 March 1992, Pages 2223-2311; Caruthers, J Biol Chem. 2013 Jan 11, 288(2):1420-7. 일부 실시형태에서, 각각의 올리고뉴클레오티드는 별도로 합성된다. 일부 실시형태에서, 전체 올리고뉴클레오티드 세트는 하나의 반응으로 합성된다. 일부 실시형태에서, 전체 올리고뉴클레오티드 세트의 서브세트는 하나의 반응으로 합성된다. 일부 실시형태에서, 전체 올리고뉴클레오티드 세트는 복수의, 개별 반응으로 합성된다. 일부 실시형태에서, 반응 생성물은, 원하는 올리고뉴클레오티드를 고순도로 수득하기 위해, 예를 들어, 고성능 액체 크로마토그래피(HPLC)에 의해 단리된다.
특정 예시적 실시형태에서, 키트가 제공된다. 본 명세서에 사용된 용어 "키트"는 올리고뉴클레오티드 태그(예를 들어, 올리고페인트), 판독 분자, 프라이머, 및/또는 본 명세서에 기술된 방법을 수행하기 위한 시약(예를 들어, 라이게이즈, 절단 제제)을 전달하기 위한 임의의 전달 시스템을 지칭한다. 분석과 관련하여, 이러한 키트는 반응 시약(예를 들어, 올리고뉴클레오티드 태그, 판독 분자, 프라이머(예를 들어, 존재하는 모든 올리고뉴클레오티드 태그에 특이적인 프라이머 및/또는 올리고뉴클레오티드 태그 서열의 하나 이상의 서브세트에 특이적인 프라이머의 하나 이상의 서브세트), 하나 이상의 검출 및/또는 검색가능한 라벨이 결합된 올리고뉴클레오티드), 올리고뉴클레오티드가 결합된 지지체(예를 들어, 마이크로어레이, 암레트 등), 또는 기타의 것 중 하나 이상을 제공하는 인클로저) 및/또는 지원 재료(예를 들어, 완충액, 본 명세서에 기술된 분석을 수행하기 위한 서면 지침, 또는 기타의 것을 제공하는 인클로저)를 한 위치에서 다른 위치로의 저장, 이송, 또는 전달을 가능케 하는 시스템을 포함한다. 예를 들어, 키트는 관련 반응 시약 및/또는 본 명세서에 기술된 분석을 위한 지원 재료를 포함하는 하나 이상의 인클로저(예를 들어, 상자)를 포함한다. 한 양태에서, 본 발명의 키트는 하나 이상의 표적 뉴클레오티드 서열(예를 들어, 염색체) 또는 하나 이상의 표적 뉴클레오티드 서열의 하나 이상의 영역(예를 들어, 서브염색체 영역)에 특이적인 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)를 포함한다. 한 양태에서, 본 발명의 키트는 하나 이상의 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)에 특이적인 판독 분자를 포함한다. 또 다른 양태에서, 키트는 하나 이상의 프라이머 서열, 그에 부착된 복수의 합성 올리고뉴클레오티드 서열을 갖는 하나 이상의 지지체, 및 하나 이상의 검출가능 및/또는 회수가능한 라벨을 포함한다. 이러한 내용물은 의도된 수령자에게 함께 또는 개별적으로 전달될 수 있다. 예를 들어, 제1 용기는 분석에 사용하기 위한 프라이머 서열을 포함할 수 있는 반면, 제2 용기는 복수의 합성 올리고뉴클레오티드 서열이 부착된 지지체를 포함할 수 있다.
임의의 양태의 일부 실시형태에서, 키트는 이에 결합된 복수의 특정 올리고뉴클레오티드 서열(예를 들어, 올리고뉴클레오티드 태그(예를 들어, 올리고페인트) 및/또는 판독 분자)을 갖는 하나 이상의 어레이 및/또는 암레트를 제공한다. 임의의 양태의 일부 실시형태에서, 어레이 및/또는 암레트는 게놈(예를 들어, 인간 게놈)에서 결합 패턴 세트에 특이적인 복수의 올리고뉴클레오티드 태그 서열(예를 들어, 올리고페인트)을 제공한다. 임의의 양태의 일부 실시형태에서, 어레이 또는 암레트는 본 명세서에 기술된 하나 이상의 장애와 관련된 소정 세트의 염색체 이상(예를 들어, 전위, 삽입, 역위, 결실, 중복, 전위, 이수성, 배수성, 복합 재배열 및 텔로미어 손실)에 특이적이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 키트는 (예를 들어, 환자 진단 및/또는 예후, 산전 진단 및/또는 예후 등을 위한) 임상 환경(예를 들어, 병원, 의료 클리닉, 진료소, 진단 실험실, 연구 실험실 등)에서 본 명세서에 기술된 하나 이상의 장애를 검출하기 위한 진단 및/또는 예후 용도에 특히 적합하다.
임의의 양태의 일부 실시형태에서, 키트는 키트에 제공된 복수의 특정 올리고뉴클레오티드 태그 서열(예를 들어, 올리고페인트)을 증폭하기 위한 지침을 제공한다. 임의의 양태의 일부 실시형태에서, 키트는 증폭된 올리고뉴클레오티드 태그(예를 들어, 올리고페인트)를 사용하여 하나 이상의 표적 핵산 서열(예를 들어, 하나 이상의 염색체 또는 하위 염색체 영역)을 검출가능하고/하거나 추적가능하게 라벨하기 위한 지침을 제공한다. 임의의 양태의 일부 실시형태에서, 키트는 올리고뉴클레오티드 태그(예를 들어, 올리고페인트) 및 판독 분자를 사용하여 하나 이상의 표적 핵산 서열(예를 들어, 하나 이상의 염색체 또는 서브염색체 영역)을 검출가능하게 및/또는 추적가능하게 라벨하기 위한 지침을 제공한다. 임의의 양태의 일부 실시형태에서, 키트는 제거하길 원하는 하나 이상의 올리고뉴클레오티드 서열에 혼성화하는 하나 이상의 비라벨된 증폭 프라이머를 포함함으로써 증폭 단계 동안 하나 이상의 복수의 특정 올리고뉴클레오티드 태그 서열(예를 들어, 올리고페인트)를 효과적으로 제거하기 위한 지침을 제공하여, 하나 이상의 표적 핵산 서열이 검출가능하게 및/또는 추적가능하게 라벨되지 않도록 한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 시스템 및 방법은 임의의 유형의 하드웨어 및/또는 소프트웨어로 구현될 수 있고, 사전-프로그래밍된 범용 컴퓨팅 디바이스일 수 있다. 예를 들어, 시스템은 서버, 개인용 컴퓨터, 휴대용 컴퓨터, 씬 클라이언트(thin client), 또는 임의의 적절한 디바이스 또는 디바이스들을 사용하여 구현될 수 있다. 본 개시내용 및/또는 이의 구성요소는 단일 위치에 있는 단일 디바이스일 수 있거나, 또는 무선 방식으로 또는 전기 케이블, 광섬유 케이블과 같은 임의의 통신 매체를 통해 임의의 적절한 통신 프로토콜을 사용하여 함께 연결된 단일 또는 복수의 위치에 있는 복수의 디바이스일 수 있다.
또한 본 개시내용은 특정 기능을 수행하는 복수의 모듈을 갖는 것으로 본 명세서에서 설명되고 논의된다는 점에 유의해야 한다. 이러한 모듈은 명확성을 위한 목적으로만 기능을 기반으로 개략적으로 설명되어 있으며, 반드시 특정 하드웨어 또는 소프트웨어를 나타내는 것은 아님을 이해해야 한다. 이와 관련하여, 이들 모듈은 논의된 특정 기능을 실질적으로 수행하도록 구현된 하드웨어 및/또는 소프트웨어일 수 있다. 또한, 모듈은 본 개시 내에서 함께 결합되거나, 또는 원하는 특정 기능에 기초하여 추가 모듈로 분할될 수 있다. 따라서, 본 개시는 본 발명을 제한하는 것으로 해석되지 않아야 하며, 단지 하나의 예시적인 실시형태를 제시하는 것으로 이해되어야 한다.
컴퓨팅 시스템은 클라이언트 및 서버를 포함할 수 있다. 클라이언트와 서버는 일반적으로 서로 멀리 떨어져 있으며 일반적으로 통신 네트워크를 통해 상호작용한다. 클라이언트와 서버의 관계는 각각의 컴퓨터에서 실행되고 서로 클라이언트-서버 관계를 갖는 컴퓨터 프로그램 덕분에 발생한다. 일부 실시형태에서, 서버는 (예를 들어, 클라이언트 디바이스에 데이터를 표시하고 클라이언트 디바이스와 상호작용하는 사용자로부터 사용자 입력을 수신하기 위한 목적으로) 데이터(예를 들어, HTML 페이지)를 클라이언트 디바이스로 전송한다. 클라이언트 디바이스에서 생성된 데이터(예를 들어, 사용자 상호작용의 결과)는 서버에서 클라이언트 디바이스로부터 수신될 수 있다.
본 명세서에 기술된 발명 주제의 구현은, 예를 들어, 데이타 서버로서, 백엔드 구성요소를 포함하거나, 미들웨어 구성요소, 예를 들어, 애플리케이션 서버를 포함하거나, 또는 프론트 엔드 구성요소, 예를 들어, 사용자가 본 명세서에 기술된 발명 주제의 구현과 상호 작용할 수 있는 그래픽 사용자 인터페이스 또는 웹 브라우저가 있는 클라이언트 컴퓨터, 또는 하나 이상의 이러한 백엔드, 미들웨어, 또는 프런트 엔드 구성 요소의 임의의 조합을 포함하는 컴퓨팅 시스템에서 구현될 수 있다. 시스템의 구성요소는 디지털 데이터 통신의 임의의 형태 또는 매체, 예를 들어, 통신 네트워크에 의해 상호 연결될 수 있다. 통신 네트워크의 예는 근거리 통신망("LAN") 및 광역 통신망("WAN"), 상호-네트워크(예를 들어, 인터넷) 및 피어-투-피어 네트워크(예를 들어, 애드 호크 피어-투-피어 네트워크).
본 명세서에 기술된 발명 주제 및 동작의 구현은 본 명세서에 개시된 구조 및 이들의 구조적 등가물을 포함하는, 디지털 전자 회로, 또는 컴퓨터 소프트웨어, 펌웨어 또는 하드웨어에서, 또는 이들의 하나 이상의 조합으로 구현될 수 있다. 본 명세서에 기술된 발명 주제의 구현은 하나 이상의 컴퓨터 프로그램, 즉, 데이터 처리 장치에 의한 실행을 위해, 또는 이의 동작을 제어하기 위해 컴퓨터 저장 매체에 코딩된, 컴퓨터 프로그램 명령의 하나 이상의 모듈로 구현될 수 있다. 대안적으로 또는 추가로, 프로그램 명령은 인공적으로 생성된 전파 신호, 예를 들어, 데이터 처리 장치에 의한 실행을 위해 적절한 수신기 장치로 전송하기 위한 정보를 코딩하도록 생성된 머신-생성 전기적, 광학적 또는 전자기적 신호에 코딩될 수 있다. 컴퓨터 저장 매체는 컴퓨터-판독가능 저장 장치, 컴퓨터-판독가능 저장 기판(substrate), 랜덤 또는 직렬 액세스 메모리 어레이 또는 디바이스, 또는 이들 중 하나 이상의 조합일 수 있거나, 또는 이에 포함될 수 있다. 더욱이, 컴퓨터 저장 매체는 전파 신호가 아니지만, 컴퓨터 저장 매체는 인위적으로 생성된 전파 신호로 코딩된 컴퓨터 프로그램 명령의 소스 또는 목적지가 될 수 있다. 컴퓨터 저장 매체는 또한 하나 이상의 개별 물리적 구성요소 또는 매체(예를 들어, 복수의 CD, 디스크 또는 기타 저장 장치)일 수 있거나, 또는 이에 포함될 수 있다.
본 명세서에 기술된 동작은 하나 이상의 컴퓨터 판독가능 저장 장치에 저장되거나 다른 소스로부터 수신된 데이터에 대해 "데이터 처리 장치(data processing apparatus)"에 의해 수행되는 동작으로 구현될 수 있다.
"데이터 처리 장치"라는 용어는, 예를 들어, 프로그래밍가능한 프로세서, 컴퓨터, 시스템 온 칩, 또는 상기한 것들의, 여러가지, 또는 이들의 조합을 포함하는, 모든 종류의 데이터 처리용 장치, 디바이스, 및 머신을 포괄한다. 장치는 특수 목적 논리 회로, 예를 들어, FPGA(필드 프로그래밍가능한 게이트 어레이) 또는 ASIC(특정 용도용 집적 회로)을 포함할 수 있다. 장치는 또한 하드웨어 외에, 문제의 컴퓨터 프로그램에 대한 실행 환경을 생성하는 코드, 예를 들어, 프로세서 펌웨어, 프로토콜 스택, 데이터베이스 관리 시스템, 운영 체제, 플랫폼 간 런타임 환경, 가상 머신, 또는 이들 중 하나 이상의 조합을 구성하는 코드를 포함할 수 있다. 장치 및 실행 환경은 웹 서비스, 분산 컴퓨팅 및 그리드 컴퓨팅 인프라스트럭처와 같은, 다양한 다른 컴퓨팅 모델 인프라스트럭처를 실현할 수 있다.
컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 애플리케이션, 스크립트, 또는 코드로도 알려짐)은 컴파일 또는 해석된 언어, 선언적 또는 절차적 언어를 포함하는 임의의 형태의 프로그래밍 언어로 작성될 수 있으며, 독립 실행형 프로그램 또는 모듈, 구성요소, 서브루틴, 개체, 또는 컴퓨팅 환경에서 사용하기에 적합한 기타 유닛을 포함하는, 임의의 형태로 배포될 수 있다. 컴퓨터 프로그램은 파일 시스템의 파일에 대응할 수 있지만 반드시 그런 것은 아니다. 프로그램은 다른 프로그램이나 데이터(예를 들어, 마크업(markup) 언어 문서에 저장된 하나 이상의 스크립트)를 보유하는 파일의 일부, 해당 프로그램 전용 단일 파일, 또는 복수의 조정된 파일(예를 들어, 하나 이상의 모듈, 하위 프로그램 또는 코드 부분을 저장하는 파일)에 저장될 수 있다. 컴퓨터 프로그램은 하나의 컴퓨터 또는 한 사이트에 있거나 여러 사이트에 분산되어 있고 통신 네트워크로 상호연결된 복수의 컴퓨터에서 실행되도록 배포될 수 있다.
본 명세서에 기술된 프로세스 및 논리 흐름은 입력 데이터에 대해 동작하고 아웃풋을 생성함으로써 동작을 수행하기 위해 하나 이상의 컴퓨터 프로그램을 실행하는 하나 이상의 프로그래밍가능한 프로세서에 의해 수행될 수 있다. 프로세스 및 논리 흐름은 특수 목적 논리 회로, 예를 들어, FPGA(필드 프로그래밍가능한 게이트 어레이) 또는 ASIC(특정 용도용 집적 회로)에 의해 수행될 수 있고, 장치는 상기한 것으로 구현될 수도 있다.
컴퓨터 프로그램의 실행에 적합한 프로세서는, 예를 들어, 일반적 및 특수 목적 마이크로프로세서, 및 임의의 종류의 디지털 컴퓨터의 임의의 하나 이상의 프로세서를 포함한다. 일반적으로, 프로세서는 읽기 전용 메모리 또는 랜덤 액세스 메모리 또는 둘 다에서 명령과 데이터를 수신한다. 컴퓨터의 필수 요소는 명령에 따라 동작을 수행하기 위한 프로세서와 명령 및 데이터를 저장하기 위한 하나 이상의 메모리 디바이스이다. 일반적으로, 컴퓨터는 또한 데이터를 저장하기 위한 하나 이상의 대용량 저장 디바이스, 예를 들어, 자기, 광자기 디스크, 또는 광 디스크를 포함하거나, 또한 전술한 것으로부터 데이터를 수신하거나 이들로 데이터를 전송하거나, 둘 다를 하기 위해 작동가능하게 연결된다. 그러나, 컴퓨터는 이러한 장치를 필요로 하지 않는다. 또한, 컴퓨터는 다른 디바이스, 단지 몇 가지만 언급하면, 예를 들어, 이동 전화, 개인용 정보 단말기(PDA), 모바일 오디오 또는 비디오 플레이어, 게임 콘솔, GPS(Global Positioning System) 수신기, 또는 휴대용 저장 디바이스(예를 들어, USB(범용 직렬 버스) 플래시 드라이브)에 내장될 수 있다. 컴퓨터 프로그램 명령 및 데이터를 저장하기에 적합한 디바이스는 모든 형태의 비휘발성 메모리, 매체 및 메모리 디바이스를 포함하며, 일예로, 반도체 메모리 장치, 예를 들어, EPROM, EEPROM 및 플래시 메모리 디바이스; 자기 디스크, 예를 들어, 내부 하드 디스크 또는 이동식 디스크; 자기 광 디스크; 및 CD ROM 및 DVD-ROM 디스크를 포함한다. 프로세서와 메모리는 특수 목적 논리 회로에 의해 보완되거나, 또는 통합될 수 있다.
편의를 위해, 명세서, 실시예, 및 첨부된 청구범위에 사용된 일부 용어 및 문구의 의미는 아래에 제공된다. 달리 명시되지 않거나, 문맥에서 암시되지 않는 한, 다음 용어 및 문구에는 아래 제공된 의미가 포함된다. 정의는 특정 실시형태를 기술하는 데 도움을 주기 위해 제공되고, 청구된 발명을 제한하려는 의도가 아니며, 그 이유는 본 발명의 범위는 청구범위에 의해서만 제한되기 때문이다. 달리 정의되지 않는 한, 본 명세서에 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 해당 기술 분야에서 용어의 사용과 본 명세서에 제공된 정의 사이에 명백한 불일치가 있는 경우 명세서 내에서 제공된 정의가 우선한다.
편의를 위해, 명세서, 실시예 및 첨부된 청구범위에서, 본 명세서에 사용된 특정 용어는 여기에 모여있다.
본 명세서에 사용된 용어 "염색체"는 DNA, 단백질, RNA 및 기타 관련 인자를 포함하는 살아있는 세포에서 유전성(heredity)을 운반하는 유전자에 대한 지지체를 지칭한다. 인간 게놈의 염색체를 식별하고 넘버링하기 위한 통상적인 국제 시스템이 본 명세서에 사용된다. 개별 염색체의 크기는 복수-염색체 게놈 내에서 그리고 게놈마다 다를 수 있다. 염색체는 임의의 종에서 얻을 수 있다. 염색체는 성인 대상체, 청소년 대상체, 유아 대상체로부터, 태어나지 않은 대상체(예를 들어, 태아, 예를 들어, 양수천자, 융모막 융모 샘플링 등과 같은 산전 검사를 통해 또는 태아, 예를 들어 태아 수술 동안)로부터, 생물학적 샘플(예를 들어, 생물학적 조직, 체액 또는 세포(예를 들어, 가래, 혈액, 혈액 세포, 조직 또는 미세 바늘 생검 샘플, 소변, 뇌척수액, 복막액 및 흉수, 또는 이로부터의 세포), 또는 세포 배양 샘플(예를 들어, 1차 세포, 불멸화 세포, 부분 불멸화 세포 등)로부터 얻을 수 있다. 특정 예시적인 실시형태에서, 하나 이상의 염색체는, 이로만 제한되는 것은 아니지만, 호모(Homo), 드로소필라(Drosophila), 카이노하이브디티스(Caenorhabiditis), 다니오(Danio), 시피누스(Cyprinus), 에쿠스(Equus), 캐니스(Canis), 오비스(Ovis), 오코린쿠스(Ocorynchus), 살모(Salmo), 보스(Bos), 수스(Sus), 갈루스(Gallus), 솔라눔(Solan㎛), 트리티크(Tritic㎛), 오리자(Oryza), 제아(Zea), 호르데움(Horde㎛), 뮤사(Musa), 아베나(Avena), 포플러스(Populus), 브라시카(Brassica), 사카룸(Sacchar㎛) 등을 포함하는 하나 이상의 속으로부터 얻을 수 있다.
본 명세서에 사용된, 용어 "염색체 밴딩(chromosome banding)"은 개별 염색체 또는 염색체 영역(즉, "밴딩 패턴")에 특징적인, 구별가능한 (예를 들어, 다르게 또는 교대로 채색된) 영역의 가로(transverse) 밴드 패턴을 초래하는 염색체의 차별적 염색을 지칭한다. 기존의 밴딩 기법은 G-밴딩(김사 염색), Q-밴딩(퀴나크린 머스타드 염색), R-밴딩(리버스-김사) 및 C-밴딩(센트로미어 밴딩)을 포함한다.
본 명세서에 사용된 용어 "핵형(karyotype)"은 염색체의 수 및 형태 둘 다에 의해 정의되는 바와 같이, 주어진 종의 개별 세포, 세포주 또는 게놈의 염색체 특성을 지칭한다. 핵형은 전위(translocations), 삽입 전위, 역위, 결실, 중복, 전좌(transpositions), 이수성, 복합 재배열, 텔로미어 손실 등을 포함하나 이에 제한되지 않는 다양한 염색체 재배열을 지칭할 수 있다. 일반적으로, 핵형은 현미경 사진 또는 컴퓨터-생성 이미지에서 전기 또는 중기(또는 응축된) 염색체의 조직화된 어레이(systematized array)로 나타난다. 간기 염색체도 검사할 수 있다.
본 명세서에 사용된, 용어 "염색체 이상(chromosomal aberration)" 또는 "염색체 비정상(chromosome abnormality)"은 대상 염색체 또는 핵형의 구조와 정상(즉, 비-이상) 상동 염색체 또는 핵형 사이의 편차를 지칭한다. 편차는 단일 염기쌍 또는 많은 염기쌍일 수 있다. 염색체 또는 핵형을 언급할 때, 용어 "정상(normal)" 또는 "비-이상(non-aberrant)"은 특정 종 및 성별의 건강한 개체에서 발견되는 핵형 또는 밴딩 패턴을 나타낸다. 염색체 비정상은 본질적으로 수치적 또는 구조적인 것일 수 있으며, 이수성, 배수성, 역전, 전위, 결실, 중복 등을 포함하지만 이에 제한되는 것은 아니다. 염색체 비정상은 병리학적 상태의 존재 또는 병리학적 상태를 발전시키는 소인과 상관관계가 있을 수 있다. 염색체 이상 및/또는 비정상은 또한 질병, 장애 및/또는 표현형 변화와 관련이 없는 변화를 지칭할 수 있다. 이러한 이상 및/또는 비정상은 드물거나 낮은 빈도로 나타날 수 있다(예를 들어, 집단의 몇 퍼센트(예를 들어, 다형성)).
하나 이상의 염색체 비정상과 관련된 장애는, 이로만 제한되는 것은 아니지만, 상염색체 비정상(예를 들어, 삼염색체(다운 증후군(염색체 21)), 에드워드 증후군(염색체 18), 파타우 증후군(염색체 13), 삼염색체 9, 와카니 증후군(염색체 8), 삼염색체 22/고양이 눈 증후군, 삼염색체 16); 일염색체 및/또는 결실(월프-허쉬호른증후군 증후군(염색체 4), 크리 듀 샤(Cri du chat)/염색체 5q 결실 증후군(염색체 5), 윌리엄스 증후군(염색체 7), 야콥센(Jacobsen) 증후군(염색체 11), 밀러-디커 증후군/스미스-마제니스 증후군(염색체 17), 디 죠지 증후군(염색체 22), 게놈 각인(앙겔만 증후군/프레더-윌리 증후군(염색체 15))); X/Y-연관 이상(예를 들어, 일염색체(터너 증후군(XO), 삼염색체 또는 사염색체 및/또는 기타 핵형 또는 모자이크(클라인펠터 증후군(47(XXY)), 48(XXYY), 48(XXXY), 49(XXXYY), 49(XXXXY), 삼중 X 증후군(47(XXX)), 48(XXXX), 49(XXXXX), 47(XYY), 48(XYYY), 49(XYYYY), 46(XX/XY)); 전위(예를 들어, 백혈병 또는 림프종(예를 들어, 림프종(예를 들어, 버킷 림프종 t(8 MYC; 14 IGH)), 여포성 림프종 t(14 IGH; 18 BCL2), 외투 세포 림프종/다발성 골수종 t(11 CCND1; 14 IGH), 역형성 거대 세포 림프종 t(2 ALK; 5 NPM1), 급성 림프모구성 백혈병) 또는 골수성(예를 들어, 필라델피아 염색체 t(9 ABL; 22 BCR), 성숙을 동반한 급성 골수모구성 백혈병 t(8 RUNX1T1;21 RUNX1), 급성 전골수구성 백혈병 t(15 PML,17 RARA), 급성 거핵모구성 백혈병 t(1 RBM15;22 MKL1))) 또는 기타(예를 들어, 유잉 육종 t(11 FiI1; 22 EWS), 활액 육종 t(x SYT;18 SSX), 융기피부섬유육종(dermatofibrosarcoma protuberans) t(17 COL1A1; 22 PDGFB), 점액성 지방육종 t(12 DDIT3; 16 FUS), 결합조직형성 원형소세포 종양(desmoplastic small round cell t㎛or) t(11 WT1; 22 EWS), 폐포 횡문근육종 t(2 PAX3; 13 FOXO1) t(1 PAX7; 13 FOXO1))); 생식선 이형성증(예를 들어, 혼합 생식선 이형성증, XX 생식선 이형성증); 및 기타 비정상(예를 들어, 취약 X 증후군, 편부모 이염색체)를 포함한다. 하나 이상의 염색체 비정상과 관련된 장애는, 이로만 제한되는 것은 아니지만, 베크위드-위드만(Beckwith-Wiedmann) 증후군, 아가미-귀-신장(branchio-oto-renal) 증후군, 크리-듀-샤 증후군, 드 랑제(De Lange) 증후군, 전전뇌증(holoprosencephaly), 루빈스타인-테이비(Rubinstein-Taybi) 증후군 및 WAGR 증후군을 포함한다.
하나 이상의 염색체 이상과 관련된 장애는 또한 세포 증식 장애(예를 들어, 암)를 포함한다. 본 명세서에 사용된, 용어 "세포 증식성 장애"는 다세포 유기체에서 세포의 하나 이상의 서브세트(들)의 바람직하지 않거나 부적절한 증식을 특징으로 하는 장애를 포함한다. 용어 "암"은 다양한 유형의 악성 신생물을 말하며, 이들 중 대부분이 주변 조직을 침범할 수 있고, 다른 부위로 전이될 수 있다(예를 들어, PDR Medical Dictionary 1st edition, 1995 참조). 용어 "신생물" 및 "종양"은 정상보다 더 빠르게 세포 증식에 의해 성장하고 증식을 개시시킨 자극이 제거된 후에도 계속 성장하는 비정상 조직을 지칭한다(예를 들어, PDR Medical Dictionary 1st edition, 1995 참조). 이러한 비정상 조직은 양성(즉, 양성 종양) 또는 악성(즉, 악성 종양)일 수 있는 정상 조직과의 구조적 조직 및 기능적 조정이 부분적으로 또는 완전히 결여되어 있음을 보여준다.
하나 이상의 염색체 이상과 관련된 장애는 또한 청각 신경종, 후천적 뇌 손상, 알츠하이머병, 근위축성 측삭 질환, 동맥류, 실어증, 동정맥 기형, 주의력 결핍 과잉 행동 장애, 자폐증 바텐병, 베체트병, 안검경련, 뇌종양, 뇌성마비 샤르코-마리-투스병, 키아리(chiari) 기형, CIDP, 비-알츠하이머형 치매, 자율신경실조증, 난독증, 언어장애, 근긴장이상, 간질, 본태성 떨림, 프리드리히 운동실조(Friedrich's ataxia), 고셔병, 길랑-바레(Gullian-Barre) 증후군, 두통, 편두통, 헌팅턴병, 수두증, 메니에르병, 운동신경질환, 다발성 경화증, 근이영양증, 중증 근무력증(myasthenia gravis), 기면증, 파킨슨병, 말초신경병증, 진행성 핵상마비(progressive supranuclear palsy), 하지불안 증후군, 레트 증후군, 정신분열증, 샤이 드래거(Shy Drager) 증후군, 뇌졸중, 지주막하출혈, 시드넘 증후군(Sydenham's syndrome), 테이-삭스병(Tay-Sachs disease), 뚜렛 증후군, 일과성 허혈발작, 횡척수염(transverse myelitis), 삼차신경통, 결절경화증 및 폰 히펠린-다우 증후군(von Hippel-Lindau syndrome)을 포함하나 이에 제한되지 않는 뇌 장애를 포함한다.
용어 "감소하다(decrease)", "감소된(reduced)", "감소(reduction)" 또는 "억제하다(inhibit)"는 모두 통계적으로 유의한 양만큼 감소를 의미하기 위해 본 명세서에서 사용된다. 일부 실시형태에서, "감소되다(reduce)", "감소(reduction)" 또는 "감소하다(decrease)" 또는 "억제하다(inhibit)"는 일반적으로 참조 수준(예를 들어, 주어진 치료제 또는 작용제의 부재)과 비교하여, 적어도 10% 감소를 의미하고, 예를 들어, 적어도 약 10%, 적어도 약 20%, 적어도 약 25%, 적어도 약 30%, 적어도 약 35%, 적어도 약 40%, 적어도 약 45%, 적어도 약 45%, 적어도 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99%, 또는 그 이상의 감소를 포함할 수 있다. 본 명세서에 사용된 "감소(reduction)" 또는 "억제(inhibition)"는 참조 수준과 비교하여 완전한 억제 또는 감소를 포함하지 않는다. "완전한 억제"는 참조 수준과 비교하여 100% 억제이다. 감소는 바람직하게는 주어진 장애가 없는 개체에 대해 정상 범위 내로 허용되는 수준까지 저하될 수 있다.
용어 "증가된(increased)", "증가하다(increase)", "향상시키다(enhance)", 또는 "활성화하다(activate)"는 모두 정적으로 유의한 양만큼 증가를 의미하기 위해 본 명세서에서 사용된다. 일부 실시형태에서, 용어 "증가된(increased)", "증가하다(increase)", "향상시키다(enhance)", 또는 "활성화하다(activate)"는 참조 수준과 비교하여, 적어도 10%의 증가, 예를 들어, 참조 수준과 비교하여, 적어도 약 20%, 또는 적어도 약 30%, 또는 적어도 약 40%, 또는 적어도 약 50%, 또는 적어도 약 60%, 또는 적어도 약 70%, 또는 적어도 약 80%, 또는 적어도 약 90% 또는 이를 포함하여 최대 100% 증가 또는 10-100% 사이의 임의의 증가, 또는 참조 수준과 비교하여, 적어도 약 2배, 또는 적어도 약 3배, 또는 적어도 약 4배, 또는 적어도 약 5배 또는 적어도 약 10배 증가, 또는 2배 내지 10배 이상의 임의의 증가를 의미할 수 있다. 마커 또는 증상과 관련하여, "증가하다"는 이러한 수준의 통계적으로 유의한 증가이다.
임의의 양태의 일부 실시형태에서, 참조 샘플 또는 수준은 본 명세서에 기술된 조성물과 접촉되기 전의 샘플 또는 샘플 자체의 수준이다. 임의의 양태의 일부 실시형태에서, 참조 샘플 또는 수준은 샘플과 접촉되기 전에 본 명세서에 기술된 샘플 또는 조성물의 수준이다. 임의의 양태의 일부 실시형태에서, 참조는 검출가능한 분자를 포함하지 않는 조성물과 접촉된 샘플일 수 있다. 임의의 양태의 일부 실시형태에서, 참조는 샘플에 특이적이지 않은 인식 도메인을 포함하는 조성물과 접촉된 샘플일 수 있다. 임의의 양태의 일부 실시형태에서, 참조는 또한 대조군 샘플, 대조군 개체의 풀링된 샘플, 또는 이에 기초한 수치 값 또는 값 범위로부터 수득된 수준일 수 있다.
본 명세서에 사용된 "대상체(subject)"은 인간 또는 동물을 의미한다. 일반적으로 동물은 영장류, 설치류, 가축 또는 사냥감 동물과 같은 척추동물이다. 영장류는 침팬지, 사이노몰구스 원숭이, 거미 원숭이, 마카크, 예를 들어, 붉은털 원숭이(Rhesus)를 포함한다. 설치류는 마우스, 랫트, 우드척, 페럿, 토끼 및 햄스터를 포함한다. 가축 및 사냥감 동물은 소, 말, 돼지, 사슴, 들소, 버암로, 고양이(feline) 종, 예를 들어, 집 고양이, 개(canine) 종, 예를 들어, 개, 여우, 늑대, 조류(avian) 종, 예를 들어, 닭, 에뮤, 타조, 및 어류, 예를 들어, 송어, 메기 및 연어를 포함한다. 일부 실시형태에서, 대상체는 포유동물, 예를 들어, 영장류, 예를 들어, 인간이다. 용어 "개체", "환자" 및 "대상체"는 본 명세서에서 상호교환가능하게 사용된다.
바람직하게는, 대상체는 포유동물이다. 포유동물은 인간, 인간이 아닌 영장류, 마우스, 랫트, 개, 고양이, 말 또는 소일 수 있지만, 이들 예로 제한되는 것은 아니다.
본 명세서에 사용된 용어 "단백질" 및 "폴리펩티드"는 인접 잔기의 알파-아미노 및 카르복시기 사이의 펩티드 결합에 의해 서로 연결된, 일련의 아미노산 잔기를 나타내기 위해 본 명세서에서 상호교환가능하게 사용된다. 용어 "단백질" 및 "폴리펩티드"는, 크기나 기능에 관계없이, 변형된 아미노산(예를 들어, 인산화, 당화, 글리코실화 등) 및 아미노산 유사체를 포함하는, 아미노산의 중합체를 지칭한다. "단백질" 및 "폴리펩티드"는 종종 비교적 큰 폴리펩티드와 관련하여 사용되는 반면, 용어 "펩티드"는 종종 작은 폴리펩티드와 관련하여 사용되지만, 당업계에서 이러한 용어의 사용은 중복된다. 용어 "단백질" 및 "폴리펩티드"는 유전자 생성물 및 이의 단편을 언급할 때 본 명세서에서 상호교환적으로 사용된다. 따라서, 예시적인 폴리펩티드 또는 단백질은 유전자 생성물, 자연 발생 단백질, 상동체, 오르쏘로그(orthologs), 파라로그(paralogs), 단편 및 기타 등가물, 변이체, 단편 및 전술한 것들의 유사체를 포함한다.
본 명세서에 기술된 다양한 실시형태에서, 기재된 임의의 특정 폴리펩티드의 변이체(자연 발생 또는 기타), 대립유전자, 상동체, 보존적으로 변형된 변이체, 및/또는 보존적 치환 변이체가 포함되는 것으로 추가로 고려된다. 아미노산 서열과 관련하여, 당업자는 코딩된 서열에서 단일 아미노산 또는 적은 비율의 아미노산을 변경하는 핵산, 펩티드, 폴리펩티드 또는 단백질 서열에 대한 개별적인 치환, 결실 또는 부가가 "보존적으로 변형된 변이체"이며, 여기서 변형은 아미노산의 화학적으로 유사한 아미노산으로의 치환을 초래하고 폴리펩티드의 원하는 활성을 유지하는 것임을 인지할 것이다. 이러한 보존적으로 변형된 변이체는 본 개시와 일치하는 다형성 변이체, 종간 상동체, 및 대립유전자에 부가되고 이러한 것들을 배제하지 않는다.
주어진 아미노산은 유사한 물리화학적 특성을 갖는 잔기로 대체, 예를 들어, 한 지방족 잔기를 다른 것으로 치환(예컨대, Ile, Val, Leu 또는 Ala를 다른 어느 하나로), 또는 한 극성 잔기를 다른 것으로 치환(예컨대, Lys와 Arg; Glu와 Asp; 또는 Gln과 Asn 사이의 치환)할 수 있다. 이와 같은 다른 보존적 치환, 예를 들어, 유사한 소수성 특성을 갖는 전체 영역의 치환은 잘 알려져 있다. 보존적 아미노산 치환을 포함하는 폴리펩티드는 원하는 활성, 예를 들어, 천연 또는 참조 폴리펩티드의 활성 및 특이성이 유지됨을 확인하기 위해 본 명세서에 기술된 분석 중 임의의 하나로 시험될 수 있다.
아미노산은 이들의 측쇄 특성의 유사성에 따라 분류될 수 있다(AL Lehninger, in Biochemistry, second ed., pp. 73-75, Worth Publishers, New York (1975)): (1) 비-극성: Ala(A), Val(V), Leu(L), Ile(I), Pro(P), Phe(F), Trp(W), Met(M); (2) 비하전 극성: Gly(G), Ser(S), Thr(T), Cys(C), Tyr(Y), Asn(N), Gln(Q); (3) 산성: Asp(D), Glu(E); (4) 염기성: Lys(K), Arg(R), His(H). 대안적으로, 자연 발생 잔기는 공통 측쇄 특성에 따라 그룹으로 나눌 수 있다. (1) 소수성: Norleucine, Met, Ala, Val, Leu, Ile; (2) 중성 친수성: Cys, Ser, Thr, Asn, Gln; (3) 산성: Asp, Glu; (4) 염기성: His, Lys, Arg; (5) 사슬 배향에 영향을 미치는 잔기: Gly, Pro; (6) 방향족: Trp, Tyr, Phe. 비-보존적 치환은 이러한 클래스 중 하나의 구성원을 다른 클래스로 교환하는 것을 수반한다. 특정한 보존적 치환은, 예를 들어, 다음을 포함한다; Ala를 Gly 또는 Ser으로; Arg을 Lys로; Asn을 Gln 또는 His로; Asp를 Glu로; Cys를 Ser로; Gln을 Asn으로; Glu를 Asp로; Gly을 Ala 또는 Pro로; His을 Asn 또는 Gln으로; Ile을 Leu 또는 Val로; Leu를 Ile 또는 Val로; Lys을 Arg, Gln 또는 Glu로; Met을 Leu, Tyr 또는 Ile로; Phe을 Met, Leu 또는 Tyr로; Ser을 Thr로; Thr을 Ser으로; Trp를 Tyr로; Tyr을 Trp으로; 및/또는 Phe을 Val, Ile 또는 Leu로.
일부 실시형태에서, 본 명세서에 기술된 폴리펩티드(또는 이러한 폴리펩티드를 코딩하는 핵산)는 본 명세서에 기술된 아미노산 서열 중 하나의 기능적 단편일 수 있다. 본 명세서에 사용된 "기능적 단편"은 본 명세서에 아래에 기재된 분석에 따라 야생형 참조 폴리펩티드 활성의 적어도 50%를 유지하는 펩티드의 단편 또는 세그먼트이다. 기능적 단편은 본 명세서에 개시된 서열의 보존적 치환을 포함할 수 있다.
일부 실시양태에서, 본 명세서에 기술된 폴리펩티드는 본 명세서에 기술된 서열의 변이체일 수 있다. 일부 실시양태에서, 변이체는 보존적으로 변형된 변이체이다. 보존적 치환 변이체는, 예를 들어, 천연 뉴클레오티드 서열의 돌연변이에 의해 수득될 수 있다. 본 명세서에 언급된, "변이체"는 천연 또는 참조 폴리펩티드와 실질적으로 상동성이지만, 하나 또는 복수의 결실, 삽입 또는 치환으로 인해 천연 또는 참조 폴리펩티드와 상이한 아미노산 서열을 갖는 것이다. 변이체 폴리펩티드-코딩 DNA 서열은 천연 또는 참조 DNA 서열과 비교할 때 뉴클레오티드의 하나 이상의 추가, 결실 또는 치환을 포함하지만, 활성을 유지하는 변이체 단백질 또는 이의 단편을 코딩하는 서열을 포함한다. 다양한 PCR-기반 부위-특이적 돌연변이유발 접근법은 당업계에 공지되어 있고 통상의 기술자에 의해 적용될 수 있다.
변이체 아미노산 또는 DNA 서열은 천연 또는 참조 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 그 이상 동일할 수 있다. 예를 들어, 월드 와이드 웹(예를 들어, 기본 설정이 있는 BLASTp 또는 BLASTn) 상에서 이 목적을 위해 일반적으로 사용되는 무료로 사용이능한 컴퓨터 프로그램을 사용하여 2개의 서열을 비교함으로써 천연 서열과 돌연변이 서열 사이의 상동성(동일성 백분율)의 정도를 결정할 수 있다.
천연 아미노산 서열의 변경은 당업자에게 공지된 임의의 다수의 기술에 의해 달성될 수 있다. 돌연변이는, 예를 들어, 천연 서열의 단편에 라이게이션을 가능하게 하는 제한 부위에 의해 플랭킹되어 있는, 돌연변이 서열을 함유하는 올리고뉴클레오티드를 합성함으로써 특정 좌위에 도입될 수 있다. 라이게이션 후, 생성된 재구성된 서열은 원하는 아미노산 삽입, 치환, 또는 결실을 갖는 유사체를 코딩한다. 대안적으로, 올리고뉴클레오티드-지정 부위-특이적 돌연변이유발 절차를 이용하여 요구되는 치환, 결실, 또는 삽입에 따라 변경된 특정 코돈을 갖는 변경된 뉴클레오티드 서열을 제공할 수 있다. 그러한 변경을 위한 기술은 매우 잘 확립되어 있으며, 예를 들어, 전문이 본 명세서에 참조로 통합되는, 다음 문헌에 개시된 것들을 포함한다: Walder et al. (Gene 42:133, 1986); Bauer et al. (Gene 37:73, 1985); Craik (BioTechniques, January 1985, 12-19); Smith et al. (Genetic Engineering: Principles and Methods, Plen㎛ Press, 1981); 및 미국 특허 제4,518,584호 및 제4,737,462호. 폴리펩티드의 적절한 형태를 유지하는 데 관여하지 않는 임의의 시스테인 잔기가 또한, 일반적으로 세린으로 치환되어 분자의 산화 안정성을 개선하고 비정상적인 가교를 방지할 수 있다. 반대로, 시스테인 결합(들)은 폴리펩티드에 부가되어 안정성을 향상시키거나 올리고머화를 촉진할 수 있다.
본 명세서에 사용된 용어 "핵산" 또는 "핵산 서열"은 리보핵산, 데옥시리보핵산 또는 이들의 유사체의 단위를 포함하는 임의의 분자, 바람직하게는 중합체 분자를 지칭한다. 핵산은 단일-가닥 또는 이중-가닥일 수 있다. 단일-가닥 핵산은 변성된 이중-가닥 DNA의 한 핵산 가닥일 수 있다. 달리, 이중-가닥 DNA에서 유래하지 않은 단일-가닥 핵산일 수 있다. 임의의 양태의 일부 실시형태에서, 단일-가닥 핵산은 시험관내(in-vitro) 전사에 이어 역전사에 의해 생성된다. 임의의 양태의 일부 실시형태에서, 단일-가닥 핵산은 닉킹 엔도뉴클레이즈에 대한 노출에 의해 생성된다. 임의의 양태의 일부 실시형태에서, 단일-가닥 핵산은 새로(de novo) 합성된다. 한 양태에서, 핵산은 DNA일 수 있다. 또 다른 양태에서, 핵산은 RNA일 수 있다. 적합한 DNA는, 예를 들어, 게놈 DNA 또는 cDNA를 포함할 수 있다. 적합한 RNA는, 예를 들어, mRNA를 포함할 수 있다.
용어 "발현"은 RNA 및 단백질을 생성하고 적절한 경우 단백질을 분비하는 데 관여하는 세포 과정을 지칭하며, 예를 들어, 적용이능한 경우, 전사, 전사체 처리, 번역 및 단백질 폴딩, 변형 및 처리을 포함하나, 이로만 제한되는 것은 아니다. 발현은 본 발명의 핵산 단편 또는 단편들로부터 유래된 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정적인 축적 및/또는 mRNA의 폴리펩티드로의 번역을 지칭할 수 있다.
일부 실시양태에서, 본 명세서에 기술된 바이오마커(들), 표적(들), 또는 유전자/폴리펩티드의 발현은 조직 특이적이다. 일부 실시양태에서, 본 명세서에 기술된 바이오마커(들), 표적(들), 또는 유전자/폴리펩티드의 발현은 전체적(global)이다. 일부 실시양태에서, 본 명세서에 기술된 바이오마커(들), 표적(들), 또는 유전자/폴리펩티드의 발현은 전신적(systemic)이다.
"발현 생성물"은 유전자로부터 전사된 RNA, 및 유전자로부터 전사된 mRNA의 번역에 의해 수득된 폴리펩티드를 포함한다. 용어 "유전자"는 적절한 조절 서열에 작동가능하게 연결된 경우 시험관내(in vitro) 또는 생체내에서(in vivo) RNA로 전사되는(DNA) 핵산 서열을 의미한다. 유전자는 코딩 영역 앞과 뒤에 있는 영역, 예를 들어, 5' 비번역(5'UTR) 또는 "리더" 서열 및 3' UTR 또는 "트레일러" 서열 뿐만 아니라, 개별 코딩 세그먼트(엑손) 사이의 개재 서열(인트론)을 포함하거나 포함하지 않을 수 있다.
본 발명의 맥락에서 "마커(marker)"는, 대조군 대상체(예를 들어, 건강한 대상체)에서 채취한 비교가능한 샘플과 비교하여, 시험 대상체로부터 채취한 샘플에 차별적으로 존재하는 발현 생성물, 예를 들어, 핵산 또는 폴리펩티드를 지칭한다. "바이오마커(biomarker)"라는 용어는 "마커"라는 용어와 상호교환적으로 사용된다.
일부 실시양태에서, 본 명세서에 기술된 방법은 적어도 하나의 표적 분자의 수준을 측정, 검출 또는 결정하는 단계와 관련이 있다. 본 명세서에 사용된, 용어 "검출(detecting)" 또는 "측정(measuring)"은 신호, 예를 들어, 프로브, 라벨, 또는 표적 분자를 관찰하여 시료 중의 분석물의 존재를 나타내는 것을 지칭한다. 특정 라벨 모이어티를 검출하기 위한 당업계에 공지된 임의의 방법이 검출을 위해 사용될 수 있다. 예시적인 검출 방법은, 이로만 제한되는 것은 아니지만, 분광적, 형광적, 광화학적, 생화학적, 면역화학적, 전기적, 광학적 또는 화학적 방법을 포함한다. 임의의 양태의 일부 실시형태에서, 측정은 정량적 관찰일 수 있다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 바와 같은 폴리펩티드, 핵산, 또는 세포가 조작될 수 있다. 본 명세서에 사용된 "조작된(engineered)"은 사람의 손에 의해 조작된 양태를 지칭한다. 예를 들어, 폴리펩티드의 적어도 하나의 양태, 예를 들어, 이의 서열이 사람의 손에 의해 조작되어 천연에 존재하는 양태와 달라진 경우, 폴리펩티드는 "조작된" 것으로 간주된다. 일반적인 관행이고 당업자에 의해 이해되는 바와 같이, 조작된 세포의 자손은 비록 실제 조작이 이전 엔티티에 대해 수행되었음에도 불구하고 일반적으로 여전히 "조작된" 것으로 지칭된다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 핵산(예를 들어, 올리고뉴클레오티드 태그, 예를 들어, 판독 분자)은 외인성이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 핵산(예를 들어, 올리고뉴클레오티드 태그, 예를 들어, 판독 분자)은 이소성(ectopic)이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 핵산(예를 들어, 올리고뉴클레오티드 태그, 예를 들어, 올리고페인트)은 내인성이 아니다.
용어 "외인성(exogenous)"은 세포의 천연 공급원 이외의 세포에 존재하는 물질을 지칭한다. 본 명세서에 사용된 용어 "외인성"은 인간의 손을 포함하는 과정에 의해 세포 또는 유기체와 같은 생물학적 시스템 내로 도입된 핵산(예를 들어, 폴리펩티드를 코딩하는 핵산) 또는 폴리펩티드를 지칭할 수 있으며, 일반적으로 상기 핵산 또는 폴리펩티드는 상기 시스템 내에서 발견되지 않고 상기 핵산 또는 폴리펩티드는 이러한 세포 또는 유기체로 도입하기를 원하는 것이다. 대안적으로, "외인성"은 인간의 손을 포함하는 과정에 의해 세포 또는 유기체와 같은 생물학적 시스템 내로 도입된 핵산 또는 폴리펩티드를 지칭할 수 있으며, 상기 핵산 또는 폴리펩티드는 상기 시스템 내에서 상대적으로 적은 양으로 발견되고 상기 세포 또는 유기체 내에서 상기 핵산 또는 폴리펩티드의 양을 증가, 예를 들어, 이소성 발현 또는 수준을 생성시키고자 하는 것이다. 대조적으로, 용어 "내인성(endogenous)"은 생물학적 시스템 또는 세포에 고유한 물질을 지칭한다. 본 명세서에 사용된, "이소성(ectopic)"은 비정상적인 위치 및/또는 양에서 발견되는 물질을 지칭한다. 이소성 물질은 일반적으로 주어진 세포에서 발견되지만, 훨씬 적은 양 및/또는 다른 시기에 발견되는 것일 수 있다. 이소성은 또한 천연 환경에서 주어진 세포에서 천연적으로 발견되거나 발현되지 않는 폴리펩티드 또는 핵산과 같은 물질을 포함한다.
일부 실시양태에서, 본 명세서에 기술된 바와 같은 핵산(예를 들어, 올리고뉴클레오티드 태그, 판독 분자) 또는 폴리펩티드를 코딩하는 핵산은 벡터에 포함된다. 본 명세서에 기술된 측면 중 일부에서, 본 명세서에 기술된 바와 같은 주어진 핵산 또는 폴리펩티드, 또는 이의 임의의 모듈을 코딩하는 핵산 서열은 벡터에 작동가능하게 연결된다. 본원에 사용된 용어 "벡터"는 숙주 세포로의 전달 또는 상이한 숙주 세포 사이의 전달을 위해 설계된 핵산 구축물을 지칭한다. 본원에 사용된 벡터는 바이러스성 또는 비-바이러스성일 수 있다. 용어 "벡터"는 적절한 제어 요소와 결합될 때 복제할 수 있고 유전자 서열을 세포로 전달할 수 있는 임의의 유전 요소를 포함한다. 벡터는, 이로만 제한되는 것은 아니지만, 클로닝 벡터, 발현 벡터, 플라스미드, 파지, 트랜스포존, 코스미드, 염색체, 바이러스, 비리온 등을 포함할 수 있다.
임의의 양태의 일부 실시형태에서, 벡터는 재조합이고, 예를 들어, 이는 2개 이상의 상이한 공급원으로부터 유래하는 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 벡터는 적어도 2개의 상이한 종으로부터 유래하는 서열을 포함한다. 임의의 양태의 일부 실시형태에서, 벡터는 적어도 2개의 상이한 유전자로부터 기원하는 서열을 포함하고, 예를 들어, 융합 단백질 또는 적어도 하나의 비-천연(예를 들어, 이종) 유전적 조절 요소(예를 들어, 프로모터, 억제인자, 활성제, 인핸서, 반응 요소 등)을 포함한다.
임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 또는 핵산은 코돈-최적화되고, 예를 들어, 핵산 서열의 천연 또는 야생형 서열은 변경된 코돈을 포함하도록 변경되거나 조작되며, 변경 또는 조작된 핵산은 천연/야생형 서열과 동일한 폴리펩티드 발현 생성물을 코딩하지만, 원하는 발현 시스템에서 개선된 효율로 전사 및/또는 번역된다. 임의의 양태의 일부 실시형태에서, 발현 시스템은 천연/야생형 서열의 공급원 이외의 유기체(또는 이러한 유기체로부터 수득된 세포)이다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 포유동물 또는 포유류 세포, 예를 들어, 마우스, 뮤린 세포, 또는 인간 세포에서의 발현을 위해 코돈-최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 인간 세포에서의 발현을 위해 코돈-최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 효모 또는 효모 세포에서의 발현을 위해 코돈 최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 박테리아 세포에서의 발현을 위해 코돈-최적화된다. 임의의 양태의 일부 실시형태에서, 본 명세서에 기술된 벡터 및/또는 핵산 서열은 대장균(E. coli) 세포에서의 발현을 위해 코돈-최적화된다.
본원에 사용된 용어 "발현 벡터"는 벡터 상의 전사 조절 서열에 연결된 서열로부터 RNA 또는 폴리펩티드의 발현을 지시하는 벡터를 지칭한다. 발현된 서열은 종종 세포에 대해 이종성일 것이지만, 반드시 그런 것은 아니다. 발현 벡터는 추가 요소를 포함할 수 있으며, 예를 들어, 발현 벡터는 2개의 복제 시스템을 가질 수 있으며, 그래서 이것이 2개의 유기체, 예를 들어, 발현을 위한 인간 세포 및 클로닝 및 증폭을 위한 원핵 숙주에서 유지되도록 할 수 있다.
본원에 사용된 용어 "바이러스 벡터"는 바이러스 기원의 적어도 하나의 요소를 포함하고 바이러스 벡터 입자 내로 패키징될 수 있는 능력을 갖는 핵산 벡터 작제물을 지칭한다. 바이러스 벡터는 비필수 바이러스 유전자를 대신하여 본 명세서에 기술된 바와 같은 핵산 또는 폴리펩티드를 코딩하는 핵산을 함유할 수 있다. 벡터 및/또는 입자는 시험관내(in vitro) 또는 생체내에서(in vivo) 임의의 핵산을 세포 내로 전달하기 위한 목적으로 사용될 수 있다. 다양한 형태의 바이러스 벡터가 당업계에 공지되어 있다.
본 명세서에 기술된 벡터는 일부 실시양태에서 다른 적합한 조성물 및 요법과 조합될 수 있음을 이해해야 한다. 일부 실시양태에서, 벡터는 에피솜이다. 적합한 에피솜 벡터의 사용은 높은 카피 수의 추가 염색체 DNA에서 대상체의 관심 뉴클레오티드를 유지함으로써 염색체 통합의 잠재적 효과를 제거하는 수단을 제공한다.
본 명세서에 사용된, "접촉(contacting)"은 적어도 하나의 세포에 작용제를 전달하거나, 노출시키기 위한 임의의 적합한 수단을 지칭한다. 예시적인 전달 방법은, 이로만 제한되는 것은 아니지만, 세포 배양 배지로의 직접 전달, 관류, 주사, 또는 당업자에게 잘 알려진 다른 전달 방법을 포함한다. 일부 실시양태에서, 접촉은 물리적 인간 활동, 예를 들어, 주사; 분배, 혼합, 및/또는 따라내는 행위; 및/또는 전달 디바이스 또는 머신의 조작을 포함한다.
"통계적으로 유의한" 또는 "유의하게"라는 용어는 통계적 유의성을 나타내며 일반적으로 2 표준 편차(2SD) 또는 그 이상의 차이를 지칭한다.
작동 예에서, 또는 달리 지시된 경우를 제외하고, 본 명세서에 사용된 성분의 양 또는 반응 조건을 나타내는 모든 숫자는 모든 경우에 용어 "약"에 의해 수정된 것으로 이해되어야 한다. 백분율과 관련하여 사용될 때 용어 "약"은 ±1%를 의미할 수 있다.
본 명세서에 사용된, 용어 "포함하는(comprising)"은 제시된 정의된 요소에 추가하여 다른 요소가 또한 존재할 수 있음을 의미한다. "포함하는"의 사용은 제한이 아니라 포함을 나타낸다.
용어 "구성되는(consisting of)"은 본 명세서에 기술된 바와 같은 조성물, 방법, 및 이들의 각각의 구성요소를 지칭하며, 실시형태의 설명에서 언급되지 않은 임의의 요소를 배제한다.
본 명세서에 사용된, 용어 "본질적으로 구성되는(consisting essentially of)"은 주어진 실시형태에 필요한 요소를 지칭한다. 이 용어는 본 발명의 실시형태의 기본적이고 신규한 또는 기능적 특성(들)에 실질적으로 영향을 미치지 않는 추가 요소의 존재를 허용한다.
본 명세서에서 사용되는, 용어 "∼에 상응하는(corresponding to)"은 제1 폴리펩티드 또는 핵산 중의 열거된 위치에 있는 아미노산 또는 뉴클레오티드, 또는 제2 폴리펩티드 또는 핵산 중의 열거된 아미노산 또는 뉴클레오티드와 동등한 아미노산 또는 뉴클레오티드를 지칭한다. 동등한 열거된 아미노산 또는 뉴클레오티드는 당업계에 공지된 상동성 프로그램, 예를 들어, BLAST를 사용하여 후보 서열의 정렬에 의해 결정될 수 있다.
본 명세서에 사용된, 용어 "특이적 결합(specific binding)"은 2개의 분자, 화합물, 세포 및/또는 입자 사이의 화학적 상호작용을 지칭하며, 여기서 제1 엔티티는 표적이 아닌 제3 엔티티에 결합하는 것 보다 더 큰 특이성 및 친화도로 제2 표적 엔티티에 결합한다. 일부 실시형태에서, 특이적 결합은 제2 표적 엔티티에 대한 제1 엔티티의 친화도를 지칭할 수 있으며, 이는 제3 비-표적 엔티티에 대한 친화도에 비해 적어도 10배, 적어도 50배, 적어도 100배, 적어도 500배, 적어도 1000배 또는 그 이상이다. 주어진 표적에 대해 특이적인 시약은 이용되는 분석 조건 하에서 해당 표적에 대한 특이적 결합을 나타내는 것이다.
단수 용어 "a", "an" 및 "the"는 문맥이 달리 명백하게 나타내지 않는 한, 복수의 지시 대상을 포함한다. 유사하게, "또는"이라는 단어는 문맥이 명백하게 달리 나타내지 않는 한, "및"을 포함하도록 의도된다. 본 명세서에 기술된 것과 유사하거나 동등한 방법 및 재료가 본 개용의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 재료가 아래에 기재되어 있다. 약어, "예를 들어(e.g.)" 라틴어 exempli gratia에서 파생되었으며, 비제한적인 예를 나타내기 위해 여기에서 사용된다. 따라서, 약어 "예를 들어(e.g.)"는 "예를 들어(for example)"라는 용어와 동의어이다.
본 명세서에 개시된 본 발명의 대안적 요소 또는 실시형태의 그룹화는 제한으로 해석되어서는 안된다. 각 그룹 구성원은 개별적으로 또는 그룹의 다른 구성원 또는 본 명세서에서 발견되는 다른 요소와 임의의 조합으로 참조 및 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의 및/또는 특허성을 이유로 그룹에 포함되거나 그룹에서 삭제될 수 있다. 임의의 그러한 포함 또는 삭제가 발생하면, 명세서는 수정된 그룹을 포함하는 것으로 간주되어 첨부된 청구범위에 사용된 모든 마쿠쉬(Markush) 그룹의 서면 설명을 충족한다.
본 명세서에서 달리 정의되지 않는 한, 본 출원과 관련하여 사용되는 과학 및 기술 용어는 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미를 가질 것이다. 본 발명은 본 명세서에 기술된 특정 방법론, 프로토콜 및 시약 등에 제한되지 않고 다양할 수 있음을 이해해야 한다. 본 명세서에서 사용된 용어는 단지 특정 실시형태를 설명하기 위해 사용된 것으로, 청구범위에 의해서만 정의되는 본 발명의 범위를 한정하려는 의도가 아니다. 면역학 및 분자 생물학에서 일반적인 용어의 정의는, 문헌 내용 모두가 전문으로 본 명세서에 참조로 통합되는, 다음 문헌에서 확인할 수 있다: The Merck Manual of Diagnosis and Therapy, 20th Edition, published by Merck Sharp & Dohme Corp., 2018 (ISBN 0911910190, 978-0911910421); Robert S. Porter et al. (eds.), The Encyclopedia of Molecular Cell Biology and Molecular Medicine, published by Blackwell Science Ltd., 1999-2012 (ISBN 9783527600908); 및 Robert A. Meyers (ed.), Molecular Biology and Biotechnology: a Comprehensive Desk Reference, published by VCH Publishers, Inc., 1995 (ISBN 1-56081-569-8); Immunology by Werner Luttmann, published by Elsevier, 2006; Janeway's Immunobiology, Kenneth Murphy, Allan Mowat, Casey Weaver (eds.), W. W. Norton & Company, 2016 (ISBN 0815345054, 978-0815345053); Lewin's Genes XI, published by Jones & Bartlett Publishers, 2014 (ISBN-1449659055); Michael Richard Green and Joseph Sambrook, Molecular Cloning: A Laboratory Manual, 4th ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (2012) (ISBN 1936113414); Davis et al., Basic Methods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (2012) (ISBN 044460149X); Laboratory Methods in Enzymology: DNA, Jon Lorsch (ed.) Elsevier, 2013 (ISBN 0124199542); Current Protocols in Molecular Biology (CPMB), Frederick M. Ausubel (ed.), John Wiley and Sons, 2014 (ISBN 047150338X, 9780471503385), Current Protocols in Protein Science (CPPS), John E. Coligan (ed.), John Wiley and Sons, Inc., 2005; 및 Current Protocols in Immunology (CPI) (John E. Coligan, ADA M Kruisbeek, David H Margulies, Ethan M Shevach, Warren Strobe, (eds.) John Wiley and Sons, Inc., 2003 (ISBN 0471142735, 9780471142737).
다른 용어는 본 발명의 다양한 양태의 설명 내에서 본 명세서에 정의된다.
본 출원 전반에 걸쳐 인용된, 참고 문헌, 발행된 특허, 공개된 특허 출원, 및 동시 계류 중인 특허 출원을 포함하는, 모든 특허 및 기타 간행물은, 예를 들어, 본 명세서에 기술된 기술과 연계하여 사용될 수 있는 그러한 간행물에 기재된 방법론을 설명 및 개시하기 위한 목적으로 본 명세서에 참조로 명시적으로 통합된다. 이러한 간행물은 본 출원의 출원일 이전에 이들의 개시에 대한 목적으로만 제공된다. 이와 관련하여 어떠한 것도 발명가가 선행 발명으로 인해 또는 다른 이유로 그러한 개시보다 선행할 자격이 없다는 것을 인정하는 것으로 해석되어서는 안된다. 이들 문서의 내용에 대한 날짜 또는 표현에 대한 모든 진술은 출원인이 이용이능한 정보에 기초한 것이며 이들 문서의 날짜 또는 내용의 정확함에 대해 인정하는 것은 아니다.
본 개시의 실시형태에 대한 설명은 완전한 형태로 개시되거나 개시된 정확한 형태로 본 개시를 제한하도록 의도된 것은 아니다. 본 개시의 특정 실시형태, 및 예는 예시적 목적으로 본 명세서에 기술되어 있지만, 관련 기술 분야의 통상의 지식을 가진 자가 인식하는 바와 같이, 본 개시의 범위 내에서 다양한 균등 변형이 가능하다. 예를 들어, 방법 단계 또는 기능이 주어진 순서로 제시되는 동안, 대안적인 실시형태는 다른 순서로 기능을 수행할 수 있거나, 또는 기능은 실질적으로 동시에 수행될 수 있다. 본 명세서에 제공된 개시에 대한 교시는 적절한 다른 절차 또는 방법에 적용될 수 있다. 본 명세서에 기술된 다양한 실시형태는 추가 실시형태를 제공하기 위해 결합될 수 있다. 본 개시의 양태는, 필요하다면, 본 개시의 또 다른 실시형태를 제공하기 위해 상기 참조 및 적용의 구성, 기능 및 개념을 사용하도록 수정될 수 있다. 또한, 생물학적 기능 동등성 고려사항으로 인해, 종류나 양의 생물학적 또는 화학적 작용에 영향을 미치지 않으면서 핵산 또는 단백질 구조에 일부 변화를 줄 수 있다. 이러한 변화 및 기타 변화가 상세한 설명에 비추어 본 개시에 대해 이루어질 수 있다. 이러한 모든 수정은 첨부된 청구항의 범위 내에 포함되도록 의도된다.
임의의 전술한 실시형태의 특정 요소는 다른 실시형태의 요소에 대해 조합되거나 대체될 수 있다. 또한, 본 개시의 특정 실시형태와 관련된 이점은 이러한 실시형태의 맥락에서 설명되었지만, 다른 실시형태가 또한 이러한 장점을 나타낼 수 있으며, 모든 실시형태가 본 개시의 범위 내에 속하기 위해 반드시 그러한 장점을 나타낼 필요는 없다.
본 명세서에 기술된 기술은 어떤 식으로든 추가로 제한하는 것으로 해석되지 않아야 하는 이하의 실시예에 의해 추가로 설명된다.
본 명세서에 기술된 기술의 일부 실시형태는 아래의 번호매겨진 단락 중 임의 단락에 따라 정의될 수 있다:
1. 적어도 2개의 판독 분자의 세트로서,
각각의 판독 분자가,
a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
d. 광학적으로 검출가능한 라벨,
을 포함하는, 세트.
2. 단락 1에 있어서, 상기 라벨이 형광 라벨인, 세트.
3. 단락 1 내지 단락 2 중 어느 한 단락에 있어서, 상기 광학적으로 검출가능한 라벨이, 비오틴, 아민, 금속, 금속 나노클러스터, 고정 분자, 양자점, 또는 아크리다이트를 포함하거나 또는 추가로 포함하는, 세트.
4. 단락 1 내지 단락 3 중 어느 한 단락에 있어서, 상기 라벨이, 판독 분자의 5' 말단에 위치하는, 세트.
5. 단락 1 내지 단락 4 중 어느 한 단락에 있어서, 상기 세트가, 4개의 구별가능한 라벨을 포함하는, 세트.
6. 단락 1 내지 단락 5 중 어느 한 단락에 있어서, 상기 세트가, 적어도 2개의 구별가능한 라벨을 포함하는, 세트.
7. 단락 1 내지 단락 6 중 어느 한 단락에 있어서, 상기 세트가, 적어도 3개의 구별가능한 라벨을 포함하는, 세트.
8. 단락 1 내지 단락 7 중 어느 한 단락에 있어서, 상기 세트가, 적어도 4개의 구별가능한 라벨을 포함하는, 세트.
9. 단락 1 내지 단락 8 중 어느 한 단락에 있어서, 제1의 3' 영역을 포함하는 각 세트의 판독 분자가, 제1 구별가능한 라벨만을 포함하는, 세트.
10. 단락 1 내지 단락 9 중 어느 한 단락에 있어서, 임의의 선택된 3' 영역을 포함하는 각 세트의 판독 분자가, 상응하는 주어진 구별가능한 라벨만을 포함하는, 세트.
11. 단락 1 내지 단락 10 중 어느 한 단락에 있어서, 상기 3' 영역이, 그 길이가 적어도 1개의 뉴클레오티드 또는 이의 유사체인, 세트.
12. 단락 1 내지 단락 11 중 어느 한 단락에 있어서, 상기 3' 영역이, 그 길이가 5개의 뉴클레오티드 또는 이의 유사체인, 세트.
13. 단락 1 내지 단락 12 중 어느 한 단락에 있어서, 상기 5' 영역이, 범용 뉴클레오티드 염기만을 포함하는 것인, 세트.
14. 단락 1 내지 단락 13 중 어느 한 단락에 있어서, 상기 5' 영역이, 데옥시이노신 뉴클레오티드만을 포함하는, 세트.
15. 단락 1 내지 단락 14 중 어느 한 단락에 있어서, 상기 5' 영역이, 그 길이가 적어도 1개의 뉴클레오티드 또는 이의 유사체인, 세트.
16. 단락 1 내지 단락 15 중 어느 한 단락에 있어서, 상기 5' 영역이, 그 길이가 3개의 뉴클레오티드 또는 이의 유사체인, 세트.
17. 단락 1 내지 단락 16 중 어느 한 단락에 있어서, 상기 적어도 2개의 판독 분자가, DNA 또는 RNA인, 세트.
18. 샘플에서 적어도 하나의 표적 분자를 검출하는 방법으로서,
상기 방법은,
a. 상기 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는,
i. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
ii. 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,
를 포함함;
b. 단락 1 내지 단락 17 중 어느 한 단락에 따른 판독 분자의 세트와 상기 샘플을 접촉시키는 단계; 및
c. 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계,
를 포함하는 방법.
19. 단락 18에 있어서, 상기 바코드 영역이 각각의 올리고뉴클레오티드 태그에 고유한, 방법.
20. 단락 18 내지 단락 19 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수보다 적은, 방법.
21. 단락 18 내지 단락 20 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수의 10% 미만인, 방법.
22. 단락 18 내지 단락 21 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수의 1% 미만인, 방법.
23. 단락 18 내지 단락 229 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 적어도 2개의 고유 바코드 비트인, 방법.
24. 단락 18 내지 단락 23 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 10개 이하의 고유 바코드 비트인, 방법.
25. 단락 18 내지 단락 24 중 어느 한 단락에 있어서, 상기 바코드-혼성화 영역이, 각각의 판독 분자에 고유한, 방법.
26. 단락 18 내지 단락 25 중 어느 한 단락에 있어서, 상기 판독 분자의 세트에 사용된 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수보다 적은, 방법.
27. 단락 18 내지 단락 26 중 어느 한 단락에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 10% 미만인, 방법.
28. 단락 18 내지 단락 27 중 어느 한 단락에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 1% 미만인, 방법.
29. 단락 18 내지 단락 28 중 어느 한 단락에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 적어도 2개의 고유 바코드-혼성화 영역을 포함하는, 방법.
30. 단락 18 내지 단락 29 중 어느 한 단락에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 10개 이하의 고유 바코드-혼성화 영역을 포함하는, 방법.
31. 단락 18 내지 단락 30 중 어느 한 단락에 있어서, 상기 스트리트가, 시퀀싱 프라이머를 어닐링하기 위한 프라이머 결합 영역을 추가로 포함하는, 방법.
32. 단락 18 내지 단락 31 중 어느 한 단락에 있어서, 상기 검출 단계가 시퀀싱법으로 수행되는, 방법.
33. 단락 18 내지 단락 32 중 어느 한 단락에 있어서, 상기 시퀀싱법이, 라이게이션에 의한 시퀀싱, 합성에 의한 시퀀싱, 혼성화에 의한 시퀀싱, 및/또는 순환 가역적 중합 혼성화 연쇄 반응에 의한 시퀀싱을 포함하는, 방법.
34. 단락 18 내지 단락 33 중 어느 한 단락에 있어서, 상기 라이게이션에 의한 시퀀싱이, 효소-기반 라이게이션을 포함하는, 방법.
35. 단락 18 내지 단락 34 중 어느 한 단락에 있어서, 상기 라이게이션에 의한 시퀀싱이, 화학적 라이게이션, 구리 보조 라이게이션, 무 구리 클릭 반응, 아민-EDC 기반 커플링, 또는 티올-말레이미드 마이클 부가를 포함하는, 방법.
36. 단락 18 내지 단락 35 중 어느 한 단락에 있어서, 상기 스트리트에 대한 판독 분자의 특이적 혼성화가, 바코드 영역 및 바코드-혼성화 영역의 아이덴티티(identity)에 의해 결정되는, 방법.
37. 단락 18 내지 단락 36 중 어느 한 단락에 있어서, 상기 광학적으로 검출가능한 라벨이, 형광단인, 방법.
38. 단락 18 내지 단락 37 중 어느 한 단락에 있어서, 상기 검출이 형광 현미경 검사법으로 수행되는, 방법.
39. 단락 18 내지 단락 38 중 어느 한 단락에 있어서, 상기 광학적으로 검출가능한 라벨이, 비오틴, 아민, 금속, 금속 나노클러스터, 고정 분자, 양자점, 또는 아크리다이트를 추가로 포함하는, 방법.
40. 단락 18 내지 단락 39 중 어느 한 단락에 있어서, 상기 검출이 적어도 단일 세포 해상도로 수행되는, 방법.
41. 단락 18 내지 단락 40 중 어느 한 단락에 있어서, 적어도 2개의 표적 분자가 동시에 검출되는, 방법.
42. 단락 18 내지 단락 41 중 어느 한 단락에 있어서, 적어도 3개의 표적 분자가 동시에 검출되는, 방법.
43. 단락 18 내지 단락 42 중 어느 한 단락에 있어서, 적어도 10개의 표적 분자가 동시에 검출되는, 방법.
44. 단락 18 내지 단락 43 중 어느 한 단락에 있어서, 적어도 20개의 표적 분자가 동시에 검출되는, 방법.
45. 단락 18 내지 단락 44 중 어느 한 단락에 있어서, 상기 표적 분자가 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질인, 방법.
46. 단락 18 내지 단락 45 중 어느 한 단락에 있어서, 상기 표적 분자가 DNA 또는 RNA인, 방법.
47. 단락 18 내지 단락 46 중 어느 한 단락에 있어서, 상기 표적 분자가 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질에 연결된 것인, 방법.
48. 단락 18 내지 단락 47 중 어느 한 단락에 있어서, 상기 샘플이 세포, 세포 배양물, 또는 조직 샘플인, 방법.
본 명세서에 설명된 기술의 일부 실시형태는 다음 번호매겨진 단락 중 하나에 따라 정의될 수 있다:
1. 적어도 2개의 판독 분자의 세트로서, 각각의 판독 분자가,
a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
d. 광학적으로 검출가능한 라벨,
을 포함하는, 세트.
2. 단락 1에 있어서, 상기 라벨이 형광 라벨인, 세트.
3. 단락 1 내지 단락 2 중 어느 한 단락에 있어서, 상기 광학적으로 검출가능한 라벨이, 비오틴, 아민, 금속, 금속 나노클러스터, 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조를 포함하거나 또는 추가로 포함하는 것인, 세트.
4. 단락 1 내지 단락 3 중 어느 한 단락에 있어서, 상기 라벨이, 판독 분자의 5' 말단에 위치하는, 세트.
5. 단락 1 내지 단락 4 중 어느 한 단락에 있어서, 상기 세트가, 4개의 구별가능한 라벨을 포함하는, 세트.
6. 단락 1 내지 단락 5 중 어느 한 단락에 있어서, 상기 세트가, 적어도 2개의 구별가능한 라벨을 포함하는, 세트.
7. 단락 1 내지 단락 6 중 어느 한 단락에 있어서, 상기 세트가, 적어도 3개의 구별가능한 라벨을 포함하는, 세트.
8. 단락 1 내지 단락 7 중 어느 한 단락에 있어서, 상기 세트가, 적어도 4개의 구별가능한 라벨을 포함하는, 세트.
9. 단락 1 내지 단락 8 중 어느 한 단락에 있어서, 제1의 3' 영역을 포함하는 각 세트의 판독 분자가, 제1 구별가능한 라벨만을 포함하는, 세트.
10. 단락 1 내지 단락 9 중 어느 한 단락에 있어서, 임의의 선택된 3' 영역을 포함하는 각 세트의 판독 분자가, 상응하는 주어진 구별가능한 라벨만을 포함하는, 세트.
11. 단락 1 내지 단락 10 중 어느 한 단락에 있어서, 상기 3' 영역이, 그 길이가 적어도 1개의 뉴클레오티드 또는 이의 유사체인, 세트.
12. 단락 1 내지 단락 11 중 어느 한 단락에 있어서, 상기 3' 영역이, 그 길이가 5개의 뉴클레오티드 또는 이의 유사체인, 세트.
13. 단락 1 내지 단락 12 중 어느 한 단락에 있어서, 상기 5' 영역이, 범용 뉴클레오티드 염기만을 포함하는 것인, 세트.
14. 단락 1 내지 단락 13 중 어느 한 단락에 있어서, 상기 5' 영역이, 데옥시이노신 뉴클레오티드만을 포함하는, 세트.
15. 단락 1 내지 단락 14 중 어느 한 단락에 있어서, 상기 5' 영역이, 그 길이가 적어도 1개의 뉴클레오티드 또는 이의 유사체인, 세트.
16. 단락 1 내지 단락 15 중 어느 한 단락에 있어서, 상기 5' 영역이, 그 길이가 3개의 뉴클레오티드 또는 이의 유사체인, 세트.
17. 단락 1 내지 단락 16 중 어느 한 단락에 있어서, 상기 적어도 2개의 판독 분자가, DNA 및/또는 RNA를 포함하는, 세트.
18. 단락 1 내지 단락 17 중 어느 한 단락에 있어서, 상기 적어도 2개의 판독 분자가, DNA 및/또는 RNA로 구성되거나 본질적으로 구성되는, 세트.
19. 단락 1 내지 단락 18 중 어느 한 단락에 있어서, 상기 적어도 2개의 판독 분자가, 폴리펩티드를 포함하는, 세트.
20. 적어도 2개의 판독 분자의 세트로서, 각각의 판독 분자가,
a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; 및
c. 5'와 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형
을 포함하는, 세트.
21. 단락 20에 있어서, 상기 적어도 하나의 판독 분자의 5' 비-바코드-혼성화 영역이, 올리고뉴클레오티드에 특이적으로 혼성화하는, 세트.
22. 단락 20 내지 단락 21 중 어느 한 단락에 있어서, 상기 올리고뉴클레오티드가, 적어도 하나의 검출가능한 라벨을 포함하는, 세트.
23. 단락 20 내지 단락 22 중 어느 한 단락에 있어서, 상기 올리고뉴클레오티드가, 적어도 하나의 다른 올리고뉴클레오티드에 특이적으로 혼성화하는, 세트.
24. 단락 20 내지 단락 23 중 어느 한 단락에 있어서, 상기 올리고뉴클레오티드가 증폭 프라이머인, 세트.
25. 단락 20 내지 단락 24 중 어느 한 단락에 있어서, 상기 올리고뉴클레오티드가 시퀀싱 프라이머인, 세트.
26. 단락 20 내지 단락 25 중 어느 한 단락에 있어서, 상기 올리고뉴클레오티드가, 초해상도 현미경 검사법을 위한 이미저 가닥인, 세트.
27. 단락 20 내지 단락 26 중 어느 한 단락에 있어서, 적어도 하나의 판독 분자의 상기 5' 비-바코드-혼성화 영역이, 적어도 5개의 뉴클레오티드의 길이인, 세트.
28. 단락 20 내지 단락 27 중 어느 한 단락에 있어서, 적어도 하나의 판독 분자의 상기 5' 비-바코드-혼성화 영역이, 적어도 10개의 뉴클레오티드의 길이인, 세트.
29. 단락 20 내지 단락 28 중 어느 한 단락에 있어서, 상기 5' 비-바코드-혼성화 영역이, 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함하는, 세트.
30. 단락 20 내지 단락 29 중 어느 한 단락에 있어서, 적어도 하나의 판독 분자가, 광학적으로 검출가능한 라벨을 포함하는, 세트.
31. 단락 20 내지 단락 30 중 어느 한 단락에 있어서, 적어도 하나의 판독 분자의 라벨이 형광 라벨인, 세트.
32. 단락 20 내지 단락 31 중 어느 한 단락에 있어서, 상기 광학적으로 검출가능한 라벨이, 형광단, 바이오틴, 아민, 금속, 금속 나노클러스터, 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조를 포함하거나 또는 추가로 포함하는, 세트.
33. 판독 분자로서,
a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 판독 분자의 세트에서 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형;
d. 광학적으로 검출가능한 라벨; 및
e. 나노 입자,
를 포함하는 판독 분자.
34. 판독 분자로서,
a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 판독 분자의 세트에서 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
d. 금속 나노입자,
를 포함하는 판독 분자.
35. 판독 분자로서,
a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역;
b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역;
c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
d. 금속 나노입자,
를 포함하는 판독 분자.
36. 단락 34 또는 단락 35 중 어느 한 단락에 있어서, 광학적으로 검출가능한 라벨을 추가로 포함하는, 판독 분자.
37. 적어도 2개의 판독 분자의 세트로서, 각각의 판독 분자가,
a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
d. 광학적으로 검출 가능한 라벨;
을 포함하고,
적어도 하나의 판독 분자는 나노입자를 추가로 포함하는, 세트.
38. 적어도 2개의 판독 분자의 세트로서, 각각의 판독 분자가,
a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; 및
c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형;
을 포함하고,
적어도 하나의 판독 분자는 나노입자를 추가로 포함하는, 세트.
39. 단락 38에 있어서, 적어도 하나의 판독 분자가, 광학적으로 검출가능한 라벨을 추가로 포함하는, 세트.
40. 단락 33 내지 단락 39 중 어느 한 단락에 있어서, 상기 광학적으로 검출가능한 라벨이, 형광단을 포함하는, 판독 분자 또는 이의 세트.
41. 단락 33 내지 단락 40 중 어느 한 단락에 있어서, 상기 나노입자가, 상기 세트의 적어도 2개의 판독 분자에 연결된, 판독 분자 또는 이의 세트.
42. 단락 33 내지 단락 41 중 어느 한 단락에 있어서, 상기 나노입자가, 금속 나노입자를 포함하는, 판독 분자 또는 이의 세트.
43. 단락 33 내지 단락 42 중 어느 한 단락에 있어서, 상기 금속 나노입자가, Au, Ag, Ni, Co, Pt, Pd, Cu, Ti, 및 Al 나노입자로 이루어진 군으로부터 선택되는, 판독 분자 또는 이의 세트.
44. 단락 33 내지 단락 43 중 어느 한 단락에 있어서, 상기 나노입자가 금 나노입자를 포함하는, 판독 분자 또는 이의 세트.
45. 단락 33 내지 단락 44 중 어느 한 단락에 있어서, 상기 나노입자가 금 나노막대를 포함하는, 판독 분자 또는 이의 세트.
46. 단락 33 내지 단락 45 중 어느 한 단락에 있어서, 상기 나노입자가 약 1.2 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
47. 단락 33 내지 단락 46 중 어느 한 단락에 있어서, 상기 나노입자가 약 3 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
48. 단락 33 내지 단락 47 중 어느 한 단락에 있어서, 상기 나노입자가 약 5 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
49. 단락 33 내지 단락 48 중 어느 한 단락에 있어서, 상기 나노입자가 약 10 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
50. 단락 33 내지 단락 49 중 어느 한 단락에 있어서, 상기 나노입자가 약 30 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
51. 단락 33 내지 단락 50 중 어느 한 단락에 있어서, 상기 나노입자가 약 50 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
52. 단락 33 내지 단락 51 중 어느 한 단락에 있어서, 상기 나노입자가, 상기 판독 분자의 3' 말단에 있는, 판독 분자 또는 이의 세트.
53. 단락 33 내지 단락 52 중 어느 한 단락에 있어서, 상기 나노입자가, 상기 검출가능한 라벨로부터 적어도 20 뉴클레오티드에 있는, 판독 분자 또는 이의 세트.
54. 단락 33 내지 단락 53 중 어느 한 단락에 있어서, 상기 나노입자가, 상기 검출가능한 라벨로부터 적어도 30 뉴클레오티드에 있는, 판독 분자 또는 이의 세트.
55. 하기를 위한, 단락 1 내지 단락 54 중 어느 한 단락의 판독 분자 또는 이의 세트의 사용:
a. 적어도 하나의 표적 분자의 검출;
b. 신호 증폭;
c. 분지 반응(branch reaction);
d. 혼성화 연쇄 반응(HCR; hybridization chain reaction);
e. 교환 반응에 의한 신호 증폭(SABER; signal amplification by exchange reaction);
f. 롤링 서클 증폭(RCA; rolling circle amplification);
g. 인시투 시퀀싱 (in situ sequencing) ;
h. 매트릭스 부착(matrix attachment); 또는
i. 초고해상도 현미경 검사법(super resolution microscopy).
56. 샘플에서 적어도 하나의 표적 분자를 검출하는 방법으로서, 상기 방법은,
a. 상기 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는,
i. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
ii. 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,
를 포함함;
b. 단락 1 내지 단락 54 중 어느 한 단락에 따른 판독 분자의 세트와 상기 샘플을 접촉시키는 단계; 및
c. 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계,
를 포함하는 방법.
57. 단락 56에 있어서, 상기 바코드 영역이 각각의 올리고뉴클레오티드 태그에 고유한, 방법.
58. 단락 56 내지 단락 57 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수보다 적은, 방법.
59. 단락 56 내지 단락 58 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수의 10% 미만인, 방법.
60. 단락 56 내지 단락 59 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수의 1% 미만인, 방법.
61. 단락 56 내지 단락 60 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 적어도 2개의 고유 바코드 비트인, 방법.
62. 단락 56 내지 단락 61 중 어느 한 단락에 있어서, 고유 바코드 비트의 총 수가, 10개 이하의 고유 바코드 비트인, 방법.
63. 단락 56 내지 단락 62 중 어느 한 단락에 있어서, 상기 바코드-혼성화 영역이, 각각의 판독 분자에 고유한, 방법.
64. 단락 56 내지 단락 63 중 어느 한 단락에 있어서, 상기 판독 분자의 세트에 사용된 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수보다 적은, 방법.
65. 단락 56 내지 단락 64 중 어느 한 단락에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 10% 미만인, 방법.
66. 단락 56 내지 단락 65 중 어느 한 단락에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 1% 미만인, 방법.
67. 단락 56 내지 단락 66 중 어느 한 단락에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 적어도 2개의 고유 바코드-혼성화 영역을 포함하는, 방법.
68. 단락 56-67 중 어느 한 단락에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 10개 이하의 고유 바코드-혼성화 영역을 포함하는, 방법.
69. 단락 56 내지 단락 68 중 어느 한 단락에 있어서, 상기 스트리트가, 시퀀싱 프라이머를 어닐링하기 위한 프라이머 결합 영역을 추가로 포함하는, 방법.
70. 단락 56 내지 단락 69 중 어느 한 단락에 있어서, 상기 검출 단계가 시퀀싱법으로 수행되는, 방법.
71. 단락 56 내지 단락 70 중 어느 한 단락에 있어서, 상기 시퀀싱법이, 라이게이션에 의한 시퀀싱, 합성에 의한 시퀀싱, 혼성화에 의한 시퀀싱, 및/또는 순환 가역적 중합 혼성화 연쇄 반응에 의한 시퀀싱을 포함하는, 방법.
72. 단락 56 내지 단락 71 중 어느 한 단락에 있어서, 상기 라이게이션에 의한 시퀀싱이, 효소 기반 라이게이션을 포함하는, 방법.
73. 단락 56 내지 단락 72 중 어느 한 단락에 있어서, 상기 라이게이션에 의한 시퀀싱이, 화학적 라이게이션, 구리 보조 라이게이션, 무 구리 클릭 반응, 아민-EDC 기반 커플링, 또는 티올-말레이미드 마이클 부가를 포함하는, 방법.
74. 단락 56 내지 단락 73 중 어느 한 단락에 있어서, 상기 스트리트에 대한 판독 분자의 특이적 혼성화가, 바코드 영역 및 바코드-혼성화 영역의 아이덴티티에 의해 결정되는, 방법.
75. 단락 56 내지 단락 74 중 어느 한 단락에 있어서, 상기 광학적으로 검출가능한 라벨이, 형광단인, 방법.
76. 단락 56 내지 단락 75 중 어느 한 단락에 있어서, 상기 검출이 형광 현미경 검사법으로 수행되는, 방법.
77. 단락 56 내지 단락 76 중 어느 한 단락에 있어서, 상기 광학적으로 검출가능한 라벨이, 비오틴, 아민, 금속, 금속 나노클러스터, 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조를 추가로 포함하는, 방법.
78. 단락 56 내지 단락 77 중 어느 한 단락에 있어서, 상기 검출이 적어도 단일 세포 해상도로 수행되는 방법.
79. 단락 56 내지 단락 78 중 어느 한 단락에 있어서, 상기 검출이 적어도 단일 핵 해상도로 수행되는 방법.
80. 단락 56 내지 단락 79 중 어느 한 단락에 있어서, 적어도 2개의 표적 분자가 동시에 검출되는, 방법.
81. 단락 56 내지 단락 80 중 어느 한 단락에 있어서, 적어도 3개의 표적 분자가 동시에 검출되는, 방법.
82. 단락 56 내지 단락 81 중 어느 한 단락에 있어서, 적어도 10개의 표적 분자가 동시에 검출되는, 방법.
83. 단락 56 내지 단락 82 중 어느 한 단락에 있어서, 적어도 20개의 표적 분자가 동시에 검출되는, 방법.
84. 단락 56 내지 단락 83 중 어느 한 단락에 있어서, 상기 표적 분자가 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질을 포함하는, 방법.
85. 단락 56 내지 단락 84 중 어느 한 단락에 있어서, 상기 표적 분자가 DNA 및/또는 RNA를 포함하는, 방법.
86. 단락 56 내지 단락 85 중 어느 한 단락에 있어서, 상기 표적 분자가 폴리펩티드를 포함하는, 방법.
87. 단락 56 내지 단락 86 중 어느 한 단락에 있어서, 상기 표적 분자가 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질에, 공유적으로 또는 비공유적으로 연결되어 있는, 방법.
88. 단락 56 내지 단락 87 중 어느 한 단락에 있어서, 상기 샘플이 세포, 세포 배양물, 또는 조직 샘플인, 방법.
89. 단락 56 내지 단락 88 중 어느 한 단락에 있어서, 상기 샘플이 오르가노이드를 포함하는, 방법.
90. 샘플에서 적어도 하나의 표적 분자를 검출하는 향상된 방법으로서, 상기 방법은,
a. 상기 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는,
i. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
ii. 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,
를 포함함;
b. 상기 샘플을 단락 1 내지 단락 54 중 어느 한 단락에 따른 판독 분자 또는 이의 세트와 접촉시키는 단계; 및
c. 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계,
를 포함하는 방법.
91. 단락 90에 있어서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 1.5배 증가된, 방법.
92. 단락 90 내지 단락 91 중 어느 한 단락에 있어서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 3배 증가된, 방법.
93. 단락 90 내지 단락 92 중 어느 한 단락에 있어서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 10배 증가된, 방법.
94. 단락 90 내지 단락 93 중 어느 한 단락에 있어서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 50배 증가된, 방법.
95. 단락 90 내지 단락 94 중 어느 한 단락에 있어서, 상기 샘플이 인간 세포 핵을 포함하는 방법.
96. 단락 90 내지 단락 95 중 어느 한 단락에 있어서, 상기 샘플이 임의의 유기체의 세포로부터의 핵을 포함하는, 방법.
97. 단락 90 내지 단락 96 중 어느 한 단락에 있어서, 상기 샘플이 중기 염색체 스프레드를 포함하는, 방법.
98. 단락 90 내지 단락 97 중 어느 한 단락에 있어서, 상기 중기 염색체가 배양된 세포 핵으로부터 수득되는, 방법.
99. 단락 90 내지 단락 98 중 어느 한 단락에 있어서, 상기 중기 염색체가 조직 절편, 오르가노이드, 또는 생검 표본으로부터 추출된 핵으로부터 수득되는, 방법.
100. 단락 90 내지 단락 99 중 어느 한 단락에 있어서, 상기 검출가능한 라벨이 전자 현미경 검사법, 형광 현미경 검사법, 암시야 현미경 검사법, 또는 이들의 임의의 조합을 사용하여 검출되는, 방법.
101. 생물학적 샘플의 핵형 분석 방법으로서, 상기 방법은,
a. 상기 샘플을 적어도 하나의 염색체에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는,
i. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
ii. 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,
를 포함함;
b. 상기 샘플을 단락 1 내지 단락 54 중 어느 한 단락에 따른 판독 분자의 세트와 접촉시키는 단계;
c. 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 적어도 하나의 표적 분자에 혼성화되고, 이로써 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계; 및
d. 적어도 하나의 염색체에 특이적인 적어도 하나의 올리고뉴클레오티드 태그의 아이덴티티에 따라 적어도 하나의 염색체의 아이덴티티를 결정하는 단계,
를 포함하는, 방법.
102. 단락 101에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 p 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉되는 것인, 방법.
103. 단락 101 내지 단락 102 중 어느 한 단락에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 q 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉되는, 방법.
104. 단락 101 내지 단락 103 중 어느 한 단락에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 p 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그, 및 상기 적어도 하나의 염색체의 q 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉되는, 방법.
105. 단락 101 내지 단락 104 중 어느 한 단락에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 p 암 또는 q 암에 특이적인 적어도 2개의 올리고뉴클레오티드 태그와 접촉되는 방법.
106. 단락 101 내지 단락 105 중 어느 한 단락에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 p 암 또는 q 암에 특이적인 적어도 3개의 올리고뉴클레오티드 태그와 접촉되는, 방법.
107. 단락 101 내지 단락 106 중 어느 한 단락에 있어서, 상기 샘플이 각 염색체 암에 특이적인 최대 6개의 올리고뉴클레오티드 태그와 접촉되는, 방법.
108. 단락 101 내지 단락 107 중 어느 한 단락에 있어서, 상기 샘플이 각 염색체 암에 특이적인 최대 10개의 올리고뉴클레오티드 태그와 접촉되는, 방법.
109. 단락 101 내지 단락 108 중 어느 한 단락에 있어서, 상기 샘플이 각 염색체 암에 특이적인 최대 20개의 올리고뉴클레오티드 태그와 접촉되는, 방법.
110. 단락 101 내지 단락 109 중 어느 한 단락에 있어서, 상기 샘플이 인간 세포 핵을 포함하는, 방법.
111. 단락 101 내지 단락 110 중 어느 한 단락에 있어서, 상기 샘플이 임의의 유기체의 세포로부터의 핵을 포함하는, 방법.
112. 단락 101 내지 단락 111 중 어느 한 단락에 있어서, 상기 샘플이 중기 염색체 스프레드를 포함하는, 방법.
113. 단락 101 내지 단락 112 중 어느 한 단락에 있어서, 상기 중기 염색체가 배양된 세포 핵으로부터 수득되는, 방법.
114. 단락 101 내지 단락 113 중 어느 한 단락에 있어서, 중기 염색체가 조직 절편, 오르가노이드, 또는 생검 표본으로부터 추출된 핵으로부터 얻어지는 것인, 방법.
115. 샘플에서 적어도 하나의 표적 분자의 고해상도 이미지를 생성하는 방법으로서, 상기 방법은,
a. 고해상도 이미지화 방법의 적어도 1 라운드를 사용하여 적어도 하나의 표적 분자를 이미지화하는 단계; 및
b. i. 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는,
A. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
B. 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,
를 포함하는, 단계;
ii. 샘플을 단락 1 내지 단락 54 중 어느 한 단락에 따른 판독 분자의 세트와 접촉시키는 단계; 및
iii. 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계,
를 포함하는, 상기 적어도 하나의 이미지화된 표적 분자의 아이덴티티(identity)를 결정하는 단계,
를 포함하는 방법.
116. 단락 115에 있어서, 상기 방법이 적어도 2개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
117. 단락 115 내지 단락 116 중 어느 한 단락에 있어서, 상기 방법이 적어도 12개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
118. 단락 115 내지 단락 117 중 어느 한 단락에 있어서, 상기 방법이 적어도 66개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
119. 단락 115 내지 단락 118 중 어느 한 단락에 있어서, 상기 방법이 적어도 258개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
120. 단락 115 내지 단락 119 중 어느 한 단락에 있어서, 상기 방법이 적어도 500개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
121. 단락 115 내지 단락 120 중 어느 한 단락에 있어서, 방법이 적어도 5000개의 표적 분자를 이미지화하는 단계를 포함하는 방법.
122. 단락 115 내지 단락 121 중 어느 한 단락에 있어서, 모든 표적 분자가 한 번에 이미지화되는, 방법.
123. 단락 115 내지 단락 122 중 어느 한 단락에 있어서, 표적 분자의 적어도 절반이 한 번에 이미지화되는, 방법.
124. 단락 115 내지 단락 123 중 어느 한 단락에 있어서, 상기 방법이 적어도 2 라운드의 고해상도 이미지화 방법을 포함하는, 방법.
125. 단락 115 내지 단락 124 중 어느 한 단락에 있어서, 상기 방법이 적어도 3 라운드의 고해상도 이미지화 방법을 포함하는, 방법.
126. 단락 115 내지 단락 125 중 어느 한 단락에 있어서, 상기 방법이 적어도 5 라운드의 고해상도 이미지화 방법을 포함하는, 방법.
127. 단락 115 내지 단락 126 중 어느 한 단락에 있어서, 상기 방법이 적어도 20 라운드의 고해상도 이미지화 방법을 포함하는, 방법.
128. 단락 115 내지 단락 127 중 어느 한 단락에 있어서, 상기 고해상도 이미지화 방법이, 올리고 확률적 광학 재구성 현미경 검사법(OligoSTORM); 구조 조명 현미경(SIM); 자극 방출 고갈(STED) 현미경 검사법; 및 나노규모 토폴로지에서 올리고 DNA 포인트 축적(DNA-PAINT)으로 이루어진 군으로부터 선택되는, 방법.
129. 단락 115 내지 단락 128 중 어느 한 단락에 있어서, 상기 고해상도 이미지화 방법이, 올리고 확률적 광학 재구성 현미경 검사법(OligoSTORM)을 포함하는, 방법.
130. 단락 115 내지 단락 129 중 어느 한 단락에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가 적어도 2 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
131. 단락 115 내지 단락 130 중 어느 한 단락에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가 적어도 3 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
132. 단락 115 내지 단락 131 중 어느 한 단락에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가 적어도 5 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
133. 단락 115 내지 단락 132 중 어느 한 단락에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가 적어도 10 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
134. 단락 115 내지 단락 133 중 어느 한 단락에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가 적어도 20 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
135. 단락 115 내지 단락 134 중 어느 한 단락에 있어서, 상기 적어도 하나의 표적 분자가, 1kb 핵산을 포함하는, 방법.
136. 단락 115 내지 단락 135 중 어느 한 단락에 있어서, 상기 적어도 하나의 표적 분자가, 15kb 핵산을 포함하는, 방법.
137. 단락 115 내지 단락 136 중 어느 한 단락에 있어서, 상기 적어도 하나의 표적 분자가, 50kb 핵산을 포함하는, 방법.
138. 단락 115 내지 단락 137 중 어느 한 단락에 있어서, 상기 적어도 하나의 표적 분자가, 100kb 핵산을 포함하는, 방법.
139. 단락 115 내지 단락 138 중 어느 한 단락에 있어서, 상기 적어도 하나의 표적 분자가, 1 Mb 핵산을 포함하는, 방법.
140. 단락 115 내지 단락 139 중 어느 한 단락에 있어서, 상기 적어도 하나의 표적 분자가, 염색체를 포함하는, 방법.
141. 단락 115 내지 단락 140 중 어느 한 단락에 있어서, 상기 적어도 하나의 표적 분자가, 게놈을 포함하는, 방법.
실시예
실시예 1
8 라운드의 인시투 시퀀싱 (in situ sequencing) 으로 진행한 3D 인간 게놈 맵핑
복제, 유전, 및 발생적으로 조절되는 유전자 발현은, 모든 염색체에 걸쳐 동시에 발생하는, 모든 게놈-차원의 과정이다. 실제로, 게놈-차원의 조정이 중단되면 게놈 손상, 염색체 파손 및 손실, 이수성, 유전자의 심한 오발현, 및 질병이 발생할 수 있다. 이와 같이, 게놈을 이들 전체로 조회할 수 있는 잠재력을 갖는 기술에 대한 수요가 증가하고 있다. 이러한 다양한 방법 중에서, 게놈의 공간적 조직화에 관한 정보를 제공하는 방법은 염색체의 3차원(3D) 배열이 게놈 기능 및 안정성과 강한 상관관계가 있다는 증거가 급증하고 있기 때문에 특별히 주목되어 왔다. Hi-C 및 기타 염색체 형태 캡처 기술, 뿐만 아니라 GAM(Genome Architecture Mapping)과 같은, 근접-기반(proximity-based) 캡처를 사용하는 분석은, 게놈 영역이 상호작용하고/하거나 핵내의 동일한 서브섹션에서 발견되는 빈도를 보고하기 때문에, 특히 강력하다. 이러한 게놈-차원의 방법은 인핸서와 프로모터 간의 시스 상호작용에서 활성 및 비활성 염색질의 염색체 내- 및 염색체 간-구획화에 이르기까지 전체 게놈이 조직화되는 계층적 방식을 밝혀내었다.
형광 제자리 혼성화(FISH)와 같은 방법은 또한 게놈을 고도로 내부적으로 조직화된 엔티티로 옹호한다. 방사성(radioactive) 및 효소성(enzymatic) 마커를 사용하는 초기 ISH 방법이 그랬던 것과 마찬가지로, FISH는 게놈의 서열-특이적 시각화를 허용하며, 가장 영향력 있는 이정표 중 하나는 개별 염색체가 별개의 영역을 형성할 수 있다는 발견이다. 이러한 연구는 유전자의 방사상(radial) 위치결정(positioning)과 활성 상태 사이의 상관 관계, 전좌 발생과 관여 염색체의 근접성 사이의 연관성, 및 DNA 복구와 관련된 동적 게놈 재구성을 포함하여, 무수히 많은 관찰을 이끌어 내었다.
게놈 기능에 대한 완전한 이해는 공간 정보를 제공할 뿐만 아니라 전체 게놈을 수용하는 도구를 필요로 하며, 이를 위해, 이러한 전체 게놈 이미지화 목표를 달성할 수 있는 일련의 기술이 본 명세서에 기재되어 있다. 특히, 광-시야(wide-field) 현미경을 사용하여 단일 세포 해상도에서 고도로 다중화된 게놈 시각화를 달성하는 OligoFISSEQ(Oligopaint + FISSEQ)로 총칭되는 3가지 FISSEQ 방법을 생성하기 위해 올리고페인트를 형광 인시투 시퀀싱 (in situ sequencing) (FISSEQ)과 결합하는 연구가 본 명세서 설명되어 있다. 이러한 전략은 올리고페인트 프로브에 내장된 바코드의 시퀀싱을 수반하며, 여기서 3가지 전략 중 하나는 라이게이션에 의한 시퀀싱(SBL)을 사용하고, 다른 하나는 합성에 의한 시퀀싱(SBS)을 사용하고, 세번째는 혼성화에 의한 시퀀싱(SBH)을 사용한다. 본 명세서에 나타낸 바와 같이, OligoFISSEQ의 3가지 형태 모두는 바코딩된 올리고페인트를 시퀀싱하는 데 사용할 수 있다. SBL이 있는 OligoFISSEQ에 초점을 맞춰, 인간 이배체 PGP1 피부 섬유아세포(남성, XY)의 66개 게놈 좌위를 단지 4 라운드의 시퀀싱으로 맵핑했다. 또한 본 명세서에는 바코드 검출을 유의하게 개선하는 방법이 설명되어 있으며, 이를 OligoFISSEQ와 함께 사용하여, 인간 X 염색체는 이의 길이를 따라 46개 영역을 맵핑하여 추적할 수 있다. 마지막으로, 단백질 및 DNA 맵핑에 대한 면역형광의 맥락에서 뿐만 아니라 OligoFISSEQ와 OligoSTORM을 결합하여 크기가 킬로베이스에서 메가베이스에 이르는 범위에 있는 복수의 게놈 표적을 동시에 초고해상도로 시각화할 수 있는 방법을 입증하는 것을 포함하여, OligoFISSEQ의 다양한 예시적 적용(applications)이 본 명세서에 제시되어 있다.
원리 및 검증
본원에 기술된 3가지 OligoFISSEQ 기술 모두의 기초가 되는 전략은 올리고페인트 올리고에 포함된 바코드의 제자리 판독을 통해 이미지화된 영역을 식별하는 것이다. 전체 게놈을 시각화하는 것이 장기적인 목표이므로, 이러한 기술은 염색체 조직을 밝힐 수 있는 확장가능한 방법을 필요로 한다. 이와 같이, 서열 특이적 방식으로 게놈을 표적화할 수 있는 생물정보학적으로 설계되고 재생가능한 단일 가닥 올리고뉴클레오티드(올리고)인, 올리고페인트가 본 명세서에서 사용된다(예를 들어, Beliveau et al. 2012, 전게서(supra) 참조; 예를 들어, 도 1A 참조). 중요하게도, 올리고페인트 올리고는 증폭, 다중화, 바코드 및 형광단-라벨링된(2차) 올리고의 혼성화를 통한 간접 시각화에 대한 적응성(amenability)을 포함하여, 다양한 기능을 허용하는, "스트리트"라고 하는 비게놈 서열을 포함한다(예를 들어, Beliveau et al. 2015, 전게서 참조). 혼성화 및 시각화의 순차적 라운드와 함께 올리고페인트에 바코드를 인코딩하면 올리고페인팅이 허용되어 스펙트럼적으로 구별되는 형광단에 대한 요구사항에 의해 일부 실험 상황에서 부과된 제한을 우회할 수 있으며; 일반적으로, 기존의 현미경은 종종, 중첩되는 형광단 여기 및 방출 스펙트럼으로 인해, 한 번에 3 내지 4개의 형광단만 사용하도록 제한된다.
FISSEQ는 원래 전사체(transcript) 분석을 위해 개발되었으며, 이의 최신 이력(iterations)은 RNA-FISSEQ, BaristaSeq 및 공간적으로 분해된 전사체 앰플리콘 판독 맵핑(STARmap; Spatially-resolved Transcript Amplicon Readout Mapping)을 포함한다(예를 들어, 각각의 내용이 그 전문으로 본 명세서에 참조로 통합되는 다음 문헌 참조: Lee et al. 2014, Science 343 (6177): 1360-1363; Chen et al. 2018, Nucleic Acids Research 46 (4): e22-e22; Wang et al. 2018, Science 361 (6400): eaat5691). 이러한 모든 방법은 라이게이션에 의한 시퀀싱(SBL) 및 합성에 의한 시퀀싱(SBS)을 포함하여 차세대 시퀀싱(NGS; Next Generation Sequencing)에 의해 제공되는 뉴클레오티드 수준 게놈 분해능을 활용하여, 세포 내 전사체의 3D 공간 맵을 제공한다(예를 들어, 다음 문헌 참조: Shendure et al., Science 309 (5741): 1728-32; 2005; Guo et al., 2008, Proc Natl Acad Sci U S A. 2008 Jul 8, 105(27):9145-50; Lee et al. 2014, 전게서; Chen et al. 2018, 전게서; Wang et al. 2018, 전게서). 이론에 얽매이는 것을 원치않으면서, FISSEQ를 사용하여 바코드화된 올리고페인트를 판독하고 이에 따라 게놈 규모 표적 시각화를 달성할 수 있다고 추론되었다. 수백에서 수천 개의 동일하게 바코드화된 올리고페인트를 게놈 표적에 표적화하면 일반적으로 FISSEQ에 의해 요구되는 증폭의 필요성을 제거할 수 있으며, 이에 따라 표적화된 영역의 기본 염색체 구조를 드러내는 FISSEQ의 능력을 향상시킬 수 있다. 또한, FISSEQ는 광시야 현미경으로 수행할 수 있으므로, FISSEQ를 기반으로 하는 전략은 한 번에 수백에서 수천 개의 세포에 대한 분석을 허용할 수 있다.
게놈에 혼성화된 올리고페인트의 바코드를 시퀀싱하는 능력을 평가하였으며, 먼저 SBL을 사용하여 라이게이션-기반 게놈 표적 조사(LIT)를 수행하고 SBS를 사용하여 합성-기반 표적 조사(SIT)를 수행하는 데 초점을 맞추었다(예를 들어, 도 2b 참조). 인간 염색체 19의 4.8Mb 단일 카피 영역에 대한 20,000개의 올리고를 표적으로 하는 올리고페인트 라이브러리(Chr19-20K 라이브러리)를 사용하였으며, 이는 기존 FISH에서의 이의 강력한 신호에 기인한다(데이터 미제시). 중요하게도, 올리고페인트 스트리트는 복수의 바코드를 수용할 수 있으므로, 단일 라이브러리는 LIT 및 SIT 둘 다를 수용하도록 설계하였으며, 그에 따라 LIT용 프라이머 결합 부위와 바코드를 메인스트리트(올리고페인트의 5' 말단)에 내포시키고 SIT용 프라이머-결합 부위와 바코드를 백스트리트(올리고페인트의 3' 말단)에 내포시켰다(예를 들어, 도 1a 참조). 도 1b-1d에 OligoFISSEQ-LIT(O-LIT) 및 OligoFISSEQ-SIT(O-SIT)가 더 자세히 설명되어 있으며; LIT 및 SIT는, 그 자체로, 시퀀싱 단계를 나타내는 반면, O-LIT 및 O-SIT는, OligoFISSEQ의 맥락에서, 각각, LIT 및 SIT의 사용을 나타낸다.
O-LIT(예를 들어, 도 1c 참조)를 사용하여, 바코드는 SOLiD(Sequencing by Oligonucleotide Ligation and Detection) 화학(예를 들어, Valouev et al. 2008, Genome Res. 2008 Jul, 18(7): 1051-1063.; McKernan et al. 2009, Genome Res. 2009 Sep;19(9):1527-41 참조)으로 판독되며, 여기서 LIT 바코드의 각 비트(예를 들어, 비트 당 5-nt)는 4개의 형광단 중 하나를 포함하는 절단가능한 8-머(mer)에 의해 판독된다. 간단히 말해서, 시퀀싱 프라이머는 스트리트에 혼성화되고 후속 바코드 판독은 라벨링된 8-머(mer)에 의한 첫 번째 바코드 비트의 결합으로 시작되며, 이후 라이게이션되고 이미지화된다. 그런 다음 8-머(mer)는 뉴클레오티드(nts) 5와 6 사이에서 절단되며, 처음 5-nt를 남기고 라벨을 제거하여, 다음 LIT 바코드 비트가 판독가능하게 된다. 이러한 초기 연구에서, 프라이머 결합 부위를 제외하고, 길이가 23개 염기이고 4 라운드 시퀀싱([4 라운드의 시퀀싱 * 비트 당 5-nts] + 4번째 라운드 후 절단되지 않은 3개 nts)을 수용하기에 충분한 바코드를 사용했고; 완전히 활용될 때, 4-비트 또는 8-비트 바코드는 각각 256개 또는 65,536개의 표적을 구별할 수 있다. 바코드 검출에서 편향을 최소화하기 위해, 자동화된 임계값 알고리즘을 사용하여 첫 번째 라운드에서 점(puncta)을 식별한 다음, 후속 라운드에서 이러한 위치로부터의 신호 강도를 측정하여, 가장 높은 SBR(signal over background ratio)을 나타내는 색상을 검출하였고(예를 들어, 방법 참조); LIT, SIT, 및 HIT 바코드는 모두 이 방법을 약간 변형하여 검출되었다. Chr19-20K 라이브러리에 대해 O-LIT를 사용하여, 4-비트 바코드가 세포의 92.1% ± 5.7%에서 성공적으로 회수되었다(n = 4개의 기술 복제물에서 핵 85개; 예를 들어, 도 1f 참조).
O-SIT(예를 들어, 도 1d 참조)의 경우, 바코드의 각 비트(비트당 1-nt)가 2개의 형광단을 포함하는 가역적 터미네이터 뉴클레오티드에 의해 판독되는, Ill㎛ina NextSeq™ 화학을 사용하여 바코드를 시퀀싱한다. 특히, 데옥시시티딘과 데옥시티미딘은, 각각, 스펙트럼의 적색과 녹색 범위에서 방출하는 형광단으로 라벨링되어 있으며, 데옥시아데노신은 이들 2가지 형광단의 조합으로 라벨링되고, 데옥시구아노신은 라벨링되지 않는다. 여기에서, 시퀀싱 프라이머는 스트리트에 혼성화되고, 바코드의 각 비트(1-nt)에 대한 후속 판독은 SIT 바코드를 주형으로 사용하여 프라이머를 한 번에 한 염기씩 연장함으로써 달성되며, 이때 각 연장 라운드에 이어 이미지화하고 나서 다음 라운드의 연장에 앞서 라벨을 제거한다. SIT 바코드는 컴팩트하며; 프라이머 결합 서열을 제외하고, 여기에 사용된 바코드는 단지 4개의 염기 길이에 불과했으나 4 라운드의 시퀀싱(4 라운드의 시퀀싱 * 비트 당 1-nt)과, 완전히 활용되는 경우, 256개의 표적을 수용하기에 충분했고; 실제로, SIT 바코드는 단지 8개 염기만으로 65,536개 표적을 표적화할 수 있었다. SIT는, Chr19-20K 라이브러리를 사용하여, 4-비트 바코드가 90.6% ± 5.8%의 세포에서 성공적으로 회수되었기 때문에, LIT와 비슷했다(n = 4개의 복제물에서 66개 세포, 도 1f 참조).
SBL 및 SBS용 바코드를 올리고페인트 스트리트로 코딩하는 과정에서, 상응하는 LIT 및 SIT 바코드는 혼성화에 의한 시퀀싱(SBH)을 통해 혼성화-기반 표적 조사(HIT)를 위한 바코드로 용도변경될 수 있다고 구상하였다(예를 들어, 도 1a 참조). SBH의 경우, 라벨링된 2차 올리고의 순차적 혼성화를 통해 판독되는 복수의 바코드의 조합 사용을 통해 표적이 식별된다. 이러한 전략은 올리고페인트를 전사체 프로파일링에 사용할 수 있게 했다(예를 들어, 각각의 내용이 그 전문이 본 명세서에 참조로 통합되는 다음 문헌 참조: Chen et al. 2015, Science 348 (6233); Eng et al. 2017, Nature. 2019 Apr, 568(7751):235-239; Eng et al. al., Nature. 2019 Apr, 568(7751):235-239). 여기에서는, 최초로 염색체 DNA의 제자리 3D 공간 맵핑을 위한 SBH의 사용을 기술한다. 특히, OligoFISSEQ-HIT(O-HIT)는 2개의 브릿지 올리고를 통해 SBH에 대한 바코드(바코드당 20nts)를 통합하여 구현되었으며, 한 브릿지는 메인스트리트에 결합되고 프라이머 결합 부위와 O-LIT에 사용되는 바코드 사이의 접합부에 걸쳐 있으며, 다른 브릿지는 백스트리트에 결합되고 동일한 O-SIT 구성요소 사이의 교차점에 걸쳐 있다(예를 들어, 도 1e 참조). 특히, 2개의 브릿지 각각은 총 4개의 위치에 대해 2개의 바코드를 위한 위치를 포함하였으며, 여기서 각 위치는 이후 6개의 라벨링된 2차 올리고로 쿼리된 6개의 가능한 바코드 중 하나를 코딩하였고; 3개의 형광단 종을 사용할 수 있었기 때문에, 2차 올리고를 2 라운드의 혼성화에 도입하였으며, 각 라운드에서는 모두 4개의 HIT 바코드를 판독하기 위해 총 8 라운드의 혼성화에 대해 3개의 차등적으로 라벨링된 2차 올리고를 이용했다. 이 전략은 1,296개의 표적(64개)을 식별할 수 있으며, 바코드 서열에 대한 추가 선택사항을 추가하고/하거나 더 많은 바코드 위치를 수용하도록 브릿지를 연장하여 표적 용량을 늘릴 수 있는 옵션이 있다(데이터 미제시). O-HIT는 스트리트 내로 직접적으로 코딩된 바코드를 사용하여 구현할 수도 있지만, 올리고페인트 라이브러리가 SBL과 SBS를 동시에 수용할 수 있도록 하기 위해 바코드를 브릿지 상에 배치하였음에 주목할 필요가 있다. Chr19-20K 라이브러리에서 O-HIT를 사용하여 4비트 바코드가 91.6%±3.8%의 세포에서 성공적으로 회수되었다(n = 4개의 복제물에서 79개 세포(예를 들어, 도 1f 참조).
LIT를 통한 OligoFISSEQ
그 다음 OligoFISSEQ를 복수의 염색체 상의 복수의 좌위를 처리하는 데 사용하였고, 바코딩 및 확장성에 관한 5가지 논의를 기반으로, O-LIT에 대해 노력을 집중하였으며; 시퀀싱에서의 혁신이 계속해서 등장하고 그에 따라 임의의 한 전략을 우수한 것으로 식별하는 것이 비현실적임을 감안하여, 여기에서는 시퀀싱 전략이 무엇이든 간에 전체 게놈을 맵핑하는 OligoFISSEQ의 능력에 대한 원리증명을 제공하는 것임에 주목할 필요가 있다. 먼저 LIT는 각 비트의 판독을 위해 양의 신호를 필요로 하기 때문에, LIT 기술에 대해 노력을 집중하였다. 이론에 얽매이는 것을 원치않으면서, LIT가 가장 강인한 바코드를 제공할 것이라고 추론하였다. 이것은 적어도 일부 비트가 신호가 없는 것으로 코딩되고, 그에 따라 신호의 부재(예를 들어, SIT의 경우, 데옥시구아노신; HIT의 경우, 라운드 사이에 특정 바코드의 부재)를, 각각, 유용한 것(informative)으로 해석할지 아니면 비효율적인 라운드의 화학 또는 혼성화의 결과로 해석할지에 대한 모호함에 취약하게 만드는, SIT 및 HIT와 대조적이다. 둘째, 신호의 부재를 유용한 것으로 사용하지 못하도록 하면 SIT 및 HIT의 확장성이 상당히 감소될 수 있다. 예를 들어, 4 라운드의 시퀀싱만 고려하면, SIT의 경우 색상 수를 4개에서 3개로 줄이면 식별가능한 표적의 수가 256(44)에서 81(34)로 줄어든다. HIT의 경우, 신호를 생성하기 위해 모든 라운드의 이미지화를 요구하면 임의의 바코드 위치에 대해 가능한 바코드 서열의 수를 3개로 제한시켜 4개의 바코드 위치를 사용하여 식별할 수 있는 총 표적의 수가 앞에서 설명한 1,296(64)이 아닌 81(34)이 되게 할 수 있다. 셋째, 데옥시아데노신이 2개의 형광단의 존재에 의해 검출되는, SIT의 경우, 하나는 스펙트럼의 적색 범위에서 방출하고 다른 하나는 녹색으로 방출하며, 2개의 형광단의 핵 백그라운드에 대한 신호의 비율(SBR)이 너무 다르기 때문에 판독이 모호해질 수 있다. 넷째, HIT 및 SIT의 이러한 모든 측면은, SBR이 감소하는 경우, 시퀀싱의 후반 라운드에서 훨씬 더 문제가 될 것이다(예를 들어, 방법 참조). 마지막으로, LIT 및 SIT에 비해, HIT는 확장성이 떨어진다. 예를 들어, HIT에 대한 현재 전략은 8 라운드의 혼성화로 1,296개의 표적을 국재화하는 능력을 가지고 있지만, 8 라운드의 LIT 및 SIT로는 65,536개의 표적을 수용할 수 있으며; 이렇게 많은 수의 표적을 수용하기 위해 HIT를 확장하려면 바코드 위치를 증가시키고 그에 따른 혼성화의 수를 8에서 ∼14로 증가시켜야 한다.
66개의 게놈 표적 맵핑
다음으로, 확장을 위해 LIT의 능력을 평가하기 위해 6개의 염색체(2, 3, 5, 16, 19, 및 X) 각각을 따라 6개 영역을 표적으로 하는 올리고페인트 라이브러리(36plex-5K; 예를 들어, 도 2a 참조)를 설계하였고; 36plex-5K는 총 66개의 표적(단일 X 상의 6개 표적 외에 5개의 상염색체의 2개의 상동체 각각에 대한 6개의 표적)을 포함하며, 각각 5,000(5K) 올리고페인트 올리고로 타일링되었고, 함께 31.6Mb의 게놈을 포함하고, 개별 표적의 게놈 크기는 642kb 내지 1.22Mb(평균 876kb) 범위이다. 이미지화된 염색체의 경로를 대략적으로 추적할 수 있도록, 3개의 표적을 각 염색체 암을 따라 전략적으로 배치하였으며, 하나는 텔로미어, 암의 중앙, 및 중심체(centromere)에 최대한 가깝게 배치하였다. 유전자가 부족한 것(예를 들어, 5.4 - 6.1 유전자/Mb; Chr 2, 3, 5, X) 및 유전자가 풍부한 것(예를 들어, 각각 10.8 및 23 유전자/Mb; Chr 16 및 19) 둘 다를 비롯하여 큰 염색체(예를 들어, Chr 2: ∼247Mb) 및 작은 염색체(예를 들어, Chr 19: ∼60Mb)에서 부위를 선택하였다. 염색체 암에 따라, 표적 사이의 거리는 7Mb에서 74.9Mb에 이르는 범위이며, 평균 32.5Mb이다. LIT의 강인성을 평가하여 다양한 길이 규모와 밀도(4 - 7.7 올리고 표적/kb, 평균 5.8)의 표적을 시퀀싱하기 위해 표적당 올리고페인트 올리고의 수(5,000)를 일정하게 유지했다. 다른 게놈 좌위에서 동일한 바코드의 회수를 평가하기 위해, 2개의 표적(Chr3qR3 및 Chr5pR3)을 동일한 바코드로 코딩했다. 36plex-5K의 전반적인 특이성을 평가하기 위해, 라이브러리를 중기 염색체 및 간기 핵에 혼성화하여, 동일한 염색체를 표적으로 하는 모든 올리고의 백스트리트에서 공유되는 염색체-특이적 바코드를 표적으로 하는 2차 올리고로 표적을 시각화하였다. 중기 염색체에서, 예상되는 6-밴드화된(banded) 염색체가 관찰되었고, 간기 핵에서는 예상되는 수의 염색체 영역이 관찰되었다(예를 들어, 도 2b 참조).
모든-픽셀 자동화 분석 파이프라인
4 라운드의 O-LIT는 간기 세포에서 66개의 36plex-5K 표적을 100% 성공적으로 식별했다(n = 2개의 복제물로부터의 세포; 데이터 미제시). 표적 신호를 증폭하고 식별력을 높이기 위해, 36plex-5K는 메인스트리트와 백스트리트 모두에 동일한 바코드를 포함하여, 두 스트리트에서 동시에 시퀀싱(MSBS)을 가능케하였다(예를 들어, 도 2c 참조). 이전에 단일 좌위(Chr19-20K, 도 1a-1f 참조)를 디코딩하는 데 사용된 알고리즘이 이러한 연구에서 발생한 표적 신호 강도 크기의 범위를 수용할 수 없었기 때문에, 핵을 수동으로 디코딩하였다. 그러나, 수동 디코딩은 잘 확장되지 않으며, 각 핵을 디코딩하는 데 최대 3시간이 필요하다. 따라서, 모든 픽셀을 개별적으로 조사하여 광범위한 신호 강도 및 크기를 처리할 수 있는 이미지 분석을 위해 자동화된 파이프라인을 개발했다(예를 들어, 도 3a 참조). 간단히 말해서, 이 접근 방식은 모든 시퀀싱 라운드의 이미지를 정렬함으로써 시작하여, 각 형광단 종(species)에 대한 신호 강도의 히스토그램을 생성하고, 그런 다음 채널의 히스토그램을 정규화하여, 픽셀 강도를 다른 형광단에 걸쳐 비교할 수 있도록 한다. 다음으로, 각 시퀀싱 라운드의 모든 이미지의 각 픽셀은 개별 단위로 분석, 추적, 및 디코딩되고(예를 들어, 각각의 내용이 그 전문으로 본 명세서에 참조로 통합되는 다음 문헌 참조: Lee et al. 2014, 전게서; Lee et al. 2015, Nature Protocols 10(3): 442-458), 이 후 모든 픽셀에 대한 생성된 바코드가 가능한 모든 바코드 목록과 매칭되고, 양의 매치가 맵핑된다. 이후 인접한 동일한 바코드가 있는 픽셀이 또한 그룹화되어 3D 픽셀 패치를 형성한다.
"모든-픽셀(every-pixel)" 접근 방식은, 복수의 픽셀에 걸쳐 있는 신호가 신호의 중심 위치를 통해 추적되는, 도심-기반(centroid-based) 접근 방식에 비해 장점이 있다. 첫째, 이것은 시퀀싱의 한 라운드로부터의 적어도 하나의 픽셀이 다른 라운드의 픽셀과 중첩될 가능성이 도심 중첩의 가능성에 비해 크기 때문에 복수-픽셀 신호의 불완전한 정렬에 대해 더 관대하다. 둘째, 이것은 모든-픽셀 접근 방식에 의해 제공되는 공간 해상도는 비-중첩 픽셀의 아이덴티티(identity)가 보존되도록 하기 때문에, 핵 내의 DNA의 조밀하게 패킹된 특성으로 인해, 3D 공간에서 가까이 위치하고 있는 게놈 표적의 위치를 더 잘 해상되도록 할 수 있다(예를 들어, 도 3a 참조; 표적 2pR1 및 2pR2).
모든-픽셀 파이프라인은 2N 세포에서 36plex-5K 표적의 높은 비율(95 ± 5.15%)을 검출하였으나, 많은 수의 위양성(FP)(핵당 582 FP; n = 13개 복제물에서 638개 세포; 데이터 미제시)을 수반하였다. FP를 필터링하기 위해, 2-티어 시스템이 개발되었으며, 여기서, 먼저 티어 1에서는 최소 신호 강도 및/또는 패치 크기 미만의 픽셀을 필터링하였다. 티어 1은, 단독으로, 각 핵(13개 복제물에서 638개 세포)에서 62.1±6.68%의 표적(∼41/66)을 검출하면서 FP를 166배(3.49 FP; 5.29%) 넘게 감소시켰다. 티어 2에서, 픽셀 강도 및 패치 크기에 대한 요구사항을 낮추었고, 그런 다음 바코드 서브샘플링을 적용하였으며, 새로 감지된 모든 신호는 동일한 염색체로부터의 티어 1 표적의 4.5㎛ 이내에 있도록 필터링되었다. 이 근접성(proximity)-기반 필터링은 단일 염색체를 따라 검출된 연속적인 티어 1 좌위 사이의 거리에 대한 이전의 측정값뿐만 아니라, 별도의 영역(territories)을 차지하는 염색체의 경향을 반영하였다(데이터 미제시; 방법). 티어 2는 모든 FP를 제거하면서 각 핵에서 표적의 80.2±7.3%(∼52/66)를 검출하였으며 세포의 75%에서 표적의 적어도 60%가 회수되었다(데이터 미제시). 티어 1 데이터로부터, 가장 적게 검출된 3개의 표적은 모두 평균 올리고페인트 올리고 밀도(< 5.88 올리고/kb) 미만인 것으로 결정되었으며, 이는 표적 밀도가 검출을 위한 표적 크기보다 더 중요할 수 있음을 나타낸다. 초기 원리-증명 실험에서 얻은 다른 통찰력과 함께 표적 밀도는 자동화된 분석 파이프라인의 수준을 수동 측정과 견줄 수 있는 수준으로 높이는 데 중요하다. 중요하게도, O-LIT는, PGP1f 세포를 사용한 13개의 복제물이 유사한 범위의 바코드 회수를 생성함에 따라, 재현가능하고 강인하다(데이터 미제시).
단일 세포 해상도로 정밀 규모 게놈 조직화
36plex-5K의 O-LIT 맵핑은 매우 상세한 단일 세포 해상 공간 게놈 데이터를 산출하였다(예를 들어, 도 3c-3e 참조). 이전 연구와 일관되게, 더 작은 염색체(예를 들어, Chr16 및 Chr19)와 더 큰 염색체(예를 들어, Chr2, Chr3, Chr5)는, 각각, 핵의 중심과 주변에 우선적으로 국재화되었다(데이터 미제시). O-LIT는 개별 염색체 3-D 경로의 추적을 가능케했다(예를 들어, 도 3d 참조). 66개 표적 각각 사이의 페어와이즈 3-D 공간 거리를 측정하여 상동성 해상 거리 매트릭스를 생성하였다. O-LIT는 거리 매트릭스 및 추적의 단일 세포 비교를 허용한다(예를 들어, 도 3E 참조). 단일 세포 데이터가 또한 집계되어, Hi-C 히트맵을 연상시키는 표적 간의 평균 거리 매트릭스를 생성할 수도 있다(예를 들어, 도 3f 참조). 여기에서는 각 상동체의 모체 기원이 미상이므로, 상동성 표적을 그룹화하였다. Hi-C 매트릭스는 PGP1f 세포의 동일한 36plex-5K 영역에서 유래되었으며(예를 들어, 문헌[Nir et al. 2018, PLOS Genetics 14(12): e1007872] 참조), 이것을 638개 세포로부터의 집단 평균 거리 매트릭스와 비교하여, 2개의 개별 방법 사이의 높은 상관 관계(r2 = 0.705; 도 SX)를 발견하였다. (예를 들어, Hi-C와 비교하여) O-LIT의 2가지 장점은, 첫째, 관심 좌위가 함께 교차-연결될 만큼 충분히 근접하여야 하는 요구조건 없이도 게놈 좌위를 맵핑할 수 있다는 것이다. 둘째, O-LIT는 단일 세포, 상동체 둘 다에 대한 분해된 데이터 뿐만 아니라 벌크 집단 데이터를 양산하는 능력이 있다. 특히, 동일한 핵에서 복수의 표적을 분석할 수 있다. 따라서, O-LIT는 여러 수준에서 게놈 구조-기능 관계를 조사하는 데 유용한 툴이다.
OligoFISSEQ 정확한 바코드 LIT (eLIT)
여기에는 LIT를 더 접근가능하게 할 뿐만 아니라 신호 검출을 개선하는 LIT 시약이 기술되어 있다. 이러한 시약은 아래 기술되며, SOLiD 화학에 대한 간략한 설명으로 시작한다.
SOLiD 화학은 서열을 디뉴클레오티드로 판독하고, 그에 따라, G, A, T 및 C의 모든 16개 가능한 디뉴클레오티드 조합을 나타내는 ∼1,024종의 형광단-라벨링된 8-nt 올리고를 사용한다. 모두 ∼1,024종의 올리고는 새로운(de novo) 게놈 시퀀싱의 맥락에서 필요하므로, 이러한 복잡성의 올리고 풀은, 사용자가 바코드를 정의하는 OligoFISSEQ와 같은, 표적 접근 방식에 과도하다. 이와 같이, LIT에 대한 올리고 풀의 복잡성은 본 명세서에서 eLIT로 지칭되는 보다 정확한 형태의 LIT를 허용하기에 적당히 충분한 바코드(JEB)를 사용함으로써 감소되었다. 이론에 얽매이는 것을 원치않으면서, JEB가 백그라운드에 비해 신호를 증가시킬 수 있다고 추론되었다(예를 들어, 도 4a 참조). eLIT는 다양한 바코드 구성(configurations)과 호환되지만, 여기에 설명된 애플리케이션은 각각 5-비트로 구성된 바코드를 사용하며, 여기서 각 비트는 단지 4개의 별개의 5-nt 시퀀스 중 하나이다. 이들 비트는 4종의 8-nt 올리고 풀로의 라이게이션에 의해 시퀀싱되며, 각각의 3' 말단은 5-nt 비트 중 하나에 완벽하게 상보적이며 절단 후 유지되고 라이게이션 후 나머지 3개 염기가 제거된다(예를 들어, 도 4b 참조). 8-nt 올리고 풀의 복잡성을 더 줄이기 위해, 위치 6, 7, 8에 관용적인(traditional) 뉴클레오티드 염기의 믹스 대신, "범용 염기" 데옥시이노신을 사용하였다. 간단히 말해서, JEB는 라벨링된 올리고 풀 ∼1,024에서 4로 감소시켰다. Chr19-9K에 대해 OligoFISSEQ eLIT(O-eLIT)의 적용은 SOLiD 올리고를 사용하여 동일한 라이브러리에 대해 LIT의 적용과 비교하여 3.3배 더 밝은 SBR을 생성시켰다(n > 55개 핵; 데이터 미제시).
더 작은 표적을 검출하는 O-eLIT의 능력을 테스트하기 위해, 라이브러리를 36plex-5K와 유사하게 설계하였다(데이터 미제시). 동일한 36개 영역을, 36plex-5K 라이브러리의 각 표적으로부터의 5,000개의 올리고페인트 올리고 중 처음 1,000개만 사용하여 더 정밀한 게놈 분해능(표적 당 평균 173kb 대 876kb)으로 표적화하였다. 예를 들어, 표적 2pR1의 경우, 36plex-5K는 1,002,895 내지 1,660,898(∼658kb)에 걸친 좌위를 표적으로 삼는 반면, 36plex-1K는 1,002,895 내지 1,147,495(144kb)를 표적으로 삼는다. 36plex-5K에 대해 라이브러리를 벤치마킹하기 위해, 36개 표적 중 35개에 대해 동일한 바코드를 채택하였으며, 예외적으로 5pR3의 바코드는 이전에 별개 좌위들 간에 바코드 검출을 테스트하기 위해 3qR3과 동일한 바코드를 공유하였다. 메인스트리트만 사용하여, 36plex-1K라고 하는, 이 라이브러리의 O-eLIT 시퀀싱은 5 라운드 후 O-LIT(SOLiD 시약)로 얻은 것보다 더 높은 바코드 회수를 양산하였다(티어 2 검출: 76.4±8.6%, n = 8개 복제물의 439개 세포 대 54.6%, n = 41개 세포, 예를 들어, 도 4c-4d 참조). 36plex-1K 라이브러리의 O-eLIT는 또한 모든 표적 염색체에 걸쳐 상동체 분석된 단일 세포 공간 데이터를 생성한다(데이터는 미제시).
정밀한 ChrX 경로 추적.
O-eLIT는, 예를 들어, 인간 X 염색체를 따라 46개 영역 각각에 2,000개의 올리고를 표적으로 하는 올리고페인트 라이브러리(ChrX-46plex-2K)를 적용함으로써 더 정밀한 게놈 분해능으로 염색체를 추적할 수 있으며, 여기서 표적화된 영역은 253kb에서 1.22Mb(평균 445kb)에 이르는 크기 범위이며, 표적 간의 평균 거리는 2.75Mb이고, X 염색체의 총 적용범위(coverage)는 20.4Mb 또는 13.3%이다(예를 들어, 도 5a 참조). 이와 같이, ChrX-46plex-2K는 다른 모든 염색체를 수용하는 OligoFISSEQ의 능력을 평가하기 위한 매우 유용한(informative) 프록시로 역할을 하였다. 메인스트리트 또는 메인스트리트와 백스트리트 둘 다로부터의 O-eLIT 시퀀싱은 유사한 바코드 회수를 산출하였으며(데이터는 제시되지 않음), 그에 따라 두 세트에서 얻은 데이터를 합하였다. 티어 2 검출은 남성 PGP1f 세포에서 표적의 평균 74.6±2.5%(∼34/46; n = 2개의 복제물에서 146개의 핵)를 회수하였다(예를 들어, 도 5b-5c 참조). X19는 티어 1 이후에는 회수할 수 없었고, 티어 2 이후에는 시간의 28%만 회수할 수 있었다. X19는 Q 암의 중심체에 인접한 영역을 표적으로 하며, 이는 올리고페인트 프로브에 대한 이 영역의 억제 기능을 시사한다. 비검출된 표적의 위치를 근사화하기 위해, 티어 2 이후 검출된 표적 사이의 3D 유클리드(Euclidean) 거리를 계산한 다음, 어느 한쪽에서 검출된 표적을 연결하는 가상의 선을 따라 비례적으로 이격된 거리에서 비검출된 표적을 할당했다. 보간(interpolation)을 위한 이 전략은 X의 고해상도 추적 및 거리 매트릭스의 생성을 허용시켰다(예를 들어, 도 5d-5f 참조). O-eLIT는 또한 2개의 X 염색체가 존재하는 PGP1f 세포를 검출하고 추적하였고; 이러한 세포는 자매 X 염색체가 분리된 X 또는 G2 세포에 대한 이수성을 반영할 수 있었다(데이터는 미제시됨). 마지막으로, ChrX-46plex-2K는 메인스트리트와 백스트리트를 독립적으로 시퀀싱할 수 있도록 설계되었기 때문에, 100만개 이상의 표적(104 = 1,048,576)을 구별할 수 있는 잠재력이 있는 10-비트 바코드에 영향을 줄 수 있다(데이터는 미제시됨).
OligoFISSEQ 적용
마지막으로, OligoFISSEQ 및 단일 유전자 분석 뿐만 아니라 면역형광(IF), 및 초해상도 현미경의 조합을 포함하지만 이에 제한되지 않는, 다른 기술과의 조합의 추가 적용이 여기에 제시된다(예를 들어, 도 6a-6d 참조).
OligoFISSEQ-eLIT를 사용하여 11kb에서 100kb에 이르는 크기 범위의 6개 유전자를 시퀀싱하고 맵핑하였다(예를 들어, 도 6a-6b 참조). 특정 경로와 관련된 특정 유전자 패널을 맵핑하는 것은 발달 및 암과 같은 분야에서 매우 유용할 수 있다.
다음으로 OligoFISSEQ-LIT를 IF와 조합하여, 게놈 구조 및 단일 세포에서의 단백질 국재화 둘 다의 연구가 가능하였다(예를 들어, 도 6c 참조). 이러한 기술은 인간 세포 아틀라스(atlases)의 구축에 사용될 수 있다. 따라서 OligoFISSEQ와 IF를 조합하면 게놈과 단백질 사이의 공간적 관계를 탐색할 수 있다.
마지막으로, OligoFISSEQ는 게놈 영역이 초해상도로 이미지화될 수 있는 효율성을 개선한다. 보다 명시적으로, OligoFISSEQ는 광시야 현미경으로 수행할 수 있기 때문에, 단일 실험에서 수백에서 수천 개의 세포를 이미지화할 수 있고 그에 따라 ≥ ∼250 nm의 분해능이 충분한 분석에 통계적 능력을 제공할 수 있다. OligoFISSEQ의 이러한 장점은 OligoSTORM(예를 들어, Beliveau et al. 2015, 전게서 참조)과 같은, 단일-분자 국재화 현미경을 사용하는 초해상도 이미지화 방법의 장점과 대조적이며, XY에서 수십 nm에 도달하고 Z에서 수백에 도달하는 정밀도로 게놈에 대한 이미지를 제공할 수 있지만, 이미지화할 수 있는 세포의 수의 측면에서 제한된다. 따라서, O-LIT는 OligoSTORM과 조합되어 단지 단일 라운드의 단일-분자 국재화 현미경으로 6개 게놈 영역의 XY 및 Z 해상도 이미지에서 40±5 및 60±5 nm를 생성하였다. 특히, Chr2-6plex-5K 라이브러리를 적용하였고 Alexa Fluor 647로 라벨링된 2차 올리고에 대한 결합 부위를 포함하는 브릿지 올리고를 도입하였다. 라이브러리는 염색체 2의 6개 영역에서 20개의 PGP1f 세포를 표적으로 하였다. 그런 다음 1 라운드의 OligoSTORM을 수행하여 6개의 Chr2 표적(예를 들어, 도 6d 참조)의 초고해상도 이미지를 생성한 후, O-LIT 프라이머를 도입하였다. 그런 다음 6개의 표적을 디코딩하기 위해 2 라운드의 O-LIT로 핵을 이미지화하였다. 즉, 단일 라운드의 OligoSTORM에 이어 2 라운드의 O-LIT가 Chr2(n = 7개 세포) 상의 표적을 식별하고 이의 92.8%를 초고해상도로 나타내었다. 임의의 양태의 일부 실시형태에서, 근접 표적이 OligoSTORM의 순차적 라운드에 의해 해상될 수 있도록 OligoFISSEQ를 먼저 수행할 수 있다. OligoSTORM과 O-LIT를 조합하는 것은 강력한 기술이며, 이는 OligoSTORM의 단일 단계가 O-LIT로 식별된 임의의 별개 게놈 영역에 대한 초고해상도 이미지를 제공할 수 있기 때문이다.
고찰
결론적으로, 제자리 게놈 맵핑을 위한 한 무리의 방법인 OligoFISSEQ가 본 명세서에 기술되어 있다. 본 명세서에 기술된 바와 같이, 6개의 염색체에 걸친 66개의 게놈 좌위뿐만 아니라, X 염색체를 따라 46개 영역의 더 정밀한 염색체 추적을 맵핑하는데 OligoFISSEQ를 사용되었다. 더불어, 이러한 실험은 OligoFISSEQ를 확장하여 고해상도로 전체 게놈을 맵핑하고 염색체를 추적하는 능력을 보여준다. OligoFISSEQ는 광시야 현미경을 사용하므로, 단일 실험으로 수천 개의 세포를 생성할 수 있으며, 이는 게놈 조직화 및 기능 간의 관계에 대한 추가 통찰력을 얻을 수 있다. 공간 트랜스크립토믹(transcriptomics)은 또한 OligoFISSEQ 방법에 통합되어, 파노믹(panomic)(예를 들어, 게놈, 트랜스크립톰, 및 프로테옴) 공간 맵이 생성될 수 있다. 단일 세포를 대규모로 분석하면 게놈 조직적 변이와 기능적 결과를 조사할 수 있다. 특히 흥미로운 것은 게놈이 조직화되는 정도이다. 한편, 게놈 구조의 이질성은 여러 규모에서 관찰되었다. 반대로, 특정 영역에 대한 염색질 히스톤 변형과 유사한 염색질 구조적 시그니처도 존재할 수 있다. 본 명세서에 기술된 OligoFISSEQ 방법은, 다양한 조건하에서, 수많은 세포 및 조직에서 다양한 규모로 게놈을 시각화할 수 있다.
재료 및 방법
올리고페인트 라이브러리 설계: 올리고페인트 FISH 프로브를 최적의 혼성화 및 높은 특이성을 위해 컴퓨터로 설계하였다. 올리고페인트 게놈 결합 서열은, hg19 게놈 및 균형 설정을 사용하여, 올리고페인트 웹사이트(예를 들어, oligopaints.hms.harvard.edu의 월드 와이드 웹에서 이용이능함; 예를 들어, Beliveau et al. 2018, 전게서 참조)에서 얻었다. 게놈 상동성 서열의 범위는 35-41 nt이다. 범용 순방향 및 역방향 프라이밍 시퀀스는 OligoLEGO를 사용하여 각 올리고페인트 올리고에 추가하였으며(예를 들어, 월드 와이드 웹 github.com/gnir/OligoLego에서 이용이능함), 이는 라이브러리를 PCR 증폭하고 재생가능하게 한. 범용 프라이밍 서열은 또한 다양한 OligoFISSEQ 프라이머/브릿지 부위로 사용하였다. 여기에 사용된 각 라이브러리는 특정 특징(features)으로 설계하였으며 각 세트에 대해 자세히 설명되어 있다.
라이게이션 기반 표적 올리고페인트 조사: Chr19-20K 라이브러리의 경우, 범용 정방향 프라이밍 서열의 일부를 LIT 프라이머 결합 부위로 사용하고, 이어서 LIT 바코드를 사용하였다. 바코드 및 색상-코드 지정은 다음과 같다: 4 = Cy5/Alexa-647, 3 = TxRd, 2 = Cy3, 1 = FITC/Alexa-488.
36plex-5K 라이브러리는 동일한 범용 정방향 프라이밍 서열을 공유하고 염색체 특이적 범용 역방향 프라이밍 서열을 포함하였다. 범용 역 프라이밍 서열을 사용하여 개별 염색체 표적을 증폭, 혼성화 및 검출할 수 있다. 범용 정방향 프라이밍 서열을 LIT 프라이머 결합 부위로 사용하였다. 사용된 LIT 프라이머는 18-nt이다. O-LIT를 메인스트리트와 백스트리트 둘 다에서 수행한 경우, LIT 프라이머 결합 부위를 백스트리트에 추가하였다. 바코드는 OligoLego의 서열을 사용하여 지정되었다. 후보 바코드 서열을 디코딩하여 색상-코드를 나타내었다. 인접 표적 간의 색상-코드 다양성을 유지하기 위해, 바코드를 표적에 수동으로 할당하였다(예를 들어, 첫 번째 라운드에서 인접 표적이 다른 색상을 갖도록 바코드를 지정함). 각 LIT 바코드 비트에는 5-nt 서열이 필요한 반면, 마지막 바코드 비트에는 8-머(mer) 결합을 위한 적절한 공간을 허용하기 위해 8-nt가 필요하다. 따라서, 4-비트 바코드에는 총 23-nt가 필요하다. 36plex-5K의 경우 표적 3qR3 및 5pR2에는 별도의 게놈 표적에서 바코드 회수를 평가하기 위해 동일한 바코드 서열이 포함되었다.
JEB/O-eLIT 바코드: 36plex-1K, ChrX-23plex-Odd, ChrX-23plex-Even의 경우(ChrX-46plex-2K는 ChX-23plex-Odd 및 ChrX-23plex-Even의 조합임). 36plex-1K 라이브러리 표적은 표적당 5,000개 대신 1,000개의 올리고페인트 올리고를 사용하여 36plex-5K 대상의 하위영역을 표적으로 했다. 또한, 36plex-1K 표적에는 JEB 호환 바코드 비트가 포함되어 있다. 36plex-1K 표적에는 36plex-5K와 동일한 바코드 비트 색상-코드가 포함되어 있으며, 표적 5pR3은 예외이다.
ChrX-46plex 라이브러리는 표적당 2,000개의 올리고페인트 올리고가 있는 전체 인간 X 염색체에 걸쳐 있도록 설계되었다. 라이브러리는 2개의 하위-라이브러리(ChrX-23plex-odd 및 ChrX-23plex-even)로 나뉘었으며, 각 하위-라이브러리는 홀수(X1, X3, X5 등) 또는 짝수 표적(X2, X4, X6 등)을 표적으로 한다. 각 하위-라이브러리에는 동일한 범용 정방향 프라이밍 서열과 다른 범용 역방향 프라이밍 서열이 포함되어 있다. ChrX-46plex 바코드에는 JEB 비트가 포함되어 있으며 또한 인접 표적 간의 색상-코드 다양성을 유지하기 위해 수동으로 할당되기도 했다.
6개의 유전자 라이브러리는 동일한 범용 정방향 프라이밍 서열 및 다른 범용 역방향 프라이밍 서열을 공유하였다. 바코드는 JEB 비트를 사용하여 수동으로 지정되었다.
합성 기반 표적 바코드 조사: Chr19-20K 라이브러리의 경우, 범용 역방향 프라이밍 서열을 SIT 프라이머 결합 부위로 사용하였고, 이어서 SIT 바코드 서열을 사용하였다. 바코드 및 색상-코드 지정은 다음과 같다: 4 = Cy5, 3 = Cy5 + Cy3, 2 = Cy3, 1 = 공백(blank).
36plex-1K의 경우, 범용 역방향 프라이밍 서열을 SIT 프라이머 결합 부위로 사용한 다음 SIT 바코드를 사용했다. 표적 색상-코드는 36plex-5K와 동일하나, SIT 시약을 사용하도록 설계했다.
표적 바코드의 혼성화 기반 조사: Chr19-20K 라이브러리의 경우, 브리징 올리고(HIT 브릿지)가 메인스트리트 및 백스트리트에 혼성화하도록 설계했다. HIT 브릿지는 HIT 판독 올리고에 대한 결합 부위를 포함했다. HIT 판독 올리고 시퀀스는 OligoLego에서 파생되었다. 바코드 및 색상 코드 지정은 다음과 같다: 0 = 공백, 1 = Alexa 647/Cy5, 2 = Cy3B/Cy3, 3 = FAM/Alexa 488.
36plex-5K 라이브러리의 경우, HIT 브릿지는 각 표적에 대한 스트리트 특이적 서열에 혼성화하도록 설계했다. 이는 양쪽 스트리트에 유사한 LIT 바코드가 있기 때문에, LIT 바코드의 5' 또는 3' 말단을 비롯하여 범용 프라이밍 부위(정방향 및 역방향)에 측접하는 브릿지를 설계하여 수행했다. HIT 브릿지에는 OligoLego에서 파생된 HIT 판독 올리고에 대한 결합 부위가 포함되어 있다.
올리고페인트 프로브 합성: 올리고페인트 올리고는 CustomArray™(예를 들어, 월드 와이드 웹 상의 customarrayinc.com/oligos_main.htm에서 이용 가능) 또는 Twist Biosciences™(예를 들어, 월드 와이드 웹 상의 twistbioscience.com에서 이용 가능)으로부터 12K 및 92K 칩 형식으로 단일 가닥 올리고풀(Oligopools)로 구입했다. 올리고풀을 경미한 변형을 가하여 이전에 설명된 대로 증폭시켰다(예를 들어, Nir et al. 2018, 전게서; Beliveau et al. 2017, 전게서 참조). 간단히 말해서, 최적의 템플릿 농도, 프라이머 농도, 및 어닐링 온도를 얻기 위해 실시간 PCR(Bio-Rad™)을 사용하여 각 라이브러리 및 하위-라이브러리에 대한 PCR 조건을 최적화했다(예를 들어, Real Time PCR 섹션 참조). 다음으로, 라이브러리를 Kapa Taq™ 시약을 사용하여 저-주기 PCR로 선형 증폭시켰다. dsDNA PCR 산물은 Zymo™ 컬럼을 사용하여 정제하고 초순수(UPW)로 용리시켰다. 그런 다음 5' 말단에 T7RNAP를 포함하는 REV 프라이머를 사용하여 T7 RNA 프로모터 서열을 올리고페인트에 추가했다. T7RNAP는 원시 라이브러리에서 바로 추가할 수 있다. dsDNA PCR 산물은 Zymo™ 컬럼을 사용하여 정제하고 UPW로 용리시켰다. 그런 다음 PCR 생성물을 37 ℃에서 밤새 NEB™ HiScribe를 사용하여 시험관 내 전사하여 RNA를 제조했다.
RNA 생성물을 역전사하여 cDNA를 제조했다. 그런 다음 RNA를 절단시켜 ssDNA를 남겼다. 이 생성물을 Zymo™ 컬럼을 사용하여 정제하였다. 최종 ssDNA 올리고페인트 올리고를 UPW에 100㎛로 재현탁하고 사용할 때까지 -20℃에서 보관했다. 선형 PCR, 손질된(touched-up) PCR 및 ssDNA 올리고페인트 올리고는 합성 동안 예상 중량으로 이동하는 단일 밴드를 확인하기 위해 2% Agarose DNA 젤 상에서 전개시켜 품질을 확인했다.
기타 올리고뉴클레오티드: 2차 형광단 라벨링된 올리고, LIT 시퀀싱 프라이머, SIT 시퀀싱 프라이머, JEB 올리고 및 MIP는 IDT™에서 구입했다. HIT 2차 올리고는 Biosynthesis™에서 구입했다. Alexa405 활성화제 플루오는 Thermo™에서 구입했다.
세포 배양: PGP1f, IMR90 및 MCF7의 3가지 인간 세포주를 사용하였다. PGP1f는 남성 기증자 PGP1(Corriell™; GM23248)의 1차 인간 섬유아세포이다. 그들은 이전에 정상적인 핵형인 것으로 밝혀졌다(예를 들어, Nir et al. 2018, 전게서 참조). PGP1f를 10% 소 태아 혈청(Thermo™), 1X 페니실린-스트렙토마이신(PS, Thermo™) 및 1X 비필수 아미노산이 보충된 DMEM(Gibco™)에서 배양하였다. PGP1f 세포는 새로운 배양물을 해동하기 전에 5회 이하의 계대 동안 배양했다. IMR90은 여성 기증자의 1차 인간 섬유아세포이다(ATCC™, CCL-186). IMR90을 10% 소태아혈청(FBS), 1X 페니실린-스트렙토마이신이 보충된 DMEM(Gibco™)에서 배양했다. MCF7은 여성 유방암의 암세포주이다(ATCC™, HTB-22). MCF7을 10% 소태아혈청(FBS), 1X 페니실린-스트렙토마이신(PS)이 보충된 DMEM(Gibco™)에서 배양했다. 세포를 5% CO2의 37℃ 인큐베이터에서 배양했다.
OligoFISSEQ를 위한 샘플 준비: Ibidi Sticky Slide VI™(예를 들어, 월드 와이드 웹 상의 ibidi.com에서 이용이능함; 카탈로그 번호: 80608)를 중기 스프레드(도 2b) 및 하이드로겔(데이터 미제시)을 제외한 모든 실험에 사용하였다. Ibidi™ 슬라이드를 조립하고 사용하기 전에 37℃에서 밤새 경화되도록 두었다. 각 웰에는 100 내지 200 ㎕의 시약이 필요하며 한 구멍은 일반적으로 입구로 지정되고 다른 구멍은 출구로 지정된다. ∼70% 컨플루언시에 이른 10 cm 디쉬로부터의 PGP1f 세포를 1mL 트립신을 사용하여 디쉬에서 분리하고 2 내지 3mL의 신선한 배지로 중화시켰다. 현탁액 중 100 ㎕의 세포를 각 Ibidi™ 웰에 첨가하고 37℃ 인큐베이터에서 밤새 부착 및 회복되도록 하였다. 다음 날, 배지를 흡인하고, 웰을 1X PBS로 세척하고 1X PBS(Gibco™)의 최종 농도에서 4% 포름알데히드(EMS™)로 10분 동안 고정시켰다. 고정액을 제거하고 세포를 1XPBS로 헹구었다. 그런 다음 세포는 로테이터에서 15분 동안 최종 1X PBS에서 0.5% Triton™(Sigma™)으로 투과화되었다. 투과화(permeabilization) 시약을 흡인하고 세포를 0.1% triton™/1X PBS로 헹구고 사용할 때까지 4℃에서 이것 또는 PBS에 보관했다. 샘플을 고정 후 2-3주 이내에 사용했다.
MIP/하이드로겔 실험을 위한 세포 샘플을 직사각형 유리 현미경 슬라이드(VWR™)에서 성장시켰다. 세포를 Ibidi™와 유사하게 플레이팅하였고, 단, 현탁액 중 150 ㎕의 세포를 직사각형 슬라이드의 개별 영역에 플레이팅하고(영역을 표시하기 위해 유리 에칭 펜으로 미리 에칭을 수행함) 페트리 디쉬를 37℃ 인큐베이터에서 밤새 인큐베이션했다. 다음 날, 위의 Ibidi™와 동일한 단계를 50mL 코플린 병에서 수행했다. 세포는 사용할 때까지 코플린 병에 담긴 1XPBT에서 보관했다.
중기 스프레드는 Applied Genetics(제품: HMM)에서 구입했다.
DNA FISH: 단계별 프로토콜은 문헌(예를 들어, Beliveau et al. 2018, 전게서)으로부터 그리고 문헌(예를 들어, Pardue et al. 1969, PNAS 64 (2): 600-4; Ba㎛an et al. 1980, Experimental Cell Research 128 (2): 485-490)에 기초하여 변경된다. 모든 OligoFISSEQ 방법은 밤새 일차 올리고페인트 라이브러리의 혼성화로 시작한 다음 이탈한다. Ibidi™ 슬라이드가 있는 LIT, SIT, 및 HIT에 공통사항(명시되지 않는한 모든 단계는 로테이터에서 수행됨): Ibidi™ 웰은 RT에서 5분 동안 0.1% PBT로 세척하고 0.1N HCl과 함께 8분 동안 배양하였다. 2XSSCT 세척을 수행하였다. 세포 RNA는 각 웰에 대해 2XSSCT에서 50 ㎕의 2 ㎍/mL RNase A(Thermo™)로 절단시켰다. 슬라이드를 37℃ 습한 챔버(예를 들어, 아래 참고사항 참조)에서 1시간 동안 인큐베이션했다. RNAse A는 2XSSCT를 추가하여 세척하였다. 사전-혼성화를 실온에서 10분 동안 50% 포름아미드/2XSSCT를 첨가하여 시작하였다. 미리 예열된(60℃) 50% 포름아미드/2XSSCT를 추가하고 슬라이드를 60℃ 수조에 20분 동안 설정된 열 블록 위에 놓아 사전 혼성화를 계속했다. 다음으로, 일차 올리고페인트 라이브러리를 추가하였다. 샘플을 흡인하고 일차 올리고페인트 올리고 라이브러리(최종 2 ㎛)의 총 50 ㎕를 혼성화 믹스(50% 포름아미드, 2XSSCT, 10% Dextran Sulfate)에 첨가했다. 일차 올리고페인트 올리고 라이브러리가 있는 샘플을 변성시키고, 증발을 방지하기 위해 웰을 파라필름으로 밀봉한 다음 슬라이드를 고무 플러그의 무게 하에 3분 동안 80℃ 수조에서 예열된 핫 블록 상에 위치시켰다. 샘플에 대한 올리고페인트 올리고 라이브러리 혼성화는 샘플을 42℃ 인큐베이터에서 16시간 이상 동안 습한 챔버 내에 위치시켜 수행하였다. 다음 날, 혼성화되지 않은 프로브는 1차 하이브 믹스가 포함된 각 웰에 미리예열된(60℃) 2XSSCT를 추가하여 세척하고 흡인했다. 새로운 예열된 2XSSCT를 추가하고 샘플을 핫블록에서 15분 동안 인큐베이션했다. 이것을 한 번 반복한 다음 실온(RT)에서 다시 반복했다. 이 세척 후에, 프로토콜이 본 기술에서 벗어나는 지점은 아래에 설명된 바와 같다. 적절한 DAPI 신호를 유지하기 위해 시퀀싱의 2 라운드마다 세포 DNA가 염색되었다는 점에 유의할 필요가 있다.
2차 혼성화를 통한 OligoPAINTS의 검출을 위해, 검출을 위한 일차 올리고 스트리트에 대한 2차 올리고 혼성화를 위해 샘플을 준비하였다. 샘플을 8분 동안 30% 포름아미드/2XSSCT로 세척하고 2차 올리고 및/또는 브릿지 올리고의 총 50 ㎕를 30% 포름아미드/2XSSCT 중 1.2 ㎛으로 각 웰에 첨가했다. 샘플을 45분 동안 RT 암실에서 습한 챔버에서 인큐베이션했다. 혼성화되지 않은 2차 올리고는 30% 포름아미드/2XSSCT를 직접 첨가하여 세척하고, 흡인하고, 로테이터에서 2x 15분 인큐베이션했다. 샘플을 2XSSCT로 5분에 2회 세척했다. 일부 실험에서, DNA를 PBS에서 10분 동안 DAPI로 대조염색했다. 그런 다음, 샘플을 1XPBS x2로 5분간 세척하고 1XPBS 또는 이미징 버퍼에서 이미지화했다.
직사각형 슬라이드 상의 세포에 대해, 상기와 동일한 전체 프로토콜을 수행했지만 코플린 병에서는 그에 따라 세척 부피를 조정했다(예를 들어, 1차 및 2차 혼성화에 대해 25㎕ 부피). 프로토콜은 다음과 같이 수정된다: RNAse를 직사각형 슬라이드의 세포에 직접 추가하고 22x22mm 커버슬립으로 덮었다. Post RNAse 세척은 슬라이드와 커버슬립을 코플린 병으로 옮기고 커버 슬립을 "밀어서" 벗겨냈다. 2차 혼성화에 대해서도 동일한 접근 방식으로 수행했다. 일차 올리고페인트 혼합물을 직사각형 슬라이드의 세포에 직접 추가하고, 22x22mm 커버슬립으로 덮고, 고무 시멘트(Elmer's™)로 가장자리를 밀봉하여 일차 올리고페인트 혼성화를 수행했다. 고무 시멘트는 3분 동안 건조하였고 샘플은 Ibidi™와 유사하게 열 블록에서 변성시켰다.
라이게이션 기반 표적 조사(LIT): LIT는 올리고페인트(예를 들어, Beliveau et al. 2012, 전게서 참조), SBL(예를 들어, Shendure et al. 2005, 전게서 참조) 및 FISSEQ 기술(예를 들어, Lee et al. 2014, 전게서 참조)에 기초하여 구축된다. O-LIT의 경우, 일차 올리고페인트 라이브러리의 혼성화 후, 샘플은 라이게이션을 프라이밍할 수 있는 내인성 포스페이트를 고갈시키기 위해 포스파타제로 처리해야 했고, 이는 백그라운드 및 불량 신호에 기여했다. 샘플을 50 ㎕의 1X NEB CutSmart™ 완충액으로 8분 동안 세척했다. 다음으로, 50 ㎕의 슈림프 알칼리성 포스파타제(rSAP; NEB™)를 각 웰에 첨가하고 1시간 동안 37℃ 습한 조건에서 배양했다. 포스파타제를 비활성화하기 위해 샘플을 5분 동안 65℃ 물 배치(batch)에서 예열된 열 블록으로 옮기고, 각각 5분 동안 열 블록에서 예열된(65℃) 2XSSCT로 2회 세척했다. RT 2XSSCT를 5분 동안 첨가했다. 그런 다음 8분 동안 30% 포름아미드/2XSSCT로 세척하여 LIT 프라이머 결합을 위한 샘플을 준비하고 총 50㎕의 LIT 시퀀싱 프라이머를 30% 포름아미드/2XSSCT 중 1.2 ㎛으로 각 웰에 첨가했다. 샘플을 습한 챔버에서 45분 동안 인큐베이션했다. 혼성화되지 않은 LIT 프라이머를 30% 포름아미드/2XSSCT로 직접 세척하여 세척하고 흡인하고 로테이터에서 2x 15분 인큐베이션했다. 샘플을 2XSSCT로 5분에 2회 세척했다. 다음으로, 100 ㎕의 1X Quick Ligation™ 완충액(NEB™)을 8분 동안 첨가하고 흡인하여 LIT의 첫 번째 라운드를 위한 샘플을 준비했다. LIT 반응 믹스를 얼음 위에서 준비하였다. 라이게이즈(마지막에 추가됨)를 추가하기 전에 LIT 반응 믹스에 대해 격렬한 볼텍싱을 수행했다. 볼텍싱 후, 라이게이즈를 추가하고 피펫팅으로 완전히 혼합했다. O-eLIT 시약은 유사하게 수행되었지만 SOLiD™ 보라색 시약 믹스 대신 각 JEB 올리고 40pmol을 첨가하고 그에 따라 UPW를 조정했다. 이 믹스 100 ㎕를 각 웰에 첨가하고 샘플을 25℃의 습한 챔버에서 55분 동안 인큐베이션했다. 그런 다음 LIT 반응 혼합물을 흡인하고 샘플을 1M GHCL로 헹구고 실온에서 로테이터(nutator)에서 15분 동안 x2 세척했다. 1XPBS 세척 5분을 수행했다. 샘플을 70% EtOH 중의 True Black™(Biot㎛™) 100 ㎕로 2분 동안 처리하여 세포 백그라운드 형광을 감소시켰다. 3x 1XPBS 빠른 헹굼, 및 이후 10분 세척을 수행했다. 그런 다음 샘플을 1XPBS 또는 이미징 버퍼에서 이미지화했다. 다음 LIT 라운드로 진행하기 전에 라이게이션되지 않은 포스페이트는 37℃에서 30분 동안 포스파타제(Quick CIP; NEB™)로 처리된다. 그런 다음 Quick CIP를 5분 동안 3x GHCL 세척으로 세척한다. 이전 LIT 라운드를 절단하여 형광단을 방출시키고 헹굼에 의해 5' PO4를 재생성한 다음, 클리브(Cleave) 1을 사용하여 RT 로테이터에서 15분 배양한 다음, 클리브 2에 대해 동일하게 수행한다. 그런 다음 샘플을 GHCL로 x3 헹구고 5분간 x2회 세척한다. LIT의 다음 라운드는 사전-라이게이션 단계로 수행할 수 있다. 마지막 바코드 비트를 판독한 후, 형광단은 절단될 수 있고 DNA FISH 방법에서와 같이 특정 브릿지와 형광단을 혼성화시켜 모든 표적을 검출할 수 있다.
합성 기반 표적 조사(SIT): SIT는 올리고페인트(예를 들어, Beliveau et al. 2012, 전게서 참조) 및 SBS(예를 들어, Guo et al. 2008, 전게서 참조) 기술을 기반으로 한다. 일차 올리고페인트 라이브러리의 혼성화 후, 30% 포름아미드/2XSSCT로 8분 동안 세척하여 SIT 프라이머 결합을 위한 샘플을 준비하고 총 50㎕의 LIT 시퀀싱 프라이머를 30% 포름아미드/2XSSCT에서 1.2 ㎛로 각 웰에 첨가했다. 샘플을 습한 챔버에서 45분 동안 인큐베이션했다. 혼성화되지 않은 SIT 프라이머를 30% 포름아미드/2XSSCT로 세척하여 직접 세척하고, 흡인하고, 로테이터에서 2x 15분간 인큐베이션했다. 샘플을 2XSSCT로 5분간 2회 세척했다. SIT의 첫 번째 라운드는 미리 예열된(60℃) NextSeq Buffer X™ 100 ㎕로 헹군 다음, 수조에서 60℃ 히트블록에서 5분 동안 인큐베이션을 진행했다. 샘플을 흡인하고 10분간 2XSSCT x3로 세척하였다. 1XPBS 세척을 수행하고 샘플을 1XPBS, 이미징 버퍼, 또는 NextSeq™ 이미징 버퍼에서 이미지화했다. 다음 SIT 라운드로 진행하기 전에, 샘플을 NextSeq Buffer X™로 헹구고 처리한 다음, 수조에서 60℃ 히트블록에서 5분간 인큐베이션을 진행하였다. 그런 다음 샘플을 2XSSCT에서 10분씩 3회 세척한다. 이제 다음 SIT 라운드를 진행할 수 있다. 모든 표적 식별을 위해, Alexa488이 포함된 SIT 프라이머를 사용하거나 브릿지가 있는 2차 올리고를 첨가할 수 있다.
혼성화 기반 표적 조사(HIT): HIT는 올리고페인트(예를 들어, Beliveau et al. 2012, 전게서 참조) 및 SBH 기술(예를 들어, Lubeck et al. 2014, Nature Methods 11 (4): 360-61; Chen et al. 2015, 전게서; Eng et al. 2017, 전게서 참조)을 기반으로 한다. 일차 올리고페인트 라이브러리의 혼성화 후, 검출을 위해 일차 올리고 스트리트에 대한 HIT 브릿지 올리고 혼성화를 위해 샘플을 준비했다. 36plex-5K용 HIT 브릿지는 범용 프라이밍 영역과 MS 바코드 또는 BS 바코드의 일부에 걸치도록 설계되었다. 샘플을 30% 포름아미드/2XSSCT로 8분 동안 세척하고 총 50㎕의 브릿지 올리고를 30% 포름아미드/2XSSCT 중 1.2 ㎛으로 각 웰에 첨가했다. 샘플을 45분 동안 RT 암실에서 습한 챔버에서 인큐베이션했다. 혼성화되지 않은 브릿지 올리고를 30% 포름아미드/2XSSCT를 직접 첨가하여 세척하고, 흡인하고, 로테이터에서 2x 15분간 인큐베이션했다. HIT의 첫 번째 라운드는 실온(RT)의 어두운 습한 챔버에서 45분 동안 30% 포름아미드/2XSSCT에서 1.2 ㎛의 각각의 라운드 특이적 HIT 2차 올리고 50 ㎕를 각 웰에 첨가하여 진행한다. 혼성화되지 않은 HIT 2차 올리고를 30% 포름아미드/2XSSCT에 직접 첨가하여 세척하고, 흡인하고, 로테이터에서 2x 15분 인큐베이션했다. 샘플을 5분 동안 2XSSCT x2로 세척한 다음 1XPBS로 5분 동안 세척했다. 샘플을 1XPBS 또는 이미징 버퍼에서 이미지화했다. 다음 라운드로 진행하기 전에, 이전의 HIT 라운드 2차 올리고 형광단을 린스를 통해 절단하고 1mM Tris(2-카르복시에틸)포스핀(TCEP, Sigma™)과 함께 15분 동안 인큐베이션한다. 3x PBS 헹굼을 수행하고 그 다음 HIT 라운드를 진행할 수 있다.
면역형광: 단백질을 시각화하기 위해 샘플을 면역형광에 적용했다. OligoFISSEQ 후, 올리고페인트 올리고는 80% 포름아미드/2XSSCT 2x 7분간 세척하여 제거했다. 다음으로, 샘플을 3분 동안 2XSSCT로 세척하고, 1X PBS로 세척하고, 4% 포름알데히드/PBS에서 10분 동안 고정했다. PBS를 헹구고 0.5% Triton/PBS에서 10분 동안 투과화를 거친 후, 샘플을 3% BSA/PBT에서 1시간 동안 블록킹시켰다. 그런 다음 1% BSA/PBT에 희석된 1차 항체를 각 웰에 첨가하고 파라필름으로 밀봉하고 4℃에서 > 12시간 동안 밤새(O/N) 인큐베이션했다. 다음날, 1차 항체를 제거하고 3x PBT 세척을 수행했다. 1% BSA/PBT에 희석된 2차 항체를 R/T 진탕기에서 1시간 동안 각각에 대해 1:500 희석하여 첨가했다. 밀 배아 응집소(WGA, 1:20)를 또한 2차 배양 단계 동안 첨가할 수 있다. 각각 5분 동안 3x PBT 세척을 수행하고, 샘플을 10분 동안 DAPI(1:1000)로 재염색하고 이미징 버퍼에서 이미지화했다.
하이드로겔: 하이드로겔 포매는 문헌(예를 들어, Moffitt et al., Proc Natl Acad Sci U S A. 2016 Dec 13, 113(50):14456-14461 참조)에 기초하였다. 하이드로겔 포매를 위한 세포는 직사각형 유리 슬라이드에서 성장시켰다. "DNA FISH" 섹션에 설명된 대로 이 슬라이드에서 FISH를 수행했다. 일차 올리고페인트 라이브러리 혼성화 후, 샘플을 60℃의 2XSSCT에서 20분 동안 세척하고, 이어서 실온(RT)에서 10분간 세척한 다음, 1XPBS에서 5분 동안 세척했다. 하이드로겔 포매를 준비하기 위해, 슬라이드를 5분 동안 공기 건조하고 세포 주위 영역을 kimwipe™로 닦아 건조했다. 하이드로겔 시약을 얼음 위의 에펜도르프 튜브에서 합하고 인큐베이션 동안 진공 챔버의 얼음 위에서 탈기시켰다. 그런 다음 세포를 APS/TEMED가 없는 하이드로겔 믹스로 4℃에서 10분 동안 세척했다. 그런 다음 하이드로겔 믹스를 샘플에서 제거하고 ∼20 ㎕의 하이드로겔 용액을 겔화 챔버 슬라이드(파라필름으로 감싼 직사각형 슬라이드, 슬라이드의 각 말단 상에 스페이서로 2개의 22x22mm 커버슬립 사용; 데이터 미제시)의 파라필름에 스폿팅했다. 그런 다음 슬라이드 샘플을 하이드로겔 용액/겔화 챔버 상에 플립시키고, 주의하여 기포 형성 없이 하이드로겔 용액이 퍼지도록 했다. 그런 다음 샘플을 진공 챔버에서 1시간 동안 37℃에서 인큐베이션했다. 인큐베이션 후, 겔화 챔버를 조심스럽게 제거했다. 하이드로겔 디스크의 가장자리를 다듬고 다이아몬드 에칭 펜을 사용하여 직사각형 슬라이드를 부수고, 젤/유리 슬라이드 부분을 보존시켰다. 그런 다음 겔/유리 슬라이드 부분을 35mm 페트리 접시로 옮기고 37℃에서 2mL 절단(digestion) 버퍼(상기 Moffitt et al. 2016 전게서의 레시피) O/N에서 절단시켰다. O/N 절단 후, 세포/하이드로겔이 유리 슬라이드에서 해리되므로 하이드로겔 손상을 방지하기 위해 특별한 주의를 기울여야 한다. 절단 버퍼와 유리 슬라이드를 제거하고 하이드로겔을 2XSSC에서 3x 20분 동안 세척한다. 하이드로겔은 다운스트림 적용을 위해 더 작은 조각으로 분할될 수 있다. 방향을 표시하기 위해, 하이드로겔 조각은, 더 쉬운 다운스트림 이미징 및 정렬을 허용하는, 고유한 모양으로 절단될 수 있다. 절단 후, 하이드로겔 샘플을 1.5mL 에펜도르프 튜브로 옮겨 더 쉽게 처리할 수 있다.
중기 FISH: 언급된 경우를 제외하고 코플린 병을 사용하여 단계를 수행했다. RNase A 처리는 RNase A를 첨가하고 22x22mm 커버슬립 아래에 끼워서 수행하고 습한 챔버에서 인큐베이션했다. 일차 올리고페인트 혼성화도 동일한 방식으로 수행했다.
광시야 현미경: OligoFISSEQ 및 회절 제한 FISH는 광시야 형광 설정을 사용하여 이미징을 수행했다. 여기에서는 Nikon 60x 1.4NA Plan Apo lambda™(Nikon MRD01605) 대물렌즈, Andor iXon Ultra EMCCD™ 카메라(DU-897U: 512 x 512 픽셀 FOV, 16 ㎛ 픽셀 크기), X-Cite 120 LED Boost™ 광원, 전동 스테이지 및 Chroma™의 기성품 필터 세트(∼488nm 49308 C191880, ∼532 nm 49309 C191881, ∼594nm 49310 C191882, ∼647nm 49009 C177216)가 장착된 Nikon Eclipse Ti™ 바디를 이용했다. ND4 및 ND8 필터를 사용하여 이미지를 얻었다. 현미경 작동은 Nikon NIS elements™ 소프트웨어에 의해 처리되었다. 일반적으로, z-스택은 2-300ms 노출 시간 및 20-60% LED 강도로 0.3㎛ 슬라이스로 얻었으며, 이는 이미지화되는 라이브러리에 좌우된다. XYZ 스테이지 위치는 nd2 메타데이터 내에서 유지되었으며 동일한 시야(FOV)로 복귀하는 데 필수적이었다. 샘플이 스테이지와 샘플 홀더로 향하는 방향은 동일한 FOV로 복귀할 수 있도록 주의하여 유지되었다. 이미징 후 그리고 시퀀싱 라운드 사이에 샘플이 제거되었기 때문에 이것은 중요했다.
STORM 이미지화: OligoFISSEQ와 OligoSTORM을 결합하기 위해, 2차 올리고에 대한 결합 부위를 포함하는 브릿지(Chr 2의 6개 지점을 대상으로 하는 개별 올리고페인트 올리고의 백 스트리트에 존재함)에 결합하는 ALEXA 647 라벨링된 2차 올리고를 혼성화함으로써 PGP1f 남성 섬유아세포 내부의 염색체 2에 있는 6개 표적 모두에 대해 먼저 STORM 이미지화의 한 라운드를 수행했다. OligoSTORM 샘플은 Olympus™ 60x 1.3NA 실리콘 대물렌즈(UPLSAPO60XS2)가 있는 Vutara 352™ 바이플레인 시스템에서 이미지화했다. 단일 분자 깜박임의 경우, 2-머캅토에탄올 및 GLOXY를 포함하는 스위칭 버퍼를 사용했다(예를 들어, Nir et al. 2018, 전게서 참조). 여기 레이저 출력은 640nm 레이저의 경우 소프트웨어에서 60%(대물렌즈에서 6.3kW/㎠)로 설정하고 405nm의 광활성화 레이저의 경우 소프트웨어에서 0.5%(대물렌즈에서 0.08kW/㎠)로 설정했다. 0.1㎛ 두께의 30-40 Z 슬라이스를 각각의 Z 슬라이스에 사용했다. 각각의 Z 슬라이스에 대해 주기당 250프레임의 10-12개의 광전환 주기를 사용했다.
STORM 이미지는 Vutara SRX™ 소프트웨어를 사용하여 분석했다(예를 들어, Nir et al. 2018, 전게서 참조). DBSCAN 클러스터링 알고리즘을 사용하여 원시 이미지에서 클러스터를 식별했다. 0.1㎛ 거리 내의 50개의 입자가 클러스터링에 사용되었다. 평균 축 정밀도는 Z에서 50+/- 10 nm이고 평균 방사 정밀도는 XY에서 17+\- 5 nm였다. 초-해상 구조의 분해능을 푸리에 링 상관 분석(SRX™ 소프트웨어의 구성 기능)으로 계산했다. XY의 분해능은 40+/-5 nm이고 Z의 분해능은 60+/-5 nm이었다.
데이터 시각화: 이미지를 Nikon Elements™ 또는 ImageJ™를 사용하여 처리했다. 도 2d는 ImageJ(플러그인 > 3D 뷰어)를 이용하여 생성했다. 염색체 도식은 ChromoMap™을 사용하여 생성했다(예를 들어, Anand 2019, BioRxiv, April, 605600 참조). 도면을 Adobe Illustrator™에서 조립했다. 공개 도면에 대한 현미경 사진 이미지는 밝기 및 콘트라스트 향상을 이용하여 후처리했다(이미지J > 이미지 > 조정 > 밝기/콘트라스트).
실시예 2
고도로 다중화된 제자리 시각화 및 표적 식별을 위한 방법
제자리에서 게놈을 맵핑하는 방법은 제한적이다. 게놈 좌위가 3D(3-차원) 핵 내부에 국재화하는, 공간 유전체학은 DNA의 공간적 국재화가 발현, 복구, 복제, 및 기능에 중요한 역할을 한다는 사실과 관련하여 새롭게 떠오르는 분야이다. 현재의 게놈 시각화 방법은 순차 라벨링 체계 및 신호 생성으로 인해 처리량을 비롯하여 표적 검출에 어려움을 겪고 있다. 공간 유전체학은 한 번에 4-5가지 색상을 검출하는 기존 현미경의 능력으로 인해 제한되기 때문에, 대부분의 기술은 표적의 순차적 시각화에 의존한다. 이 방법은 선형으로 확장되며 ∼25,000개의 인간 유전자를 모두 시각화하는 데 현실적이지 않다.
이 문제를 극복하기 위해, 각 표적이 멀티비트 컬러 바코드로 표시될 수 있는 바코드 방식이 있다. 이 방법은 기하급수적으로 확장된다. 4가지 색상과 8비트 바코드로 65,536개의 표적(4^8)을 식별할 수 있다. 바코드는 형광 인시투 시퀀싱 (FISSEQ) 기술로 판독할 수 있다.
FISSEQ(예를 들어, OligoFISSEQ)를 통한 게놈 시각화의 현재 적용은 라이게이션 화학에 의한 SOLiD 시퀀싱을 활용한다. 이 방법은 검출가능한 FISSEQ 신호를 생성하기 위해 각 표적에서 많은 올리고페인트(예를 들어, 수천개)의 축적에 의존한다. 이 검출의 어려움은 비트 판독 라운드가 증가함에 따라 증가한다. 표적 신호 검출을 혼란스럽게 하는 SOLiD 화학의 한 양태는 화학이 바코드를 판독하기 위해 1,024개의 8nt 형광적으로 라벨링된 올리고 풀을 활용한다는 것이다(예를 들어, 도 10c 참조). 이것은 높은 수준의 유연성을 허용하지만, 이러한 유연성은 표적화된 영역의 공간 유전체학에 필요하지 않다.
절단가능한 올리고뉴클레오티드의 생성을 가능하게 하는 화학이 본 명세서에 제시된다. 올리고는 임의의 뉴클레오티드 위치 사이에서 특이적으로 절단되어, 5' 포스페이트의 생성을 초래할 수 있다. 이 5' 포스포릴화된 올리고는 이후 DNA 라이게이즈가 있는 3' 하이드록실화된 올리고와의 라이게이션을 위해 양립가능하다(예를 들어, 도 10a-10b 참조). 이러한 변형된 올리고는 또한 검출가능한 표지(예를 들어, 형광단)로 기능화되어, FISSEQ에 사용할 수 있는 시약을 생성할 수 있다. 더욱이, 이 화학은 nt 위치 1-5에 특정 서열과 위치 6-8에 범용 염기를 갖는 8nt 올리고를 생성하는 데 사용될 수 있다. 이러한 변형된 올리고는 위치 5와 6 사이에서 절단가능하다. 이러한 올리고는 OligoFISSEQ에서 5nt 특이적 바코드를 시퀀싱하는 데 사용할 수 있다(예를 들어, 도 10e-10h 참조). 이러한 접근 방식은 OligoFISSEQ에 사용되는 형광-라벨링된(fluor-labeled) 올리고의 수를 1,024에서 4로 줄여서, 시퀀싱 신호를 극적으로 증가시킨다(예를 들어, 도 10c, 도 10f-10g 참조). 이러한 올리고는 본 명세서에서 "적당히 충분한 바코드(Just Enough Barcodes)" 또는 "JEB"로 지칭될 수 있다.
본 명세서에 제시된 바와 같이, OligoFISSEQ는 올리고페인트 상의 특정 5nt 비트를 함유하는 바코드를 설계하고 4개의 특정 8nt 형광 표지된 올리고를 사용하여 이들을 시퀀싱함으로써 단순화될 수 있다(예를 들어, 도 10d 참조). 본 명세서에서 JEB라고 지칭되는, 생성된 올리고 세트 및 방법은 단순화되고, SOLiD 화학에 포함된 불필요한 올리고를 폐기하고, 결과적으로 더 높은 시퀀싱 신호를 생성한다. 본 명세서에 설명된 세트 및 방법은 다른 방법과 비교하여, 적어도 두 가지 이점을 나타낸다: (1) 표적에서 충분한 신호를 생성하는 데 필요한 올리고페인트 수가 감소하고, (2) 이들은 검출될 수 있는 바코드 비트 수를 증가시키고, 고유하게 식별될 수 있는 표적의 수를 증가시킨다. 궁극적으로, 본 명세서에 기술된 바와 같은 세트 및 방법은 전체 게놈의 이미지화를 허용한다.
실시예 3
게놈은 방대할 뿐만 아니라, 상동 염색체의 형태로 내부적으로 복제된다. 그리고, 수많은 연구에서 복잡한 내부 3D 조직 구조를 보여주었지만, 이제는 이러한 구조가 높은 수준의 가변성을 나타낸다는 것이 명확하다. 마지막으로, 아마도 가장 주목할 만한 것은, 게놈은 조직, 세포 분열을 통한 복제 및 연출(choreography), 유전, 전사 활성의 조절, 심지어 노화 중 소멸까지 조정되는, 통합 유닛으로서 기능한다는 것이다. 이러한 이유로, 게놈 전체를 다룰 수 있고, 상동 염색체 영역을 구별할 수 있으며, 또한 이종 집단에서 기본(underlying) 패턴을 추출하는 데 필수적인 통계적 능력을 제공할 수 있는 고-처리량을 가질 수 있는 기술에 대한 요구가 증가하고 있다. 이러한 요구는 게놈을 시각화하는 능력과 마찬가지로 생화학적 접근에 있어서도 매우 중요하며, 시각화는 3D 게놈 조직을 밝힐 수 있는 역량(capabilities)을 제공한다. 여기에서는 제자리 게놈 맵핑을 위한 3가지 방법 세트인 OligoFISSEQ에 대한 첫 번째 원리 증명이 기술되어 있다. 이러한 연구는 6개 염색체에 걸쳐 66개의 게놈 좌위를 맵핑하여, X 염색체를 따라 46개 영역의 미세한 추적을 제공할 뿐만 아니라 초고해상도에서 게놈 영역의 시각화를 가속화함으로써 전체 게놈 맵핑을 위해 OligoFISSEQ를 확장할 수 있는 가능성을 보여준다. 중요하게도, OligoFISSEQ는 수천 개의 세포에 걸쳐 동일한 표적을 일관되게 식별할 수 있는 능력이 있고 그에 따라, 초고해상도를 비롯하여 광시야 분해능에서, 게놈의 가장 벅차면서도 매혹적인 측면 중 하나인, 가변성(variability) 문제를 해결하는 데 매우 적합하다. 가변성은 확률적 과정을 나타낼 수 있지만, 필수적인 시그니처 게놈 영역일 수도 있다. 가변성은 국소적인 것으로 생각되지만, 그 영향은 전체적으로(globally) 미칠 수 있다. 또한, 무작위적인 것으로 보일 수도 있지만, 그러한 무작위성은 구조적 형태(conformations)를 지시하는 조절 프로그램의 절묘한 제어 하에 있을 수 있으며, 임의의 다른 개량된(honed) 유전적 요소와 마찬가지로 진화의 결과일 수도 있다.
올리고페인트의 다양성으로 인해 OligoFISSEQ는 또한 다른 기술과 융합할 수 있는 능력이 있다. 예를 들어, 바코드 및 이미지 획득에 대한 약간의 조정으로, OligoFISSEQ는 염색질 구조(ORCA)의 광학적 재구성(예를 들어, Mateo et al. 2019 참조), Hi-M(예를 들어, Andr
Figure pct00001
Cardozo Gizzi et al. 2019 참조), 및 OligoDNA-PAINT(예를 들어, Nir et al. 2018 참조)과 함께 미세한 염색체 접힘의 다중화된, 아마도 다중-색상 시각화를 허용할 수 있다. 확장의 관점에서, 별개의 겹치지 않는 신호를 가정하고 PGP1f 핵에서 적어도 3,000개의 표적을 맵핑할 수 있으며, 이는 표적 크기를 줄이거나, 초고해상도 현미경 검사에서 시퀀스를 줄이거나, 확장 현미경검사를 허용할 수 있는 전략을 통해 그 수를 증가시킬 수 있는 잠재력을 갖는다(예를 들어, F. Chen, Tillberg 및 Boyden 2015 참조). 시퀀싱의 시간적 분리(temporal separation)(예를 들어, (Mateo et al. 2019; Eng et al. 2019) 참조)는 중첩되는 표적을 해결하는 데 사용할 수도 있다. 특히, 시간적 분리는 문제가 있는 표적이 서로 다른 시간에 시퀀싱되도록 서로 다른 단계에서 표적의 서로 다른 서브세트에 대해 O-LIT를 수행하여 달성할 수 있다.
많은 개별 세포에서, 동시에, 전체 게놈을 시각화하는 능력은 전례 없는 방식으로 게놈 구조를 탐색할 수 있는 기회를 제공한다. 단일 세포 수준에서 구조적 및 조직적 가변성에 대한 최근 발견(예를 들어, S. Wang et al. 2016; Bintu et al. 2018; Nir et al. 2018; Finn et al. 2019; Mateo et al. 2019; Andr
Figure pct00002
Cardozo Gizzi et al. 2019 참조)는 이러한 "빅-픽처(big-picture)" 게놈 전체 관점을 취함으로써 특히 이점을 얻을 수 있다. OligoFISSEQ는 전체 게놈을 시각화하는 데 사용할 수 있기 때문에, 연구자는 편견없는 방식으로 구조와 가변성을 시각화할 수 있다. 예를 들어, 게놈의 한 부분에서 발생하는 미미하고 중요하지 않은 섭동은, "나비 효과(butterfly effect)"라고 하는 것과 유사하게, 전체적 규모에 중대한 영향을 미칠 수 있다(예를 들어, Lorenz 1963 참조). 또한, 게놈 규모의 공간 맵핑은 유전자 공간 네트워크를 밝힐 수 있는 개별 세포 상호작용 맵을 생성하여, 생물학에 대한 이해를 향상시킬 수 있다.
티어 1 검출
전처리. OligoFISSEQ의 각 라운드의 광시야 현미경 데이터세트(z-스택)는, Alexa 647, Texas Red, Cy3, Alexa 488 및 DAPI의 5개 채널과 일련의 z-슬라이스를 포함한다. z 스택은 Nikon 소프트웨어로 이론적으로 계산된 포인트 스프레드 함수를 사용하는 Richardson-Lucy 알고리즘의 20회 반복(iterations)을 이용하여 디콘볼루션되고 백그라운드 교정된다.
라운드는 5개의 채널, 일련의 z-슬라이스 및 라운드당 하나의 프레임으로 구성된 하이퍼스택으로 컴파일된다. 토토 이미지와 같이, 모든 점(punctas)이 라벨링된 이미지가 이용이능한 경우, 새로운 추가 프레임으로 포함된다. 하이퍼스택은 Fiji 플러그인 "Correct 3D Drift"를 사용하여 정렬된다(예를 들어, Parslow, Cardona 및 Bryson-Richardson 2014 참조). DAPI 염색된 핵의 이미지는 임계값 세분화(threshold segmentation)을 수행하고 초기 이미지에서 각각의 개별 세포를 별도의 관심 영역(roi)으로 추출하는 데 사용된다. 세분화는 각 하이퍼스택을 구성하는 개별 핵의 위치 및 엔벨로프(envelope)에 대한 정보를 제공한다. 면적이 25 ㎛2 미만인 핵은 폐기된다.
바코드 검출. 다른 채널의 강도를 비교하기 위해, 동일한 라운드 및 채널에 있는 모든 z-슬라이스 값 간의 최대 강도로 이미지의 강도를 나누어 이미지를 정규화한다.
바코드 검출 및 각 라운드에 대해, 모든 픽셀 위치의 강도가 서로 다른 채널에 걸쳐 비교된다. 가장 높은 값을 가진 채널이 보편적인(prevalent) 것으로 유지된다. 모든 픽셀 위치에서 서로 다른 라운드를 따라 채널 간의 전환이 예상 바코드 목록과 비교된다. 전환 세트가 바코드와 연관된 것과 일치하는 경우 바코드가 픽셀 위치에 할당된다. 최대 강도 투영(MiP) 이미지는 모든 라운드의 보편적인(prevalent) 채널의 강도를 평균화하여 구축된다. 동일한 바코드를 가진 연결된 픽셀을 그룹화하여 3D 패치를 형성한다. 각 패치에 대해 다음 정보가 수집되고 저장된다: 중앙 위치; 패치의 일부를 형성하는 픽셀의 수(크기); 패치 픽셀의 최대 강도; 패치 픽셀의 최대 강도를 갖는 픽셀 위치. 모든 점이 라벨링된 이미지가 있는 경우 각 픽셀 위치의 강도 정보가 추가 파일에 저장된다.
티어 2 검출
염색체 추적. 단일 픽셀 위치로 구성된 패치는 폐기된다. 나머지 패치는 강도나 크기를 무시하고 추적에 사용된다.
고강도 값을 갖는 패치가 가장 확실한 것으로 선택되고 염색체 중심을 찾는 데 사용된다. 여기에서 사용된 것은 동일한 염색체에 속하는 바코드 세트의 중심을 찾기 위한 제약된 K-평균 알고리즘의 구현이다. 상동체를 분리하기 위해, 동일한 클러스터에 있지 않도록 하기 위해 동일한 좌위의 2개의 복사본에 연결-불가(cannot-link) 제약이 사용되었다. 중심에 기점이 있는 반경 4.5 ㎛의 구체를 사용하여 염색체 영역을 구분하고 외부에 위치한 패치를 필터링했다.
통합 모델링 플랫폼의 Domino 샘플러(예를 들어, Russel et al. 2012 참조)는 염색체 추적의 핵심 요소이다. Domino에서, 각 좌위는 이미지에서 서로 다른 가능한 위치의 유한 세트가 있는 입자로 표시된다. 좌위에 할당된 것과 동일한 바코드를 갖는 패치 목록에서 위치(positions)가 추출된다. 제안된 문제의 나머지 요소는 가능한 솔루션 목록에 대한 제한으로 시스템에 코딩된다. 호환가능한 솔루션을 필터링하기 위해 시스템에 다음과 같은 제한이 적용된다: 2개 입자는 동일한 위치/패치를 공유할 수 없음; 동일한 염색체의 2개의 연속 입자는 36plex 데이터세트의 경우 4 ㎛, ChrX-46plex의 경우 1 ㎛의 거리보다 더 가까워야 함; 염색체는 반경 4.5 ㎛의 구체로 모델링된 영역에 국한되어야 함.
염색체 영역 및 연속 좌위 사이의 거리는 "염색체 영역 및 연속 좌위 사이의 최대 거리 추론" 섹션에서 설명된 바와 같이 추론된다. 이러한 추가 제약 조건을 바코드에 적용함으로써 검출 임계값(예를 들어, 표 3 참조)보다 낮지만 멀리 있지 않은 강도를 갖는 패치를 사용할 수 있고 진정 양성일 가능성이 있다. 강도와 크기가 더 높은 패치는 진정 양성 좌위일 가능성이 가장 높다. 따라서, 해당 패치가 진정 양성 검출일 가능성을 측정하는 척도로서 강도 및 크기에 기반한 점수가 각 패치에 할당된다. 패치 목록은 점수별로 정렬되고 각 염색체의 가장 가능성 있는 경로를 찾기 위한 반복적인 프로세스에 대한 입력 데이터로 사용된다(예를 들어, 도 7 참조).
염색체를 추적하는 반복적인 프로세스는 높은 점수를 가진 패치를 해당 좌위에 할당함으로써 시작된다. 바코드는 이들을 구별하도록 설계되어 있지 않기 때문에 모든 상동체를 동시에 고려하여 염색체당 1회 프로세스를 실행한다. Domino는 부과된 제한과 호환가능한 모든 가능한 솔루션을 나열하는 데 사용된다. 각 솔루션은 해당 특정 솔루션에서 선택한 개별 패치의 점수를 더하여 얻은 총 점수를 갖는다. 총점이 가장 높은 형태가 선택된다. 2개 이상의 솔루션이 동일한 총점을 얻을 경우 가장 짧은 염색체 공간 길이와 부합하는 솔루션을 선택한다. 좌위 할당은 임계값을 낮추어 입력으로 더 많은 패치를 사용하고 이전 접근 방식을 사용하여 할당되지 않은 나머지 좌위를 선택함으로써 반복적인 프로세스로 수행된다. 이 반복적인 프로세스는 모든 좌위가 식별되었거나 또는 Domino에 공급할 입력 데이터가 더 이상 없을 때 완료된다.
검출 효율성 및 위양성 비율
바코드당 검출 효율을 계산하기 위해, 데이터세트는 모든 실험 조건에 대해 최적화된 강도 임계값(예를 들어, 표 3 참조)을 사용하여 필터링된다. 하나의 단일 픽셀로 형성된 패치도 강도에 관계없이 폐기된다.
36플렉스 데이터세트의 경우, X 염색체에 할당된 것을 제외하고 핵당 검출된 바코드의 평균을 계산했다. 이상적인 경우 및 배수성으로 인해, 핵당 2개의 바코드가 예상된다. 실제로, 데이터 세트에는 결국 비율이 증가할 동일한 올리고에 속하는 패치의 중복 또는 위양상이 포함될 수 있다. 평균 2.5개 이상의 바코드를 가진 핵은 유사분열 과정에 있을 가능성이 높기 때문에 폐기된다. ChrX-46plex의 경우, 유사한 절차를 따랐고 검출된 바코드의 평균이 1.5보다 높은 핵을 폐기했다.
나머지 핵 각각의 경우, 검출된 바코드 대 예상된 바코드의 비율을 계산했다. 염색체 X에 속하는 바코드를 제외하고 세포당 2개의 바코드가 예상된다. 바코드당 및 세포당 비율은 1.0으로 제한되고, 모든 세포에 대해 평균화되어 검출 효율이 산출된다. 대신, 바코드의 위양성 비율의 경우, 계산은 검출된 값이 예상된 값을 초과하는 경우 검출된 값에서 예상된 값을 뺀 검출 초과량을 계산한 다음, 예상 초과값 대 예상값의 비율에 대해 계산하는 것을 포함한다.
거리 히트-맵 및 Hi-C 맵
모든 추적된 핵의 경우, 검출된 좌 사이의 모든 페어와이즈 거리를 계산하고 모든 세포에서 결과를 평균화했다. 36plex-5K LIT 데이터세트의 평균 히트맵의 경우 3qR3 및 5pR3 좌위는 이들이 동일한 바코드를 공유하고 따라서 구별할 수 없기 때문에 고려되지 않았다. PGP1f 세포의 Hi-C 맵은 이전의 제자리 Hi-C 실험에서 얻었다(예를 들어, Nir et al. 2018 참조). 포함된 Hi-C 맵에서의 상호작용 빈도 값은 5Kbp 해상도에서 생성된 상호작용 매트릭스의 관찰된 값에서 추출되었다. 각 프로브 쌍의 게놈 영역에 의해 형성된 서브매트릭스를 집계하여 좌위-간(inter-loci) 관찰된 상호작용을 획득했다. 단일 세포 히트맵을 상동 염색체를 식별하여 구축했다. 바코드 목록을 방법론에 설명된 절차에 따라 추적한다. 그런 다음 추적된 좌위의 모든 페어와이즈 거리를 계산한다. 식별되지 않은 좌위는 회색 열/행으로 나타난다.
상관도의 목록
라이브러리 필터링 없음 유사분열 세포 필터링
36plex-5K LIT 페어와이즈 거리=2095723
상관도=-0.685
p값=4.789e-161
페어와이즈 거리=1287298
상관도=-0.705
p값=1.771e-174
36plex-1K eLIT 페어와이즈 거리=1871099
상관도=-0.692
p값=1.167e-185
페어와이즈 거리=1077893
상관도=-0.697
p값=1.091e-189
chrX 46plex 페어와이즈 거리=370499
상관도=-0.562
p값=8.041654826642585e-177
페어와이즈 거리=180896
상관도=-0.64
p값=7.0735300041298106e-245
염색체 영역 추론 및 연속 좌위 사이의 최대 거리
염색체 추적에 사용된 연속 좌위 사이의 최대 거리를 추론하기 위해, 모든 36플렉스 데이터세트에 대해 검출된 바코드 목록을 필터링하여 검출 효율 섹션에 설명된 바와 같이 유사분열 세포를 폐기했다. 하나의 단일 픽셀로 형성된 패치도 필터링되었다. 필터링 프로세스 후, 36plex 데이터세트는 1,171개의 핵과 48,352개의 바코드로 구성되었다. 그런 다음 각 핵 내의 각 염색체에 대한 연속적인 좌위 사이의 거리를 계산했다. 이러한 거리의 히스토그램 플롯은 남성 세포에서 예상되는 염색체 X를 제외하고 염색체에 대해 예상되는 바이모달 분포를 보여준다(예를 들어, 도 8 참조). 더 큰 염색체는 핵의 주변부에 있는 경향이 있는 반면 작은 염색체는 내부를 선호하기 때문에 바이모달리티(bimodality)는 더 큰 염색체에서 더 분명하다.
히스토그램의 검사 후, 4㎛를 연속 좌위 사이의 일반적인 최대 거리로 선택하였고 염색체 영역의 경우 약간 더 높은 값인 4.5㎛를 선택하였다.
ChrX-46plex의 경우, 유사한 접근 방식에 따랐다. 필터링 프로세스 후, ChrX-46plex 데이터세트는 189개의 핵과 7752개의 바코드를 포함했다. 연속된 좌위 사이의 거리 히스토그램을 기반으로, 2.5 ㎛를 일반적인 최대 거리로 선택했다.
chrX-46plex용 3D 구조 클러스터링
티어 2 검출 후, 평균 34개의 검출된 좌위가 있는 chrX-46plex 라이브러리에 대해 177개의 세포를 사용했다. 세포 중 하나는 모든 3D 구조에서 세포당 50% 이상의 검출 효율을 요구하는 식별된 바코드가 23개 미만인 이유로 폐기하였다. 그런 다음 각 염색체에 대해 검출된 모든 표적 사이의 페어와이즈 거리를 계산하고 거리 매트릭스를 구축하기 위한 유사성 척도로 사용했다. 구조 간의 일치 거리는 Ward 방법을 사용하여 계층적으로 클러스터링하는 데 사용했다.
클러스터링 평가를 위한 Calinski-Harabasz 기준은 클러스터의 최적 수를 평가하는 데 사용했다.
강도 임계값
화학
라운드 수
스트리트 임계값 단일 라운드 임계값 평균 토토의 임계값
(사용이능한 경우)
JEB 5 MS 62000 61000 47000
JEB 5 MSBS 64000 63500 47000
SOLiD 4 MS 64000 63500 47000
SOLiD 4 MSBS 64000 63500 47000
임계값 단일 라운드: 적어도 한 라운드에서 최소 강도 값
임계값 평균: 모든 라운드 평균의 최소 강도 값
토토의 임계값: 토토 이미지의 최소 강도 값
실시예 4
JEB 오버행
도 11a-11e에 나타낸 바와 같이, JEB 오버행은 상보적 올리고뉴클레오티드를 모집하는 기능을 한다. 상보적 올리고뉴클레오티드는 형광단, 금속 원소, DNA 오리가미 구조, 비오틴 및/또는 기타 화학적 부분으로 라벨링될 수 있다. 상보적 올리고뉴클레오타이드는 또한 분기 반응과 같은 방법에 의해 신호를 증폭하기 위해 추가적인 올리고뉴클레오타이드를 모집할 수 있다. JEB 오버행은 혼성화 연쇄 반응(HCR), 교환 반응에 의한 신호 증폭(SABER), 또는 롤링 서클 증폭(RCA)과 같은 방법으로 신호를 증폭하는 데에도 사용할 수 있다. JEB 오버행은 인시투 시퀀싱을 위한 주형으로도 사용할 수 있다. JEB 오버행은 초해상 현미경을 중재하기 위해 DNA-PAINT(나노스케일 토폴로지의 DNA 포인트 축적)에 대한 이미저 가닥을 모집하기 위한 도킹 가닥으로 역할할 수 있으며; 예를 들어, 이의 내용이 그 전문으로 본 명세서에 참조로 통합되는 다음 문헌 참조: Schnitzbauer et al., Super-resolution microscopy with DNA-PAINT, Nature Protocols vol㎛e 12, 1198?1228(2017). JEB 오버행을 DNA-PAINT와 결합하면 다중화를 유의하게 증가시키고 이미지화 시간을 단축할 수 있다.
실시예 5
JEB/OligoFISSEQ를 사용한 핵형 분석
JEB 올리고와 함께 OligoFISSEQ를 생물학적 샘플의 신속 핵형 분석을 위해 사용하였다. 예를 들어, 도 12a-12b, 도 13, 도 14, 또는 도 15를 참조. 샘플은 인간 세포 핵 또는 임의의 유기체로부터의 세포 핵일 수 있다. 각 염색체는 p 및 q 암 당 적어도 1개 또는 2개 또는 3개의 검출가능한 표적을 포함할 수 있다. 각 염색체는 적어도 하나의 검출가능한 표적을 가질 수 있다. 중기 스프레드은 배양된 세포 핵 또는 조직 절편 또는 오르가노이드 또는 생검 표본에서 추출한 핵에서 얻을 수 있다. 각 염색체 암은 최대 6, 10, 또는 20개의 검출가능한 표적을 포함할 수 있다. 표적은 올리고페인트 프로브일 수 있다. 표적은 DNA, RNA 또는 핵산 또는 염색체 DNA일 수 있다.
실시예 6
Au-NP의 존재하의 OligoFISSEQ
하나 또는 둘 모두의 시퀀싱 프라이머는 3' 말단에 직경 10 nm, 30 nm, 50 nm 또는 이들의 조합의 금 나노입자를 포함할 수 있다. 나노입자는 금 나노막대일 수 있다. 예를 들어, 도 16을 참조. 나노입자는 검출가능한 라벨로부터 30bp 또는 20bp 보다 더 먼 거리에 위치할 수 있다. 형광단-라벨링된 JEB 올리고의 형광 신호는 나노입자에 의해 적어도 1.5배, 적어도 3배, 적어도 10배, 또는 적어도 50배만큼 증강될 수 있다. 이러한 나노입자는 세포 핵, 중기 염색체, 또는 중기 염색체 스프레드의 표적화된 영역에서 검출가능한 라벨의 형광 신호를 증가시킬 수 있다. 금 나노입자 라벨링된 표적화된 영역은 전자 현미경 검사법, 형광 현미경 검사법, 암시야 현미경 검사법, 또는 이들의 임의의 조합으로 시각화할 수 있다. 표적은 올리고페인트 프로브일 수 있다.
실시예 7
OligoFISSEQ + OligoSTORM
여기에서는 적어도 1 라운드의 OligoSTORM 또는 2 라운드의 OligoSTORM 또는 3 라운드의 OligoSTORM 또는 5 라운드의 OligoSTORM 또는 20 라운드의 OligoSTORM을 사용하여 초해상도 이미지화에서 생물학적 샘플 내의 12 또는 66 또는 258 또는 500 또는 5000개 이상의 표적을 동시에 검출 및 이미지화하는 방법을 설명한다. 예를 들어, 도 17을 참조. 스트리트 중 하나에서 표적의 결합 영역에 상보적인 형광단-라벨링된 올리고를 사용하여 한 번에 모든 표적을 시각화할 수 있다. 스트리트 중 하나에서 표적의 결합 영역에 상보적인 형광단-라벨링된 올리고를 사용하여 한 번에 표적의 적어도 절반을 시각화할 수 있다. 그런 다음 동일한 생물학적 샘플에서 2 또는 3 또는 5 또는 10 또는 20 라운드의 OligoFISSEQ를 사용하여 개별 표적의 아이덴티티(identity)를 디코딩할 수 있다. 표적은 적어도 1kb 또는 15kb 또는 50kb 또는 100kb 또는 1Mb, 또는 전체 염색체 또는 전체 게놈일 수 있다.
SEQUENCE LISTING <110> PRESIDENT AND FELLOWS OF HARVARD COLLEGE <120> COMPOSITIONS, SETS, AND METHODS RELATED TO TARGET ANALYSIS <130> 002806-095230WOPT <150> 62/940,638 <151> 2019-11-26 <160> 17 <170> PatentIn version 3.5 <210> 1 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 1 gagcg 5 <210> 2 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 2 gacca 5 <210> 3 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 3 ccaga 5 <210> 4 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 4 agacc 5 <210> 5 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 5 actgtgaatc gc 12 <210> 6 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(3) <223> n comprises a universal nucleotide base (e.g., deoxyinosine) <220> <221> misc_feature <222> (3)..(4) <223> sulfur modification in place of the bridged oxygen of the phosphate backbone between nucleotides 3 and 4 <400> 6 nnntgact 8 <210> 7 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(3) <223> n comprises a universal nucleotide base (e.g., deoxyinosine) <220> <221> misc_feature <222> (3)..(4) <223> sulfur modification in place of the bridged oxygen of the phosphate backbone between nucleotides 3 and 4 <400> 7 nnnagacc 8 <210> 8 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(3) <223> n comprises a universal nucleotide base (e.g., deoxyinosine) <220> <221> misc_feature <222> (3)..(4) <223> sulfur modification in place of the bridged oxygen of the phosphate backbone between nucleotides 3 and 4 <400> 8 nnngacca 8 <210> 9 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(3) <223> n comprises a universal nucleotide base (e.g., deoxyinosine) <220> <221> misc_feature <222> (3)..(4) <223> sulfur modification in place of the bridged oxygen of the phosphate backbone between nucleotides 3 and 4 <400> 9 nnngagcg 8 <210> 10 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 10 tggtcggtct agtca 15 <210> 11 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 11 tggtcggtct agtcacgctc ggtct 25 <210> 12 <211> 13 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <220> <221> misc_feature <222> (1)..(3) <223> n comprises a universal nucleotide base (e.g., deoxyinosine) <220> <221> misc_feature <222> (3)..(4) <223> sulfur modification in place of the bridged oxygen of the phosphate backbone between nucleotides 3 and 4 <400> 12 nnnagaccga cca 13 <210> 13 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 13 agaccgagcg tgactagacc gacca 25 <210> 14 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 14 gcgag 5 <210> 15 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 15 accag 5 <210> 16 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 16 ccaga 5 <210> 17 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> synthetic oligonucleotide <400> 17 tcagt 5

Claims (141)

  1. 적어도 2개의 판독 분자의 세트로서, 각각의 판독 분자가,
    a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
    b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
    c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
    d. 광학적으로 검출가능한 라벨,
    을 포함하는, 세트.
  2. 청구항 1에 있어서, 상기 라벨이 형광 라벨인, 세트.
  3. 청구항 1 또는 청구항 2에 있어서, 상기 광학적으로 검출가능한 라벨이, 비오틴, 아민, 금속, 금속 나노클러스터, 귀금속(noble metal) 나노입자, 고정 분자, 양자점, 아크리다이트(acrydite), 또는 DNA 오리가미(origami) 구조를 포함하거나 또는 추가로 포함하는, 세트.
  4. 청구항 1 내지 청구항 3 중 어느 한 항에 있어서, 상기 라벨이, 판독 분자의 5' 말단에 위치하는, 세트.
  5. 청구항 1 내지 청구항 4 중 어느 한 항에 있어서, 상기 세트가, 4개의 구별가능한 라벨을 포함하는, 세트.
  6. 청구항 1 내지 청구항 5 중 어느 한 항에 있어서, 상기 세트가, 적어도 2개의 구별가능한 라벨을 포함하는, 세트.
  7. 청구항 1 내지 청구항 6 중 어느 한 항에 있어서, 상기 세트가, 적어도 3개의 구별가능한 라벨을 포함하는, 세트.
  8. 청구항 1 내지 청구항 7 중 어느 한 항에 있어서, 상기 세트가, 적어도 4개의 구별가능한 라벨을 포함하는, 세트.
  9. 청구항 1 내지 청구항 8 중 어느 한 항에 있어서, 제1의 3' 영역을 포함하는 각 세트의 판독 분자가, 제1 구별가능한 라벨만을 포함하는, 세트.
  10. 청구항 1 내지 청구항 9 중 어느 한 항에 있어서, 임의의 선택된 3' 영역을 포함하는 각 세트의 판독 분자가, 상응하는 주어진 구별가능한 라벨만을 포함하는, 세트.
  11. 청구항 1 내지 청구항 10 중 어느 한 항에 있어서, 상기 3' 영역이, 그 길이가 적어도 1개의 뉴클레오티드 또는 이의 유사체인, 세트.
  12. 청구항 1 내지 청구항 11 중 어느 한 항에 있어서, 상기 3' 영역이, 그 길이가 5개의 뉴클레오티드 또는 이의 유사체인, 세트.
  13. 청구항 1 내지 청구항 12 중 어느 한 항에 있어서, 상기 5' 영역이, 범용(universal) 뉴클레오티드 염기만을 포함하는 것인, 세트.
  14. 청구항 1 내지 청구항 13 중 어느 한 항에 있어서, 상기 5' 영역이, 데옥시이노신 뉴클레오티드만을 포함하는, 세트.
  15. 청구항 1 내지 청구항 14 중 어느 한 항에 있어서, 상기 5' 영역이, 그 길이가 적어도 1개의 뉴클레오티드 또는 이의 유사체인, 세트.
  16. 청구항 1 내지 청구항 15 중 어느 한 항에 있어서, 상기 5' 영역이, 그 길이가 3개의 뉴클레오티드 또는 이의 유사체인, 세트.
  17. 청구항 1 내지 청구항 16 중 어느 한 항에 있어서, 상기 적어도 2개의 판독 분자가, DNA 및/또는 RNA를 포함하는, 세트.
  18. 청구항 1 내지 청구항 17 중 어느 한 항에 있어서, 상기 적어도 2개의 판독 분자가, DNA 및/또는 RNA로 구성되거나 또는 이로 본질적으로 구성되는, 세트.
  19. 청구항 1 내지 청구항 18 중 어느 한 항에 있어서, 상기 적어도 2개의 판독 분자가, 폴리펩티드를 포함하는, 세트.
  20. 적어도 2개의 판독 분자의 세트로서, 각각의 판독 분자가,
    a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
    b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역; 및
    c. 5'와 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형
    을 포함하는, 세트.
  21. 청구항 20에 있어서, 적어도 하나의 판독 분자의 상기 5' 비-바코드-혼성화 영역이, 올리고뉴클레오티드에 특이적으로 혼성화하는, 세트.
  22. 청구항 20 또는 청구항 21에 있어서, 상기 올리고뉴클레오티드가, 적어도 하나의 검출가능한 라벨을 포함하는, 세트.
  23. 청구항 20 내지 청구항 22 중 어느 한 항에 있어서, 상기 올리고뉴클레오티드가, 적어도 하나의 다른 올리고뉴클레오티드에 특이적으로 혼성화하는, 세트.
  24. 청구항 20 내지 청구항 23 중 어느 한 항에 있어서, 상기 올리고뉴클레오티드가 증폭 프라이머인, 세트.
  25. 청구항 20 내지 청구항 24 중 어느 한 항에 있어서, 상기 올리고뉴클레오티드가 시퀀싱 프라이머인, 세트.
  26. 청구항 20 내지 청구항 25 중 어느 한 항에 있어서, 상기 올리고뉴클레오티드가, 초해상도 현미경 검사법을 위한 이미저 가닥(imager strand)인, 세트.
  27. 청구항 20 내지 청구항 26 중 어느 한 항에 있어서, 적어도 하나의 판독 분자의 상기 5' 비-바코드-혼성화 영역이, 적어도 5개의 뉴클레오티드의 길이인, 세트.
  28. 청구항 20 내지 청구항 27 중 어느 한 항에 있어서, 적어도 하나의 판독 분자의 상기 5' 비-바코드-혼성화 영역이, 적어도 10개의 뉴클레오티드의 길이인, 세트.
  29. 청구항 20 내지 청구항 28 중 어느 한 항에 있어서, 상기 5' 비-바코드-혼성화 영역이, 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함하는, 세트.
  30. 청구항 20 내지 청구항 29 중 어느 한 항에 있어서, 적어도 하나의 판독 분자가, 광학적으로 검출가능한 라벨을 포함하는, 세트.
  31. 청구항 20 내지 청구항 30 중 어느 한 항에 있어서, 적어도 하나의 판독 분자의 라벨이 형광 라벨인, 세트.
  32. 청구항 20 내지 청구항 31 중 어느 한 항에 있어서, 상기 광학적으로 검출가능한 라벨이, 형광단, 바이오틴, 아민, 금속, 금속 나노클러스터, 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조를 포함하거나 또는 추가로 포함하는, 세트.
  33. 판독 분자로서,
    a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 판독 분자의 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
    b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
    c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형;
    d. 광학적으로 검출가능한 라벨; 및
    e. 나노 입자,
    를 포함하는, 판독 분자.
  34. 판독 분자로서,
    a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 판독 분자의 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
    b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
    c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
    d. 금속 나노입자
    를 포함하는, 판독 분자.
  35. 판독 분자로서,
    a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역;
    b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역;
    c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
    d. 금속 나노입자,
    를 포함하는, 판독 분자.
  36. 청구항 34 또는 청구항 35에 있어서, 광학적으로 검출가능한 라벨을 추가로 포함하는, 판독 분자.
  37. 적어도 2개의 판독 분자의 세트로서, 각각의 판독 분자가,
    a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
    b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함;
    c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형; 및
    d. 광학적으로 검출 가능한 라벨;
    을 포함하고,
    적어도 하나의 판독 분자는 나노입자를 추가로 포함하는, 세트.
  38. 적어도 2개의 판독 분자의 세트로서, 각각의 판독 분자가,
    a. 뉴클레오티드 또는 이의 유사체의 3' 바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 3' 영역 서열과 구별되는 고유 서열을 포함함;
    b. 뉴클레오티드 또는 이의 유사체의 5' 비-바코드-혼성화 영역, 상기 영역은 상기 세트 내의 다른 모든 판독 분자의 5' 영역 서열과 동일한 서열을 포함함; 및
    c. 5' 및 3' 영역 사이의 포스페이트 골격의 가교 산소를 대신하여 황 변형;
    을 포함하고,
    적어도 하나의 판독 분자는 나노입자를 추가로 포함하는, 세트.
  39. 청구항 38에 있어서, 적어도 하나의 판독 분자가, 광학적으로 검출가능한 라벨을 추가로 포함하는, 세트.
  40. 청구항 33 내지 청구항 39 중 어느 한 항에 있어서, 상기 광학적으로 검출가능한 라벨이, 형광단을 포함하는, 판독 분자 또는 이의 세트.
  41. 청구항 33 내지 청구항 40 중 어느 한 항에 있어서, 상기 나노입자가, 상기 세트의 적어도 2개의 판독 분자에 연결된, 판독 분자 또는 이의 세트.
  42. 청구항 33 내지 청구항 41 중 어느 한 항에 있어서, 상기 나노입자가, 금속 나노입자를 포함하는, 판독 분자 또는 이의 세트.
  43. 청구항 33 내지 청구항 42 중 어느 한 항에 있어서, 상기 금속 나노입자가, Au, Ag, Ni, Co, Pt, Pd, Cu, Ti, 및 Al 나노입자로 이루어진 군으로부터 선택되는, 판독 분자 또는 이의 세트.
  44. 청구항 33 내지 청구항 43 중 어느 한 항에 있어서, 상기 나노입자가 금 나노입자를 포함하는, 판독 분자 또는 이의 세트.
  45. 청구항 33 내지 청구항 44 중 어느 한 항에 있어서, 상기 나노입자가 금 나노막대를 포함하는, 판독 분자 또는 이의 세트.
  46. 청구항 33 내지 청구항 45 중 어느 한 항에 있어서, 상기 나노입자가 약 1.2 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
  47. 청구항 33 내지 청구항 46 중 어느 한 항에 있어서, 상기 나노입자가 약 3 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
  48. 청구항 33 내지 청구항 47 중 어느 한 항에 있어서, 상기 나노입자가 약 5 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
  49. 청구항 33 내지 청구항 48 중 어느 한 항에 있어서, 상기 나노입자가 약 10 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
  50. 청구항 33 내지 청구항 49 중 어느 한 항에 있어서, 상기 나노입자가 약 30 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
  51. 청구항 33 내지 청구항 50 중 어느 한 항에 있어서, 상기 나노입자가 약 50 nm의 직경을 갖는, 판독 분자 또는 이의 세트.
  52. 청구항 33 내지 청구항 51 중 어느 한 항에 있어서, 상기 나노입자가, 상기 판독 분자의 3' 말단에 있는, 판독 분자 또는 이의 세트.
  53. 청구항 33 내지 청구항 52 중 어느 한 항에 있어서, 상기 나노입자가, 상기 검출가능한 라벨로부터 적어도 20 뉴클레오티드에 있는, 판독 분자 또는 이의 세트.
  54. 청구항 33 내지 청구항 53 중 어느 한 항에 있어서, 상기 나노입자가, 상기 검출가능한 라벨로부터 적어도 30 뉴클레오티드에 있는, 판독 분자 또는 이의 세트.
  55. 하기를 위한, 청구항 1 내지 청구항 54 중 어느 한 항의 판독 분자 또는 이의 세트의 사용:
    a. 적어도 하나의 표적 분자의 검출;
    b. 신호 증폭;
    c. 분지 반응(branch reaction);
    d. 혼성화 연쇄 반응(HCR; hybridization chain reaction);
    e. 교환 반응에 의한 신호 증폭(SABER; signal amplification by exchange reaction);
    f. 롤링 서클 증폭(RCA; rolling circle amplification);
    g. 인시투 시퀀싱 (in situ sequencing) ;
    h. 매트릭스 부착(matrix attachment); 또는
    i. 초고해상도 현미경 검사법(super resolution microscopy).
  56. 샘플에서 적어도 하나의 표적 분자를 검출하는 방법으로서, 상기 방법은,
    a. 상기 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는,
    i. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
    ii. 적어도 하나의 바코드 비트(barcode bit)를 포함하는 바코드 영역을 포함하는 스트리트(street),
    를 포함함;
    b. 청구항 1 내지 청구항 54 중 어느 한 항에 따른 판독 분자의 세트와 상기 샘플을 접촉시키는 단계; 및
    c. 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계,
    를 포함하는 방법.
  57. 청구항 56에 있어서, 상기 바코드 영역이 각각의 올리고뉴클레오티드 태그에 고유한, 방법.
  58. 청구항 56 내지 청구항 57 중 어느 한 항에 있어서, 고유 바코드 비트(unique barcode bit)의 총 수가, 가능한 고유 바코드 비트의 총 수보다 적은, 방법.
  59. 청구항 56 내지 청구항 58 중 어느 한 항에 있어서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수의 10% 미만인, 방법.
  60. 청구항 56 또는 청구항 59에 있어서, 고유 바코드 비트의 총 수가, 가능한 고유 바코드 비트의 총 수의 1% 미만인, 방법.
  61. 청구항 56 내지 청구항 60 중 어느 한 항에 있어서, 고유 바코드 비트의 총 수가, 적어도 2개의 고유 바코드 비트인, 방법.
  62. 청구항 56 내지 청구항 61 중 어느 한 항에 있어서, 고유 바코드 비트의 총 수가, 10개 이하의 고유 바코드 비트인, 방법.
  63. 청구항 56 내지 청구항 62 중 어느 한 항에 있어서, 상기 바코드-혼성화 영역이, 각각의 판독 분자에 고유한, 방법.
  64. 청구항 56 내지 청구항 63 중 어느 한 항에 있어서, 상기 판독 분자의 세트에 사용된 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수보다 적은, 방법.
  65. 청구항 56 내지 청구항 64 중 어느 한 항에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 10% 미만인, 방법.
  66. 청구항 56 내지 청구항 65 중 어느 한 항에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 가능한 고유 바코드-혼성화 영역의 총 수의 1% 미만인, 방법.
  67. 청구항 56 내지 청구항 66 중 어느 한 항에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 적어도 2개의 고유 바코드-혼성화 영역을 포함하는, 방법.
  68. 청구항 56 내지 청구항 67 중 어느 한 항에 있어서, 상기 판독 분자의 세트 내의 고유 바코드-혼성화 영역의 총 수가, 10개 이하의 고유 바코드-혼성화 영역을 포함하는, 방법.
  69. 청구항 56 내지 청구항 68 중 어느 한 항에 있어서, 상기 스트리트가, 시퀀싱 프라이머를 어닐링하기 위한 프라이머 결합 영역을 추가로 포함하는, 방법.
  70. 청구항 56 내지 청구항 69 중 어느 한 항에 있어서, 상기 검출 단계가 시퀀싱법으로 수행되는, 방법.
  71. 청구항 56 내지 청구항 70 중 어느 한 항에 있어서, 상기 시퀀싱법이, 라이게이션에 의한 시퀀싱(sequencing by ligation), 합성에 의한 시퀀싱(sequencing by synthesis), 혼성화에 의한 시퀀싱(sequencing by hybridization), 및/또는 순환 가역적 중합 혼성화 연쇄 반응에 의한 시퀀싱(sequencing by cyclic reversible polymerization hybridization chain reaction)을 포함하는, 방법.
  72. 청구항 56 내지 청구항 71 중 어느 한 항에 있어서, 상기 라이게이션에 의한 시퀀싱이, 효소 기반 라이게이션을 포함하는, 방법.
  73. 청구항 56 내지 청구항 72 중 어느 한 항에 있어서, 상기 라이게이션에 의한 시퀀싱이, 화학적 라이게이션, 구리 보조 라이게이션(copper assisted ligation), 무 구리 클릭 반응(copper free click reaction), 아민-EDC 기반 커플링, 또는 티올-말레이미드 마이클 부가를 포함하는, 방법.
  74. 청구항 56 내지 청구항 73 중 어느 한 항에 있어서, 상기 스트리트에 대한 판독 분자의 특이적 혼성화가, 바코드 영역 및 바코드-혼성화 영역의 아이덴티티(identity)에 의해 결정되는, 방법.
  75. 청구항 56 내지 청구항 74 중 어느 한 항에 있어서, 상기 광학적으로 검출가능한 라벨이, 형광단인, 방법.
  76. 청구항 56 내지 청구항 75 중 어느 한 항에 있어서, 상기 검출이 형광 현미경 검사법으로 수행되는, 방법.
  77. 청구항 56 내지 청구항 76 중 어느 한 항에 있어서, 상기 광학적으로 검출가능한 라벨이, 비오틴, 아민, 금속, 금속 나노클러스터, 귀금속 나노입자, 고정 분자, 양자점, 아크리다이트, 또는 DNA 오리가미 구조를 추가로 포함하는, 방법.
  78. 청구항 56 내지 청구항 77 중 어느 한 항에 있어서, 상기 검출이 적어도 단일 세포 해상도로 수행되는 방법.
  79. 청구항 56 내지 청구항 78 중 어느 한 항에 있어서, 상기 검출이 적어도 단일 핵 해상도로 수행되는 방법.
  80. 청구항 56 내지 청구항 79 중 어느 한 항에 있어서, 적어도 2개의 표적 분자가 동시에 검출되는, 방법.
  81. 청구항 56 내지 청구항 80 중 어느 한 항에 있어서, 적어도 3개의 표적 분자가 동시에 검출되는, 방법.
  82. 청구항 56 내지 청구항 81 중 어느 한 항에 있어서, 적어도 10개의 표적 분자가 동시에 검출되는, 방법.
  83. 청구항 56 내지 청구항 82 중 어느 한 항에 있어서, 적어도 20개의 표적 분자가 동시에 검출되는, 방법.
  84. 청구항 56 내지 청구항 83 중 어느 한 항에 있어서, 상기 표적 분자가 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질을 포함하는, 방법.
  85. 청구항 56 내지 청구항 84 중 어느 한 항에 있어서, 상기 표적 분자가 DNA 및/또는 RNA를 포함하는, 방법.
  86. 청구항 56 내지 청구항 85 중 어느 한 항에 있어서, 상기 표적 분자가 폴리펩티드를 포함하는, 방법.
  87. 청구항 56 내지 청구항 86 중 어느 한 항에 있어서, 상기 표적 분자가 핵산, 폴리펩티드, 세포 표면 분자, 또는 무기 물질에, 공유적으로 또는 비공유적으로 연결되어 있는, 방법.
  88. 청구항 56 내지 청구항 87 중 어느 한 항에 있어서, 상기 샘플이 세포, 세포 배양물, 또는 조직 샘플인, 방법.
  89. 청구항 56 내지 청구항 88 중 어느 한 항에 있어서, 상기 샘플이 오르가노이드를 포함하는, 방법.
  90. 샘플에서 적어도 하나의 표적 분자를 검출하는 향상된 방법으로서, 상기 방법은,
    a. 상기 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는,
    i. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
    ii. 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,
    를 포함함;
    b. 상기 샘플을 청구항 1 내지 청구항 54 중 어느 한 항에 따른 판독 분자 또는 이의 세트와 접촉시키는 단계; 및
    c. 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계,
    를 포함하는 방법.
  91. 청구항 90에 있어서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 1.5배 증가된, 방법.
  92. 청구항 90 내지 청구항 91 중 어느 한 항에 있어서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 3배 증가된, 방법.
  93. 청구항 90 내지 청구항 92 중 어느 한 항에 있어서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 10배 증가된, 방법.
  94. 청구항 90 내지 청구항 93 중 어느 한 항에 있어서, 나노입자를 포함하는 상기 적어도 하나의 판독 분자의 광학적으로 검출가능한 라벨의 신호가, 상기 나노입자를 포함하지 않는 동일한 판독 분자의 광학적으로 검출가능한 라벨의 신호와 비교하여, 적어도 50배 증가된, 방법.
  95. 청구항 90 내지 청구항 94 중 어느 한 항에 있어서, 상기 샘플이 인간 세포 핵을 포함하는 방법.
  96. 청구항 90 내지 청구항 95 중 어느 한 항에 있어서, 상기 샘플이 임의의 유기체의 세포로부터의 핵을 포함하는, 방법.
  97. 청구항 90 내지 청구항 96 중 어느 한 항에 있어서, 상기 샘플이 중기 염색체 스프레드(metaphase chromosome spread)를 포함하는, 방법.
  98. 청구항 90 내지 청구항 97 중 어느 한 항에 있어서, 상기 중기 염색체가 배양된 세포 핵으로부터 수득되는, 방법.
  99. 청구항 90 내지 청구항 98 중 어느 한 항에 있어서, 상기 중기 염색체가 조직 절편, 오르가노이드, 또는 생검 표본으로부터 추출된 핵으로부터 수득되는, 방법.
  100. 청구항 90 내지 청구항 99 중 어느 한 항에 있어서, 상기 검출가능한 라벨이 전자 현미경 검사법, 형광 현미경 검사법, 암시야 현미경 검사법, 또는 이들의 임의의 조합을 사용하여 검출되는, 방법.
  101. 생물학적 샘플의 핵형 분석(karyotyping) 방법으로서, 상기 방법은,
    a. 상기 샘플을 적어도 하나의 염색체에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계, 각각의 올리고뉴클레오티드 태그는,
    i. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
    ii. 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,
    를 포함함;
    b. 상기 샘플을 청구항 1 내지 청구항 54 중 어느 한 항에 따른 판독 분자의 세트와 접촉시키는 단계;
    c. 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 적어도 하나의 표적 분자에 혼성화되고, 이로써 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계; 및
    d. 적어도 하나의 염색체에 특이적인 적어도 하나의 올리고뉴클레오티드 태그의 아이덴티티(identity)에 따라 적어도 하나의 염색체의 아이덴티티를 결정하는 단계,
    를 포함하는, 방법.
  102. 청구항 101에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 p 암(arm)에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉되는 것인, 방법.
  103. 청구항 101 또는 청구항 102에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 q 암(arm)에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉되는, 방법.
  104. 청구항 101 내지 청구항 103 중 어느 한 항에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 p 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그, 및 상기 적어도 하나의 염색체의 q 암에 특이적인 적어도 하나의 올리고뉴클레오티드 태그와 접촉되는, 방법.
  105. 청구항 101 내지 청구항 104 중 어느 한 항에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 p 암 또는 q 암에 특이적인 적어도 2개의 올리고뉴클레오티드 태그와 접촉되는 방법.
  106. 청구항 101 내지 청구항 105 중 어느 한 항에 있어서, 상기 샘플이 상기 적어도 하나의 염색체의 p 암 또는 q 암에 특이적인 적어도 3개의 올리고뉴클레오티드 태그와 접촉되는, 방법.
  107. 청구항 101 내지 청구항 106 중 어느 한 항에 있어서, 상기 샘플이 각 염색체 암(arm)에 특이적인 최대 6개의 올리고뉴클레오티드 태그와 접촉되는, 방법.
  108. 청구항 101 내지 청구항 107 중 어느 한 항에 있어서, 상기 샘플이 각 염색체 암에 특이적인 최대 10개의 올리고뉴클레오티드 태그와 접촉되는, 방법.
  109. 청구항 101 내지 청구항 108 중 어느 한 항에 있어서, 상기 샘플이 각 염색체 암에 특이적인 최대 20개의 올리고뉴클레오티드 태그와 접촉되는, 방법.
  110. 청구항 101 내지 청구항 109 중 어느 한 항에 있어서, 상기 샘플이 인간 세포 핵을 포함하는, 방법.
  111. 청구항 101 내지 청구항 110 중 어느 한 항에 있어서, 상기 샘플이 임의의 유기체의 세포로부터의 핵을 포함하는, 방법.
  112. 청구항 101 내지 청구항 111 중 어느 한 항에 있어서, 상기 샘플이 중기 염색체 스프레드를 포함하는, 방법.
  113. 청구항 101 내지 청구항 112 중 어느 한 항에 있어서, 상기 중기 염색체가 배양된 세포 핵으로부터 수득되는, 방법.
  114. 청구항 101 내지 청구항 113 중 어느 한 항에 있어서, 중기 염색체가 조직 절편, 오르가노이드, 또는 생검 표본으로부터 추출된 핵으로부터 얻어지는 것인, 방법.
  115. 샘플에서 적어도 하나의 표적 분자의 고해상도 이미지를 생성하는 방법으로서, 상기 방법은,
    a. 고해상도 이미지화 방법의 적어도 1 라운드를 사용하여 적어도 하나의 표적 분자를 이미지화하는 단계; 및
    b. i. 샘플을 적어도 하나의 올리고뉴클레오티드 태그와 접촉시키는 단계로서, 각각의 올리고뉴클레오티드 태그는,
    A. 검출하고자 하는 표적 분자에 특이적으로 결합하는 인식 도메인, 및
    B. 적어도 하나의 바코드 비트를 포함하는 바코드 영역을 포함하는 스트리트,
    를 포함하는, 단계;
    ii. 샘플을 청구항 1 내지 청구항 54 중 어느 한 항에 따른 판독 분자의 세트와 접촉시키는 단계; 및
    iii. 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적인 순서를 검출하는 단계로서, 여기서 상기 적어도 하나의 올리고뉴클레오티드 태그는 상기 적어도 하나의 표적 분자에 혼성화되고, 이로써 상기 광학적으로 검출가능한 라벨의 상대적인 순서에 의해 어느 올리고뉴클레오티드 태그가 해당 위치에서 상기 표적 분자에 혼성화되는지에 대한 식별이 가능하게 되는, 단계,
    를 포함하는, 적어도 하나의 이미지화된 표적 분자의 아이덴티티(identity)를 결정하는 단계,
    를 포함하는 방법.
  116. 청구항 115에 있어서, 상기 방법이 적어도 2개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
  117. 청구항 115 또는 청구항 116에 있어서, 상기 방법이 적어도 12개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
  118. 청구항 115 내지 청구항 117 중 어느 한 항에 있어서, 상기 방법이 적어도 66개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
  119. 청구항 115 내지 청구항 118 중 어느 한 항에 있어서, 상기 방법이 적어도 258개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
  120. 청구항 115 내지 청구항 119 중 어느 한 항에 있어서, 상기 방법이 적어도 500개의 표적 분자를 이미지화하는 단계를 포함하는, 방법.
  121. 청구항 115 내지 청구항 120 중 어느 한 항에 있어서, 상기 방법이 적어도 5000개의 표적 분자를 이미지화하는 단계를 포함하는 방법.
  122. 청구항 115 내지 청구항 121 중 어느 한 항에 있어서, 상기 표적 분자 모두가 한 번에 이미지화되는, 방법.
  123. 청구항 115 내지 청구항 122 중 어느 한 항에 있어서, 상기 표적 분자의 적어도 절반이 한 번에 이미지화되는, 방법.
  124. 청구항 115 내지 청구항 123 중 어느 한 항에 있어서, 상기 방법이 적어도 2 라운드의 고해상도 이미지화 방법을 포함하는, 방법.
  125. 청구항 115 내지 청구항 124 중 어느 한 항에 있어서, 상기 방법이 적어도 3 라운드의 고해상도 이미지화 방법을 포함하는, 방법.
  126. 청구항 115 내지 청구항 125 중 어느 한 항에 있어서, 상기 방법이 적어도 5 라운드의 고해상도 이미지화 방법을 포함하는, 방법.
  127. 청구항 115 내지 청구항 126 중 어느 한 항에 있어서, 상기 방법이 적어도 20 라운드의 고해상도 이미지화 방법을 포함하는, 방법.
  128. 청구항 115 내지 청구항 127 중 어느 한 항에 있어서, 상기 고해상도 이미지화 방법이, 올리고 확률적 광학 재구성 현미경 검사법(OligoSTORM; Oligo Stochastic Optical Reconstruction Microscopy); 구조 조명 현미경 검사법(SIM: structured ill㎛ination microscopy); 자극 방출 고갈(STED; Stimulated emission depletion) 현미경 검사법; 및 나노규모 토폴로지에서 올리고 DNA 포인트 축적(DNA-PAINT; Oligo DNA point acc㎛ulation in nanoscale topology)으로 이루어진 군으로부터 선택되는, 방법.
  129. 청구항 115 내지 청구항 128 중 어느 한 항에 있어서, 상기 고해상도 이미지화 방법이, 올리고 확률적 광학 재구성 현미경 검사법(OligoSTORM)을 포함하는, 방법.
  130. 청구항 115 내지 청구항 129 중 어느 한 항에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 2 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
  131. 청구항 115 내지 청구항 130 중 어느 한 항에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 3 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
  132. 청구항 115 내지 청구항 131 중 어느 한 항에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 5 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
  133. 청구항 115 내지 청구항 132 중 어느 한 항에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 10 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
  134. 청구항 115 내지 청구항 133 중 어느 한 항에 있어서, 상기 적어도 하나의 올리고뉴클레오티드 태그에 혼성화된 광학적으로 검출가능한 라벨의 상대적 순서를 검출하는 단계가, 적어도 20 라운드의 상기 샘플을 상기 판독 분자의 세트와 접촉시키는 단계를 포함하는, 방법.
  135. 청구항 115 내지 청구항 134 중 어느 한 항에 있어서, 상기 적어도 하나의 표적 분자가, 1kb 핵산을 포함하는, 방법.
  136. 청구항 115 내지 청구항 135 중 어느 한 항에 있어서, 상기 적어도 하나의 표적 분자가, 15kb 핵산을 포함하는, 방법.
  137. 청구항 115 내지 청구항 136 중 어느 한 항에 있어서, 상기 적어도 하나의 표적 분자가, 50kb 핵산을 포함하는, 방법.
  138. 청구항 115 내지 청구항 137 중 어느 한 항에 있어서, 상기 적어도 하나의 표적 분자가, 100kb 핵산을 포함하는, 방법.
  139. 청구항 115 내지 138 중 어느 한 항에 있어서, 상기 적어도 하나의 표적 분자가, 1 Mb 핵산을 포함하는, 방법.
  140. 청구항 115 내지 청구항 139 중 어느 한 항에 있어서, 상기 적어도 하나의 표적 분자가, 염색체를 포함하는, 방법.
  141. 청구항 115 내지 청구항 140 중 어느 한 항에 있어서, 상기 적어도 하나의 표적 분자가, 게놈을 포함하는, 방법.
KR1020227020588A 2019-11-26 2020-11-24 표적 분석과 관련된 조성물, 세트, 및 방법 KR20220106153A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962940638P 2019-11-26 2019-11-26
US62/940,638 2019-11-26
PCT/US2020/061956 WO2021108370A1 (en) 2019-11-26 2020-11-24 Compositions, sets, and methods related to target analysis

Publications (1)

Publication Number Publication Date
KR20220106153A true KR20220106153A (ko) 2022-07-28

Family

ID=76130683

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227020588A KR20220106153A (ko) 2019-11-26 2020-11-24 표적 분석과 관련된 조성물, 세트, 및 방법

Country Status (7)

Country Link
US (1) US20230340457A1 (ko)
EP (1) EP4065707A4 (ko)
JP (1) JP2023503349A (ko)
KR (1) KR20220106153A (ko)
AU (1) AU2020391144A1 (ko)
CA (1) CA3158080A1 (ko)
WO (1) WO2021108370A1 (ko)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2710145T3 (en) * 2011-05-17 2016-02-22 Dxterity Diagnostics Inc METHOD AND COMPOSITIONS FOR THE DETECTION OF TARGET NUCLEIC ACIDS
JP2014531908A (ja) * 2011-10-14 2014-12-04 プレジデント アンド フェローズ オブ ハーバード カレッジ 構造アッセンブリによる配列決定
WO2017161251A1 (en) * 2016-03-17 2017-09-21 President And Fellows Of Harvard College Methods for detecting and identifying genomic nucleic acids
WO2018183851A1 (en) * 2017-03-31 2018-10-04 President And Fellows Of Harvard College Methods for the imaging of nucleic acid sequences
US20200115742A1 (en) * 2017-03-31 2020-04-16 President And Fellows Of Harvard College Methods of Imaging of Nucleic Acid Sequences using Triplex-Forming Oligonucleotides
US20200256862A1 (en) * 2017-10-23 2020-08-13 Massachusetts Institute Of Technology Functionalized solid support

Also Published As

Publication number Publication date
WO2021108370A1 (en) 2021-06-03
EP4065707A4 (en) 2024-01-03
US20230340457A1 (en) 2023-10-26
CA3158080A1 (en) 2021-06-03
AU2020391144A1 (en) 2022-05-26
EP4065707A1 (en) 2022-10-05
JP2023503349A (ja) 2023-01-27

Similar Documents

Publication Publication Date Title
EP3891300B1 (en) Methods for spatial analysis using rna-templated ligation
JP7532458B2 (ja) 化学組成物とそれを利用する方法
US20240263218A1 (en) Methods for spatial analysis using targeted probe silencing
EP4242325A2 (en) Methods for spatial analysis using targeted rna depletion
EP3377625B1 (en) Method for controlled dna fragmentation
US20220042090A1 (en) PROGRAMMABLE RNA-TEMPLATED SEQUENCING BY LIGATION (rSBL)
US20220316010A1 (en) Methods for copy number determination
EP3177740B1 (en) Digital measurements from targeted sequencing
EP2619329B1 (en) Direct capture, amplification and sequencing of target dna using immobilized primers
CN111954720A (zh) 用于分析核酸的方法和组合物
EP4168578B1 (en) Compositions and methods for in situ single cell analysis using enzymatic nucleic acid extension
US20150252412A1 (en) High-definition dna in situ hybridization (hd-fish) compositions and methods
JP2024502028A (ja) 配列決定ライブラリー調製のための方法および組成物
EP4172357B1 (en) Methods and compositions for analyzing nucleic acid
US11136576B2 (en) Method for controlled DNA fragmentation
US20230340457A1 (en) Compositions, sets, and methods related to target analysis
US20220186301A1 (en) Methods and compositions related to target analysis
WO2022256228A1 (en) Method for producing a population of symmetrically barcoded transposomes
WO2024054517A1 (en) Methods and compositions for analyzing nucleic acid