KR102313431B1 - 화학적 조성물 및 이것을 사용하는 방법 - Google Patents

화학적 조성물 및 이것을 사용하는 방법 Download PDF

Info

Publication number
KR102313431B1
KR102313431B1 KR1020207034479A KR20207034479A KR102313431B1 KR 102313431 B1 KR102313431 B1 KR 102313431B1 KR 1020207034479 A KR1020207034479 A KR 1020207034479A KR 20207034479 A KR20207034479 A KR 20207034479A KR 102313431 B1 KR102313431 B1 KR 102313431B1
Authority
KR
South Korea
Prior art keywords
nucleic acid
probe
acid molecule
domain
sequencing
Prior art date
Application number
KR1020207034479A
Other languages
English (en)
Other versions
KR20200138426A (ko
Inventor
마가렛 호앙
마크 그레고리
대 김
드웨인 엘 더너웨이
엘리자베스 에이 맨라오
조지프 엠 비쳄
루스템 카피조브
상하미트라 코루콘다
이 덩
Original Assignee
나노스트링 테크놀로지스, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 나노스트링 테크놀로지스, 인크. filed Critical 나노스트링 테크놀로지스, 인크.
Priority to KR1020217032539A priority Critical patent/KR102476709B1/ko
Publication of KR20200138426A publication Critical patent/KR20200138426A/ko
Application granted granted Critical
Publication of KR102313431B1 publication Critical patent/KR102313431B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6825Nucleic acid detection involving sensors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/107Nucleic acid detection characterized by the use of physical, structural and functional properties fluorescence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/10Detection mode being characterised by the assay principle
    • C12Q2565/101Interaction between at least two labels
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface
    • C12Q2565/518Detection characterised by immobilisation to a surface characterised by the immobilisation of the nucleic acid sample or target

Abstract

본 발명은 화학적 조성물, 키트, 및 장치와, 이들 조성물, 키트 및 장치를 다양한 분석에서 사용하기 위한 방법에 관한 것이다.

Description

화학적 조성물 및 이것을 사용하는 방법{CHEMICAL COMPOSITIONS AND METHODS OF USING SAME}
관련 출원에 대한 상호 참조
본 출원은 2016년 11월 21일에 출원된 미국 가출원 제62/424,887호; 2017년 2월 10일에 출원된 미국 가출원 제62/457,237호; 및 2017년 7월 24일에 출원된 미국 가출원 제62/536,147호에 대한 우선권 및 이익을 주장한다. 전술한 특허 출원 각각의 내용은 그 전체가 참조로 본원에 포함된다.
서열 목록
본 출원은 EFS-Web을 통해 ASCII 포맷으로 제출된 서열 목록을 포함하며, 이는 그 전체가 참조로 본원에 포함되어 있다. 2017년 11월 20일에 생성된 상기 ASCII 사본의 이름은 NATE033-001WO_SeqList_ST25.txt이며, 19,351 바이트 크기이다.
현재 다양한 핵산 시퀀싱 방법, 즉, 핵산 분자 내의 뉴클레오타이드의 정확한 순서를 결정하는 과정이 있다. 현재의 방법은 핵산을 효소적으로 증폭하는 것, 예컨대, PCR, 및/또는 클로닝을 필요로 한다. 광 검출 수단에 의해 검출 가능한 신호를 생성하기 위해서는 추가의 효소적 중합이 필요하다. 이러한 증폭 및 중합 단계는 비용이 들고/거나 시간 소모적이다. 따라서, 신속하고 증폭 및 효소가 없는 핵산 시퀀싱 방법이 당업계에 필요하다. 본 발명은 이러한 요구를 다룬다.
본 발명은 긴 리드 길이를 갖고 낮은 오류율을 갖는 신속하고, 효소가 없으며, 증폭이 없고, 라이브러리가 없는 핵산 시퀀싱을 제공하는 시퀀싱 프로브, 방법, 키트, 및 장치를 제공한다. 본원에 기재된 시퀀싱 프로브는 바코드 도메인을 포함하며, 여기서 바코드 도메인 내의 각각의 위치는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드에 상응한다. 더욱이, 방법, 키트, 및 장치는 신속한 샘플 답변(sample-to-answer) 능력을 갖는다. 이러한 특징은 임상 환경에서의 시퀀싱에 특히 유용하다. 본 발명은 미국 특허 공개 제2016/0194701호에 개시된 개시내용의 개선이며, 그 내용은 그 전체가 참조로 본원에 포함되어 있다.
본 발명은 복합체가 a) 표적 결합 도메인 및 바코드 도메인을 포함하는 조성물을 포함하며, 표적 결합 도메인은 적어도 8개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이고; 바코드 도메인은 합성 백본을 포함하며, 바코드 도메인은 적어도 3개의 부착 위치를 포함하고, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하며, 적어도 3개의 부착 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드의 위치 및 정체(identity)를 결정하고, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 가지며; 그리고 복합체가 적어도 3개의 부착 위치 중 제1 부착 위치에 혼성화된 제1 상보적 일차 핵산 분자를 포함하고, 제1 일차 상보적 핵산 분자는 적어도 2개의 도메인 및 링커 변형을 포함하며, 제1 도메인은 바코드 도메인의 제1 부착 위치에 혼성화되고, 제2 도메인은 적어도 1개의 상보적인 이차 핵산 분자에 혼성화할 수 있으며, 링커 변형은
Figure 112020129306748-pat00001
Figure 112020129306748-pat00002
이고, 링커 변형은 제1 도메인과 제2 도메인 사이에 위치하는 것인 복합체를 제공한다.
본 발명은 복합체가 a) 표적 결합 도메인 및 바코드 도메인을 포함하는 조성물을 포함하며, 표적 결합 도메인은 적어도 8개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이고; 바코드 도메인은 합성 백본을 포함하며, 바코드 도메인은 적어도 3개의 부착 위치를 포함하고, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하며, 적어도 3개의 부착 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드의 위치 및 정체를 결정하고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하며; 그리고 복합체가 적어도 3개의 부착 위치 중 제1 부착 위치에 혼성화된 제1 상보적 일차 핵산 분자를 포함하고, 제1 일차 상보적 핵산 분자는 적어도 2개의 도메인 및 링커 변형을 포함하며, 제1 도메인은 바코드 도메인의 제1 부착 위치에 혼성화되고, 제2 도메인은 적어도 1개의 상보적인 이차 핵산 분자에 혼성화될 수 있으며, 링커 변형은
Figure 112020129306748-pat00003
Figure 112020129306748-pat00004
이고, 링커 변형은 제1 도메인과 제2 도메인 사이에 위치하는 것인 복합체를 제공한다.
본 발명은 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 8개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이고; 바코드 도메인은 합성 백본을 포함하며, 바코드 도메인은 적어도 3개의 부착 위치를 포함하고, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하며, 적어도 3개의 부착 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드의 위치 및 정체를 결정하고, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖는 것인 시퀀싱 프로브를 제공한다.
본 발명은 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 8개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이고; 바코드 도메인은 합성 백본을 포함하며, 바코드 도메인은 적어도 3개의 부착 위치를 포함하고, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하며, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하고, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 가지며, 적어도 3개의 부착 위치의 각각의 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
본 발명은 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 10개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 4개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 적어도 3개의 부착 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드의 위치 및 정체를 결정하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖는 것인 시퀀싱 프로브를 제공한다.
본 발명은 또한 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 10개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 4개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
합성 백본은 다당류, 폴리뉴클레오타이드, 펩타이드, 펩타이드 핵산, 또는 폴리펩타이드를 포함할 수 있다. 합성 백본은 DNA를 포함할 수 있다. 합성 백본은 단일 가닥의 DNA를 포함한다. 시퀀싱 프로브는 표적 결합 도메인과 바코드 도메인 사이에 단일 가닥의 DNA 합성 백본 및 이중 가닥의 DNA 스페이서를 포함할 수 있다. 이중 가닥의 DNA 스페이서는 약 1개 뉴클레오타이드 내지 약 100개 뉴클레오타이드 길이; 약 2개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이; 또는 20개 뉴클레오타이드 내지 40개 뉴클레오타이드 길이일 수 있다. 이중 가닥의 DNA 스페이서는 약 36개 뉴클레오타이드 길이이다. 시퀀싱 프로브는 표적 결합 도메인과 바코드 도메인 사이에 단일 가닥의 DNA 합성 백본 및 폴리머 기반의 스페이서를 포함할 수 있고, 폴리머 기반의 스페이서는 이중 가닥의 DNA 스페이서와 유사한 기계적 특성을 제공한다.
표적 결합 도메인 내의 뉴클레오타이드의 수는 바코드 도메인 내의 부착 위치의 수와 동일하거나, 더 작거나, 또는 더 클 수 있다. 바람직하게는, 표적 결합 도메인 내의 뉴클레오타이드의 수는 바코드 도메인 내의 부착 위치의 수보다 크다. 표적 결합 도메인 내의 뉴클레오타이드의 수는 바코드 도메인 내의 부착 위치의 수보다 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개 또는 적어도 10개 더 많을 수 있다. 바람직하게는, 표적 결합 도메인은 8개의 뉴클레오타이드를 포함하며, 바코드 도메인은 3개의 부착 위치를 포함한다.
표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별할 수 있는 표적 결합 도메인 내의 적어도 3개, 적어도 4개, 적어도 5개, 또는 적어도 6개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체일 수 있다. 변형된 뉴클레오타이드 또는 핵산 유사체는 잠금 핵산(LNA), 가교 핵산(BNA), 프로핀(propyne) 변형된 핵산, 지프(zip) 핵산(ZNA®), 이소구아닌, 이소시토신, 또는 이의 임의의 조합일 수 있다. 바람직하게는, 변형된 뉴클레오타이드 또는 핵산 유사체는 잠금 핵산(LNA)이다.
상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드보다 선행할 수 있다. 상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드보다 후행할 수 있다. 상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드 중 적어도 1개는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드보다 선행하며, 상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드 중 1개는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드보다 후행한다. 즉, 상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드에 플랭킹(flanking)한다.
표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 유니버설 염기, 축퇴성 염기, 또는 이의 조합일 수 있다. 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 4개의 뉴클레오타이드 중 적어도 2개는 유니버설 염기, 축퇴성 염기, 또는 이의 조합일 수 있다.
바코드 도메인 내의 각각의 부착 위치는 1개의 부착 영역을 포함할 수 있다. 바코드 도메인 내의 각각의 부착 위치는 1개를 초과하는 부착 영역을 포함할 수 있다.
바코드 도메인 내의 각각의 부착 위치는 동일한 수의 부착 영역을 포함할 수 있다. 바코드 도메인 내의 각각의 부착 위치는 상이한 수의 부착 영역을 포함할 수 있다. 바코드 도메인 내의 적어도 3개의 부착 위치 중 적어도 1개는 다른 2개와 상이한 수의 부착 영역을 포함할 수 있다. 바코드 도메인 내의 부착 위치가 1개를 초과하는 부착 영역을 포함하는 경우, 부착 영역은 동일할 수 있다. 바코드 도메인 내의 부착 위치가 1개를 초과하는 부착 영역을 포함하는 경우, 부착 영역은 동일한 핵산 서열을 포함할 수 있다. 바코드 도메인 내의 부착 위치가 1개를 초과하는 부착 영역을 포함하는 경우, 부착 영역은 상이할 수 있다. 바코드 도메인 내의 부착 위치가 1개를 초과하는 부착 영역을 포함하는 경우, 부착 영역은 상이한 핵산 서열을 포함할 수 있다.
바코드 도메인 내의 각각의 부착 영역을 포함하는 각각의 핵산 서열은 약 8개 뉴클레오타이드 내지 약 20개 뉴클레오타이드 길이이다. 바코드 도메인 내의 각각의 부착 영역을 포함하는 각각의 핵산 서열은 약 12개 뉴클레오타이드 길이이다. 바코드 도메인 내의 각각의 부착 영역을 포함하는 각각의 핵산 서열은 약 14개 뉴클레오타이드 길이이다.
바코드 도메인 내의 적어도 3개의 부착 위치 중 적어도 1개, 적어도 2개, 또는 적어도 3개는 적어도 1개의 플랭킹 단일 가닥 폴리뉴클레오타이드에 인접할 수 있다. 바코드 도메인 내의 적어도 3개의 부착 위치 각각은 적어도 1개의 플랭킹 단일 가닥 폴리뉴클레오타이드에 인접할 수 있다.
적어도 1개의 부착 위치 내의 적어도 1개, 적어도 2개, 또는 적어도 3개의 부착 영역은 합성 백본에 통합될 수 있다. 적어도 3개의 부착 위치 각각 내의 각각의 부착 영역은 합성 백본에 통합될 수 있다. 적어도 1개의 부착 위치 내의 적어도 1개, 적어도 2개, 또는 적어도 3개의 부착 영역은 합성 백본으로부터 분지될 수 있다. 적어도 3개의 부착 위치 각각 내의 각각의 부착 영역은 합성 백본으로부터 분지될 수 있다.
각각의 부착 위치 내의 적어도 1개의 부착 영역 내의 적어도 1개의 핵산 서열에 직접 또는 간접적으로 결합할 수 있는 상보적 핵산 분자는 RNA, DNA 또는 PNA일 수 있다. 바람직하게는, 상보적 핵산 분자는 DNA이다.
상보적 핵산 분자는 일차 핵산 분자일 수 있으며, 일차 핵산 분자는 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역에 직접 결합한다.
일차 핵산 분자는 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역에 결합할 수 있는 제1 도메인 및 적어도 1개의 상보적인 이차 핵산 분자에 결합할 수 있는 제2 도메인인 적어도 2개의 도메인을 포함할 수 있다. 일차 핵산 분자는 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역에 결합할 수 있는 제1 도메인 및 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제2 도메인인 적어도 2개의 도메인을 포함할 수 있다.
일차 핵산 분자는 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역에 혼성화될 수 있고 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개 이상의 이차 핵산 분자에 혼성화될 수 있다. 바람직하게는 일차 핵산 분자는 4개의 이차 핵산 분자에 혼성화된다. 일차 핵산 분자는 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역에 혼성화될 수 있고 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 혼성화될 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
일차 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 제1 도메인과 제2 도메인 사이에 위치한다. 절단 가능한 링커는 광 절단 가능한 링커(예컨대, UV 광 절단 가능한 링커), 환원제 절단 가능한 링커, 또는 효소적으로 절단 가능한 링커일 수 있다. 바람직하게는, 링커는 광 절단 가능한 링커이다.
이차 핵산 분자는 적어도 1개의 일차 핵산 분자 내의 상보적인 서열에 결합할 수 있는 제1 도메인; 및 (a) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지, (b) 적어도 1개의 상보적인 삼차 핵산 분자, 또는 (c) 이들의 조합에 결합할 수 있는 제2 도메인인 적어도 2개의 도메인을 포함할 수 있다.
이차 핵산 분자는 적어도 1개의 일차 핵산 분자에 혼성화될 수 있고, 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 이상의 삼차 핵산 분자에 혼성화될 수 있다. 바람직하게는 이차 핵산 분자는 1개의 삼차 핵산 분자에 혼성화된다. 이차 핵산 분자는 적어도 1개의 일차 핵산 분자에 혼성화될 수 있고, 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함할 수 있다. 이차 핵산 분자는 적어도 1개의 일차 핵산 분자, 적어도 1개의 삼차 핵산 분자 및 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 혼성화될 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 이차 핵산 분자가 적어도 1개의 일차 핵산 분자, 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 적어도 1개의 삼차 핵산 분자, 및 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 혼성화되는 경우, 이차 핵산 분자 상에 위치한 적어도 제1 및 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있고, 삼차 핵산 분자 상에 위치한 적어도 제1 및 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있으며, 이차 핵산 분자 상의 검출 가능한 표지의 방출 스펙트럼은 삼차 핵산 분자 상의 검출 가능한 표지의 방출 스펙트럼과 상이할 수 있다.
이차 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 제1 도메인과 제2 도메인 사이에 위치한다. 절단 가능한 링커는 광 절단 가능한 링커(예컨대, UV 광 절단 가능한 링커), 환원제 절단 가능한 링커, 또는 효소적으로 절단 가능한 링커일 수 있다. 바람직하게는, 링커는 광 절단 가능한 링커이다.
삼차 핵산 분자는 적어도 1개의 이차 핵산 분자 내의 상보적인 서열에 결합할 수 있는 제1 도메인; 및 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합할 수 있는 제2 도메인인 적어도 2개의 도메인을 포함할 수 있다.
삼차 핵산 분자는 적어도 1개의 이차 핵산 분자에 혼성화될 수 있고, 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함할 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
삼차 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 제1 도메인과 제2 도메인 사이에 위치한다. 절단 가능한 링커는 광 절단 가능한 링커(예컨대, UV 광 절단 가능한 링커), 환원제 절단 가능한 링커, 또는 효소적으로 절단 가능한 링커일 수 있다. 바람직하게는, 링커는 광 절단 가능한 링커이다.
본 발명은 또한 본원에 개시된 복수의 시퀀싱 프로브를 포함하는 시퀀싱 프로브의 집단을 제공한다. 바람직하게는, 복수의 시퀀싱 프로브 내의 각각의 시퀀싱 프로브는 상이한 표적 결합 도메인을 포함하고, 표적 핵산 내의 상이한 영역에 결합한다.
본 발명은 또한 (1) 본원에 기재된 시퀀싱 프로브를 하나 이상의 위치에서 기재(substrate)에 선택적으로 고정화된 표적 핵산에 혼성화시키는 단계; (2) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합시키는 단계; (3) 결합된 제1 상보적 핵산 분자의 제1 및 적어도 제2의 검출 가능한 표지를 검출하는 단계; (4) 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (5) 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자를 제1 부착 위치에 결합시켜, 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 결합해제시키거나, 또는 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 방출하기에 충분한 힘과 접촉시키는 단계; (6) 제3의 검출 가능한 표지 및 적어도 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 결합시키는 단계; (7) 결합된 제2 상보적 핵산 분자의 제3 및 적어도 제4의 검출 가능한 표지를 검출하는 단계; (8) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (9) 바코드 도메인 내의 적어도 3개의 부착 위치의 각각의 부착 위치가 2개의 검출 가능한 표지를 포함하는 상보적 핵산 분자에 의해 결합되고, 결합된 상보적 핵산 분자의 2개의 검출 가능한 표지가 검출될 때까지 단계 (5) 내지 (8)을 반복하여, 시퀀싱 프로브의 표적 결합 도메인에 혼성화된 선택적으로 고정화된 표적 핵산의 적어도 제1 영역에 대한 적어도 6개 뉴클레오타이드의 선형 순서를 확인하는 단계; 및 (10) 선택적으로 고정화된 표적 핵산으로부터 시퀀싱 프로브를 제거하는 단계를 포함하는 핵산을 시퀀싱하는 방법을 제공한다.
방법은 (11) 제2 시퀀싱 프로브를 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산에 혼성화시키는 단계로서, 제1 시퀀싱 프로브 및 제2 시퀀싱 프로브의 표적 결합 도메인은 상이한 것인 단계; (12) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합시키는 단계; (13) 결합된 제1 상보적 핵산 분자의 제1 및 적어도 제2의 검출 가능한 표지를 검출하는 단계; (14) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (15) 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자를 제1 부착 위치에 결합시켜, 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자 또는 복합체를 결합해제시키거나, 또는 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자 또는 복합체를 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 방출시키기에 충분한 힘과 접촉시키는 단계; (16) 제3의 검출 가능한 표지 및 적어도 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 결합시키는 단계; (17) 결합된 제2 상보적 핵산 분자의 제3 및 적어도 제4의 검출 가능한 표지를 검출하는 단계; (18) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (19) 바코드 도메인 내의 적어도 3개의 부착 위치의 각각의 부착 위치가 2개의 검출 가능한 표지를 포함하는 상보적 핵산 분자에 의해 결합되고, 결합된 상보적 핵산 분자의 2개의 검출 가능한 표지가 검출될 때까지 단계 (15) 내지 (18)을 반복하여, 시퀀싱 프로브의 표적 결합 도메인에 의해 혼성화된 선택적으로 고정화된 표적 핵산의 적어도 제2 영역에 대한 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계; 및 (20) 선택적으로 고정화된 표적 핵산으로부터 제2 시퀀싱 프로브를 제거하는 단계를 추가로 포함할 수 있다.
방법은 고정화된 표적 핵산의 적어도 제1 영역 및 적어도 제2 영역 내의 뉴클레오타이드의 각각의 확인된 선형 순서를 조립하여, 고정화된 표적 핵산에 대한 서열을 확인하는 단계를 추가로 포함할 수 있다.
단계 (5) 및 (6)은 연속적으로 또는 동시에 발생할 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 제3 및 적어도 제4의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
제1 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제2 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제1 상보적 핵산 분자 및 제2 상보적 핵산 분자는 각각 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다. 해제 힘은 광, 바람직하게는, UV 광일 수 있다. 광은 아크 램프, 레이저, 집속 UV 광원, 및 발광 다이오드로 이루어진 군으로부터 선택된 광원에 의해 제공될 수 있다.
제1 상보적 핵산 분자 및 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 동일한 핵산 서열을 포함할 수 있다. 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 바코드 도메인 내의 제1 부착 위치에 인접한 플랭킹 단일 가닥 폴리뉴클레오타이드에 상보적인 핵산 서열을 포함할 수 있다.
제2 상보적 핵산 분자 및 검출 가능한 표지가 결여된 제2 혼성화 핵산 분자는 동일한 핵산 서열을 포함할 수 있다. 검출 가능한 표지가 결여된 제2 혼성화 핵산 분자는 바코드 도메인 내의 제2 부착 위치에 인접한 플랭킹 단일 가닥 폴리뉴클레오타이드에 상보적인 핵산 서열을 포함할 수 있다.
본 발명은 또한 (1) 본원에 기재된 복수의 시퀀싱 프로브를 포함하는 제1 시퀀싱 프로브의 적어도 1개의 제1 집단을 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산에 혼성화시키는 단계; (2) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합시키는 단계; (3) 결합된 제1 상보적 핵산 분자의 제1 및 적어도 제2의 검출 가능한 표지를 검출하는 단계; (4) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (5) 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자를 제1 부착 위치에 결합시켜, 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 결합해제시키거나, 또는 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 방출하기에 충분한 힘과 접촉시키는 단계; (6) 제3의 검출 가능한 표지 및 적어도 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 결합시키는 단계; (7) 결합된 제2 상보적 핵산 분자의 제3 및 적어도 제4의 검출 가능한 표지를 검출하는 단계; (8) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (9) 바코드 도메인 내의 적어도 3개의 부착 위치의 각각의 부착 위치가 2개의 검출 가능한 표지를 포함하는 상보적 핵산 분자에 의해 결합되고, 결합된 상보적 핵산 분자의 2개의 검출 가능한 표지가 검출될 때까지 단계 (5) 내지 (8)을 반복하여, 시퀀싱 프로브의 표적 결합 도메인에 의해 혼성화된 선택적으로 고정화된 표적 핵산의 적어도 제1 영역에 대한 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계; 및 (10) 선택적으로 고정화된 표적 핵산으로부터 제1 시퀀싱 프로브의 적어도 1개의 제1 집단을 제거하는 단계를 포함하는 핵산을 시퀀싱하는 방법을 제공한다.
방법은 (11) 본원에 개시된 바와 같은 복수의 시퀀싱 프로브를 포함하는 제2 시퀀싱 프로브의 적어도 1개의 제2 집단을 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산에 혼성화시키는 단계로서, 제1 시퀀싱 프로브 및 제2 시퀀싱 프로브의 표적 결합 도메인은 상이한 것인 단계; (12) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합시키는 단계; (13) 결합된 제1 상보적 핵산 분자의 제1 및 적어도 제2의 검출 가능한 표지를 검출하는 단계; (14) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (15) 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자를 제1 부착 위치에 결합시켜, 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자 또는 복합체를 결합해제시키거나, 또는 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자 또는 복합체를 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 방출시키기에 충분한 힘과 접촉시키는 단계; (16) 제3의 검출 가능한 표지 및 적어도 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 결합시키는 단계; (17) 결합된 제2 상보적 핵산 분자의 제3 및 적어도 제4의 검출 가능한 표지를 검출하는 단계; (18) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (19) 바코드 도메인 내의 적어도 3개의 부착 위치의 각각의 부착 위치가 2개의 검출 가능한 표지를 포함하는 상보적 핵산 분자에 의해 결합되고, 결합된 상보적 핵산 분자의 2개의 검출 가능한 표지가 검출될 때까지 단계 (15) 내지 (18)을 반복하여, 시퀀싱 프로브의 표적 결합 도메인에 의해 혼성화된 선택적으로 고정화된 표적 핵산의 적어도 제2 영역에 대한 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계; 및 (20) 선택적으로 고정화된 표적 핵산으로부터 제2 시퀀싱 프로브의 적어도 1개의 제2 집단을 제거하는 단계를 추가로 포함할 수 있다.
방법은 고정화된 표적 핵산의 적어도 제1 영역 및 적어도 제2 영역 내의 뉴클레오타이드의 각각의 확인된 선형 순서를 조립하여, 고정화된 표적 핵산에 대한 서열을 확인하는 단계를 추가로 포함할 수 있다.
단계 (5) 및 (6)은 연속적으로 또는 동시에 발생할 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 제3 및 적어도 제4의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
제1 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제2 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제1 상보적 핵산 분자 및 제2 상보적 핵산 분자는 각각 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다. 해제 힘은 광, 바람직하게는, UV 광일 수 있다. 광은 아크 램프, 레이저, 집속 UV 광원, 및 발광 다이오드로 이루어진 군으로부터 선택된 광원에 의해 제공될 수 있다.
제1 상보적 핵산 분자 및 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 동일한 핵산 서열을 포함할 수 있다. 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 바코드 도메인 내의 제1 부착 위치에 인접한 플랭킹 단일 가닥 폴리뉴클레오타이드에 상보적인 핵산 서열을 포함할 수 있다.
제2 상보적 핵산 분자 및 검출 가능한 표지가 결여된 제2 혼성화 핵산 분자는 동일한 핵산 서열을 포함할 수 있다. 검출 가능한 표지가 결여된 제2 혼성화 핵산 분자는 바코드 도메인 내의 제2 부착 위치에 인접한 플랭킹 단일 가닥 폴리뉴클레오타이드에 상보적인 핵산 서열을 포함할 수 있다.
본 발명은 또한 (1) 본원에 개시된 바와 같은 제1 시퀀싱 프로브를 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산에 혼성화시키는 단계; (2) 제1의 검출 가능한 표지 및 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 혼성화시키는 단계; (3) 제1 부착 위치에 혼성화된 제1 상보적 핵산 분자의 제1 및 제2의 검출 가능한 표지를 확인하는 단계; (4) 제1 부착 위치에 혼성화된 제1 및 제2의 검출 가능한 표지를 제거하는 단계; (5) 제3의 검출 가능한 표지 및 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 혼성화시키는 단계; (6) 제2 부착 위치에 혼성화된 제2 상보적 핵산 분자의 제3 및 제4의 검출 가능한 표지를 확인하는 단계; (7) 제2 부착 위치에 혼성화된 제3 및 제4의 검출 가능한 표지를 제거하는 단계; (8) 제5의 검출 가능한 표지 및 제6의 검출 가능한 표지를 포함하는 제3 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치의 제3 부착 위치에 혼성화시키는 단계; (9) 제3 부착 위치에 혼성화된 제3 상보적 핵산 분자의 제5 및 제6의 검출 가능한 표지를 확인하는 단계; 및 (10) 제1의 검출 가능한 표지, 제2의 검출 가능한 표지, 제3의 검출 가능한 표지, 제4의 검출 가능한 표지, 제5의 검출 가능한 표지 및 제6의 검출 가능한 표지의 정체에 기초하여 시퀀싱 프로브의 표적 결합 도메인에 혼성화된 선택적으로 고정화된 표적 핵산의 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계를 포함하는 핵산의 뉴클레오타이드 서열을 결정하는 방법을 제공한다.
방법은 (11) 선택적으로 고정화된 표적 핵산의 제1 영역으로부터 적어도 제1 시퀀싱 프로브를 제거하는 단계; (12) 본원에 개시된 바와 같은 적어도 제2 시퀀싱 프로브를 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산의 제2 영역에 혼성화시키는 단계로서, 제1 시퀀싱 프로브 및 적어도 제2 시퀀싱 프로브의 표적 결합 도메인은 상이한 것인 단계; (13) 제1의 검출 가능한 표지 및 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 혼성화시키는 단계; (14) 제1 부착 위치에 혼성화된 제1 상보적 핵산 분자의 제1 및 제2의 검출 가능한 표지를 검출하는 단계; (15) 제3의 검출 가능한 표지 및 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 혼성화시키는 단계; (16) 제2 부착 위치에 혼성화된 제2 상보적 핵산 분자의 제3 및 제4의 검출 가능한 표지를 검출하는 단계; (17) 제2 부착 위치에 혼성화된 제3 및 제4의 검출 가능한 표지를 제거하는 단계; (18) 제5의 검출 가능한 표지 및 제6의 검출 가능한 표지를 포함하는 제3 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제3 부착 위치에 혼성화시키는 단계; (19) 제3 부착 위치에 혼성화된 제3 상보적 핵산 분자의 제5 및 제6의 검출 가능한 표지를 확인하는 단계; 및 (20) 제1의 검출 가능한 표지, 제2의 검출 가능한 표지, 제3의 검출 가능한 표지, 제4의 검출 가능한 표지, 제5의 검출 가능한 표지 및 제6의 검출 가능한 표지의 정체에 기초하여 적어도 제2 시퀀싱 프로브의 표적 결합 도메인에 혼성화된 선택적으로 고정화된 표적 핵산의 제2 영역 내의 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계를 추가로 포함할 수 있다.
방법은 고정화된 표적 핵산의 적어도 제1 영역 및 적어도 제2 영역 내의 뉴클레오타이드의 각각의 확인된 선형 순서를 조립하여, 고정화된 표적 핵산에 대한 서열을 확인하는 단계를 추가로 포함할 수 있다.
단계 (4) 및 (5)는 연속적으로 또는 동시에 발생할 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 제3 및 적어도 제4의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 제5 및 적어도 제6의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
제1 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제2 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제3 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제1 상보적 핵산 분자, 제2 상보적 핵산 분자 및 적어도 제3 상보적 핵산 분자는 각각 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다. 제1 상보적 핵산 분자, 제2 상보적 핵산 분자 및 적어도 제3 상보적 핵산 분자 중 어느 하나를 제거하는 방법은 광, 바람직하게는, UV 광과의 접촉을 포함할 수 있다. 광은 아크 램프, 레이저, 집속 UV 광원, 및 발광 다이오드로 이루어진 군으로부터 선택된 광원에 의해 제공될 수 있다.
본 발명은 또한 (1) 본원에 개시된 바와 같은 제1 시퀀싱 프로브를 소정의 유전자로부터 얻은 표적 핵산의 제1 영역에 혼성화시키는 단계로서, 표적 핵산은 하나 이상의 위치에서 기재에 선택적으로 고정화되는 것인 단계; (2) 제1의 검출 가능한 표지 및 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 혼성화시키는 단계; (3) 제1 부착 위치에 혼성화된 제1 상보적 핵산 분자의 제1 및 제2의 검출 가능한 표지를 검출하는 단계; (4) 제1 부착 위치에 혼성화된 제1 및 제2의 검출 가능한 표지를 제거하는 단계; (5) 제3의 검출 가능한 표지 및 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 혼성화시키는 단계; (6) 제2 부착 위치에 혼성화된 제2 상보적 핵산 분자의 제3 및 제4의 검출 가능한 표지를 검출하는 단계; (7) 제2 부착 위치에 혼성화된 제3 및 제4의 검출 가능한 표지를 제거하는 단계; (8) 제5의 검출 가능한 표지 및 제6의 검출 가능한 표지를 포함하는 제3 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제3 부착 위치에 혼성화시키는 단계; (9) 제3 부착 위치에 혼성화된 제3 상보적 핵산 분자의 제5 및 제6의 검출 가능한 표지를 확인하는 단계; 및 (10) 제1의 검출 가능한 표지, 제2의 검출 가능한 표지, 제3의 검출 가능한 표지, 제4의 검출 가능한 표지, 제5의 검출 가능한 표지 및 제6의 검출 가능한 표지의 정체에 기초하여 제1 시퀀싱 프로브의 표적 결합 도메인에 혼성화된 선택적으로 고정화된 표적 핵산의 제1 영역 내의 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계를 포함하는 핵산의 뉴클레오타이드 서열을 결정하는 방법을 제공한다.
방법은 (11) 선택적으로 고정화된 표적 핵산의 제1 영역으로부터 적어도 제1 시퀀싱 프로브를 제거하는 단계; (12) 본원에 개시된 바와 같은 적어도 제2 시퀀싱 프로브를 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산의 제2 영역에 혼성화시키는 단계로서, 제1 시퀀싱 프로브 및 적어도 제2 시퀀싱 프로브의 표적 결합 도메인은 상이한 것인 단계; (13) 제1의 검출 가능한 표지 및 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 혼성화시키는 단계; (14) 제1 부착 위치에 혼성화된 제1 상보적 핵산 분자의 제1 및 제2의 검출 가능한 표지를 검출하는 단계; (15) 제3의 검출 가능한 표지 및 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 혼성화시키는 단계; (16) 제2 부착 위치에 혼성화된 제2 상보적 핵산 분자의 제3 및 제4의 검출 가능한 표지를 검출하는 단계; (17) 제2 부착 위치에 혼성화된 제3 및 제4의 검출 가능한 표지를 제거하는 단계; (18) 제5의 검출 가능한 표지 및 제6의 검출 가능한 표지를 포함하는 제3 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제3 부착 위치에 혼성화시키는 단계; (19) 제3 부착 위치에 혼성화된 제3 상보적 핵산 분자의 제5 및 제6의 검출 가능한 표지를 확인하는 단계; 및 (20) 제1의 검출 가능한 표지, 제2의 검출 가능한 표지, 제3의 검출 가능한 표지, 제4의 검출 가능한 표지, 제5의 검출 가능한 표지 및 제6의 검출 가능한 표지의 정체에 기초하여 적어도 제2 시퀀싱 프로브의 표적 결합 도메인에 혼성화된 선택적으로 고정화된 표적 핵산의 제2 영역 내의 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계를 추가로 포함할 수 있다.
방법은 고정화된 표적 핵산의 적어도 제1 영역 및 적어도 제2 영역 내의 뉴클레오타이드의 각각의 확인된 선형 순서를 조립하여, 고정화된 표적 핵산에 대한 서열을 확인하는 단계를 추가로 포함할 수 있다.
단계 (4) 및 (5)는 연속적으로 또는 동시에 발생할 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 제3 및 적어도 제4의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 제5 및 적어도 제6의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
제1 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제2 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제3 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제1 상보적 핵산 분자, 제2 상보적 핵산 분자 및 적어도 제3 상보적 핵산 분자는 각각 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다. 제1 상보적 핵산 분자, 제2 상보적 핵산 분자 및 적어도 제3 상보적 핵산 분자 중 어느 하나를 제거하는 방법은 광, 바람직하게는, UV 광과의 접촉을 포함할 수 있다. 광은 아크 램프, 레이저, 집속 UV 광원, 및 발광 다이오드로 이루어진 군으로부터 선택된 광원에 의해 제공될 수 있다.
본 발명은 또한 본원에 개시된 임의의 방법을 수행하기 위한 장치를 제공한다.
본 발명은 또한 기재, 본원에 개시된 시퀀싱 프로브의 집단, 제1의 검출 가능한 표지 및 적어도 2개의 제2의 검출 가능한 표지를 포함하는 적어도 3개의 상보적 핵산 분자, 및 사용 설명서를 포함하는 하나 이상의 키트를 제공한다. 하나 이상의 키트는 적어도 1개의 캡처 프로브를 추가로 포함할 수 있다. 하나 이상의 키트는 적어도 2개의 캡처 프로브를 추가로 포함할 수 있다.
상기 양태 중 어느 것은 임의의 다른 양태와 조합될 수 있다.
달리 정의되지 않는 한, 본원에 사용된 모든 기술 및 과학 용어는 본 개시내용이 속하는 기술 분야에서 통상의 기술을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 명세서에서, 단수 형태는 또한 문맥이 다르게 지시하지 않는 한 복수를 포함하며; 예로서, 용어 "a," "an," 및 "the"는 단수 또는 복수인 것으로 이해되고, 용어 "또는"은 포괄적인 것으로 이해된다. 예로서, "하나의 요소"는 하나 이상의 요소를 의미한다. 명세서 전반에 걸쳐, 단어 "포함하는," 또는 변형, 예컨대 "포함하다" 또는 "포함하는"은 명시된 요소, 정수 또는 단계, 또는 요소, 정수 또는 단계의 그룹을 포함하지만, 임의의 다른 요소, 정수 또는 단계, 또는 요소, 정수 또는 단계의 그룹을 배제하지 않는 것을 의미하는 것으로 이해될 것이다. 약은 명시된 값의 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.05%, 또는 0.01% 이내로서 이해될 수 있다. 문맥으로부터 달리 명확하지 않는 한, 본원에 제공된 모든 수치 값은 용어 "약"에 의해 수식된다.
본원에 기재된 것과 유사하거나 동등한 방법 및 물질이 본 발명의 실시 또는 시험에 사용될 수 있지만, 적합한 방법 및 물질이 하기에 기재되어 있다. 본원에 언급된 모든 간행물, 특허 출원, 및 특허, 및 기타 참고문헌은 그 전체가 참조로 포함된다. 본원에 인용된 참고문헌은 청구된 발명에 대한 선행 기술임을 인정하는 것은 아니다. 충돌이 있는 경우, 정의를 포함하는 본 명세서가 우선할 것이다. 또한, 물질, 방법, 및 실시예는 단지 예시적인 것이며 제한하고자 하는 것이 아니다. 다른 특징 및 이점은 하기 상세한 설명 및 청구범위로부터 명백해질 것이다.
특허 또는 출원 파일은 색상으로 작성된 적어도 하나의 도면을 포함한다. 이 색상 도면을 갖는 이 특허 또는 특허 출원의 사본은 요청시 그리고 필요한 수수료의 납부시 특허청에 의해 제공될 것이다.
상기 및 추가 특징은 첨부된 도면과 함께 하기 상세한 설명으로부터 보다 명확하게 이해될 것이다.
도 1은 본 발명의 하나의 예시적인 시퀀싱 프로브의 예시이다.
도 2는 본 발명의 표준 및 3부분 시퀀싱 프로브의 디자인을 나타낸다.
도 3은 본 발명의 예시적인 시퀀싱 프로브에 혼성화된 본 발명의 예시적인 리포터 복합체의 예시이다.
도 4는 본 발명의 예시적인 리포터 프로브의 개략도를 나타낸다.
도 5는 본 발명의 몇 가지 예시적인 리포터 프로브의 개략도를 나타낸다.
도 6은 "여분 핸들(extra-handle)"을 포함하는 본 발명의 예시적인 리포터 프로브의 개략도이다.
도 7은 삼차 핵산의 상이한 배열을 포함하는 본 발명의 몇 가지 예시적인 리포터 프로브의 개략도이다.
도 8은 분지화 삼차 핵산을 포함하는 본 발명의 몇 개의 예시적인 리포터 프로브의 개략도이다.
도 9는 절단 가능한 링커 변형을 포함하는 본 발명의 하나의 예시적인 리포터 프로브의 예시이다.
도 10은 본 발명의 예시적인 리포터 프로브 내의 절단 가능한 링커 변형을 위한 가능한 위치를 나타낸다.
도 11은 본 발명의 2개의 캡처 프로브 시스템을 사용한 표적 핵산의 캡처의 개략도이다.
도 12는 FFPE 샘플을 사용하여 100개의 표적으로 구성된 멀티플렉스 암 패널을 캡처하고 검출하기 위한 본 방법을 사용한 실험의 결과를 나타낸다.
도 13은 큰 표적 핵산 분자의 표적화된 시퀀싱을 위한 캡처 프로브, 블로커 올리고, 및 시퀀싱 프로브에 혼성화된 2개의 캡처된 표적 DNA 분자의 개략도를 나타낸다.
도 14는 본 발명의 시퀀싱 방법의 단일 사이클의 개략도이다.
도 15는 본 발명의 시퀀싱 방법의 하나의 사이클 및 이 사이클 동안 수집된 상응하는 이미징 데이터의 개략도이다.
도 16은 시퀀싱 프로브의 8개의 상이한 풀을 디자인하기 위해 8개의 색상 조합이 사용되는 본 발명의 예시적인 시퀀싱 프로브 풀 구성을 예시한다.
도 17은 미국 제2016/019470호에 개시된 바코드 도메인 디자인을 본 발명의 바코드 도메인과 비교한다.
도 18은 캡처된 표적 핵산 분자에 혼성화된 본 발명의 단일 시퀀싱 프로브 또는 복수의 시퀀싱 프로브의 개략도이다.
도 19는 단일 시퀀싱 프로브 또는 복수의 시퀀싱 프로브가 표적 핵산에 혼성화될 때 본 발명의 시퀀싱 방법 동안 기록된 형광 이미지를 나타낸다.
도 20은 표적 핵산의 길이를 따라 결합된 본 발명의 복수의 시퀀싱 프로브의 개략도 및 상응하는 기록된 형광 이미지이다.
도 21은 본 발명의 시퀀싱 사이클 동안 기록된 예시적인 이미징 데이터 및 본 발명의 리포터 프로브의 형광 신호 강도 프로파일을 나타낸다.
도 22는 절단 가능한 링커 변형이 바코드 위치를 어둡게 하는데 사용되는 본 발명의 시퀀싱 사이클의 개략도이다.
도 23은 일차 핵산의 대체에 의해 바코드 도메인 내의 위치가 어두워지는 본 발명의 예시적인 시퀀싱 사이클의 예시이다.
도 24는 FFPE 샘플로부터의 RNA 및 DNA의 통합된 캡처의 예를 나타낸다.
도 25는 본 발명의 시퀀싱 방법이 상이한 시퀀싱 프로브를 사용하여 표적 핵산의 동일한 염기의 시퀀싱을 어떻게 가능하게 하는지의 개략도이다.
도 26은 하나 이상의 시퀀싱 프로브로부터 기록된 표적 핵산 상의 특정 뉴클레오타이드 위치에 대한 다중 염기 콜링이 어떻게 조합되어 공통 서열을 생성하고, 이로써 최종 염기 콜링의 정확도를 증가킬 수 있는지 나타낸다.
도 27은 33 킬로베이스 DNA 단편의 캡처, 스트레칭, 및 검출 후 본 발명의 시퀀싱 방법의 기록된 형광 이미지를 나타낸다.
도 28은 본 발명의 시퀀싱 방법을 사용하여 수득되고 ShortStack™ 알고리즘을 사용하여 분석된 시퀀싱 실험의 결과를 나타낸다. 상부 패널 플롯에서 시작하여 시계 방향으로 진행하는 좌측 패널의 플롯의 경우, 표시된 서열은 서열번호: 3, 4, 6, 8, 7 및 5에 상응한다. 상부에서 시작하여 아래로 이동하는 우측의 표의 경우, 서열은 서열번호: 3, 4, 7, 8, 6 및 5에 상응한다.
도 29는 FFPE 샘플로부터의 종양유전자 표적의 멀티플렉스된 캡처 및 시퀀싱에 대한 실험 디자인의 개략도를 나타낸다.
도 30은 직접 RNA 시퀀싱 및 RNA 분자와 본 발명의 시퀀싱 방법의 양립성을 테스트하기 위한 실험으로부터의 결과의 개략도를 나타낸다.
도 31은 본 발명의 시퀀싱 방법을 사용한 동일한 뉴클레오타이드 서열을 갖는 RNA 분자 및 DNA 분자의 시퀀싱을 나타낸다.
도 32는 RNA 패널의 멀티플렉스 표적 캡처의 결과를 나타낸다.
도 33은 ShortStack™ 소프트웨어 파이프라인의 단계의 개략적 개요를 나타낸다.
도 34는 ShortStack™ 소프트웨어 파이프라인을 사용한 시뮬레이션된 데이터 세트의 돌연변이 분석의 결과를 나타낸다.
도 35는 다양한 유형의 돌연변이에 대한 ShortStack™ 소프트웨어 파이프라인의 전체적인 돌연변이 콜링 정확도를 나타낸다.
도 36은 특정 색상 조합으로 표지된 리포터 복합체에 대한 강도 분포를 나타낸다.
도 37은 본 발명의 전형적인 증착 구배를 나타낸다.
도 38은 25 ng 내지 500 ng의 DNA 질량 투입량의 적정 동안 본 발명의 캡처 효율을 나타낸다.
도 39는 본 발명의 예시적인 리포터 복합체의 HLPC 정제를 나타낸다.
도 40은 상이한 완충제 첨가제의 존재하에 본 발명의 리포터 프로브의 혼성화 효율 및 정확도를 나타낸다.
도 41은 본 발명의 시퀀싱 방법이 상이한 완충제 첨가제의 존재하에 사용될 때 표적 핵산 손실의 백분율을 나타낸다.
도 42는 12머 상보적 핵산을 포함하는 본 발명의 예시적인 리포터 프로브의 효율 및 오류를 나타낸다.
도 43은 예시적인 8x8x8 14머 리포터 세트를 사용한 리포터 프로브의 효율 및 오류를 나타낸다.
도 44는 예시적인 10x10x10 14머 리포터 세트를 사용한 리포터 프로브의 효율 및 오류를 나타낸다.
도 45는 본 발명의 표준 및 3부분 시퀀싱 프로브의 성능의 비교를 나타낸다.
도 46은 개별적인 프로브를 사용한 본 발명의 예시적인 표적 결합 도메인 내의 LNA 치환의 효과를 나타낸다.
도 47은 9개 프로브의 풀을 사용한 본 발명의 예시적인 표적 결합 도메인 내의 LNA 치환의 효과를 나타낸다.
도 48은 본 발명의 예시적인 표적 결합 도메인 내의 변형된 뉴클레오타이드 및 핵산 유사체 치환의 효과를 나타낸다.
도 49는 본 발명의 시퀀싱 방법의 미가공 정확도를 정량화하기 위한 실험의 결과를 나타낸다.
도 50은 표적 핵산 내의 뉴클레오타이드가 1개를 초과하는 시퀀싱 프로브에 의해 시퀀싱될 때 본 발명의 시퀀싱 방법의 정확도를 결정하기 위한 실험의 결과를 나타낸다.
본 발명은 긴 리드 길이를 갖고 낮은 오류율을 갖는 신속하고, 효소가 없으며, 증폭이 없고, 라이브러리가 없는 핵산 시퀀싱을 제공하는 시퀀싱 프로브, 리포터 프로브, 방법, 키트, 및 장치를 제공한다.
본 발명의 조성물
본 발명은 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 8개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는(상보적인) 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 1개, 또는 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이고, 표적 결합 도메인 내의 적어도 1개, 또는 적어도 2개의 뉴클레오타이드는 유니버설 또는 축퇴성 염기이며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
본 발명은 또한 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 10개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는(상보적인) 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 4개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
본 발명은 또한 본원에 개시된 복수의 임의의 시퀀싱 프로브를 포함하는 시퀀싱 프로브의 집단을 제공한다.
개시된 시퀀싱 프로브의 표적 결합 도메인, 바코드 도메인, 및 백본뿐만 아니라, 상보적 핵산 분자(예컨대, 리포터 분자 또는 리포터 복합체)가 하기에 더 상세히 설명된다.
본 발명의 시퀀싱 프로브는 표적 결합 도메인 및 바코드 도메인을 포함한다. 도 1은 본 발명의 예시적인 시퀀싱 프로브의 개략도이다. 도 1은 표적 결합 도메인이 표적 핵산에 결합할 수 있음을 보여준다. 표적 핵산은 본 발명의 시퀀싱 프로브가 혼성화할 수 있는 임의의 핵산일 수 있다. 표적 핵산은 DNA 또는 RNA일 수 있다. 표적 핵산은 대상으로부터의 생물학적 샘플로부터 수득될 수 있다. 용어 "표적 결합 도메인" 및 "시퀀싱 도메인"은 본원에서 상호교환적으로 사용된다.
표적 결합 도메인은 일련의 뉴클레오타이드를 포함할 수 있다(예컨대, 폴리뉴클레오타이드임). 표적 결합 도메인은 DNA, RNA, 또는 이의 조합을 포함할 수 있다. 표적 결합 도메인이 폴리뉴클레오타이드인 경우, 표적 결합 도메인은 도 1에 나타낸 바와 같이 시퀀싱 프로브의 표적 결합 도메인에 상보적인 표적 핵산의 부분에 혼성화함으로써 표적 핵산에 결합한다.
시퀀싱 프로브의 표적 결합 도메인은 시퀀싱 프로브 혼성화 및/또는 탈혼성화 가능성 및 이들이 발생하는 비율을 제어하도록 디자인될 수 있다. 일반적으로, 프로브의 Tm이 낮을수록, 프로브가 표적 핵산에/으로부터 탈혼성화하는 것이 빠르고 가능성이 높을 것이다. 따라서, 더 낮은 Tm 프로브의 사용은 표적 핵산에 결합된 프로브의 수를 감소시킬 것이다.
표적 결합 도메인의 길이는 부분적으로 프로브가 표적 핵산에 혼성화하고 혼성화된 상태를 유지할 가능성에 영향을 미친다. 일반적으로, 표적 결합 도메인이 더 길수록(더 큰 수의 뉴클레오타이드), 표적 뉴클레오타이드에 상보적인 서열이 존재할 가능성이 더 낮다. 반대로, 표적 결합 도메인이 더 짧을수록, 표적 뉴클레오타이드에 상보적인 서열이 존재할 가능성이 더 높다. 예를 들어, 4머 서열이 표적 핵산에 위치할 1/256 확률 대 6머 서열이 표적 핵산에 위치할 1/4096 확률이 있다. 결과적으로, 더 짧은 프로브의 집합은 더 긴 프로브의 집합과 비교하여 핵산의 주어진 스트레치에 대해 더 많은 위치에서 결합할 가능성이 높다.
경우에 따라, 핵산의 주어진 스트레치에서 리드의 수를 증가시켜, 예컨대, 돌연변이 또는 SNP 대립유전자를 검출할 때, 표적 핵산 또는 표적 핵산의 부분, 특히 특정한 관심있는 부분의 커버리지를 풍부하게 하기 위해 더 짧은 표적 결합 도메인을 갖는 프로브를 갖는 것이 바람직하다.
표적 결합 도메인은 임의의 양 또는 수의 뉴클레오타이드 길이일 수 있다. 표적 결합 도메인은 적어도 12개 뉴클레오타이드 길이, 적어도 10개 뉴클레오타이드 길이, 적어도 8개 뉴클레오타이드 길이, 적어도 6개 뉴클레오타이드 길이 또는 적어도 3개 뉴클레오타이드 길이일 수 있다.
표적 결합 도메인 내의 각각의 뉴클레오타이드는 표적 분자의 상보적인 뉴클레오타이드를 식별(또는 코딩)할 수 있다. 대안적으로, 표적 결합 도메인 내의 일부 뉴클레오타이드는 표적 분자의 상보적인 뉴클레오타이드를 식별(또는 코딩)하고, 표적 결합 도메인 내의 일부 뉴클레오타이드는 표적 분자의 상보적인 뉴클레오타이드를 식별(또는 코딩)하지 않는다.
표적 결합 도메인은 적어도 1개의 천연 염기를 포함할 수 있다. 표적 결합 도메인은 천연 염기를 포함할 수 없다. 표적 결합 도메인은 적어도 1개의 변형된 뉴클레오타이드 또는 핵산 유사체를 포함할 수 있다. 표적 결합 도메인은 변형된 뉴클레오타이드 또는 핵산 유사체를 포함할 수 없다. 표적 결합 도메인은 적어도 1개의 유니버설 염기를 포함할 수 있다. 표적 결합 도메인은 유니버설 염기를 포함할 수 없다. 표적 결합 도메인은 적어도 1개의 축퇴성 염기를 포함할 수 있다. 표적 결합 도메인은 축퇴성 염기를 포함할 수 없다.
표적 도메인은 임의의 조합 천연 염기(예컨대 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 천연 염기), 변형된 뉴클레오타이드 또는 핵산 유사체(예컨대 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 변형된 또는 유사체 뉴클레오타이드), 유니버설 염기(예컨대 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 유니버설 염기), 또는 축퇴성 염기(예컨대 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 축퇴성 염기)를 포함할 수 있다. 조합으로 존재할 때, 특정 표적 결합 도메인의 천연 염기, 변형된 뉴클레오타이드 또는 핵산 유사체, 유니버설 염기 및 축퇴성 염기는 임의의 순서로 배열될 수 있다.
용어 "변형된 뉴클레오타이드" 또는 "핵산 유사체"는, 비제한적으로, 잠금 핵산(LNA), 가교 핵산(BNA), 프로핀 변형된 핵산, 지프 핵산(ZNA®), 이소구아닌 및 이소시토신을 포함한다. 표적 결합 도메인은 0 내지 6개(예컨대 0, 1, 2, 3, 4, 5 또는 6개)의 변형된 뉴클레오타이드 또는 핵산 유사체를 포함할 수 있다. 바람직하게는, 변형된 뉴클레오타이드 또는 핵산 유사체는 잠금 핵산(LNA)이다.
본원에 사용된 바와 같이 용어 "잠금 핵산(LNA)"은, 비제한적으로, 리보스 모이어티가 2' 산소 및 4' 탄소를 연결하는 메틸렌 다리를 포함하는 변형된 RNA 뉴클레오타이드를 포함한다. 이 메틸렌 다리는 A-형 RNA 이합체에서 발견되는 노스 형태(north conformation)로도 알려진 3'-엔도 형태에서 리보스를 잠근다. 용어 접근할 수 없는 RNA가 LNA와 상호교환적으로 사용될 수 있다. 본원에 사용된 바와 같이 용어 "가교 핵산(BNA)"은 비제한적으로, 노스 형태로도 공지된 고정된 3'-엔도 형태를 갖는 5-원 또는 6-원 가교 구조를 포함하는 변형된 RNA 분자를 포함한다. 가교 구조는 리보스의 2' 산소를 리보스의 4' 탄소에 연결한다. 탄소, 질소, 및 수소 원자를 함유하는 다양한 상이한 다리 구조가 가능하다. 본원에 사용된 바와 같이 용어 "프로핀 변형된 핵산"은, 비제한적으로, 핵산 염기의 C5 위치에 프로핀 변형을 포함하는 피리딘, 즉 시토신 및 티민/우라실을 포함한다. 본원에 사용된 바와 같이 용어 "지프 핵산(ZNA®)"은, 비제한적으로, 양이온성 스페르민(spermine) 모이어티와 접합된 올리고뉴클레오타이드를 포함한다.
본원에 사용된 바와 같이 용어 "유니버설 염기"는, 비제한적으로, 왓슨-크릭 염기 쌍 규칙을 따르지 않고 표적 핵산 상에 위치한 4개의 표준(canonical) 염기(A, T/U, C, G) 중 어느 것에 결합할 수 있는 뉴클레오타이드 염기를 포함한다. 본원에 사용된 바와 같이 용어 "축퇴성 염기"는, 비제한적으로, 왓슨-크릭 염기 쌍 규칙을 따르지 않고 4개 표준 염기(A, T/U, C, G) 중 적어도 2개에 결합할 수 있지만 4개 모두에 결합할 수 없는 뉴클레오타이드 염기를 포함한다. 축퇴성 염기는 워블(Wobble) 염기로도 불릴 수 있고; 이들 용어는 본원에서 상호교환적으로 사용된다.
도 1에 도시된 예시적인 시퀀싱 프로브는 시퀀싱하고자 하는 표적 핵산의 상보적인 뉴클레오타이드 1-6에 특이적으로 혼성화하는 6개 뉴클레오타이드 길이(6머) 서열(b1- b2- b3- b4- b5- b6)을 포함하는 표적 결합 도메인을 예시한다. 표적 결합 도메인의 이 6머 부분(b1- b2- b3- b4- b5- b6)은 표적 서열 내의 상보적인 뉴클레오타이드(1- 2- 3- 4- 5- 6)를 식별(또는 코딩)한다. 이 6머 서열은 염기(N)에 의해 어느 하나의 측면에 플랭킹된다. (N)으로 표시된 염기는 독립적으로 유니버설 또는 축퇴성 염기일 수 있다. 전형적으로, (N)으로 표시된 염기는 독립적으로 표준 염기 중 하나이다. (N)으로 표시된 염기는 그것이 표적 서열에서 결합하는 상보적인 뉴클레오타이드를 식별(또는 코딩)하지 않고 (6머) 서열(b1- b2- b3- b4- b5- b6)의 핵산 서열과 독립적이다.
도 1에 도시된 시퀀싱 프로브는 혼성화 반응만을 사용하여 표적 핵산을 시퀀싱하기 위해 본 발명의 시퀀싱 방법과 함께 사용될 수 있으며, 공유 화학, 효소 또는 증폭이 필요하지 않다. 표적 핵산 분자 내의 모든 가능한 6머 서열을 시퀀싱하기 위해, 총 4096개의 시퀀싱 프로브가 필요하다(4^6=4096).
도 1은 본 발명의 서열 프로브의 표적 결합 도메인의 하나의 구성에 대한 예시이다. 표 1은 본 발명의 표적 결합 도메인의 몇 가지 다른 구성을 제공한다. "6 LNA" 표적 결합 도메인으로 불리는 하나의 바람직한 표적 결합 도메인은 표적 결합 도메인의 위치 b1 내지 b6에 6개의 LNA를 포함한다. 이들 6개의 LNA는 염기(N)에 의해 어느 하나의 측면에 플랭킹된다. 본원에 사용된 바와 같이, (N) 염기는 (6머) 서열(b1- b2- b3- b4- b5- b6)의 핵산 서열과 독립적인 유니버설/축퇴성 염기 또는 표준 염기일 수 있다. 즉, 염기 b1- b2- b3- b4- b5- b6은 임의의 주어진 표적 서열에 특이적일 수 있지만, (N) 염기는 유니버설/축퇴성 염기일 수 있거나 염기 b1- b2- b3- b4- b5- b6로 표시된 표적에 특이적이지 않은 4개의 표준 염기 중 어느 것으로 구성될 수 있다. 예를 들어, 조사될 표적 서열이 CAGGCATA 염기인 경우, 표적 결합 도메인의 b1- b2- b3- b4- b5- b6은 TCCGTA인 반면 표적 결합 도메인의 (N) 염기 각각은 독립적으로 A, C, T 또는 G일 수 있으므로, 생성된 표적 결합 도메인은 서열 ATCCGTAG, TTCCGTAC, GTCCGTAG 또는 다른 16개의 가능한 반복 중 어느 것을 가질 수 있다. 대안적으로, 2개의 (N) 염기가 6개의 LNA보다 선행할 수 있다. 대안적으로, 2개의 (N) 염기는 6개의 LNA보다 후행할 수 있다.
Figure 112020129306748-pat00005
표 1은 또한 10개의 천연, 표적 특이적 염기를 포함하는 "10 머" 표적 결합 도메인을 기술한다.
표 1은 위치 b1 내지 b6에 6개의 천연 염기를 포함하는 "천연 I" 표적 결합 도메인을 추가로 기술한다. 이들 6개의 천연 염기는 2개의 (N) 염기에 의해 양쪽 측면에 플랭킹된다. 대안적으로, 모든 4개의 (N) 염기가 6개의 천연 염기보다 선행할 수 있다. 대안적으로, 모든 4개의 (N) 염기가 6개의 천연 염기보다 후행할 수 있다. 4개의 (N) 염기 중 임의의 수(즉 1, 2, 3 또는 4)가 6개의 천연 염기보다 선행할 수 있는 반면, 나머지 (N) 염기는 6개의 천연 염기보다 후행할 것이다.
표 1은 위치 b1 내지 b6에 6개의 천연 염기를 포함하는 "천연 II" 표적 결합 도메인을 추가로 기술한다. 이들 6개의 천연 염기는 (N) 염기에 의해 양쪽 측면에 플랭킹된다. 대안적으로, 2개의 (N) 염기는 6개의 천연 염기보다 선행할 수 있다. 대안적으로, 2개의 (N) 염기는 6개의 천연 염기보다 후행할 수 있다.
표 1은 또한 표적 결합 도메인의 위치 b1 내지 b6에 2개의 LNA 및 4개의 천연 염기의 조합을 포함하는 "2 LNA" 표적 결합 도메인을 기술한다. 2개의 LNA 및 4개의 천연 염기는 임의의 순서로 발생할 수 있다. 예를 들어, 위치 b3 및 b4는 LNA일 수 있는 반면 위치 b1, b2, b5 및 b6은 천연 염기이다. 염기 b1 내지 b6은 (N) 염기에 의해 양쪽 측면에 플랭킹된다. 대안적으로, 염기 b1 내지 b6은 2개의 (N) 염기보다 선행할 수 있다. 대안적으로, 염기 b1 내지 b6은 2개의 (N) 염기보다 후행할 수 있다.
표 1은 표적 결합 도메인의 위치 b1 내지 b6에 4개의 LNA 및 2개의 천연 염기의 조합을 포함하는 "4 LNA" 표적 결합 도메인을 추가로 기술한다. 4개의 LNA 및 2개의 천연 염기는 임의의 순서로 발생할 수 있다. 예를 들어, 위치 b2 내지 b5는 LNA일 수 있는 반면, 위치 b1 및 b6은 천연 염기이다. 염기 b1 내지 b6은 (N) 염기에 의해 양쪽 측면에 플랭킹된다. 대안적으로, 염기 b1 내지 b6은 2개의 (N) 염기보다 선행할 수 있다. 대안적으로, 염기 b1 내지 b6은 2개의 (N) 염기보다 후행할 수 있다.
본 발명의 시퀀싱 프로브는 합성 백본을 포함한다. 표적 결합 도메인 및 바코드 도메인은 작동가능하게 연결된다. 표적 결합 도메인 및 바코드 도메인은 하나의 합성 백본의 부분으로서 공유 결합될 수 있다. 표적 결합 도메인 및 바코드 도메인은 링커(예컨대, 핵산 링커, 화학적 링커)를 통해 부착될 수 있다. 합성 백본은 임의의 물질, 예컨대, 다당류, 폴리뉴클레오타이드, 폴리머, 플라스틱, 섬유, 펩타이드, 펩타이드 핵산, 또는 폴리펩타이드를 포함할 수 있다. 바람직하게는, 합성 백본은 견고하다. 합성 백본은 단일 가닥의 DNA 분자를 포함할 수 있다. 백본은 6개의 DNA 이중 나선의 "DNA 오리가미(origami)"를 포함할 수 있다(예컨대, Lin et al, "Submicrometre geometrically encoded fluorescent barcodes self-assembled from DNA." Nature Chemistry; 2012 Oct; 4(10): 832-9 참고). 바코드는 DNA 오리가미 타일(tile)로 만들어질 수 있다(Jungmann et al, "Multiplexed 3D cellular super-resolution imaging with DNA-PAINT and Exchange-PAINT", Nature Methods, Vol. 11, No. 3, 2014).
본 발명의 시퀀싱 프로브는 부분적 이중 가닥의 합성 백본을 포함할 수 있다. 시퀀싱 프로브는 표적 결합 도메인과 바코드 도메인 사이에 단일 가닥의 DNA 합성 백본 및 이중 가닥의 DNA 스페이서를 포함할 수 있다. 시퀀싱 프로브는 표적 결합 도메인과 바코드 도메인 사이에 단일 가닥의 DNA 합성 백본 및 이중 가닥의 DNA와 유사한 기계적 특성을 갖는 폴리머 기반의 스페이서를 포함할 수 있다. 전형적인 폴리머 기반의 스페이서는 폴리에틸렌 글리콜(PEG) 유형 폴리머를 포함한다.
이중 가닥의 DNA 스페이서는 약 1개 뉴클레오타이드 내지 약 100개 뉴클레오타이드 길이; 약 2개 뉴클레오타이드 내지 약 50개 뉴클레오타이드 길이; 약 20개 뉴클레오타이드 내지 약 40개 뉴클레오타이드 길이일 수 있다. 바람직하게는, 이중 가닥의 DNA 스페이서는 약 36개 뉴클레오타이드 길이이다.
"표준 프로브"로 불리는 본 발명의 하나의 시퀀싱 프로브는 도 2의 좌측 패널에 예시되어 있다. 도 2의 표준 프로브는 표적 결합 도메인에 공유결합된 바코드 도메인을 포함하여, 표적 결합 및 바코드 도메인은 동일한 단일 가닥의 올리고뉴클레오타이드 내에 존재한다. 도 2의 좌측 패널에서, 단일 가닥의 올리고뉴클레오타이드는 스템 올리고뉴클레오타이드에 결합하여 스템으로 불리는 36개 뉴클레오타이드 길이의 이중 가닥의 스페이서 영역을 생성한다. 이 구조를 사용하여, 프로브의 풀 내의 각각의 시퀀싱 프로브는 동일한 스템 서열에 혼성화할 수 있다.
"3부분 프로브"로 불리는 본 발명의 또 다른 시퀀싱 프로브가 도 2의 우측 패널에 예시되어 있다. 도 2의 3부분 프로브는 링커를 통해 표적 결합 도메인에 부착된 바코드 도메인을 포함한다. 이 예에서, 링커는 표적 결합 도메인을 함유하는 단일 가닥의 올리고뉴클레오타이드 및 바코드 도메인을 함유하는 단일 가닥의 올리고뉴클레오타이드에 혼성화하여, 바코드 도메인(18개 뉴클레오타이드) 및 표적 결합 도메인(18개 뉴클레오타이드)을 가교하는 36개 뉴클레오타이드 길이의 이중 가닥의 스페이서 영역을 생성하는 단일 가닥의 스템 올리고뉴클레오타이드이다. 이 예시적인 프로브 구성을 사용하여, 바코드 도메인의 교환을 방지하기 위해, 각각의 바코드는 특유의 스템 서열에 혼성화되도록 디자인될 수 있다. 또한, 각각의 바코드 도메인은 또한 상이한 시퀀싱 프로브를 모으기 전에 그의 상응하는 스템 올리고뉴클레오타이드에 혼성화될 수 있다.
바코드 도메인은 복수의 부착 위치, 예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 부착 위치를 포함한다. 부착 위치의 수는 표적 결합 도메인 내의 뉴클레오타이드의 수보다 적거나, 같거나, 많을 수 있다. 표적 결합 도메인은 백본 도메인 내의 부착 위치의 수보다 더 많은 뉴클레오타이드, 예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 뉴클레오타이드를 포함할 수 있다. 표적 결합 도메인은 8개의 뉴클레오타이드를 포함할 수 있고, 바코드 도메인은 3개의 부착 위치를 포함한다. 표적 결합 도메인은 10개의 뉴클레오타이드를 포함할 수 있고, 바코드 도메인은 3개의 부착 위치를 포함한다.
바코드 도메인의 길이는 하기에 기재된 바와 같이 적어도 3개의 부착 위치를 위한 충분한 공간이 존재하는 한 제한되지 않는다. 용어 "부착 위치," "위치" 및 "스팟"은 본원에서 상호교환적으로 사용된다. 용어 "바코드 도메인" 및 "리포팅 도메인"은 본원에서 상호교환적으로 사용된다.
바코드 도메인 내의 각각의 부착 위치는 표적 결합 도메인 내의 2개의 뉴클레오타이드(디뉴클레오타이드)에 상응하며, 따라서, 표적 결합 도메인 내의 디뉴클레오타이드에 혼성화된 표적 핵산 내의 상보적인 디뉴클레오타이드에 상응한다. 비제한적인 예로서, 바코드 도메인 내의 제1 부착 위치는 표적 결합 도메인 내의 제1 및 제2 뉴클레오타이드에 상응하며(예컨대, 도 1, 여기서 R1은 바코드 도메인 내의 제1 부착 위치이고, R1은 표적 결합 도메인 내의 디뉴클레오타이드 b1 및 b2에 상응하며 - 이는 결국 표적 핵산의 디뉴클레오타이드 1 및 2를 식별함); 바코드 도메인 내의 제2 부착 위치는 표적 결합 도메인 내의 제3 및 제4 뉴클레오타이드에 상응하고(예컨대, 도 1, 여기서 R2는 바코드 도메인 내의 제2 부착 위치이고, R2는 표적 결합 도메인 내의 디뉴클레오타이드 b3 및 b4에 상응하며 - 이는 결국 표적 핵산의 디뉴클레오타이드 3 및 4를 식별함); 바코드 도메인 내의 제3 부착 위치는 표적 결합 도메인 내의 제5 및 제6 뉴클레오타이드에 상응한다(예컨대, 도 1, 여기서 R3은 바코드 도메인 내의 제3 부착 위치이고, R3은 표적 결합 도메인 내의 디뉴클레오타이드 b5 및 b6에 상응하며 - 이는 결국 표적 핵산의 디뉴클레오타이드 5 및 6을 식별함).
바코드 도메인 내의 각각의 부착 위치는 적어도 1개의 부착 영역, 예컨대, 1개 내지 50개 이상의 부착 영역을 포함한다. 바코드 도메인 내의 특정 위치는 다른 위치보다 더 많은 부착 영역을 가질 수 있고(예컨대, 제1 부착 위치는 3개의 부착 영역을 가질 수 있는 반면, 제2 부착 위치는 2개의 부착 위치를 가질 수 있음); 대안적으로, 바코드 도메인 내의 각각의 위치는 동일한 수의 부착 영역을 가질 수 있다. 바코드 도메인 내의 각각의 부착 위치는 1개의 부착 영역을 포함할 수 있다. 바코드 도메인 내의 각각의 부착 위치는 1개를 초과하는 부착 영역을 포함할 수 있다. 바코드 도메인 내의 적어도 3개의 부착 위치 중 적어도 1개는 바코드 도메인 내의 다른 2개의 부착 위치와 상이한 수의 부착 영역을 포함할 수 있다.
각각의 부착 영역은 상보적 핵산 분자(예컨대, DNA 또는 RNA)에 의해 가역적으로 결합될 수 있는 핵산 서열(들)의 적어도 1개(즉, 1개 내지 50개, 예컨대, 10개 내지 30개)의 카피를 포함한다. 단일 부착 위치에서의 부착 영역의 핵산 서열은 동일할 수 있으며; 따라서, 이들 부착 영역에 결합하는 상보적 핵산 분자는 동일하다. 대안적으로, 위치에서의 부착 영역의 핵산 서열은 동일하지 않으며; 따라서, 이들 부착 영역에 결합하는 상보적 핵산 분자는 동일하지 않다.
바코드 도메인 내의 각각의 부착 영역을 포함하는 핵산 서열은 약 8개 뉴클레오타이드 내지 약 20개 뉴클레오타이드 길이일 수 있다. 바코드 도메인 내의 각각의 부착 영역을 포함하는 핵산 서열은 약 12개 뉴클레오타이드 길이일 수 있거나 약 14개 뉴클레오타이드 길이이다. 바람직하게는, 바코드 도메인 내의 각각의 부착 영역을 포함하는 핵산 서열은 약 14개 뉴클레오타이드 길이이다.
바코드 도메인 내의 각각의 부착 영역을 포함하는 핵산 각각은 독립적으로 표준 염기 또는 변형된 뉴클레오타이드 또는 핵산 유사체일 수 있다. 바코드 도메인 내의 부착 영역 내의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 또는 적어도 6개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체일 수 있다. 바코드 도메인에서 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체 대 표준 염기의 전형적인 비율은 1:2 내지 1:8이다. 바코드 도메인 내의 부착 영역에서 유용한 전형적인 변형된 뉴클레오타이드 또는 핵산 유사체는 이소구아닌 및 이소시토신이다. 이소구아닌 및 이소시토신과 같은 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체의 사용은, 예를 들어, 표적을 포함하는 다른 곳에의 결합을 최소화하면서 바코드 도메인 내의 적절한 부착 영역에 대한 리포터의 결합 효율 및 정확도를 개선할 수 있다.
하나 이상의 부착 영역은 폴리뉴클레오타이드 백본에 통합될 수 있고; 즉, 백본은 단일 폴리뉴클레오타이드이고, 부착 영역은 단일 폴리뉴클레오타이드의 서열의 부분이다. 하나 이상의 부착 영역은 합성 백본 내의 변형된 모노머(예컨대, 변형된 뉴클레오타이드)에 연결되어 부착 영역은 합성 백본으로부터 분지된다. 부착 위치는 1개를 초과하는 부착 영역을 포함할 수 있으며, 일부 부착 영역은 합성 백본으로부터 분지되고, 일부 부착 영역은 합성 백본에 통합된다. 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역은 합성 백본에 통합될 수 있다. 적어도 3개의 부착 위치 각각 내의 각각의 부착 영역은 합성 백본에 통합될 수 있다. 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역은 합성 백본으로부터 분지될 수 있다. 적어도 3개의 부착 위치 각각 내의 각각의 부착 영역은 합성 백본으로부터 분지될 수 있다.
바코드 도메인 내의 각각의 부착 위치는 16개 디뉴클레오타이드 중 1개, 즉, 아데닌-아데닌, 아데닌-티민/우라실, 아데닌-시토신, 아데닌-구아닌, 티민/우라실-아데닌, 티민/우라실-티민/우라실, 티민/우라실-시토신, 티민/우라실-구아닌, 시토신-아데닌, 시토신-티민/우라실, 시토신-시토신, 시토신-구아닌, 구아닌-아데닌, 구아닌-티민/우라실, 구아닌-시토신 또는 구아닌-구아닌에 상응한다. 따라서, 바코드 도메인의 단일 부착 위치에 위치한 하나 이상의 부착 영역은 16개 디뉴클레오타이드 중 1개에 상응하며, 부착 영역이 상응하는 디뉴클레오타이드에 특이적인 핵산 서열을 포함한다. 바코드 도메인의 상이한 부착 위치에 위치한 부착 영역은 바코드 도메인 내의 이들 위치가 동일한 디뉴클레오타이드에 상응하더라도 특유의 핵산 서열을 함유한다. 예를 들어, 서열 A-G-A-G-A-C를 코딩하는 헥사머를 갖는 표적 결합 도메인을 함유하는 본 발명의 시퀀싱 프로브가 주어지면, 이 시퀀싱 프로브의 바코드 도메인은 아데닌-구아닌 디뉴클레오타이드에 상응하는 제1 부착 위치, 아데닌-구아닌 디뉴클레오타이드에 상응하는 제2 부착 위치 및 아데닌-시토신 디뉴클레오타이드에 상응하는 제3 부착 위치를 갖는 3개의 위치를 함유할 것이다. 이 예시적인 프로브의 위치 1에 위치한 부착 영역은 위치 2에 위치한 부착 영역의 핵산 서열로부터 독특한 핵산 서열을 포함할 것이며, 부착 위치 1 및 부착 위치 2 모두가 디뉴클레오타이드 아데닌-구아닌에 상응함에도 불구하고 그러하다. 특이적 부착 위치의 서열은 특정 부착 위치의 상보적 핵산이 상이한 부착 위치와 상호작용하지 않도록 디자인되고 테스트된다. 또한, 상보적 핵산의 뉴클레오타이드 서열은 제한되지 않으며; 바람직하게는 그것은 공지된 뉴클레오타이드 서열와 실질적인 상동성(예컨대, 50% 내지 99.9%)이 결여되고; 이것은 상보적 핵산 및 표적 핵산의 바람직하지 않는 혼성화를 제한한다.
도 1은 예시적인 바코드 도메인을 포함하는 본 발명의 하나의 예시적인 시퀀싱 프로브의 예시를 나타낸다. 도 1에 도시된 예시적인 바코드 도메인은 3개의 부착 위치 R1, R2, 및 R3을 포함한다. 각각의 부착 위치는 표적 결합 도메인의 6머 서열(b1 내지 b6) 내에 존재하는 특정 디뉴클레오타이드에 상응한다. 이 예에서, R1은 위치 b1 및 b2에 상응하고, R2는 위치 b3 b4에 상응하며, R3은 위치 b5 및 b6에 상응한다. 따라서, 각각의 위치는 표적 결합 도메인의 6머 서열에 존재하는 특정한 디뉴클레오타이드를 디코딩하여, 각각의 특정 디뉴클레오타이드에 존재하는 특정한 2개의 염기(A, C, G 또는 T)를 식별한다.
도 1에 도시된 예시적인 바코드 도메인에서, 각각의 부착 위치는 합성 백본에 통합된 단일 부착 영역을 포함한다. 3개의 부착 위치의 각각의 부착 영역은 각각의 부착 위치에 의해 코딩되는 특정한 디뉴클레오타이드에 상응하는 특정한 뉴클레오타이드 서열을 함유한다. 예를 들어, 부착 위치 R1은 디뉴클레오타이드 b1-b2의 정체에 상응하는 특정 서열을 갖는 부착 영역을 포함한다.
바코드 도메인은 하나 이상의 결합 영역을 추가로 포함할 수 있다. 바코드 도메인은 적어도 1개의 부착 위치에 인접하거나 플랭킹한 적어도 1개의 단일 가닥의 핵산 서열을 포함할 수 있다. 바코드 도메인은 적어도 2개의 부착 위치에 인접하거나 플랭킹한 적어도 2개의 단일 가닥의 핵산 서열을 포함할 수 있다. 바코드 도메인은 적어도 3개의 부착 위치에 인접하거나 플랭킹한 적어도 3개의 단일 가닥의 핵산 서열을 포함할 수 있다. 이들 플랭킹 부분은 "토홀드(Toe-Hold)"로 알려져 있으며, 이는 단일 가닥의 올리고뉴클레오타이드(예컨대, "토홀드"; 예컨대 Seeling et al., "Catalyzed Relaxation of a Metastable DNA Fuel"; J. Am. Chem. Soc. 2006, 128(37), pp12211-12220 참고)에 대한 추가의 결합 부위를 제공함으로써 토홀드에 인접하여 혼성화된 올리고뉴클레오타이드의 교환 속도를 가속화시키는데 사용될 수 있다.
본 발명의 시퀀싱 프로브는 약 20 나노미터 내지 약 50 나노미터의 전체 길이(표적 결합 도메인, 바코드 도메인, 및 임의의 선택적인 도메인 포함)를 가질 수 있다. 시퀀싱 프로브의 백본은 약 120개 뉴클레오타이드를 포함하는 폴리뉴클레오타이드 분자일 수 있다.
시퀀싱 프로브는 절단 가능한 링커 변형을 포함할 수 있다. 당업자에게 공지된 임의의 절단 가능한 링커 변형이 이용될 수 있다. 절단 가능한 링커 변형의 비제한적인 예는, 비제한적으로, UV 광 절단 가능한 링커, 환원제 절단 가능한 링커 및 효소적으로 절단 가능한 링커를 포함한다. 효소적으로 절단 가능한 링커의 예는 USER™ 효소에 의한 절단을 위한 우라실의 삽입이다. 절단 가능한 링커 변형은, 비제한적으로, 표적 결합 도메인과 바코드 도메인 사이의 영역을 포함하는, 시퀀싱 프로브의 길이를 따라 어디든지 위치할 수 있다. 도 10의 우측 패널은 본 발명의 프로브 내로 혼입될 수 있는 예시적인 절단 가능한 링커 변형을 도시한다.
리포터 프로브
본 발명의 시퀀싱 프로브의 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역 내의 상보적 핵산 서열에 결합(예컨대, 혼성화)하고 (직접 또는 간접적으로) 검출 가능한 표지를 포함하는 핵산 분자는 본원에서 "리포터 프로브" 또는 "리포터 프로브 복합체"로 지칭되며, 이들 용어는 본원에서 상호교환적으로 사용된다. 리포터 프로브는 DNA, RNA 또는 PNA일 수 있다. 바람직하게는, 리포터 프로브는 DNA이다.
리포터 프로브는 적어도 1개의 제1 상보적 핵산 분자에 결합할 수 있는 제1 도메인 및 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합할 수 있는 제2 도메인인 적어도 2개의 도메인을 포함할 수 있다. 도 3은 예시적인 시퀀싱 프로브의 바코드 도메인의 제1 부착 위치에 결합된 본 발명의 예시적인 리포터 프로브의 개략도를 나타낸다. 도 3에서, 리포터 프로브의 제1 도메인(교차된 평행선 밤색으로 표시됨)은 바코드 도메인의 부착 위치 R1 내의 상보적 핵산 서열에 결합하고, 리포터 프로브의 제2 도메인(회색으로 표시됨)은 2개의 검출 가능한 표지(하나의 녹색 표지, 하나의 적색 표지)에 결합된다.
대안적으로, 리포터 프로브는 적어도 1개의 제1 상보적 핵산 분자에 결합할 수 있는 제1 도메인 및 적어도 1개의 제2 상보적 핵산 분자에 결합할 수 있는 제2 도메인인 적어도 2개의 도메인을 포함할 수 있다. 적어도 1개의 제1 및 적어도 1개의 제2 상보적 핵산 분자는 상이할 수 있다(상이한 핵산 서열을 가질 수 있다).
"일차 핵산 분자"는 시퀀싱 프로브의 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역 내의 상보적 핵산 서열에 결합(예컨대, 혼성화)할 수 있는 제1 도메인 및 적어도 1개의 추가의 상보적 핵산에 결합(예컨대, 혼성화)할 수 있는 제2 도메인인 적어도 2개의 도메인을 포함하는 리포터 프로브이다. 일차 핵산 분자는 시퀀싱 프로브의 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역 내의 상보적 핵산 서열에 직접 결합할 수 있다. 일차 핵산 분자는 핵산 링커를 통해 시퀀싱 프로브의 바코드 도메인의 적어도 1개의 부착 위치 내의 적어도 1개의 부착 영역 내의 상보적 핵산 서열에 간접적으로 결합할 수 있다. 일차 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 절단 가능한 링커는 제1 도메인과 제2 도메인 사이에 위치할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다.
일차 핵산 분자의 제1 도메인을 포함하는 핵산 각각은 독립적으로 표준 염기 또는 변형된 뉴클레오타이드 또는 핵산 유사체일 수 있다. 일차 핵산 분자의 제1 도메인 내의 적어도 1개, 2개, 적어도 3개, 적어도 4개, 적어도 5개, 또는 적어도 6개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체일 수 있다. 바코드 도메인에서 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체 대 표준 염기의 전형적인 비율은 1:2 내지 1:8이다. 일차 핵산 분자의 제1 도메인에서 유용한 전형적인 변형된 뉴클레오타이드 또는 핵산 유사체는 이소구아닌 및 이소시토신이다. 이소구아닌 및 이소시토신과 같은 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체의 사용은, 예를 들어, 표적을 포함하는 다른 곳에의 결합을 최소화하면서 시퀀싱 프로브의 바코드 도메인 내의 적어도 1개의 위치 내의 적어도 1개의 부착 영역 내의 적절한 상보적 핵산 서열에 대한 일차 핵산 분자의 제1 도메인의 결합 효율 및 정확도를 개선할 수 있다.
일차 핵산 분자에 결합하는 적어도 1개의 추가의 상보적 핵산은 본원에서 "이차 핵산 분자"로 지칭된다. 일차 핵산 분자는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개 이상의 이차 핵산 분자에 결합(예컨대, 혼성화)할 수 있다. 바람직하게는, 일차 핵산 분자는 4개의 이차 핵산 분자에 결합(예컨대, 혼성화)할 수 있다.
이차 핵산 분자는 적어도 1개의 일차 핵산 분자 내의 적어도 1개의 상보적인 서열에 결합(예컨대, 혼성화)할 수 있는 제1 도메인 및 (a) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지; (b) 적어도 1개의 추가적인 상보적 핵산; 또는 (c) 이들의 조합에 결합(예컨대, 혼성화)할 수 있는 제2 도메인인 적어도 2개의 도메인을 포함한다. 이차 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 절단 가능한 링커는 제1 도메인과 제2 도메인 사이에 위치할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다.
이차 핵산 분자의 제1 도메인을 포함하는 핵산 각각은 독립적으로 표준 염기 또는 변형된 뉴클레오타이드 또는 핵산 유사체일 수 있다. 이차 핵산 분자의 제1 도메인 내의 적어도 1개, 2개, 적어도 3개의, 적어도 4개, 적어도 5개, 또는 적어도 6개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체일 수 있다. 바코드 도메인에서 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체 대 표준 염기의 전형적인 비율은 1:2 내지 1:8이다. 이차 핵산 분자의 제1 도메인에서 유용한 전형적인 변형된 뉴클레오타이드 또는 핵산 유사체는 이소구아닌 및 이소시토신이다. 이소구아닌 및 이소시토신과 같은 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체의 사용은, 예를 들어, 다른 곳에의 결합을 최소화하면서 일차 핵산 분자의 제2 도메인 내의 적절한 상보적 핵산 서열에 대한 이차 핵산 분자의 제1 도메인의 결합 효율 및 정확도를 개선할 수 있다.
이차 핵산 분자에 결합하는 적어도 1개의 추가적인 상보적 핵산은 본원에서 "삼차 핵산 분자"로 지칭된다. 이차 핵산 분자는 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개 이상의 삼차 핵산 분자에 결합(예컨대, 혼성화)할 수 있다. 바람직하게는, 적어도 1개의 이차 핵산 분자는 1개의 삼차 핵산 분자에 결합(예컨대, 혼성화)할 수 있다.
삼차 핵산 분자는 적어도 1개의 이차 핵산 분자 내의 적어도 1개의 상보적인 서열에 결합(예컨대, 혼성화)할 수 있는 제1 도메인 및 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합(예컨대, 혼성화)할 수 있는 제2 도메인인 적어도 2개의 도메인을 포함한다. 대안적으로, 제2 도메인은, 예를 들어, 포스포로아미다이트 또는 NHS 화학을 이용한 올리고뉴클레오타이드 합성 동안 표지의 직접 또는 간접 부착을 통해 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함할 수 있다. 삼차 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 절단 가능한 링커는 제1 도메인과 제2 도메인 사이에 위치할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다.
삼차 핵산 분자의 제1 도메인을 포함하는 핵산 각각은 독립적으로 표준 염기 또는 변형된 뉴클레오타이드 또는 핵산 유사체일 수 있다. 삼차 핵산의 제1 도메인 내의 적어도 1개, 2개, 적어도 3개, 적어도 4개, 적어도 5개, 또는 적어도 6개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체일 수 있다. 삼차 핵산 분자의 제1 도메인에서 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체 대 표준 염기의 전형적인 비율은 1:2 내지 1:8이다. 삼차 핵산 분자의 제1 도메인에서 유용한 전형적인 변형된 뉴클레오타이드 또는 핵산 유사체는 이소구아닌 및 이소시토신이다. 이소구아닌 및 이소시토신과 같은 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체의 사용은, 예를 들어, 다른 곳에의 결합을 최소화하면서 제2 핵산 분자의 제2 도메인 내의 적절한 상보적 핵산 서열에 대한 삼차 핵산 분자의 제1 도메인의 결합 효율 및 정확도를 개선할 수 있다.
리포터 프로브는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합되어 이중 색상 조합을 생성한다. 형광 염료의 이러한 이중 조합은 단일 색상의 이중성, 예컨대 청색-청색을 포함할 수 있다. 본원에 사용된 바와 같이, 용어 "표지"는 검출 가능한 신호를 생성할 수 있는 단일 모이어티 또는 동일하거나 실질적으로 동일한 검출 가능한 신호를 생성할 수 있는 다중 모이어티를 포함한다. 예를 들어, 표지는 단일 황색 형광 염료, 예컨대 ALEXA FLUOR™ 532 또는 다중 황색 형광 염료, 예컨대 ALEXA FLUOR™ 532를 포함한다.
리포터 프로브는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합할 수 있고, 여기서 각각의 검출 가능한 표지는 4개 형광 염료인 청색(B); 녹색(G); 황색(Y); 및 적색(R) 중 하나이다. 이들 4개 염료의 사용은 10개의 가능한 이중 색상 조합 BB; BG; BR; BY; GG; GR; GY; RR; RY; 또는 YY를 생성한다. 일부 양태에서, 본 발명의 리포터 프로브는 도 3에 도시된 바와 같이 8개 가능한 색상 조합 BB; BG; BR; BY; GG; GR; GY; 또는 YY 중 하나로 표지된다. 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
시퀀싱 프로브 및 일차 핵산 분자를 포함하는 양태에서, 본 발명은 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 8개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는(상보적인) 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 1개, 또는 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이고; 바코드 도메인은 합성 백본을 포함하며, 바코드 도메인은 적어도 3개의 부착 위치를 포함하고, 각각의 부착 위치는 적어도 1개의 상보적인 일차 핵산 분자에 의해 결합된 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하며, 상보적인 일차 핵산 분자는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치에 결합된 각각의 상보적인 일차 핵산 분자의 적어도 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지는 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정한다. 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 또는 유니버설 또는 축퇴성 염기에 의해 지시된 표적에 특이적이지 않는 4개의 표준 염기 중 어느 것일 수 있는 것인 시퀀싱 프로브를 제공한다.
시퀀싱 프로브 및 일차 핵산 분자를 포함하는 양태에서, 본 발명은 또한 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 10개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는(상보적인) 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 4개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 적어도 1개의 상보적인 일차 핵산 분자에 의해 결합된 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 상보적인 일차 핵산 분자는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하며, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하고, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 가지며, 적어도 3개의 부착 위치의 각각의 위치에 결합된 각각의 상보적인 일차 핵산 분자의 적어도 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지는 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
시퀀싱 프로브, 일차 핵산 분자 및 이차 핵산 분자를 포함하는 양태에서, 본 발명은 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 8개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는(상보적인) 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 1개, 또는 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이고, 표적 결합 도메인 내의 적어도 1개, 또는 적어도 2개의 뉴클레오타이드는 표적 결합 도메인 내의 다른 염기에 의해 지시된 표적에 특이적이지 않은 4개의 표준 염기 중 어느 것 또는 유니버설 또는 축퇴성 염기이며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 적어도 1개의 상보적인 일차 핵산 분자에 의해 결합된 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 상보적인 일차 핵산 분자는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 적어도 1개의 상보적인 이차 핵산 분자에 의해 추가로 결합되고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치에 결합된 각각의 상보적인 이차 핵산 분자의 적어도 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지는 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
시퀀싱 프로브, 일차 핵산 분자 및 이차 핵산 분자를 포함하는 양태에서, 본 발명은 또한 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 10개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는(상보적인) 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 4개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 적어도 1개의 상보적인 일차 핵산 분자에 의해 결합된 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 상보적인 일차 핵산 분자는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 적어도 1개의 상보적인 이차 핵산 분자에 의해 추가로 결합되고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치에 결합된 각각의 상보적인 이차 핵산 분자의 적어도 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지는 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
시퀀싱 프로브, 일차 핵산 분자, 이차 핵산 분자 및 삼차 핵산 분자를 포함하는 양태에서, 본 발명은 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 8개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는(상보적인) 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 1개, 또는 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이고, 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않는 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드에 의해 지시된 표적에 특이적이지 않은 4개의 표준 염기 중 어느 것 또는 유니버설 또는 유니버설 또는 축퇴성 염기일 수 있으며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 적어도 1개의 상보적인 일차 핵산 분자에 의해 결합된 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 상보적인 일차 핵산 분자는 적어도 1개의 상보적인 이차 핵산 분자에 의해 추가로 결합되며, 적어도 1개의 상보적인 이차 핵산 분자는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 적어도 1개의 상보적인 삼차 핵산 분자에 의해 추가로 결합되고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치에 결합된 각각의 상보적인 삼차 핵산 분자의 적어도 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지는 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
시퀀싱 프로브, 일차 핵산 분자, 이차 핵산 분자 및 삼차 핵산 분자를 포함하는 양태에서, 본 발명은 또한 표적 결합 도메인 및 바코드 도메인을 포함하는 시퀀싱 프로브로서, 표적 결합 도메인은 적어도 10개의 뉴클레오타이드를 포함하고 표적 핵산에 결합할 수 있으며, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는(상보적인) 뉴클레오타이드를 식별할 수 있고, 표적 결합 도메인 내의 적어도 4개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않으며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 적어도 1개의 상보적인 일차 핵산 분자에 의해 결합된 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 상보적인 일차 핵산 분자는 적어도 1개의 상보적인 이차 핵산 분자에 의해 추가로 결합되며, 적어도 1개의 상보적인 이차 핵산 분자는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 적어도 1개의 상보적인 삼차 핵산 분자에 의해 추가로 결합되고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치에 결합된 각각의 상보적인 삼차 핵산 분자의 적어도 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지는 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정하는 것인 시퀀싱 프로브를 제공한다.
본 발명은 또한 이차 핵산 분자 및 삼차 핵산 분자 모두 상에 검출 가능한 표지를 갖는 시퀀싱 프로브 및 리포터 프로브를 제공한다. 예를 들어, 이차 핵산 분자는 일차 핵산 분자에 결합할 수 있고, 이차 핵산 분자는 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지 모두를 포함할 수 있으며, 또한 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 적어도 1개의 삼차 분자에 결합될 수 있다. 이차 핵산 분자 상에 위치한 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 삼차 핵산 분자 상에 위치한 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 이차 핵산 분자 상의 검출 가능한 표지의 방출 스펙트럼은 삼차 핵산 분자 상의 검출 가능한 표지의 방출 스펙트럼과 동일할 수 있거나 상이할 수 있다.
도 4는 예시적인 일차 핵산 분자, 이차 핵산 분자 및 삼차 핵산 분자를 포함하는 본 발명의 예시적인 리포터 프로브의 개략도이다. 3' 말단에서, 일차 핵산은 제1 도메인을 포함하고, 제1 도메인은 시퀀싱 프로브 바코드 도메인의 부착 위치 내의 상보적인 부착 영역에 혼성화하는 12개의 뉴클레오타이드 서열을 포함한다. 5' 말단에는 6개의 이차 핵산 분자에 혼성화되는 제2 도메인이 있다. 도시된 예시적인 이차 핵산 분자는 차례로 5' 말단에 일차 핵산 분자에 혼성화하는 제1 도메인 및 3' 부분에 5개의 삼차 핵산 분자에 혼성화하는 도메인을 포함한다.
삼차 핵산 분자는 적어도 2개의 도메인을 포함한다. 제1 도메인은 이차 핵산 분자에 결합할 수 있다. 삼차 핵산의 제2 도메인은 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합할 수 있다. 삼차 핵산의 제2 도메인은 하나 이상의 형광 표지된 뉴클레오타이드 모노머를 삼차 핵산의 제2 도메인의 서열 내로 직접 혼입함으로써 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합될 수 있다. 이차 핵산 분자의 제2 도메인은 표지된 짧은 폴리뉴클레오타이드를 이차 핵산의 제2 도메인에 혼성화시킴으로써 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 의해 결합될 수 있다. "표지된 올리고"로 불리는 이들 짧은 폴리뉴클레오타이드는 형광 표지된 뉴클레오타이드 모노머의 직접 혼입에 의해 또는 당업자에게 알려진 핵산을 표지화하는 다른 방법에 의해 표지화될 수 있다. "표지된 올리고"로 간주될 수 있는 도 4에 도시된 예시적인 삼차 핵산 분자는 이차 핵산 분자에 혼성화하는 제1 도메인 및 예를 들어, NHS 화학을 이용한 올리고뉴클레오타이드 합성 동안 표지의 간접 부착 또는 삼차 핵산 분자의 합성 동안 하나 이상의 형광 표지된 뉴클레오타이드 모노머의 혼입에 의해 형광 표지된 제2 도메인을 포함한다. 표지된 올리고는 DNA, RNA 또는 PNA일 수 있다.
대안적인 양태에서, 이차 핵산의 제2 도메인은 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합할 수 있다. 이차 핵산의 제2 도메인은 하나 이상의 형광 표지된 뉴클레오타이드 모노머를 이차 핵산의 제2 도메인의 서열 내로 직접 혼입함으로써 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 결합될 수 있다. 이차 핵산 분자의 제2 도메인은 표지된 짧은 폴리뉴클레오타이드를 이차 핵산의 제2 도메인에 혼성화시킴으로써 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 의해 결합될 수 있다. 표지된 올리고로 불리는 이들 짧은 폴리뉴클레오타이드는 형광 표지된 뉴클레오타이드 모노머의 직접 혼입에 의해 또는 당업자에게 알려진 핵산을 표지화하는 다른 방법에 의해 표지화될 수 있다.
일차 핵산 분자는 약 100개, 약 95개, 약 90개, 약 85개, 약 80개 또는 약 75개 뉴클레오타이드를 포함할 수 있다. 일차 핵산 분자는 약 100개 내지 약 80개 뉴클레오타이드를 포함할 수 있다. 일차 핵산 분자는 약 90개 뉴클레오타이드를 포함할 수 있다. 이차 핵산 분자는 약 90개, 약 85개, 약 80개, 약 75개 또는 약 70개 뉴클레오타이드를 포함할 수 있다. 이차 핵산 분자는 약 90개 내지 약 80개 뉴클레오타이드를 포함할 수 있다. 이차 핵산 분자는 약 87개 뉴클레오타이드를 포함할 수 있다. 이차 핵산 분자는 약 25개, 약 20개, 약 15개, 또는 약 10개 뉴클레오타이드를 포함할 수 있다. 삼차 핵산 분자는 약 20개 내지 약 10개 뉴클레오타이드를 포함할 수 있다. 삼차 핵산 분자는 약 15개 뉴클레오타이드를 포함할 수 있다.
본 발명의 리포터 프로브는 다양한 디자인일 수 있다. 예를 들어, 일차 핵산 분자는 적어도 1개(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 이차 핵산 분자에 혼성화될 수 있다. 각각의 이차 핵산 분자는 적어도 1개(예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상)의 삼차 핵산 분자에 혼성화될 수 있다. 특정 이중 색상 조합으로 표지된 리포터 프로브를 생성하기 위해, 리포터 프로브는 특정 이중 색상 조합의 각각의 색상으로 표지된 이차 핵산 분자, 삼차 핵산 분자, 표지된 올리고 또는 이차 핵산 분자, 삼차 핵산 분자 및 표지된 올리고의 임의의 조합을 포함하도록 디자인된다. 예를 들어, 도 4는 색상 1에 대해 15개의 염료 및 색상 2에 대해 15 염료를 갖는, 30개의 총 염료를 포함하는 본 발명의 리포터 프로브를 도시한다. 상이한 형광 염료 사이의 색상 교환(swapping) 또는 교차 혼성화를 방지하기 위해, 특정 표지 또는 형광 염료에 결합된 각각의 삼차 핵산 또는 표지된 올리고는 특유의 뉴클레오타이드 서열을 포함한다.
도 5는 본 발명의 4개의 예시적인 리포터 프로브 디자인를 도시한다. 도 5의 상부 좌측 패널은 5x5 리포터 프로브를 도시한다. 5x5 리포터 프로브는 일차 핵산을 포함하며, 일차 핵산은 12개 뉴클레오타이드의 제1 도메인을 포함한다. 일차 핵산은 또한 제2 도메인을 포함하며, 제2 도메인은 5개의 이차 핵산 분자에 혼성화될 수 있는 뉴클레오타이드 서열을 포함한다. 각각의 이차 핵산은 검출 가능한 표지에 의해 결합된 5개의 삼차 핵산이 각각의 이차 핵산에 혼성화할 수 있도록 뉴클레오타이드 서열을 포함한다.
도 5의 상부 우측 패널은 4x3 리포터 프로브를 도시한다. 4x3 리포터 프로브는 일차 핵산을 포함하며, 일차 핵산은 12개 뉴클레오타이드의 제1 도메인을 포함한다. 일차 핵산은 또한 제2 도메인을 포함하며, 제2 도메인은 4개의 이차 핵산 분자에 혼성화될 수 있는 뉴클레오타이드 서열을 포함한다. 각각의 이차 핵산은 검출 가능한 표지에 결합된 3개의 삼차 핵산이 각각의 이차 핵산에 혼성화할 수 있도록 뉴클레오타이드 서열을 포함한다.
도 5의 하부 좌측 패널은 3x4 리포터 프로브를 도시한다. 3x4 리포터 프로브는 일차 핵산을 포함하며, 일차 핵산은 12개 뉴클레오타이드의 제1 도메인을 포함한다. 일차 핵산은 또한 제2 도메인을 포함하며, 제2 도메인은 3개의 이차 핵산 분자에 혼성화될 수 있는 뉴클레오타이드 서열을 포함한다. 각각의 이차 핵산은 검출 가능한 표지에 결합된 4개의 삼차 핵산이 각각의 이차 핵산에 혼성화할 수 있도록 뉴클레오타이드 서열을 포함한다.
도 5의 하부 우측 패널은 스페이서 3x4 리포터 프로브를 도시한다. 스페이서 3x4 리포터 프로브는 일차 핵산을 포함하며, 일차 핵산은 12개 뉴클레오타이드의 제1 도메인을 포함한다. 일차 핵산의 제1 도메인과 제2 도메인 사이에 위치한 것은 20 내지 40개 뉴클레오타이드로 구성되는 스페이서 영역이다. 스페이서는 20 내지 40개 뉴클레오타이드 길이로서 확인되지만; 스페이서의 길이는 비제한적이며, 20개 뉴클레오타이드보다 짧거나 40개 뉴클레오타이드보다 길 수 있다. 일차 핵산의 제2 도메인은 3개의 이차 핵산 분자에 혼성화할 수 있는 뉴클레오타이드 서열을 포함한다. 각각의 이차 핵산은 검출 가능한 표지에 결합된 4개의 삼차 핵산이 각각의 이차 핵산에 혼성화할 수 있도록 뉴클레오타이드 서열을 포함한다.
도 5에서, 각각의 일차 핵산은 12개 뉴클레오타이드 길이의 제1 도메인을 포함한다. 그러나, 일차 핵산의 제1 도메인의 길이는 제한되지 않으며, 12개 뉴클레오타이드보다 적거나 12개 뉴클레오타이드보다 많을 수 있다. 바람직하게는, 일차 핵산의 제1 도메인은 14개 뉴클레오타이드이다.
도 5의 특정 패널에 도시된 특정 리포터 프로브 디자인의 임의의 특징은 도 5의 상이한 패널에 도시되거나 본원의 다른 곳에 기재된 리포터 프로브 디자인의 임의의 특징과 조합될 수 있다. 예를 들어, 5x5 리포터 프로브는 상보적 핵산 및 일차 핵산 사이에 약 20 내지 40개 뉴클레오타이드의 스페이서 영역을 함유하도록 변형될 수 있다. 또 다른 예에서, 4x3 리포터 프로브는 4개의 이차 핵산이 검출 가능한 표지에 결합된 5개의 삼차 핵산이 각각의 이차 핵산에 혼성화하는 것을 허용하는 뉴클레오타이드 서열을 포함하도록 변형되어, 4x5 리포터 프로브를 생성할 수 있다.
도 5를 참조하면, 5x5 리포터는 4x3 리포터(12)보다 더 많은 형광 표지(25)를 함유하므로, 5x5 리포터의 형광 강도는 더 클 것이다. 임의의 주어진 시야 FOV에서 검출된 형광은 상기 FOV 내에서 주어진 리포터 프로브의 형광 강도 및 선택적으로 결합된 표적 분자의 수를 포함하는 다양한 변수의 함수이다. 시야(FOV)당 선택적으로 결합된 표적 분자의 수는 FOV당 100만 내지 250만 개 표적일 수 있다. FOV당 결합된 표적 분자의 전형적인 수는 20,000 내지 40,000, 220,000 내지 440,000 또는 100만 내지 200만 개 표적 분자이다. 전형적인 FOV는 .05 mm2 내지 1mm2이다. 전형적인 FOV의 추가의 예는 .05 mm2 내지 .65mm2이다.
도 6은 삼차 핵산 분자에 혼성화되지 않고 일차 핵산 분자의 말단인 "여분 핸들(extra-handle)"을 이차 핵산 분자가 포함하는 리포터 프로브 디자인을 나타낸다. 도 6에서, 각각의 "여분 핸들"은 12개 뉴클레오타이드 길이("12 머")이나; 이들의 길이는 제한되지 않으며, 12개 뉴클레오타이드보다 작거나 12개 뉴클레오타이드보다 클 수 있다. "여분 핸들"은 각각 이차 핵산 분자가 혼성화되는 일차 핵산 분자의 제1 도메인의 뉴클레오타이드 서열을 포함할 수 있다. 따라서, 리포터 프로브가 "여분 핸들"을 포함하는 경우, 리포터 프로브는 일차 핵산 분자의 제1 도메인을 통해 또는 "여분 핸들"을 통해 시퀀싱 프로브에 혼성화할 수 있다. 따라서, 리포터 프로브가 시퀀싱 프로브에 결합할 가능성은 증가한다. "여분 핸들" 디자인은 또한 혼성화 동역학을 개선할 수 있다. 임의의 이론에 구애되지 않으면서, "여분 핸들"은 리포터 프로브의 상보적 핵산의 유효 농도를 증가시킬 수 있다. 5x4 "여분 핸들" 리포터 프로브는 표준 FOV당 약 4750개의 형광 카운트를 산출할 것으로 예상된다. 5x3 "여분 핸들" 리포터 프로브, 4x4 "여분 핸들" 리포터 프로브, 4x3 "여분 핸들" 리포터 프로브 및 3x4 "여분 핸들" 리포터 프로브는 모두 표준 FOV당 약 6000개 형광 카운트를 산출할 것으로 예상된다. 도 5에 도시된 예시적인 리포터 프로브 디자인은 또한 "여분 핸들"을 포함하도록 변형될 수 있다.
리포터 프로브의 개별적인 이차 핵산 분자는 모두 동일한 검출 가능한 표지로 표지된 삼차 핵산 분자에 혼성화할 수 있다. 예를 들어, 도 7의 좌측 패널은 "5x6" 리포터 프로브를 도시한다. 5x6 리포터 프로브는 제2 도메인을 포함하는 하나의 일차 핵산을 포함하며, 제2 도메인은 6개의 이차 핵산 분자에 혼성화된 뉴클레오타이드 서열을 포함한다. 각각의 이차 핵산은 검출 가능한 표지에 결합된 5개의 삼차 핵산 분자가 각각의 이차 핵산에 혼성화되도록 뉴클레오타이드 서열을 포함한다. 특정 이차 핵산 분자에 결합하는 5개의 삼차 핵산 분자 각각은 동일한 검출 가능한 표지로 표지된다. 예를 들어, 이차 핵산 분자 중 3개는 황색 형광 염료로 표지된 삼차 핵산 분자에 결합하고, 다른 3개의 이차 핵산은 적색 형광 염료로 표지된 삼차 핵산 분자에 결합한다.
리포터 프로브의 개별적인 이차 핵산 분자는 상이한 검출 가능한 표지로 표지된 삼차 핵산 분자에 혼성화할 수 있다. 예를 들어, 도 7의 중간 패널은 "3x2x6" 리포터 프로브 디자인을 도시한다. "3x2x6" 리포터 프로브는 제2 도메인을 포함하는 하나의 일차 핵산을 포함하며, 제2 도메인은 6개의 이차 핵산 분자에 혼성화된 뉴클레오타이드 서열을 포함한다. 각각의 이차 핵산은 검출 가능한 표지에 결합된 5개의 삼차 핵산이 각각의 이차 핵산에 혼성화되도록 뉴클레오타이드 서열을 포함한다. 각각의 이차 핵산은 황색 형광 염료로 표지된 삼차 핵산 분자 및 적색 형광 염료로 표지된 삼차 핵산 분자 모두에 결합한다. 이 특정 예에서, 3개의 이차 핵산 분자는 2개의 적색 및 3개의 황색 삼차 핵산 분자에 결합하는 반면, 다른 3개의 이차 핵산 분자는 2개의 적색 및 3개의 황색 삼차 핵산 분자에 결합한다. 각각의 이차 핵산 분자는 상이한 검출 가능한 표지에 의해 결합된 임의의 수의 삼차 핵산 분자에 결합할 수 있다. 도 7의 중간 패널에서, 개별적인 이차 핵산 분자에 결합된 삼차 핵산 분자는 표지의 색상이 교대되도록(즉, 적색-황색-적색-황색-적색 또는 황색-적색-황색-적색-황색) 배열된다.
기재된 리포터 프로브 디자인 중 어느 것에서, 상이한 검출 가능한 표지로 표지된 삼차 핵산은 이차 핵산을 따라 임의의 순서로 배열될 수 있다. 예를 들어, 도 7의 우측 패널은 각각의 이차 핵산 분자를 따라 적색 및 황색 삼차 핵산 분자의 배열(예컨대, 선형 순서 또는 분류)을 제외하면 3x2x6 리포터 프로브 디자인와 유사한 "Fret 내성 3x2x6" 리포터 프로브를 도시한다.
도 8은 다양한 삼차 핵산 분자에 결합하는 개별적인 이차 핵산 분자를 포함하는 본 발명의 보다 예시적인 리포터 프로브 디자인을 도시한다. 좌측 패널은 1개의 일차 핵산 분자를 포함하는 "6x1x4.5" 리포터 프로브를 도시하며, 여기서 일차 핵산 분자는 제2 도메인을 포함하고, 제2 도메인은 6개의 이차 핵산 분자에 혼성화된 뉴클레오타이드 서열을 포함한다. 각각의 이차 핵산 분자는 5개의 삼차 핵산 분자에 혼성화된다. 각각의 이차 핵산 분자에 혼성화하는 5개의 삼차 핵산 분자 중 4개는 동일한 색상 검출 가능한 표지로 직접 표지된다. 분지화 삼차 핵산으로 표시된 제5 삼차 핵산은 이중 색상 조합의 다른 색상의 5개의 표지된 올리고에 결합된다. 6개의 이차 핵산 중에서, 이들 중 3개는 이중 색상 조합의 하나의 색상(이 예에서 적색)으로 표지된 분지화 삼차 핵산에 결합하는 반면, 다른 3개의 이차 핵산은 이중 색상 조합의 다른 색상(이 예에서 황색)으로 표지된 분지화 삼차 핵산에 결합한다. 전체적으로, 6x1x4.5 리포터 프로브는 각각의 색상에 대해 27개의 염료인 54개의 총 염료로 표지된다. 도 8의 중간 패널은 4x1x4.5 리포터 프로브의 일차 핵산이 4개의 이차 핵산에만 결합하여 각각의 색상에 대해 18개씩 총 36개의 염료가 있는 것을 제외하면, 6x1x4.5 리포터 프로브와 동일한 전체 구조를 공유하는 "4x1x4.5" 리포터 프로브를 도시한다.
리포터 프로브는 이중 색상 조합의 각각의 색상에 대해 동일한 수의 염료를 포함할 수 있다. 리포터 프로브는 이중 색상 조합의 각각의 색상에 대해 상이한 수의 염료를 포함할 수 있다. 어느 색상이 리포터 프로브 내에서 더 많은 염료를 갖는지에 관한 선택은 2개의 염료가 흡수하는 빛의 에너지 수준에 기초하여 이뤄질 수 있다. 예를 들어, 도 8의 우측 패널은 "5x5 에너지 최적화된" 리포터 프로브 디자인을 도시한다. 이 리포터 프로브 디자인은 15개의 황색 염료(더 높은 에너지임) 및 10개의 적색 염료(더 낮은 에너지임)를 포함한다. 이 예에서, 15개 황색 염료는 제1 표지를 구성할 수 있고, 10개의 적색 염료는 제2 표지를 구성할 수 있다.
검출 가능한 모이어티, 표지 또는 리포터는 형광 모이어티, 비색 모이어티 등과 같은 검출 가능한 모이어티의 직접 또는 간접 부착을 포함하는 다양한 방식으로 이차 핵산 분자, 삼차 핵산 분자 또는 표지된 올리고에 결합될 수 있다. 당업자는 핵산을 표지하는 것에 관한 참고문헌을 참조할 수 있다. 형광 모이어티의 예는, 비제한적으로, 황색 형광 단백질(YFP), 녹색 형광 단백질(GFP), 시안 형광 단백질(CFP), 적색 형광 단백질(RFP), 움벨리페론(umbelliferone), 플루오레세인, 플루오레세인 이소티오시아네이트, 로다민, 디클로로트리아지닐아민 플루오레세인, 시아닌, 단실 클로라이드, 피코시아닌, 피코에리트린 등을 포함한다.
형광 표지 및 이들의 뉴클레오타이드 및/또는 올리고뉴클레오타이드에의 부착은 문헌[Haugland, Handbook of Fluorescent Probes and Research Chemicals, Ninth Edition (Molecular Probes, Inc., Eugene, 2002); Keller and Manak, DNA Probes, 2nd Edition (Stockton Press, New York, 1993); Eckstein, editor, Oligonucleotides and Analogues: A Practical Approach (IRL Press, Oxford, 1991); 및 Wetmur, Critical Reviews in Biochemistry and Molecular Biology, 26:227-259 (1991)]을 포함하는 많은 검토에 기재되어 있다. 본 발명에 적용가능한 특정 방법은 하기 참고 견본에 개시되어 있다: 미국 특허 제4,757,141호; 제5,151,507호; 및 제5,091,519호. 하나 이상의 형광 염료는 미국 특허 제5,188,934호(4,7-디클로로플루오레세인 염료); 제5,366,860호(스펙트럼적으로 분해가능한 로다민 염료); 제5,847,162호(4,7-디클로로로다민 염료); 제4,318,846호(에테르 치환된 플루오레세인 염료); 제5,800,996호(에너지 전달 염료); Lee et al. 제5,066,580호(잔틴 염료); 제5,688,648호(에너지 전달 염료); 등에 개시된 바와 같이 표지된 표적 서열을 위한 표지로서 사용될 수 있다. 표지화는 또한 하기 특허 및 특허 공개에 개시된 바와 같이 양자점을 이용하여 수행될 수 있다: 미국 특허 제6,322,901호; 제6,576,291호; 제6,423,551호; 제6,251,303호; 제6,319,426호; 제6,426,513호; 제6,444,143호; 제5,990,479호; 제6,207,392호; 제2002/0045045호; 및 제2003/0017264호. 본원에 사용된 바와 같이, 용어 "형광 표지"는 하나 이상의 분자의 형광 흡수 및/또는 방출 특성을 통해 정보를 전달하는 신호전달 모이어티를 포함한다. 이러한 형광 특성은 형광 강도, 형광 수명, 방출 스펙트럼 특징, 에너지 전달 등을 포함한다.
뉴클레오타이드 및/또는 올리고뉴클레오타이드 서열 내로 쉽게 혼입되는 상업적으로 이용가능한 형광 뉴클레오타이드 유사체는, 비제한적으로, Cy3-dCTP, Cy3-dUTP, Cy5-dCTP, Cy5-dUTP(Amersham Biosciences, Piscataway, NJ), 플루오레세인-12-dUTP, 테트라메틸로다민-6-dUTP, 텍사스 레드(TEXAS RED)™-5-dUTP, 카스케이드 블루(CASCADE BLUE)™-7-dUTP, 보디피(BODIPY) TMFL-14-dUTP, 보디피 TMR-14-dUTP, 보디피 TMTR-14-dUTP, 로다민 GREEN™-5-dUTP, 오레곤 그린(OREGON GREEN)™ 488-5-dUTP, 텍사스 레드™-12-dUTP, 보디피 TM 630/650-14-dUTP, 보디피 TM 650/665-14-dUTP, 알렉사 플루오르(ALEXA FLUOR)™ 488-5-dUTP, 알렉사 플루오르™ 532-5-dUTP, 알렉사 플루오르™ 568-5-dUTP, 알렉사 플루오르™ 594-5-dUTP, 알렉사 플루오르™ 546-14-dUTP, 플루오레세인-12-UTP, 테트라메틸로다민-6-UTP, 텍사스 레드™-5-UTP, mCherry, 카스케이드 블루™-7-UTP, 보디피 TM FL-14-UTP, 보디피 TMR-14-UTP, 보디피 TM TR-14-UTP, 로다민 GREEN™-5-UTP, 알렉사 플루오르™ 488-5-UTP, 알렉사 플루오르™ 546-14-UTP(Molecular Probes, Inc. Eugene, OR) 등을 포함한다. 대안적으로, 상기 형광단 및 본원에 언급된 것들은 예를 들어 포스포로아미다이트 또는 NHS 화학을 이용한 올리고뉴클레오타이드 합성 동안 첨가될 수 있다. 다른 형광단을 갖는 뉴클레오타이드의 맞춤형 합성을 위한 프로토콜은 당업계에 공지되어 있다(Henegariu et al. (2000) Nature Biotechnol. 18:345 참고). 2-아미노퓨린은 합성 동안 올리고뉴클레오타이드 서열에 직접 혼입될 수 있는 형광 염기이다. 핵산은 또한, 선험적으로, DAPI, YOYO-1, 브롬화 에티듐, 시아닌 염료(예컨대, SYBR GREEN) 등과 같은 인터컬레이팅 염료로 염색될 수 있다.
합성후 부착에 이용가능한 다른 형광단은, 비제한적으로, 알렉사 플루오르™ 350, 알렉사 플루오르™ 405, 알렉사 플루오르™ 430, 알렉사 플루오르™ 532, 알렉사 플루오르™ 546, 알렉사 플루오르™ 568, 알렉사 플루오르™ 594, 알렉사 플루오르™ 647, 보디피 493/503, 보디피 FL, 보디피 R6G, 보디피 530/550, 보디피 TMR, 보디피 558/568, 보디피 558/568, 보디피 564/570, 보디피 576/589, 보디피 581/591, 보디피 TR, 보디피 630/650, 보디피 650/665, 카스케이드 블루, 카스케이드 옐로우(Cascade Yellow), 단실(Dansyl), 리사민(lissamine) 로다민 B, 마리나 블루(Marina Blue), 오레곤 그린 488, 오레곤 그린 514, 퍼시픽 블루(Pacific Blue), 퍼시픽 오렌지(Pacific Orange), 로다민 6G, 로다민 그린, 로다민 레드, 테르라메틸 로다민, 텍사스 레드(Molecular Probes, Inc., Eugene, OR로부터 이용가능함), Cy2, Cy3, Cy3.5, Cy5, Cy5.5, Cy7(Amersham Biosciences, Piscataway, NJ) 등을 포함한다. 비제한적으로, PerCP-Cy5.5, PE-Cy5, PE-Cy5.5, PE-Cy7, PE-텍사스 레드, APC-Cy7, PE-알렉사 염료(610, 647, 및 680), APC-알렉사 염료 등을 포함하는 FRET 탠덤(tandem) 형광단이 또한 사용될 수 있다.
금속성 은 또는 금 입자는 형광 표지된 뉴클레오타이드 및/또는 올리고뉴클레오타이드 서열로부터의 신호를 향상시키는데 사용될 수 있다(Lakowicz et al. (2003) BioTechniques 34:62).
올리고뉴클레오타이드 서열을 위한 다른 적합한 표지는 플루오레세인(FAM, FITC), 디곡시게닌, 디니트로페놀(DNP), 단실, 바이오틴, 브로모데옥시우리딘(BrdU), 헥사히스티딘(6xHis), 포스포르-아미노산(예컨대, P-tyr, P-ser, P-thr) 등을 포함할 수 있다. 하기 합텐/항체 쌍은 검출에 사용될 수 있으며, 여기서 각각의 항체는 검출 가능한 표지로 유도체화된다: 바이오틴/a-바이오틴, 디곡시게닌/a-디곡시게닌, 디니트로페놀(DNP)/a-DNP, 5-카르복시플루오레세인(FAM)/a-FAM.
본원에 기재된 검출 가능한 표지는 스펙트럼적으로 분해가능하다. 복수의 형광 표지와 관련하여 "스펙트럼적으로 분해가능한"은 표지의 형광 방출 밴드가 충분히 뚜렷하다는 것, 즉 충분히 비중첩되는 것, 각각의 표지가 부착된 분자 태그가 미국 특허 제4,230,558호; 제4,811,218호; 등, 또는 문헌[Wheeless et al., pgs. 21-76, in Flow Cytometry: Instrumentation and Data Analysis (Academic Press, New York, 1985)]에 기재된 시스템에 의해 예시된 바와 같이, 예컨대 밴드 패스 필터 및 광전자 배증관 등의 시스템을 사용하는 표준 광검출 시스템에 의해 각각의 표지에 의해 생성된 형광 신호에 기초하여 구별될 수 있다는 것을 의미한다. 플루오레세인, 로다민 등과 같은 스펙트럼적으로 분해가능한 유기 염료는 파장 방출 최대가 적어도 20 nm 이격되어 있고, 또 다른 양태에서, 적어도 40 nm 이격되어 있다는 것을 의미한다. 킬레이트화된 란탄 화합물, 양자점 등의 경우, 스펙트럼적으로 분해가능하다는 것은 파장 방출 최대가 적어도 10 nm 이격되거나, 또는 적어도 15 nm 이격되어 있다는 것을 의미한다.
리포터 프로브는 하나 이상의 절단 가능한 링커 변형을 포함할 수 있다. 하나 이상의 절단 가능한 링커 변형은 리포터 프로브 내의 어디든지 위치할 수 있다. 절단 가능한 링커 변형은 리포터 프로브의 일차 핵산 분자의 제1 도메인과 제2 도메인 사이에 위치할 수 있다. 도 9는 일차 핵산 분자의 제1 도메인과 제2 도메인 사이에 절단 가능한 링커 변형을 포함하는 본 발명의 예시적인 리포터 프로브를 도시한다. 절단 가능한 링커 변형은 리포터 프로브의 이차 핵산 분자의 제1 도메인과 제2 도메인 사이에 존재할 수 있다. 절단 가능한 링커 변형은 리포터 프로브의 일차 핵산 분자 및 이차 핵산 분자의 제1 도메인과 제2 도메인 사이에 존재할 수 있다. 도 10의 좌측 패널은 일차 핵산의 제1 도메인과 제2 도메인 사이 및 이차 핵산의 제1 도메인과 제2 도메인 사이에 절단 가능한 링커 변형을 포함하는 본 발명의 예시적인 리포터 프로브를 도시한다.
절단 가능한 링커 변형은 식 (I)의 화합물:
Figure 112020129306748-pat00006
또는 이의 입체이성질체 또는 염일 수 있고, 여기서 R1은 수소, 할로겐, C1-6알킬, C2-6알케닐, C2-6알키닐이고, 상기 C1-6알킬, C2-6알케닐, C2-6알키닐은 각각 독립적으로 선택적으로 적어도 1개의 치환기 R10으로 치환되며; R2는 O, NH, 또는 N(C1-6알킬)이고; R3은 각각 선택적으로 적어도 1개의 치환기 R10으로 치환된 사이클로알킬, 헤테로사이클로알킬, 아릴, 또는 헤테로아릴이며; 각각의 R4 및 R7은 독립적으로 C1-6알킬, C2-6알케닐, C2-6알키닐이고, 상기 C1-6알킬, C2-6알케닐, C2-6알키닐은 각각 독립적으로 선택적으로 적어도 1개의 치환기 R10으로 치환되며; R5 및 R9는 각각 선택적으로 적어도 1개의 치환기 R10으로 치환된 각각 독립적으로 사이클로알킬, 헤테로사이클로알킬, 아릴, 또는 헤테로아릴이고; R6은 O, NH 또는 N(C1-6알킬)이며; R8은 O, NH, 또는 N(C1-6알킬)이고; 각각의 R10은 독립적으로 수소, 할로겐, -C1-6알킬, -C2-6알케닐, -C2-6알키닐, 할로C1-6알킬, 할로C2-6알케닐, 할로C2-6알키닐, 사이클로알킬, 헤테로사이클릴, 아릴, 헤테로아릴, -CN, -NO2, 옥소, -OR11, -SO2R11, -SO3 -, -COR11, -CO2R11, -CONR11R12, -C(=NR11)NR12R13, -NR11R12, -NR12COR12, -NR11CONR12R13, -NR11CO2R12, -NR11SONR12R13, -NR11SO2NR12R13, 또는 -NR11SO2R12이며; 동일하거나 상이할 수 있는 R11, R12, 및 R13은 각각 독립적으로 수소, -C1-6알킬, -C2-6알케닐, -C2-6알키닐, 할로C1-6알킬, 할로C2-6알케닐, 할로C2-6알키닐, C1-6알킬옥시C1-6알킬-, 사이클로알킬, 헤테로사이클릴, 아릴, 또는 헤테로아릴이다.
일 양태에서, R1은 C1-6알킬, 바람직하게는 C1-3알킬, 예컨대 메틸, 에틸, 프로필 또는 이소프로필이고; R2는 NH 또는 N(C1-6알킬)이며; R3은 5- 내지 6-원 사이클로알킬, 바람직하게는 사이클로헥실이고; R4는 C1-6알킬, 바람직하게는 C1-3알킬렌, 예컨대 메틸렌, 에틸렌, 프로필렌, 또는 이소프로필렌이며; R5는 1개의 질소 원자 및 N, O 및 S로부터 선택된 0 또는 1개의 추가적인 헤테로원자를 포함하는 5- 내지 6-원 헤테로사이클릴이고, 상기 헤테로사이클릴은 선택적으로 1개 또는 2개의 R10으로 치환되며; R6은 O이고; R7은 C1-6알킬, 바람직하게는 C1-3알킬렌, 예컨대 메틸렌, 에틸렌, 프로필렌, 또는 이소프로필렌이며; R8은 O이고; R9는 1개의 질소 원자 및 N, O 및 S로부터 선택된 0 또는 1개의 추가적인 헤테로원자를 포함하는 5- 내지 6-원 헤테로사이클릴이며, 상기 헤테로사이클릴은 선택적으로 1개 또는 2개의 R10으로 치환되고; 각각의 R10은 독립적으로 할로겐, C1-6알킬, 할로C1-6알킬, 옥소, -SO2H, 또는 -SO3 -이다.
일 양태에서, R3은 사이클로헥실이고, R4는 메틸렌이며, R5는 1H-피롤-2,5-디온이고, R9는 선택적으로 SO3 -으로 치환된 피롤리딘-2,5-디온이다.
링커 화합물은
Figure 112020129306748-pat00007
또는 이의 입체이성질체 또는 염일 수 있다.
링커 화합물은
Figure 112020129306748-pat00008
또는 이의 입체이성질체 또는 염일 수 있다.
링커 화합물 또는 링커 변형은
Figure 112020129306748-pat00009
,
Figure 112020129306748-pat00010
일 수 있다.
링커 화합물 또는 링커 변형은
Figure 112020129306748-pat00011
Figure 112020129306748-pat00012
일 수 있다.
리포터 프로브는 3개의 스톡 용액을 물과 혼합함으로써 조립될 수 있다. 하나의 스톡 용액은 일차 핵산 분자를 함유하고, 하나의 스톡 용액은 이차 핵산 분자를 함유하며, 마지막 스톡 용액은 삼차 핵산 분자를 함유한다. 표 2는 특정 리포터 프로브 디자인을 조립하기 위해 혼합될 수 있는 각각의 스톡 용액의 예시적인 양을 도시한다.
Figure 112020129306748-pat00013
표적 핵산
본 발명은 본원에 개시된 시퀀싱 프로브를 사용하여 핵산을 시퀀싱하는 방법을 제공한다. 본 발명의 방법을 사용하여 시퀀싱하고자 하는 핵산은 본원에서 "표적 핵산"으로 지칭된다. 용어 "표적 핵산"은 본 발명의 프로브, 방법, 및 장치에 의해 서열이 결정될 핵산 분자(DNA, RNA, 또는 PNA)를 의미할 것이다. 일반적으로, 용어 "표적 핵산", "표적 핵산 분자,", "표적 핵산 서열," "표적 핵산 단편," "표적 올리고뉴클레오타이드" 및 "표적 폴리뉴클레오타이드"는 상호교환적으로 사용되며, 비제한적으로, 다양한 길이를 가질 수 있는 뉴클레오타이드 폴리머성 형태인 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드, 또는 이의 유사체를 포함하는 것으로 의도된다. 핵산의 비제한적인 예는 유전자, 유전자 단편, 엑손, 인트론, 유전자간 DNA(비제한적으로, 헤테로크로마틱 DNA를 포함), 메신저 RNA(mRNA), 전달 RNA, 리보솜 RNA, 리보자임, 작은 간섭 RNA(siRNA), 비코딩 RNA(ncRNA), cDNA, 재조합 폴리뉴클레오타이드, 분지된 폴리뉴클레오타이드, 플라스미드, 벡터, 서열의 단리된 DNA, 서열의 단리된 RNA, 핵산 프로브, 및 프라이머를 포함한다. 본 발명의 방법을 사용하여 시퀀싱하기 전에, 표적 핵산의 정체 및/또는 서열은 공지되어 있다. 대안적으로, 정체 및/또는 서열은 공지되어 있지 않다. 표적 핵산의 서열의 부분은 본 발명의 방법을 사용하여 시퀀싱하기 전에 공지되어 있을 수도 있다. 예를 들어, 방법은 공지된 표적 핵산 분자에서 점 돌연변이를 결정하는 것에 관한 것일 수 있다.
본 발명의 방법은 샘플, 예컨대 유기체로부터의 샘플로부터 얻은 핵산 분자를 직접, 그리고, 바람직하게는, 전환(또는 증폭) 단계 없이 시퀀싱한다. 예로서, 직접 RNA 기반 시퀀싱의 경우, 본 발명의 방법은 서열이 수득되기 전에 RNA 분자의 DNA 분자로의 전환(즉, cDNA의 합성을 통해)을 필요로 하지 않는다. 증폭 또는 전환이 필요하지 않으므로, 본 발명에서 시퀀싱된 핵산은 핵산이 샘플 내에 있을 때 또는 핵산이 샘플로부터 수득되었을 때 핵산에 존재하는 임의의 특유의 염기 및/또는 후성 마커를 보유할 것이다. 이러한 특유의 염기 및/또는 후성 마커는 당업계에 공지된 시퀀싱 방법에서 소실된다.
본 방법은 단일 분자 분해능으로 시퀀싱하는데 사용될 수 있다. 다시 말해서, 본 방법은 사용자가 상이한 표적 핵산 분자로부터 데이터를 조합할 필요 없이, 단일 표적 핵산 분자로부터 수집된 데이터에 기초하여 최종 서열을 생성할 수 있게 하여, 상기 특정 표적의 임의의 특유의 특징을 보존한다.
표적 핵산은 핵산의 임의의 샘플 또는 공급원, 예컨대, 임의의 세포, 조직, 또는 유기체, 시험관내, 화학 합성기 등으로부터 수득될 수 있다. 표적 핵산은 임의의 당업계에 알려진 방법에 의해 수득될 수 있다. 핵산은 임상 대상의 혈액 샘플로부터 수득될 수 있다. 핵산은 당업계에 널리 공지된 방법 및 키트를 사용하여 공급원 또는 샘플로부터 추출, 단리, 또는 정제될 수 있다.
표적 핵산은 당업계에 공지된 임의의 수단에 의해 단편화될 수 있다. 바람직하게는, 단편화는 효소적 또는 기계적 수단에 의해 수행된다. 기계적 수단은 초음파처리 또는 물리적 전단일 수 있다. 효소적 수단은 뉴클레아제(예컨대, 데옥시리보뉴클레아제 I(DNase I)) 또는 하나 이상의 제한 엔도뉴클레아제를 이용한 절단에 의해 수행될 수 있다.
표적 핵산을 포함하는 핵산 분자가 온전한 염색체인 경우, 염색체의 단편화를 피하기 위한 조치가 이뤄져야 한다.
표적 핵산은 당업계에 널리 공지된 바와 같은 변형된 뉴클레오타이드 또는 핵산 유사체를 포함하는 천연 또는 비천연 뉴클레오타이드를 포함할 수 있다.
표적 핵산 분자는 최대 수백 킬로베이스 길이(예컨대 1, 2, 3, 4, 5, 10, 20, 30, 40, 50, 100, 200, 500개 이상의 킬로베이스)의 DNA, RNA, 및 PNA 분자를 포함할 수 있다.
캡처 프로브
표적 핵산은 기재에 고정화될 수 있다(예컨대, 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 위치에).
예시적인 유용한 기재는 리간드, 항원, 탄수화물, 핵산, 수용체, 렉틴, 및 항체로 이루어진 군으로부터 선택된 결합 모이어티를 포함하는 것을 포함한다. 캡처 프로브는 기재의 결합 모이어티와 결합할 수 있는 기재 결합 모이어티를 포함한다. 반응성 모이어티를 포함하는 예시적인 유용한 기재는, 비제한적으로, 에폭시, 알데히드, 금, 하이드라지드, 설프하이드릴, NHS-에스테르, 아민, 알킨, 아지드, 티올, 카르복실레이트, 말레이미드, 하이드록시메틸 포스핀, 이미도에스테르, 이소시아네이트, 하이드록실, 펜타플루오로페닐-에스테르, 소랄렌(psoralen), 피리딜 디설파이드 또는 비닐 설폰, 폴리에틸렌 글리콜(PEG), 하이드로겔, 또는 이의 혼합물을 포함하는 표면을 포함한다. 이러한 표면은 상업적인 공급원으로부터 수득될 수 있거나 또는 표준 기술에 따라 제조될 수 있다. 반응성 모이어티를 포함하는 예시적인 유용한 기재는, 비제한적으로, OptArray-DNA NHS 그룹(Accler8), Nexterion Slide AL(Schott) 및 Nexterion Slide E(Schott)를 포함한다.
기재는 표적 핵산을 고정화시킬 수 있는 당업계에 공지된 임의의 고체 지지체, 예컨대, 코팅된 슬라이드 및 마이크로플루이딕 디바이스일 수 있다. 기재는 표면, 막, 비드, 다공성 물질, 전극 또는 어레이일 수 있다. 기재는 예를 들어 폴리머성 물질, 금속, 실리콘, 유리 또는 석영일 수 있다. 표적 핵산은 당업자에게 명백한 임의의 기재 상에 고정화될 수 있다.
기재가 어레이인 경우, 기재는 웰을 포함할 수 있고, 이의 크기 및 간격은 부착될 표적 핵산 분자에 따라 달라진다. 일 예에서, 기재는 표적 핵산의 초고밀도 어레이가 부착되도록 제작된다. 기재 상의 표적 핵산의 어레이의 밀도의 예는 mm2당 500,000 내지 10,000,000개 표적 핵산 분자, mm2당 1,000,000 내지 4,000,000개 표적 핵산 분자 또는 mm2당 850,000 내지 3,500,000개 표적 핵산 분자를 포함한다.
기재 내의 웰은 표적 핵산 분자의 부착을 위한 위치이다. 웰의 표면은 표적 핵산 분자 상에 존재하는 특정 화학적 그룹을 끌어당기고 결합하는 상기 기재된 반응성 모이어티 또는 표적 핵산 분자를 끌어당기고, 고정시키고, 결합시키기 위해 표적 핵산 분자에 결합된 캡처 프로브로 기능화될 수 있다. 이들 작용기는 다양한 접합 화학을 통해 생체분자를 특이적으로 끌어당기고 결합시킬 수 있는 것으로 널리 알려져 있다.
어레이와 같은 기재 상에서 단일 핵산 분자 시퀀싱을 위해, 캡처 프로브의 기재 결합 모이어티에 상보적인 유니버설 캡처 프로브 또는 유니버설 서열이 각각의 웰에 부착된다. 그리고 나서, 캡처 프로브에 결합된 캡처 프로브의 기재 결합 모이어티에 상보적인 유니버설 캡처 프로브 또는 유니버설 서열에 단일 표적 핵산 분자가 결합되고, 시퀀싱이 시작될 수 있다.
표적 핵산은 하나 이상의 캡처 프로브(즉 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개 이상의 캡처 프로브)에 의해 결합될 수 있다. 캡처 프로브는 표적 핵산의 부분에 상보적인 도메인 및 기재 결합 모이어티를 포함하는 도메인을 포함한다. 캡처 프로브가 상보적인 표적 핵산의 부분은 표적 핵산의 말단이거나 말단을 향하지 않을 수 있다.
캡처 프로브의 기재 결합 모이어티는 바이오틴일 수 있고, 기재는 아비딘(예컨대, 스트렙타비딘)일 수 있다. 아비딘을 포함하는 유용한 기재는 상업적으로 이용가능하며, TB0200(Accelr8), SAD6, SAD20, SAD100, SAD500, SAD2000(Xantec), SuperAvidin(Array-It), 스트렙타비딘 슬라이드(catalog #MPC 000, Xenopore) 및 STREPTAVIDINnslide(catalog #439003, Greiner Bio-one)를 포함한다. 캡처 프로브의 기재 결합 모이어티는 아비딘(예컨대, 스트렙타비딘)일 수 있고, 기재는 바이오틴일 수 있다. 상업적으로 이용가능한 바이오틴을 포함하는 유용한 기재는, 비제한적으로, Optiarray-biotin(Accler8), BD6, BD20, BD100, BD500 및 BD2000(Xantec)을 포함한다.
캡처 프로브의 기재 결합 모이어티는 광활성화에 의해 기재에 결합될 수 있는 반응성 모이어티일 수 있다. 기재는 광반응성 모이어티를 포함할 수 있거나, 나노리포터(nanoreporter)의 제1 부분은 광반응성 모이어티를 포함할 수 있다. 광반응성 모이어티의 일부 예는 아릴 아지드, 예컨대 N((2-피리딜디티오)에틸)-4-아지도살리실아미드; 플루오르화된 아릴 아지드, 예컨대 4-아지도-2,3,5,6-테트라플루오로벤조산; 벤조페논계 시약, 예컨대 4-벤조일벤조산의 석신이미딜 에스테르; 및 5-브로모-데옥시우리딘을 포함한다.
캡처 프로브의 기재 결합 모이어티는 상보적인 기재의 결합 모이어티에 혼성화할 수 있는 핵산일 수 있다. 캡처 프로브의 기재 결합 모이어티를 포함하는 핵산 각각은 독립적으로 표준 염기 또는 변형된 뉴클레오타이드 또는 핵산 유사체일 수 있다. 캡처 프로브의 기재 결합 모이어티 내의 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개, 또는 적어도 6개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체일 수 있다. 캡처 프로브의 기재 결합 모이어티에서 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체 대 표준 염기의 전형적인 비율은 1:2 내지 1:8이다. 캡처 프로브의 기재 결합 모이어티에서 유용한 전형적인 변형된 뉴클레오타이드 또는 핵산 유사체는 이소구아닌 및 이소시토신이다.
캡처 프로브의 기재 결합 모이어티는 당업자에게 명백한 다른 결합 쌍을 통해 기재에 고정화될 수 있다. 기재에 결합 후, 표적 핵산을 연장하기에 충분한 힘(예컨대, 중력, 유체역학적 힘, 전자기력 "전기스트레칭(electrostreching)", 플로우-스트레칭(flow-stretching), 후진 메니스커스(receding meniscus) 기술, 및 이의 조합)을 가함으로써 표적 핵산이 신장될 수 있다. 캡처 프로브는 검출 가능한 표지, 즉, 기점 스팟을 포함하거나 이와 결합될 수 있다.
표적 핵산은 표적 핵산의 제2 부분에 상보적인 도메인을 포함하는 제2 캡처 프로브에 의해 결합될 수 있다. 제2 캡처 프로브에 의해 결합된 표적 핵산의 제2 부분은 제1 캡처 프로브에 의해 결합된 표적 핵산의 제1 부분과 상이하다. 부분은 표적 핵산의 말단일 수 있거나 말단을 향하지 않을 수 있다. 제2 캡처 프로브의 결합은 표적 핵산의 신장 후 또는 동안에 또는 신장되지 않은 표적 핵산에 발생할 수 있다. 제2 캡처 프로브는 상기 기재된 바와 같은 결합을 가질 수 있다.
표적 핵산은 표적 핵산의 제3, 제4, 제5, 제6, 제7, 제8, 제9 또는 제10 부분에 상보적인 도메인을 포함하는 제3, 제4, 제5, 제6, 제7, 제8, 제9 또는 제10 캡처 프로브에 의해 결합될 수 있다. 부분은 표적 핵산의 말단일 수 있거나 말단을 향하지 않을 수 있다. 제3, 제4, 제5, 제6, 제7, 제8, 제9 또는 제10 캡처 프로브의 결합은 표적 핵산의 신장 후 또는 동안에 또는 신장되지 않은 표적 핵산에 발생할 수 있다. 제3, 제4, 제5, 제6, 제7, 제8, 제9 또는 제10 캡처 프로브는 상기 기재된 바와 같은 결합을 가질 수 있다.
캡처 프로브는 샘플로부터 표적 핵산을 단리할 수 있다. 여기서, 표적 핵산을 포함하는 샘플에 캡처 프로브가 첨가된다. 캡처 프로브는 표적 핵산의 영역에 상보적인 캡처 프로브의 영역을 통해 표적 핵산에 결합한다. 표적 핵산이 캡처 프로브의 기재 결합 모이어티에 결합하는 모이어티를 포함하는 기재와 접촉할 때, 핵산은 기재 상에 고정화된다.
도 11은 본 발명의 2개의 캡처 프로브 시스템을 사용한 표적 핵산의 캡처를 나타낸다. 게놈 DNA는 95℃에서 변성되어 캡처 시약의 풀에 혼성화된다. 이러한 캡처 시약의 풀은 올리고뉴클레오타이드 프로브 A, 프로브 B, 및 안티센스 블록 프로브를 포함한다. 프로브 A는 프로브의 3' 말단에 바이오틴 모이어티 및 표적 핵산의 5' 말단에 상보적인 서열을 포함한다. 프로브 B는 프로브의 5' 말단에서 상자성 비드에 의해 결합될 수 있는 정제 결합 서열 및 표적 핵산의 3' 말단에 상보적인 뉴클레오타이드 서열을 포함한다. 안티센스 블록 프로브는 시퀀싱하고자 하는 표적 핵산의 부분의 안티센스 가닥에 상보적인 뉴클레오타이드 서열을 포함한다. 캡처 시약과 혼성화 후, 시퀀싱 윈도우가 혼성화된 프로브 A 및 프로브 B 사이에서 표적 핵산 상에 생성된다. 표적 핵산은 프로브 B의 5' 서열에 결합하는 상자성 비드를 사용하여 정제된다. 임의의 과량의 캡처 시약 또는 상보적인 안티센스 DNA 가닥이 씻겨 내려가 의도된 표적 핵산이 정제된다. 그 후, 정제된 표적 핵산이 스트렙타비딘과 같은 혼성화된 프로브 A 상의 바이오틴 모이어티에 결합할 수 있는 표면을 포함하는 유동 챔버를 통해 유동된다. 이것은 표적 핵산의 하나의 말단을 플로우 셀의 표면에 묶는다. 다른 말단을 캡처하기 위해, 표적 핵산이 플로우-스트레치되고 프로브 B의 정제 결합 서열에 상보적인 바이오티닐화된 프로브가 첨가된다. 프로브 B의 정제 결합 서열에 혼성화 시, 바이오티닐화된 프로브는 플로우 셀의 표면에 결합하여, 양 말단에서 신장되고 플로우 셀 표면에 결합되는 캡처된 표적 핵산 분자를 생성할 수 있다.
사용자가 높은 단편화된 샘플로부터 가능한 많은 표적 핵산 분자를 "캡처"하기 위해서, 각각 표적 핵산의 상이한 영역에 상보적인 복수의 캡처 프로브를 포함시키는 것이 도움이 된다. 예를 들어, 5' 말단 근처에서 표적 핵산의 영역에 상보적인 제1 풀, 표적 핵산의 중간에 있는 영역에 상보적인 제2 풀, 및 3' 말단 근처에서의 제3 풀인 캡처 프로브의 3개의 풀이 있을 수 있다. 이것은 표적 핵산당 "관심있는 n 영역(n-regions-of-interest)"으로 일반화될 수 있다. 이 예에서, 단편화된 표적 핵산의 각각의 개별적인 풀은 바이오틴 태그를 포함하는 캡처 프로브에 결합되거나 바이오틴 태그에 결합되었다. 투입 샘플의 1/n번째(여기서 n = 표적 핵산 내의 뚜렷한 영역의 수)가 각각의 풀 챔버에 대해 단리된다. 캡처 프로브는 관심있는 표적 핵산에 결합한다. 그리고 나서, 표적 핵산은 캡처 프로브의 바이오틴을 통해 기재에 부착된 아비딘 분자에 고정화된다. 선택적으로, 표적 핵산은, 예컨대, 유동 또는 정전기력을 통해 스트레치된다. 모든 n-풀은 동시에 스트레치되고 결합될 수 있거나, 또는, 완전히 스트레치된 분자의 수를 최대화하기 위해, 풀 1(가장 5' 영역을 캡처함)이 먼저 스트레치되고 결합될 수 있고; 그 다음 풀 2(표적 중간 영역을 캡처함)가 스트레치되고 결합될 수 있으며; 마지막으로, 풀 3이 스트레치되고 결합될 수 있다.
본 발명은 또한 사용자가 복수의 표적 핵산을 캡처하고 동시에 시퀀싱할 수 있게 해주며, 복수의 캡처 프로브는 표적 핵산의 혼합 샘플에 혼성화될 수 있다. 복수의 표적 핵산은 각각의 핵산이 동일한 서열을 함유하는 1개를 초과하는 핵산의 그룹, 또는 각각의 핵산이 반드시 동일한 서열을 함유하는 것은 아닌 1개를 초과하는 핵산의 그룹을 포함할 수 있다. 마찬가지로, 복수의 캡처 프로브는 서열이 동일한 1개를 초과하는 캡처 프로브의 그룹, 또는 서열이 반드시 동일한 것은 아닌 1개를 초과하는 캡처 프로브의 그룹을 포함할 수 있다. 예를 들어, 모두 동일한 서열을 함유하는 복수의 캡처 프로브를 사용하는 것은 사용자가 모두 동일한 서열을 함유하는 복수의 표적 핵산을 캡처하게 할 수 있다. 동일한 서열을 함유하는 이 복수의 표적 핵산을 시퀀싱함으로써, 데이터 중복으로 인해 더 높은 수준의 시퀀싱 정확도가 달성될 수 있다. 또 다른 예에서, 관심있는 2개 이상의 특정 유전자는 관심있는 각각의 유전자에 상보적인 캡처 프로브를 포함하는 캡처 프로브의 그룹을 사용하여 캡처되고 동시에 시퀀싱될 수 있다. 이것은 사용자가 특정 유전자의 멀티플렉스 시퀀싱을 수행할 수 있게 해준다. 도 12는 FFPE 샘플을 사용하여 100개의 표적으로 구성된 멀티플렉스 암 패널을 캡처하고 검출하기 위한 본 발명의 방법을 사용한 실험의 결과를 나타낸다.
완전한 시퀀싱 커버리지가 요구되는 경우, 필요한 뚜렷한 캡처 프로브의 수는 표적 핵산 단편의 크기에 반비례한다. 다시 말해서, 매우 단편화된 표적 핵산을 위해 더 많은 캡처 프로브가 필요할 것이다. 매우 단편화되고 분해된 표적 핵산을 갖는 샘플 유형(예컨대, 포르말린 고정된 파라핀 포매된 조직)의 경우, 캡처 프로브의 다수의 풀을 포함하는 것이 유용할 수 있다. 반면, 긴 표적 핵산 단편, 예컨대, 시험관내에서 얻은 단리된 핵산을 갖는 샘플의 경우, 5' 말단에 단일 캡처 프로브가 충분할 수 있다.
2개의 캡처 프로브 사이 또는 하나의 캡처 프로브 이후와 표적 핵산의 말단 이전의 표적 핵산의 영역은 본원에서 "시퀀싱 윈도우"로 지칭된다. 표적 핵산을 캡처하기 위해 2개의 캡처 프로브가 사용될 때 생성된 시퀀싱 윈도우가 도 11에 표시되어 있다. 시퀀싱 윈도우는 시퀀싱 프로브에 의해 결합되도록 이용가능한 표적 핵산의 부분이다. 최소 시퀀싱 윈도우는 표적 결합 도메인 길이(예컨대, 4 내지 10개 뉴클레오타이드)이고, 최대 시퀀싱 윈도우는 전체 염색체의 대부분이다.
큰 표적 핵산 분자가 본 발명의 방법을 사용하여 시퀀싱될 때, "블로커 올리고" 또는 복수의 블로커 올리고는 시퀀싱 윈도우의 크기를 제어하기 위해 표적 핵산의 길이를 따라 혼성화될 수 있다. 블로커 올리고는 특정 위치에서 표적 핵산에 혼성화하고, 이에 의해 상기 위치에 시퀀싱 프로브가 결합하는 것을 방지하여, 관심있는 더 작은 시퀀싱 윈도우를 생성한다. 도 13은 캡처 프로브, 블로커 올리고, 및 시퀀싱 프로브에 혼성화된 2개의 캡처된 표적 DNA 분자의 개략도를 나타낸다. 더 작은 시퀀싱 윈도우를 생성함으로써, 시퀀싱 반응은 표적 DNA 분자 상의 관심있는 특정 영역에 국한되어, 시퀀싱의 속도와 정확도를 증가시킨다. 블로커 올리고의 사용은 표적 핵산 내의 공지된 위치에서 특정 돌연변이를 시퀀싱할 때 특히 유용한데, 전체 표적 핵산이 시퀀싱될 필요가 없기 때문이다. 도 13의 예는 2개의 상이한 반수체형을 구별하기 위한 2개의 이종접합 부위의 표적화된 시퀀싱을 나타낸다.
본 발명의 방법
본 발명의 시퀀싱 방법은 본원에 개시된 적어도 1개의 시퀀싱 프로브를 표적 핵산에 가역적으로 혼성화시키는 단계를 포함한다.
핵산을 시퀀싱하는 방법은 (1) 본원에 기재된 시퀀싱 프로브를 표적 핵산에 혼성화시키는 단계를 포함할 수 있다. 표적 핵산은 선택적으로 하나 이상의 위치에서 기재에 고정화될 수 있다. 예시적인 시퀀싱 프로브는 표적 결합 도메인 및 바코드 도메인을 포함할 수 있으며; 표적 결합 도메인은 표적 핵산에 혼성화된 적어도 8개의 뉴클레오타이드를 포함하고, 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별할 수 있으며(예를 들어, 표적 결합 도메인 서열이 정확히 6개의 뉴클레오타이드일 때, 상기 6개의 뉴클레오타이드는 그것이 혼성화되는 표적 분자로 상보적인 6개 뉴클레오타이드를 식별함), 표적 결합 도메인 내의 적어도 2개의 뉴클레오타이드는 표적 핵산 분자 내의 상응하는 뉴클레오타이드를 식별하지 않고(예를 들어, 상기 적어도 2개의 뉴클레오타이드는 그것이 혼성화되는 표적 분자로 상보적인 2개의 뉴클레오타이드를 식별하지 않음); 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 적어도 2개의 뉴클레오타이드는 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체이며; 바코드 도메인은 합성 백본을 포함하고, 바코드 도메인은 적어도 3개의 부착 위치를 포함하며, 각각의 부착 위치는 상보적 핵산 분자에 의해 결합될 수 있는 적어도 1개의 핵산 서열을 포함하는 적어도 1개의 부착 영역을 포함하고, 적어도 3개의 부착 위치의 각각의 부착 위치는 표적 결합 도메인 내의 적어도 6개의 뉴클레오타이드 중 2개의 뉴클레오타이드에 상응하며, 적어도 3개의 부착 위치 각각은 상이한 핵산 서열을 갖고, 적어도 3개의 부착 위치의 각각의 위치의 핵산 서열은 표적 결합 도메인에 의해 결합되는 표적 핵산 내의 적어도 6개의 뉴클레오타이드 중 상응하는 2개의 뉴클레오타이드의 위치 및 정체를 결정한다.
시퀀싱 프로브를 표적 핵산에 혼성화시킨 다음, 방법은 (2) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합시키는 단계; (3) 결합된 제1 상보적 핵산 분자의 제1 및 적어도 제2의 검출 가능한 표지를 검출하는 단계; (4) 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계를 포함한다. 예를 들어, 제1 상보적 핵산 분자가 2개의 검출 가능한 표지를 포함하는 경우, 2개의 검출 가능한 표지는 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드를 식별한다.
적어도 2개의 검출 가능한 표지의 검출 후, 제1 상보적 핵산 분자로부터 적어도 2개의 검출 가능한 표지를 제거한다. 따라서, 방법은 (5) 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자를 제1 부착 위치에 결합시켜, 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 결합해제시키거나, 또는 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 방출시키기에 충분한 힘과 접촉시키는 단계를 추가로 포함한다. 따라서, 단계 (5) 이후, 검출 가능한 표지가 제1 부착 위치에 결합되지 않는다. 방법은 (6) 제3의 검출 가능한 표지 및 적어도 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 결합시키는 단계; (7) 결합된 제2 상보적 핵산 분자의 제3 및 적어도 제4의 검출 가능한 표지를 검출하는 단계; (8) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (9) 바코드 도메인 내의 적어도 3개의 부착 위치의 각각의 부착 위치가 2개의 검출 가능한 표지를 포함하는 상보적 핵산 분자에 의해 결합되고, 결합된 상보적 핵산 분자의 2개의 검출 가능한 표지가 검출될 때까지 단계 (5) 내지 (8)을 반복하여, 시퀀싱 프로브의 표적 결합 도메인에 의해 혼성화된 고정화된 표적 핵산의 적어도 제1 영역에 대한 적어도 6개 뉴클레오타이드의 선형 순서를 확인하는 단계; 및 (10) 선택적으로 고정화된 표적 핵산으로부터 시퀀싱 프로브를 제거하는 단계를 추가로 포함한다.
방법은 (11) 제2 시퀀싱 프로브를 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산에 혼성화시키는 단계로서, 제1 시퀀싱 프로브 및 제2 시퀀싱 프로브의 표적 결합 도메인은 상이한 것인 단계; (12) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합시키는 단계; (13) 결합된 제1 상보적 핵산 분자의 제1 및 적어도 제2의 검출 가능한 표지를 검출하는 단계; (14) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (15) 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자를 제1 부착 위치에 결합시켜, 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자 또는 복합체를 결합해제시키거나, 또는 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자 또는 복합체를 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 방출시키기에 충분한 힘과 접촉시키는 단계; (16) 제3의 검출 가능한 표지 및 적어도 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 결합시키는 단계; (17) 결합된 제2 상보적 핵산 분자의 제3 및 적어도 제4의 검출 가능한 표지를 검출하는 단계; (18) 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (19) 바코드 도메인 내의 적어도 3개의 부착 위치의 각각의 부착 위치가 2개의 검출 가능한 표지를 포함하는 상보적 핵산 분자에 의해 결합되고, 결합된 상보적 핵산 분자의 2개의 검출 가능한 표지가 검출될 때까지 단계 (15) 내지 (18)을 반복하여, 시퀀싱 프로브의 표적 결합 도메인에 의해 혼성화된 고정화된 표적 핵산의 적어도 제2 영역에 대한 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계; 및 (20) 선택적으로 고정화된 표적 핵산으로부터 제2 시퀀싱 프로브를 제거하는 단계를 추가로 포함할 수 있다.
방법은 고정화된 표적 핵산의 적어도 제1 영역 및 적어도 제2 영역 내의 뉴클레오타이드의 각각의 확인된 선형 순서를 조립하여, 고정화된 표적 핵산에 대한 서열을 확인하는 단계를 추가로 포함할 수 있다.
단계 (5) 및 (6)은 연속적으로 또는 동시에 발생할 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 제3 및 적어도 제4의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
제1 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제2 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제1 상보적 핵산 분자 및 제2 상보적 핵산 분자는 각각 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다. 해제 힘은 광, 바람직하게는, UV 광일 수 있다. 광은 아크 램프, 레이저, 집속 UV 광원, 및 발광 다이오드로 이루어진 군으로부터 선택된 광원에 의해 제공될 수 있다.
제1 상보적 핵산 분자 및 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 동일한 핵산 서열을 포함할 수 있다. 예를 들어, 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합하는 제1 상보적 핵산 분자의 부분과 동일한 핵산 서열을 포함할 수 있다. 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 바코드 도메인 내의 제1 부착 위치에 인접한 플랭킹 단일 가닥 폴리뉴클레오타이드에 상보적인 핵산 서열을 포함할 수 있다.
제2 상보적 핵산 분자 및 검출 가능한 표지가 결여된 제2 혼성화 핵산 분자는 동일한 핵산 서열을 포함할 수 있다. 검출 가능한 표지가 결여된 제2 혼성화 핵산 분자는 바코드 도메인 내의 제2 부착 위치에 인접한 플랭킹 단일 가닥 폴리뉴클레오타이드에 상보적인 핵산 서열을 포함할 수 있다.
본 발명은 본원에 개시된 복수의 시퀀싱 프로브를 이용하는 핵산을 시퀀싱하는 방법을 추가로 제공한다. 예를 들어, 표적 핵산은 1개를 초과하는 시퀀싱 프로브에 혼성화되고, 각각의 프로브는 그것이 혼성화되는 표적 핵산의 부분을 시퀀싱할 수 있다.
본 발명은 또한 (1) 본원에 기재된 복수의 시퀀싱 프로브를 포함하는 제1 시퀀싱 프로브의 적어도 1개의 제1 집단을 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산에 혼성화시키는 단계; (2) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합시키는 단계; (3) 결합된 제1 상보적 핵산 분자의 제1 및 적어도 제2의 검출 가능한 표지를 검출하는 단계; (4) 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (5) 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자를 제1 부착 위치에 결합시켜, 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 결합해제시키거나, 또는 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 방출하기에 충분한 힘과 접촉시키는 단계; (6) 제3의 검출 가능한 표지 및 적어도 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 결합시키는 단계; (7) 결합된 제2 상보적 핵산 분자의 제3 및 적어도 제4의 검출 가능한 표지를 검출하는 단계; (8) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (9) 바코드 도메인 내의 적어도 3개의 부착 위치의 각각의 부착 위치가 2개의 검출 가능한 표지를 포함하는 상보적 핵산 분자에 의해 결합되고, 결합된 상보적 핵산 분자의 2개의 검출 가능한 표지가 검출될 때까지 단계 (5) 내지 (8)을 반복하여, 시퀀싱 프로브의 표적 결합 도메인에 의해 혼성화된 고정화된 표적 핵산의 적어도 제1 영역에 대한 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계; 및 (10) 선택적으로 고정화된 표적 핵산으로부터 제1 시퀀싱 프로브의 적어도 1개의 제1 집단을 제거하는 단계를 포함하는 핵산을 시퀀싱하는 방법을 제공한다.
방법은 (11) 본원에 개시된 복수의 시퀀싱 프로브를 포함하는 제2 시퀀싱 프로브의 적어도 1개의 제2 집단을 하나 이상의 위치에서 기재에 선택적으로 고정화된 표적 핵산에 혼성화시키는 단계로서, 제1 시퀀싱 프로브 및 제2 시퀀싱 프로브의 표적 결합 도메인은 상이한 것인 단계; (12) 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제1 부착 위치에 결합시키는 단계; (13) 결합된 제1 상보적 핵산 분자의 제1 및 적어도 제2의 검출 가능한 표지를 검출하는 단계; (14) 선택적으로 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (15) 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자를 제1 부착 위치에 결합시켜, 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자 또는 복합체를 결합해제시키거나, 또는 검출 가능한 표지를 포함하는 제1 상보적 핵산 분자 또는 복합체를 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지를 방출시키기에 충분한 힘과 접촉시키는 단계; (16) 제3의 검출 가능한 표지 및 적어도 제4의 검출 가능한 표지를 포함하는 제2 상보적 핵산 분자를 바코드 도메인의 적어도 3개의 부착 위치 중 제2 부착 위치에 결합시키는 단계; (17) 결합된 제2 상보적 핵산 분자의 제3 및 적어도 제4의 검출 가능한 표지를 검출하는 단계; (18) 고정화된 표적 핵산 내의 적어도 2개의 뉴클레오타이드의 위치 및 정체를 식별하는 단계; (19) 바코드 도메인 내의 적어도 3개의 부착 위치의 각각의 부착 위치가 2개의 검출 가능한 표지를 포함하는 상보적 핵산 분자에 의해 결합되고, 결합된 상보적 핵산 분자의 2개의 검출 가능한 표지가 검출될 때까지 단계 (15) 내지 (18)을 반복하여, 시퀀싱 프로브의 표적 결합 도메인에 의해 혼성화된 고정화된 표적 핵산의 적어도 제2 영역에 대한 적어도 6개의 뉴클레오타이드의 선형 순서를 확인하는 단계; 및 (20) 선택적으로 고정화된 표적 핵산으로부터 제2 시퀀싱 프로브의 적어도 1개의 제2 집단을 제거하는 단계를 추가로 포함할 수 있다.
방법은 고정화된 표적 핵산의 적어도 제1 영역 및 적어도 제2 영역 내의 뉴클레오타이드의 각각의 확인된 선형 순서를 조립하여, 고정화된 표적 핵산에 대한 서열을 확인하는 단계를 추가로 포함할 수 있다.
단계 (5) 및 (6)은 연속적으로 또는 동시에 발생할 수 있다. 제1 및 적어도 제2의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다. 제3 및 적어도 제4의 검출 가능한 표지는 동일한 방출 스펙트럼을 가질 수 있거나 상이한 방출 스펙트럼을 가질 수 있다.
제1 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제2 상보적 핵산 분자는 절단 가능한 링커를 포함할 수 있다. 제1 상보적 핵산 분자 및 제2 상보적 핵산 분자는 각각 절단 가능한 링커를 포함할 수 있다. 바람직하게는, 절단 가능한 링커는 광 절단 가능하다. 해제 힘은 광, 바람직하게는, UV 광일 수 있다. 광은 아크 램프, 레이저, 집속 UV 광원, 및 발광 다이오드로 이루어진 군으로부터 선택된 광원에 의해 제공될 수 있다.
제1 상보적 핵산 분자 및 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 동일한 핵산 서열을 포함할 수 있다. 검출 가능한 표지가 결여된 제1 혼성화 핵산 분자는 바코드 도메인 내의 제1 부착 위치에 인접한 플랭킹 단일 가닥 폴리뉴클레오타이드에 상보적인 핵산 서열을 포함할 수 있다.
제2 상보적 핵산 분자 및 검출 가능한 표지가 결여된 제2 혼성화 핵산 분자는 동일한 핵산 서열을 포함할 수 있다. 검출 가능한 표지가 결여된 제2 혼성화 핵산 분자는 바코드 도메인 내의 제2 부착 위치에 인접한 플랭킹 단일 가닥 폴리뉴클레오타이드에 상보적인 핵산 서열을 포함할 수 있다.
시퀀싱 방법이 본원에 추가로 기재되어 있다.
도 14는 본 발명의 단일 예시적인 시퀀싱 사이클의 개략적인 개요를 나타낸다. 시퀀싱 전에 표적 핵산을 고정화하는 것이 본 방법에 필요하지는 않지만, 이 예에서, 방법은 캡처 프로브를 사용하여 캡처되고 좌측 최상단 패널에 나타낸 바와 같이 플로우 셀 표면에 결합된 표적 핵산으로 시작한다. 그 후, 시퀀싱 프로브의 풀이 플로우 셀 내로 유동되어 시퀀싱 프로브를 표적 핵산에 혼성화시킨다. 이 예에서, 시퀀싱 프로브는 도 1에 도시된 것이다. 이들 시퀀싱 프로브는 표적 핵산에 혼성화하는 표적 결합 도메인 내의 6머 서열을 포함한다. 6머는 유니버설/축퇴성 염기일 수 있거나 또는 염기 b1- b2- b3- b4- b5- b6에 의해 지시된 표적에 특이적이지 않은 4개의 표준 염기 중 어느 것으로 구성된 (N) 염기에 의해 양쪽 측면에 플랭킹된다. 6머 서열을 사용하여, 4096개(4^6) 시퀀싱 프로브의 세트가 임의의 표적 핵산의 시퀀싱을 가능하게 한다. 이 예의 경우, 4096개 시퀀싱 프로브의 세트가 각각 512개 시퀀싱 프로브의 8개의 풀 내의 표적 핵산에 혼성화된다. 시퀀싱 프로브의 표적 결합 도메인 내의 6머 서열은 도 14의 상단 중간 패널에 나타낸 바와 같이 6머 및 표적 핵산 사이에 완전한 상보적인 매치가 존재하는 위치에서 표적 핵산의 길이를 따라 혼성화할 것이다. 이 예에서, 단일 시퀀싱 프로브가 표적 핵산에 혼성화한다. 임의의 결합되지 않은 시퀀싱 프로브는 플로우 셀로부터 씻겨 나간다.
이들 시퀀싱 프로브는 또한 상기 기재된 바와 같은 3개의 부착 위치 R1, R2 및 R3을 갖는 바코드 도메인을 포함한다. 부착 위치 R1 내의 부착 영역은 시퀀싱 프로브의 6머의 제1 디뉴클레오타이드에 상응하는 하나 이상의 뉴클레오타이드 서열을 포함한다. 따라서, 시퀀싱 프로브의 표적 결합 도메인 내에 존재하는 제1 디뉴클레오타이드의 정체에 상응하는 상보적 핵산을 포함하는 리포터 프로브만이 부착 위치 R1에 혼성화할 것이다. 마찬가지로, 시퀀싱 프로브의 부착 위치 R2 내의 부착 영역은 표적 결합 도메인 내에 존재하는 제2 디뉴클레오타이드에 상응하며, 시퀀싱 프로브의 부착 위치 R3 내의 부착 영역은 표적 결합 도메인 내에 존재하는 제2 디뉴클레오타이드에 상응한다.
방법은 도 14의 우측 최상단 패널에서 계속된다. 리포터 프로브의 풀은 플로우 셀 내로 유동된다. 리포터 프로브 풀 내의 각각의 리포터 프로브는 이중 색상 조합의 형태의 검출 가능한 표지, 및 시퀀싱 프로브의 부착 위치 R1 내의 상응하는 부착 영역에 혼성화할 수 있는 상보적 핵산을 포함한다. 특정 리포터 프로브의 이중 색상 조합 및 상보적 핵산은 상기 기재된 바와 같이 16개의 가능한 디뉴클레오타이드 중 하나에 상응한다. 리포터 프로브의 각각의 풀은 특정 디뉴클레오타이드에 상응하는 이중 색상 조합이 시퀀싱 전에 확립되도록 디자인된다. 예를 들어, 도 14에 도시된 시퀀싱 실험에서, 부착 위치 R1에 혼성화된 리포터 프로브의 제1 풀의 경우, 이중 색상 조합 황색-적색은 디뉴클레오타이드 아데닌-티민에 상응할 수 있다. 도 14의 상부 우측 패널에 나타낸 바와 같이 리포터 프로브를 부착 위치 R1에 혼성화 후, 임의의 결합되지 않은 리포터 프로브는 플로우 셀로부터 씻겨 나가고, 결합된 리포터 프로브의 검출 가능한 표지가 기록되어 6머의 제1 디뉴클레오타이드의 정체를 결정한다.
부착 위치 R1에 혼성화된 리포터 프로브에 기인하는 검출 가능한 표지는 제거된다. 검출 가능한 표지를 제거하기 위해, 리포터 프로브는 절단 가능한 링커를 포함할 수 있고 적절한 절단제의 첨가가 부가될 수 있다. 대안적으로, 검출 가능한 표지가 결여된 상보적 핵산이 시퀀싱 프로브의 부착 위치 R1에 혼성화되고 검출 가능한 표지를 갖는 리포터 프로브를 대체한다. 검출 가능한 표지를 제거하는 방법에 관계없이, 부착 위치 R1은 더 이상 검출 가능한 신호를 방출하지 않는다. 이전에 검출 가능한 신호를 방출하고 있던 바코드 도메인의 부착 위치가 더 이상 검출 가능한 신호를 방출할 수 없게 되는 과정이 본원에서 "어둡게 하기(darkening)"로 지칭된다.
리포터 프로브의 제2 풀은 플로우 셀 내로 유동된다. 리포터 프로브 풀 내의 각각의 리포터 프로브는 이중 색상 조합 형태의 검출 가능한 표지, 및 시퀀싱 프로브의 부착 위치 R2 내의 상응하는 부착 영역에 혼성화할 수 있는 상보적 핵산을 포함한다. 특정 리포터 프로브의 이중 색상 조합 및 상보적 핵산은 16개의 가능한 디뉴클레오타이드 중 하나에 상응한다. 특정 이중 색상 조합이 리포터 프로브의 제1 풀의 문맥에서 하나의 디뉴클레오타이드에 상응하고, 리포터 프로브의 제2 풀의 문맥에서 상이한 디뉴클레오타이드에 상응하는 것이 가능하다. 도 14의 하부 우측 패널에 나타낸 바와 같이, 부착 위치 R2에 리포터 프로브의 혼성화 후, 임의의 결합되지 않은 리포터 프로브는 플로우 셀로부터 씻겨 나가고, 검출 가능한 표지가 기록되어 시퀀싱 프로브에 존재하는 6머의 제2 디뉴클레오타이드의 정체를 결정한다.
위치 R2에서 검출 가능한 표지를 제거하기 위해, 리포터 프로브는 절단 가능한 링커를 포함할 수 있고, 적절한 절단제의 첨가가 부가될 수 있다. 대안적으로, 검출 가능한 표지가 결여된 상보적 핵산은 시퀀싱 프로브의 부착 위치 R2에 혼성화되고 검출 가능한 표지를 갖는 리포터 프로브를 대체한다. 검출 가능한 표지를 제거하는 방법에 관계없이, 부착 위치 R2는 더 이상 검출 가능한 신호를 방출하지 않는다.
그 후, 리포터 프로브의 제3 풀이 플로우 셀 내로 유입된다. 제3 리포터 프로브 풀 내의 각각의 리포터 프로브는 이중 색상 조합 형태의 검출 가능한 표지, 및 리포터 프로브의 부착 위치 R3 내의 상응하는 부착 영역에 혼성화할 수 있는 상보적 핵산을 포함한다. 특정 리포터 프로브의 이중 색상 조합 및 상보적 핵산은 16개의 가능한 디뉴클레오타이드 중 하나에 상응한다. 도 14의 하부 중간 패널에 나타낸 바와 같이, 위치 R3에 리포터 프로브의 혼성화 후, 임의의 결합되지 않은 리포터 프로브는 플로우 셀로부터 씻겨 나가고, 검출 가능한 표지가 기록되어 시퀀싱 프로브에 존재하는 6머의 제3 디뉴클레오타이드의 정체를 결정한다. 이 방식으로, 표적 결합 도메인의 모든 3개의 디뉴클레오타이드가 식별되고, 함께 조립되어 표적 결합 도메인의 서열 및 따라서 표적 핵산의 서열을 밝힐 수 있다.
표적 핵산을 계속 시퀀싱하기 위해, 임의의 결합된 시퀀싱 프로브가 표적 핵산으로부터 제거될 수 있다. 리포터 프로브가 바코드 도메인의 위치 R3에 여전히 혼성화되어 있다고 할지라도 시퀀싱 프로브는 표적 핵산으로부터 제거될 수 있다. 대안적으로, 위치 R3에 혼성화된 리포터 프로브는, 예를 들어, 위치 R1 및 R2에서 리포터에 대해 상기 기재된 바와 같이 어둡게 하기 절차를 사용하여, 표적 결합 도메인으로부터 시퀀싱 프로브를 제거하기 전에 바코드 도메인으로부터 제거될 수 있다.
도 14에 도시된 시퀀싱 사이클은 시퀀싱 프로브의 동일한 풀의 표적 핵산 분자에의 혼성화 또는 시퀀싱 프로브의 상이한 풀의 표적 핵산에의 혼성화로 각각의 시퀀싱 사이클로 시작하여 임의의 횟수로 반복될 수 있다. 시퀀싱 프로브의 제2 풀은 제1 시퀀싱 프로브 또는 시퀀싱 프로브의 풀이 제1 시퀀싱 사이클 동안 결합된 위치와 중첩되는 위치에서 표적 핵산에 결합하는 것이 가능하다. 따라서, 표적 핵산 내의 특정 뉴클레오타이드는 1개를 초과하는 시퀀싱 프로브를 사용하여 2회 이상 시퀀싱될 수 있다.
도 15는 본 발명의 시퀀싱 방법의 하나의 전체 사이클 및 이 사이클 동안 수집된 상응하는 이미징 데이터의 개략도를 도시한다. 이 예에서, 사용된 시퀀싱 프로브는 도 1에 도시된 것이며, 시퀀싱 단계는 도 14에 도시되고 상기 기재된 것과 동일하다. 시퀀싱 프로브의 시퀀싱 도메인이 표적 핵산에 혼성화된 후, 리포터 프로브는 시퀀싱 프로브에 제1 부착 위치(R1)에 혼성화된다. 그 후, 제1 리포터 프로브는 이미지화되어 색상 도트를 기록한다. 도 15에서, 색상 도트는 점선 원으로 표시되어 있다. 색상 도트는 전체 사이클 동안 기록되고 있는 단일 시퀀싱 프로브에 상응한다. 이 예에서, 7개 시퀀싱 프로브가 기록된다(1 내지 7). 그 후, 바코드 도메인의 제1 부착 위치가 어두워지고, 이중 형광 리포터 프로브가 시퀀싱 프로브의 제2 부착 위치(R2)에 혼성화된다. 그 후, 제2 리포터 프로브가 이미지화되어 색상 도트를 기록한다. 그 후, 바코드 도메인의 제2 부착 위치가 어두워지고, 이중 형광 리포터가 시퀀싱 프로브의 제3 부착 위치(R3)에 혼성화된다. 그 후, 제3 리포터 프로브가 이미지화되어 색상 도트를 기록한다. 그 후, 각각의 시퀀싱 프로브 1 내지 7로부터의 3개의 색상 도트가 순서대로 배열된다. 그 후, 각각의 색상 스팟이 디코딩 매트릭스를 사용하여 특정 디뉴클레오타이드에 맵핑되어 시퀀싱 프로브 1 내지 7의 표적 결합 도메인의 서열을 밝힌다.
단일 시퀀싱 사이클 동안, 표적 핵산에 결합된 임의의 시퀀싱 프로브의 표적 결합 도메인의 서열을 결정하는데 필요한 리포터 프로브 풀의 수는 바코드 도메인 내의 부착 위치의 수와 동일하다. 따라서, 3개의 위치를 갖는 바코드 도메인의 경우, 3개의 리포터 프로브 풀이 시퀀싱 프로브에 대해 사이클될 것이다.
시퀀싱 프로브의 풀은 서열이 모두 동일한 복수의 시퀀싱 프로브 또는 서열이 모두 동일하진 않은 복수의 시퀀싱 프로브를 포함할 수 있다. 시퀀싱 프로브의 풀이 서열이 모두 동일하진 않은 복수의 시퀀싱 프로브를 포함할 때, 각각의 상이한 시퀀싱 프로브는 동일한 수로 존재할 수 있거나, 또는 상이한 시퀀싱 프로브는 상이한 수로 존재할 수 있다.
도 16은, 시퀀싱 프로브가 (a) 표적 핵산에 특이적으로 결합하는 6개 뉴클레오타이드(6머)를 갖는 표적 결합 도메인 및 (b) 바코드 도메인 내의 3개의 부착 위치(R1, R2 및 R3)를 함유할 때, 상기 명시된 8개의 색상 조합이 시퀀싱 프로브의 8개의 상이한 풀을 디자인하는데 사용되는 본 발명의 예시적인 시퀀싱 프로브 풀 구성을 나타낸다. 가능한 4096개의 특유의 6머 서열(4x4x4x4x4x4=4096)이 있다. 바코드 도메인 내의 3개의 부착 위치 각각이 8개의 상이한 색상 조합 중 하나에 의해 결합된 상보적 핵산에 혼성화될 수 있다고 가정하면, 가능한 3개의 색상 조합의 512개의 특유의 세트(8*8*8=512)가 존재한다. 예를 들어, R1이 색상 조합 GG에 결합된 상보적 핵산에 혼성화하고, R2가 색상 조합 BG에 결합된 상보적 핵산에 혼성화하며, R3이 색상 조합 YR에 결합된 상보적 핵산에 혼성화하는 프로브의 경우, 3개의 색상 조합의 세트는 따라서 GG-BG-YR이다. 시퀀싱 프로브의 풀 내에서, 3개의 색상 조합의 각각의 특유의 세트는 표적 결합 도메인 내의 특유의 6머에 상응할 것이다. 각각의 풀이 512개의 특유의 6머를 함유하고, 총 4096개의 가능한 6머가 있다고 가정하면, 모든 가능한 6머를 시퀀싱하기 위해 8개의 풀이 필요하다(4096/512=8). 8개 풀 각각에 위치한 특정 시퀀싱 프로브는 표적 핵산에 대한 각각의 시퀀싱 프로브의 최적의 혼성화를 보장하기 위해 결정된다. 최적의 혼성화를 보장하기 위해, (a) 완벽한 6머 보체를 상이한 풀로 분리하는 것; (b) 높은 Tm 및 낮은 Tm을 갖는 6머를 상이한 풀로 분리하는 것; 및 (c) 경험적으로 배운 혼성화 패턴에 기초하여 6머를 상이한 풀로 분리하는 것을 포함하는 몇 가지 예방 조치가 취해진다:.
도 17은 미국 특허 공개 제20160194701호에 기재된 시퀀싱 프로브와 본 발명의 시퀀싱 프로브 간의 차이를 도시한다. 도 17의 좌측 패널에 도시된 바와 같이, 미국 특허 공개 제20160194701호는 상보적 핵산에 혼성화되는 6개의 부착 위치를 포함하는 바코드 도메인을 갖는 시퀀싱 프로브를 기술한다. 각각의 상보적 핵산은 4개의 상이한 형광 염료 중 하나에 결합된다. 이 구성에서, 각각의 색상(적색, 청색, 녹색, 황색)은 표적 결합 도메인 내의 하나의 뉴클레오타이드(A, T, C, 또는 G)에 상응한다. 이 프로브 디자인은 4096개의 특유의 프로브(4^6)를 생성한다. 도 17의 우측 패널에 도시된 바와 같이, 본 발명의 일 예에서, 각각의 시퀀싱 프로브의 바코드 도메인은 도 17의 우측 패널에 도시된 바와 같은 상보적 핵산에 혼성화되는 3개의 부착 위치를 포함한다. 미국 특허 공개 제20160194701호와 달리, 이들 상보적 핵산은 8개의 상이한 색상 조합(GG, RR, GY, RY, YY, RG, BB, 및 RB) 중 하나에 의해 결합된다. 각각의 색상 조합은 표적 결합 도메인 내의 특정 디뉴클레오타이드에 상응한다. 이 구성은 512개의 특유의 프로브(8^3)를 생성한다. 표적 결합 도메인 내의 모든 가능한 헥사머 조합(4096)을 커버하기 위해, 이들 512개의 특유의 프로브의 8개의 분리된 풀이 전체 표적 핵산을 시퀀싱하는데 필요하다. 8개 색상 조합이 상보적 핵산을 표지하는데 사용되지만, 16개의 가능한 디뉴클레오타이드가 존재하므로, 특정 색상 조합은 어떤 시퀀싱 프로브 풀이 사용되고 있는지에 따라 상이한 디뉴클레오타이드에 상응할 것이다. 예를 들어, 도 17에서, 시퀀싱 프로브의 1번째, 2번째, 3번째, 및 4번째 풀에서, 색상 조합 BB는 디뉴클레오타이드 AA에 상응하고, 색상 조합 GG는 디뉴클레오타이드 AT에 상응한다. 시퀀싱 프로브의 5번째, 6번째, 7번째, 및 8번째 풀에서, 색상 조합 BB는 디뉴클레오타이드 CA에 상응하고, 색상 조합 CT는 디뉴클레오타이드 AT에 상응한다.
복수의 시퀀싱 프로브(즉 1개를 초과하는 시퀀싱 프로브)가 시퀀싱 윈도우 내에서 혼성화될 수 있다. 시퀀싱 동안, 복수의 혼성화된 시퀀싱 프로브 내의 각각의 시퀀싱 프로브에 결합된 검출 가능한 표지의 정체 및 공간 위치가 기록된다. 이것은 복수의 디뉴클레오타이드의 위치 및 정체 모두의 후속 식별을 가능하게 한다. 다시 말해서, 복수의 시퀀싱 프로브를 단일 표적 핵산 분자에 동시에 혼성화시킴으로써, 표적 핵산을 따라 다수의 위치가 동시에 시퀀싱되어, 시퀀싱 속도를 증가시킬 수 있다.
도 18은 캡처된 표적 핵산 분자에 혼성화된 단일 시퀀싱 프로브 및 복수의 시퀀싱 프로브의 개략도를 보여준다. 2개의 혼성화된 5' 및 3' 캡처 프로브 사이의 시퀀싱 윈도우는 표적 핵산 분자의 길이를 따라 단일 시퀀싱 프로브(좌측 패널) 또는 복수의 시퀀싱 프로브(우측 패널)의 혼성화를 가능하게 한다. 표적 핵산 분자의 길이를 따라 복수의 시퀀싱 프로브를 혼성화시킴으로써, 표적 핵산 분자 상의 1개를 초과하는 위치가 동시에 시퀀싱되어, 시퀀싱 속도를 증가시킬 수 있다. 도 19는 단일 프로브(좌측 패널) 또는 복수의 프로브(우측 패널)가 캡처된 표적 핵산에 혼성화될 때 본 발명의 시퀀싱 방법 동안 기록된 형광 이미지를 나타낸다. 도 19의 우측 패널은 표적 핵산의 길이를 따라 결합된 복수의 프로브 중 개별적인 프로브로부터의 형광 신호가 공간적으로 분해될 수 있음을 보여준다.
도 20은 15 킬로베이스 길이의 표적 핵산의 길이를 따라 결합된 본 발명의 복수의 시퀀싱 프로브 및 상응하는 기록된 형광 이미지의 개략도를 나타낸다. 시퀀싱 프로브는 도 20의 우측 패널에 나타낸 바와 같이 표적 핵산의 길이를 따라 균등한 간격으로 결합할 수 있다. 시퀀싱 프로브는 도 20의 좌측 패널에 나타낸 바와 같이 표적 핵산의 길이를 따라 균등한 간격으로 결합할 필요가 없다. 도 20에 나타낸 형광 이미지는 표적 핵산의 길이를 따라 결합된 복수의 시퀀싱 프로브로부터의 신호가 공간적으로 분해되어 표적 핵산의 다수의 위치에서 시퀀싱 정보를 동시에 얻을 수 있음을 입증한다.
표적 핵산의 길이에 따른 프로브의 분포는 검출 가능한 신호의 분해능에 중요하다. 영역 내의 너무 많은 프로브가 이들의 검출 가능한 표지의 중첩을 야기하여 2개의 가까운 프로브의 분해능을 방지할 수 있는 경우가 있다. 이것은 다음과 같이 설명된다. 하나의 뉴클레오타이드가 0.34 nm 길이라고 가정하고 시퀀싱 장치의 측면(x-y) 공간 분해능이 약 200 nm라고 가정하면, 시퀀싱 장치의 분해능 한계는 약 588개 염기 쌍(즉, 1 뉴클레오타이드/0.34 nm x 200 nm)이다. 즉, 전술한 시퀀싱 장치는 2개의 프로브가 서로 약 588개 염기 쌍 이내에 있을 때 표적 핵산에 혼성화된 2개의 프로브로부터의 신호를 분해할 수 없을 것이다. 따라서, 시퀀싱 장치의 분해능에 따라, 2개의 프로브는 이들의 검출 가능한 표지가 별개의 "스팟"으로서 분해될 수 있기 전에 약 600bp 이격될 필요가 있을 것이다. 따라서, 최적의 간격으로, 표적 핵산의 600bp당 단일 프로브가 있어야 한다. 바람직하게는, 프로브의 집단 내의 각각의 시퀀싱 프로브는 서로 600개 뉴클레오타이드보다 더 가깝게 결합하지 않을 것이다. 다양한 소프트웨어 접근법(예컨대, 형광 강도 값 및 파장 의존적 비율을 이용함)이 표적 핵산의 분해가능한 영역 내에서 혼성화하는 프로브의 수를 모니터링하고, 제한하고, 잠재적으로 디콘볼류션(deconvolution)하고, 따라서 프로브 집단을 디자인하는데 사용될 수 있다. 더욱이, 더 구별되는 신호를 제공하는 검출 가능한 표지(예컨대, 형광 표지)가 선택될 수 있다. 또한, 문헌(예컨대, Small and Parthasarthy: "Superresolution localization methods." Annu. Rev. Phys Chem., 2014; 65:107-25)에 기재된 방법은 시퀀싱 현미경의 분해능 한계를 최대 10 나노미터로 감소시키는 구조화된 조명 및 다양한 초고분해능 접근법을 기술한다. 더 높은 분해능 시퀀싱 장치의 사용은 더 짧은 표적 결합 도메인을 갖는 프로브의 사용을 허용한다.
상기 언급한 바와 같이, 프로브의 Tm을 디자인하는 것은 표적 핵산에 혼성화된 프로브의 수에 영향을 미칠 수 있다. 대안적으로 또는 추가적으로, 표적 핵산의 특정 영역에서 프로브의 커버리지를 증가시키도록 집단에서의 시퀀싱 프로브의 농도는 증가될 수 있다. 표적 핵산의 특정 영역에서 프로브의 커버리지를 감소시키기 위해, 시퀀싱 프로브의 농도는, 예컨대, 시퀀싱 장치의 분해능 한계 초과까지 감소될 수 있다.
2개의 검출 가능한 표지에 대한 분해능 한계는 약 600개 뉴클레오타이드이지만, 이것은 본 발명의 강력한 시퀀싱 방법을 방해하지 않는다. 특정 양태에서, 임의의 집단에서의 복수의 시퀀싱 프로브는 표적 핵산 상의 600개 뉴클레오타이드에 의해 분리되지 않을 것이다. 그러나, 통계적으로(프아송 분포(Poisson distribution)에 따라), 하나의 시퀀싱 프로브만이 결합된 표적 핵산이 존재할 것이고, 상기 시퀀싱 프로브는 광학적으로 분해될 수 있는 것이다. 600개 뉴클레오타이드 이내에 결합된(따라서 광학적으로 분해되지 않는) 다수의 프로브를 갖는 표적 핵산의 경우, 이들 분해할 수 없는 시퀀싱 프로브에 대한 데이터는 폐기될 수 있다. 중요하게도, 본 발명의 방법은 복수의 시퀀싱 프로브를 결합시키고 검출하는 복수의 라운드를 제공한다. 따라서, 일부 라운드에서 모든 시퀀싱 프로브로부터의 신호가 검출되고, 일부 라운드에서 시퀀싱 프로브의 부분만으로부터의 신호가 검출되며, 일부 라운드에서 시퀀싱 프로브로부터의 신호가 검출되지 않는다. 일부 양태에서, 표적 핵산에 결합된 시퀀싱 프로브의 분포는 표적 핵산당 오직 하나의 시퀀싱 프로브가 결합하도록 조작될 수 있다(예컨대, 농도 제어 또는 희석에 의해).
무작위로, 그러나 부분적으로는 표적 결합 도메인의 길이, 프로브의 Tm, 및 적용된 프로브의 농도에 따라, 집단 내의 2개의 구별되는 시퀀싱 프로브가 서로 600개 뉴클레오타이드 이내로 결합하는 것이 가능하다.
대안적으로 또는 추가적으로, 표적 핵산의 특정 영역에서 프로브의 커버리지를 감소시키기 위해, 집단 내의 시퀀싱 프로브의 농도가, 예컨대 시퀀싱 장치의 분해능 한계 초과까지 감소되어, 분해능 제한된 스팟으로부터 단일 리드를 생성할 수 있다.
표적 핵산의 서열, 또는 서열의 부분이 본 발명의 방법을 사용하여 표적 핵산을 시퀀싱하기 전에 공지되면, 시퀀싱 프로브는 2개의 시퀀싱 프로브가 서로 600개 뉴클레오타이드 이내로 표적 핵산에 결합하지 않도록 디자인되고 선택될 수 있다.
시퀀싱 프로브를 표적 핵산에 혼성화하기 전에, 하나 이상의 상보적 핵산 분자가 제1의 검출 가능한 표지에 의해 결합될 수 있고, 적어도 제2의 검출 가능한 표지가 시퀀싱 프로브의 바코드 도메인 내의 부착 위치 중 하나 이상에 혼성화될 수 있다. 예를 들어, 표적 핵산에 혼성화되기 전에, 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 의해 결합된 하나 이상의 상보적 핵산 분자가 각각의 시퀀싱 프로브의 제1 부착 위치에 혼성화될 수 있다. 따라서, 그의 표적 핵산과 접촉될 때, 시퀀싱 프로브는 제1 부착 위치로부터 검출 가능한 신호를 방출할 수 있고, 바코드 도메인 상의 제1 위치로 향하는 상보적 핵산 또는 리포터 프로브의 제1 풀을 제공하는 것이 불필요하다. 또 다른 예에서, 제1의 검출 가능한 표지 및 적어도 제2의 검출 가능한 표지에 의해 결합된 하나 이상의 상보적 핵산 분자는 시퀀싱 프로브의 바코드 도메인 내의 모든 부착 위치에 혼성화될 수 있다. 따라서, 이 예에서, 6개의 뉴클레오타이드 서열은 상보적 핵산을 연속적으로 대체할 필요없이 판독될 수 있다. 이러한 사전 혼성화된 시퀀싱 프로브-리포터 프로브 복합체의 사용은 기재된 방법의 많은 단계가 생략되므로 서열 정보를 얻는 시간을 감소시킬 것이다. 그러나, 이 프로브는 비중첩하는 검출 가능한 표지로부터 이익을 얻을 것이며, 예컨대, 형광단은 비중첩 파장의 빛에 의해 여기되거나 형광단은 비중첩 파장의 빛을 방출한다.
시퀀싱 동안, 기록된 색상 도트로부터의 신호 강도는 표적 핵산을 보다 정확하게 시퀀싱하는데 사용될 수 있다. 도 21은 본 발명의 시퀀싱 사이클 동안 기록된 예시적인 이미징 데이터를 보여준다. 도 21의 우측 패널은 리포터 프로브가 시퀀싱 프로브의 제1 부착 위치에 혼성화된 후 기록된 형광 현미경 이미지를 나타낸다. 특정 색상 도트가 강조 표시되고 기록된 특정 색상 조합이 표시되어 있으며, 이는 이중 형광 신호가 명확하게 검출 가능하고 구별될 수 있음을 입증한다. 기점 마커로부터의 밝은 신호는 화살표로 표시되어 있다. 도 21의 좌측 패널은 특정 색상 도트가 하나의 색상의 이중성인 색상 조합(즉 BB, GG, YY, 또는 RR)에 상응할 확률을 결정하기 위해 색상 도트 내의 특정 색상의 스팟 강도가 사용될 수 있음을 보여준다.
바코드 도메인 내의 위치를 어둡게 하는 것은 상기 위치에 혼성화된 리포터 프로브 내에 존재하는 절단 가능한 링커 변형에서의 가닥 절단에 의해 달성될 수 있다. 도 22는 시퀀싱 사이클 동안 바코드 위치를 어둡게 하기 위한 절단 가능한 링커 변형의 사용을 도시한다. 도 22의 가장 먼 좌측 패널에 도시된 제1 단계는 리포터 프로브의 일차 핵산을 시퀀싱 프로브의 제1 부착 위치에 혼성화시키는 것을 포함한다. 일차 핵산은 바코드 도메인의 제1 위치의 부착 영역 내의 특정한 상보적인 서열에 혼성화한다. 일차 핵산의 제1 및 제2 도메인은 절단 가능한 링커 변형에 의해 공유결합된다. 제2 단계에서, 검출 가능한 표지가 이후에 기록되어 시퀀싱 프로브의 표적 결합 도메인 내의 특정 디뉴클레오타이드의 정체 및 위치를 결정한다. 제3 단계에서, 바코드 도메인의 제1 위치는 절단 가능한 링커 변형에서 리포터 프로브를 절단함으로써 어두워진다. 이것은 일차 핵산의 제2 도메인을 방출하여, 검출 가능한 표지를 방출한다. 임의의 검출 가능한 표지가 결여된 일차 핵산 분자의 제1 도메인은 바코드 도메인의 제1 부착 위치의 좌측에 혼성화되어, 바코드 도메인의 제1 위치는 더 이상 검출 가능한 신호를 방출하지 않으며 후속 시퀀싱 단계에서 임의의 다른 리포터 프로브에 혼성화할 수 없을 것이다. 도 22의 가장 먼 우측 패널에 도시된 최종 단계에서, 리포터 프로브는 시퀀싱을 계속하기 위해 바코드 도메인의 제2 위치에 혼성화된다.
바코드 도메인의 부착 위치는 리포터 프로브의 일차 핵산 분자가 시퀀싱 프로브에 혼성화된 상태를 여전히 유지하게 하면서 검출 가능한 표지에 의해 결합된 리포터 프로브 내의 임의의 이차 또는 삼차 핵산을 대체함으로써 어두워질 수 있다. 이 대체는 검출 가능한 표지에 의해 결합되지 않은 일차 핵산 또는 이차 또는 삼차 핵산에 혼성화함으로써 달성될 수 있다. 도 23은 바코드 도메인 내의 위치가 표지된 이차 핵산의 대체에 의해 어두워지는 본 발명의 예시적인 시퀀싱 사이클의 예시적인 예이다. 도 23의 가장 좌측 패널은 리포터 프로브의 일차 핵산 분자가 시퀀싱 프로브의 바코드 도메인의 제1 부착 위치에 혼성화되는 시퀀싱 사이클의 시작을 도시한다. 그 후, 검출 가능한 표지에 결합된 이차 핵산 분자가 일차 핵산 분자에 혼성화되고, 검출 가능한 표지가 기록된다. 바코드 도메인의 제1 위치를 어둡게 하기 위해, 검출 가능한 표지에 결합된 이차 핵산 분자는 검출 가능한 표지가 결여된 이차 핵산 분자에 의해 대체된다. 시퀀싱 사이클의 다음 단계에서, 검출 가능한 표지를 포함하는 리포터 프로브가 바코드 도메인의 제2 위치에 혼성화된다.
바코드 도메인의 부착 위치는 검출 가능한 표지에 의해 결합되지 않은 핵산을 상응하는 바코드 도메인 부착 위치에서 시퀀싱 프로브에 혼성화시킴으로써 리포터 프로브의 임의의 일차 핵산 분자를 대체함으로써 어두워질 수 있다. 바코드 도메인이 적어도 1개의 부착 위치에 인접하거나 플랭킹한 적어도 1개의 단일 가닥의 핵산 서열을 포함하는 경우, 검출 가능한 표지에 의해 결합되지 않은 핵산은 플랭킹 서열 및 일차 핵산 분자에 의해 점유된 바코드 도메인의 부분에 혼성화함으로써 일차 핵산 분자를 대체할 수 있다. 필요한 경우, 검출 가능한 표지 교환 속도는 검출 가능한 표지의 교환 속도를 가속화시키는 작은 단일 가닥의 올리고뉴클레오타이드(예컨대, "토홀드" 프로브; 예컨대, Seeling et al., "Catalyzed Relaxation of a Metastable DNA Fuel"; J. Am. Chem. Soc. 2006, 128(37), pp12211-12220 참고)를 혼입함으로써 가속화될 수 있다.
검출 가능한 표지 또는 리포터 프로브를 포함하는 상보적 핵산은 부착 영역으로부터 제거될 수 있지만 검출 가능한 표지가 결여된 혼성화 핵산으로 대체될 수 없다. 이것은, 예를 들어, 카오트로픽제를 첨가하고, 온도를 증가시키고, 염 농도를 변화시키고, pH를 조절하고/하거나 유체역학적 힘을 가함으로써 발생할 수 있다. 이들 예에서, 보다 적은 시약(즉, 검출 가능한 표지가 결여된 혼성화 핵산)이 필요하다.
본 발명의 방법은 동일한 샘플로부터 mRNA 및 gDNA를 포함하는 RNA 및 DNA 분자를 동시에 캡처 및 시퀀싱하는데 사용될 수 있다. 동일한 샘플로부터의 RNA 및 DNA 분자 모두의 캡처 및 시퀀싱은 동일한 플로우 셀에서 수행될 수 있다. 도 24의 좌측 패널은 본 발명의 방법이 FFPE 샘플로부터의 gDNA 및 mRNA 모두를 어떻게 동시에 캡처하고, 검출하고, 시퀀싱하는데 사용될 수 있는지의 개략도이다.
본 발명의 시퀀싱 방법은 고정화된 표적 핵산의 각각의 영역에 대한 뉴클레오타이드의 각각의 확인된 선형 순서를 조립하여, 고정화된 표적 핵산에 대한 서열을 확인하는 단계를 추가로 포함한다. 조립 단계는 그 안에 저장된 실행가능한 프로그램을 갖는 비일시적 컴퓨터 판독가능한 저장 매체를 사용한다. 프로그램은 마이크로프로세서가 표적 핵산의 각각의 영역에 대한 뉴클레오타이드의 각각의 확인된 선형 순서를 배열하여, 핵산의 서열을 수득하도록 지시한다. 조립은 "실시간"으로, 즉, 모든 데이터가 수집된 후 또는 완전한 데이터 획득 후가 아니라 데이터가 시퀀싱 프로브로부터 수집되고 있는 동안 발생할 수 있다.
본 발명의 시퀀싱 방법의 미가공 특이도(raw specificity)는 약 94%이다. 본 발명의 시퀀싱 방법의 정확도는 1개를 초과하는 시퀀싱 프로브로 표적 핵산 내의 동일한 염기를 시퀀싱함으로써 약 99%까지 증가될 수 있다. 도 25는 본 발명의 시퀀싱 방법이 상이한 시퀀싱 프로브로 표적 핵산의 동일한 염기의 시퀀싱을 어떻게 허용하는지 도시한다. 이 예에서의 표적 핵산은 NRAS 엑손2의 단편(서열번호: 1)이다. 관심있는 특정 염기는 표적 핵산에서 강조표시된 시토신(C)이다. 관심있는 염기는 각각 표적 핵산에 대한 혼성화의 구별되는 풋프린트를 가지고 2개의 상이한 시퀀싱 프로브에 혼성화될 것이다. 이 예에서, 시퀀싱 프로브 1 내지 4(바코드 1 내지 4)는 관심있는 염기의 좌측의 3개의 뉴클레오타이드에 결합하는 반면, 시퀀싱 프로브 5 내지 8(바코드 5 내지 8)은 관심있는 염기의 좌측의 5개 뉴클레오타이드에 결합한다. 따라서, 관심있는 염기는 2개의 상이한 프로브에 의해 시퀀싱되어 상기 특정 위치에 대한 염기 콜링의 양을 증가시키고 상기 특정 위치에서 전체 정확도를 증가시킬 것이다. 도 26은 하나 이상의 시퀀싱 프로브로부터 기록된, 표적 뉴클레오타이드 상의 특정 뉴클레오타이드 위치에 대한 다수의 상이한 염기 콜링이 어떻게 조합되어 공통 서열(서열번호: 2)을 생성하고, 이에 의해 최종 염기 콜링의 정확도를 증가시킬 수 있는지 보여준다.
용어 "Hyb & Seq 화학," "Hyb & Seq 시퀀싱," 및 "Hyb & Seq"는 상기 기재된 본 발명의 방법을 지칭한다.
상기 양태 중 어느 것은 본원에 개시된 임의의 다른 양태와 조합될 수 있다.
정의
본원에 사용된 바와 같이 용어 "어닐링" 및 "혼성화"는 안정한 이합체의 형성을 의미하기 위해 상호교환적으로 사용된다. 일 양태에서, 안정한 이합체는 이합체 구조가 이합체의 가닥의 Tm보다 약 5℃ 낮거나 약 5℃ 높은 온도 및 낮은 일가 염 농도, 예컨대, 0.2 M 미만, 또는 0.1 M 미만 또는 당업자에게 공지된 염 농도와 같은 조건하에서의 엄격한 세척에 의해 파괴되지 않는다는 것을 의미한다. 이합체에 관해 사용될 때 용어 "완벽하게 매칭된"은 이합체를 구성하는 폴리뉴클레오타이드 및/또는 올리고뉴클레오타이드 가닥이 서로 이중 가닥 구조를 형성하여 각각의 가닥 내의 모든 뉴클레오타이드가 다른 가닥 내의 뉴클레오타이드와 왓슨-크릭 염기 쌍 형성을 겪는다는 것을 의미한다. 용어 "이합체"는 사용될 수 있는 뉴클레오사이드 유사체, 예컨대 데옥시이노신, 2-아미노퓨린 염기를 갖는 뉴클레오사이드, PNA 등의 쌍 형성을 포함하나, 이에 제한되지 않는다. 2개의 올리고뉴클레오타이드 사이의 이합체에서의 "미스매치(mismatch)"는 이합체 내의 뉴클레오타이드의 쌍이 왓슨-크릭 결합을 겪지 못한다는 것을 의미한다.
본원에 사용된 바와 같이, 용어 "혼성화 조건"은 전형적으로 약 1 M 미만, 보다 일반적으로 약 500 mM 미만 및 더욱 보다 일반적으로 약 200 mM 미만의 염 농도를 포함할 것이다. 혼성화 온도는 5℃ 정도 낮을 수 있지만, 전형적으로 22℃ 초과, 보다 전형적으로 약 30℃ 초과, 및 종종 약 37℃ 초과이다. 혼성화는 일반적으로 엄격 조건, 예컨대, 프로브가 그의 표적 하위서열에 특이적으로 혼성화할 조건 하에 수행된다. 엄격 조건은 서열 의존적이며, 상이한 상황에서 상이하다. 더 긴 단편은 특이적 혼성화를 위해 더 높은 혼성화 온도를 필요로 할 수 있다. 상보적인 가닥의 염기 조성 및 길이, 유기 용매의 존재 및 염기 미스매칭 정도를 포함하는, 다른 인자가 혼성화의 엄격성에 영향을 미칠 수 있으므로, 파라미터의 조합이 어느 하나의 절대 척도 단독보다 더 중요하다.
일반적으로, 엄격 조건은 정의된 이온 강도 및 pH에서 특정 서열에 대한 Tm보다 약 5℃ 더 낮도록 선택된다. 예시적인 엄격 조건은 pH 7.0 내지 8.3 및 적어도 25℃의 온도에서 적어도 0.01 M 내지 1 M 이하의 Na 이온 농도(또는 다른 염)의 염 농도를 포함한다. 예를 들어, 5X SSPE(750 mM NaCl, 50 mM 인산나트륨, 5 mM EDTA, pH 7.4) 및 25-30℃의 온도의 조건이 대립유전자 특이적 프로브 혼성화에 적합하다. 엄격 조건의 경우, 예를 들어, 문헌[Sambrook, Fritsche and Maniatis, "Molecular Cloning A Laboratory Manual, 2nd Ed." Cold Spring Harbor Press (1989) and Anderson Nucleic Acid Hybridization, 1st Ed., BIOS Scientific Publishers Limited (1999)]을 참고한다. 본원에 사용된 바와 같이, 용어 "혼성화 특이도" 또는 "특이적으로 혼성화하는" 또는 유사한 용어는 엄격 조건 하에서 실질적으로 특정 뉴클레오타이드 서열 또는 서열에 대한 분자의 결합, 이합체화, 또는 혼성화를 지칭한다.
프로브의 특정 위치와 관련된 검출 가능한 표지는 한 번 또는 여러 번 "판독(readout)"(예컨대, 그의 형광이 검출됨)될 수 있고; "판독"은 용어 "염기콜링(basecall)"과 동의어일 수 있다. 다중 리드는 정확도를 개선한다. 표적 핵산 서열은 단일 원래의 표적 분자로부터 유래된 서열 정보의 연속 스트레치가 검출될 때 "판독"되며; 전형적으로, 이것은 다중 패스 공통(multi-pass consensus)(하기에 정의된 바와 같음)을 통해 생성된다. 본원에 사용된 바와 같이, 용어 "커버리지(coverage)" 또는 "커버리지의 깊이(depth of coverage)"는 표적의 영역이 시퀀싱되고(구별되는 판독을 통해) 참조 서열에 대해 정렬되는 횟수를 지칭한다. 리드 커버리지는 특정 참조 표적 서열에 대해 맵핑되는 리드의 총 수이며; 염기 커버리지는 특정 게놈 위치에서 만들어진 염기콜링의 총 수이다.
"리드(read)"는 시퀀서 출력의 단위이다. 단일 원래의 표적 분자로부터 유래된 서열 정보의 연속 스트레치. 각각의 리드는 리드 내의 염기 콜링의 신뢰 수준을 연관시키는 품질 지표(quality metric)를 갖는다. 시퀀서 출력의 단위. 단일 원래의 표적 분자로부터 유래된 서열 정보의 연속 스트레치. Hyb & Seq에서, 모든 리드는 다중 패스 공통을 통해 생성된다.
"리드길이(readlength)"는 각각의 리드로부터의 서열의 길이(bp)를 기술하는 지표이다. 이 지표는 시퀀싱 기술에 의해 결정된다.
본원에 사용된 바와 같이, "Hyb & Seq 사이클"은 특정 프로브 또는 프로브의 집단 상의 각각의 부착 영역을 검출하는데 필요한 모든 단계를 지칭한다. 예를 들어, 표적 핵산 상의 6개의 위치를 검출할 수 있는 프로브의 경우, 하나의 "Hyb & Seq 사이클"은, 적어도, 프로브를 표적 핵산에 혼성화시키고, 상보적 핵산/리포터 프로브를 프로브의 바코드 도메인 상의 6개 위치 각각에서의 부착 영역에 혼성화시키고, 6개 위치 각각에 결합된 검출 가능한 표지를 검출하는 단계를 포함할 것이다.
용어 "k머 프로브"는 본 발명의 시퀀싱 프로브와 동의어이다. k머 리드아웃은 Hyb & Seq의 데이터의 기본 단위이다. 단일 k머 리드아웃은 단일 Hyb & Seq 사이클당 단일 표적 분자로부터 수득된다. 단일 표적 분자로부터 충분한 구별되는 k머 판독을 생성하기 위해 다수의 Hyb & Seq 사이클이 수행되어, 구별되는 K머를 서열의 연속 스트레치 내로 명확히 정렬시킨다.
구별되는 리드로부터의 2개 이상의 서열이 정렬되는 경우, 중첩 부분이 조합되어 단일 공통 서열을 생성할 수 있다. 중첩 부분이 동일한 염기를 갖는 위치(정렬의 단일 컬럼)에서, 상기 염기는 공통이 된다. 중첩 서열 중에서 불일치가 있는 위치에 대한 공통을 생성하기 위해 다양한 규칙이 사용될 수 있다. 간단한 다수결 원칙은 컬럼 내의 가장 공통된 염기를 공통으로서 사용한다. "다중 패스 공통"은 단일 표적 분자로부터의 모든 구별되는 프로브 판독의 정렬이다. 적용된 프로브 집단/폴의 사이클의 총 수에 따라, 단일 표적 분자 내의 각각의 염기 위치는 상이한 수준의 중복 또는 중첩으로 질의될 수 있으며; 일반적으로, 중복은 염기콜링의 신뢰 수준을 증가시킨다.
"공통(consensus)"은 구별되는 리드로부터의 2개 이상의 DNA 서열이 정렬될 때이며, 중첩 부분은 단일 공통 서열을 생성하기 위해 조합될 수 있다. 중첩 부분이 동일한 염기를 갖는 위치(정렬의 단일 컬럼)에서, 상기 염기는 공통이 된다. 중첩 서열 중에서 불일치가 있는 위치에 대해 공통을 생성하기 위해 다양한 규칙이 사용될 수 있다. 간단한 다수결 원칙은 컬럼 내의 가장 공통된 염기를 공통으로서 사용한다.
"미가공 정확도(Raw Accuracy)"는 염기를 정확히 식별하는 시스템의 특유의 능력의 측정값이다. 미가공 정확도는 시퀀싱 기술에 따라 다르다. "공통 정확도"는 추가의 리드 및 통계 능력을 사용하여 염기를 정확히 식별하는 시스템의 능력의 측정값이다. "특이도"은 실행(run)당 총 리드 중에서 의도된 표적에 대해 맵핑되는 리드의 백분율을 지칭한다. "균일성(Uniformity)"은 표적 영역에 대한 서열 커버리지의 변동성을 지칭하며; 높은 균일성은 낮은 변동성과 상관관계가 있다. 이 특징은 일반적으로 모든 표적화된 영역에 대한 평균 커버리지 깊이의 ≥20%에 의해 커버되는 표적화된 영역의 비율로서 보고된다. 확률적 오류(즉, 내재적 시퀀싱 화학 오류)는 동일한 표적 핵산의 '다중 패스' 시퀀싱으로 쉽게 보정될 수 있고; 충분한 수의 패스가 주어지면, 실질적으로 '완전한 공통' 또는 '오류가 없는' 시퀀싱이 달성될 수 있다.
방법을 구현할 수 있고/거나 결과를 기록할 수 있는 임의의 장치를 사용하여 본원에 기재된 방법은 구현될 수 있고/거나 결과는 기록될 수 있다. 사용될 수 있는 장치의 예는 비제한적으로 모든 유형의 컴퓨터를 포함하는 전자 계산 장치를 포함한다. 본원에 기재된 방법이 컴퓨터에서 구현되고/되거나 기록되는 경우, 방법의 단계를 수행하도록 컴퓨터를 구성하는데 사용될 수 있는 컴퓨터 프로그램이 컴퓨터 프로그램을 포함할 수 있는 임의의 컴퓨터 판독가능한 매체에 포함될 수 있다. 사용될 수 있는 컴퓨터 판독가능한 매체의 예는 비제한적으로 디스켓, CD-ROM, DVD, ROM, RAM, 비일시적 컴퓨터 판독가능한 매체, 및 다른 메모리 및 컴퓨터 저장 장치를 포함한다. 방법의 단계를 수행하고, 서열 정보를 조립하고/하거나, 결과를 기록하도록 컴퓨터를 구성하는데 사용될 수 있는 컴퓨터 프로그램은 또한 전자 네트워크, 예를 들어, 인터넷, 인트라넷, 또는 다른 네트워크를 통해 제공될 수 있다.
"소모성 시퀀싱 카드(Consumable Sequencing Card)"가 당업계에 공지된 형광 이미징 장치에 통합될 수 있다. 많은 다양한 특징을 갖는 임의의 형광 현미경이 이 시퀀싱 판독을 수행할 수 있다. 예를 들어: 광시야 램프, 레이저, LED, 다중 광자, 공초점 또는 전반사 조명(total-internal reflection illumination)이 여기 및/또는 검출에 사용될 수 있다. 필터 기반 또는 격자 기반 스펙트럼 분해능(하나 이상의 스펙트럼적으로 분해된 방출 파장)을 갖는 카메라(단일 또는 다중) 및/또는 광전자 증배관(단일 또는 다중)이 형광 현미경의 방출-검출 채널에서 가능하다. 표준 컴퓨터는 소모성 시퀀싱 카드, 카드를 통해 유동하는 시약, 및 형광 현미경에 의한 검출 모두를 제어할 수 있다.
시퀀싱 데이터는 많은 표준 차세대 시퀀싱 어셈블러에 의해 분석될 수 있다(예컨대, Wajid and Serpedin, "Review of general algorithmic features for genome assemblers for next generation sequencers" Genomics, proteomics & bioinformatics, 10 (2), 58-73, 2012 참고). 현미경의 단일 회절 제한 영역 내에서 얻은 시퀀싱 데이터는 "국소 조립"되어 회절 스팟 내의 다수의 리드로부터 공통 서열을 생성한다. 그 후, 다수의 회절 스팟 조립된 리드는 함께 맵핑되어 전체 표적화된 유전자 세트, 또는 전체 게놈(들)의 드노보(de-novo) 조립체를 나타내는 연속 서열을 생성한다.
본 발명과 관련된 추가적인 교시가 하기 중 하나 이상에 기재되어 있으며, 이들 각각은 그 전체가 참조로 본원에 포함되어 있다: U.S. 제8,148,512호, U.S. 제7,473,767호, U.S. 제7,919,237호, U.S. 제7,941,279호, U.S. 제8,415,102호, U.S. 제8,492,094호, U.S. 제8,519,115호, U.S. 제2009/0220978호, U.S. 제2009/0299640호, U.S. 제2010/0015607호, U.S. 제2010/0261026호, U.S. 제2011/0086774호, U.S. 제2011/0145176호, U.S. 제2011/0201515호, U.S. 제2011/0229888호, U.S. 제2013/0004482호, U.S. 제2013/0017971호, U.S. 제2013/0178372호, U.S. 제2013/0230851호, U.S. 제2013/0337444호, U.S. 제2013/0345161호, U.S. 제2014/0005067호, U.S. 제2014/0017688호, U.S. 제2014/0037620호, U.S. 제2014/0087959호, U.S. 제2014/0154681호, U.S. 제2014/0162251호, 및 U.S. 제2016/0194701호.
실시예:
실시예 1 - Hyb & Seq 화학을 이용한 단일 분자 긴 리드
현재 개시된 시퀀싱 프로브 및 시퀀싱 프로브를 이용하는 방법은 간편하게 Hyb & Seq로 불린다. 이 용어는 개시된 시퀀싱 프로브 및 방법을 기술하기 위해 본 명세서 전반에 이용된다. Hyb & Seq는, 천연 표적 상에서 형광 분자 바코드의 핵산 혼성화 사이클을 사용하는, 라이브러리가 없고, 증폭이 없는 단일 분자 시퀀싱 기술이다.
Hyb & Seq를 사용한 긴 리드는 하기 주요 단계를 이용하여 33 킬로베이스(kb) 길이의 단일 분자 DNA 표적 상에서 입증된다: (1) 긴 DNA 분자가 캡처되고, 시퀀싱 플로우 셀 상에서 유체역학적으로 스트레치되고; (2) 다수의 완벽하게 매칭된 시퀀싱 프로브가 긴 단일 분자 표적에 대해 혼성화되며; (3) 형광 리포터가 시퀀싱 프로브 내의 바코드 영역에 혼성화하여 모든 결합된 서열을 확인하고/하거나; (4) 공간적으로 분해된 형광 데이터를 사용하여 단일 분자 표적 내의 서열의 상대적 위치가 결정된다.
Hyb & Seq를 사용한 긴 리드의 주요 이점은, 비제한적으로 하기를 포함한다: 화학에 의해 제한되지 않고 분자 길이에 의해 결정된 리드 길이; 간단하고 제한된 샘플 제조가 적은 단편화를 야기함; 시퀀싱 프로브와 관련된 위치 정보가 조립을 도움; 및/또는 변이체를 긴 범위 반수체형으로 전환하는 능력.
Hyb & Seq 화학 디자인 - 시퀀싱 프로브는 단일 분자 표적과 염기 쌍을 형성하는 표적 결합 도메인 및 표적 결합 도메인에 존재하는 헥사머 서열에 상응하는 적어도 3개의 위치(R1, R2, 및 R3)를 갖는 바코드 도메인을 포함한다. 4096개 시퀀싱 프로브의 세트는 임의의 표적 서열의 시퀀싱을 가능하게 한다. 리포터 프로브: 3개의 리포터 프로브가 바코드 도메인의 위치에 연속적으로 결합한다. 각각의 리포터 복합체는 특정 디뉴클레오타이드에 상응한다. 혼성화는 기능성을 유도한다.
본 발명의 긴 리드 및 짧은 리드 시퀀싱 방법은 도 18 및 19에 나타낸 바와 같이 핵산의 표적화된 캡처를 위한 동일한 간단한 프로브 혼성화 작업흐름을 사용한다. 복수의 시퀀싱 프로브는 도 18의 우측 패널에 나타낸 바와 같이 표적 핵산에 동시에 혼성화할 수 있고, 광학 분해능은 도 19의 우측 패널에 나타낸 바와 같이 긴 표적당 몇 개의 스팟이 개별적으로 구별되게 한다. 복수의 시퀀싱 프로브를 동시에 혼성화하고 기록함으로써, 단일 리드의 정보 함량이 증가된다. 긴 범위 반수체형은 단일 분자 분석에 내재하며, 컴퓨터 재구성이 아닌 실제 물리적 위치에 의해 조립될 수 있다. 본 발명의 시퀀싱 방법을 사용하여 최대 수백 킬로베이스의 긴 시퀀싱 리드가 실현가능하다.
특정 시퀀싱 프로브의 풀은 도 20에 나타낸 바와 같은 예상된 패턴으로 15 킬로베이스 표적에 혼성화한다. 시퀀싱 프로브는 예상된 서열 특이적 위치 및 상대적인 물리적 거리에서 스트레치된 표적(바람직하게는 유체역학적으로 스트레치된 표적)에 혼성화한다. 본 발명의 시퀀싱 방법은 짧은 리드 기술에 비해 증가된 정보 내용을 가져, 각각의 사이클에 더 많은 염기가 판독될 수 있게 한다. 본 발명의 시퀀싱 방법은 또한 시퀀싱 판독의 상대적 위치를 기록하며, 이는 긴 리드의 조립을 돕는다. 본 발명의 시퀀싱 방법을 사용하여, 리드 길이 = 공통 서열 길이 = 캡처된 표적 분자의 길이.
도 27은 33 킬로베이스 DNA 단편이 캡처되고, 스트레치되고, 시퀀싱 프로브 및 리포터 프로브에 혼성화되고, 검출되는 실험의 결과를 나타낸다. 본 발명의 시퀀싱 방법은 33 킬로베이스 이상의 DNA 단편과 양립가능하다. 리드 길이는 효소 또는 시퀀싱 화학이 아닌 표적 핵산 단편의 초기 길이에 의해서만 제한된다.
도 13은 표적화된 단계적(phased) 긴 리드에 관한 본 발명의 시퀀싱 방법의 추가 성능을 나타낸다. 긴 범위 단계적 반수체형은 데이터에 내재되며, 변이체의 단계별로 쉽게 식별된다. "블로커 올리고"가 서열 사이클링을 관심있는 시퀀싱 윈도우로 제한하는데 사용될 수 있기 때문에 전체 긴 표적 분자의 시퀀싱은 필요하지 않다.
실시예 1의 결과는 본 발명의 시퀀싱 방법이 긴 리드 길이로 단일 분자 시퀀싱이 가능하다는 것을 보여준다. 특히, 결과는 15 킬로베이스 및 33 킬로베이스 단일 가닥의 DNA 분자의 성공적인 캡처 및 유체역학적 스트레칭; 공간적으로 분해된 형광 데이터는 긴 단일 분자에 대한 실제 상대적 위치에 정확히 상응한다는 것; 및 시퀀싱 사이클당 10+ 염기 서열의 동시 판독을 보여준다.
실시예 2 - ShortStack™ 기술: 짧은 뉴클레오타이드 변이체 및 InDel을 분해하는 표적화된 시퀀싱을 위한 Hyb & Seq 리드의 정확한, 참조 가이드된 조립
ShortStack은 Hyb & Seq의 특유의 헥사머 판독(헥사머 스펙트럼)의 조립을 수행하기 위해 디자인된 오픈 소스 알고리즘이다. 알고리즘은 각각의 이미지화된 특징으로부터 헥사머 리드를 사용한 식별을 표적으로 하고 오류 보정으로 단일 분자 기준으로 공통 서열 내로 헥사머 판독의 조립을 수행하는 통계적 접근법이다.
Hyb & Seq 화학 및 ShortStack을 사용한 단일 분자 시퀀싱을 다음과 같이 수행하였다: 단일 분자 표적의 헥사머 판독을 Hyb & Seq 화학을 이용한 혼성화의 각 사이클 후에 생성하였고; 많은 혼성화 사이클 후, 각각의 단일 분자 표적 영역을 커버하는 헥사머 스펙트럼을 생성하였으며; 헥사머 스펙트럼을 각각의 표적 핵산 분자의 참조 서열과 함께 사용하여 각각의 단일 분자 표적의 공통 서열을 유도한다.
ShortStack을 갖는 Hyb & Seq 기술을 사용한 표적 시퀀싱의 결과는 헥사머 스펙트럼을 사용한 단일 분자 표적 식별 알고리즘이 100% 성공률을 가지고 있었고; 참조 가이드된 조립 알고리즘이 5x 커버리지에서 >99%(~QV 32)의 단일 분자 공통 정확도를 생성하였으며; 일치하는 체세포 변이체 검출(R2 ~90%)이 미리 규명된 참조 gDNA 샘플을 사용하여 입증되었고/거나; 모든 헥사머와 ShortStack을 사용한 인실리코 실험이 더 큰 표적 패널에 대해 평균 QV >90을 확인하였음을 보여준다.
ShortStack 알고리즘은 Hyb & Seq 데이터를 정확히 조립할 수 있다. 도 28은 본 발명의 시퀀싱 방법을 사용하여 수득되고 ShortStack 알고리즘을 사용하여 분석된 시퀀싱 실험의 결과를 나타낸다. 본 실험에서, 시퀀싱된 표적 핵산은 유전자 BRAF(서열번호: 3), EGFRex18(서열번호: 4), KRAS(서열번호: 5), PIK3CA(서열번호: 6), EGFRex20(서열번호: 7) 및 NRAS(서열번호: 8)의 단편을 포함하였다. 도 28은 염기 커버리지 및 변이체 콜링 모두를 나타낸다. 커버리지 플롯은 FFPE(포르말린 고정된 파라핀 포매된) gDNA에서 염기의 커버리지를 보여준다. 결과는 다양한 표적에서의 대부분의 염기가 이용가능한 시퀀싱 프로브에 의해 커버된다는 것을 보여준다. 오류 플롯은 다양한 표적에 대한 FFPE gDNA 샘플에서 질의된 위치에서의 오류율 대 커버리지를 보여준다. 결과는 8x 커버리지에서, 오류율이 <1%이라는 것을 보여준다. 빈도 플롯은 시퀀싱된 호리존(Horizon) gDNA 샘플에서 변이체의 예상 빈도 및 알려진 빈도 사이의 상관관계를 보여준다. 표는 시퀀싱된 호리존 게놈 참조 gDNA를 제공하며, 변이체 분자의 분획이 참조 샘플의 공지된 빈도와 일치한다는 것을 보여준다.
실시예 2의 결과는 ShortStack이 본 발명의 시퀀싱 방법을 사용하여 얻은 헥사머 스펙트럼의 서브조립을 위한 정확한 알고리즘임을 보여준다. 특히, 결과는 시뮬레이션된 데이터를 사용하여 표적 식별의 100% 정확도 및 염기당 평균 품질 값(average per-base quality value) >30; 5x 커버리지에서, 실험적 Hyb & Seq 데이터에서 염기 콜링의 >99% 정확도; 공지된 값(R2 ~90%)과 일치하는 빈도로 게놈 DNA로부터 변이체의 검출; 및 계산 성능이 효과적이고, 개인용 컴퓨터 상에서 ~15분 내에 69k 분자를 조립할 수 있는, 조립된 헥사머의 수에 선형적으로 비례한다는 것을 보여준다.
실시예 3 - Hyb & Seq™ 기술을 사용하여 FFPE 샘플로부터의 천연(native) gDNA의 라이브러리가 없는 표적화된 시퀀싱 - 혼성화 기반 단일 분자 시퀀싱 시스템
본 발명의 시퀀싱 방법(Hyb & Seq)을 사용하여 FFPE 샘플로부터의 천연 gDNA의 표적화된 암 패널 시퀀싱을 수행하여 정확한 염기 콜링로 종양유전자 표적의 표적화된 단일 분자 시퀀싱; 공지된 종양유전자 단일 뉴클레오타이드 변이체(SNV) 및 삽입/결실(InDel)의 정확한 검출; FFPE 추출된 gDNA(중간 DNA 단편 크기 200 염기)로부터의 종양유전자 표적의 멀티플렉스된 캡처; 및/또는 진보된 원형 기기에서 수행된 말단간(end-to-end) 자동화 시퀀싱을 입증하였다.
Hyb & Seq 화학 및 작업흐름은 하기와 같이 입증되었다: 관심있는 게놈 표적이 시퀀싱 플로우 셀 상에 직접 캡처되고; 수백 개의 헥사머 시퀀싱 프로브를 함유하는 풀이 시퀀싱 챔버 내로 유동되며; 형광 리포터 프로브가 시퀀싱 프로브의 바코드 영역에 연속적으로 혼성화하여 3개의 리포터 교환 사이클 동안 헥사머 염기를 식별하고; 염기가 식별되면, 시퀀싱 프로브가 씻겨 나가며; 표적 영역이 충분한 깊이까지 판독될 때까지 시퀀싱 프로브의 새로운 풀로 사이클이 반복된다.
Hyb & Seq의 주요 이점: 간단하고 신속한 FFPE 작업흐름 - 임상 검체가 60분 이내에 시퀀싱 시작; 효소 또는 증폭 없음 / 라이브러리 제작 없음; 15분의 총 처리 시간(hands-on-time); 높은 정확도 - 낮은 화학 오류율 + 고유 오류 보정; 및/또는 긴 & 짧은 리드 모두 - 화학에 의해 제한되지 않은, 투입 샘플에 의해 정의된 리드 길이.
Hyb & Seq 화학 디자인은 실시예 1에 기술된 바와 같다. FFPE 조직을 처리하기 위한 Hyb & Seq 샘플 제조는 3가지 간단한 단계로 구성된다: (1) 단일 튜브 탈파라핀화 및 용해; (2) 주사기 필터를 사용한 미립자의 제거; 및 (3) 선택적 DNA 단편화 및 표적 캡처. 공정은 샘플당 사용된 1 내지 3개의 10 마이크론 FFPE 컬(curl)을 필요로 한다. 전체 공정은 60분 이내에 완료되며, 일반적인 실험 장비만을 필요로 한다: 히트 블록, 피펫, 필터 및 시약.
도 29는 FFPE 샘플로부터의 종양유전자 표적의 멀티플렉스된 캡처 및 시퀀싱을 위한 실험 디자인의 개략도를 나타낸다. 총 425개의 시퀀싱 프로브를 디자인하고 제작하여 11개 종양유전자 표적(서열번호: 3-13)의 부분을 시퀀싱하였다. 각각의 유전자 표적에 대해 공지된 변이체의 유전자좌는 많은 시퀀싱 프로브(완전 매치 + 단일 미스매치)로 커버되었다. 염기 커버리지 및 염기별 정확도를 이들 영역에서 측정하였다. 미리 특성화된 참조 샘플을 사용하여, 변이체 검출의 정확도를 수득하였다. 도 29의 상부 패널은 시퀀싱 프로브(청색)가 공지된 변이체 위치(적색)를 둘러싼 표적 서열(회색)에 정렬한다는 것을 보여준다. 각각의 변이체 위치(적색)에 대해, 4개의 프로브 서열이 각각의 (A, G, C, T) 염기 변이체를 가지고 포함되었다. 시퀀싱 동안, 단일 표적 DNA 분자를 800 바코드 교환 사이클 동안 추적하여, 실시예 2에 기재된 바와 같은 ShortStack™ 알고리즘에 의해 재조합된 다수의 헥사머 리드를 제공하였다.
도 28은 각각의 표적의 평균 커버리지, 단일 염기 오류율, 및 관찰된 변이체 빈도 대 예상된 변이체 빈도를 포함하는 시퀀싱 결과를 나타낸다. 실시예 3의 결과는 Hyb & Seq 시퀀싱이 FFPE 및 낮은 오류로 검출된 단일 뉴클레오타이드 변이를 갖는 참조 gDNA 샘플에서 11개의 표적 영역의 멀티플렉스된 시퀀싱을 수행하는데 사용될 수 있음을 보여준다.
실시예 4 - Hyb & Seq™ 화학을 이용하여 cDNA 전환 없이 직접 단일 분자 RNA 시퀀싱
Hyb & Seq 화학을 이용한 직접 단일 분자 RNA 시퀀싱은 다음과 같이 입증되었다: 천연 RNA 분자가 cDNA 전환 없이 직접 캡처되고 시퀀싱 플로우 셀 상에 고정되었으며; 수백 개의 헥사머 시퀀싱 프로브를 함유하는 풀이 시퀀싱 플로우 셀 내로 유동되었고; 완벽하게 매칭된 시퀀싱 프로브가 단일 분자 RNA 표적 상에 무작위로 혼성화되었으며; 형광 리포터 프로브가 시퀀싱 프로브의 바코드 영역에 연속적으로 혼성화되어 헥사머 염기를 식별하였고; 염기가 식별된 다음, 시퀀싱 프로브가 씻겨 내려갔으며; 표적이 충분한 깊이까지 판독될 때까지 사이클이 반복되었다.
주요 결과: 표적화된 단일 분자 RNA가 시퀀싱되었고, 이는 DNA에 대해 유사한 커버리지 프로파일을 나타내었으며; RNA 분자가 200개 초과의 Hyb & Seq 사이클 내내 플로우 셀에서 안정하게 유지되었고; mRNA 및 게놈 DNA가 동시에 캡처되고 단일 FFPE 슬라이스로부터 정량화되었고/거나; 8개의 전사체가 10 ng 정도의 적은 총 RNA를 사용하여 멀티플렉스 캡처되고 정량화되었다.
Hyb & Seq 화학 디자인은 실시예 1에 기재된 바와 같다. 도 30의 좌측 패널은 cDNA 전환을 사용하여 수행된 통상적인 RNA 시퀀싱과 관련된 단계와 비교된 직접 RNA 시퀀싱과 관련된 실험 단계의 개략도를 나타낸다. 도 30의 중간 및 좌측 패널은 RNA 분자와 본 발명의 시퀀싱 방법과의 양립성을 테스트하기 위한 실험의 결과를 나타낸다. 실험에서, 4개의 표적 RNA 분자가 시퀀싱되었다(서열번호: 14-17). 결과는 RNA 분자가 적어도 200 시퀀싱 사이클 동안 캡처 및 검출될 수 있음을 보여주며, 이는 본 발명의 시퀀싱 방법 및 RNA 분자의 양립성을 입증한다.
도 31은 본 발명의 시퀀싱 방법을 사용하여 직접 단일 분자 RNA 시퀀싱을 검증하는 실험의 결과를 나타낸다. NRASex2의 단편을 코딩하는 천연 RNA 분자(서열번호: 18)를 cDNA 전환 없이 직접 캡처하고 시퀀싱 플로우 셀 상에 고정화시키고 본 발명의 방법을 사용하여 시퀀싱하였다. RNA 대신에 캡처된 DNA 분자를 사용하여 실험을 또한 반복하였다. 도 31은 DNA 및 RNA에 대한 시퀀싱 커버리지가 대등하다는 것을 보여주며, 이는 RNA가 본 발명의 시퀀싱 방법을 사용하여 cDNA로의 전환 없이 직접 시퀀싱될 수 있음을 입증한다.
도 24는 FFPE 샘플로부터의 RNA 및 DNA의 통합된 캡처의 예를 나타낸다. 도 24의 좌측 패널은 본 발명의 방법이 FFPE 샘플로부터의 gDNA 및 mRNA 모두를 동시에 캡처, 검출, 및 시퀀싱하는데 어떻게 사용될 수 있는지의 개략도이다. 샘플은 실시예 3에 기재된 동일한 FFPE 작업흐름을 사용하여 제조된다. 동일한 캡처 프로토콜이 RNA 및 DNA 특이적 캡처 프로브를 가지고 사용된다. DNA 및 RNA 분자는 동일한 시퀀싱 프로브를 사용하여 동일한 플로우 셀에서 동시에 시퀀싱된다. 도 24의 우측 패널은 편도 FPPE 샘플로부터의 NRAS RNA 및 DNA를 동시에 캡처하고 검출하는 실험의 결과를 나타낸다. 형광 이미지는 RNA 및 DNA 모두가 캡처되고 검출될 수 있음을 보여준다. 막대 그래프는 특정 RNA 및 DNA 캡처 프로브가 RNA 및 DNA를 동시에 캡처하는데 필요하다는 것을 입증한다.
도 32는 RNA 패널의 멀티플렉스 표적 캡처의 결과를 나타낸다. 다양한 투입량의 총 RNA(0 ng, 1 ng, 10 ng, 100 ng, 1000 ng)를 갖는 인간 유니버설 참조 RNA 상에서 8개의 중간 내지 높은 발현 전사체의 멀티플렉스 캡처를 수행하였다. 멀티플렉스된 캡처된 RNA 분자를 플로우 셀 상에 고정화시키고, 특정 시퀀싱 프로브 및 리포터 프로브를 정량을 위해 고정화된 RNA 분자에 혼성화시켰다. 도 32의 하부 패널은 100 ng 투입량 캡처로부터의 형광 이미지를 보여준다. 각각의 RNA의 하나의 예가 식별을 위해 사용된 전사체 이름 및 상응하는 리포터 복합체 색상 조합과 함께 원으로 표시되어 있다. 도 32의 상부 패널은 각각의 특정 RNA 표적에 대한 카운트의 정량을 나타낸다.
실시예 4의 결과는 단일 분자 RNA 시퀀싱이 Hyb & Seq 화학을 이용하여 달성된다는 것을 보여준다. 특히, 결과는 (1) cDNA 전환 없는 직접 RNA 시퀀싱; (2) RNA 분자가 Hyb & Seq 사이클링 과정 내내 안정하다는 것; (3) RNA 및 DNA 분자 모두가 하나의 Hyb & Seq 작업흐름에서 캡처되고 시퀀싱될 수 있다는 것; (4) mRNA 패널의 표적 캡처가 10 ng 정도의 적은 총 RNA 투입량으로 수행될 수 있다는 것을 입증한다.
실시예 5 - Hyb & Seq 시퀀싱 플랫폼으로부터 생성된 고처리량 분자 수준 짧은 리드를 위한 통합 생물정보학 알고리즘
ShortStack™ 소프트웨어는 정렬, 오류 보정, 돌연변이 콜링, 및 리드 조립과 같은 표준 시퀀싱 기반 생물정보학 분석 과제를 수행하도록 디자인된다. 도 33은 헥사머 정렬 및 커버리지 예상; 돌연변이된 서열 식별; 그래프 데이터 구조 제작; 및/또는 분자 수준 서열 재구성 및 오류 보정을 포함하는 ShortStack™ 소프트웨어 파이프라인의 단계의 개략도를 보여준다.
모든 알고리즘을 단일 분자로부터 얻은 정보 내에서 엄격하게 수행하여, 최종 돌연변이 콜링 결과가 샘플의 돌연변이 빈도에 의해 편향되지 않게 하였다. 헥사머를 패널 결합 위치에 따라 상이한 분자로 분류하였다. 분자를 표적에 할당하기 위해, 헥사머를 모든 상이한 표적 영역에 대해 분자마다 정렬하고, 톱 매칭된 유전자 표적을 선택하였다.
통계적 척도를 측정하여 분자 식별의 품질을 평가하였다. N개의 상이한 표적 영역에 대한 정렬은 각각의 표적에 대해 N개의 합계된 커버리지 값의 분포를 생성한다. 상위 합계된 커버리지 스코어 매치를 정확한 매치로서 선택하였다. 모든 N개의 상이한 표적의 스코어 분포에 대한 선택된 톱 매칭 스코어의 Z-스코어 통계를 측정하였다. 낮은 신뢰도 분자 식별(2.5 시그마의 z-스코어 미만)을 필터링하였다.
ShortStack™ 알고리즘의 주요 이점은 계층적 해시 인덱스(hierarchical hash index) 디자인을 구현함으로써 가능한 서열 모호성을 정확하게 처리하는 것; 및/또는 진보된 알고리즘 디자인 구조가 우선순위에 의해 맵핑 품질을 보장하고 돌연변이의 과대평가를 방지하는 것을 포함한다.
또한, 돌연변이 그래프 데이터 구조는 다양한 유형의 돌연변이(치환, 삽입, 및 결실)의 계산 모델링을 가능하게 하고 서열 재구성 및 변이체 콜링에 대한 출력을 생성한다: 치환 변이체는 원래의 서열을 갖는 동일한 길이의 그래프에서 추가의 노드(node)로서 표시되며; 삽입은 연결된 노드의 임의의 길이를 추가하여 모델링될 수 있고; 결실은 빈 염기 쌍 스트링을 가진 그래프에서 인공 노드를 추가하는 것으로서 모델링되며; 블라인드 돌연변이 검색(즉, 돌연변이 내성 서열 정렬에 대한 검색)에서, 해밍 거리(hamming distance)가 모든 참조 서열 위치로부터 측정되고 새로운 노드가 검색된 돌연변이를 나타내는 그래프에 추가되고/거나; 돌연변이된 헥사머에 대한 커버리지 예상은 계층적 해시 테이블을 사용하여 수행된다.
제작된 그래프 데이터 구조는 분자 수준 서열 재구성 및 기기 오류 보정을 가능하게 한다. 제작된 그래프에서, 동적 프로그래밍 알고리즘을 적용하여 스코어가 정규화된 염기 커버리지로서 정의된 최상의 스코어링 경로를 찾는다. 그래프의 최상의 스코어링 경로는 분자 수준 서열 재구성을 나타내었다. 정확한 돌연변이된 서열이 포함된 반면, 헥사머에서의 기기 오류는 폐기되었다.
시뮬레이션된 데이터 세트는 소프트웨어가 매우 정확한 분자 수준 서열 조립 및 돌연변이 콜링 결과를 전달할 수 있었음을 확인시켜 주었다. 도 34는 ShortStack™ 소프트웨어 파이프라인을 사용한 시뮬레이션된 데이터 세트의 돌연변이 분석의 결과를 나타낸다. 이들 결과는 10개의 무작위 돌연변이에 대한 돌연변이 콜링 정확도를 나타낸다. 중간 기기 오류 데이터 세트에서, 정확도는 평균 99.39%(표적화된 검색) 및 98.02%(블라인드 검색)를 나타내었다. 상승된 기기 오류 시뮬레이션 하에, 성능은 평균 97.19%(표적화된 검색) 및 93.53%(블라인드 검색)를 나타내었다. 분자 수준 염기 커버리지 역치가 2x로 증가된 경우, 결과는 99.5%(2x 커버리지) 및 99.9%(3x 커버리지)로 개선되었다.
ShortStack™ 소프트웨어는 광범위한 다양한 돌연변이를 처리할 수 있다. 도 35는 전체적인 돌연변이 콜링 정확도를 보여주며, 각각의 막대는 다양한 유형의 돌연변이에서 10개의 상이한 돌연변이된 표적으로부터의 평균값을 나타낸다. 삽입 및 결실의 길이는 1bp 내지 15bp에서 선택된다. 이들 결과는 돌연변이 콜링 정확도가 94.4%(1x 커버리지), 97.7%(2x 커버리지), 98.5%(3x 커버리지)였음을 보여준다.
실시예 6 - Hyb & Seq를 위한 FFPE 조직을 처리하기 위한 샘플 제조
포르말린 고정된 파라핀 포매된(FFPE) 조직은 전통적인 시퀀싱 플랫폼을 위한 도전적인 샘플 투입 유형이다. Hyb & Seq의 샘플 제조 방법은 하류 시퀀싱을 위한 FFPE 조직 투입량을 성공적으로 처리한다. 먼저, 시퀀싱하고자 하는 핵산(들)을 단일 단계 공정으로 포르말린 고정된 파라핀 포매된(FFPE) 조직으로부터 추출한다. 하나 이상의 10 μm 두께의 FFPE 컬을 수성 기반의 핵산 추출 완충제에서 가열하여 동시에 파라핀 왁스를 녹이고, 조직을 분해하고, 핵산을 세포로부터 방출시킨다. 적합한 추출 완충제는 당업계에 공지되어 있으며 전형적으로 프로티나아제, 세제, 예컨대 트리톤-100, 킬레이트화제, 예컨대 EDTA, 및 암모늄 이온을 포함한다. FFPE 컬 및 추출 완충제를 56℃에서 30분 동안 배양하여 조직으로부터 파라핀을 분리하고 프로티나아제 K가 조직 구조를 소화하게 하고 포매된 세포를 세제에 노출시켜 세포 용해를 가능하게 한다. 용액을 8분 간격으로 3회 뒤집어 조직 탈파라핀화 및 소화 공정 동안 시약의 혼합을 돕는다. 이 단계 후, 용액을 98℃로 가열하여 포름알데히드 가교결합의 전환(reversal)을 촉진하여 핵산의 추출을 추가로 돕는다.
핵산이 FFPE 조직으로부터 추출되면, 용액을 2.7 μm 공극 크기를 갖는 유리 섬유 필터(Whatman)를 사용하여 여과하여 조직 파편 및 응고된 파라핀을 제거한다. 생성된 용액은 포르말린 고정 과정 및 저장 조건으로 인해 매우 단편화된 핵산을 함유하는 균질하고 반투명한 용액이다. 추가 단편화가 필요한 경우, DNA는 코바리스(Covaris) 집중된 초음파기를 사용하여 기계적으로 전단될 수 있다. 완충제 조건으로 인해, 핵산을 전단시키기 위해 연장된 초음파처리가 필요하다. 50W 피크 입사력, 20% 듀티 인자(duty factor), 200 사이클/버스트의 표준 설정을 사용한 초음파 처리를 600초 동안 사용하여 캡처된 표적의 최대 증가를 달성하였다. 더 짧은 단편 길이를 달성하기 위해, 유화 파라핀은 21,000 g 및 4℃에서 15분 동안 원심분리함으로써 여과된 용액으로부터 침전될 수 있다. 이것은 DNA를 약 225 bp로 전단시킨다.
다음으로, 신속한 혼성화 단계 동안 캡처 프로브의 쌍을 표적 핵산 분자에 결합시킴으로써 표적 캡처를 수행한다. 5' 캡처 프로브는 3' 바이오틴 모이어티를 함유하며, 이는 표적 증착(deposition) 과정 동안 표적을 스트렙타비딘 코팅된 플로우 셀 표면에 결합시킨다. 3' 캡처 프로브는 정제 과정 동안 비드에의 결합을 가능하게 하는 5' 태그 서열(G-서열)을 함유한다. 반응 속도는 반응 속도를 최대화하기 위해 낮은 나노몰 범위로 첨가되는 캡처 프로브 농도에 의해 유도된다. 캡처 프로브는 시퀀싱 윈도우를 생성하기 위해 관심 영역에 플랭킹하는 방식으로 표적에 혼성화한다. 각각의 DNA 표적에 대해, 캡처 프로브 세트는 또한 표적의 안티센스 가닥에 혼성화하고 재어닐링을 방지하기 위해 시퀀싱 윈도우와 동일한 서열로 구성된 올리고를 포함한다. 캡처 프로브를 함유하는 용액을 3분 동안 98℃로 가열하여 게놈 DNA를 변성시킨 다음, 65℃에서 15분 배양한다. 400 mM 내지 600 mM 범위의 NaCl의 농도가 이 혼성화 반응에 사용된다. 실험적으로 검증된 100개 이상의 표적의 패널이 표 3에 열거되어 있으며, 이는 표적화된 DNA 영역의 유전자 및 엑손을 자세히 설명한다.
표 3: 표적화된 DNA 영역의 유전자 및 엑손
Figure 112020129306748-pat00014
Figure 112020129306748-pat00015
표적화된 DNA 영역이 캡처 프로브와 결합된 후, 이들을 나머지 게놈 DNA로부터 정제하여 표적의 농축된 용액을 생성한다. 3' 캡처 프로브의 결합 서열에 대한 안티센스 올리고(항 G-서열)로 코팅된 비드를 실온에서 15분 동안 캡처 반응 믹스와 함께 배양한다. 결합 단계 후, 비드를 0.1x SSPE로 3회 세척하여 비표적 DNA 및 바이오틴 함유 5' 캡처 프로브를 제거한다. 세척 후, 비드를 14 μL의 0.1x SSPE에 재현탁한 다음 45℃에서 10분 동안 가열하여 비드로부터 정제된 DNA 표적을 용리시킨다. 용리 후, 1 μL의 5 M NaCl을 첨가하여 캡처 프로브가 DNA 표적에 결합된 상태를 유지하게 한다.
샘플 제조 과정의 최종 단계는 DNA 표적을 플로우 셀 표면 상에 증착시키는 것이며, 플로우 셀 표면 상에서 이들은 본원에 개시된 바와 같이 본 발명의 프로브를 사용하여 분석될 수 있다. 모든 표적이 채널의 높이를 가로질러 확산하고 스트렙타비딘 표면에 결합하는 시간을 갖도록, 주사기 펌프를 이용하여 표적이 플로우 셀 유체 채널 내로 로딩되는 속도를 제어한다. 이 로딩 방법은 표적의 밀도 구배를 생성하며, 단위 면적당 최대 분자 수는 유체 채널 입구에서 가장 크고 출구 쪽으로의 유체 유동의 방향으로 채널 길이를 따라 감소한다. 0.35 μL/초의 유속은 1.6 mm의 채널 폭 및 40 μm의 높이에 대해 약 10 mm의 채널 길이 내에서 정량적 캡처를 달성한다. 표적이 바이오티닐화된 5' 캡처 프로브에 의해 표면에 결합되면, 3' 캡처 프로브의 결합 서열의 역 보체인 바이오티닐화된 올리고(G-후크)의 용액을 주입하여 표적의 유리 말단을 고정시켜 중간에 있는 ssDNA 영역이 관심있는 시퀀싱 윈도우인 가교된 구조를 생성한다. 다음으로, G-서열 올리고의 용액을 첨가하여 표면 상의 과량의 G-후크에 혼성화시켜 표면 상의 ssDNA의 양을 감소시킨다. 도 11은 본 발명의 2개의 캡처 프로브 시스템을 사용한 표적 핵산의 캡처를 나타낸다.
실시예 7 - Hyb & Seq를 위한 다중 색상 리포터 이미지 처리
이미지 처리 파이프라인은 하기 단계 백그라운드 차감, 등록, 특징 검출, 및 분류를 포함한다. 백그라운드 차감에서, 임의의 주어진 채널의 평균 백그라운드는 샷 노이즈 및 노출의 함수이다. 본 발명자들의 시스템에서, 청색 채널은 더 큰 변동(variance)을 동반하는 가장 높은 백그라운드 수준을 갖는다. 반경 7 픽셀의 원형 구조 요소를 갖는 간단한 탑햇(tophat) 필터를 적용하여 국소화된 백그라운드 차감을 수행한다. 등록을 위해, 관심있는 특징이 다중 색상 및 다중 사이클 특징 분석을 위해 완벽하게 정렬되어야 한다. 이 시스템은 2가지 형태의 등록이 필요하다. 첫 번째 형태의 경우, 국소 어파인 변환(local affine transformation)이 단일 획득 스택 내의 모든 이미지 채널에 적용된다. 이 변환은 광학 시스템의 함수이므로, 주어진 기기와 일치한다. 이 함수는 매 실행마다 미리 계산되고 획득된 모든 이미지에 적용된다. 두 번째 형태의 경우, 실행 동안 기계적 갠트리(mechanical gantry)의 드리프트(drift)를 캡처하기 위해 정규화된 교차 상관관계를 사용하여 엄격한 변위(rigid shift) 형태의 전체 변환(global transformation)을 계산한다.
모든 이미지가 등록되면, LoG(Laplace of Gaussian) 필터를 통해 매치된 필터를 사용하여 특징을 검출한다. 필터를 고정된 커널 크기(특징의 회절 한계에 매치됨) 및 매치하기 위한 다양한 표준 편차(상응하는 채널의 파장에 매치됨)로 적용하여 스팟 반응을 향상시킨다. 극대값(local maxima)을 사용하여 잠재적인 리포터 위치를 식별한다. 각각의 식별된 특징에 대한 연관된 강도 값을 분류를 위해 검색한다. 최종 단계는 분류이다. 다중 색상 리포터 강도를 가우시안 나이브 베이즈(Gaussian naive-Bayes) 모델을 사용하여 분류한다. 모델은 리포터 강도가 독립적이며 정규 분포를 따르는 것으로 가정한다. 그 후, 모델은 최대 사후 확률(maximum a posteriori) 또는 MAP 규칙을 사용하여 특정 특징
Figure 112020129306748-pat00016
(모든 채널에서의 강도
Figure 112020129306748-pat00017
에 의해 특정됨)가 특정 클래스(Ck)에 속할 확률을 계산한다:
Figure 112020129306748-pat00018
특정 색상 조합으로 표지된 리포터 복합체에 대한 강도 분포가 도 36에 나타나 있다. 도 36은 2가지 염료인 청색 및 적색을 사용하는 코딩 방식을 예시한다. 2-색상 코딩 시나리오에서 가능한 6개의 클래스(백그라운드 포함)가 있다. 구현된 시스템에서, 4개 색상의 선택은 14개의 잠재적인 클래스를 초래한다. 단일 절반 염료 대 전체 염료 분포 사이에 일부 중첩이 있음에 유의한다. 결과적으로, 이들 클래스 사이의 분류는 'xG'및 'GG' 사이에 11.8%의 최대 오분류율을 갖는 더 높은 오류율을 나타낸다. 10 클래스 모델에 대한 오분류율은 0.2% 미만이다. 각각의 리포터는 최대 8개 클래스가 필요하므로, 최소 분류 오류를 갖는 것을 선택하는 것이 간단하다. 검출된 색상 코드는 룩업 테이블(look up table)에 기초하여 식별된 염기 쌍으로 번역된다. 본원에 개시된 바와 같은 본 발명의 프로브를 사용하여, 특징이 다중 사이클에 걸쳐 추적된다.
실시예 8 - 캡처 프로브를 사용한 표적 핵산 정제 및 증착
표적 핵산 분자를 캡처하기 위해, 2개의 캡처 프로브 시스템을 매우 특이적 농축에 사용한다. 캡처 프로브를 관심있는 표적화된 영역에 플랭킹한 위치에서 표적 핵산에 결합하여, "시퀀싱 윈도우"를 생성하도록 디자인한다. CapB로 지칭되는 5' 캡처 프로브는 3' 바이오틴 모이어티를 함유한다. CapA로 지칭되는 3' 캡처 프로브는 G-서열로 지칭되는 5' 친화도 태그 서열을 함유한다. 평균적으로, 캡처 프로브는 약 40개 뉴클레오타이드 길이이며, Tm 및 서열 문맥에 기초하여 디자인된다. 시퀀싱 윈도우는 약 70개 뉴클레오타이드 길이이며, 쉽게 조절된다. 도 11은 2개의 캡처 프로브 시스템의 개략도를 나타낸다.
CapB 상의 바이오틴 모이어티는 시퀀싱을 위해 표적 핵산을 스트렙타비딘 코딩된 플로우 셀 표면에 연결시킨다. CapA 상의 친화도 태그는 정제 동안 표적 핵산 분자를 자기 비드에 가역적으로 결합시킨다. 표적이 자기 비드 정제 및 표면 증착 과정 모두에서 생존하도록 두 프로브가 단일 표적 핵산 분자에 결합된 상태를 유지하므로 CapA 및 CapB의 사용은 매우 엄격한 표적 농축을 가능하게 한다. 멀티플렉스된 캡처는 한 번에 최대 100개의 표적으로 입증되었다. 단시간에 효율적인 캡처를 달성하기 위해, 캡처 프로브를 1 nM 내지 10 nM의 농도 범위로 첨가한다.
실험에서, ~10개 표적 핵산 분자의 패널을 G-비드 및 2개의 프로브 캡처 시스템을 사용하여 정제하였다. CapA 및 CapB 프로브를 먼저 표적 핵산에 혼성화시켰다. 그 후, 결합된 CapA 프로브의 G-서열 부분을 G-비드 상의 G-후크에 혼성화시켜, 표적 핵산 분자를 G-비드에 연결시켰다. 0.1x SSPE를 사용한 일련의 엄격한 세척을 수행하여 비표적화된 DNA 및 결합되지 않은 CapB를 제거하였다. G-비드로부터 표적 핵산 분자를 방출하기 위해, 낮은 염, 45℃ 용리를 수행하여 CapA 및 CapB가 여전히 표적 핵산에 혼성화된 상태를 유지하도록 하면서 G-서열을 변성시켰다.
테스트는 ~100개 표적 핵산 분자의 패널을 정제할 때 비특이적/백그라운드 신호가 유의하게 증가한다는 것을 보여준다. 이러한 백그라운드의 증가는 (1) 정제를 통해 운반된 유리 CapB 프로브의 양을 증가시키는 CapA 및 CapB 프로브 종 사이의 증가된 상호작용; 및 (2) 원하지 않은 표적을 정제시키는 CapB 프로브 및 G-후크 또는 G-비드 사이의 증가된 상호작용을 포함하는 몇 가지 인자 때문일 수 있다. 또한, 패널의 크기가 증가함에 따라, CapB 종, CapA 종, 및 시퀀싱 프로브 사이의 가능한 상호작용은 기하급수적으로 증가한다. 이러한 상호작용은 표적을 조밀하게 증착시키는 능력을 방해하고 시퀀싱 리드의 낭비를 초래할 수 있다.
유리 프로브 종 및 원하지 않는 표적 핵산 분자의 정제로 인한 비특이적인 백그라운드 신호를 감소시키기 위해, 정제 절차에 대한 몇 가지 변형이 이뤄질 수 있다. 첫 번째로, 표적 핵산 분자가 G-비드에 결합하는 동안 사용된 완충제에 30% v/v의 농도의 포름아미드를 포함시키는 것은 아마도 유리 캡처 프로브와 G-후크의 불완전한 혼성화를 방해하는 것을 통해 백그라운드 카운트를 2배 감소시켜(표적 분자가 결여된 대조군에서의 카운트에 의해 측정된 바와 같음), 과량의 프로브를 씻어낸다. 두 번째로, G-비드 상의 G-후크에 4개 이소-dG 염기(이소-G-후크) 및 CapA G-서열에 상보적인 이소-dC 염기를 포함시키는 것은 백그라운드 수를 3배 감소시킨다(표적 분자가 결여된 대조군에서의 카운트에 의해 측정된 바와 같음). 이소-dC 및 이소-dG는 천연 dC 및 dG 염기의 이성질체 변이체이다. 이소 염기는 다른 이소 염기와 염기 쌍을 형성하지만 천연 염기와는 염기 쌍을 형성하지 않을 것이므로, 캡처 프로브와 이소-G-후크 사이의 불완전한 혼성화는 G-서열의 비이소 염기 및 이소-G-후크 사이에서만 존재할 수 있다. 이들 불완전한 상호작용은 엄격한 세척 동안 더욱 쉽게 파괴된다. 마지막으로, Ampure® XP(Agencourt Biosciences Company) 비드를 사용한 이소-G-비드의 후속 정제는 백그라운드 카운트를 적어도 20배 더 감소시킨다(표적 분자가 결여된 대조군에서의 카운트에 의해 측정된 바와 같음). Ampure® XP 비드 정제 동안, DNA 샘플을 폴리에틸렌 글리콜(PEG) 및 NaCl의 용액 중의 카르복실화된 자기 비드의 현탁액과 혼합한다. PEG 및 NaCl의 농도는 분자량 역치를 초과하는 분자만 침전되어 비드에 결합하도록 적정될 수 있다. 캡처 프로브에 혼성화된 Hyb & Seq 표적은 약 81 kDa인 반면, 유리 프로브는 약 17 kDa 이하이다. Ampure® XP 비드 현탁액을 이소-G-비드 용리액과 1.8:1의 부피 비율로 혼합함으로써, 혼성화된 표적을 비드에 결합시키고, 유리 프로브의 유의한 부분을 최종 용리 전에 씻어 낼 수 있다.
따라서, 모델 정제 작업흐름은 하기 단계로 구성된다: (1) 5x SSPE/30% 포름아미드에서 이소-G-비드에 대한 캡처 프로브-표적 핵산 조립체의 혼성화; (2) 0.1x SSPE로 이소-G-비드의 세척; (3) 0.1x SSPE에서 45℃에서 캡처 프로브-표적 핵산 조립체의 용리; (4) 1.8x 부피의 Ampure® XP 비드에 대한 이소-G 비드 용리액의 결합; (5) 75% 에탄올을 이용한 Ampure® XP 비드의 세척; 및 (6) 표적이 7.5 μL에서 용리되도록 0.1x SSPE에서 캡처 프로브-표적 핵산 조립체의 용리 후 0.5 μL의 5 M NaCl의 첨가.
정제 후, 정제된 표적을 플로우 셀을 통해 천천히 주입하는 주입 시린지 펌프를 사용하여 캡처 프로브-표적 핵산 조립체를 시퀀싱 표면 상에 증착시킨다. 증착 구배를 결정하기 위해, 플로우 셀을 채널 길이를 따라 다양한 위치에서 이미징한다. 전형적인 증착 구배가 도 37에 나타나 있다. 20 μm의 채널 높이의 경우, 0.167 μL/분의 유속으로 샘플을 로딩하는 것은 모든 표적의 80%가 채널 길이를 따라 5.1 mm 이내에서 결합하도록 표적을 집중시킬 것이고, 이는 0.0357 mm2의 FOV 및 1.7 mm의 플로우 셀 채널 폭을 갖는 Gen2 이미저(imager)에 대해 ~240 FOV에 해당한다. 구배는 증착 동안 유속을 조절함으로써 조절될 수 있다.
상기 기재된 절차를 사용하여 ~300 염기 쌍의 크기로 전단된 게놈 DNA를 갖는 100플렉스 표적 핵산 패널의 정제 및 증착을 테스트하였다. 일련의 실험을 25 ng 내지 500 ng의 DNA 투입량 범위로 3 반복 수행하였다. 도 38에 나타낸 바와 같이 평균 카운트를 얻기 위해 증착 구배를 이미지화하여 플로우 셀 상의 표적의 총 수를 추정하였다. 캡처 효율은 6.6%였고, 이는 DNA 질량 투입량의 범위에서 일관되었다.
실시예 9 - 시퀀싱 프로브의 디자인 및 특징
시퀀싱 프로브는 표적 결합 도메인을 통해 표적 핵산 분자에 혼성화한다. 본 실시예에서, 표적 결합 도메인은 8개 뉴클레오타이드 길이이며, 유니버설/축퇴성 염기 또는 표준 염기일 수 있는 (N) 염기에 의해 플랭킹된 잠금 핵산(LNA) 헥사머를 함유한다(N1-B1- B2- B3- B4- B5- B6-N2, 여기서 B1 내지 B6은 LNA이며, N1 및 N2는 (6머) 서열 B1- B2- B3- B4- B5- B6의 핵산 서열에 무관한 유니버설/축퇴성 염기 또는 표준 염기임). 4,096개 시퀀싱 프로브의 완전한 세트는 모든 가능한 헥사머를 코딩하고 임의의 표적 핵산의 시퀀싱을 가능하게 한다. 각각의 시퀀싱 프로브는 또한 표적 결합 도메인에 존재하는 헥사머 서열을 코딩하는 바코드 도메인을 포함한다. 각각의 바코드 도메인은 3개의 위치(R1, R2, 및 R3)를 함유한다. 바코드 도메인 내의 각각의 위치는 표적 결합 도메인의 헥사머 내의 특정 디뉴클레오타이드에 상응하고 특정 표지된 리포터 복합체에 결합할 수 있는 특유의 서열을 함유한다. 시퀀싱 프로브의 개략적인 개요가 도 1에 나타나 있다. 바코드 도메인 내의 각각의 위치는 4개 형광 염료인 청색(B); 녹색(G); 황색(Y); 및 적색(R)을 사용하여 생성된 8개의 "색상 조합"을 코딩한다. 시퀀싱의 각각의 사이클 동안, 리포터 복합체는 바코드 도메인 내의 3개의 위치 중 하나에 결합하며, 이는 표적 결합 도메인의 헥사머 내의 상응하는 디뉴클레오타이드의 정체를 나타낸다. 3개의 순차적 시퀀싱 사이클 동안, 3개의 "색상 조합"이 바코드 도메인 내의 각각의 위치에 대해 하나씩 기록되어, 표적 결합 도메인의 전체 헥사머의 식별을 가능하게 한다. 4,096개 시퀀싱 프로브는 8개 풀로 나뉘며, 각각은 512개의 가능한 바코드 중 하나와 연관된다.
실시예 10 - 리포터 복합체 디자인, 정제, 및 결합 조건
본 실시예에서, 각각의 리포터 복합체는 색상 조합의 각각의 색상에 대해 15개 염료를 갖는 총 30개 형광 염료를 갖도록 디자인된 37개 DNA 올리고머 분지 구조이다. 리포터 복합체를 구성하는 37개 DNA 올리고머는 이들의 크기에 의해 분류될 수 있다. 일차 핵산으로 불리는 가장 큰 올리고머는 12 또는 14개 뉴클레오타이드 길이의 상보적 핵산에 공유 결합된다. 일차 핵산은 96개 뉴클레오타이드 길이이다. 일차 상보적 핵산은 시퀀싱 프로브의 바코드 도메인 상의 위치 R1, R2, 또는 R3에 결합한다. 다음으로 큰 DNA 올리고머는 89개 뉴클레오타이드 길이이며 이차 핵산으로 불린다. 색상 조합의 각각의 색상당 3개의 이차 핵산을 갖는, 리포터 복합체당 6개의 이차 핵산이 있다. 각각의 이차 핵산은 이차 핵산을 일차 핵산에 혼성화시키는 14개 뉴클레오타이드 길이 서열을 포함한다. 가장 작은 DNA 올리고머는 15개 뉴클레오타이드 길이이며 삼차 핵산으로 불린다. 색상당 15개의 삼차 핵산을 갖는, 2개의 색상 프로브당 30개의 삼차 핵산이 있다. 5개의 삼차 핵산은 각각의 이차 핵산에 결합한다. 37개 DNA 올리고머 분지 구조의 개략도가 도 4에 나타나 있다.
삼차 핵산은 형광 염료 형태의 검출 가능한 표지를 포함한다. 4개의 형광 염료가 있다: 청색 (B); 녹색 (G); 황색 (Y); 및 적색 (R). 리포터 복합체에서 염료를 조합하는 것은 10개의 가능한 2-색상 조합(BB, BG, BR, BY, GG, GR, GY, RR, YR, YY)을 생성한다. 상이한 형광 염료 사이에 색상 교환 또는 교차 혼성화를 방지하기 위해, 특정 형광 염료에 상응하는 각각의 이차 및 삼차 핵산은 특유의 서열을 함유한다. 예를 들어, Alexa 488 형광단, 또는 청색 색상으로 표지된 각각의 삼차 핵산은 청색 이차 핵산에만 상보적인 서열을 포함한다. 청색 이차 핵산은 청색을 포함하는 색상에 상응하는 일차 핵산 분자에만 상보적인 구별되는 서열을 추가로 갖는다.
각각의 상보적 핵산은 시퀀싱 프로브의 바코드 도메인의 위치 R1, R2, 및 R3 사이에 구별되는 서열을 함유한다. 따라서, 동일한 바코드 도메인 상의 위치 R1 및 R2가 동일한 디뉴클레오타이드를 코딩하더라도, 위치 R1에서의 상기 디뉴클레오타이드를 식별하는 상보적 핵산 분자의 결합은 위치 R2에 결합하지 않을 것이다. 마찬가지로, 위치 R2에서 상기 디뉴클레오타이드를 식별하는 상보적 핵산 분자는 위치 R1에 결합하지 않을 것이다. 상보적 핵산은 이들이 경쟁적인 토홀드 교환(상보적 핵산 12개 뉴클레오타이드 길이의 경우) 또는 UV 절단(상보적 핵산 14개 뉴클레오타이드 길이의 경우)을 사용하여 효율적으로 시퀀싱 프로브로부터 결합해제되도록 디자인된다.
리포터 복합체의 제조는 2개의 연속적인 혼성화 단계에서 발생한다: (1) 이차 핵산에 대한 삼차 핵산의 혼성화 및 그 다음 (2) 일차 핵산에 대한 삼차 핵산 + 이차 핵산의 혼성화. 4개의 분리된 삼차 핵산-대-이차 핵산 반응은 100 uM의 이차 핵산 및 600 uM의 삼차 핵산을 실온에서 30분 동안 4.2X SSPE 완충제에서 조합함으로써 제조된다. 그 후, 24개 리포터 프로브를 4.8X SSPE에서 2 uM의 일차 핵산, 7.2 uM의 이차 핵산+염료 #1 삼차 핵산, 및 7.2 uM 이차 핵산+염료 #2 삼차 핵산을 사용하여 별도로 제조한다. 이들 반응을 45℃에서 5분 동안 가열한 다음, 실온에서 30분 동안 냉각시킨다. 그 후, 24개 반응을 바코드 도메인(즉 R1, R2, 및 R3)에 상응하는 3개의 상이한 풀로 모은다. 예를 들어, R1 바코드 도메인에 결합하는 8개의 상이한 리포터 프로브(각각 2 uM)를 모아, 200 nM 각각의 리포터 복합체의 최종 작업 농도로 10배 희석한다. 리포터 복합체는 고압 액체 크로마토그래피(HPLC)를 사용하여 정제될 수 있다. 도 39는 HPLC 정제가 유리 올리고머 및 기형(malformed) 프로브를 제거하여 리포터 프로브를 생성할 수 있음을 보여준다.
리포터 복합체 제조 후, 품질 보증을 위한 표준 시험이 있다. 리포터 프로브의 3개의 풀 각각을 3개의 개별 플로우 셀에서 그의 상응하는 바코드 영역(R1, R2, 또는 R3)에의 결합에 대해 테스트한다. 테스트 바코드 도메인만이 존재하고 플로우 셀 상에 고정화된 변형된 시퀀싱 프로브 구성물 상에서 수행한다. 각각의 색상을 나타내는 모든 8개의 12머는 멀티플렉스되고 모든 8개의 리포터 프로브는 높은 색상 수로 식별될 것으로 예상된다.
리포터 프로브 및 시퀀싱 프로브의 바코드 도메인의 혼성화의 효율 및 정확도를 개선하기 위해, 다양한 완충제 첨가제를 테스트하였다. 도 40은 5% 황산 덱스트란(500K) 및 15% 포름아미드 또는 15% 에틸렌 카보네이트 중 하나를 함유하는 완충제가 짧은 혼성화 시간에 리포터 프로브 및 시퀀싱 프로브의 가장 효율적이고 정확한 혼성화를 허용한다는 것을 나타내는 실험의 결과를 보여준다. 그러나, 도 41은 에틸렌 카보네이트가 시퀀싱 슬라이드의 표면에 부정적인 영향을 미쳐, 시간 경과에 따라 표적 핵산의 높은 손실을 초래한다는 것을 나타내는 실험의 결과를 보여준다. 따라서, 5% 황산 덱스트란(500K) 및 15% 포름아미드를 함유하는 완충제가 리포터 프로브 및 시퀀싱 프로브의 효율적이고 정확한 혼성화에 우월하다.
실시예 11 - 상보적 핵산 서열의 디자인 및 검증
리포터 프로브는 시퀀싱 프로브의 바코드 도메인 상의 특정 위치(R1, R2, 또는 R3)에 결합하는 상보적 핵산을 함유한다. 12개 뉴클레오타이드(12머) 또는 14개 뉴클레오타이드(14머)를 함유하는 상보적 핵산을 디자인하고 혼성화를 위한 최적 서열을 결정하기 위해 테스트하였다. 스크리닝을 위해, 하기 기준을 사용하여 최적 서열을 결정하였다: 서열은 10개의 시퀀싱 사이클에서 > 80% 효율로 결합하는 리포터 및 시퀀싱 프로브에 의해 정의된 바와 같은 높은 결합 효율을 나타내야 하며; 서열은 15초 내지 30초 이내에 발생하는 빠른 혼성화 동역학을 나타내야 하고; 서열은 리포터 풀에서 < 5% 교차 혼성화 오류로 높은 특이도를 나타내야 한다.
표 4는 식별된 24개의 12머 서열(서열번호: 19-42)을 나타낸다. 각각의 바코드 도메인은 3개의 위치를 함유하므로, 24개의 12머 서열은 3개의 그룹으로 나뉘어 8x8x8 12머 리포터 세트를 생성할 수 있다.
Figure 112020129306748-pat00019
14머 서열을 유사한 방식으로 디자인하였지만, 3가지 방식에서 12머 서열과 상이하다. 첫째, 14머 서열이 12머에 존재하는 12개 단일 가닥의 뉴클레오타이드가 아닌 바코드 도메인 상의 특정 위치에 결합하는 14개 단일 가닥의 뉴클레오타이드를 함유한다는 것을 고려하면 14머 서열은 더 긴 혼성화 서열을 함유한다. 둘째, 14머 서열은 토홀드 매개 제거를 수용하도록 디자인되지 않았기 때문에 더 많은 서열 다양성을 함유한다. 14머 서열은 시퀀싱 프로브에 더 강하게 혼성화하므로, 토홀드 매개 제거의 효율은 감소된다. 따라서, 서열 독립적인 제거 전략을 14머 서열에 대해 조사하여, 스크리닝 동안 서열 제한을 경감시켰다. 스크리닝을 위한 서열을 다음 규칙 세트를 포함하는 알고리즘을 사용하여 디자인하였다: "G" 또는 "C" 중 어느 하나가 결여된 뉴클레오타이드 조성물(즉, 낮은 복잡성 서열); 40% 내지 60%의 GC 함량; 35℃ 내지 37℃의 멜팅 온도(Tm); 헤어핀 폴딩 에너지(dG) > 2; 및 다른 시퀀싱 프로브와의 양립성(해밍 거리 >= 7). 표적 핵산에 존재할 수 있는 게놈 서열에 대한 14머 서열의 혼성화를 최소화하기 위해, 외부 RNA 대조군 컨소시엄 서열을 가이드로서 사용하여 잠재적인 서열을 필터링하였다. 셋째, 14머 상보적 핵산이 리포터 복합체의 일차 핵산에 부착되는 지점에서 절단 가능한 링커 변형을 사용한 가닥 절단에 의해 시퀀싱 프로브의 바코드 도메인으로부터 제거되도록 14머 서열을 디자인하였다. 14머 서열의 제거는 리포터 복합체 신호의 "어둡게 하기"를 초래하여, 시퀀싱 및 신호 검출의 다음 사이클을 발생시켰다. UV 광 절단 가능한 링커, 환원제(예컨대 TCEP) 절단 가능한 링커 및 효소적으로 절단 가능한 링커(예컨대 USER™ 효소에 의해 절단된 우라실)를 포함하는 다양한 절단 가능한 링커 변형을 테스트하였다. 이들 절단 가능한 링커 변형 모두는 효율적인 리포터 복합체를 어둡게 하는 것을 촉진하는 것으로 밝혀졌다. 어둡게 하는 것은 이차 핵산 내에 절단 가능한 링커 변형을 도입함으로써 더 향상되었다. 이들 절단 가능한 링커 변형을 일차 핵산에 혼성화하는 서열 및 삼차 핵산에 혼성화하는 서열 사이에 위치시켰다. 도 10은 리포터 프로브 내의 절단 가능한 링커 변형을 위한 가능한 위치를 나타낸다.
잠재적인 14머 서열의 스크리닝은 허용가능한 서열의 두 그룹의 식별을 초래하였다. 표 5는 24개 서열(서열번호: 43-66)을 함유한 제1 그룹을 나타낸다. 이들 24개 서열은 3개의 그룹으로 나뉘어 8x8x8 14머 리포터 세트를 생성할 수 있었다.
Figure 112020129306748-pat00020
표 6은 30개 서열(서열번호: 67-96)을 함유한 다른 그룹을 나타낸다. 이들 30개 서열은 3개의 그룹으로 나뉘어 10x10x10 14머 리포터 세트를 생성할 수 있었다.
Figure 112020129306748-pat00021
스크리닝 후, 8x8x8 12머, 8x8x8 14머, 및 10x10x10 14머 리포터 세트를 실험적으로 검증하였다. 8x8x8 12머 결합 방식의 경우, Hyb & Seq 원형을 사용하여 검증을 수행하여 10개 시퀀싱 사이클을 기록하였다. 리포터 프로브의 3개의 풀을 긴 및 짧은 작업흐름 방법 모두에서 사용하였다. 모든 512개의 가능한 시퀀싱 프로브 바코드 도메인을 테스트하였다. 표 7은 긴 및 짧은 작업흐름 방법의 실험 단계를 나타낸다.
Figure 112020129306748-pat00022
긴 작업흐름 실험은 >97% 어둡게 하기 효율을 초래하였다. 짧은 작업흐름 실험의 경우, 어둡게 하는 것이 효과적인 것으로 간주되었지만, 어두워지지 않은 리포터의 작은 빈도가 각각의 이미지로 이어져 새로운 리포터로서 잘못 콜링될 것으로 예상되었다. 실제로, 짧은 작업흐름 실험에서 가장 높은 바코드 수는 YYYYYY였으며, 이는 어둡게 되지 않은 백그라운드의 인공물일 가능성이 컸다. 도 42는 8x8x8 12머 리포터 세트의 성능이 긴 작업흐름과 비교하여 짧은 작업흐름에서 일반적으로 더 낮았음을 보여준다. 리포터 복합체 1(바코드 도메인의 위치 R1에 결합함) 및 리포터 복합체 3(바코드 도메인의 위치 R3에 결합함)은 긴 작업흐름과 비교하여 짧은 작업흐름에서 더 낮은 효율을 가지고 있었다. 이것은 리포터 복합체 3에 대해 예상되는데, 그것이 리포터 혼성화를 방해할 수 있는 각각 2.5 uM의 고농도로 8개의 추가적인 토홀드 올리고뉴클레오타이드를 포함하기 때문이다. 리포터 복합체 1은 2개의 작업흐름 간에 유사하게 행동해야 하는데, 짧은 또는 긴 작업흐름에서 제1 리포터 복합체를 제거하기 위해 토홀드가 사용되지 않았기 때문이다. 총 오류는 또한 모든 3개의 리포터 프로브에 대해 긴 작업흐름과 비교하여 짧은 작업흐름에서 더 높았다(1.3 내지 2배).
8x8x8 14머 리포터 세트를 모든 512개의 가능한 시퀀싱 프로브 바코드 도메인에 대한 혼성화의 효율, 특이도, 및 속도를 테스트함으로써 검증하였다. 시퀀싱 프로브 바코드 도메인을 Hyb & Seq 시퀀싱 카트리지의 유리 상에 직접 고정시켰다. 도 43은 8x8x8 14머 리포터 프로브가 5.1%의 평균 오류율로 15초 만에 88%의 평균 효율로 혼성화하였음을 보여준다. 이 오류의 대부분은 부정확한 혼성화가 아닌 리포터의 부정확한 식별 때문이다. 리포터의 잘못된 오분류는 리포터 오류의 가장 큰 요소로 남아 있다.
10x10x10 14머 리포터 세트를 30개의 상보적인 절단된 시퀀싱 프로브 바코드 도메인에 대한 혼성화의 효율, 특이도, 및 속도에 대해 테스트함으로써 검증하였다. 각각의 바코드 도메인은 하나의 리포터 결합 부위만을 함유하였다. 이들 바코드 도메인을 Hyb & Seq 시퀀싱 카트리지의 유리 상에 직접 고정시켰다. 도 44는 10x10x10 14머 리포터 세트가 5.0%의 평균 오류율로 15초 만에 90%의 평균 효율로 혼성화하였음을 보여준다. 다시, 오류의 대부분은 부정확한 혼성화가 아닌 리포터의 부정확한 식별 때문이었다.
실시예 12 - 표준 및 3부분 시퀀싱 프로브의 디자인 및 테스트
시퀀싱 프로브는 표적 결합 및 바코드 도메인은 이중 가닥의 "스템(stem)"에 의해 분리된다. 도 2는 실험적으로 테스트된 2개의 시퀀싱 프로브 구조를 나타낸다. 표준 시퀀싱 프로브 상에서, 표적 결합 및 바코드 도메인은 동일한 올리고뉴클레오타이드 상에 존재하며, 이는 스템 올리고뉴클레오타이드에 결합하여 36개 뉴클레오타이드 길이의 이중 가닥의 영역을 생성한다. 이 구조를 사용하여, 프로브 풀 내의 각각의 시퀀싱 프로브는 동일한 스템 서열을 사용한다. 3부분 프로브 상에서, 표적 결합 및 바코드 도메인은 36개 뉴클레오타이드 스템 올리고뉴클레오타이드에 의해 함께 결합된 별도의 DNA 올리고뉴클레오타이드이다. 바코드 도메인의 가능한 교환을 방지하기 위해, 각각의 바코드는 특유의 스템 서열을 가지며 시퀀싱 프로브를 모으기 전에 개별적으로 혼성화된다.
도 45는 3부분 시퀀싱 프로브를 표준 시퀀싱 프로브와 비교하기 위해 수행된 일련의 실험의 결과를 보여준다. 이들 실험은 3부분 시퀀싱 프로브가 제3 리포터 프로브의 검출을 포함하여 두 가지 구성에 대해 모든 리드의 ~80%로 전체 시퀀싱 사이클에서 살아남는다는 것을 확인시켜 주었다. 표준 시퀀싱 프로브와 비교할 때, 3부분 프로브는 ~12% 더 적은 수를 나타낸다. 바코드 도메인 올리고의 교환 성향을 연구하기 위해, 동일한 스템 서열을 함유하는 고농도의 짧은 대안적인 올리고뉴클레오타이드를 반응에 첨가하였다. 결과는 검출된 3부분 시퀀싱 프로브의 ~13%가 바코드 올리고를 교환하였음을 나타내었다. 올리고뉴클레오타이드 교환은 특유의 스템 서열의 혼입으로 완화될 필요가 있을 것이다. 약간의 성능 감소에도 불구하고, 3부분 프로브는 디자인 유연성, 빠른 올리고 합성, 및 비용 감소의 이점을 제공한다.
실시예 13 - 표적 결합 도메인에서 잠금 핵산 치환의 효과
시퀀싱 프로브의 표적 결합 도메인 내로의 잠금 핵산(LNA)의 치환의 효과를 하기와 같이 테스트하였다. 시퀀싱 프로브를 용액 중에서 리포터 프로브에 혼성화시키고 적절하게 형성된 시퀀싱 프로브-리포터 프로브를 정제하였다. 그 후, 시퀀싱 프로브-리포터 프로브를 용액 중에서 합성 표적 핵산에 혼성화시키고 원형 시퀀싱 카트리지에 로딩하였다. 합성 표적 핵산은 50개 뉴클레오타이드로 구성되었고 바이오티닐화되었다. 시퀀싱 프로브를 개별적으로 또는 9개의 풀에서 테스트하였다. 9개의 시퀀싱 프로브의 풀의 경우, 프로브를 표적 핵산의 길이를 따라 결합하도록 디자인하였다. 분석을 위해, 전체 반응을 브레드보드(breadboard) 기기에 의해 스트렙타비딘 코팅된 커버 슬라이드 상에 증착시킨 다음, 유동 스트레치하였다. 그 후, 리포터 프로브를 이미지화하고, 적절한 기기 및 소프트웨어를 사용하여, 예를 들어 NanoString nCounter® 기기 및 소프트웨어를 사용하여 계수하였다.
각각의 시퀀싱 프로브는 10개 뉴클레오타이드(서열번호: 97)의 표적 결합 도메인을 함유하였다. 도 46에 나타낸 위치에 2, 3, 또는 4개의 LNA 염기를 포함하도록 표적 결합 도메인 내에서 LNA 치환을 수행하였다. 도 46은 LNA 염기의 수가 증가함에 따라 표적 핵산에 대한 개별적인 시퀀싱 프로브의 결합 친화도가 증가하였음을 보여준다. 중요하게도, 도 46은 LNA 염기의 혼입이 서열 프로브 결합의 특이도을 감소시키지 않았음을 보여준다. 9개 시퀀싱 프로브의 풀을 테스트하여 프로브가 표적 결합에 대해 경쟁할 수 있을 때의 염기 커버리지를 결정하였다. 도 47은 단일 LNA 프로브가 풀에 도입되었을 때, 주변 프로브의 결합에 거의 영향을 미치지 않으면서 영향을 받은 염기의 커버리지가 증가되었음을 보여준다. 이들 결과는 LNA 염기 치환이 특이도를 감소시키지 않으면서 염기 민감도를 개선할 수 있음을 보여주었다.
실시예 14 - 표적 결합 도메인에서 변형된 뉴클레오타이드 및 핵산 유사체 치환의 효과
시퀀싱 프로브의 표적 결합 도메인 내로 잠금 핵산(LNA), 가교 핵산(BNA), 프로핀 변형된 핵산, 지프 핵산(ZNA®), 이소구아닌 및 이소시토신을 포함하는 다양한 변형된 뉴클레오타이드 및 핵산 유사체의 치환의 효과를 다음과 같이 테스트하였다. 바이오티닐화된 표적 핵산 50개 뉴클레오타이드 길이를 원형 시퀀싱 카트리지의 스트렙타비딘 커버 슬라이드 상에 로딩하였다. 그 후, 시퀀싱 및 리포터 프로브를 샘플 챔버에 연속적으로 도입하고 Hyb & Seq 원형 기기를 사용하여 이미지화하였다. 이미지를 처리하여 각각의 상이한 시퀀싱 프로브에 대한 카운트를 비교하였다. 도 48에 나타낸 위치에서 LNA, BNA, 프로핀, 및 ZNA® 염기를 포함하도록 시퀀싱 프로브의 10개 뉴클레오타이드(서열번호: 99) 표적 결합 도메인에서의 치환을 수행하였다. 도 48은 LNA 및 BNA를 함유하는 프로브가 매칭 및 미스매치된 표적에 대해 검출된 카운트 수에 의해 나타낸 바와 같이, 특이도를 유지하면서 결합 친화도의 가장 큰 증가를 나타내었음을 보여준다. 이들 결과는 LNA 또는 BNA 염기 치환이 특이도를 감소시키지 않으면서 염기 민감도를 개선할 수 있음을 보여주었다.
실시예 15 - 본 발명의 시퀀싱 방법의 정확도 결정
도 49는 본 발명의 시퀀싱 방법의 미가공 특이도를 정량화한 실험의 결과를 나타낸다. 이 실험에서, 4개의 상이한 시퀀싱 프로브의 풀을 NRAS 엑손2(서열번호: 1)의 단편을 함유한 표적 핵산에 혼성화하는 시퀀싱 반응을 수행하였다. 각각의 시퀀싱 프로브(바코드 1 내지 4)는 도 49의 상부 패널에 도시된 바와 같이 표적 결합 도메인의 헥사머가 위치 b5에서 상이한 것을 제외하고 동일한 표적 결합 도메인을 가지고 있었다. 본 실시예에서, 바코드 4는 정확한 시퀀싱 프로브이다. 시퀀싱 프로브의 혼성화 후, 리포터 프로브를 바코드 도메인의 3개의 위치(R1, R2 및 R3) 각각에 연속적으로 혼성화시키고, 상응하는 형광 데이터를 기록하였다. 도 49의 중간 패널은 3개의 바코드 도메인 위치에 대해 각각의 색상 조합이 기록된 횟수 및 정확한 조합이 기록된 시간의 백분율을 나타낸다. R1에서의 색상 조합은 시간의 96%를 정확히 식별하였고, R2에서의 색상 조합은 시간의 97%를 정확히 식별하였으며, R3에서의 정확한 색상 조합은 시간의 94%를 정확히 식별하였다. 도 49의 하부 패널에 도시된 바와 같이, 이것은 94%의 전체적인 미가공 특이도를 야기하였다. 잘못 콜링된 바코드 도메인 위치를 설명할 수 있는 오류의 원인은 (a) 플로우 셀의 표면에 대한 리포터 프로브의 비특이적 결합 및 (b) 리포터 프로브의 부정확한 혼성화를 포함한다. 리포터 혼성화 오류의 예상된 양은 약 2 내지 4%였다.
도 50은 표적 핵산 내의 뉴클레오타이드가 1개를 초과하는 시퀀싱 프로브에 의해 시퀀싱될 때 본 발명의 시퀀싱 방법의 정확도를 결정하는 실험으로부터의 결과를 나타낸다. 도 50의 상부 패널에 나타낸 바와 같이, 본 실시예에서의 표적 핵산은 NRAS 엑손2의 단편(서열번호: 1)이다. 관심있는 특정 염기는 표적 핵산에서 강조표시된 시토신(C)이다. 관심있는 염기는 2개의 상이한 시퀀싱 프로브에 혼성화될 것이며, 각각 표적 핵산에 대한 혼성화의 뚜렷한 풋프린트를 갖는다. 본 실시예에서, 시퀀싱 프로브 1 내지 4(바코드 1 내지 4)는 관심있는 염기의 좌측의 3개의 뉴클레오타이드에 결합하는 반면, 시퀀싱 프로브 5 내지 8(바코드 5 내지 8)은 관심있는 염기의 좌측의 5개의 뉴클레오타이드에 결합한다. 도 50의 중간 패널은 시퀀싱 프로브의 바코드 도메인의 각각의 위치에서 특정 색상 조합이 기록된 횟수를 나타낸다. 이미지 정량 후 그리고 도 26에 도시된 염기 콜링 기술을 사용하여, ~98.98%의 평균 정확도가 기록될 수 있다.
SEQUENCE LISTING <110> NanoString Technologies, Inc. Dunaway, Dwayne Hoang, Margaret Gregory, Mark Kim, Dae Manrao, Elizabeth A Beechem, Joseph M Khafizov, Rustem Korukonda, Sanghamithra Deng, Yi <120> RAPID ENZYME- AND AMPLIFICATION-FREE SEQUENCING <130> NATE-033/001WO <150> US 62/424,887 <151> 2016-11-21 <150> US 62/457,237 <151> 2017-02-10 <150> US 62/536,147 <151> 2017-07-24 <160> 99 <170> PatentIn version 3.5 <210> 1 <211> 38 <212> DNA <213> Homo sapiens <400> 1 accgtgacat gagaagaaca ggtcgacata ggtcatac 38 <210> 2 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Example Consensus <400> 2 aacaccacct 10 <210> 3 <211> 24 <212> DNA <213> Homo sapiens <400> 3 gtctagctac agtgaaatct cgat 24 <210> 4 <211> 23 <212> DNA <213> Homo sapiens <400> 4 tcaaagtgct gggctccggt gcg 23 <210> 5 <211> 27 <212> DNA <213> Homo sapiens <400> 5 tagttggagc tggtggcgta ggcaaga 27 <210> 6 <211> 23 <212> DNA <213> Homo sapiens <400> 6 gaatgatgca catcatggtg gct 23 <210> 7 <211> 23 <212> DNA <213> Homo sapiens <400> 7 gcagctcatc acgcagctca tgc 23 <210> 8 <211> 23 <212> DNA <213> Homo sapiens <400> 8 atacagctgg acaagaagag tac 23 <210> 9 <211> 25 <212> DNA <213> Homo sapiens <400> 9 tggctcgaga tatcatgagt gattc 25 <210> 10 <211> 23 <212> DNA <213> Homo sapiens <400> 10 tcatcatagg tcgtcatgct tat 23 <210> 11 <211> 23 <212> DNA <213> Homo sapiens <400> 11 atggagtatg tgtctgtgga gac 23 <210> 12 <211> 23 <212> DNA <213> Homo sapiens <400> 12 gtgcaactct ccgtacatcg tgg 23 <210> 13 <211> 23 <212> DNA <213> Homo sapiens <400> 13 cagccgcgtg ctgcacacca acg 23 <210> 14 <211> 30 <212> RNA <213> Homo sapiens <400> 14 gcuucagcac cacuccacuc cacauucuca 30 <210> 15 <211> 30 <212> RNA <213> Homo sapiens <400> 15 uguccucaug uauuggucuc ucauggcacu 30 <210> 16 <211> 30 <212> RNA <213> Homo sapiens <400> 16 cuuucgccaa aguggaggag accaucgccg 30 <210> 17 <211> 30 <212> RNA <213> Homo sapiens <400> 17 gaaggugaug uuugggucag gugccuuagu 30 <210> 18 <211> 50 <212> DNA <213> Homo sapiens <400> 18 caaactggtg gtggttggag caggtggtgt tgggaaaagc gcactgacaa 50 <210> 19 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 19 aggacagatg ac 12 <210> 20 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 20 gtatcggatg ac 12 <210> 21 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 21 aggagtgatg ac 12 <210> 22 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 22 aggggtgagg ag 12 <210> 23 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 23 agaggggatg ac 12 <210> 24 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 24 agtggggagg ag 12 <210> 25 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 25 agccgagatg ac 12 <210> 26 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 26 agggtggatg ac 12 <210> 27 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 27 tggatggaaa ag 12 <210> 28 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 28 gaaggagaaa ag 12 <210> 29 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 29 ggggatgaaa ag 12 <210> 30 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 30 gtgagggaaa ag 12 <210> 31 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 31 agccgagaaa ag 12 <210> 32 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 32 cgagaggaaa ag 12 <210> 33 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 33 gagggcgaaa ag 12 <210> 34 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 34 agcgtggaaa ag 12 <210> 35 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 35 tgagaagggt ag 12 <210> 36 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 36 gttgttattg tg 12 <210> 37 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 37 tttgggttta gg 12 <210> 38 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 38 gttagtggga aa 12 <210> 39 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 39 atgggaaaaa gt 12 <210> 40 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 40 gagttggatg ag 12 <210> 41 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 41 atgttgtggg ta 12 <210> 42 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> 12-mer attachment position <400> 42 gagggtttta ag 12 <210> 43 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 43 atcttttccc cact 14 <210> 44 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 44 ccccactatt tctt 14 <210> 45 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 45 ctacccacaa cata 14 <210> 46 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 46 ccatataaac ccca 14 <210> 47 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 47 aaactccaat ctcc 14 <210> 48 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 48 ctattctcaa ccta 14 <210> 49 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 49 ccccctcttt taaa 14 <210> 50 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 50 ccaatcttac ctca 14 <210> 51 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 51 ccctcacata actt 14 <210> 52 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 52 ctcctctact ttcc 14 <210> 53 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 53 ccctaaaccc aaaa 14 <210> 54 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 54 cactttttcc catc 14 <210> 55 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 55 catctgattc ctcc 14 <210> 56 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 56 ctaaaccccc tact 14 <210> 57 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 57 cctttacaaa caca 14 <210> 58 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 58 ataccaccct cttt 14 <210> 59 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 59 tattcttcta cccc 14 <210> 60 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 60 tctacccttc tcat 14 <210> 61 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 61 ccacaataac aacc 14 <210> 62 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 62 accttaacat tccc 14 <210> 63 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 63 atttcccact aacc 14 <210> 64 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 64 acttaaaacc ctcc 14 <210> 65 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 65 tacctattcc tcca 14 <210> 66 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 66 cccctttctc taag 14 <210> 67 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 67 gatgatggta ggtg 14 <210> 68 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 68 atgagaaggg taga 14 <210> 69 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 69 gttttgttgg tgag 14 <210> 70 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 70 ttagtgtgtt ggag 14 <210> 71 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 71 atgtaggaga gaga 14 <210> 72 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 72 gggaatgtta aggt 14 <210> 73 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 73 ggttagtggg aaat 14 <210> 74 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 74 ggagggtttt aagt 14 <210> 75 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 75 gtagtgtgga tgtt 14 <210> 76 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 76 cttagagaaa gggg 14 <210> 77 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 77 ggaagaggat gaaa 14 <210> 78 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 78 aagttatgtg aggg 14 <210> 79 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 79 ggaaagtaga ggag 14 <210> 80 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 80 ttttgggttt aggg 14 <210> 81 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 81 agatgtatgg gtga 14 <210> 82 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 82 gatgggaaaa agtg 14 <210> 83 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 83 ggaggaatca gatg 14 <210> 84 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 84 agagggattg atga 14 <210> 85 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 85 tgtgtttgta aagg 14 <210> 86 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 86 aaggagtgat agga 14 <210> 87 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 87 tggtgattta gagg 14 <210> 88 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 88 ggggtagaag aata 14 <210> 89 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 89 aagaaatagt gggg 14 <210> 90 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 90 tatgttgtgg gtag 14 <210> 91 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 91 gttaaaggga ggtt 14 <210> 92 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 92 tggggtttat atgg 14 <210> 93 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 93 agggaatatg gaga 14 <210> 94 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 94 taggttgaga atag 14 <210> 95 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 95 tttaaaagag gggg 14 <210> 96 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> 14-mer attachment position <400> 96 tgaggtaaga ttgg 14 <210> 97 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Target binding domain <400> 97 agcttcttat 10 <210> 98 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Target nucleic acid <400> 98 gagactagca gaataggagg ataagaagct cgaagagtga ggacaaatgg 50 <210> 99 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Target binding domain <400> 99 ttcactgtag 10

Claims (78)

  1. 적어도 6개의 이차 핵산 분자에 혼성화된 일차 핵산 분자를 포함하는 프로브로서,
    복수의 이차 핵산 분자 각각은 적어도 5개의 삼차 핵산 분자에 혼성화되고,
    각각의 삼차 핵산 분자는 적어도 1개의 검출 가능한 표지를 포함하는 것인 프로브.
  2. 제1항에 있어서, 프로브가 적어도 1개의 절단 가능한 링커를 추가로 포함하는 것인 프로브.
  3. 제2항에 있어서, 적어도 1개의 절단 가능한 링커가 광 절단 가능한 링커인 프로브.
  4. 제2항에 있어서, 일차 핵산 분자가 적어도 1개의 절단 가능한 링커를 포함하는 것인 프로브.
  5. 제1항에 있어서, 일차 핵산 분자가 제1 도메인 및 제2 도메인을 포함하고, 적어도 6개의 이차 핵산 분자가 제2 도메인에 혼성화되는 것인 프로브.
  6. 제5항에 있어서, 제1 도메인이 14개의 뉴클레오타이드를 포함하는 것인 프로브.
  7. 제6항에 있어서, 일차 핵산 분자가 100개 내지 80개의 뉴클레오타이드를 포함하는 것인 프로브.
  8. 제1항에 있어서, 각각의 이차 핵산 분자가 90개 내지 80개의 뉴클레오타이드를 포함하는 것인 프로브.
  9. 제1항에 있어서, 각각의 삼차 핵산 분자가 20개 내지 10개의 뉴클레오타이드를 포함하는 것인 프로브.
  10. 제9항에 있어서, 각각의 삼차 핵산 분자가 15개의 뉴클레오타이드를 포함하는 것인 프로브.
  11. 제5항에 있어서, 제1 도메인과 제2 도메인 사이에 위치한 적어도 1개의 절단 가능한 링커를 추가로 포함하는 것인 프로브.
  12. 제2항에 있어서, 각각의 이차 핵산 분자가 적어도 1개의 절단 가능한 링커를 포함하는 것인 프로브.
  13. 제1항에 있어서, 각각의 이차 핵산 분자가 제1 도메인 및 제2 도메인을 포함하고, 제1 도메인은 일차 핵산 분자에 혼성화되고, 제2 도메인은 적어도 5개의 삼차 핵산 분자에 혼성화되는 것인 프로브.
  14. 제13항에 있어서, 제1 도메인과 제2 도메인 사이에 위치한 적어도 1개의 절단 가능한 링커를 추가로 포함하는 것인 프로브.
  15. 제1항에 있어서, 프로브가 적어도 30개의 검출 가능한 표지를 포함하는 것인 프로브.
  16. 제15항에 있어서, 적어도 30개의 검출 가능한 표지가 모두 동일한 방출 스펙트럼을 갖는 것인 프로브.
  17. 제15항에 있어서, 30개의 검출 가능한 표지 중 적어도 1개가 제1 방출 스펙트럼을 가지고, 30개의 검출 가능한 표지 중 적어도 1개가 제2 방출 스펙트럼을 갖는 것인 프로브.
  18. 제17항에 있어서, 제1 방출 스펙트럼과 제2 방출 스펙트럼은 스펙트럼적으로 분해 가능한 것인 프로브.
  19. 제1항에 있어서, 적어도 1개의 검출 가능한 표지가 형광 표지인 프로브.
  20. 샘플에서 표적 분석 물질을 검출하는 방법으로서,
    (a) 프로브가 직접적으로 또는 간접적으로 표적 분석 물질에 결합하는 조건 하에 샘플을 제1항의 프로브와 접촉시키는 단계;
    (b) 프로브의 검출 가능한 표지를 검출함으로써, 샘플에서 표적 분석 물질을 검출하는 단계
    를 포함하는 것인 방법.
  21. 샘플에서 표적 분석 물질을 검출하는 방법으로서,
    (a) 프로브가 직접적으로 또는 간접적으로 표적 분석 물질에 결합하는 조건 하에 샘플을 제1항의 제1 프로브와 접촉시키는 단계;
    (b) 제1 프로브의 검출 가능한 표지를 검출하는 단계;
    (c) 제1 프로브의 검출 가능한 표지를 제거하는 단계;
    (d) 프로브가 직접적으로 또는 간접적으로 표적 분석 물질에 결합하는 조건 하에 샘플을 제1항의 적어도 제2 프로브와 접촉시키는 단계;
    (e) 제1 프로브의 검출 가능한 표지를 검출함으로써, 샘플에서 표적 분석 물질을 검출하는 단계
    를 포함하는 것인 방법.
  22. 복수의 이차 핵산 분자에 혼성화된 일차 핵산 분자를 포함하는 프로브로서,
    각각의 이차 핵산 분자는 복수의 삼차 핵산 분자에 혼성화되고,
    복수의 삼차 핵산 분자 중 적어도 1개는 적어도 5개의 검출 가능한 표지를 포함하고,
    복수의 삼차 핵산 분자 중 나머지 삼차 핵산 분자 각각은 적어도 1개의 검출 가능한 표지를 포함하는 것인 프로브.
  23. 제22항에 있어서, 일차 핵산 분자는 적어도 4개의 이차 핵산 분자에 혼성화되는 것인 프로브.
  24. 제22항에 있어서, 각각의 이차 핵산 분자는 적어도 5개의 삼차 핵산 분자에 혼성화되는 것인 프로브.
  25. 제22항에 있어서, 적어도 1개의 삼차 핵산 분자가 표지된 올리고뉴클레오타이드인 프로브.
  26. 제22항에 있어서, 적어도 4개의 삼차 핵산 분자가 표지된 올리고뉴클레오타이드인 프로브.
  27. 제22항에 있어서, 적어도 5개의 검출 가능한 표지가 5개의 표지된 올리고뉴클레오타이드를 통해 적어도 1개의 삼차 핵산 분자에 혼성화되는 것인 프로브.
  28. 제24항에 있어서, 적어도 5개의 삼차 핵산 분자가,
    표지된 올리고뉴클레오타이드인 4개의 삼차 핵산 분자, 및
    적어도 5개의 검출 가능한 표지를 포함하는 1개의 삼차 핵산 분자를 포함하고,
    적어도 5개의 검출 가능한 표지가 5개의 표지된 올리고뉴클레오타이드를 통해 1개의 삼차 핵산 분자에 혼성화되는 것인 프로브.
  29. 제22항에 있어서, 프로브가 적어도 1개의 절단 가능한 링커를 추가로 포함하는 것인 프로브.
  30. 제29항에 있어서, 적어도 1개의 절단 가능한 링커가 광 절단 가능한 링커인 프로브.
  31. 제29항에 있어서, 일차 핵산 분자가 적어도 1개의 절단 가능한 링커를 포함하는 것인 프로브.
  32. 제22항에 있어서, 일차 핵산 분자가 제1 도메인 및 제2 도메인을 포함하고, 제2 도메인이 복수의 이차 핵산 분자에 혼성화되는 것인 프로브.
  33. 제32항에 있어서, 제1 도메인과 제2 도메인 사이에 위치한 적어도 1개의 절단 가능한 링커를 추가로 포함하는 것인 프로브.
  34. 제29항에 있어서, 각각의 이차 핵산 분자가 적어도 1개의 절단 가능한 링커를 포함하는 것인 프로브.
  35. 제22항에 있어서, 각각의 이차 핵산 분자가 제1 도메인 및 제2 도메인을 포함하고, 제1 도메인이 일차 핵산 분자에 혼성화되고, 제2 도메인이 복수의 삼차 핵산 분자에 혼성화되는 것인 프로브.
  36. 제35항에 있어서, 제1 도메인과 제2 도메인 사이에 위치한 적어도 1개의 절단 가능한 링커를 추가로 포함하는 것인 프로브.
  37. 제22항에 있어서, 프로브가 적어도 36개의 검출 가능한 표지를 포함하는 것인 프로브.
  38. 제37항에 있어서, 36개의 검출 가능한 표지 중 적어도 18개가 제1 방출 스펙트럼을 가지고, 나머지 검출 가능한 표지가 제2 방출 스펙트럼을 갖는 것인 프로브.
  39. 제38항에 있어서, 제1 방출 스펙트럼과 제2 방출 스펙트럼은 스펙트럼적으로 분해 가능한 것인 프로브.
  40. 제22항에 있어서, 적어도 1개의 삼차 핵산 분자의 적어도 5개의 검출 가능한 표지가, 나머지 삼차 핵산 분자의 적어도 1개의 검출 가능한 표지와 상이한 방출 스펙트럼을 갖는 것인, 프로브.
  41. 제22항에 있어서,
    복수의 이차 핵산 분자 중 적어도 1개가 복수의 삼차 핵산 분자에 혼성화되고, 여기서
    복수의 삼차 핵산 분자 중 적어도 1개가 제1 방출 스펙트럼을 갖는 적어도 5개의 검출 가능한 표지를 포함하고,
    복수의 삼차 핵산 분자 중 나머지 삼차 핵산 분자 각각이 제2 방출 스펙트럼을 갖는 적어도 1개의 검출 가능한 표지를 포함하고, 또한
    복수의 이차 핵산 분자 중 적어도 1개가 복수의 삼차 핵산 분자에 혼성화되고, 여기서
    복수의 삼차 핵산 분자 중 적어도 1개가 제2 방출 스펙트럼을 갖는 적어도 5개의 검출 가능한 표지를 포함하고,
    복수의 삼차 핵산 분자 중 나머지 삼차 핵산 분자 각각이 제1 방출 스펙트럼을 갖는 적어도 1개의 검출 가능한 표지를 포함하는 것인
    프로브.
  42. 제22항에 있어서, 일차 핵산 분자가 적어도 1개의 변형된 뉴클레오타이드 또는 뉴클레오타이드 유사체를 포함하는 것인 프로브.
  43. 제22항에 있어서, 적어도 1개의 검출 가능한 표지가 형광 표지인 프로브.
  44. 샘플에서 표적 분석 물질을 검출하는 방법으로서,
    (a) 프로브가 직접적으로 또는 간접적으로 표적 분석 물질에 결합하는 조건 하에 샘플을 제22항의 프로브와 접촉시키는 단계;
    (b) 프로브의 검출 가능한 표지를 검출함으로써, 샘플에서 표적 분석 물질을 검출하는 단계
    를 포함하는 것인 방법.
  45. 샘플에서 표적 분석 물질을 검출하는 방법으로서,
    (a) 프로브가 직접적으로 또는 간접적으로 표적 분석 물질에 결합하는 조건 하에 샘플을 제22항의 제1 프로브와 접촉시키는 단계;
    (b) 제1 프로브의 검출 가능한 표지를 검출하는 단계;
    (c) 제1 프로브의 검출 가능한 표지를 제거하는 단계;
    (d) 프로브가 직접적으로 또는 간접적으로 표적 분석 물질에 결합하는 조건 하에 샘플을 제22항의 적어도 제2 프로브와 접촉시키는 단계;
    (e) 제1 프로브의 검출 가능한 표지를 검출함으로써, 샘플에서 표적 분석 물질을 검출하는 단계
    를 포함하는 것인 방법.
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
KR1020207034479A 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법 KR102313431B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020217032539A KR102476709B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US201662424887P 2016-11-21 2016-11-21
US62/424,887 2016-11-21
US201762457237P 2017-02-10 2017-02-10
US62/457,237 2017-02-10
US201762536147P 2017-07-24 2017-07-24
US62/536,147 2017-07-24
KR1020197017827A KR102187291B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법
PCT/US2017/062760 WO2018094385A1 (en) 2016-11-21 2017-11-21 Chemical compositions and methods of using same

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020197017827A Division KR102187291B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020217032539A Division KR102476709B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법

Publications (2)

Publication Number Publication Date
KR20200138426A KR20200138426A (ko) 2020-12-09
KR102313431B1 true KR102313431B1 (ko) 2021-10-18

Family

ID=60655103

Family Applications (4)

Application Number Title Priority Date Filing Date
KR1020217032539A KR102476709B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법
KR1020197017827A KR102187291B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법
KR1020227042875A KR20230003586A (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법
KR1020207034479A KR102313431B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법

Family Applications Before (3)

Application Number Title Priority Date Filing Date
KR1020217032539A KR102476709B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법
KR1020197017827A KR102187291B1 (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법
KR1020227042875A KR20230003586A (ko) 2016-11-21 2017-11-21 화학적 조성물 및 이것을 사용하는 방법

Country Status (9)

Country Link
US (5) US10415080B2 (ko)
EP (1) EP3541957A1 (ko)
JP (3) JP6730525B2 (ko)
KR (4) KR102476709B1 (ko)
CN (2) CN116334202A (ko)
AU (3) AU2017361521B2 (ko)
CA (1) CA3043489A1 (ko)
SG (1) SG10202100951SA (ko)
WO (1) WO2018094385A1 (ko)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
CN106715768B (zh) 2014-07-30 2020-06-16 哈佛学院院长及董事 用于测定核酸的系统和方法
KR102298387B1 (ko) * 2014-11-21 2021-09-07 나노스트링 테크놀로지스, 인크. 무효소 및 무증폭 시퀀싱
DK3901281T3 (da) 2015-04-10 2023-01-23 Spatial Transcriptomics Ab Rumligt adskilt, multipleks nukleinsyreanalyse af biologiske prøver
SG10202107055SA (en) 2015-07-17 2021-08-30 Nanostring Technologies Inc Simultaneous quantification of a plurality of proteins in a user-defined region of a cross-sectioned tissue
SG10202107053QA (en) 2015-07-17 2021-08-30 Nanostring Technologies Inc Simultaneous quantification of gene expression in a user-defined region of a cross-sectioned tissue
WO2017189525A1 (en) 2016-04-25 2017-11-02 President And Fellows Of Harvard College Hybridization chain reaction methods for in situ molecular detection
CN109563539A (zh) 2016-06-15 2019-04-02 慕尼黑路德维希马克西米利安斯大学 使用dna纳米技术的单分子检测或定量
WO2017222453A1 (en) 2016-06-21 2017-12-28 Hauling Thomas Nucleic acid sequencing
AU2017361521B2 (en) 2016-11-21 2020-08-27 Nanostring Technologies, Inc. Chemical compositions and methods of using same
WO2018107054A1 (en) 2016-12-09 2018-06-14 Ultivue, Inc. Improved methods for multiplex imaging using labeled nucleic acid imaging agents
US11788123B2 (en) 2017-05-26 2023-10-17 President And Fellows Of Harvard College Systems and methods for high-throughput image-based screening
WO2019068880A1 (en) 2017-10-06 2019-04-11 Cartana Ab RNA MATRIX LIGATION
WO2019157445A1 (en) 2018-02-12 2019-08-15 Nanostring Technologies, Inc. Biomolecular probes and methods of detecting gene and protein expression
SG11202011274YA (en) 2018-05-14 2020-12-30 Nanostring Technologies Inc Chemical compositions and methods of using same
WO2020123320A2 (en) 2018-12-10 2020-06-18 10X Genomics, Inc. Imaging system hardware
US20220064697A1 (en) * 2018-12-13 2022-03-03 President And Fellows Of Harvard College Amplification methods and systems for merfish and other applications
US11926867B2 (en) 2019-01-06 2024-03-12 10X Genomics, Inc. Generating capture probes for spatial analysis
US11649485B2 (en) 2019-01-06 2023-05-16 10X Genomics, Inc. Generating capture probes for spatial analysis
WO2020243579A1 (en) 2019-05-30 2020-12-03 10X Genomics, Inc. Methods of detecting spatial heterogeneity of a biological sample
AU2020282024A1 (en) * 2019-05-31 2021-11-11 10X Genomics, Inc. Method of detecting target nucleic acid molecules
EP3754028A1 (en) 2019-06-18 2020-12-23 Apollo Life Sciences GmbH Method of signal encoding of analytes in a sample
WO2020254672A1 (en) 2019-06-19 2020-12-24 Therycell Gmbh Spatial characterisation of target structures in a sample
EP4025711A2 (en) 2019-11-08 2022-07-13 10X Genomics, Inc. Enhancing specificity of analyte binding
ES2946357T3 (es) 2019-12-23 2023-07-17 10X Genomics Inc Métodos para el análisis espacial usando ligación con molde de ARN
US11702693B2 (en) 2020-01-21 2023-07-18 10X Genomics, Inc. Methods for printing cells and generating arrays of barcoded cells
US11732299B2 (en) 2020-01-21 2023-08-22 10X Genomics, Inc. Spatial assays with perturbed cells
US11898205B2 (en) 2020-02-03 2024-02-13 10X Genomics, Inc. Increasing capture efficiency of spatial assays
US11732300B2 (en) 2020-02-05 2023-08-22 10X Genomics, Inc. Increasing efficiency of spatial analysis in a biological sample
US11891654B2 (en) 2020-02-24 2024-02-06 10X Genomics, Inc. Methods of making gene expression libraries
EP4242325A3 (en) 2020-04-22 2023-10-04 10X Genomics, Inc. Methods for spatial analysis using targeted rna depletion
WO2021237087A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Spatial analysis to detect sequence variants
WO2021236929A1 (en) 2020-05-22 2021-11-25 10X Genomics, Inc. Simultaneous spatio-temporal measurement of gene expression and cellular activity
WO2021252499A1 (en) 2020-06-08 2021-12-16 10X Genomics, Inc. Methods of determining a surgical margin and methods of use thereof
WO2021263111A1 (en) 2020-06-25 2021-12-30 10X Genomics, Inc. Spatial analysis of dna methylation
US11761038B1 (en) 2020-07-06 2023-09-19 10X Genomics, Inc. Methods for identifying a location of an RNA in a biological sample
US11926822B1 (en) 2020-09-23 2024-03-12 10X Genomics, Inc. Three-dimensional spatial analysis
US11827935B1 (en) 2020-11-19 2023-11-28 10X Genomics, Inc. Methods for spatial analysis using rolling circle amplification and detection probes
EP4121555A1 (en) 2020-12-21 2023-01-25 10X Genomics, Inc. Methods, compositions, and systems for capturing probes and/or barcodes
EP4092414A1 (en) * 2021-05-19 2022-11-23 Leica Microsystems CMS GmbH Connector, marker and method for analysing biological samples
EP4341671A1 (en) * 2021-05-19 2024-03-27 Leica Microsystems CMS GmbH Method for analyzing a biological sample or a chemical compound or a chemical element
WO2022250774A1 (en) * 2021-05-24 2022-12-01 California Institute Of Technology Linked amplification tethered with exponential radiance
WO2023034489A1 (en) 2021-09-01 2023-03-09 10X Genomics, Inc. Methods, compositions, and kits for blocking a capture probe on a spatial array
EP4216220A1 (en) * 2022-01-25 2023-07-26 Leica Microsystems CMS GmbH Data storage device and method for storing data
WO2023235836A2 (en) * 2022-06-03 2023-12-07 Nanostring Technologies, Inc. Spatial biology informatics integration portal with programmable machine learning pipeline orchestrator
EP4328175A1 (en) * 2022-08-23 2024-02-28 Leica Microsystems CMS GmbH Method for sequencing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013055995A2 (en) 2011-10-14 2013-04-18 President And Fellows Of Harvard College Sequencing by structure assembly

Family Cites Families (279)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US327876A (en) * 1885-10-06 Automatic fire-extinguishing apparatus
US4230558A (en) 1978-10-02 1980-10-28 Coulter Electronics, Inc. Single drop separator
US4318846A (en) 1979-09-07 1982-03-09 Syva Company Novel ether substituted fluorescein polyamino acid compounds as fluorescers and quenchers
US4994373A (en) 1983-01-27 1991-02-19 Enzo Biochem, Inc. Method and structures employing chemically-labelled polynucleotide probes
US4757141A (en) 1985-08-26 1988-07-12 Applied Biosystems, Incorporated Amino-derivatized phosphite and phosphate linking agents, phosphoramidite precursors, and useful conjugates thereof
US5985549A (en) 1985-10-22 1999-11-16 University Of Massachusetts Non-isotopic in-situ hybridization method for detection of nucleic acids
US5091519A (en) 1986-05-01 1992-02-25 Amoco Corporation Nucleotide compositions with linking groups
US4811218A (en) 1986-06-02 1989-03-07 Applied Biosystems, Inc. Real time scanning electrophoresis apparatus for DNA sequencing
US5151507A (en) 1986-07-02 1992-09-29 E. I. Du Pont De Nemours And Company Alkynylamino-nucleotides
US5066580A (en) 1988-08-31 1991-11-19 Becton Dickinson And Company Xanthene dyes that emit to the red of fluorescein
US6242184B1 (en) 1988-10-18 2001-06-05 University Of Massachusetts In-situ hybridization of single-copy and multiple-copy nucleic acid sequences
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5871928A (en) 1989-06-07 1999-02-16 Fodor; Stephen P. A. Methods for nucleic acid analysis
US5366860A (en) 1989-09-29 1994-11-22 Applied Biosystems, Inc. Spectrally resolvable rhodamine dyes for nucleic acid sequence determination
US5188934A (en) 1989-11-14 1993-02-23 Applied Biosystems, Inc. 4,7-dichlorofluorescein dyes as molecular probes
US5849481A (en) 1990-07-27 1998-12-15 Chiron Corporation Nucleic acid hybridization assays employing large comb-type branched polynucleotides
US6277569B1 (en) 1990-09-20 2001-08-21 Vysis, Inc. Methods for multiple direct label probe detection of multiple chromosomes or regions thereof by in situ hybridization
US5491224A (en) 1990-09-20 1996-02-13 Bittner; Michael L. Direct label transaminated DNA probe compositions for chromosome identification and methods for their manufacture
US6037120A (en) 1995-10-12 2000-03-14 Benner; Steven Albert Recognition of oligonucleotides containing non-standard base pairs
US6140496A (en) 1990-10-09 2000-10-31 Benner; Steven Albert Precursors for deoxyribonucleotides containing non-standard nucleosides
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US5320814A (en) 1991-01-25 1994-06-14 Trustees Of Tufts College Fiber optic array sensors, apparatus, and methods for concurrently visualizing and chemically detecting multiple analytes of interest in a fluid sample
DE69333073T2 (de) 1992-02-12 2004-04-15 Chromagen, Inc., San Diego Verwendungen von fluoreszierenden n-nukleosiden und dessen analogen
AU4292893A (en) 1992-04-21 1993-11-18 Regents Of The University Of California, The Multicolor in situ hybridization methods for genetic testing
US5386024A (en) 1993-02-10 1995-01-31 Gen-Probe Incorporated Method to prepare nucleic acids from a biological sample using low pH and acid protease
US5543838A (en) 1993-08-31 1996-08-06 Xerox Corporation Signal multiplexing system for an image sensor array
US5681697A (en) 1993-12-08 1997-10-28 Chiron Corporation Solution phase nucleic acid sandwich assays having reduced background noise and kits therefor
US5654419A (en) 1994-02-01 1997-08-05 The Regents Of The University Of California Fluorescent labels and their use in separations
US5783387A (en) 1995-02-06 1998-07-21 The Regents Of The University Of California Method for identifying and quantifying nucleic acid sequence aberrations
US5780227A (en) 1995-06-07 1998-07-14 Sheridan; Patrick J. Oligonucleotide probe conjugated to a purified hydrophilic alkaline phosphatase and uses thereof
US5945515A (en) 1995-07-31 1999-08-31 Chomczynski; Piotr Product and process for isolating DNA, RNA and proteins
AU6898296A (en) 1995-08-14 1997-03-12 Ely Michael Rabani Methods and devices for parallel multiplex polynucleotide sequencing
AU7398996A (en) 1995-10-11 1997-04-30 Luminex Corporation Multiplexed analysis of clinical specimens apparatus and method
US5981180A (en) 1995-10-11 1999-11-09 Luminex Corporation Multiplexed analysis of clinical specimens apparatus and methods
US6007994A (en) 1995-12-22 1999-12-28 Yale University Multiparametric fluorescence in situ hybridization
US7144119B2 (en) 1996-04-25 2006-12-05 Bioarray Solutions Ltd. System and method for programmable illumination pattern generation
US6387707B1 (en) 1996-04-25 2002-05-14 Bioarray Solutions Array Cytometry
US5800996A (en) 1996-05-03 1998-09-01 The Perkin Elmer Corporation Energy transfer dyes with enchanced fluorescence
US5847162A (en) 1996-06-27 1998-12-08 The Perkin Elmer Corporation 4, 7-Dichlororhodamine dyes
US6750016B2 (en) 1996-07-29 2004-06-15 Nanosphere, Inc. Nanoparticles having oligonucleotides attached thereto and uses therefor
US6449562B1 (en) 1996-10-10 2002-09-10 Luminex Corporation Multiplexed analysis of clinical specimens apparatus and method
US5853993A (en) 1996-10-21 1998-12-29 Hewlett-Packard Company Signal enhancement method and kit
US20020034737A1 (en) 1997-03-04 2002-03-21 Hyseq, Inc. Methods and compositions for detection or quantification of nucleic acid species
US6027945A (en) 1997-01-21 2000-02-22 Promega Corporation Methods of isolating biological target materials using silica magnetic particles
JP4209471B2 (ja) 1997-02-20 2009-01-14 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア プラズモン共鳴粒子、方法、および装置
US5888778A (en) 1997-06-16 1999-03-30 Exact Laboratories, Inc. High-throughput screening method for identification of genetic mutations or disease-causing microorganisms using segmented primers
US20050037397A1 (en) 2001-03-28 2005-02-17 Nanosphere, Inc. Bio-barcode based detection of target analytes
US7115884B1 (en) 1997-10-06 2006-10-03 Trustees Of Tufts College Self-encoding fiber optic sensor
US7348181B2 (en) 1997-10-06 2008-03-25 Trustees Of Tufts College Self-encoding sensor with microspheres
KR20010031140A (ko) 1997-10-14 2001-04-16 루미넥스 코포레이션 정밀 형광염료 입자 및 그의 제조방법 그리고 그의 사용
US6322901B1 (en) 1997-11-13 2001-11-27 Massachusetts Institute Of Technology Highly luminescent color-selective nano-crystalline materials
US5990479A (en) 1997-11-25 1999-11-23 Regents Of The University Of California Organo Luminescent semiconductor nanocrystal probes for biological applications and process for making and using such probes
US6207392B1 (en) 1997-11-25 2001-03-27 The Regents Of The University Of California Semiconductor nanocrystal probes for biological applications and process for making and using such probes
US6238869B1 (en) 1997-12-19 2001-05-29 High Throughput Genomics, Inc. High throughput assay system
US6673914B1 (en) 1998-01-22 2004-01-06 John Wayne Cancer Institute Human tumor-associated gene
JP2002503814A (ja) 1998-02-12 2002-02-05 イムニベスト・コーポレイション 循環ガン細胞の迅速かつ効率的な単離のための方法および試薬
US6225285B1 (en) 1998-03-11 2001-05-01 Exelixis Pharmaceuticals, Inc. Semaphorin K1
ATE423314T1 (de) 1998-06-24 2009-03-15 Illumina Inc Dekodierung von matrixartig-angeordneten sensoren durch mikropartikel
US6306643B1 (en) 1998-08-24 2001-10-23 Affymetrix, Inc. Methods of using an array of pooled probes in genetic analysis
US6426513B1 (en) 1998-09-18 2002-07-30 Massachusetts Institute Of Technology Water-soluble thiol-capped nanocrystals
EP0990903B1 (en) 1998-09-18 2003-03-12 Massachusetts Institute Of Technology Biological applications of semiconductor nanocrystals
US6251303B1 (en) 1998-09-18 2001-06-26 Massachusetts Institute Of Technology Water-soluble fluorescent nanocrystals
US6465193B2 (en) 1998-12-11 2002-10-15 The Regents Of The University Of California Targeted molecular bar codes and methods for using the same
US6429027B1 (en) 1998-12-28 2002-08-06 Illumina, Inc. Composite arrays utilizing microspheres
ES2310514T3 (es) 1999-03-10 2009-01-16 Asm Scientific, Inc. Un metodo para la secuenciacion directa de acido nucleico.
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
KR20020012169A (ko) 1999-03-31 2002-02-15 유나이티드 쎄러퓨틱스 코포레이션 프로스타글란딘 화합물, 조성물 및 말초혈관질병 및폐고혈압증의 치료방법
JP2003517283A (ja) 1999-04-08 2003-05-27 オアシス バイオサイエンシーズ インコーポレイティッド プライマーペアの増幅及び配列決定並びにそれらの使用
US6908737B2 (en) 1999-04-15 2005-06-21 Vitra Bioscience, Inc. Systems and methods of conducting multiplexed experiments
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
WO2000065094A2 (en) 1999-04-22 2000-11-02 The Albert Einstein College Of Medicine Of Yeshiva University Assay of gene expression patterns by multi-fluor fish
ATE439452T1 (de) 1999-05-07 2009-08-15 Life Technologies Corp Verfahren zum nachweis von analyten mit hilfe von halbleiternanokrystallen
US20020051971A1 (en) 1999-05-21 2002-05-02 John R. Stuelpnagel Use of microfluidic systems in the detection of target analytes using microsphere arrays
US6316200B1 (en) 2000-06-08 2001-11-13 Becton, Dickinson And Company Probes and methods for detection of nucleic acids
AU5764500A (en) 1999-06-25 2001-01-31 Motorola, Inc. Novel methods and products for arrayed microsphere analysis
CA2382436C (en) 1999-08-30 2011-05-17 Illumina, Inc. Methods for improving signal detection from an array
US6379888B1 (en) 1999-09-27 2002-04-30 Becton, Dickinson And Company Universal probes and methods for detection of nucleic acids
US6428957B1 (en) 1999-11-08 2002-08-06 Agilent Technologies, Inc. Systems tools and methods of assaying biological materials using spatially-addressable arrays
US6727356B1 (en) 1999-12-08 2004-04-27 Epoch Pharmaceuticals, Inc. Fluorescent quenching detection reagents and methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
EP1257805B1 (en) 2000-02-10 2015-10-14 Illumina, Inc. Composition comprising a substrate with multiple assay locations for bead-based simultaneous processing of multiple samples, apparatus comprising the composition, and manufacturing method for the composition
US20020028457A1 (en) 2000-02-16 2002-03-07 Quantum Dot Corporation Single target counting assays using semiconductor nanocrystals
EP1257668B1 (en) 2000-02-16 2008-10-29 Illumina, Inc. Parallel genotyping of multiple patient samples
EP1257355A2 (en) 2000-02-22 2002-11-20 Genospectra, Inc. Microarray fabrication techniques and apparatus
US20030186426A1 (en) 2000-03-15 2003-10-02 The Regents Of The University Of California Multichannel flow cell for interacting single optically trapped, DNA molecules with different chemical species
US6734420B2 (en) 2000-04-06 2004-05-11 Quantum Dot Corporation Differentiable spectral bar code methods and systems
IL152727A0 (en) 2000-05-16 2003-06-24 Childrens Mercy Hospital Single copy genomic hybridization probes and method of generating same
US7033758B2 (en) 2000-06-02 2006-04-25 Bayer Corporation Highly sensitive gene detection and localization using in situ branched-DNA hybridization
US7763421B2 (en) 2000-06-05 2010-07-27 Ventana Medical Systems, Inc. Methods for producing nucleic acid hybridization probes that amplify hybridization signal by promoting network formation
AU2001278133A1 (en) 2000-08-01 2002-02-13 Surromed, Inc. Methods for solid phase nanoextraction and desorption
US6649138B2 (en) 2000-10-13 2003-11-18 Quantum Dot Corporation Surface-modified semiconductive and metallic nanoparticles having enhanced dispersibility in aqueous media
US6777244B2 (en) 2000-12-06 2004-08-17 Hrl Laboratories, Llc Compact sensor using microcavity structures
US6576291B2 (en) 2000-12-08 2003-06-10 Massachusetts Institute Of Technology Preparation of nanocrystallites
EP1351970A2 (en) 2000-12-12 2003-10-15 Invitrogen Corporation Compositions and methods for the release of nucleic acid molecules from solid matrices
EP1370690B1 (en) 2001-03-16 2012-03-14 Kalim Mir Arrays and methods of use
CN1559006A (zh) 2001-05-21 2004-12-29 埃克来拉生物科学公司 用于分析蛋白的方法和组合物
US20040161741A1 (en) 2001-06-30 2004-08-19 Elazar Rabani Novel compositions and processes for analyte detection, quantification and amplification
US7473767B2 (en) 2001-07-03 2009-01-06 The Institute For Systems Biology Methods for detection and quantification of analytes in complex mixtures
WO2003092043A2 (en) 2001-07-20 2003-11-06 Quantum Dot Corporation Luminescent nanoparticles and methods for their preparation
US7189509B2 (en) 2001-08-16 2007-03-13 Zhifeng Shao Analysis of gene expression profiles using sequential hybridization
US7863012B2 (en) 2004-02-17 2011-01-04 Veridex, Llc Analysis of circulating tumor cells, fragments, and debris
EP1425383A4 (en) 2001-08-23 2005-11-09 Immunivest Corp STABILIZATION OF CELLS AND BIOLOGICAL PREPARATIONS FOR ANALYSIS
EP1432786B1 (en) 2001-09-06 2009-07-22 Genomic Profiling Systems, Inc. Rapid detection of replicating cells
AU2002360272A1 (en) 2001-10-10 2003-04-22 Superarray Bioscience Corporation Detecting targets by unique identifier nucleotide tags
US20110151438A9 (en) * 2001-11-19 2011-06-23 Affymetrix, Inc. Methods of Analysis of Methylation
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
AU2002351276A1 (en) * 2001-12-10 2003-07-09 James O. Bowlby Jr. Tsunami chain reaction - geometric dna amplification
US20040229294A1 (en) 2002-05-21 2004-11-18 Po-Ying Chan-Hui ErbB surface receptor complexes as biomarkers
US7164533B2 (en) 2003-01-22 2007-01-16 Cyvera Corporation Hybrid random bead/chip based microarray
US8394944B2 (en) 2002-09-20 2013-03-12 Siemens Healthcare Diagnostics Inc. Dual-purpose primers and probes for providing enhanced hybridization assays by disruption of secondary structure formation
US20090246879A1 (en) 2002-12-20 2009-10-01 Callida Genomics Materials and Methods Relating to Nano-Tags and Nano-Brands
JP4761202B2 (ja) 2003-01-31 2011-08-31 学校法人慶應義塾 切断可能な対応付け分子およびそれを用いるスクリーニング方法
JP4283578B2 (ja) 2003-03-31 2009-06-24 学校法人片柳学園 不一致増幅物質を含むプローブ核酸を用いる標的配列の検出方法、プローブ核酸および標的配列検出用アッセイキット
DK1620568T3 (da) 2003-04-24 2009-03-30 Afshin Ahmadian Analyse til allelspecifik mutationspåvisning
US7385043B1 (en) 2003-04-30 2008-06-10 The Public Health Research Institute Of The City Of New York, Inc. Homogeneous multiplex screening assays and kits
US7250371B2 (en) 2003-08-26 2007-07-31 Lam Research Corporation Reduction of feature critical dimensions
US20050048498A1 (en) 2003-08-29 2005-03-03 Applera Corporation Compositions, methods, and kits for assembling probes
US20050064435A1 (en) 2003-09-24 2005-03-24 Xing Su Programmable molecular barcodes
US7402399B2 (en) 2003-10-14 2008-07-22 Monogram Biosciences, Inc. Receptor tyrosine kinase signaling pathway analysis for diagnosis and therapy
WO2005054516A2 (en) 2003-11-26 2005-06-16 Advandx, Inc. Peptide nucleic acid probes for analysis of certain staphylococcus species
US7381529B2 (en) 2003-12-31 2008-06-03 Intel Corporation Methods and compositions for detecting nucleic acids using scanning probe microscopy and nanocodes
US7462475B2 (en) 2004-05-20 2008-12-09 Dna Poleymerase Technology, Inc. Use of whole blood in PCR reactions
CN102680440A (zh) 2004-06-07 2012-09-19 先锋生物科技股份有限公司 用于微流体器件的光学透镜系统和方法
US20070154889A1 (en) 2004-06-25 2007-07-05 Veridex, Llc Methods and reagents for the detection of melanoma
EP1766089A1 (en) 2004-06-30 2007-03-28 Applera Corporation Analog probe complexes
US20060073501A1 (en) 2004-09-10 2006-04-06 Van Den Boom Dirk J Methods for long-range sequence analysis of nucleic acids
JP4839051B2 (ja) 2004-10-08 2011-12-14 シスメックス株式会社 核酸プローブを用いる被検物質の検出方法
ATE452208T1 (de) 2004-10-08 2010-01-15 Sysmex Corp Verfahren zum nachweis einer zielsubstanz unter verwendung einer nukleinsäuresonde
US7829278B2 (en) 2004-10-28 2010-11-09 Board Of Trustees Of The University Of Illinois Polynucleotide barcoding
US20060134917A1 (en) 2004-12-16 2006-06-22 Lam Research Corporation Reduction of etch mask feature critical dimensions
AU2006210553A1 (en) 2005-02-01 2006-08-10 Ab Advanced Genetic Analysis Corporation Reagents, methods and libraries for bead-based sequencing
US8063196B2 (en) 2005-02-01 2011-11-22 Siemens Healthcare Diagnostics Inc. Highly orthogonal universal sequences for use in nucleic acid assays
US7524631B2 (en) 2005-02-02 2009-04-28 Patterson Bruce K HPV E6, E7 mRNA assay and methods of use thereof
US8628918B2 (en) 2005-05-09 2014-01-14 Affymetrix, Inc. Multiplex capture of nucleic acids
ATE502120T1 (de) 2005-05-12 2011-04-15 Affymetrix Inc Multiplex-assays für verzweigtkettige dna
US20070048759A1 (en) 2005-06-10 2007-03-01 Dan Luo Detection of target molecules with labeled nucleic acid detection molecules
US7842793B2 (en) 2005-06-14 2010-11-30 The California Institute Of Technology Methods of making nucleic acid nanostructures
ES2565670T3 (es) 2005-06-20 2016-04-06 Advanced Cell Diagnostics, Inc. Métodos de detección de ácidos nucleicos en células individuales y de identificación de células raras en grandes poblaciones de células heterogéneas
WO2007015168A2 (en) 2005-07-01 2007-02-08 Dako Denmark A/S Monomeric and polymeric linkers useful for conjugating biological molecules and other substances
US7927798B2 (en) 2005-10-05 2011-04-19 Panomics, Inc. Detection of nucleic acids from whole blood
US8017360B2 (en) 2005-11-10 2011-09-13 Panomics, Inc. Detection of nucleic acids through amplification of surrogate nucleic acids
WO2007061876A2 (en) 2005-11-23 2007-05-31 University Of Utah Research Foundation Methods and compositions involving intrinsic genes
EP1963851A4 (en) 2005-12-16 2009-07-29 Applera Corp METHOD AND SYSTEM FOR PHASE STARTER SEQUENCING
WO2007076132A2 (en) 2005-12-23 2007-07-05 Nanostring Technologies, Inc. Compositions comprising oriented, immobilized macromolecules and methods for their preparation
JP5537034B2 (ja) 2005-12-23 2014-07-02 ナノストリング テクノロジーズ,インコーポレーテッド ナノレポーターならびにその作製方法および使用方法
JP2009538123A (ja) 2006-04-19 2009-11-05 アプライド バイオシステムズ, エルエルシー ゲル非含有ビーズベースの配列決定のための試薬、方法およびライブラリー
ES2620398T3 (es) 2006-05-22 2017-06-28 Nanostring Technologies, Inc. Sistemas y métodos para analizar nanoindicadores
US7745129B1 (en) 2006-07-12 2010-06-29 Kenneth David Schatz Methods for sequencing of a necleic acid
JP2008043332A (ja) 2006-08-17 2008-02-28 Panomics Inc 組織スライドからの核酸定量
US8055034B2 (en) 2006-09-13 2011-11-08 Fluidigm Corporation Methods and systems for image processing of microfluidic devices
WO2008039998A2 (en) 2006-09-28 2008-04-03 President And Fellows Of Harvard College Methods for sequencing dna
US7629125B2 (en) 2006-11-16 2009-12-08 General Electric Company Sequential analysis of biological samples
US7883869B2 (en) 2006-12-01 2011-02-08 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
WO2008069884A2 (en) 2006-12-01 2008-06-12 Panomics, Inc. Two-stage nucleic acid amplification using an amplification oligomer
WO2008124847A2 (en) 2007-04-10 2008-10-16 Nanostring Technologies, Inc. Methods and computer systems for identifying target-specific sequences for use in nanoreporters
ES2391906T3 (es) 2007-09-12 2012-11-30 Institut Pasteur Polinucleótido apto para un ensayo indicador basado en una sola célula para controlar los patrones de expresión génica con una resolución espacio-temporal elevada
WO2009046149A1 (en) 2007-10-01 2009-04-09 Applied Biosystems Inc. Chase ligation sequencing
WO2009046445A1 (en) 2007-10-04 2009-04-09 Halcyon Molecular Sequencing nucleic acid polymers with electron microscopy
US8114681B2 (en) 2007-10-05 2012-02-14 Affymetrix, Inc. Highly multiplexed particle-based assays
EP2227563B1 (en) 2007-12-05 2012-06-06 Complete Genomics, Inc. Efficient base determination in sequencing reactions
CN101586150B (zh) 2008-05-23 2016-09-28 陕西佰美基因股份有限公司 检测探针、通用寡核苷酸芯片及核酸检测方法及其用途
US20090298709A1 (en) 2008-05-28 2009-12-03 Affymetrix, Inc. Assays for determining telomere length and repeated sequence copy number
DK2297359T3 (en) 2008-05-30 2014-02-24 Univ Utah Res Found Gene expression profiles to predict the outcome of breast cancer
GB2461026B (en) 2008-06-16 2011-03-09 Plc Diagnostics Inc System and method for nucleic acids sequencing by phased synthesis
CA2733609C (en) 2008-08-14 2018-03-06 Nanostring Technologies, Inc. Stable nanoreporters
US8309306B2 (en) 2008-11-12 2012-11-13 Nodality, Inc. Detection composition
WO2010056577A1 (en) 2008-11-17 2010-05-20 Magic Technologies, Inc. Methods and compositions in particle-based detection of target molecules using linking molecules
WO2010060103A1 (en) 2008-11-24 2010-05-27 Loma Linda University Biomarkers for the detection of head and neck tumors
US8685646B2 (en) 2008-12-18 2014-04-01 Siemens Healthcare Diagnostics Inc. Methods and reagents for shortening incubation times in hybridization assays
EP2373812B1 (en) 2008-12-19 2016-11-09 President and Fellows of Harvard College Particle-assisted nucleic acid sequencing
WO2010081114A2 (en) 2009-01-12 2010-07-15 20/20 Genesystems, Inc. Oligonucleotide-coated affinity membranes and uses thereof
US8404444B2 (en) 2009-02-25 2013-03-26 Diacarta Llc Method for predicting the level of damage to cells by measuring free circulating Alu nucleic acid
CN103952482A (zh) 2009-04-02 2014-07-30 弗卢伊蒂格姆公司 用于对目标核酸进行条形码化的多引物扩增方法
CN102858995B (zh) 2009-09-10 2016-10-26 森特瑞隆技术控股公司 靶向测序方法
US20130023433A1 (en) 2009-09-28 2013-01-24 Yuling Luo Methods of detecting nucleic acid sequences with high specificity
AU2010306862B2 (en) 2009-10-13 2015-08-27 Nanostring Technologies, Inc. Protein detection via nanoreporters
WO2011084168A1 (en) 2010-01-08 2011-07-14 The Regents Of The University Of California Bioassays based on polymeric sequence probes
US20130171621A1 (en) 2010-01-29 2013-07-04 Advanced Cell Diagnostics Inc. Methods of in situ detection of nucleic acids
CA2785529C (en) 2010-02-11 2019-01-08 Nanostring Technologies, Inc. Compositions and methods for the detection of small rnas
WO2011100669A2 (en) 2010-02-15 2011-08-18 North Carolina State University Office Of Technology Transfer Lable-free multiplexing bioassays using fluorescent conjugated polymers and barcoded nanoparticles
WO2011106583A1 (en) * 2010-02-26 2011-09-01 Ventana Medical Systems, Inc. Polytag probes
EP2547795B1 (en) 2010-03-16 2015-01-14 Nanostring Technologies, Inc Compositions and methods for the detection of genomic features
US20130203055A1 (en) 2010-06-03 2013-08-08 Joan Aurich-Costa Methods and kits for in situ detection of nucleotide sequences
WO2011156434A2 (en) 2010-06-07 2011-12-15 Firefly Bioworks, Inc. Nucleic acid detection and quantification by post-hybridization labeling and universal encoding
US20120052498A1 (en) 2010-07-01 2012-03-01 Affymetrix, Inc. Detection of Nucleic Acids
US20120003648A1 (en) 2010-07-01 2012-01-05 Affymetrix, Inc. Signal Multiplexing and Signal Amplification
US20120004132A1 (en) 2010-07-02 2012-01-05 Affymetrix, Inc. Detection of Nucleic Acids and Proteins
CN103109187B (zh) 2010-07-07 2015-03-25 密执安大学评议会 乳腺癌的诊断和治疗
US20120071343A1 (en) 2010-09-20 2012-03-22 Advanced Cell Diagnostics, Inc Biomarkers for differentiating melanoma from benign nevus in the skin
CN102445964A (zh) 2010-10-06 2012-05-09 鸿富锦精密工业(深圳)有限公司 电脑机箱及其硬盘模组
DK2625320T3 (da) 2010-10-08 2019-07-01 Harvard College High-throughput enkeltcellestregkodning
US10669569B2 (en) 2010-10-15 2020-06-02 Navinci Diagnostics Ab Dynamic range methods
US8658361B2 (en) 2010-10-21 2014-02-25 Advanced Cell Diagnostics, Inc. Ultra sensitive method for in situ detection of nucleic acids
JP5978220B2 (ja) 2010-10-29 2016-08-24 プレジデント アンド フェローズ オブ ハーバード カレッジ 核酸ナノ構造バーコードプローブ
US8865404B2 (en) 2010-11-05 2014-10-21 President And Fellows Of Harvard College Methods for sequencing nucleic acid molecules
US8859201B2 (en) 2010-11-16 2014-10-14 Nabsys, Inc. Methods for sequencing a biomolecule by detecting relative positions of hybridized probes
US20120172246A1 (en) 2010-12-31 2012-07-05 Affymetrix, Inc. Detection of Nucleic Acids
US20120178081A1 (en) 2010-12-31 2012-07-12 Affymetrix. Inc. Methods of Labeling Cells, Labeled Cells, and uses Thereof
DK2668290T3 (en) 2011-01-28 2017-09-18 Advanced Cell Diagnostics Inc RNASCOPE® HPV ASSAY FOR DETERMINING HPV STATUS OF CANCER AND HEALTH CANCER AND LESSIONS
US20120295801A1 (en) 2011-02-17 2012-11-22 President And Fellows Of Harvard College High-Throughput In Situ Hybridization
JP5971769B2 (ja) 2011-03-15 2016-08-17 ザ ユニバーシティー オブ ノースカロライナ アット チャペル ヒル アントラサイクリン療法を用いて乳癌を処置する方法
US9758834B2 (en) 2011-03-28 2017-09-12 Nanostring Technologies, Inc. Compositions and methods for diagnosing cancer
US20150086981A1 (en) 2011-05-04 2015-03-26 Genovoxx Gmbh Nucleoside-triphosphate conjugate and methods for the use thereof
US20140227706A1 (en) 2011-05-16 2014-08-14 Dna Chip Research Inc. Method for assessing progression of clinical state of malignant neoplasm by quantitative detection of DNA in blood
US20140248611A1 (en) 2011-06-16 2014-09-04 Nippon Steel & Sumikin Eco-Tech Corporation Nucleic acid probe for assaying nucleic acids
US20130017971A1 (en) 2011-06-24 2013-01-17 Nanostring Technologies, Inc. Multivariate Diagnostic Assays and Methods for Using Same
WO2013006495A2 (en) 2011-07-01 2013-01-10 Dana-Farber Cancer Institute, Inc. Methods of predicting prognosis in cancer
ITPD20110324A1 (it) 2011-10-12 2013-04-13 Innovation Factory S C A R L Metodo per la rilevazione di galfa15 come marcatore tumorale nel carcinoma pancreatico
US9670549B2 (en) 2011-11-10 2017-06-06 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Gene expression signatures of neoplasm responsiveness to therapy
EP2785873A4 (en) 2011-11-30 2015-11-11 Univ North Carolina METHOD FOR THE TREATMENT OF BREAST CANCER WITH TAXAN THERAPY
EP4249605A3 (en) 2011-12-22 2023-11-15 President And Fellows Of Harvard College Methods for analyte detection
US11021737B2 (en) 2011-12-22 2021-06-01 President And Fellows Of Harvard College Compositions and methods for analyte detection
US10385392B2 (en) 2011-12-30 2019-08-20 Abbott Molecular Inc. Nucleic acid hybridization probes
US9096902B2 (en) 2012-03-22 2015-08-04 The Regents Of The University Of California Genetic barcodes
US20140178869A1 (en) 2012-04-05 2014-06-26 Advanced Cell Diagnostics, Inc. Detection of immunoglobulin light chain restriction by rna in situ hybridization
CN104704128A (zh) 2012-05-22 2015-06-10 纳米线科技公司 预测乳腺癌结果的nano46基因和方法
WO2013184754A2 (en) 2012-06-05 2013-12-12 President And Fellows Of Harvard College Spatial sequencing of nucleic acids using dna origami probes
CA2877378A1 (en) 2012-06-29 2014-01-03 Nanostring Technologies, Inc. Methods of treating breast cancer with gemcitabine therapy
US9347106B2 (en) 2012-07-18 2016-05-24 The Regents Of The University Of California Multiplex assay for the detection of citrus pathogens
US20140120083A1 (en) 2012-11-01 2014-05-01 Infinity Pharmaceuticals, Inc. Treatment of cancers using pi3 kinase isoform modulators
US20150283142A1 (en) 2013-03-15 2015-10-08 Infinity Pharmaceuticals, Inc. Treatment of cancers using pi3 kinase isoform modulators
US20140154681A1 (en) 2012-11-12 2014-06-05 Nanostring Technologies, Inc. Methods to Predict Breast Cancer Outcome
US9713612B2 (en) 2013-03-12 2017-07-25 Curegenix, Inc. Compounds for treatment of cancer
US10138509B2 (en) 2013-03-12 2018-11-27 President And Fellows Of Harvard College Method for generating a three-dimensional nucleic acid containing matrix
PT2968586T (pt) 2013-03-14 2018-11-13 Ethris Gmbh Composições de arnm de cftr e métodos e utilizações relacionados
TW201522637A (zh) 2013-03-15 2015-06-16 Jackson Lab 非胚胎幹細胞之單離及其用途
US20140357509A1 (en) 2013-03-28 2014-12-04 Advanced Cell Diagnostics, Inc. Differentiation between transient and persistent high-risk hpv infection by in situ hybridization
KR102368591B1 (ko) 2013-04-30 2022-02-25 캘리포니아 인스티튜트 오브 테크놀로지 순차적 하이브리드화 바코딩에 의한 분자의 멀티플렉스 표지화
WO2014182598A1 (en) 2013-05-06 2014-11-13 Physicians Choice Laboratory Services, Llc Diagnostic assay combining cellular and cell free nucleic acid
EP2996789B1 (en) 2013-05-17 2019-07-17 Siemens Healthcare Diagnostics Inc. Particle release and collection
DK3003309T3 (da) 2013-05-30 2020-12-14 Infinity Pharmaceuticals Inc Behandling af cancer med PI3-kinase-isoform modulatorer
JP2016521575A (ja) 2013-06-14 2016-07-25 ナノストリング テクノロジーズ,インコーポレイティド 多重化可能なタグベースのレポーターシステム
US10697005B2 (en) 2013-06-26 2020-06-30 Ramesh Vallabhaneni Method and system for tracking specific in situ hybridizations in biological samples using molecular barcodes
US20150051117A1 (en) 2013-08-16 2015-02-19 President And Fellows Of Harvard College Assembly of Nucleic Acid Sequences in Emulsions
EP3338793A1 (en) 2013-08-28 2018-06-27 AbbVie Stemcentrx LLC Novel sez6 modulators and methods of use
US20150105298A1 (en) 2013-10-10 2015-04-16 The Research Foundation For The State University Of New York Multi-oligomer in situ hybridization probes
US9629804B2 (en) 2013-10-22 2017-04-25 Shire Human Genetic Therapies, Inc. Lipid formulations for delivery of messenger RNA
WO2015061461A1 (en) 2013-10-22 2015-04-30 Shire Human Genetic Therapies, Inc. Cns delivery of mrna and uses thereof
WO2015084726A1 (en) 2013-12-02 2015-06-11 Qbase, LLC Event detection through text analysis template models
CA2932476A1 (en) 2013-12-12 2015-06-18 Stemcentrx, Inc. Novel anti-dpep3 antibodies and methods of use
WO2015095766A2 (en) 2013-12-20 2015-06-25 Stem Centrx, Inc. Novel anti-lingo1 antibodies and methods of use
WO2015100459A2 (en) 2013-12-27 2015-07-02 Merrimack Pharmaceuticals, Inc. Biomarker profiles for predicting outcomes of cancer therapy with erbb3 inhibitors and/or chemotherapies
EP3094751A4 (en) 2014-01-14 2017-06-07 Santa Maria Biotherapeutics, Inc. Activin inhibitor response prediction and uses for treatment
WO2015120273A1 (en) 2014-02-07 2015-08-13 The General Hospital Corporation Differential diagnosis of hepatic neoplasms
US20150232935A1 (en) 2014-02-14 2015-08-20 The General Hospital Corporation Methods for diagnosing igg4-related disease
JP2017514143A (ja) 2014-02-21 2017-06-01 アッヴィ・ステムセントルクス・エル・エル・シー メラノーマに使用するための抗dll3抗体および薬物コンジュゲート
JP6825915B2 (ja) 2014-02-24 2021-02-03 ヴェンタナ メディカル システムズ, インク. 標識された2’−o−メチルrnaオリゴヌクレオチドプローブ及びシグナル増幅系を使用する自動rna検出
US20150247205A1 (en) 2014-02-28 2015-09-03 The General Hospital Corporation Diagnosis of multiple myeloma and lymphoma
WO2015136509A2 (en) 2014-03-14 2015-09-17 Genesis Theranostix Korlatolt Felelossegu Tarsasag Diagnostic and therapeutic targets for preeclampsia and closely related complications of pregnancy
AU2015231294B2 (en) 2014-03-18 2020-10-29 University Of Massachusetts rAAV-based compositions and methods for treating amyotrophic lateral sclerosis
BR112016021383A2 (pt) 2014-03-24 2017-10-03 Genentech Inc Método para identificar um paciente com câncer que é susceptível ou menos susceptível a responder ao tratamento com um antagonista de cmet, método para identificar um paciente apresentando câncer previamente tratado, método para determinar a expressão do biomarcador hgf, antagonista anti-c-met e seu uso, kit de diagnóstico e seu método de preparo
US10858698B2 (en) 2014-03-25 2020-12-08 President And Fellows Of Harvard College Barcoded protein array for multiplex single-molecule interaction profiling
CN106715768B (zh) 2014-07-30 2020-06-16 哈佛学院院长及董事 用于测定核酸的系统和方法
US9933431B2 (en) 2014-08-22 2018-04-03 Arizona Board Of Regents On Behalf Of Arizona State University System and method for iterative detection of biological molecules
KR102298387B1 (ko) * 2014-11-21 2021-09-07 나노스트링 테크놀로지스, 인크. 무효소 및 무증폭 시퀀싱
JP7012957B2 (ja) 2015-03-24 2022-01-31 国立大学法人群馬大学 Rna配列の簡便検出法
EP3283629A4 (en) * 2015-04-17 2018-08-29 President and Fellows of Harvard College Barcoding systems and methods for gene sequencing and other applications
AU2016349288A1 (en) 2015-11-03 2018-05-31 President And Fellows Of Harvard College Method and apparatus for volumetric imaging of a three-dimensional nucleic acid containing matrix
JP7025340B2 (ja) 2016-02-26 2022-02-24 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 2プローブ近接ライゲーションシステムを用いた多重化単一分子rna可視化
WO2017161251A1 (en) 2016-03-17 2017-09-21 President And Fellows Of Harvard College Methods for detecting and identifying genomic nucleic acids
US11326206B2 (en) 2016-04-07 2022-05-10 Pacific Biosciences Of California, Inc. Methods of quantifying target nucleic acids and identifying sequence variants
CA3023566A1 (en) 2016-05-16 2017-11-23 Nanostring Technologies, Inc. Methods for detecting target nucleic acids in a sample
WO2017222453A1 (en) 2016-06-21 2017-12-28 Hauling Thomas Nucleic acid sequencing
AU2017361521B2 (en) * 2016-11-21 2020-08-27 Nanostring Technologies, Inc. Chemical compositions and methods of using same
ES2917500T3 (es) 2017-03-01 2022-07-08 Univ Leland Stanford Junior Ensayo de ligadura de proximidad circular altamente específico
WO2019199579A1 (en) 2018-04-09 2019-10-17 The Board Of Trustees Of The Leland Stanford Junior University Method of in situ gene sequencing
SG11202011274YA (en) 2018-05-14 2020-12-30 Nanostring Technologies Inc Chemical compositions and methods of using same
EP3836967A4 (en) 2018-07-30 2022-06-15 ReadCoor, LLC METHODS AND SYSTEMS FOR SAMPLE PROCESSING OR ANALYSIS
AU2020354648A1 (en) 2019-09-26 2022-04-14 Jumpcode Genomics, Inc. Method and system for targeted nucleic acid sequencing
US20230039899A1 (en) 2020-01-03 2023-02-09 The Johns Hopkins University In situ rna analysis using probe pair ligation
US20210403992A1 (en) 2020-06-29 2021-12-30 Miltenyi Biotec B.V. & Co. KG METHOD COMBINING SINGLE CELL GENE EXPRESSION MAPPING AND TARGETED RNA OR c-DNA SEQUENCING USING PADLOCK OLIGONUCLEOTIDES COMPRISING A BARCODE REGION
US20220040346A1 (en) 2020-08-10 2022-02-10 Sterilization Station, LLC System and method for shopping cart disinfection and sterilization using ultraviolet light
EP4001432A1 (en) 2020-11-13 2022-05-25 Miltenyi Biotec B.V. & Co. KG Algorithmic method for efficient indexing of genetic sequences using associative arrays
CN114854838A (zh) 2021-02-04 2022-08-05 美天施生物科技有限两合公司 结合靶向RNA或cDNA体外测序与原位测序的方法
WO2022197801A1 (en) 2021-03-17 2022-09-22 Yale University Systems and methods for determining barcodes and screening in situ
US20220356519A1 (en) 2021-05-10 2022-11-10 Pacific Biosciences Of California, Inc. Single-molecule seeding and amplification on a surface
WO2022241227A1 (en) 2021-05-14 2022-11-17 Akoya Biosciences, Inc. Amplification of rna detection signals in biological samples
US20220403462A1 (en) 2021-06-18 2022-12-22 Miltenyi Biotec B.V. & Co. KG Method of spatial sequencing of genes from tissue using padlocks with gaps on substrate
EP4108783B1 (en) 2021-06-24 2024-02-21 Miltenyi Biotec B.V. & Co. KG Spatial sequencing with mictag

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013055995A2 (en) 2011-10-14 2013-04-18 President And Fellows Of Harvard College Sequencing by structure assembly

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Nat Chem.,4(10):832-839(2012.10.)

Also Published As

Publication number Publication date
US10415080B2 (en) 2019-09-17
US20220213532A1 (en) 2022-07-07
JP6730525B2 (ja) 2020-07-29
JP2021000085A (ja) 2021-01-07
KR20200138426A (ko) 2020-12-09
US11279969B2 (en) 2022-03-22
KR20190080952A (ko) 2019-07-08
AU2017361521A1 (en) 2019-05-30
KR102476709B1 (ko) 2022-12-09
WO2018094385A1 (en) 2018-05-24
AU2023226700A1 (en) 2023-09-28
JP2022174137A (ja) 2022-11-22
AU2020210277B2 (en) 2023-06-29
US20190390258A1 (en) 2019-12-26
JP7137595B2 (ja) 2022-09-14
CN110225980B (zh) 2023-01-06
KR20230003586A (ko) 2023-01-06
KR20210126155A (ko) 2021-10-19
US11821026B2 (en) 2023-11-21
CA3043489A1 (en) 2018-05-24
AU2017361521B2 (en) 2020-08-27
EP3541957A1 (en) 2019-09-25
AU2020210277A1 (en) 2020-08-20
KR102187291B1 (ko) 2020-12-07
SG10202100951SA (en) 2021-03-30
US20180142286A1 (en) 2018-05-24
JP2020500514A (ja) 2020-01-16
CN110225980A (zh) 2019-09-10
US20240084361A1 (en) 2024-03-14
CN116334202A (zh) 2023-06-27
US20230257800A1 (en) 2023-08-17

Similar Documents

Publication Publication Date Title
KR102313431B1 (ko) 화학적 조성물 및 이것을 사용하는 방법
AU2017268257B2 (en) Methods for detecting target nucleic acids in a sample
KR102105236B1 (ko) 무효소 및 무증폭 시퀀싱
US11549139B2 (en) Chemical compositions and methods of using same

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right