KR20220111315A - 연속 표지화 방식을 사용하는 합성에 의한 시퀀싱 방법 - Google Patents

연속 표지화 방식을 사용하는 합성에 의한 시퀀싱 방법 Download PDF

Info

Publication number
KR20220111315A
KR20220111315A KR1020227022926A KR20227022926A KR20220111315A KR 20220111315 A KR20220111315 A KR 20220111315A KR 1020227022926 A KR1020227022926 A KR 1020227022926A KR 20227022926 A KR20227022926 A KR 20227022926A KR 20220111315 A KR20220111315 A KR 20220111315A
Authority
KR
South Korea
Prior art keywords
group
nucleotide
different
conjugate
nucleotides
Prior art date
Application number
KR1020227022926A
Other languages
English (en)
Inventor
얀 아스띠에
프랑크 베르크만
디터 하인들
Original Assignee
에프. 호프만-라 로슈 아게
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에프. 호프만-라 로슈 아게 filed Critical 에프. 호프만-라 로슈 아게
Publication of KR20220111315A publication Critical patent/KR20220111315A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/24Heterocyclic radicals containing oxygen or sulfur as ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6811Selection methods for production or design of target specific oligonucleotides or binding molecules
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/113Modifications characterised by incorporating modified backbone
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/101Primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/149Sequential reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/143Magnetism, e.g. magnetic label
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/155Particles of a defined size, e.g. nanoparticles

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

본 발명은 표적 폴리뉴클레오티드 분자를 시퀀싱하는 방법을 제공한다. 일부 실시형태에서, 본 발명은 합성에 의한 시퀀싱 방법을 제공하며, 이때 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트들은 복수의 신생 핵산 복제 가닥들의 각 반복적 연장 동안 순차적으로 형성되고 검출되며, 이때 각각의 신생 핵산 복제 가닥은 복수의 표적 폴리뉴클레오티드 분자들 중 하나에 상보적이다. 일부 실시형태에서, 이러한 복수의 표적 폴리뉴클레오티드 분자들은 고체 지지체 상에 배열된다.

Description

연속 표지화 방식을 사용하는 합성에 의한 시퀀싱 방법
발명의 배경
DNA 시퀀싱은 40년 전 처음 시작된 이래 그 중요성이 극히 증가했다. 이는 대부분의 생물학 및 의학 영역에서 중요한 기술로 인식되고 있으며 맞춤형 및 정밀의학이라는 새로운 패러다임의 토대가 된다. 개체의 게놈 및 후성유전체에 대한 정보는 질병 성향, 임상 예후 및 치료제에 대한 반응을 밝히는 데 도움이 될 수 있다; 그러나 의학에서 게놈 시퀀싱을 일상적으로 적용하려면 시기 적절하고 비용 효율적인 방식으로 제공되는 포괄적인 데이터가 필요하다.
잘 알려진 시퀀싱 방법은 R. Tsien(WO 91/06678)에 의해 처음 기술된 합성을 통한 시퀀싱 (Sequencing-by-Synthesis, SBS) 방법이다. 이 방법은 3'-OH 기에서 보호되는 가역적 종결자 뉴클레오티드를 사용한다. 현재 시퀀싱 시스템은 형광 표지를 비롯한 가역적 종결자 뉴클레오티드를 활용한다. 다른 가역적 종결자 뉴클레오티드들의 혼합물을 플로우 셀에 추가하면, DNA 중합효소는 변형된 뉴클레오티드를 합성 중인 DNA 가닥에 혼입시키고, 이들 가닥이 영상화된 다음, 혼입된 뉴클레오티드가 3'-OH 기에서 탈보호되어, 또 다른 뉴클레오티드 혼입 주기에서 이용가능하다.
보다 구체적으로, 가역적 종결에 의한 시퀀싱의 각 주기는 다음 단계들로 구성된다: (i) 돌연변이 DNA 중합효소에 의한 상보적 가역적 종결자 뉴클레오티드를 플로우 셀에 부착된 DNA 가닥에 혼입, (ii) 서로 다른 가역적 종결자 뉴클레오티드의 4개 염기에 대한 서로 다른 형광 신호 검출, 및 (iii) 종결 모이어티 및 형광 표지를 절단하여 유리 3'-OH 기를 복원. 일부 실시형태에서, 형광 염료는 레이저 여기 및 영상화를 통해 식별된다. 이러한 주기를 반복하여 DNA 템플릿을 시퀀싱한다.
발명의 간단한 요약
출원인은 검출가능한 자성 표지를 포함하는 시약 및 자성 센서 어레이를 사용하여 개선된 합성에 의한 시퀀싱 방법을 개발했다. 출원인은 검출가능한 자성 표지를 포함하는 시약 및 자성 센서 어레이를 사용하여 합성에 의한 시퀀싱을 수행하는 것이 시퀀싱 시스템에서 고출력 레이저 및 고해상도 광학 장치의 필요성을 제거하면서 시퀀싱 처리량을 상당히 증가시키고 시퀀싱 비용을 절감시킴을 발견했다.
본 발명의 한 양상은, 다음 단계들을 포함하는, 고체 지지체 상에 배열된 복수의 표적 폴리뉴클레오티드를 시퀀싱하는 방법이다: (a) 4개의 서로 다른 뉴클레오티드 중 하나를 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 복제 가닥들에 혼입시키는 단계, 이때 4개의 서로 다른 뉴클레오티드 각각은 (i) 3'-하이드록실 보호기, 및 (ii) 절단성 링커를 통해 핵염기에 커플링된 제1 반응기를 포함하고, 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 제1 반응기를 포함하고; (b) 뉴클레오티드-접합체 복합체의 서로 다른 서브세트들을 순차적으로 형성하는 단계, 이때 형성된 뉴클레오티드-접합체 복합체의 각각의 서로 다른 서브세트 내 각각의 뉴클레오티드-접합체 복합체는 신생 핵산 복제 가닥들에 혼입된 서로 다른 뉴클레오티드 중 단 하나로부터 유래되고, 이때 뉴클레오티드-접합체 복합체의 각각의 서로 다른 서브세트의 순차적 형성은 다음 단계들을 포함한다: (i) 검출가능한 표지를 포함하고 신생 핵산 가닥들에 혼입된 4개의 서로 다른 뉴클레오티드 중 단 하나와 직교 반응성인 접합체를 도입하는 단계; (ii) 각각의 도입된 접합체의 표지를 검출함으로써 상기 서브세트 내 각 뉴클레오티드-접합체 복합체의 형성을 검출하는 단계; (iii) 고체 지지체 내부에서 상기 서브세트 내 각각의 검출된 뉴클레오티드-접합체 복합체의 위치를 결정하는 단계; 그리고 (iv) 상기 서브세트 내 형성된 검출가능한 뉴클레오티드-접합체 복합체 각각으로부터 적어도 검출가능한 표지를 선택적으로 절단하는 단계.
일부 실시형태에서, 4개의 서로 다른 뉴클레오티드 각각의 서로 다른 제1 반응기는 "클릭 화학" 반응에 참여할 수 있는 반응성 작용기 쌍의 제1 구성원, 한 쌍의 특이적 결합 실체(entities)들의 제1 구성원, 제1 올리고뉴클레오티드, 및 한 쌍의 호스트 / 게스트 분자의 제1 구성원에서 독립적으로 선택된다. 일부 실시형태에서, 도입된 접합체는 "클릭 화학" 반응에 참여할 수 있는 반응성 작용기 쌍의 제2 구성원, 한 쌍의 특이적 결합 실체들의 제2 구성원, 제1 올리고뉴클레오티드와 혼성화가능한 제2 올리고뉴클레오티드, 및 상기 한 쌍의 호스트 / 게스트 분자의 제2 구성원에서 선택된 제2 반응기를 포함한다. 일부 실시형태에서, 제1 및 제2 반응기는 서로 혼성화가능한 제1 및 제2 올리고뉴클레오티드를 포함한다.
일부 실시형태에서, 4개의 서로 다른 뉴클레오티드 각각의 서로 다른 제1 반응기는 서로 다른 제1 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 서로 다른 제1 올리고뉴클레오티드는 서열 번호: 1 - 58 중 어느 하나에서 선택될 수 있다. 일부 실시형태에서, 각각의 서로 다른 제1 올리고뉴클레오티드는 제1 LNA-변형된 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제1 LNA-변형된 올리고뉴클레오티드는 서열 번호: 1 - 22 및 29 - 50 중 어느 하나로부터 선택된 서열을 포함한다.
일부 실시형태에서, 도입된 접합체의 제2 반응기는 제1 올리고뉴클레오티드와 혼성화가능한 제2 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제1 올리고뉴클레오티드와 혼성화가능한 제2 올리고뉴클레오티드는 서열 번호: 1- 58 중 어느 하나로부터 선택된다. 일부 실시형태에서, 제1 올리고뉴클레오티드와 혼성화가능한 제2 올리고뉴클레오티드는 제2 LNA-변형된 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제2 LNA-변형된 올리고뉴클레오티드는 3 내지 12량체를 포함한다. 일부 실시형태에서, 제2 LNA-변형된 올리고뉴클레오티드는 5 내지 10량체를 포함한다. 일부 실시형태에서, 제2 LNA-변형된 올리고뉴클레오티드는 서열 번호: 1 - 22 및 29 - 50 중 어느 하나로부터 선택된 서열을 포함한다. 일부 실시형태에서, 제1 올리고뉴클레오티드와 혼성화가능한 제2 올리고뉴클레오티드는 L-배열의 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제1 올리고뉴클레오티드와 혼성화가능한 제2 올리고뉴클레오티드는 베타-L-LNA 올리고뉴클레오티드를 포함한다.
일부 실시형태에서, 절단성 링커는 디설파이드 기, 알파-아지도에터, 니트로벤질계 기 및 페나실 기로 구성된 군에서 선택되는 하나 이상의 절단성 기를 포함한다. 일부 실시형태에서, 고체 지지체 상에 존재하는 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 복제 가닥에 서로 다른 뉴클레오티드들의 혼입은 4개의 서로 다른 뉴클레오티드의 혼합물을 고체 지지체에 도입하는 것을 포함한다. 일부 실시형태에서, 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트의 순차적 형성은 3회 수행되어, 검출가능한 뉴클레오티드-접합체 복합체들의 3개의 서로 다른 서브세트가 형성되고 검출된다.
일부 실시형태에서, 상기 방법은 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 복제 가닥들에 혼입된 서로 다른 뉴클레오티드로부터 3'-하이드록실 보호기 각각을 제거하는 단계를 추가로 포함한다. 일부 실시형태에서, 3'-하이드록실 보호기는 아지도메틸기를 포함한다. 일부 실시형태에서, 상기 방법은 4개의 서로 다른 뉴클레오티드의 혼합물을 고체 지지체에 도입하여 고체 지지체 상의 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 가닥 각각을 연장시키는 단계를 추가로 포함한다.
일부 실시형태에서, 상기 4개의 서로 다른 뉴클레오티드는 화학식 (IC), (ID), (IE) 및 (IF) 중 어느 하나의 구조를 갖는다:
Figure pct00001
(IC),
Figure pct00002
(ID),
Figure pct00003
(IE), 및
Figure pct00004
(IF),
이때
WA는 아데닌 핵염기이고, WG는 구아닌 핵염기이고; WC는 사이토신 핵염기이고; WR은 티민 핵염기 또는 우라실 핵염기 중 하나이고;
Z1A, Z1B, Z1C , 및 Z1D는 각각 서로 다른 제1 반응기이고;
Y는 -O-P(O)(OH)[-O-P(O)(OH)]z-OH이고, 이때 z는 2 내지 약 5의 범위이고;
PG는 보호기이고; 그리고
각각의 L1은 독립적으로 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자로 선택적으로 치환되며, 단, L1 은 하나 이상의 절단성 기를 포함한다.
일부 실시형태에서, z는 2이다.
일부 실시형태에서, 각각의 도입된 접합체의 검출가능한 표지는 자성 나노입자를 포함한다. 일부 실시형태에서, 자성 나노입자는 FeO, Fe3O4, FePt, FePd, 및 CoPt로 이루어진 군에서 선택된 물질을 포함한다. 일부 실시형태에서, 자성 나노입자는 자성 센서 어레이를 사용하여 검출된다.
일부 실시형태에서, 상기 도입된 접합체는 화학식 (IIA) 및 (IIB) 중 어느 하나의 구조를 가지며:
Figure pct00005
(IIA),
Figure pct00006
(IIB),
이때
D는 검출가능한 표지 또는 검출가능한 표지를 포함하는 접합체이고;
L2는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며;
Z2는 제2 반응기이고; 그리고
p는 2 내지 약 1000 범위이다.
일부 실시형태에서, L2는 절단성 기를 포함한다. 일부 실시형태에서, L2는 비오틴 유래 모이어티를 포함한다.
일부 실시형태에서, 상기 방법은 뉴클레오티드-접합체 복합체의 서로 다른 서브세트의 순차적 형성 이전에 혼입되지 않은 뉴클레오티드를 제거하는 단계를 추가로 포함한다.
본 발명의 또 다른 양상은 다음 단계들을 포함하는, 고체 지지체 상에 배열된 복수의 표적 폴리뉴클레오티드의 서열을 결정하는 방법이다: (a) 4개의 서로 다른 뉴클레오티드 중 하나를 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 가닥들에 혼입시키는 단계, 이때 4개의 서로 다른 뉴클레오티드 각각은 절단성 링커를 통해 핵염기에 커플링된 제1 반응기 및 3'-하이드록실 보호기를 포함하고, 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 제1 반응기를 포함하고; (b) 신생 핵산 가닥에 혼입된 4개의 서로 다른 뉴클레오티드의 각 하나를 순차적으로 표지화하는 단계, 이때 이러한 순차적 표지화 단계는 다음 단계들을 포함한다: (i) 검출가능한 표지를 포함하고 신생 핵산 가닥들에 혼입된 4개의 서로 다른 뉴클레오티드 중 단 하나와 직교 반응성인 접합체를 도입하여 하나 이상의 표지된 뉴클레오티드를 제공하는 단계; (ii) 하나 이상의 표지된 뉴클레오티드의 표지를 검출하는 단계; (iii) 검출된 표지에 기초하여, 고체 지지체 내부에서 하나 이상의 표지된 뉴클레오티드의 위치를 확인하는 단계; 및 (iv) 신생 핵산 가닥들에 혼입된 하나 이상의 표지된 뉴클레오티드로부터 적어도 검출가능한 표지를 선택적으로 절단하는 단계.
일부 실시형태에서, 4개의 서로 다른 뉴클레오티드 각각의 서로 다른 제1 반응기는 "클릭 화학" 반응에 참여할 수 있는 반응성 작용기 쌍의 제1 구성원, 한 쌍의 특이적 결합 실체들의 제1 구성원, 제1 올리고뉴클레오티드, 및 한 쌍의 호스트 / 게스트 분자의 제1 구성원으로 이루어진 군에서 독립적으로 선택된다. 일부 실시형태에서, 4개의 서로 다른 뉴클레오티드 각각의 서로 다른 제1 반응기는 서로 다른 제1 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 각각의 도입된 접합체는 제1 올리고뉴클레오티드 중 하나에 상보적인 제2 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제1 올리고뉴클레오티드 중 하나에 상보적인 제2 올리고뉴클레오티드는 L-배열의 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제1 올리고뉴클레오티드 중 하나에 상보적인 제2 올리고뉴클레오티드는 베타-L-LNA 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제1 올리고뉴클레오티드 중 하나에 상보적인 제2 올리고뉴클레오티드는 하나 이상의 LNA 단량체를 포함한다. 일부 실시형태에서, 제2 올리고뉴클레오티드는 서열 번호: 1 - 22 및 29 - 50 중 어느 하나로 이루어진 군에서 선택된 서열을 가진다. 일부 실시형태에서, 제1 올리고뉴클레오티드 중 하나에 상보적인 제2 올리고뉴클레오티드는 하나 이상의 PNA 단량체를 포함한다.
일부 실시형태에서, 절단성 링커는 디설파이드 기, 알파-아지도에터, 니트로벤질계 기 및 페나실 기로 구성된 군에서 선택되는 하나 이상의 절단성 기를 포함한다. 일부 실시형태에서, 고체 지지체 상에 존재하는 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 가닥에 서로 다른 뉴클레오티드들의 혼입은 4개의 서로 다른 뉴클레오티드의 혼합물을 고체 지지체에 도입하는 것을 포함한다.
일부 실시형태에서, 순차적 표지화 단계는 3회 수행된다. 일부 실시형태에서, 순차적 표지화 단계는 4회 수행된다. 일부 실시형태에서, 상기 방법은 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 가닥들에 혼입된 서로 다른 뉴클레오티드로부터 3'-하이드록실 보호기 각각을 제거하는 단계를 추가로 포함한다. 일부 실시형태에서, 3'-하이드록실 보호기는 아지도메틸기를 포함한다.
일부 실시형태에서, 상기 방법은 4개의 서로 다른 뉴클레오티드의 혼합물을 고체 지지체에 도입하여 고체 지지체 상의 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 가닥 각각을 연장시키는 단계를 추가로 포함한다. 일부 실시형태에서, 상기 방법은 뉴클레오티드-접합체 복합체의 서로 다른 서브세트의 순차적 형성 이전에 혼입되지 않은 뉴클레오티드를 제거하는 단계를 추가로 포함한다. 일부 실시형태에서, 상기 방법은 각각의 순차적 표지화 단계 사이에 임의의 미반응 접합체를 제거하는 단계를 추가로 포함한다.
본 발명의 또 다른 양상은 화학식 (IA)로 정의된 구조를 갖는 화합물 또는 이의 염으로서:
Figure pct00007
(IA),
이때
Y는 -O-P(O)(OH)[-O-P(O)(OH)]z-OH 또는 -O-P(O)(OH)-올리고뉴클레오티드이고; 이때 z는 2 내지 약 5 범위이고;
PG는 보호기이고;
W는 핵염기이고;
L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
Z1은 올리고뉴클레오티드이다.
일부 실시형태에서, z는 2이다.
일부 실시형태에서, Z1은 LNA-변형된 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, Z1은 PNA-변형된 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, Z1은 L-배열의 단량체, 예를 들어, 적어도 하나의 L-배열의 단량체를 포함한다. 일부 실시형태에서, L-배열의 단량체는 L-배열의 LNA 단량체이다. 일부 실시형태에서, L-배열의 LNA 단량체는 베타-L-LNA 단량체이다. 일부 실시형태에서, 상기 올리고뉴클레오티드는 4 내지 12량체를 포함한다. 일부 실시형태에서, 상기 올리고뉴클레오티드는 5 내지 10량체를 포함한다. 일부 실시형태에서, 상기 올리고뉴클레오티드는 서열 번호: 1 - 22 및 29 - 50 중 어느 하나로부터 선택된 서열을 포함한다. 일부 실시형태에서, 적어도 하나의 절단성 기는 화학적 절단성 기, 효소적 절단성 기 및 광절단성 기로 이루어진 군에서 선택된다.
본 발명의 또 다른 양상은 (i) 3'-하이드록실 보호기, 및 (ii) 절단성 링커를 통해 핵염기에 커플링되는 반응기를 포함하는 뉴클레오티드로서, 이때 반응기는 LNA-변형된 올리고뉴클레오티드 또는 베타-L-LNA 변형된 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, LNA-변형된 올리고뉴클레오티드 또는 베타-L-LNA 변형된 올리고뉴클레오티드는 서열 번호: 1 - 22 또는 29 - 50 중 어느 하나를 가지는 서열을 포함한다.
본 발명의 또 다른 양상은 화학식 (IC)의 뉴클레오티드 하나, 화학식 (ID)의 뉴클레오티드 하나, 화학식 (IE)의 뉴클레오티드 하나, 및 화학식 (IF)의 뉴클레오티드 하나를 포함하는 키트로서:
Figure pct00008
(IC),
Figure pct00009
(ID),
Figure pct00010
(IE), 및
Figure pct00011
(IF),
이때
Y는 -O-P(O)(OH)[-O-P(O)(OH)]z-OH이고, 이때 z는 2 내지 약 5의 범위의 정수이고;
PG는 보호기이고;
WA는 아데닌 핵염기이고;
WG는 구아닌 핵염기이고;
WC는 사이토신 핵염기이고;
WR은 티민 핵염기 또는 우라실 핵염기 중 하나이고;
L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
Z1A, Z1B, Z1C , 및 Z1D 각각은 서로 다른 제1 반응기를 포함한다.
일부 실시형태에서, z는 2이다.
일부 실시형태에서, Z1A, Z1B, Z1C, 및 Z1D 제1 반응기는 "클릭 화학" 반응에 참여할 수 있는 반응성 작용기 쌍의 제1 구성원, 한 쌍의 특이적 결합 실체들의 제1 구성원, 제1 올리고뉴클레오티드, 및 한 쌍의 호스트 / 게스트 분자의 제1 구성원으로 이루어진 군에서 독립적으로 선택된다. 일부 실시형태에서, Z1A, Z1B, Z1C, 및 Z1D 제1 반응기 각각은 서로 다른 제1 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, Z1A, Z1B, Z1C, 및 Z1D 제1 반응기 각각은 서로 다른 LNA-변형된 제1 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, Z1A, Z1B, Z1C, 및 Z1D 제1 반응기 각각은 서로 다른 베타-L-LNA-변형된 제1 올리고뉴클레오티드를 포함한다.
일부 실시형태에서, 이러한 키트는 적어도 3개의 서로 다른 접합체를 추가로 포함하고, 이때 적어도 3개의 서로 다른 접합체 각각은 Z1A, Z1B, Z1C , 및 Z1D 중 하나와 직교로 반응하는 서로 다른 제2 반응기를 포함한다. 일부 실시형태에서, 각각의 서로 다른 제2 반응기는 Z1A, Z1B, Z1C , 및 Z1D 제1 반응기 중 하나와 직교로 반응한다. 일부 실시형태에서, 각각의 서로 다른 제2 반응기는 서로 다른 제2 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 각각의 서로 다른 제2 올리고뉴클레오티드는 적어도 하나의 LNA 단량체를 포함한다. 일부 실시형태에서, 각각의 서로 다른 제2 올리고뉴클레오티드는 적어도 하나의 베타-L-LNA 단량체를 포함한다.
본 발명의 또 다른 양상은 뉴클레오티드-접합체 복합체로서, 이때 이러한 뉴클레오티드-접합체 복합체는,
화학식 (IA)의 구조를 가지며:
Figure pct00012
(IA),
이때
Y는 -O-P(O)(OH)-올리고뉴클레오티드이고;
PG는 보호기이고;
W는 핵염기이고;
L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자로 선택적으로 치환되며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
Z1은 제1 반응기인, 뉴클레오티드를;
(ii) 화학식 (IIA) 또는 (IIB) 중 어느 하나의 구조를 가지며:
Figure pct00013
(IIA),
Figure pct00014
(IIB),
이때
D는 검출가능한 표지 또는 검출가능한 표지를 포함하는 접합체이고;
L2는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며;
Z2 는 제1 반응기 Z1과 직교 반응성인 제2 반응기이고; 그리고
p는 2 내지 약 1000 범위의 정수인, 접합체와 반응시키는 단계를 포함하는 공정에 의해 생성된다.
일부 실시형태에서, L2는 비오틴 또는 비오틴 유래 모이어티를 포함한다.
일부 실시형태에서, 상기 접합체는 화학식 (IIA)의 구조를 가진다. 일부 실시형태에서, 접합체는 화학식 (IIB)의 구조를 가지며, 이때 p는 2 내지 약 100의 범위이다.
일부 실시형태에서, 제1 반응기는 "클릭 화학(click chemistry)" 반응에 참여할 수 있는 한 쌍의 반응성 작용기의 제1 구성원을 포함한다. 일부 실시형태에서, 제1 반응기는 한 쌍의 특이적 결합 실체의 제1 구성원을 포함한다. 일부 실시형태에서, 특이적 결합 실체들의 쌍의 제1 구성원은 합텐이다. 일부 실시형태에서, 제1 반응기는 한 쌍의 호스트 / 게스트 분자의 제1 구성원을 포함한다. 일부 실시형태에서, 제1 반응기는 제1 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제1 올리고뉴클레오티드는 LNA-변형된 제1 올리고뉴클레오티드이다. 일부 실시형태에서, LNA-변형된 제1 올리고뉴클레오티드는 적어도 하나의 L-배열의 LNA 단량체를 포함한다. 일부 실시형태에서, LNA-변형된 제1 올리고뉴클레오티드는 서열 번호: 1 - 22 또는 29 - 50 중 어느 하나를 갖는 서열을 포함한다.
일부 실시형태에서, 제2 반응기는 제1 올리고뉴클레오티드에 상보적인 제2 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 제2 올리고뉴클레오티드는 LNA-변형된 제2 올리고뉴클레오티드 또는 베타-L-LNA-변형된 제2 올리고뉴클레오티드이다. 일부 실시형태에서, LNA-변형된 제2 올리고뉴클레오티드는 서열 번호: 1 - 22 또는 29 - 50 중 어느 하나를 갖는 서열을 포함한다.
일부 실시형태에서, 검출가능한 표지는 형광 분자를 포함한다. 일부 실시형태에서, 검출가능한 표지는 자성 나노입자를 포함한다. 일부 실시형태에서, 자성 나노입자는 강자성 물질을 포함한다. 일부 실시형태에서, 자성 나노입자는 FeO, Fe3O4, FePt, FePd, 및 CoPt로 이루어진 군에서 선택된 물질을 포함한다.
본 발명의 또 다른 양상은 간접적으로 커플링된 복수의 신생 핵산 복제 가닥들을 포함하는 고체 지지체로서, 이때 복수의 신생 핵산 복제 가닥들 각각은 화학식 (IA)를 갖는 혼입된 뉴클레오티드를 포함하고:
Figure pct00015
(IA),
이때
Y는 -O-P(O)(OH)-O-올리고뉴클레오티드이고, 이때
PG는 보호기이고;
W는 핵염기이고;
L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
Z1은 제1 올리고뉴클레오티드이다.
일부 실시형태에서, 제1 올리고뉴클레오티드는 LNA-변형된 제1 올리고뉴클레오티드이다. 일부 실시형태에서, LNA-변형된 제1 올리고뉴클레오티드는 적어도 하나의 L-배열의 LNA 단량체를 포함한다. 일부 실시형태에서, LNA-변형된 제1 올리고뉴클레오티드는 3 내지 12량체를 포함한다. 일부 실시형태에서, LNA-제1 변형된 올리고뉴클레오티드는 서열 번호: 1 - 22 또는 29 - 50 중 어느 하나를 가지는 서열을 포함한다.
도면의 간단한 설명
본 발명의 특징들에 대한 일반적인 이해를 위해 도면을 참조한다. 도면에서, 동일한 참조 번호는 전체에 걸쳐 동일한 요소를 식별하기 위해 사용되었다.
도 1A는 본 발명의 한 실시형태에 따른 시퀀싱 방법을 설명하는 흐름도를 제공한다.
도 1B는 본 발명의 한 실시형태에 따른 뉴클레오티드-접합체 복합체의 서로 다른 서브세트들을 순차적으로 형성하는 방법을 예시하는 흐름도를 제공한다.
도 2A는 본 발명의 한 실시형태에 따른 시퀀싱 방법을 설명하는 흐름도를 제공한다.
도 2B는 본 발명의 한 실시형태에 따라 핵산 가닥에 혼입된 뉴클레오티드를 순차적으로 표지하는 방법을 예시하는 흐름도를 제공한다.
도 3은 본 발명의 한 실시형태에 따른 시퀀싱 방법을 도시하는 흐름도를 제공한다.
도 4A는 본 발명의 일 실시형태에 따라 본 발명의 4개의 서로 다른 뉴클레오티드를 4개의 서로 다른 핵산 가닥에 혼입시킨 다음, 4개의 서로 다른 혼입된 뉴클레오티드 각각을 순차적으로 표지하는 방법을 예시한다.
도 4B는 본 발명의 한 실시형태에 따라 뉴클레오티드-접합체 복합체의 순차적으로 형성된 서브세트들이 순차적으로 검출되는 방법을 도시한다.
상세한 설명
또한, 달리 명백하게 지시되지 않는 한, 하나 이상의 단계 또는 작용을 포함하는 본원 청구범위의 임의의 방법에서, 해당 방법의 단계 또는 작용 순서는 해당 방법의 단계 또는 작용이 언급되어 있는 순서에 반드시 제한되는 것은 아니다.
본원에서 사용되는 단수 표현 “하나 (a, an)” 및 “그것(the)”은 문맥상 명백하게 달리 언급되지 않는 한, 복수 표현을 포함한다. 유사하게, 용어 “또는”은 문맥상 명백하게 달리 나타내지 않는 한 “및”을 포함하는 것으로 한다. “포함한다”라는 용어는 포괄적으로 정의되며, “A 또는 B를 포함한다”는 A, B 또는 A 및 B를 포함하는 것을 의미한다.
본명세서 및 청구범위에서 사용된 “또는”은 상기 정의된 “및/또는”과 동일한 의미를 갖는 것으로 이해되어야 한다. 예를 들어, 목록에서 항목을 분리할 때 “또는” 또는 “및/또는”은 포괄적인 것으로 해석되어야 한다, 즉, 소정의 구성요소들 또는 이의 목록 중 하나 이상을 포함하지만 선택적으로 목록에 없는 또 다른 항목을 포함하는 것이다. “~ 중 단 하나” 또는 “~ 중 정확히 하나” 또는 청구범위에서 사용되는 경우 “~로 이루어진”과 같이 명확하게 달리 언급이 되는 용어들만 소정의 구성요소들 또는 이의 목록 중 정확하게 하나의 구성요소의 포함을 지칭하게 될 것이다. 일반적으로, 본원에서 사용되는 용어 “또는”은 배타성에 관한 용어, 예를 들어, “둘 중 하나”(“either”, “one of”), “둘 중 단 하나”(“only one of”) 또는 “둘 중 정확히 하나”(“exactly one of”)가 선행되는 경우 배타적 대안 (즉, “하나 또는 다른 하나 그러나 둘 모두는 아님”)을 나타내는 것으로 해석되어야 한다. “~로 본질적으로 구성된”(“Consisting essentially of”)은 청구범위에서 사용될 때 특허법 분야에서 사용되는 일반적인 의미를 가진다.
본원에서 “포함하는”, “포함하는”, “갖는” 등의 용어는 상호교환적으로 사용되며 동일한 의미를 갖는다. 유사하게, “포함한다”, “포함한다”, “갖다” 등은 상호교환적으로 사용되며 동일한 의미를 갖는다. 구체적으로, 각 용어는 “포함하는”에 대한 일반적인 미국 특허법 정의와 일관되게 정의되므로 “적어도 다음”을 의미하는 개방된 용어로 해석되며 추가적인 기능, 제한 사항, 양상 등을 배제하지 않는 것으로도 해석된다. 따라서, 예를 들어 “구성요소 a, b 및 c를 갖는 장치”는 해당 장치가 적어도 구성 요소 a, b 및 c를 포함함을 의미한다. 유사하게, “a, b, 및 c 단계를 포함하는 방법”이라는 문구는 그 방법이 적어도 a, b, 및 c 단계를 포함한다는 것을 의미한다. 또한, 단계 및 과정들이 본원에서 특정 순서로 설명될 수 있으나, 당업자는 이러한 순서의 단계 및 과정들이 달라질 수 있음을 알고 있을 것이다.
명세서 및 청구범위에서 본 명세서에 사용된 바와 같이, 하나 이상의 요소의 목록과 관련하여 “적어도 하나”라는 문구는, 이러한 요소들의 목록에 있는 요소들 중 하나 이상으로부터 선택된 적어도 하나의 요소를 의미하는 것으로 이해되어야 하지만, 해당 요소들의 목록에 구체적으로 열거된 각각의 그리고 모든 요소 중 적어도 하나를 반드시 포함하여야 하는 것은 아니며 해당 요소들의 목록에 있는 요소들의 임의의 조합을 반드시 배제하는 것도 아니다. 이 정의는 또한 “적어도 하나”라는 문구가 지칭하는 요소들의 목록 내에서 구체적으로 식별된 요소들 이외의 요소들이, 구체적으로 식별된 요소들과 관련이 있든 없든, 선택적으로 존재할 수 있음을 허용한다. 따라서, 비제한적인 예로서, “A 및 B 중 적어도 하나”(또는 동등하게 “A 또는 B 중 적어도 하나”, 또는 동등하게 “A 및/또는 B 중 적어도 하나”)는, 한 실시형태에서, 적어도 하나의 A (선택적으로 하나 이상을 포함)이고 B는 존재하지 않음 (그리고 선택적으로 B 이외의 요소들을 포함); 또 다른 실시형태에서, 적어도 하나의 B (선택적으로 하나 이상을 포함)이고 A는 존재하지 않음 (그리고 선택적으로 A 이외의 요소들을 포함); 또한 또 다른 실시형태에서, 적어도 하나의 A (선택적으로 하나 이상을 포함), 그리고 적어도 하나의 B (선택적으로 하나 이상을 포함); 등을 의미할 수 있다.
본원 전반에 걸쳐 “하나의 실시형태” 또는 “실시형태”라는 지칭은 해당 실시형태와 관련하여 기재된 특정한 특징, 구조 또는 특성이 최소한 하나의 실시형태에 포함됨을 의미한다. 그러므로, 본원 전반에 걸쳐 여러 부분에서 “하나의 실시형태에서” 또는 “실시형태에서”라는 문구의 사용은 반드시 모두 동일한 구체예를 언급하는 것은 아니다. 또한, 특정 특징, 구조, 또는 특성은 하나 이상의 실시형태에서 임의의 적절한 방식으로 조합될 수 있다.
본 명세서에 사용된 바와 같이, 용어 “유사체” 또는 “유도체”는 화학 및 생물학 내에서 통상적인 일반적 의미에 따라 사용되며 또 다른 화합물(즉, 소위 “참조” 화합물)과 구조적으로 유사하지만 그 조성이 서로 다른, 예를 들어, 하나의 원자가 서로 다른 원소의 원자로 치환된, 또는 특정 작용기가 존재하는, 또는 하나의 작용기가 또 다른 작용기로 치환된, 또는 참조 화합물의 하나 이상의 키랄 중심의 절대 입체화학이 다른 화학적 화합물을 지칭한다. 따라서 유사체는 기능 및 외관이 유사하거나 비등하지만 구조 또는 출처가 참조 화합물과 유사하지 않은 화합물이다.
본원에 사용된 용어 “지방족”은 포화되거나 단일- 또는 다중불포화될 수 있는 직쇄 또는 분지쇄 탄화수소 사슬을 의미한다. 불포화 지방족 그룹은 하나 이상의 이중 및/또는 삼중 결합을 포함한다. 탄화수소 사슬의 분지는 선형 사슬뿐만 아니라 비방향족 고리형 요소를 포함할 수 있다. 탄화수소 사슬은 달리 명시되지 않는 한 임의의 길이일 수 있으며 임의의 수의 분지쇄를 포함할 수 있다. 주요 사슬 및 분지쇄 모두는 또한 예를 들어 B, N, O, P, S, Se 또는 Si와 같은 헤테로원자를 함유할 수 있다.
본원에 사용된 용어 “알킬”은 직쇄 알킬 기(예를 들어, 메틸, 에틸, 프로필, 부틸, 펜틸, 헥실, 헵틸, 옥틸, 노닐, 데실 등), 분지쇄 알킬기(이소프로필, tert-부틸, 이소부틸 등), 사이클로알킬(지환족)기(사이클로프로필, 사이클로펜틸, 사이클로헥실, 사이클로헵틸, 사이클로옥틸), 알킬 치환 사이클로알킬기, 사이클로알킬 치환 알킬기 등을 포함하는 포화 지방족 기를 포함한다. 용어 알킬은 또한 알킬기를 포함하며, 이는 탄화수소 골격의 하나 이상의 탄소를 대체하는 산소, 질소, 황 또는 인 원자를 추가로 포함할 수 있다. 특정 실시형태에서, 직쇄 또는 분지쇄 알킬은 골격에 30개 이하의 탄소 원자를 갖는다 (예를 들어, 직쇄의 경우 C1-C30, 측쇄의 경우 C1-C30). 더욱이, 용어 알킬은 “비치환된 알킬” 및 “치환된 알킬” 둘 다를 포함하며, 이들 중 후자는 탄화수소 골격의 하나 이상의 탄소 상의 수소를 대체하는 치환기를 갖는 알킬 모이어티를 지칭한다. 이러한 치환기에는, 예를 들어 알케닐, 알키닐, 할로겐, 히드록실, 알킬카르보닐옥시, 아릴카르보닐옥시, 알콕시카르보닐옥시, 아릴옥시카르보닐옥시, 카르복실레이트, 알킬카르보닐, 아릴카르보닐, 알콕시카르보닐, 아미노카르보닐, 알킬아미노카르보닐, 디알킬아미노카르보닐, 알킬티오카르보닐, 알콕실, 포스페이트, 포스포네이토, 포스피네이토, 시아노, 아미노(알킬 아미노, 디알킬아미노, 아릴아미노, 디아릴아미노 및 알킬아릴아미노 포함), 아실아미노(알킬카르보닐아미노, 아릴카르보닐아미노, 카르바모일 및 우레이도 포함), 아미디노, 이미노, 설프히드릴, 알킬티오, 아릴티오, 티오카르복실레이트, 설페이트, 알킬설피닐, 설포네이토, 설파모일, 설폰아미도, 니트로, 트리플루오로메틸, 시아노, 아지도, 헤테로사이클릴, 알킬아릴, 또는 방향족 또는 헤테로방향족 모이어티가 포함될 수 있다. “알킬아릴” 또는 “아릴알킬” 모이어티는 아릴(예를 들어, 페닐메틸(벤질))로 치환된 알킬이다. 용어 “알킬”은 또한 천연 및 비천연 아미노산의 측쇄를 포함한다.
본원에서 사용되는 용어 “알케닐”은 상기 기재된 알킬과 길이가 유사하고 이에 대한 치환이 가능한 불포화 지방족 기를 포함하나, 적어도 하나의 이중 결합을 함유한다. 예를 들어, 용어 “알케닐”은 직쇄 알케닐 기(예를 들어, 에틸렌일, 프로페닐, 부테닐, 펜테닐, 헥세닐, 헵테닐, 옥테닐, 노네닐, 데세닐 등), 분지쇄 알케닐 기, 사이클로알케닐(지환족) 기 (사이클로프로페닐, 사이클로펜테닐, 사이클로헥세닐, 사이클로헵테닐, 사이클로옥테닐), 알킬 또는 알케닐 치환 사이클로알케닐 기, 및 사이클로알킬 또는 사이클로알케닐 치환 알케닐 기를 포함한다. 용어 알케닐은 또한 탄화수소 골격의 하나 이상의 탄소를 대체하는 산소, 질소, 황 또는 인 원자를 포함하는 알케닐기를 포함한다. 특정 실시형태에서, 직쇄 또는 분지쇄 알케닐 기는 골격에 30개 이하의 탄소 원자를 갖는다 (예를 들어, 직쇄의 경우 C2-C30, 분지쇄의 경우 C3-C30). 더욱이, 용어 알케닐은 “비치환된 알케닐” 및 “치환된 알케닐” 둘 다를 포함하며, 이들 중 후자는 탄화수소 골격의 하나 이상의 탄소 상의 수소를 대체하는 치환기를 갖는 알케닐 모이어티를 지칭한다. 이러한 치환기에는, 예를 들어, 알킬기, 알케닐기, 알키닐기, 할로겐, 히드록실, 알킬카르보닐옥시, 아릴카르보닐옥시, 알콕시카르보닐옥시, 아릴옥시카르보닐옥시, 카르복실레이트, 알킬카르보닐, 아릴카르보닐, 알콕시카르보닐, 아미노카르보닐, 알킬아미노카르보닐, 디알킬아미노카르보닐, 알킬티오카르보닐, 알콕실, 포스페이트, 포스포네이토, 포스피네이토, 시아노, 아미노(알킬 아미노, 디알킬아미노, 아릴아미노, 디아릴아미노 및 알킬아릴아미노 포함), 아실아미노(알킬카르보닐아미노, 아릴카르보닐아미노, 카르바모일 및 우레이도 포함), 아미디노, 이미노, 설프히드릴, 알킬티오, 아릴티오, 티오카르복실레이트, 설페이트, 알킬설피닐, 설포네이토, 설파모일, 설폰아미도, 니트로, 트리플루오로메틸, 시아노, 아지도, 헤테로사이클릴, 알킬아릴, 또는 방향족 또는 헤테로방향족 모이어티가 포함될 수 있다. 알케닐 기의 다른 예에는, 에테닐, 1-프로페닐, 2-프로페닐, 1-메틸-에테닐, 1-부테닐, 2-부테닐, 3-부테닐, 1-메틸-1-프로페닐, 2-메틸-1-프로페닐, 1-메틸-2-프로페닐, 2-메틸-2-프로페닐; 1-펜테닐, 2-펜테닐, 3-펜테닐, 4-펜테닐, 1-메틸-1-부테닐, 2-메틸-1-부테닐, 3-메틸-1-부테닐, 1-메틸-2-부테닐, 2-메틸-2-부테닐, 3-메틸-2-부테닐, 1-메틸-3-부테닐, 2-메틸-3-부테닐, 3-메틸-3-부테닐, 1,1-디메틸-2-프로페닐, 1,2-디메틸-1-프로페닐, 1,2-디메틸-2-프로페닐, 1-에틸-1-프로페닐, 1-에틸-2-프로페닐, 1-헥세닐, 2-헥세닐, 3-헥세닐, 4-헥세닐, 5 -헥세닐, 1-메틸-1-펜테닐, 2-메틸-1-펜테닐, 3-메틸-1-펜테닐, 4-메틸-1-펜테닐, 1-메틸-2-펜테닐, 2-메틸-2-펜테닐, 3-메틸-2-펜테닐, 4-메틸-2-펜테닐, 1-메틸-3-펜테닐, 2-메틸-3-펜테닐, 3-메틸-3-펜테닐, 4-메틸-3-펜테닐, 1-메틸-4-펜테닐, 2-메틸-4-펜테닐, 3-메틸-4-펜테닐, 4-메틸-4-펜테닐, 1,1-디메틸-2-부테닐, 1,1-디메틸-3-부테닐, 1,2-디메틸-1-부테닐, 1,2-디메틸-2-부테닐, 1,2-디메틸-3-부테닐, 1,3-디메틸-1-부테닐, 1,3-디메틸-2-부테닐, 1,3-디메틸-3-부테닐, 2,2-디메틸-3-부테닐, 2,3-디메틸-1-부테닐, 2,3-디메틸-2-부테닐, 2,3-디메틸-3-부테닐, 3,3-디메틸-1-부테닐, 3,3-디메틸-2-부테닐, 1-에틸-1-부테닐, 1-에틸-2-부테닐, 1-에틸-3-부테닐, 2-에틸-1-부테닐, 2-에틸-2-부테닐, 2-에틸-3-부테닐, 1,1,2-트리메틸-2-프로페닐, 1-에틸-1-메틸-2-프로페닐, 1-에틸-2-메틸-1-프로페닐 및 1-에틸-2-메틸-2-프로페닐기가 포함되나 이에 제한되는 것은 아니다. 다중 이중 결합을 함유하는 기는 부타-1,3-디에닐, 펜타-1,3-디에닐 또는 펜타-1,4-디에닐 기를 포함할 수 있지만 이에 제한되지는 않는다.
본원에서 사용되는 용어 “알키닐”은 상기 기재된 알킬과 길이가 유사하고 이에 대한 치환이 가능한 불포화 지방족 기를 포함하나, 적어도 하나의 삼중 결합을 함유한다. 예를 들어, 용어 “알키닐”은 직쇄 알키닐 기(예를 들어, 에티닐, 프로피닐, 부티닐, 펜티닐, 헥시닐, 헵티닐, 옥티닐, 노니닐, 데시닐 등), 분지쇄 알키닐 기, 및 사이클로알킬 또는 사이클로알케닐 치환된 알키닐기를 포함한다. 용어 알키닐은 또한 탄화수소 골격의 하나 이상의 탄소를 대체하는 산소, 질소, 황 또는 인 원자를 포함하는 알케닐기를 포함한다. 특정 실시형태에서, 직쇄 또는 분지쇄 알키닐 기는 골격에 30개 이하의 탄소 원자를 갖는다 (예를 들어, 직쇄의 경우 C2-C30, 분지쇄의 경우 C3-C30). 더욱이, 용어 알키닐은 “비치환된 알키닐” 및 “치환된 알키닐” 둘 다를 포함하며, 이들 중 후자는 탄화수소 골격의 하나 이상의 탄소 상의 수소를 대체하는 치환기를 갖는 알키닐 모이어티를 지칭한다. 이러한 치환기에는, 예를 들어, 알킬기, 알케닐기, 알키닐기, 할로겐, 히드록실, 알킬카르보닐옥시, 아릴카르보닐옥시, 알콕시카르보닐옥시, 아릴옥시카르보닐옥시, 카르복실레이트, 알킬카르보닐, 아릴카르보닐, 알콕시카르보닐, 아미노카르보닐, 알킬아미노카르보닐, 디알킬아미노카르보닐, 알킬티오카르보닐, 알콕실, 포스페이트, 포스포네이토, 포스피네이토, 시아노, 아미노(알킬 아미노, 디알킬아미노, 아릴아미노, 디아릴아미노 및 알킬아릴아미노 포함), 아실아미노(알킬카르보닐아미노, 아릴카르보닐아미노, 카르바모일 및 우레이도 포함), 아미디노, 이미노, 설프히드릴, 알킬티오, 아릴티오, 티오카르복실레이트, 설페이트, 알킬설피닐, 설포네이토, 설파모일, 설폰아미도, 니트로, 트리플루오로메틸, 시아노, 아지도, 헤테로사이클릴, 알킬아릴, 또는 방향족 또는 헤테로방향족 모이어티가 포함될 수 있다. 다중 삼중 결합을 함유하는 기는 부타-1,3-디이닐, 펜타-1,3-디이닐 또는 펜타-1,4-디이닐 기를 포함할 수 있지만 이에 제한되지는 않는다.
본원에 사용된 용어 “방향족”은 달리 언급되지 않는 한, 단일 고리일 수 있거나 다중 융합되거나 공유 연결된 고리를 포함할 수 있는 공액 이중 결합의 평면 고리형 탄화수소 모이어티를 의미한다. 고리형 탄화수소 모이어티의 주쇄는 달리 언급되지 않는 한 임의의 길이일 수 있고 예를 들어 N, O 및 S와 같은 임의의 수의 헤테로원자를 포함할 수 있다. 방향족기는 알킬기 또는 O, S, N, P 또는 Si와 같은 헤테로원자로 치환될 수 있다.
본원에 사용된 용어 “헤테로알킬”은 그 자체로 또는 다른 용어와 조합하여, 달리 언급되지 않는 한, 적어도 하나의 탄소 원자 및 O, N, P, Si, 및 S로 이루어진 군에서 선택된 적어도 하나의 헤테로원자로 이루어진 안정한 직쇄 또는 분지쇄 또는 이들의 조합을 의미하며, 이때 질소, 인 및 황 원자는 선택적으로 산화될 수 있고, 질소 헤테로원자는 선택적으로 4차일 수 있다. 헤테로원자(들) O, N, P, S, 및 Si는 헤테로알킬 기의 임의의 내부 위치 또는 알킬 기가 분자의 나머지 부분에 부착되는 위치에 위치할 수 있다. 헤테로알킬은 고리화되지 않는다. 예에는 다음이 포함되나 이에 제한되는 것은 아니다: ―CH2―CH2―O―CH3, ―CH2―CH2―NH―CH3, ―CH2―CH2―N(CH3)―CH3, ―CH2―S―CH2―CH3, ―CH2―O―CH3, ―S(O)―CH3, ―CH2―CH2―S(O)2―CH3, ―CH〓CH―O―CH3, ―Si(CH3)3, ―CH2―CH〓N―OCH3, ―CH〓CH―N(CH3)―CH3, ―O―CH3, ―O―CH2―CH3, 및 ―CN. 예를 들어, ―CH2―NH―OCH3와 같이 최대 2개의 헤테로원자가 연속일 수 있다.
본원에 사용된 용어 “사이클로알킬” 및 “헤테로사이클로알킬”은 그 자체로 또는 다른 용어와 조합하여 달리 언급되지 않는 한 각각 “알킬” 및 “헤테로알킬”의 고리형 형태를 의미한다. 사이클로알킬 및 헤테로사이클로알킬은 방향족이 아니다. 사이클로알킬 및 헤테로사이클로알킬은 예를 들어 본원에 기재된 임의의 치환기로 추가로 치환될 수 있다.
상기 용어들 각각(예를 들어, “알킬”, “방향족”, “헤테로알킬”, “사이클로알킬” 등)은 제시된 라디칼의 치환 및 비치환 형태 둘 다를 포함한다. 이와 관련하여, 기 또는 모이어티가 “치환된” 또는 “선택적으로 치환된”(또는 “선택적으로 갖는” 또는 “선택적으로 포함하는”) 것으로 기재될 때는 언제나 해당 기는 비치환되거나 표시된 치환기 중 하나 이상으로 치환될 수 있다. 유사하게, 하나의 기가 “치환되거나 비치환된” 것으로 기재되고, 치환된 경우, 치환기(들)는 제시된 치환기 중 하나 이상으로부터 선택될 수 있다. 치환기가 표시되지 않은 경우, 표시된 “선택적으로 치환된” 또는 “치환된” 기가 알킬, 알케닐, 알키닐, 사이클로알킬, 사이클로알케닐, 사이클로알키닐, 아릴, 헤테로아릴, 헤테로알리시클릴, 아르알킬, 헤테로아르알킬, (헤테로알리시클릴)알킬, 히드록시, 보호된 히드록실, 알콕시, 아릴옥시, 아실, 메르캅토, 알킬티오, 아릴티오, 시아노, 시아네이트, 할로겐, 티오카르보닐, O-카르바밀, N-카르바밀, O-티오카르바밀, N-티오카르바밀, C-아미도, N-아미도, S-설폰아미도, N-설폰아미도, C-카르복시, 보호된 C-카르복시, O-카르복시, 이소시아네이토, 티오시아네이토, 이소티오시아네이토, 니트로, 실릴, 설페닐, 설피닐, 설포닐, 할로알킬, 할로알콕시, 트리할로메탄설포닐, 트리할로메탄설폰아미도, 에터, 아미노(예를 들어, 일치환된 아미노기 또는 이치환된 아미노기), 및 이들의 보호된 유도체로부터 개별적으로 독립적으로 선택된 하나 이상의 기(들)로 치환될 수 있음을 의미한다. 임의의 상기 기들은 O, N, 또는 S를 포함하는 하나 이상의 헤테로원자를 포함할 수 있다. 예를 들어, 하나의 모이어티가 알킬기로 치환되는 경우, 그 알킬기는 O, N 또는 S로부터 선택된 헤테로원자를 포함할 수 있다 (예를 들어, -(CH2-CH2-O-CH2-CH3)).
본원에 사용된 용어 “항체”는 다른 분자들에 대한 결합을 실질적으로 배제하면서 관심 분자 (또는 매우 유사한 관심 분자들의 그룹)에 특이적으로 결합하는 면역글로불린 또는 면역글로불린 유사 분자를 의미하며, 예시로서, 그리고 제한 없이, IgA, IgD, IgE, IgG 및 IgM, 이들의 조합, 및 모든 척추동물(예를 들어, 인간, 염소, 토끼 및 마우스와 같은 포유동물)에서 면역 반응 동안 생성되는 유사한 분자들, 및 항체 단편 (예를 들어, 해당 분야에 공지되어 있는 F(ab′단편, Fab′단편, Fab′SH 단편 및 Fab 단편, 재조합 항체 단편 (예를 들어, sFv 단편, dsFv 단편, 이중특이성 sFv 단편, 이중특이성 dsFv 단편, F(ab)′단편, 단일 사슬 Fv 단백질 (“scFv”), 이황화 안정화 Fv 단백질 (“dsFv”), 디아바디, 및 트리아바디 (해당 분야에 공지), 및 낙타류 항체)를 포함한다. 항체는 또한 항원의 에피토프를 특이적으로 인식하고 결합하는 적어도 경쇄 또는 중쇄 면역글로불린 가변 영역을 포함하는 폴리펩티드 리간드를 지칭한다. 항체는 중쇄 및 경쇄로 구성될 수 있으며, 이들 각각은 가변 중쇄(VH) 영역 및 가변 경쇄(VL) 영역이라고 하는 가변 영역을 갖는다. VH 영역과 VL 영역은 함께 항체가 인식하는 항원에 결합하는 역할을 한다. 용어 항체는 또한 당업계에 잘 알려진 온전한 면역글로불린 및 이들의 변이체 및 일부분을 포함한다.
본원에 사용된 용어 “커플” 또는 “커플링”은 한 분자 또는 원자를 다른 분자 또는 원자에 접합, 결합(예를 들어, 공유 결합), 또는 연결하는 것을 지칭한다.
본원에 사용된 용어 “상보적”은 적절한 온도 및 이온 완충 조건에서 2개의 뉴클레오티드 염기 사이에 유리한 열역학적 안정성 및 특이적 페어링을 형성하는 능력을 지칭한다. 상보성은 핵염기 아데닌, 티민(RNA에서 우라실), 구아닌 및 사이토신 사이의 뚜렷한 상호작용에 의해 구현되며, 이때 아데닌은 티민 또는 우라실과 페어링되고 구아닌은 사이토신과 페어링된다.
본원에서 사용되는 용어 “헤테로원자”는 붕소(B), 산소(O), 질소(N), 황(S), 인(P) 및 규소(Si)를 포함하는 것을 의미한다. 일부 실시형태에서, “헤테로사이클릭 고리”는 하나 이상의 헤테로원자를 포함할 수 있다. 다른 실시형태에서, 지방족 기는 하나 이상의 헤테로원자를 포함하거나 이에 의해 치환될 수 있다.
본원에 사용된 용어 “혼성화”는 해당 뉴클레오티드 서열들과 일치하는 서로 다른 핵산 분자들 사이의 염기-페어링을 지칭한다.
본원에 사용된 용어 “표지”는 원자 또는 분자, 또는 원자 또는 분자의 집합일 수 있는 검출가능한 모이어티를 지칭한다. 표지는 검출될 수 있는 광학적, 전기화학적, 자기적 또는 정전기적 (예를 들어, 유도성, 용량성) 시그너처를 제공할 수 있다.
본원에 사용된 용어 “핵산”은 아데닌(A), 사이토신(C), 구아닌(G), 티민(T) 및 우라실(U)을 비롯한 (그러나 이에 제한되는 것은 아님) 하나 이상의 서브유닛들 (자연 발생, 합성 또는 변형된 핵염기)을 포함할 수 있다. 이들 염기의 유도체는 PCR Systems, Reagents and Consumables (Perkin Elmer Catalogue 1996-1997, Roche Molecular Systems, Inc., Branchburg, N.J., USA)에 예시되어 있으며, 이 문헌은 그 전문이 본원에 참고로 포함된다. 일부 예에서, 핵산은 데옥시리보핵산(DNA) 또는 리보핵산(RNA), 또는 이들의 유도체이다. 핵산은 단일 가닥 또는 이중 가닥일 수 있다. 핵산은, 제한 없이, DNA, RNA 및 이들의 하이브리드 또는 변이체를 비롯한 임의의 핵산 분자를 포함할 수 있다.
본원에 사용된 용어 “핵산 템플릿”은 중합효소 촉매화된 복제를 위한 가이드로 사용할 수 있는 핵산 또는 이의 일부를 의미한다. 핵산 분자는 길이를 따라 다수의 템플릿을 포함할 수 있거나, 대안적으로, 본원의 특정 실시형태에서 단일 템플릿만이 사용될 수 있다. 핵산 템플릿은 또한 리가아제 촉매된 프라이머 연장을 위한 가이드 역할을 할 수 있다.
본원에 사용된 용어 “핵염기”는 다른 핵염기와 비공유적으로 페어링 할 수 있는 헤테로사이클릭 모이어티를 지칭한다. 용어 “핵염기”는 “비변형된 핵염기” 및 “변형된 핵염기” 둘 모두를 포함한다. “자연 발생 핵염기” 또는 “비변형 핵염기”(호환적으로 사용됨)는 자연 발생 형태에 비해 변형되지 않은 핵염기를 의미한다. 유사하게, “변형된 핵염기”는 천연 핵염기로부터의 임의의 치환 및/또는 변화를 의미한다. 핵염기(또는 염기) 변형 또는 치환은 자연 발생 또는 합성 비변형 핵염기와 구조적으로 구별 가능하지만 기능적으로는 호환가능하다. 천연 및 변형된 핵염기 모두 수소 결합에 참여할 수 있다. 이러한 핵염기 변형은 올리고뉴클레오티드에 뉴클레아제 안정성, 결합 친화성 또는 일부 다른 유익한 생물학적 특성을 부여할 수 있다. 변형된 핵염기는, 예를 들어, 5-메틸사이토신(5-me-C)과 같은 합성 및 천연 핵염기를 포함한다. 5-메틸사이토신 치환을 포함하는 특정 핵염기 치환은 표적 핵산에 대한 상보적 올리고뉴클레오티드의 결합 친화도를 증가시키는 데 특히 유용하다. 예를 들어, 5-메틸사이토신 치환은 핵산 이중체 안정성을 약 0.6 내지 약 1.2℃증가시키는 것으로 나타났다 (Sanghvi, Y. S., Crooke, S. T. and Lebleu, B., eds., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278, 이 문헌의 내용은 본원에 그 전문이 참고로 포함됨).
또 다른 변형된 핵염기에는, 제한 없이, 5-하이드록시메틸 사이토신, 잔틴, 하이포잔틴, 7-메틸구아닌, 2-아미노아데닌, 2-아미노퓨린, 이소-C, 이소-G, 티오T, 티오G, 5,6-디히드로우라실, 6-메틸아데닌, 2-프로필구아닌 및 아데닌과 구아닌의 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오사이토신, 5-할로우라실 및 사이토신, 예를 들어, 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 사이토신, 5-프로피닐 (―C≡C―CH3) 우라실 및 사이토신 및 피리미딘 염기의 기타 알키닐 유도체, 6-아자 우라실, 사이토신 및 티민, 우라실-5-일(수도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-하이드록시 및 기타 8-치환된 아데닌 및 구아닌, 7-메틸구아닌 및 7-메틸아데닌, 2-F-아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌, 8-아자-7-데아자구아닌 및 8-아자-7-데아자아데닌이 포함된다.
또 다른 핵염기들은 문헌 [Greco et. al., Synthesis and site-specific incorporation of a simple fluorescent pyrimidine, Nature Protocols, vol.2, no.2, 2007; Dien et. al., Progress Toward a Semi-Synthetic Organism with an Unrestricted Expanded Genetic Alphabet, J. Am. Chem. Soc. 2018, 140, 16115-16123; Zhang et. al., Evolution of Functional Six-Nucleotide DNA, J. Am. Chem. Soc. 2015, 137, 67346737; Biondi et. al. Artificially Expanded Genetic Information Systems for New Aptamer Technologies, Biomedicines 2018, 6, 53; Liu et. al., Helix-Forming Properties of Size-Expanded DNA, an Alternative Four-Base Genetic Form, J. Am. Chem. Soc. 9 Vol. 127, No. 5, 2005, 1396-1402; Tor et. al., Designing new isomorphic fluorescent nucleobase analogues: the thieno[3,2-d]pyrimidine core, Tetrahedron 63 (2007) 3608-3614; Laos et. al., Directed Evolution of Polymerases to Accept Nucleotides with Nonstandard Hydrogen Bond Patterns, Biochemistry 2013, 52, 52885294; Krueger et. al., Synthesis and Properties of Size-expanded DNAs: Toward Designed, Functional Genetic Systems, Acc Chem Res. 2007 February; 40(2): 141-150; Srivatsan et. al., A highly fluorescent nucleoside analog based on thieno[3,4-d]pyrimidine senses mismatched pairing, Org. Biomol. Chem., 2008, 6, 1334-1338; Kim et. al., Synthesis and Properties of 5-Cyano-Substituted Nucleoside Analog with a DonorDonorAcceptor Hydrogen-Bonding Pattern, J. Org. Chem. 2012, 77, 36643669; 및 Noe et. al., Oligodeoxynucleotides Containing Multiple Thiophene-Modified Isomorphic Fluorescent Nucleosides, J. Org. Chem. 2013, 78, 81238128]에 개시되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참고로 포함된다.
본원에서 사용되는 용어 “뉴클레오시드”는 당에 공유적으로 부착된 핵염기, 예를 들어, 리보스 또는 2'-데옥시리보스를 지칭한다.
본원에 사용된 용어 “뉴클레오티드”는 포스페이트 또는 폴리포스페이트, 예컨대 아데노신 5'-모노포스페이트(AMP), 아데노신 5'-디포스페이트(ADP), 아데노신 5'-트리포스페이트(ATP), 아데노신 5'-테트라포스페이트 또는 이의 2'-데옥시 유도체에 공유 부착된 뉴클레오시드를 지칭한다.
본원에 사용된 용어 “올리고뉴클레오티드”는 뉴클레오티드 또는 뉴클레오시드 단량체 단위의 올리고머를 지칭하며, 이때 올리고머는 선택적으로 비-뉴클레오티드 단량체 단위, 및/또는 올리고머의 내부 및/또는 외부 위치에 부착된 다른 화학기를 포함한다. 올리고머는 천연 또는 합성일 수 있으며 자연 발생 올리고뉴클레오티드를 포함할 수 있으며, 또는 비천연 발생(또는 변형된) 염기, 당 모이어티, 포스포디에스터-유사체 링키지, 및/또는 대체 단량체 단위 키랄성 및 이성질체 구조를 갖는 뉴클레오시드 (예를 들어, 5'-에서 2'-링키지, L-뉴클레오사이드, α-아노머 뉴클레오사이드, β-아노머 뉴클레오시드, 잠금 핵산(LNA), 펩티드 핵산(PNA))를 포함할 수 있다.
본원에 사용된 용어 “중합효소”는 중합 반응을 촉매할 수 있는 임의의 효소를 지칭한다. 중합효소의 예에는 핵산 중합효소, 전사효소 또는 리가제가 포함되지만 이에 제한되지 않는다. 중합효소는 중합 효소(polymerization enzyme)일 수 있다. “DNA 중합효소”는 데옥시뉴클레오티드의 중합을 촉매한다. “RNA 중합효소”는 리보뉴클레오티드의 중합을 촉매한다. 중합체는 RNA 템플릿으로부터 상보적 DNA(cDNA)를 생성하는 데 사용되는 효소인 역전사효소를 포함할 수 있다.
본원에 사용된 “폴리뉴클레오티드”는 적어도 2개의 뉴클레오티드를 포함하는 중합체 또는 올리고머이다. 폴리뉴클레오티드 또는 올리고뉴클레오티드는 DNA 폴리뉴클레오티드 또는 올리고뉴클레오티드, RNA 폴리뉴클레오티드 또는 올리고뉴클레오티드, 또는 DNA 폴리뉴클레오티드 또는 올리고뉴클레오티드 및/또는 RNA 폴리뉴클레오티드 또는 올리고뉴클레오티드의 하나 이상의 섹션을 포함할 수 있다.
본원에 사용된 용어 “반응기” 또는 “반응성 작용기”는 서로 다른 모이어티의 작용기와 화학적으로 연합, 상호작용, 혼성화, 수소 결합 또는 커플링할 수 있는 작용기를 지칭한다. 일부 실시형태에서, 2개의 반응기 또는 2개의 반응성 작용기 사이의 “반응”은 2개의 반응기 또는 2개의 반응성 작용기 사이에 공유 결합이 형성됨을 의미할 수 있고; 또는 2개의 반응기 또는 2개의 반응성 작용기가 서로 결합하고, 상호 작용하고, 서로 혼성화하고, 서로 수소 결합하는 등을 의미할 수 있다. 일부 실시형태에서, 그러므로 “반응”은 합텐과 항-합텐 항체의 결합, 또는 게스트 분자가 초분자 호스트 분자와 결합하는 것과 같은 결합 이벤트를 포함한다.
본원에 사용된 용어 “서열”은 핵산과 관련하여 사용될 때 핵산에서 뉴클레오티드(또는 염기)의 순서를 의미한다. 서로 다른 종의 뉴클레오티드가 핵산에 존재하는 경우, 서열은 핵산의 각 위치에서 뉴클레오티드 (또는 염기) 종의 식별을 포함한다. 서열은 핵산 분자의 전체 또는 일부의 특성이다. 이 용어는 다른 중합체에서 단량체 단위, 예를 들어, 단백질 중합체의 아미노산 단량체 단위의 순서 및 위치 동일성을 설명하기 위해 유사하게 사용될 수 있다.
본원에 사용된 용어 “시퀀싱”은 핵산에서 염기의 순서 및 위치를 결정하는 것을 의미한다.
본원에 사용된 용어 “템플릿 핵산”, “표적 폴리뉴클레오티드 분자” 및 “표적 핵산”은 상호교환적으로 사용될 수 있으며, 선택적으로 이의 서열 정보를 얻기 위하여 시퀀싱 반응에 의해 조사 대상이 될 수 있는 증폭 반응의 대상인 핵산 분자를 의미한다. 템플릿 핵산은 클론 증폭 방법에 의해 생성되고 고체 지지체에 고정될 수 있는, 즉 비드 또는 어레이에 고정될 수 있는 핵산일 수 있다.
본원에 제시된 제목은 단지 편의를 위한 것이며 개시된 실시형태들의 범위 또는 의미로 해석되지 않는다.
뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드, 폴리뉴클레오티드
본 발명은 당, 예를 들어, 리보스 또는 데옥시리보스, 및 핵염기를 포함하는 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드, 및/또는 폴리뉴클레오티드(또는 이의 임의의 염)에 관한 것이다. 일부 실시형태에서, 본 발명의 뉴클레오티드는 신생 핵산 가닥에 혼입되고, 이에 의해 혼입된 뉴클레오티드는 접합체와 반응하여 본원에 기재된 혼입된 뉴클레오티드-접합체 복합체를 형성할 수 있다.
일부 실시형태에서, 본 발명에 따른 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드 및/또는 폴리뉴클레오티드(이의 임의의 염 포함)는 화학식 (IA)로 정의된 구조를 가지며:
Figure pct00016
(IA),
이때
Y는 -OH, -O-P(O)(OH)[-O-P(O)(OH)]z-OH 또는 -O-P(O)(OH)-올리고뉴클레오티드이고, 이때 z는 0 또는 1 내지 5 범위의 정수이고;
PG는 보호기이고;
W는 핵염기이고;
L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자로 선택적으로 치환되며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
Z1은 반응기이다.
일부 실시형태에서, z는 2이다.
일부 실시형태에서, 모이어티 L1은 왓슨-크릭 염기 페어링이 여전히 수행될 수 있는 한, 핵염기(“W”) 상의 임의의 위치에서 부착될 수 있다. 일부 실시형태에서, 그리고 퓨린 염기에 관한 내용에서, 모이어티 L1은 7-데아자퓨린의 7-위치를 통해, 8-변형된 퓨린을 통해, N-6 변형된 아데닌 또는 N-2 변형된 구아닌을 통해 부착된다. 일부 실시형태에서, 그리고 피리미딘에 관한 내용에서, 모이어티 L1은 사이토신, 티민 또는 우라실 상의 5-위치 그리고 사이토신 상의 N-4 위치를 통해 부착된다.
상기와 같이, 일부 실시형태에서, 모이어티 L1은 1 내지 약 60개 탄소 원자를 포함한다. 일부 실시형태에서, 모이어티 L1은 1 내지 약 50개 탄소 원자를 포함한다. 일부 실시형태에서, 모이어티 L1은 1 내지 약 40개 탄소 원자를 포함한다. 일부 실시형태에서, 모이어티 L1은 1 내지 약 35개 탄소 원자를 포함한다. 일부 실시형태에서, 모이어티 L1은 1 내지 약 30개 탄소 원자를 포함한다. 다른 실시형태에서, 모이어티 L1은 2 내지 약 25개 탄소 원자를 포함한다. 또한 다른 실시형태에서, 모이어티 L1은 약 5 내지 약 20개 탄소 원자를 포함한다. 또한 다른 실시형태에서, 모이어티 L1은 약 5 내지 약 15개 탄소 원자를 포함한다. 추가 실시형태에서, 모이어티 L1은 약 10 내지 약 20개 탄소 원자를 포함한다.
일부 실시형태에서, 모이어티 L1은 약 50g/mol 내지 약 1000g/mol 범위의 분자량을 갖는다. 다른 실시형태에서, 모이어티 L1은 약 40g/mol 내지 약 400g/mol 범위의 분자량을 갖는다. 다른 실시형태에서, 모이어티 L1은 약 50g/mol 내지 약 300g/mol 범위의 분자량을 갖는다. 다른 실시형태에서, 모이어티 L1은 약 50g/mol 내지 약 250g/mol 범위의 분자량을 갖는다. 일부 실시형태에서, 모이어티 L1은 약 0.5nm 내지 약 70nm 범위의 길이를 가진다. 일부 실시형태에서, 모이어티 L1은 약 0.5nm 내지 약 60nm 범위의 길이를 가진다. 일부 실시형태에서, 모이어티 L1은 약 0.5nm 내지 약 50nm 범위의 길이를 가진다. 일부 실시형태에서, 모이어티 L1은 약 0.5nm 내지 약 40nm 범위의 길이를 가진다. 일부 실시형태에서, 모이어티 L1은 약 1nm 내지 약 40nm 범위의 길이를 가진다.
일부 실시형태에서, 모이어티 L1은 1 내지 약 40개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 모이어티 L1은 1 내지 약 30개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 모이어티 L1은 1 내지 약 20개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알킬기 또는 헤테로알킬기이다.
일부 실시형태에서, 모이어티 L1은 2 내지 약 40개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알케닐기 또는 헤테로알케닐기이다. 일부 실시형태에서, 모이어티 L1은 2 내지 약 30개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알케닐기 또는 헤테로알케닐기이다. 일부 실시형태에서, 모이어티 L1은 2 내지 약 20개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알케닐기 또는 헤테로알케닐기이다.
일부 실시형태에서, 모이어티 L1은 2 내지 약 40개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알키닐기 또는 헤테로알키닐기이다. 일부 실시형태에서, 모이어티 L1은 2 내지 약 30개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알키닐기 또는 헤테로알키닐기이다. 일부 실시형태에서, 모이어티 L1은 2 내지 약 20개의 탄소 원자를 갖고 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알키닐기 또는 헤테로알키닐기이다.
상기와 같이, 모이어티 L1은 절단될 수 있는 하나 이상의 기, 예를 들어, 광절단성 기, 효소적 절단성 기, 화학적 절단성 기, 및 특정 pH에서의 절단성 기를 포함한다. 모이어티 L1은 절단성 기를 포함하지만, 그것이 부착된 핵염기로부터 전체 모이어티 L1이 제거되어야 함을 의미하는 것은 아니다. 오히려, 모이어티 L1 내의 절단 부위는 모이어티 L1의 일부가 절단 후에 해당 핵염기에 부착된 상태를 확실히 유지하게 하는 모이어티 L1 내의 임의의 위치에 위치할 수 있다. 일부 실시형태에서, 절단성 링커의 사용은, 화학식 (IA)의 뉴클레오티드 또는 뉴클레오시드에 추가로 커플링된 임의의 성분이 후속적으로 확실히 제거될 수 있게 한다. 일부 실시형태에서, 절단성 기는 산, 염기, 친핵체, 친전자체, 라디칼, 금속, 환원제 또는 산화제, 빛, 온도, 효소 등에 대한 노출을 포함하는 임의의 적합한 방법에 의해 절단될 수 있다. 적합한 절단성 기의 비제한적 예에는 디설파이드 기, 알파-아지도에터, 니트로벤질계 기, 및 페나실 기가 포함된다. 적합한 절단성 기의 다른 비제한적 예가 본원에 추가로 기재되어 있다. 사용될 수 있는 절단기 또는 절단기 분류들의 또 다른 예는 미국 특허 제 9,605,310, 7,414,116, 및 7,057,026호에 기재된 것들이 포함되며, 이들 문헌에 개시된 내용은 그 전체가 본원에 참고로 포함된다.
일부 실시형태에서, 모이어티 L1은 일반 구조 -[링커]-[절단성 기]-[링커]-를 가지며, 이때 각 [링커]는 동일 또는 상이할 수 있다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 약 1 내지 45개의 탄소 원자를 갖는 직쇄 또는 분지형, 치환 또는 비치환, 포화 또는 불포화, 지방족 또는 방향족 모이어티고, 이는 하나 이상의 헤테로원자로 선택적으로 치환된다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 약 1 내지 35개의 탄소 원자를 갖는 직쇄 또는 분지형, 치환 또는 비치환, 포화 또는 불포화, 지방족 또는 방향족 모이어티고, 이는 하나 이상의 헤테로원자로 선택적으로 치환된다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 약 1 내지 25개의 탄소 원자를 갖는 직쇄 또는 분지형, 치환 또는 비치환, 포화 또는 불포화, 지방족 또는 방향족 모이어티고, 이는 하나 이상의 헤테로원자로 선택적으로 치환된다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 약 1 내지 20개의 탄소 원자를 갖는 직쇄 또는 분지형, 치환 또는 비치환, 포화 또는 불포화, 지방족 또는 방향족 모이어티고, 이는 하나 이상의 헤테로원자로 선택적으로 치환된다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 약 1 내지 10개의 탄소 원자를 갖는 직쇄 또는 분지형, 치환 또는 비치환, 포화 또는 불포화, 지방족 또는 방향족 모이어티고, 이는 하나 이상의 헤테로원자로 선택적으로 치환된다.
일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 45개 탄소 원자를 갖는 치환 또는 비치환 알케닐기 또는 헤테로알케닐기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 35개 탄소 원자를 갖는 치환 또는 비치환 알케닐기 또는 헤테로알케닐기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 25개 탄소 원자를 갖는 치환 또는 비치환 알케닐기 또는 헤테로알케닐기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 20개 탄소 원자를 갖는 치환 또는 비치환 알케닐기 또는 헤테로알케닐기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 10개 탄소 원자를 갖는 치환 또는 비치환 알케닐기 또는 헤테로알케닐기이다. 일부 실시형태에서, -[절단성 링커]-는 광절단성 기, 효소적 절단성 기, 화학적 절단성 기, 및 특정 pH에서의 절단성 기이다.
일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 45개 탄소 원자를 갖는 치환 또는 비치환 알키닐기 또는 헤테로알키닐기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 35개 탄소 원자를 갖는 치환 또는 비치환 알키닐기 또는 헤테로알키닐기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 25개 탄소 원자를 갖는 치환 또는 비치환 알키닐기 또는 헤테로알키닐기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 20개 탄소 원자를 갖는 치환 또는 비치환 알키닐기 또는 헤테로알키닐기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 10개 탄소 원자를 갖는 치환 또는 비치환 알키닐기 또는 헤테로알키닐기이다. 일부 실시형태에서, -[절단성 링커]-는 광절단성 기, 효소적 절단성 기, 화학적 절단성 기, 및 특정 pH에서의 절단성 기이다.
일부 실시형태에서, 각각의 [링커]는 독립적으로 1 내지 약 45개 탄소 원자를 갖는 치환 또는 비치환 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 1 내지 약 35개 탄소 원자를 갖는 치환 또는 비치환 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 1 내지 약 25개 탄소 원자를 갖는 치환 또는 비치환 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 1 내지 약 20개 탄소 원자를 갖는 치환 또는 비치환 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 1 내지 약 10개 탄소 원자를 갖는 치환 또는 비치환 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, -[절단성 링커]-는 광절단성 기, 효소적 절단성 기, 화학적 절단성 기, 및 특정 pH에서의 절단성 기이다.
일부 실시형태에서, 반응기 Z1은 반응기 쌍의 제1 구성원이다. 예를 들어, 그리고 본원에 추가로 기재된 바와 같이, Z1은 제2 반응기 구성원 Z2, 예를 들어, 화학식 (IIA) 내지 (IIE) 중 어느 하나를 갖는 그리고 본원에 기재된 접합체의 제2 반응기 구성원 Z2와 직교로 반응하는 제1 반응기 구성원일 수 있다.
일부 실시형태에서, Z1은 “클릭 화학” 반응에 참여할 수 있는 반응기를 포함한다. “클릭 화학” 반응에 참여하기에 적합한 적절한 반응성 작용기(예를 들어, 서로 반응성인 작용기 쌍)의 예는 하기 표 1에 제시되어 있다. 일반적으로 “클릭 화학”은 범위가 넓고 화학 수율이 높으며 유해하지 않은 부산물을 생성하고 화학 특이적이며 간단한 반응 조건이 필요하며 쉽게 구할 수 있는 출발 물질과 시약을 사용하고, 무용매 또는 양성 용매(예를 들어, 물)를 사용하여 산물 분리가 용이하고 열역학적 추진력이 커서 단일 반응 산물과의 반응에 유리하고 원자 경제성이 높은 모듈식 응용 프로그램이 있는 반응을 권장한다. 일반적인 기준 중 일부는 본질적으로 주관적일 수 있지만 모든 기준을 충족할 필요는 없다.
“클릭 화학”은 Sharpless 및 Meldal 그룹에서 독립적으로 정의한 화학 철학으로, 작은 단위를 함께 결합하여 물질을 빠르고 안정적으로 생성하도록 맞춤화된 화학을 설명한다. “클릭 화학”은 신뢰할 수 있고 자기 주도적인 유기 반응 모음에 적용되었다 (Kolb, H. C.; Finn, M. G.; Sharpless, K. B. Angew). Chem. Int. Ed. 2001, 40, 2004-2021). 예를 들어, 구리 촉매된 아지드-알킨 [3+2] 고리화 첨가반응을 물에서의 매우 안정적인 분자 연결로서 식별하는 것은 (Rostovtsev, V. V.; et al. Angew. Chem. Int. Ed. 2002, 41, 2596-2599) 생체 분자 상호 작용에 대한 여러 유형의 조사를 보강하는데 사용되어 왔다 (Wang, Q.; et al. J. Am. Chem. Soc. 2003, 125, 3192-3193; Speers, A. E.; et al. J. Am. Chem. Soc. 2003, 125, 4686-4687; Link, A. J.; Tirrell, D. A. J. Am. Chem. Soc. 2003, 125, 11164-11165; Deiters, A.; et al. J. Am. Chem. Soc. 2003, 125, 11782-11783). 또한, 유기 합성 (Lee, L. V.; et al. J. Am. Chem. Soc. 2003, 125, 9588-9589), 약물 발견 (Kolb, H. C.; Sharpless, K. B. Drug Disc. Today 2003, 8, 1128-1137; Lewis, W. G.; et al. Angew. Chem. Int. Ed. 2002, 41, 1053-1057), 및 표면의 작용기화 (Meng, J.-C.; et al. Angew. Chem. Int. Ed. 2004, 43, 1255-1260; Fazio, F.; et al. J. Am. Chem. Soc. 2002, 124, 14397-14402; Collman, J. P.; et al. Langmuir 2004, ASAP, in press; Lummerstorfer, T.; Hoffmann, H. J. Phys. Chem. B 2004, in press)에도 적용되었다.
일부 실시형태에서, Z1은 Cu(I)-촉매된 아지드-알킨 고리화 첨가반응(CuAAC)를 거칠 수 있는 반응기를 포함한다 (예를 들어, Meldal et. al., “Cu-Catalyzed Azide-Alkyne Cycloaddition,” Chem Rev. 2008, 108, 8, 2952-3015 참조). 일부 실시형태에서, Z1은 구리가 없는, 변형-촉진 아지드-알킨 고리화 첨가반응 (copper-free strain-promoted azide-alkyne cycloaddition, SPAAC)을 거칠 수 있는 반응기를 포함한다. 일부 실시형태에서, Z1은 킬레이트화 보조 Cu(II) 아세테이트 가속 아지드-알킨 고리화 첨가반응(chelation-assisted Cu(II) acetate accelerated azide-alkyne cycloaddition, CuAAC)을 거칠 수 있는 반응기를 포함한다. 일부 실시형태에서, Z1은 역수요 Diels-Alder 고리화 첨가 반응(예를 들어, 테트라진 변형-알켄 클릭 화학)을 거칠 수 있는 반응기를 포함한다.
표 1: 반응성 작용기 쌍의 제1 및 제2 구성원.
Figure pct00017
일부 실시형태에서, Z1은 결합 이벤트에 참여할 수 있는 반응기를 포함한다. 결합 이벤트의 예는 올리고뉴클레오티드의 서로에 대한 혼성화, 항체 또는 이의 변이체에 대한 합텐의 결합, 호스트-게스트 분자 상호작용(즉, 호스트 분자와 게스트 분자의 상호작용)을 포함하지만 이에 제한되지는 않는다.
이에 따라, 일부 실시형태에서, Z1은 특이적 결합 실체를 포함한다. 본원에 사용된 용어 “특이적 결합 실체”는 특이적 결합 쌍의 구성원을 지칭한다. 특이적 결합 쌍은 다른 분자에 대한 결합을 실질적으로 배제하지 않고 서로에 결합하는 것을 특징으로 하는 분자 쌍이다 (예를 들어, 특이적 결합 쌍들은 반응 혼합물 또는 샘플 내 다른 분자들과의 결합 쌍의 두 구성원 중 하나에 대한 결합 상수보다 적어도 약 103 M-1 더 큰, 적어도 약 104 M-1 더 큰, 또는 적어도 약 105 M-1 더 큰 결합 상수를 가질 수 있다).
일부 실시형태에서, 특이적 결합 실체는 단백질, 예를 들어 항체, 항체 단편, 렉틴, 아비딘(예를 들어, 스트렙타비딘), 및 단백질 A이다. 일부 실시형태에서, 항체는 항-합텐 항체이다.
다른 실시형태에서, 특이적 결합 실체는 합텐이다. 본원에 사용된 “합텐”은, 담체 분자와 결합하는 경우를 제외하고, 항체와 특이적으로 결합할 수 있지만 일반적으로 실질적으로 면역원성이 될 수 없는 소분자이다. 합텐의 비제한적인 예에는 피라졸(예를 들어, 니트로피라졸); 니트로페닐 화합물; 벤조퓨라잔; 트리테르펜; 우레아(예를 들어, 페닐 우레아); 티오우레아(예를 들어, 페닐 티오우레아); 로테논 및 로테논 유도체; 옥사졸(예를 들어, 옥사졸 설폰아미드); 및 티아졸(예를 들어, 티아졸 설폰아미드); 쿠마린 및 쿠마린 유도체; 및 사이클로리그난(예를 들어, 포도필로톡신 및 포도필로톡신 유도체)이 포함된다. 일부 실시형태에서, 합텐은 벤조퓨란 합텐 및 티아졸설폰아미드 합텐으로부터 선택된다. 일부 실시형태에서, 합텐은 5-니트로-3-피라졸카르바미드(NP), 2-아세트아미도-4-메틸-5-티아졸설폰아미드(TS), 7-(디에틸아미노)-2-옥소-2H-크로멘-3-카르복실산(DCC), 디곡시제닌(DIG), 2,4-디니트로페닐(DNP), 플루오레세인, 3-하이드록시-2-퀴녹살린카르바미드 및 2,1,3-벤족사디아졸-5-카르바미드(BF)에서 선택된다. 본 발명에서 사용하기에 적합한 다른 합텐은 미국 특허 제 8,846,320; 8,618,265; 7,695,929; 8,481,270; 및 9,017,954호에 기술되어 있으며, 이 문헌들의 내용은 그 전문이 본원에 참고로 포함된다.
일부 실시형태에서, Z1은 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 올리고뉴클레오티드는 길이가 약 3 내지 약 30개의 뉴클레오티드, 즉 약 3량체 내지 약 30량체이다. 다른 실시형태에서, 올리고뉴클레오티드는 길이가 약 3 내지 약 25개 뉴클레오티드이다. 다른 실시형태에서, 올리고뉴클레오티드는 길이가 약 3 내지 약 20개 뉴클레오티드이다. 다른 실시형태에서, 올리고뉴클레오티드는 길이가 약 3 내지 약 16개 뉴클레오티드이다. 다른 실시형태에서, 올리고뉴클레오티드는 길이가 약 3 내지 약 12개 뉴클레오티드이다. 다른 실시형태에서, 올리고뉴클레오티드는 길이가 약 3 내지 약 10개 뉴클레오티드이다. 또 다른 실시형태에서, 올리고뉴클레오티드는 길이가 약 4 내지 약 6개 뉴클레오티드이다. 추가 실시형태에서, 올리고뉴클레오티드는 길이가 5 내지 6개 뉴클레오티드이다. 적합한 올리고뉴클레오티드 서열의 비제한적 예는 하기 표 2에 제시되어 있다.
표 2 : 올리고뉴클레오티드 서열의 비제한적인 예.
Figure pct00018
일부 실시형태에서, 서열 번호: 1 - 22 및 29 - 50 (표 2에 제시됨)은 LNA 서열이다. 다른 실시형태에서, 서열 번호: 23 - 28 및 51 - 56 (표 2에 제시됨)은 DNA 서열이다.
일부 실시형태에서, 올리고뉴클레오티드는 하나 이상의 “거울 이미지”, “L-배열” 또는 “L-형태”의 단량체(예를 들어, L-데옥시리보스로 구성된 단량체)를 포함한다. L-형태 단량체로 구성된 올리고뉴클레오티드는 자연적으로 발생하는 베타-D-배열의 핵산, 예를 들어, 시퀀싱할 DNA 분자, 시퀀싱 프라이머 등에 결합하지 않는 것으로 여겨진다. 베타-L-배열의 올리고뉴클레오티드는 베타-D-배열의 올리고뉴클레오티드 대응물과 동일한 물리화학적 특성(예를 들어, 용해도, 이중체 안정성, 페어링 선택성)을 특징으로 한다. 그러나 L-배열의 올리고뉴클레오티드는 뉴클레아제 소화에 대해 안정하고 왼손잡이 이중체(left-handed-duplex)를 형성한다. 단량체의 또 다른 형태들은 J. Am. Chem. Soc.1991, 113 (21), 8174-8175; 및 Nucleic Acids Research, Volume 20, Issue 13, 11 July 1992, Pages 3325-3332 페이지에 개시되어 있으며, 이 문헌의 내용은 본원에 그 전문이 참고로 포함된다.
다른 실시형태에서, 올리고뉴클레오티드는 하나 이상의 2'-O-Me RNA 염기들을 포함한다. 또한 다른 실시형태들에서, 올리고뉴클레오티드는 하나 이상의 용융 온도(Tm) 향상 핵염기를 포함한다. 일부 실시형태에서, Tm 향상 핵염기는 5-프로피닐-우라실, 5-프로피닐-사이토신, 7-프로피닐-7-데아자아데닌, 7-프로피닐-7-데아자구아닌, 7-데아자-8-아자-7-브로모-구아닌, 및 7-데아자-8-아자-7-브로모-2-아미노-아데닌에서 선택된다.
일부 실시형태에서, 올리고뉴클레오티드는 “LNA-변형된 올리고뉴클레오티드”이다. “LNA-변형된 올리고뉴클레오티드”는 하나 이상의 LNA 단량체(“잠금 핵산” 단량체)로 완전히 또는 부분적으로 변형된 올리고뉴클레오티드를 의미한다. 따라서, “LNA-변형된 올리고뉴클레오티드”는 전적으로 LNA 단량체로 구성될 수 있거나, “LNA-변형된 올리고뉴클레오티드”는 1개의 LNA 단량체, 2개의 LNA 단량체 등을 포함할 수 있다. 본원에 사용된 용어 “LNA 단량체”는 리보스 고리가 2'-산소와 4'-탄소 사이의 메틸렌 연결에 의해 구속되는 형태적으로 제한된 뉴클레오티드 유사체, 즉, 2'과 4' 위치 사이에 공유 브릿지(2' - 4' 브릿지)를 포함하는 뉴클레오티드 부류를 지칭한다. 일부 실시형태에서, LNA는 자연 발생 핵산에 높은 친화도로 결합하는 베타-D-배열로 적용된다. 알파-L-LNA 또한 기재되어 있으며 이 또한 자연 발생 핵산과 높은 친화도로 페어링한다. 알파-L-LNA와 대조적으로 베타-L-LNA는 자연 발생 핵산에는 결합하지 않고 베타-L-DNA 또는 베타-L-LNA와 같은 베타-L-배열 핵산에만 결합한다. LNA 단량체는 미국 특허 6,268,490, 미국 특허 6,794,499, 미국 특허 7,034,133에 더 상세히 기재되어 있으며, 이들 문헌의 내용은 본원에 그 전문이 참고로 포함된다. 잠금 핵산 유도체의 합성은 미국 특허 8,492,390에 기재되어 있으며, 이 문헌의 내용은 본원에 그 전문이 참고로 포함된다. 또 다른 단량체는 PCT 공개 공보 WO98/39352, WO99/14226, 및 WO200066604에 개시되어 있으며, 이들 문헌의 내용은 본원에 그 전문이 참고로 포함된다.
일부 실시형태에서, 올리고뉴클레오티드에 하나 이상의 LNA 단량체를 혼입하면 이중체의 용융 온도(Tm)를 증가시킴으로써 상보적 RNA 또는 DNA 표적에 대한 올리고뉴클레오티드의 친화도가 증가한다. 일부 실시형태에서, 이중체의 열적 안정성은 실제 염기에 따라 올리고뉴클레오티드에 존재하는 LNA 단량체 당 약 3℃에서 약 8℃사이의 범위에서 증가한다 (Dwaine A. Braasch and David R. Corey, Chemistry and Biology 8 (2001) 1-7 참조). DNA/LNA 혼합체(mixmers)와 비교하여 모든-LNA 이중체는 매우 예외적으로 이중체를 형성한다. 따라서 매우 짧은 서열을 결합 쌍으로 사용할 수 있다. 일부 실시형태에서, 매우 짧은 서열의 사용은 뉴클레오티드에서의 변형이 중합효소에 의한 혼입 효율을 최소로 손상시키도록 가능한 한 작게 유지될 수 있기 때문에 유리한 것으로 여겨진다. 더욱이, 베타-L-LNA는 D-배열의 핵산(예를 들어, 시퀀싱할 DNA)을 방해하지 않는다는 추가적인 이점이 있다. 일부 실시형태에서, 올리고뉴클레오티드는 전적으로 LNA 단량체로 구성된다, 예를 들어, 올리고뉴클레오티드는 3 내지 12개의 LNA 단량체, 4 내지 8개의 LNA 단량체, 또는 5 내지 6개의 LNA 단량체를 포함한다. 일부 실시형태에서, Z1기는 LNA 단량체를 포함하고 서열 번호: 1 - 22 중 어느 하나의 서열을 갖는 올리고뉴클레오티드 서열을 포함할 수 있다. 당업자는 도입된 접합체(본원에 기술됨)가 LNA 단량체를 포함하고 서열 번호: 29 - 50 중 어느 하나의 서열을 갖는 상보적 올리고뉴클레오티드 서열을 포함할 것임을 이해할 것이다. 예를 들어, 뉴클레오티드가 서열 번호: 19를 갖는 올리고뉴클레오티드를 포함하는 Z1기를 포함하는 경우, 도입된 접합체는 상보적인 서열, 즉 서열 번호: 47을 가질 것이다. 일부 실시형태에서 제1 및 제2 올리고뉴클레오티드 서열은 교환될 수 있다, 즉 Z1기는 LNA 단량체를 포함하고 서열 번호: 29 - 50 중 어느 하나의 서열을 갖는 올리고뉴클레오티드 서열을 포함할 수 있고, 그러면 도입된 접합체는 LNA 단량체를 포함하고 서열 번호: 1 - 22 중 어느 하나의 서열을 갖는 상보적 올리고뉴클레오티드 서열을 포함할 것이다.
일부 실시형태에서, 올리고뉴클레오티드는 “PNA-변형된 올리고뉴클레오티드”이다. “PNA-변형된 올리고뉴클레오티드”는 하나 이상의 PNA 단량체(“펩티드 핵산” 단량체)로 완전히 또는 부분적으로 변형된 올리고뉴클레오티드를 지칭한다. PNA 단량체는 천연 핵산의 당 인산 골격이 일반적으로 N-(2-아미노-에틸)-글리신 단위로 형성된 합성 펩타이드 골격으로 대체되어 비키랄성 및 비하전 모방체를 생성하는 뉴클레오티드 유사체의 부류를 지칭한다. PNA는 전하를 포함하지 않기 때문에 PNA와 DNA 간의 결합 혼성화는 동일한 서열에 대한 DNA와 DNA 간의 결합 혼성화보다 더 강하다고 여겨진다. LNA/LNA 이중체와 유사하게 PNA/PNA 이중체는 이중체 안정성이 높다. 일부 실시형태에서, 올리고뉴클레오티드는 전적으로 PNA 단량체로 구성된다, 예를 들어, 올리고뉴클레오티드는 3 내지 12개의 PNA 단량체, 4 내지 8개의 PNA 단량체, 또는 5 내지 6개의 PNA 단량체를 포함한다. 한 예로서, 올리고뉴클레오티드는 6개의 PNA 단량체를 포함할 수 있으며 서열 5'- ctgtca -3' (서열 번호: 4)을 가진다.
일부 실시형태에서, 올리고뉴클레오티드는 하나 이상의 감마-PNA 단량체로 구성된다. 일부 실시형태에서, 올리고뉴클레오티드 내 하나 이상의 PNA 단량체는 그 감마 탄소에서, 예를 들어, 하전된 모이어티 (예를 들어, 리신기)로 치환될 수 있다.
일부 실시형태에서, Z1은 호스트 분자 또는 게스트 분자 중 하나(즉, 호스트/게스트 시스템의 한 구성원)를 포함한다. 호스트-게스트 시스템은 약간 더 큰 호스트 분자의 공동에 맞는 작은 게스트 분자를 포함하고 비공유적 인력(예를 들어, 수소 결합 및/또는 반 데르 발스 인력)에 의해 유지된다. 서로 다른 유형의 호스트-게스트 시스템은 다양한 결합 형태와 광범위한 결합 친화도를 나타낸다.
일부 실시형태에서, 호스트 분자는 쿠커비트[n]우릴 화합물이고, 게스트 분자는 쿠커비트[n]우릴 화합물의 공동 내에 존재할 수 있는 모든 화합물이다. 일부 실시형태에서, 쿠커비트[n]우릴 화합물은 쿠커비트[6]우릴, 쿠커비트[7]우릴, 또는 쿠커비트[8]우릴이다. 다른 호스트 화합물에는 칼릭스아렌, 예를 들어, 칼릭스[4]아렌이 포함된다.
일부 실시형태에서, 게스트 분자는 아미노아다만탄이다. 일부 실시형태에서, 게스트 분자는 이양이온성 페로센 유도체(dicationic ferrocene derivative) (예를 들어, 비스(트리메틸암모니오메틸)페로센)이다. 다른 실시형태에서, 게스트 분자는 이양이온성 N-아다만틸 에틸렌디아민이다. 또한 다른 실시형태들에서, 호스트 분자는 사이클로덱스트린, 예를 들어, 베타-사이클로덱스트린이다.
본 발명에서 사용하기에 적합한 또 다른 호스트/게스트 분자는 미국 특허 공개 번호 2005/0080068, 2009/0072191, 2010/0247477, 및 2017/0028374에 기재되어 있으며, 이들의 내용은 본원에 참고로 포함된다. 또한 더 많은 호스트 / 게스트 분자들은 Rekharsky et. al., “A synthetic host-guest system achieves avidin-biotin affinity by overcoming enthalpy- entropy compensation,” PNAS, December 26, 2007, vol. 104, no. 52, 20737-20742; Moghaddam et. al., “HostGuest Complexes with ProteinLigand-like Affinities: Computational Analysis and Design,” Journal of the American Chemical Society 2009, 131, 11, 4012-4021; Sonzini et. al., “High Affinity Recognition of a Selected Amino Acid Epitope within a Protein by Cucurbit[8]uril Complexation,” Angewandte Chemie, Vol. 55, Issue 45, November 2016; Chakraborty et. al., “A styryl based fluorogenic probe with high affinity for a cyclodextrin derivative,” Organic & Biomolecular Chemistry, Issue 28, 2019; Iwamoto et. al., “Energetics of guest binding to calix[4]arene molecular containers,” Tetrahedron, Vol. 65, Issue 35, August 2009, 7259 - 7267에 보다 상세히 기재되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참고문헌으로 포함된다.
일부 실시형태에서, PG는 분자의 혼입을 방지하는 임의의 보호기(예를 들어, 화학식 (IA)의 것과 같은 또 다른 뉴클레오티드)가 화학식 (IA)의 뉴클레오티드의 3' 위치에서 반응하는 것을 방지하지만, 여기서 기 PG는 (예를 들어, 추가 뉴클레오티드의 혼입을 통해 중합이 발생하도록 허용하는) 정의된 조건하에서 제거될 수 있다. 적합한 보호기의 비-제한적 예에는 아지도메틸, 3'-O-알릴 (3'-O-CH2-CH=CH2), 3'-니트레이트 (3'-O-NO2), 3-디티오메틸 (3'-O-CH2-S-S-R), 3'-O-시아노에틸 (3'-O-CH2CH2CN), 및 3'-O-시아노에톡시메틸 (3'-O-CH2-O-CH2CH2CN)이 포함된다. 또 다른 보호기는 미국 특허 제 5,990,300; 미국 공개공보 제 2015/0140561 및 2007/0117104에; 그리고 PCT 공개 공보 제 WO/2008/037568A2 및 WO91/06678에 기재되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참고로 포함된다. 또 다른 보호기는 PCT 출원 번호 PCT/US19/66670에 개시되어 있으며, 그 개시내용은 그 전체가 본원에 참고로 포함된다. PCT 출원 번호 PCT/US19/66670은 예를 들어 화학식 -B(OR1)(OR2)를 갖는 보호기를 기재하고 있으며, 여기서 R1 및 R2는 -H, 메틸 또는 에틸로부터 독립적으로 선택된다.
일부 실시형태에서, 본 발명에 따른 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드 및/또는 폴리뉴클레오티드(이의 임의의 염 포함)는 화학식 (IB)로 정의된 구조를 가지며:
Figure pct00019
(IB),
이때
Y는 -OH, -O-P(O)(OH)[-O-P(O)(OH)]z-OH 또는 -O-P(O)(OH)-올리고뉴클레오티드이고, 이때 z는 0 또는 1 내지 5 범위의 정수이다.
PG는 보호기이고;
W는 핵염기이고;
Q1은 직쇄 또는 측쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 모이어티이고 1 내지 25개의 탄소 원자를 가지고 하나 이상의 헤테로원자로 선택적으로 치환되며;
Q2는 직쇄 또는 측쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 45개의 탄소 원자를 가지고 하나 이상의 헤테로원자로 선택적으로 치환되며;
X1은 절단성 기이고; 그리고
Z1은 반응기이다.
일부 실시형태에서, Q1은 C1 - C25 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 일부 실시형태에서, Q1은 C1 - C20 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 일부 실시형태에서, Q1은 C1 - C15 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 다른 실시형태에서, Q1은 C1 - C8 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또 다른 실시형태에서, Q1은 C1 - C6 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또한 추가 실시형태에서, Q1은 C1 - C4 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또한 추가 실시형태에서, Q1은 C1 - C4 직쇄 또는 분지쇄, 치환 또는 비치환 알킬기를 포함한다. 또한 추가 실시형태에서, Q2는 C1 - C4 직쇄 또는 분지쇄 알킬기를 포함한다.
일부 실시형태에서, Q1은 C3 - C6 사이클로알킬기 또는 헤테로사이클로알킬기를 포함한다. 일부 실시형태에서, Q1은 C3 - C4 사이클로알킬기 또는 헤테로사이클로알킬기를 포함한다. 일부 실시형태에서, Q1은 치환 또는 비치환 C5 - C7 사이클로알킬기를 포함한다. 일부 실시형태에서, Q1은 치환 또는 비치환 C5 - C6 사이클로알킬기를 포함한다. 일부 실시형태에서, Q1은 치환 또는 비치환 C5 - C7 헤테로사이클로알킬기를 포함한다. 일부 실시형태에서, Q1은 치환 또는 비치환 C5 - C6 헤테로사이클로알킬기를 포함한다.
일부 실시형태에서, Q1은 C2 - C25 치환 또는 비치환 알케닐기를 포함한다. 일부 실시형태에서, Q1은 C2 - C12 치환 또는 비치환 알케닐기를 포함한다. 또 다른 구체예에서, Q1은 C2 - C6 치환 또는 비치환 알케닐기를 포함한다. 일부 실시형태에서, Q1은 C2 - C25 치환 또는 비치환 알키닐기를 포함한다. 일부 실시형태에서, Q1은 C2 - C12 치환 또는 비치환 알키닐기를 포함한다. 또 다른 구체예에서, Q1은 C2 - C6 치환 또는 비치환 알키닐기를 포함한다.
일부 실시형태에서, Q2는 C1 - C45 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 일부 실시형태에서, Q2는 C1 - C35 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 일부 실시형태에서, Q2는 C1 - C25 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 다른 실시형태에서, Q2는 C1 - C20 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬 그룹을 포함한다. 또 다른 실시형태에서, Q2는 C1 - C15 직쇄 또는 분지쇄, 치환 또는 비치환 알킬기 또는 헤테로알킬기를 포함한다. 또한 추가 실시형태에서, Q2는 C1 - C10 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또한 추가 실시형태에서, Q2는 C1 - C6 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또한 추가 실시형태에서, Q2는 C1 - C6 직쇄 또는 분지쇄, 치환 또는 비치환 알킬기를 포함한다. 또한 추가 실시형태에서, Q2는 C1 - C6 직쇄 또는 분지쇄 알킬기를 포함한다.
일부 실시형태에서, Q2는 C3 - C6 사이클로알킬기 또는 헤테로사이클로알킬기를 포함한다. 일부 실시형태에서, Q2는 C3 - C4 사이클로알킬기 또는 헤테로사이클로알킬기를 포함한다. 일부 실시형태에서, Q2는 치환 또는 비치환 C5 - C7 사이클로알킬기를 포함한다. 일부 실시형태에서, Q2는 치환 또는 비치환 C5 - C6 사이클로알킬기를 포함한다. 일부 실시형태에서, Q2는 치환 또는 비치환 C5 - C7 헤테로사이클로알킬기를 포함한다. 일부 실시형태에서, Q2는 치환 또는 비치환 C5 - C6 헤테로사이클로알킬기를 포함한다.
일부 실시형태에서, Q2는 C2 - C45 치환 또는 비치환 알케닐기를 포함한다. 일부 실시형태에서, Q2는 C2 - C25 치환 또는 비치환 알케닐기를 포함한다. 일부 실시형태에서, Q2는 C2 - C45 치환 또는 비치환 알키닐기를 포함한다. 일부 실시형태에서, Q2는 C2 - C25 치환 또는 비치환 알키닐기를 포함한다.
일부 실시형태에서, Q1 및/또는 Q2는 독립적으로 폴리에틸렌 옥사이드 모이어티 또는 폴리프로필렌 옥사이드 모이어티를 포함할 수 있다. 예를 들어, Q1 및/또는 Q2는 -[CH2-CH2-O]s-기를 포함할 수 있으며, 이때 s는 1 내지 약 27 범위의 정수이다. 일부 실시형태에서, s는 1 내지 12 범위이다. 예를 들어, Q2는 -[CH2-CH (CH3)-O]s-기를 포함할 수 있으며, 이때 s는 1 내지 약 27 범위의 정수이다. 일부 실시형태에서, s는 1 내지 약 12 범위이다.
일부 실시형태에서, Q1 및/또는 Q2는 치환 또는 비치환 C5 - C7 아릴기를 독립적으로 포함한다. 다른 실시형태에서, Q1 및/또는 Q2는 치환 또는 비치환 C5 - C6 아릴기를 독립적으로 포함한다.
일부 실시형태에서, X1은 임의의 광절단성, 효소적 절단성, 화학적 절단성, pH 민감성 등의 기일 수 있다. 예를 들어, X1은 약 200nm 내지 약 400nm(UV) 또는 약 400nm 내지 약 800nm(가시)의 파장을 갖는 전자기 방사선 소스에 노출될 때 절단될 수 있는 기이다. 적합한 광절단성 기의 예에는 아릴카르보닐메틸기(예를 들어, 4-아세틸-2-니트로벤질, 디메틸페나실(DMP)); 2-(알콕시메틸)-5-메틸-α-클로로아세토페논, 2,5-디메틸벤조일 옥시란, 벤조인기(예를 들어, 3',5'-디메톡시벤조인(DMB)), o-니트로벤질기(예를 들어, 1-(2-니트로페닐) 에틸(NPE), 1-(메톡시메틸)-2-니트로벤젠, 4,5-디메톡시-2-니트로벤질(DMNB), α-카르복시니트로벤질(α-CNB)); o-니트로-2-펜에틸옥시카보닐기(예를 들어, 1-(2-니트로페닐)에틸옥시카보닐 및 2-니트로-2-펜에틸 유도체); o-니트로아닐리드(예를 들어, 아실화 5-브로모-7-니트로인돌린); 쿠마린-4-일-메틸기(예를 들어, 7-메톡시쿠마린 유도체); 9-치환된 잔텐 및 아릴메틸기(예를 들어, o-하이드록시아릴메틸기)가 포함되나 이에 제한되는 것은 아니다.
일부 실시형태에서, X1은 약 700nm 내지 약 1000nm의 파장을 갖는 전자기 방사선 소스에 노출될 때 절단될 수 있는 기이다. 적합한 근적외선 광절단성 기는 C4-디알킬아민-치환된 헵타메틴 시아닌을 비롯한 시아닌 기를 포함한다.
일부 실시형태에서, X1은 환원제를 비롯한 다양한 화학 반응물에 의해 또는 유도된 pH의 변화(예를 들어, 약 7 미만의 pH에서 X1기의 절단)에 의해 화학적으로 절단될 수 있는 기이다. 화학적 절단성 기의 비제한적인 예는 디설파이드계 기; 디아조벤젠기(예를 들어, 2-(2-알콕시-4-하이드록시-페닐아조), 벤조산 스캐폴드, 에스터 결합계 기, 산성 민감성 기(예를 들어, 디알콕시디페닐실란 기 또는 아실하이드라존 기)가 포함된다. 친전자성으로 절단된 기(예를 들어, p-알콕시벤질 에스터 및 p-알콕시벤질 아미드)는 양성자에 의해 절단되는 것으로 여겨지며 산에 민감성인 절단을 포함한다.
일부 실시형태에서, X1은 트립신 절단성 기 및 V8 프로테아제 절단성 기를 포함하는 (그러나 이에 제한되지 않음) 효소적 절단성 기이다. 일부 실시형태에서, 이러한 기는 우라실-N-글리코실라제, RNase A, 베타-글루쿠로니다제, 베타-갈락토시다제 또는 TEV-프로테아제 중 하나에 의해 효소적으로 절단될 수 있다.
일부 실시형태에서, 이들 W, Z1, Q1, X1, 및 Q2기들은 C-C 결합, 아미드 결합, 에스터 결합, 우레아 링키지, 우레탄 링키지, 아민 결합, 에터 결합, 티오에터 결합, 포스페이트 링키지, 1,2,3-트리아졸 링키지, 또는 디하이드로피리다진 링키지와 같은 화학 결합을 통해 연결된다. 예로서, 합성 동안 Q1은 X1의 상응하는 반응성 작용기 (예를 들어, 아미노 반응기, 카르복시산 반응기, 또는 티올 반응기)에 커플링하기 위한 제1 반응성 작용기 (예를 들어, 아민 반응기, 카르복시산 반응기, 또는 티올 반응기)를 포함할 수 있다. 일부 실시형태에서, 아민 반응기는 이소티오시아네이트, 이소시아네이트, 아실 아지드, NHS 에스터, 산 염화물, 예를 들어, 설포닐 클로라이드, 알데히드, 에폭사이드 및 옥시란, 카보네이트, 아릴화제, 이미도에스터, 카르보디이미드, 무수물, 및 이들의 조합을 포함한다. 적합한 티올-반응성 작용기는 할로아세틸 및 알킬 할라이드, 말레이미드, 아지리딘, 아크릴로일 유도체, 아릴화제, 티올-디설파이드 교환 시약, 예컨대 피리딜 디설파이드, TNB-티올, 및 디설파이드 환원제, 및 이들의 조합을 포함한다. 카르복실레이트 반응성 작용기는 디아조알칸, 디아조아세틸 화합물, 카르보닐디이미다졸 화합물 및 카르보디이미드를 포함한다. 하이드록실 반응성 작용기는 에폭사이드 및 옥시란, 카르보닐디이미다졸, N,N'-디숙신이미딜 카르보네이트 또는 N-하이드록시숙신이미딜 클로로포르메이트, 과요오드산염 산화 화합물, 효소적 산화, 알킬 할로겐 및 이소시아네이트를 포함한다. 알데히드 및 케톤 반응성 작용기는 하이드라진, Schiff 염기, 환원성 아민화 생성물, Mannich 축합 생성물, 및 이들의 조합을 포함한다. 활성 수소 반응성 화합물에는 디아조늄 유도체, Mannich 축합 생성물, 요오드화 반응 생성물 및 이들의 조합이 포함된다. 광반응성 화학 작용기는 아릴 아지드, 할로겐화 아릴 아지드, 벤조포논, 디아조 화합물, 디아지린 유도체, 및 이들의 조합을 포함한다.
(IA) 또는 (IB)를 갖는 뉴클레오티드의 비제한적인 예는 하기에 제시되어 있다:
Figure pct00020
Figure pct00021
Figure pct00022
접합체
본 발명은 또한 화학식 (IA) 및 (IB)의 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드, 및/또는 폴리뉴클레오티드(또는 이의 임의의 염)와 반응할 수 있는 접합체를 제공한다. 일부 실시형태에서, 접합체는 화학식 (IIA) 또는 (IIB)에 의해 정의된 구조를 가지며:
Figure pct00023
(IIA), 또는
Figure pct00024
(IIB),
이때
D는 검출가능한 표지 또는 검출가능한 표지를 포함하는 접합체이고;
L2는 결합 또는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며;
Z2는 반응기이고; 그리고
p는 2 내지 약 1000 범위이다.
일부 실시형태에서, 그리고 화학식 (IIA)를 보면, 검출가능한 표지 또는 검출가능한 표지 “D”를 포함하는 접합체는 예를 들어 L2기를 통해 단일 Z2 반응기로만 작용기화된다. 다른 실시형태에서, 그리고 화학식 (IIB)를 참조하면, 2개 이상의 Z2 반응기는 단일 검출가능한 표지 또는 검출가능한 표지 “D”를 포함하는 단일 접합체에 접합된다. 일부 실시형태에서, p는 2 내지 약 500 범위이다. 다른 실시형태에서, p는 2 내지 약 250 범위이다. 또한 다른 실시형태들에서, p는 2 내지 약 150 범위이다. 추가 실시형태들에서, p는 2 내지 약 100 범위이다. 또 다른 실시형태들에서, p는 2 내지 약 60 범위이다. 또한 또 다른 실시형태들에서, p는 2 내지 약 30 범위이다.
일부 실시형태에서, Z2는 반응기 쌍의 제2 구성원이다. 예를 들어, Z2는 제1 반응기 구성원 Z1, 예를 들어, 화학식 (IA) 및 (IB) 중 어느 하나의 뉴클레오티드의 제1 반응기 구성원 Z1과 특이적으로 반응하는, 즉 직교 반응하는 제2 반응기 구성원일 수 있다. 일부 실시형태에서, Z2는 모이어티 Z1과 관련하여 본원에 기재된 임의의 반응기들에서 선택된다. 예를 들어, Z1이 한 쌍의 클릭 접합체의 제1 구성원을 포함하면 Z2는 한 쌍의 클릭 접합체의 제2 구성원을 포함하며, 여기서 한 쌍의 클릭 접합체의 제2 구성원은 한 쌍의 클릭 접합체의 제1 구성원과 반응한다. 또 다른 예로서, Z1이 제1 올리고뉴클레오티드를 포함하면, Z2는 제2 올리고뉴클레오티드를 포함하고, 이때 제2 올리고뉴클레오티드는 제1 올리고뉴클레오티드에 상보적이고 제1 올리고뉴클레오티드와 혼성화 가능하다. 또 다른 예에서, Z1이 합텐을 포함하는 경우, Z2는 항-합텐 항체를 포함한다. 추가 예에서, Z1이 호스트 분자를 포함하는 경우, Z2는 호스트 분자와 상호작용할 수 있는 게스트 분자를 포함한다. 일부 실시형태에서, Z2는 Z1에 관해 본원에 기재된 임의의 화합물들에서 선택된다.
일부 실시형태에서, 모이어티 L2는 1 내지 약 50개 탄소 원자를 포함한다. 일부 실시형태에서, 모이어티 L2는 1 내지 약 40개 탄소 원자를 포함한다. 다른 실시형태에서, 모이어티 L2는 2 내지 약 30개 탄소 원자를 포함한다. 또한 다른 실시형태에서, 모이어티 L2는 약 5 내지 약 20개 탄소 원자를 포함한다. 또한 다른 실시형태에서, 모이어티 L2는 약 5 내지 약 15개 탄소 원자를 포함한다. 추가 실시형태에서, 모이어티 L2는 약 10 내지 약 20개 탄소 원자를 포함한다. 일부 실시형태에서, 모이어티 L2는 약 20 g/mol 내지 약 750 g/mol 범위의 분자량을 가진다. 다른 실시형태에서, 모이어티 L2는 약 20 g/mol 내지 약 500 g/mol 범위의 분자량을 가진다. 또 다른 실시형태에서, 모이어티 L2는 약 20 g/mol 내지 약 250 g/mol 범위의 분자량을 가진다.
일부 실시형태에서, 모이어티 L2는 비오틴(5-[(3aS,4S,6aR)-2-옥소-1,3,3a,4,6,6a-헥사하이드로티에노[3,4-d]이미다졸-4-일]펜탄산) 또는 이의 유도체를 포함한다. 일부 실시형태에서, L2는 다음 구조를 가지며: L4-L5- 이때 L4는 비오틴 또는 이의 유도체이고; L5는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 50개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함한다. 일부 실시형태에서, L5는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 20개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함한다. 일부 실시형태에서, L5는 하나 이상의 절단성 기를 포함한다. 일부 실시형태에서, L2는 비오틴 또는 이의 유도체이다. 일부 실시형태에서, L2는, 적어도 일부는, 비오틴에서 유래한다. 다른 실시형태에서, L2는 결합이다.
일부 실시형태에서, 모이어티 L2는 선택적으로 하나 이상의 절단성 기, 예를 들어, 광절단성 기, 효소적 절단성 기, 화학적 절단성 기, 및 특정 pH에서의 절단성 기를 포함한다. 모이어티 L2가 절단성 기를 포함하는 실시형태에서, 절단성 기는 모이어티 L2 내의 임의의 위치에 위치할 수 있다. 모이어티 L2가 절단성 기를 포함하는 실시형태에서, 절단성 기는 L1 또는 X1과 관련하여 본원에 기재된 것들 (예를 들어, 이황화물 또는 알파-아지도에터)을 포함할 수 있다. 일부 실시형태에서, 모이어티 L2는 하나의 절단성 기를 포함한다. 다른 실시형태에서, 모이어티 L2는 절단성 기를 포함하지 않는다. 일부 실시형태에서, L2는 존재하지 않는다, 즉, L2는 결합이다.
일부 실시형태에서, 모이어티 L2는 1 내지 약 40개의 탄소 원자를 갖고 선택적으로 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 모이어티 L2는 1 내지 약 30개의 탄소 원자를 갖고 선택적으로 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 모이어티 L2는 1 내지 약 20개의 탄소 원자를 갖고 선택적으로 하나 이상의 절단성 기를 포함하는 치환 또는 비치환된 알킬기 또는 헤테로알킬기이다.
일부 실시형태에서, 모이어티 L2는 일반 구조 -[링커]t-[절단성 기]u-[링커]v-를 가지며, 이때 각각의 [링커]는 동일 또는 상이할 수 있고, 이때 t, u, 및 v는 독립적으로 0 또는 1 내지 약 5 범위의 정수이다. 일부 실시형태에서, t, u, 및 v는 독립적으로 0 또는 1 내지 약 4 범위의 정수이다. 일부 실시형태에서, t, u, 및 v는 독립적으로 0 또는 1 내지 약 3 범위의 정수이다. 일부 실시형태에서, t, u, 및 v는 독립적으로 0 또는 1 내지 2 범위의 정수이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 1 내지 약 30개의 탄소 원자를 포함할 수 있고, 이때 각각의 [링커]는 하나 이상의 헤테로원자로 선택적으로 치환된다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 2 내지 약 20개의 탄소 원자를 포함할 수 있고, 이때 각각의 [링커]는 하나 이상의 헤테로원자로 선택적으로 치환된다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 3 내지 약 15개의 탄소 원자를 포함할 수 있고, 이때 각각의 [링커]는 하나 이상의 헤테로원자로 선택적으로 치환된다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 1 내지 약 20개 탄소 원자를 갖는 치환 또는 비치환 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, 각각의 [링커]는 독립적으로 1 내지 약 10개 탄소 원자를 갖는 치환 또는 비치환 알킬기 또는 헤테로알킬기이다. 일부 실시형태에서, -[절단성 링커]-는 광절단성 기, 효소적 절단성 기, 화학적 절단성 기, 및 특정 pH에서의 절단성 기를 포함한다.
일부 실시형태에서, 검출가능한 표지 또는 검출가능한 표지 “D”를 포함하는 접합체는 검출될 수 있는 임의의 화학 기 또는 분자일 수 있다. 일부 실시형태에서, 검출가능한 표지 또는 검출가능한 표지 “D”를 포함하는 접합체는 자성 나노입자이다. 일부 실시형태에서, 자성 나노입자는 상자성, 초상자성 또는 강자성일 수 있는 자성 재료로부터 형성된다. 일부 실시형태에서, 자성 나노입자는 구조가 결정질, 다결정질 또는 비정질인 강자성 물질로부터 형성된다. 예를 들어, 자성 나노입자의 코어는 Fe, Co, Ni, FeOFe2O3, NiOFe2O3, CuOFe2O3, MgOFe2O3, MnBi, MnSb, MnOFe2O3, Y3Fe5O12, CrO2, MnAs, SmCo, FePt, 또는 이들의 조합과 같은 물질을 포함할 수 있지만 이에 제한되지 않는다. 다른 실시형태에서, 자성 나노 입자는 부동태 금속과 자성 금속의 복합체 또는 합금인 코어 물질을 포함한다. 일부 실시형태에서, 부동태 금속은 Au, Ag, Pt 또는 Cu에서 선택되고, 자성 금속은 Fe 및 Co에서 선택된다. 나노입자 코어는 또한 Au/Fe, Au/Cu, Au/Gd, Au/Zn, Au/Fe/Cu, Au/Fe/Gd 및 Au/Fe/Cu/Gd를 비롯한 합금으로부터 형성될 수 있다. 다른 비-제한적 자성 나노입자들은 미국 특허 공개공보 제 2006/0233712, 및 2003/0068187; PCT 공개공보 제 WO/03/073444, WO/02/093140, 및 WO/02/32404; 및 미국 특허 제 6,531,304, 6,514,481, 6,254,662, 8,557,607, 9,623,126, 및 9,707,2984에 기재되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참고로 포함된다.
일부 실시형태에서, 자성 나노입자는 자기 이방성이 높은 것들을 포함할 수 있다. 높은 자기 이방성을 갖는 자성 나노 입자의 예에는, Fe3O4, FePt, FePd, 및 CoPt가 포함되나 이에 제한되지는 않는다. 뉴클레오티드에 대한 화학적 결합을 촉진하기 위해 이들 입자들을 합성하고 SiO2로 코팅할 수 있다. 예를 들어, M. Aslam, L. Fu, S. Li, and V.P. Dravid, “Silica encapsulation and magnetic properties of FePt nanoparticles,” Journal of Colloid and Interface Science, Volume 290, Issue 2, 15 October 2005, pp. 444-449를 참조하라. 높은 자기 이방성을 갖는 나노입자의 예에는, FeO, Fe3O4, FePt, FePd, 및 CoPt가 포함되지만 이에 제한되는 것은 아니다. 뉴클레오티드에 대한 화학적 결합을 촉진하기 위해 입자를 합성하고 SiO2로 코팅할 수 있다 (예를 들어, M. Aslam, L. Fu, S. Li, and V.P. Dravid, “Silica encapsulation and magnetic properties of FePt nanoparticles,” Journal of Colloid and Interface Science, Volume 290, Issue 2, 15 October 2005, pp. 444-449 참조, 이들 문헌의 내용은 그 전문이 본원에 참고로 포함됨).
일부 실시형태에서,자성 나노입자는 하나 이상의 L2 기에 직접 (예를 들어, 공유 결합을 통해) 커플링된다. 다른 실시형태에서, 자성 나노입자는 접합체에 간접적으로 커플링된다. 예를 들어, 일부 실시형태에서, 자성 나노입자는 복수의 아비딘 및/또는 스트렙타비딘 분자로 작용기화된 표면을 포함할 수 있다. 일부 실시형태에서, 아비딘 및/또는 스트렙타비딘 분자로 작용기화된 자성 나노입자는 비오틴 분자 또는 비오틴 분자의 유도체를 포함하는 L2 기와 (예를 들어, 비공유적으로) 반응할 수 있다.
일부 실시형태에서, 접합체에 (직접적으로 또는 간접적으로) 커플링된 자성 나노입자는 자성 센서 어레이로 검출될 수 있는 임의의 자성 나노입자를 포함할 수 있다. 일부 실시형태에서, 접합체에 (직접적으로 또는 간접적으로) 커플링된 자성 나노입자는 (예를 들어, 선형 어레이로 구성된) 복수의 자성 센서를 포함하는 자성 센서 어레이로 검출될 수 있는 임의의 자성 나노입자를 포함할 수 있으며, 이때 복수의 자성 센서들 각각은 적어도 하나의 어드레스 라인에 커플링되어 있다. 일부 실시형태에서, 자기장은 복수의 자성 센서 중 적어도 하나의 특성을 검출하기 위해 적어도 하나의 어드레스 라인에 인가된다. 일부 실시형태에서, 검출된 특성은 검출가능한 자성 나노입자(예를 들어, 뉴클레오티드, 올리고-/폴리뉴클레오티드에 결합된 것 또는 본 명세서에 추가로 기재된 바와 같은 뉴클레오티드-접합체 복합체의 일부)의 존재를 나타낸다. 자성 나노입자를 포함하는 표지된 뉴클레오티드 및/또는 형성된 뉴클레오티드-접합체 복합체(각각 본원에 기술됨)를 검출하기 위한 적합한 자성 센서 어레이는 동시 계류 중인 미국 가출원 번호 62/833,130에 기재되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참고로 포함된다.
일부 실시형태에서, 검출가능한 표지 “D”는 형광단이다. 형광단은 쿠마린, 플루오레세인(또는 플루오레세인 유도체 및 유사체), 로다민, 옥사진(레소루핀 포함), BODIPY, 발광단 및 시아닌을 비롯한 여러 일반적인 화학 부류에 속한다. 또 다른 형광 분자들의 예는 Molecular Probes Handbook ― A Guide to Fluorescent Probes and Labeling Technologies, Molecular Probes, Eugene, OR, ThermoFisher Scientific, 11th Edition에서 찾을 수 있다. 다른 실시형태에서, 형광단은 잔텐 유도체, 시아닌 유도체, 스쿠아레인 유도체, 나프탈렌 유도체, 쿠마린 유도체, 옥사디아졸 유도체, 안트라센 유도체, 피렌 유도체, 옥사진 유도체, 아크리딘 유도체, 아릴메틴 유도체, 및 테트라피롤 유도체로부터 선택된다. 일부 실시형태에서, 플루오레세인 계열의 염료에는 예를 들어 FAM, HEX, TET, JOE, NAN 및 ZOE가 포함된다. 로다민 계열의 염료에는, 예를 들어 텍사스 레드(Texas Red), ROX, R110, R6G 및 TAMRA가 포함된다. FAM, HEX, TET, JOE, NAN, ZOE, ROX, R110, R6G 및 TAMRA는 예를 들어, Perkin-Elmer, Inc. (Wellesley, Mass., USA)으로부터 상업적으로 구입가능하고, 텍사스 레드는, 예를 들어, Life Technologies (Molecular Probes, Inc.) (Grand Island, N.Y.)로부터 상업적으로 구입가능하다. 일부 실시형태에서, 시아닌 계열의 염료는 예를 들어 CY2, CY3, CY5, CY5.5 및 CY7을 포함하고, 예를 들어 GE Healthcare Life Sciences(Piscataway, NJ, USA)로부터 상업적으로 구입가능하다.
다른 실시형태에서, 형광 모이어티는 CF 염료 (Biotium사로부터 구입가능), DRAQ 앤드 CyTRAK 프로브 (BioStatus사로부터 구입가능), BODIPY (Invitrogen사로부터 구입가능), Alexa Fluor (Invitrogen사로부터 구입가능), DyLight Fluor (예를 들어, DyLight 649) (Thermo Scientific, Pierce사로부터 구입가능), Atto 앤드 Tracy (Sigma Aldrich사로부터 구입가능), FluoProbes (Interchim사로부터 구입가능), Abberior 염료 (Abberior사로부터 구입가능), DY 앤드 MegaStokes 염료 (Dyomics사로부터 구입가능), Sulfo Cy 염료 (Cyandye사로부터 구입가능), HiLyte Fluor (AnaSpec사로부터 구입가능), Seta, SeTau 앤드 Square 염료 (SETA BioMedicals사로부터 구입가능), Quasar 앤드 Cal Fluor 염료 (Biosearch Technologies사로부터 구입가능), SureLight 염료 (APC, RPEPerCP, Phycobilisomes사로부터 구입가능)(Columbia Biosciences), 및 APC, APCXL, RPE, BPE (Phyco-Biotech, Greensea, Prozyme, Flogen사로부터 구입가능)에서 선택된다.
본원에 기재된 접합체에 결합된 또 다른 유형의 검출가능한 표지 및 표지 시스템은 양자점, 표면 강화 라만 산란 입자, 산란 금속성 나노입자, FRET 시스템, 고유 형광, 비형광 발색단, 화학발광 표지, 생물발광 표지, 방사성 표지 등을 포함한다. 이러한 검출가능한 표지는 일반적으로 당업계에 공지되어 있고 미국 특허 제6,399,335, 5,866,366, 7,476,503 및 4,981,977호에 추가로 기재되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참고로 포함된다. 적합한 화학발광제는 미국 특허 제7,256,299 및 4,363,759호에 기재되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참고로 포함된다. 화학발광제의 또 다른 예는 아크리디늄 에스터이다.
일부 실시형태에서, 접합체는 화학식 (IIC), (IID), 또는 (IIE) 중 어느 하나에 의해 정의된 구조를 가지며:
Figure pct00025
(IIC),
Figure pct00026
(IID), 또는
Figure pct00027
(IIE),
이때
D는 검출가능한 표지 또는 검출가능한 표지를 포함하는 접합체이고;
Q3 및 Q4는 독립적으로 직쇄 또는 측쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 30개의 탄소 원자를 가지고 하나 이상의 헤테로원자로 선택적으로 치환되며;
X2는 절단성 기이고;
Z2는 반응기이고;
n은 0 또는 1 내지 3 범위의 정수이고;
m 및 o는 각각 독립적으로 0 또는 1이고;
r은 1 내지 3 범위의 정수이고; 그리고
p는 2 내지 약 1000 범위의 정수이다.
일부 실시형태에서, 그리고 화학식 (IIC) 및 (IID)를 보면, 검출가능한 표지 또는 검출가능한 표지 “D”를 포함하는 접합체는 단일 Z2 반응기로만 작용기화된다. 다른 실시형태에서, 그리고 화학식 (IID)를 참조하면, 2개 이상의 Z2 반응기는 단일 검출가능한 표지 또는 검출가능한 표지 “D”를 포함하는 단일 접합체에 접합된다. 일부 실시형태에서, p는 2 내지 약 500 범위이다. 다른 실시형태에서, p는 2 내지 약 250 범위이다. 또한 다른 실시형태들에서, p는 2 내지 약 150 범위이다. 추가 실시형태들에서, p는 2 내지 약 100 범위이다. 또 다른 실시형태들에서, p는 2 내지 약 60 범위이다. 또한 또 다른 실시형태들에서, p는 2 내지 약 30 범위이다.
일부 실시형태에서, X2는 모이어티 X1과 관련하여 본원에 기재된 임의의 절단성 기들에서 선택된다. 일부 구체예에서, n은 0이다. 다른 실시형태에서, n은 1 내지 3 범위의 정수이다. 일부 실시형태에서, n은 1이다.
일부 실시형태에서, 모이어티 Q3는 비오틴(5-[(3aS,4S,6aR)-2-옥소-1,3,3a,4,6,6a-헥사하이드로티에노[3,4-d]이미다졸-4-일]펜탄산) 또는 이의 유도체를 포함한다. 일부 실시형태에서, Q3는 비오틴에서 유래한다.
일부 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C25 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 다른 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C20 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또한 다른 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C15 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또한 추가 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C10 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 특정 실시형태에서, Q3 및/또는 Q4는 이중 또는 삼중 결합을 포함할 수 있다.
또한 추가 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C6 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또한 추가 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C6 직쇄 또는 분지쇄, 치환 또는 비치환 알킬기를 포함한다. 또한 추가 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C6 직쇄 또는 분지쇄, 알킬기를 포함한다. 또한 추가 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C4 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬기를 포함한다. 또한 추가 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C4 직쇄 또는 분지쇄, 치환 또는 비치환 알킬기를 포함한다. 또한 추가 실시형태에서, Q3 및 Q4는 독립적으로 C1 - C4 직쇄 또는 분지쇄 알킬기를 포함한다.
일부 실시형태에서, Q3 및 Q4는 독립적으로 폴리에틸렌 옥사이드 모이어티 또는 폴리프로필렌 옥사이드 모이어티를 포함한다. 예를 들어, Q3 및 Q4는 독립적으로 -[CH2-CH2-O]s-기를 포함할 수 있으며, 이때 s는 1 내지 약 27 범위의 정수이다. 일부 실시형태에서, s는 1 내지 약 12 범위이다. 예를 들어, Q3 및 Q4는 독립적으로 -[CH2-CH (CH3)-O]s-기를 포함할 수 있으며, 이때 s는 1 내지 약 27 범위의 정수이다. 일부 실시형태에서, s는 1 내지 12 범위이다.
일부 실시형태에서, Q3 및 Q4는 치환 또는 비치환 C5 - C7 아릴기를 독립적으로 포함한다. 다른 실시형태에서, Q3 및 Q4는 치환 또는 비치환 C5 - C6 아릴기를 독립적으로 포함한다.
일부 실시형태에서, Q3 및 Q4는 치환 또는 비치환 C5 - C7 사이클로알킬기를 독립적으로 포함한다. 일부 실시형태에서, Q3 및 Q4는 치환 또는 비치환 C5 - C6 사이클로알킬기를 독립적으로 포함한다. 일부 실시형태에서, Q3 및 Q4는 치환 또는 비치환 C5 - C7 헤테로사이클로알킬기를 독립적으로 포함한다. 일부 실시형태에서, Q3 및 Q4는 치환 또는 비치환 C5 - C6 헤테로사이클로알킬기를 독립적으로 포함한다.
당업자는 D, Z2, Q3, X2, 및 Q4기들이 C-C 결합, 아미드 결합, 에스터 결합, 우레아 링키지, 우레탄 링키지, 아민 결합, 에터 결합, 티오에터 결합, 포스페이트 링키지, 1,2,3-트리아졸 링키지, 또는 디하이드로피리다진 링키지와 같은 화학 결합을 통해 연결됨을 알고 있을 것이다. 예를 들면, 합성 동안 D는 Q3의 상응하는 반응성 작용기 (예를 들어, 아미노 반응기, 카르복시산 반응기, 또는 티올 반응기)에 커플링하기 위한 제1 반응성 작용기 (예를 들어, 아민 반응기, 카르복시산 반응기, 또는 티올 반응기)를 포함할 수 있다. 커플링에 적합한 다른 반응성 작용기가 본원에 기재되어 있다(예를 들어, 표 1 참조).
화학식 (IIA) 내지 (IIE) 중 어느 하나를 갖는 접합체의 비제한적인 예는 하기에 제시된다:
Figure pct00028
Figure pct00029
이때 n은 2 내지 1000 범위이다.
뉴클레오티드와 접합체 사이의 직교 반응성
적절하게 작용기화된 화학식 (IA) 또는 (IB)의 뉴클레오티드는 상응하는 화학식 (IIA) 내지 (IIE)의 적절하게 작용기화된 접합체와 직교로 반응할 수 있다. 본원에 언급된 바와 같이, 화학식 (IA) 또는 (IB)의 서로 다른 뉴클레오티드 및 화학식 (IIA) 내지 (IIE)의 서로 다른 접합체는 각각 서로 직교로 반응하는 반응기들 (Z1 및 Z2)의 쌍을 포함할 수 있다. 예를 들어, 화학식 (IA)의 제1 뉴클레오티드는 제1 반응기쌍의 제1 구성원인 제1 반응기를 포함할 수 있다. 유사하게, 화학식 (IIA)의 제1 접합체는 제1 반응기쌍의 제2 구성원인 제2 반응기를 포함할 수 있다. 제1 반응기쌍의 제1 구성원을 가지는 제1 뉴클레오티드가 제1 반응기쌍의 제2 구성원을 가지는 제1 접합체와 접촉하게 될 때, 제1 반응기쌍의 제1 및 제2 구성원은 본원에 상세히 기재된 바와 같이 서로 직교로 반응하여, 화합물 또는 중간체, 예를 들어, 화학식 (III)을 갖는 화합물 또는 중간체를 제공할 수 있다.
당업자는 각각이 서로 다른 Z1 모이어티를 포함하는 화학식 (IA)의 서로 다른 뉴클레오티드들이 개발될 수 있음을 이해할 것이다. 이와 관련하여, 서로 다른 Z1 모이어티를 갖는 각각의 서로 다른 뉴클레오티드는 화학식 (IIA) 또는 (IIB) 중 어느 하나의 적절하게 작용기화된 접합체, 즉 Z1 모이어티와 선택적으로 반응할 수 있는 Z2 모이어티를 갖는 접합체와 선택적으로 반응할 수 있다. 예를 들어, 제1 뉴클레오티드는 제1 Z2 모이어티 Z2A를 갖는 제1 접합체와 선택적으로 반응하는 제1 Z1 모이어티 Z1A를 가질 수 있고; 제2 뉴클레오티드는 제2 Z2 모이어티 Z2B를 갖는 제2 접합체와 선택적으로 반응하는 제2 Z1 모이어티 Z1B를 가질 수 있고; 제3 뉴클레오티드는 제3 Z2 모이어티 Z2C를 갖는 제3 접합체와 선택적으로 반응하는 제3 Z1 모이어티 Z1C를 가질 수 있고; 제4 뉴클레오티드는 제4 Z2 모이어티 Z2D를 갖는 제4 접합체와 선택적으로 반응하는 제4 Z1 모이어티 Z1D를 가질 수 있다.
이어서 이러한 예는 또한 각각의 제1, 제2, 제3 및 제4 뉴클레오티드(모이어티 Z1A, Z1B, Z1C, Z1D를 가짐)는 서로 다른 핵염기, 예를 들어, A, G, C 및 T를 포함할 수 있다. 이러한 방식으로, 하기 예시된 바와 같은 각각이 서로 다른 반응성 작용기 (Z1A, Z1B, Z1C, Z1D) 및 서로 다른 핵염기(A, G, C, 및 T)를 포함하는 다음과 같은 4개의 서로 다른 뉴클레오티드가 제공될 수 있다:
뉴클레오티드 1: 이때 핵염기 (W) = A이고; 그리고 Z1 = Z1A이다
뉴클레오티드 2: 이때 핵염기 (W) = G이고; 그리고 Z1 = Z1B이다
뉴클레오티드 3: 이때 핵염기 (W) = C이고; 그리고 Z1 = Z1C이다
뉴클레오티드 4: 이때 핵염기 (W) = T이고; 그리고 Z1 = Z1D이다
이 예에서 각각의 뉴클레오티드 1-4는 Z2A, Z2B, Z2C, 또는 Z2D 모이어티 중 하나를 갖는 다음과 같은 4개의 서로 다른 접합체 중 하나와 독립적으로 선택적으로 반응할 수 있다:
접합체 1: 이때 Z2 = Z2A이고, 이때 Z2A는 Z1A와 반응하는 반응기이다
접합체 2: 이때 Z2 = Z2B이고, 이때 Z2B는 Z1B와 반응하는 반응기이다
접합체 3: 이때 Z2 = Z2C이고, 이때 Z2C는 Z1C와 반응하는 반응기이다.
접합체 4: 이때 Z2 = Z2D이고, 이때 Z2D는 Z1D와 반응하는 반응기이다
화학식 (IA) 및 (IB)의 서로 다른 뉴클레오티드와 화학식 (IIA) 및 (IIB)의 적절하게 작용기화된 접합체 사이의 직교 반응성은 본원에서 시퀀싱과 관련하여 추가로 설명될 것이다.
키트
일부 실시형태에서, 본 발명은 각각 서로 다른 핵염기(A, G, C, 또는 T)를 갖고 각각 서로 다른 Z1 모이어티를 추가로 갖는 4개의 서로 다른 뉴클레오티드를 포함하는 키트를 제공한다. 본 발명은 또한 화학식 (IA) 내지 (IB)의 하나 이상의 뉴클레오티드 및/또는 화학식 (IIA) 내지 (IIE) 중 어느 하나의 하나 이상의 접합체를 포함하는 키트를 제공한다.
일부 실시형태에서, 키트는 화학식 (IC)의 뉴클레오티드 하나, 화학식 (ID)의 뉴클레오티드 하나, 화학식 (IE)의 뉴클레오티드 하나, 및 화학식 (IF)의 뉴클레오티드 하나를 포함할 수 있으며:
Figure pct00030
(IC),
Figure pct00031
(ID),
Figure pct00032
(IE), 및
Figure pct00033
(IF),
이때 Y, PG, 및 L1은 본원에 정의된 바와 같고; WA는 아데닌 핵염기이고, WG는 구아닌 핵염기이고; WC는 사이토신 핵염기이고; 그리고 WR는 티민 핵염기 또는 우라실 핵염기이고; 그리고 이때 Z1A, Z1B, Z1C , 및 Z1D 각각은 서로 다른 반응기 (본원에 정의된 반응기들 중 어느 하나 포함)를 포함한다. 일부 실시형태에서, 화학식 (IC), (ID), (IE), 및 (IF)의 뉴클레오티드들 각각은 단일 용기 또는 디스펜서에 혼합물로 제공될 수 있다. 일부 실시형태에서, 화학식 (IC), (ID), (IE), 및 (IF)의 뉴클레오티드 각각은 별도의 용기 또는 별도의 디스펜서에 제공될 수 있다.
일부 실시형태에서, 키트는 화학식 (IIA) 내지 (IIE) 중 어느 하나의 3개 또는 4개의 서로 다른 접합체를 추가로 포함할 수 있고, 이때 서로 다른 접합체 각각은 모이어티 Z1A, Z1B, Z1C, 및 Z1D 중 하나와 직교로 반응하는 모이어티 Z2를 포함한다. 예를 들어, 키트는 화학식 (IIF), (IIG), (IIH), 및 (III)의 접합체들을 적어도 3개 추가로 포함할 수 있으며:
Figure pct00034
(IIF),
Figure pct00035
(IIG),
Figure pct00036
(IIH), 및
Figure pct00037
(III),
이때 D 및 L2는 본원에 정의된 바와 같고, Z2A, Z2B, Z2C , 및 Z2D는 각각 서로 다른 반응기를 포함하고, Z2A는 Z1A와 선택적으로 반응하고, Z2B는 Z1B와 선택적으로 반응하고, Z2C는 Z1C와 선택적으로 반응하고, Z2D는 Z1D와 선택적으로 반응한다. 일부 실시형태에서, 화학식 (IIA)의 서로 다른 접합체 각각은 별도의 용기 또는 디스펜서에 제공된다. 일부 실시형태에서, 키트의 서로 다른 접합체들 각각은 동일한 표지를 가진다. 다른 실시형태에서, 키트의 서로 다른 접합체들 각각은 서로 다른 표지를 가진다. 유사하게, 일부 실시형태에서, 키트의 서로 다른 접합체들 각각은 동일한 L2 모이어티를 포함한다. 다른 실시형태에서, 서로 다른 접합체들 각각은 서로 다른 L2 모이어티를 포함한다. “D”가 자성 나노입자인 실시형태들에서, L2-Z2A, L2-Z2B, L2-Z2C, L2-Z2D는 화학식 (IIB), (IID), 및 (IIE) 중 어느 하나에서와 같이 하나 이상 존재할 수 있다.
뉴클레오티드-접합체 복합체
화학식 (IA) 또는 (IB)의 뉴클레오티드, 뉴클레오시드, 올리고뉴클레오티드, 및/또는 폴리뉴클레오티드 (또는 이의 염)는 화학식 (IIA) 내지 (IIE) 중 어느 하나의 적합한 접합체와 반응하여 뉴클레오티드-접합체 복합체를 제공할 수 있다. 일부 실시형태에서, 뉴클레오티드-접합체 복합체는 본원에 추가로 기재된 바와 같이 신생 핵산 가닥에 혼입된다. 예를 들어, 그리고 본원에 추가로 기재된 바와 같이, 뉴클레오티드-접합체 복합체는 화학식 (IIA)의 접합체가 화학식 (IA)의 뉴클레오티드, 예를 들어, 신생 핵산 가닥에 혼입된 화학식 (IA)의 뉴클레오티드와 반응할 때 형성될 수 있다. 일반적으로, 형성된 뉴클레오티드-접합체 복합체들은 화학식 (III)의 구조를 가지며:
Figure pct00038
(III),
이때 Y, PG, W, L1, L2, 및 D 각각은 본원에 정의된 바와 같고, 그리고 이때 T는 반응기들 Z1 (화학식 (IA) 참조)과 Z2 (화학식 (IB) 참조) 사이의 “반응”의 생성물을 나타낸다. 당업자는W, L1, T, L2, 및 D기들이 C-C 결합, 아미드 결합, 에스터 결합, 우레아 링키지, 우레탄 링키지, 아민 결합, 에터 결합, 티오에터 결합, 포스페이트 링키지, 1,2,3-트리아졸 링키지, 또는 디하이드로피리다진 링키지와 같은 화학 결합을 통해 서로 커플링될 수 있음을 알고 있을 것이다. 다양한 모이어티를 커플링하기에 적합한 다른 유형의 화학 결합이 본원에 추가로 기재되어 있다.
일부 실시형태에서, 뉴클레오티드-접합체 복합체는 적어도 하나의 절단성 기 (이는 모이어티 L1 또는 L2 내부에 존재할 수 있음)를 포함한다. 다른 실시형태에서, 뉴클레오티드-접합체 복합체는 적어도 2개의 절단성 기 (예를 들어, L1 내부에 하나의 절단성 기 그리고 L2 내부에 또 다른 절단성 기)를 포함한다.
일부 실시형태에서, 반응기들 사이의 “반응”의 생성물은 새로운 모이어티를 포함하거나 두 분자들 사이의 상호작용(예를 들어, 수소 결합, 반 데르 발스 상호작용, 혼성화)을 나타낸다. 예를 들어, T는 2개의 반응성 작용기들 사이의 공유 커플링 (예를 들어, “클릭 화학” 반응에 참여할 수 있는 2개의 서로 다른 작용기의 반응); 호스트/게스트 분자 간의 수소 결합 및/또는 반 데르 발스 상호작용(예를 들어, 쿠커비트[7]우릴과 아미노아다만탄 간의 상호작용); 2개의 상보적인 올리고뉴클레오티드의 혼성화(예를 들어, 제1 올리고뉴클레오티드와 제1 올리고뉴클레오티드에 상보적인 제2 올리고뉴클레오티드 사이의 혼성화; 또는 적어도 하나의 LNA 단량체를 포함하는 제1 올리고뉴클레오티드와 제1 올리고뉴클레오티드에 상보적이고 적어도 하나의 LNA 단량체를 포함하는 제2 올리고뉴클레오티드 사이의 혼성화); 및/또는 2개의 특이적 결합 실체들 사이(예를 들어, 합텐과 항-합텐 항체 사이)의 상호작용의 생성물을 나타낼 수 있다.
일부 실시형태에서, 화학식 (III)의 뉴클레오티드-접합체 복합체는 반응식 1에 예시된 합성에 의한 시퀀싱 동안 생성된 중간체이다 (또한, 뉴클레오티드-접합체 복합체는 신생 핵산에 혼입된다). 일반적으로, 합성에 의한 시퀀싱 기술(본원에 추가로 기술됨)은 템플릿 가닥에 대한 뉴클레오티드의 순차적 첨가를 통한 신생 핵산 가닥의 효소적 연장을 포함한다. 이와 관련하여, 반응식 1은 시퀀싱될 핵산 템플릿에 혼성화된 신생 핵산 가닥과 같은 단일 신생 핵산 가닥의 연장을 예시한다. 이때, 신생 핵산은 화학식 (IA)와 같은 뉴클레오티드들의 순차적 도입 및 혼입을 통해 연장된다. 추가로, 반응식 1은 화학식 (IIA) 내지 (IIE) 중 어느 하나를 갖는 적절하게 작용기화된 접합체의 도입을 통해 2개의 서로 다른 화학식 (III)의 검출가능한 뉴클레오티드-접합체 복합체의 형성을 예시한다.
Figure pct00039
반응식 1: 화학식 (III)의 서로 다른 검출가능한 화학종들의 형성을 포함하는, 신생 핵산 가닥에 화학식 (I)의 뉴클레오티드들의 순차적 도입의 예시.
보다 구체적으로, 반응식 1은 신생 핵산 가닥에 커플링된 뉴클레오티드 1(제1 핵염기 “WA”를 갖는 화학식 (IA)의 제1 뉴클레오티드)을 예시하며, 이때 뉴클레오티드 1은 신생 핵산 가닥의 추가 연장을 방지하기 위한 보호기(“PG”)를 포함한다. 단계 10에서, 혼입된 뉴클레오티드 1에만 반응성인 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제1 접합체가 도입될 수 있다. 예를 들어, 뉴클레오티드 1은 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제1 도입 접합체의 Z2A 모이어티와만 반응성인 Z1A 모이어티를 포함할 수 있다. 뉴클레오티드 1과 화학식 (IIA) 내지 (IIE) 중 어느 하나의 접합체 사이의 반응은 검출가능한 표지 “D”를 포함하는 제1 뉴클레오티드-접합체 복합체 2를 제공한다. 제1 뉴클레오티드-접합체 복합체 2가 형성되고 검출된 후, 검출가능한 표지 “D”와 보호기 “PG”가 모두 제거되어(단계 11) 혼입된 뉴클레오티드 3이 생성될 수 있다.
예로서, 시스테아민은 질산염 기를 포함하는 절단성 기를 화학적으로 절단하는데 사용될 수 있다. 마찬가지로, 3'-O-알릴기는 Pd-촉매화된 탈알릴화 혼합물을 사용하여 탈알릴화될 수 있다. 일부 실시형태에서, 또 다른 예로서, 샘플은 절단성 기 L1 및/또는L2를 광화학적으로 절단하기 위해 가시광선, 자외선 또는 적외선으로 조사된다. 절단성 기가 절단되면 L1 기의 단편인 L3기가 남는다. 일부 실시형태에서, 보호기는 검출가능한 표지의 절단 전, 후, 또는 이와 동시에 혼입된 뉴클레오티드로부터 제거된다(단계 11). TCEP (트리스(2-카르복시에틸)포스핀)는 L1 및/또는 L2에서 아지도메틸 보호기 및 알파-아지도에터 결합을 화학적으로 절단하는 데 사용될 수 있다.
보호기 “PG”의 절단 후에, 또 다른 뉴클레오티드 4 (제2 핵염기 “WG”를 갖는 화학식 (IA)의 제2 뉴클레오티드)가 신생 핵산 가닥에 혼입될 수 있다(단계 12). 일부 실시형태에서, 핵염기 4는 신생 핵산 가닥의 추가 연장을 방지하기 위해 보호기(“PG”)를 포함한다. 단계 13에서, 혼입된 뉴클레오티드 4에만 반응성인 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제2 접합체가 도입될 수 있다. 예를 들어, 뉴클레오티드 4는 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제2 도입 접합체의 Z2B 모이어티와만 반응성인 Z1B 모이어티를 포함할 수 있다. 뉴클레오티드 4와 화학식 (IIA) 내지 (IIE) 중 어느 하나의 접합체 사이의 반응은 검출가능한 표지 “D”를 포함하는 제2 뉴클레오티드-접합체 복합체 5를 제공한다. 화학식 (IA)의 뉴클레오티드의 혼입, 화학식 (III)의 뉴클레오티드-접합체 복합체(예를 들어, 혼입된 뉴클레오티드에 상응하는 것)의 형성, 및 형성된 화학식 (III)의 뉴클레오티드-접합체 복합체의 검출 단계들이 반복될 수 있다(단계 14).
합성에 의한 시퀀싱
상기 기재한 바와 같이, 합성에 의한 시퀀싱 기술은 시퀀싱될 템플릿 가닥 분자에 대한 뉴클레오티드의 순차적 첨가를 통한 신생 핵산 복제 가닥의 효소적 연장을 포함한다. 일부 실시형태에서, 합성에 의한 시퀀싱은 가역적 종결자(예를 들어, 화학식 (IA)의 뉴클레오티드의 보호기)를 포함하는 뉴클레오티드를 활용하여 효소(예를 들어, 중합효소)에 의해 각각의 신생 핵산 복제 가닥에 단일 염기만이 추가될 수 있다. 일부 실시형태에서, 시퀀싱 반응은 고체 표면에 펼쳐진 매우 많은 수(예를 들어, 수백만)의 서로 다른 템플릿 핵산 분자들에서 동시에 수행된다. 일부 실시형태에서, 시퀀싱될 핵산 템플릿 가닥은 DNA, RNA 또는 이들의 유사체로 구성될 수 있다. 일부 실시형태에서, 템플릿 핵산의 출처는 게놈 DNA, 메신저 RNA 또는 기타 천연 출처의 핵산일 수 있다. 일부 실시형태에서, 이러한 출처로부터 유래된 템플릿 핵산은 사용 전 증폭될 수 있다. 시퀀싱 방법 및 시퀀싱 과정 동안 사용되는 물질을 비롯한, 합성에 의한 시퀀싱의 다른 양상들은 예를 들어 PCT 출원 공개공보 제 WO 91/06678, WO/2005/024010, WO/2006/120433, WO/2005/065814, 및 WO/2006/064199; 미국 특허 제 9,605,310 및 9,441,272; 및 미국 공개공보 제 2019/0024162에 기술되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참조로 포함된다.
상기 반응식 1은 화학식 (III)의 뉴클레오티드-접합체 복합체의 형성을 예시하지만, 이 반응식은 단일 신생 가닥을 따라 발생하는 화학 및 이에 따른 단일 표적 폴리뉴클레오티드만의 시퀀싱을 예시한다. 그러나, 당업자는 다수(예를 들어, 수백만)의 서로 다른 표적(또는 심지어 동일한 증폭된 표적) 폴리뉴클레오티드의 서열이 동시에 결정될 수 있음을 이해할 것이다. 일부 실시형태에서, 복수의 센서 각각에 클론 증폭이 있을 수 있다 (예를 들어, 브릿지 증폭). 이러한 실시형태에서, 단일 센서 또는 복수의 센서 상에 복수의 동일한 핵산 가닥들이 존재할 수 있다.
본 발명은 뉴클레오티드-접합체 복합체의 서로 다른 서브세트의 순차적 형성이 검출되는 합성에 의한 시퀀싱 방법을 제공한다. 이들 실시형태에서, 순차적으로 형성된 뉴클레오티드-접합체 복합체의 서로 다른 서브세트들의 검출은 각각의 뉴클레오티드 혼입 주기 동안 복수의 표적 폴리뉴클레오티드 분자들 각각의 상보체에 혼입된 서로 다른 뉴클레오티드들을 순차적으로 결정할 수 있게 한다. 따라서 본원에 설명된 방법은 뉴클레오티드-접합체 복합체가 각 반복적 연장 동안 순차적으로 형성되고 검출됨에 따라 대규모 병렬 시퀀싱을 가능하게 한다.
본 발명은 표적 폴리뉴클레오티드 분자를 시퀀싱하는 방법을 제공한다. 일부 실시형태에서, 본 발명은 합성에 의한 시퀀싱 방법을 제공하며, 이때 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트들(예를 들어, 화학식 (III)의 서브세트들)은 복수의 신생 핵산 복제 가닥들의 각 반복적 연장 동안 순차적으로 형성되고 검출되며, 이때 각각의 신생 핵산 복제 가닥은 표적 폴리뉴클레오티드 분자들 중 하나에 상보적이다. 일부 실시형태에서, 이러한 복수의 표적 폴리뉴클레오티드 분자들은 고체 지지체 상에 배열된다. 일부 실시형태에서, 고체 지지체는 플로우 셀이다. 일부 실시형태에서, 뉴클레오티드-접합체 복합체는 본원에 추가로 기재된 바와 같이 신생 핵산 가닥에 혼입된다.
일부 실시형태에서, 상기 방법은 먼저 4개의 서로 다른 뉴클레오티드 중 하나를 각각의 신생 핵산 복제 가닥에 혼입함으로써 각각의 신생 핵산 복제 가닥을 연장시키는 단계를 포함한다. 일부 실시형태에서, 4개의 서로 다른 뉴클레오티드 각각은 (i) 보호기, 및 (ii) 절단성 링커를 통해 핵염기에 커플링된 반응기를 포함하고, 이때 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 반응기를 포함한다. 당업자는 상응하는 상보적 표적 폴리뉴클레오티드 분자의 서열에 따라, 서로 다른 신생 핵산 가닥이 서로 다른 뉴클레오티드로 각각 독립적으로 연장될 수 있음을 이해할 것이다.
일부 실시형태에서, 뉴클레오티드는 화학식 (IA) 또는 (IB)의 4개의 서로 다른 뉴클레오티드의 풀을 도입함으로써 신생 핵산 복제 가닥에 혼입되며, 이때 4개의 서로 다른 뉴클레오티드 각각은 서로 다른 핵염기 (예를 들어, A, G, C, T/ U) 및 다른 Z1 모이어티를 포함한다. 다른 실시형태에서, 뉴클레오티드는 4개의 서로 다른 뉴클레오티드의 풀을 도입함으로써 혼입되며, 여기서 제1 뉴클레오티드는 화학식 (IC), 제2 뉴클레오티드는 화학식 (ID), 제3 뉴클레오티드는 화학식 (IE), 제4 뉴클레오티드는 화학식 (IF)를 가지며, 단, 반응기 Z1A, Z1B, Z1C , 및 Z1D는 각각 상이하다.
다음으로, 뉴클레오티드-접합체 복합체의 서로 다른 서브세트들이 순차적으로 형성된다(예를 들어, 신생 핵산 내에서 형성됨). 일부 실시형태에서, 뉴클레오티드-접합체 복합체 임의의 단일 서브세트 내 형성된 각각의 뉴클레오티드-접합체 복합체는 신생 핵산 복제 가닥들에 혼입된 서로 다른 뉴클레오티드 중 단 하나로부터 유래된다. 일부 실시형태에서, 뉴클레오티드-접합체 복합체의 서로 다른 서브세트는 검출가능한 표지를 포함하는 서로 다른 접합체를 순차적으로 도입함으로써 순차적으로 형성되며, 이때 도입된 서로 다른 접합체 각각은 신생 핵산 사복 가닥 내에 혼입된 뉴클레오티드 중 단 하나와만 직교 반응성이다. 예를 들어, 화학식 (IIA) 내지 (IIE)의 적어도 3개의 서로 다른 접합체들이 순차적으로 도입될 수 있으며, 이때 이러한 화학식 (IIA) 내지 (IIE)의 적어도 3개의 서로 다른 접합체들의 각각의 서로 다른 접합체는 상기 화학식 (IA) 또는 (IB)의 4개의 혼입된 뉴클레오티드들 중 단 하나와만 직교 반응성이다. 화학식 (IIA) 내지 (IIE) 중 어느 하나의 서로 다른 접합체의 순차적 첨가 및 화학식 (IA) 또는 (IB)의 서로 다른 혼입된 뉴클레오티드와의 직교 반응성을 고려할 때, 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트들의 순차적 형성 및 검출은 신생 핵산 복제 가닥들에 혼입되는 서로 다른 뉴클레오티드들의 식별을 용이하게 한다. 그 결과, 상응하는 각각의 상보적 표적 폴리뉴클레오티드 분자의 서열들이 결정될 수 있다. 당업자는 상기 과정이 1회 이상의 주기, 즉, 신생 핵산 복제 가닥의 1회 이상의 연장에 대해 반복될 수 있음을 이해할 것이다.
도 1A 및 1B는 복수의 표적 폴리뉴클레오티드 분자를 포함하는 핵산 라이브러리를 시퀀싱하는 방법을 예시한다. 일부 실시형태에서, 합성에 의한 시퀀싱은 고체 지지체 상에 배열된 복수의 서로 다른 표적 폴리뉴클레오티드로 수행될 수 있다. 예를 들어, 복수의 표적 폴리뉴클레오티드는 링커 분자를 통해 고체 지지체에 고정되거나 고체 지지체에 부착될 수 있는 입자들에 부착될 수 있다. 일부 실시형태에서, 합성에 의한 시퀀싱은 시퀀싱을 위해 복수의 서로 다른 표적 폴리뉴클레오티드 분자들의 라이브러리가 로딩된 플로우 셀을 이용할 수 있다. 예를 들어, 플로우 셀은 시퀀싱을 위한 수백만 개의 표적 폴리뉴클레오티드 분자를 포함할 수 있다. 일부 실시형태에서, 핵산 시퀀싱 라이브러리는 gDNA 샘플을 단편화하고 생성된 단편의 말단에 어댑터를 결찰하여 준비될 수 있다. 그런 다음 이러한 라이브러리를 플로우 셀에 로딩하고 단편들이 플로우 셀 표면에 혼성화될 수 있다. 일부 실시형태에서, 각 결합된 단편은 브릿지 증폭을 통해 클론 클러스터로 증폭될 수 있다. 고체 지지체, 플로우 셀, 및 시퀀싱 라이브러리의 제조는 미국 공개공보 제2010/00111768호; 및 PCT 공개공보 제 WO/2019/126040, WO/2018/119053, 및 WO/2018/119101호에 기재되어 있으며, 이들 문헌의 내용은 그 전문이 본원에 참고로 포함된다.
핵산 라이브러리가 준비되고 고체 지지체 상에 배열된 후, 4개의 서로 다른 뉴클레오티드 중 하나가 고체 지지체 상에 존재하는 각각의 상보적 신생 핵산 복제 가닥에 혼입되고(단계 101), 이때 4개의 서로 다른 뉴클레오티드 각각은 (i) 3'-하이드록실 보호기, 및 (ii) 절단성 링커를 통해 핵염기에 커플링된 반응기를 포함하고, 이때 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 반응기를 포함한다. 일부 실시형태에서, 뉴클레오티드는 화학식 (IA)의 4개의 서로 다른 뉴클레오티드의 풀을 도입함으로써 플로우 셀에 혼입되며, 이때 4개의 서로 다른 뉴클레오티드 각각은 서로 다른 핵염기 (예를 들어, A, G, C, T/ U) 및 다른 Z1 모이어티를 포함한다. 일부 실시형태에서, 4개의 서로 다른 뉴클레오티드 중 첫 번째는 화학식 (IC)의 구조를 가지고; 4개의 서로 다른 뉴클레오티드 중 두 번째는 화학식 (ID)의 구조를 가지고; 4개의 서로 다른 뉴클레오티드 중 세 번째는 화학식 (IE)의 구조를 가지고; 그리고 4개의 서로 다른 뉴클레오티드 중 네 번째는 화학식 (IF)의 구조를 가지며, 단, 반응기 Z1A, Z1B, Z1C , 및 Z1D는 각각 상이하다. 일부 실시형태에서, 반응기 Z1A, Z1B, Z1C , 및 Z1D 각각은 서로 다른 올리고뉴클레오티드 서열을 포함할 수 있다.
각각의 신생 핵산 복제 가닥이 4개의 서로 다른 뉴클레오티드 중 하나로 연장된 후 (단계 101), 뉴클레오티드-접합체 복합체의 서로 다른 서브세트들이 순차적으로 형성되고 (단계 102), 이때 순차적으로 형성된 뉴클레오티드-접합체 복합체들의 각각의 서로 다른 서브세트 내 각각의 뉴클레오티드-접합체 복합체는 신생 핵산 복제 가닥들에 혼입된 서로 다른 뉴클레오티드들 중 단 하나로부터 유래된다 (예를 들어, 뉴클레오티드-접합체 복합체들은 신생 핵산에 혼입된다). 일부 실시형태에서, 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트들을 순차적으로 형성하는 단계는 3회 수행된다. 다른 실시형태에서, 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트들을 순차적으로 형성하는 단계는 4회 수행된다.
일부 실시형태에서, 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트들의 순차적 형성 (단계 102)는 다음 단계들을 포함한다: 검출가능한 표지를 포함하고 상보적 신생 핵산 복제 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 단 하나와만 직교 반응성인 접합체를 도입하는 단계(단계 110); 각각의 도입된 접합체의 표지를 검출함으로써 서브세트 내 각각의 뉴클레오티드-접합체 복합체의 형성을 검출하는 단계(단계 111); 고체 지지체 내부에서 상기 서브세트 내 각각의 검출된 뉴클레오티드-접합체 복합체의 위치를 결정하는 단계 (단계 112); 그리고 상기 서브세트 내 형성된 검출가능한 뉴클레오티드-접합체 복합체 각각으로부터 적어도 검출가능한 표지를 선택적으로 절단하는 단계 (단계 113). 일부 실시형태에서, 각각의 도입된 접합체는 혼입된 뉴클레오티드들 중 하나에 커플링된 올리고뉴클레오티드 서열에 상보적인 올리고뉴클레오티드 서열을 포함하는 반응기를 포함한다.
당업자는 상기 과정이 고체 지지체 상의 복수의 표적 폴리뉴클레오티드 분자들에 상보적인 신생 핵산 복제 가닥들의 1회 연장을 위한 것임을 이해할 것이다. 이어서, 이 과정은 고체 지지체 상의 복수의 표적 폴리뉴클레오티드 분자들에 상보적인 신생 핵산 복제 가닥들의 각각의 반복적 연장에서 반복될 수 있다. 상보적 신생 핵산 복제 가닥이 추가로 연장되기 전에(즉, 다른 주기가 수행되기 전에), 3'-하이드록실 보호기는 단계 101에서 혼입된 4개의 서로 다른 뉴클레오티드로부터 절단되어야 한다(단계 103). 또한, 검출가능한 표지가 아직 절단되어 있지 않은 경우, 검출가능한 표지는 다음 연장 이전에 절단되어야 한다. 일부 실시형태에서, 검출가능한 표지 및 3'-하이드록실 보호기는 동시에 그리고 동일한 시약을 사용하여 절단된다. 일부 실시형태에서, 뉴클레오티드-접합체 복합체의 서로 다른 서브세트의 순차적 형성 및 검출은 각각의 반복적 연장 동안 각각의 신생 핵산 가닥에 혼입된 각 뉴클레오티드의 결정을 용이하게 한다.
도 2A 및 2B는 고체 지지체 상에 배열된 복수의 서로 다른 표적 폴리뉴클레오티드 분자들과 같은 복수의 서로 다른 표적 폴리뉴클레오티드 분자를 시퀀싱하는 본원에 개시된 방법을 추가로 예시하며, 이때 이 방법은 혼입된 서로 다른 뉴클레오티드들을 표지를 갖는 서로 다른 접합체로 순차적으로 표지하는 단계를 포함한다. 일부 실시형태에서, 고체 지지체는 시퀀싱할 핵산 라이브러리가 로딩된 플로우 셀이다. 일부 실시형태에서, 4개의 서로 다른 뉴클레오티드 중 하나가 고체 지지체 상에 존재하는 각각의 신생 핵산 복제 가닥에 먼저 혼입되고(단계 201), 이때 4개의 서로 다른 뉴클레오티드 각각은 (i) 3'-하이드록실 보호기, 및 (ii) 절단성 링커를 통해 핵염기에 커플링된 반응기를 포함하고, 이때 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 반응기를 포함한다. 일부 실시형태에서, 뉴클레오티드는 화학식 (IA) 또는 (IB)의 4개의 서로 다른 뉴클레오티드의 풀을 도입함으로써 플로우 셀에 혼입되며, 이때 4개의 서로 다른 뉴클레오티드 각각은 서로 다른 핵염기 (예를 들어, A, G, C, T/ U) 및 다른 Z1 모이어티를 포함한다.
일부 실시형태에서, 4개의 서로 다른 뉴클레오티드 중 첫 번째는 화학식 (IC)의 구조를 가지고; 4개의 서로 다른 뉴클레오티드 중 두 번째는 화학식 (ID)의 구조를 가지고; 4개의 서로 다른 뉴클레오티드 중 세 번째는 화학식 (IE)의 구조를 가지고; 그리고 4개의 서로 다른 뉴클레오티드 중 네 번째는 화학식 (IF)의 구조를 가지며, 단, 반응기 Z1A, Z1B, Z1C , 및 Z1D는 각각 상이하다. 일부 실시형태에서, 각각의 Z1A, Z1B, Z1C , 및 Z1D기는 서로 다른 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, 각각의 Z1A, Z1B, Z1C , 및 Z1D기는 서로 다른 LNA-변형된 올리고뉴클레오티드를 포함한다. 일부 실시형태에서, Z1A, Z1B, Z1C , 및 Z1D기들 중 어느 하나의 서로 다른 LNA-변형된 올리고뉴클레오티드는 서열 번호: 1 내지 22 또는 서열 번호: 29 내지 50 중 어느 하나의 서열을 가지며 이의 베타-L-배열로 이용된다.
각각의 신생 핵산 가닥들에 혼입된 4개의 서로 다른 뉴클레오티드 중 적어도 3개가 순차적으로 표지된다 (단계 202). 일부 실시형태에서, 각각의 신생 핵산 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 적어도 3개는 3개의 서로 다른 접합체, 예컨대 화학식 (IIA) 내지 (IIE) 중 어느 하나를 갖는 3개의 서로 다른 접합체를 순차적으로 도입함으로써 순차적으로 표지된다. 일부 실시형태에서, 각각의 신생 핵산 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 4개 모두는 4개의 서로 다른 접합체, 예컨대, 화학식 (IIA) 내지 (IIE) 중 어느 하나를 갖는 4개의 서로 다른 접합체를 순차적으로 도입함으로써 순차적으로 표지된다. 일부 실시형태에서, 화학식 (IIA) 내지 (IIE) 중 어느 하나의 서로 다른 도입된 접합체 각각은 4개의 서로 다른 혼입된 뉴클레오티드들 중 단 하나와만 직교로 반응한다. 일부 실시형태에서, 화학식 (IIA) 내지 (IIE) 중 어느 하나의 접합체들 각각은 올리고뉴클레오티드를 포함하는 반응성 모이어티를 가진다. 일부 실시형태에서, 화학식 (IIA) 내지 (IIE) 중 어느 하나의 접합체들 각각은 LNA-변형된 올리고뉴클레오티드를 포함하는 반응성 모이어티를 가진다. 일부 실시형태에서, 도입된 접합체의 서로 다른 LNA-변형된 올리고뉴클레오티드는 서열 번호: 29 내지 50 또는 서열 번호: 1 내지 22 중 어느 하나의 서열을 가지며, 다만, 하나의 접합체에 대해 선택된 임의의 LNA-변형된 올리고뉴클레오티드 서열은 혼입된 뉴클레오티드의 LNA-변형된 올리고뉴클레오티드 서열들 중 하나에 상보적이다.
예를 들어, Z1A가 서열 번호: 6을 가지는 올리고뉴클레오티드를 포함하는 경우, 접합체는 서열 번호: 34를 가지는 상보적 올리고뉴클레오티드를 포함할 것이다. 또 다른 예로서, Z1B가 서열 번호: 19를 가지는 올리고뉴클레오티드를 포함하는 경우, 접합체는 서열 번호: 47을 가지는 상보적 올리고뉴클레오티드를 포함할 것이다. 예를 들어, Z1C가 서열 번호: 4를 가지는 올리고뉴클레오티드를 포함하는 경우, 접합체는 서열 번호: 32를 가지는 상보적 올리고뉴클레오티드를 포함할 것이다. 예를 들어, Z1D가 서열 번호: 31을 가지는 올리고뉴클레오티드를 포함하는 경우, 접합체는 서열 번호: 3을 가지는 상보적 올리고뉴클레오티드를 포함할 것이다. 일부 실시형태에서, 각각의 접합체는 동일한 검출가능한 표지(예를 들어, 동일한 자성 나노입자)를 포함한다. 다른 실시형태에서, 접합체 중 적어도 하나는 다른 접합체에 커플링된 검출가능한 표지와 서로 다른 검출가능한 표지를 포함한다.
이러한 방식으로, 뉴클레오티드-접합체 복합체들 (예를 들어, 화학식 (III)을 가지는 것들)의 서로 다른 서브세트들은 표지화 과정을 통해 순차적으로 형성되고 독립적으로 검출된다. 서로 다른 접합체의 순차적 추가 및 이의 서로 다른 혼입된 뉴클레오티드와의 직교 반응성을 감안할 때, 서로 다른 혼입된 뉴클레오티드의 순차적 표지화는 고체 지지체 또는 플로우 셀 내부에서 신생 핵산 복제 가닥들에 혼입된 서로 다른 뉴클레오티드들의 위치를 순차적으로 결정할 수 있게 한다.
도 2B를 참조하면, 일부 실시형태에서, 각각의 순차적 표지화(단계 202)는 다음 단계들을 포함한다: 검출가능한 표지를 포함하고 상보적 핵산 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 단 하나와만 직교 반응성인 접합체를 도입하여 하나 이상의 표지된 뉴클레오티드를 제공하는 단계(단계 210); 하나 이상의 표지된 뉴클레오티드의 표지를 검출하는 단계(단계 211); 검출된 표지에 기초하여, 고체 지지체 또는 플로우 셀에서 하나 이상의 표지된 뉴클레오티드의 위치를 확인하는 단계(단계 212); 및 적어도 하나의 표지된 뉴클레오티드로부터 적어도 검출가능한 표지를 선택적으로 절단하는 단계(단계 213). 일부 실시형태에서, 순차적 표지화 단계(단계 202)는 (예를 들어, 검출가능하고 표지된 혼입된 뉴클레오티드의 3개의 서로 다른 세트를 형성하기 위해) 3개의 서로 다른 접합체로 3회 수행된다. 다른 실시형태에서, 순차적 표지화 단계(단계 202)는 (예를 들어, 검출가능하고 표지된 혼입된 뉴클레오티드의 4개의 서로 다른 세트를 형성하기 위해) 4개의 서로 다른 접합체로 4회 수행된다.
당업자는 상기 과정(단계 201 및 202)이 고체 지지체 상의 또는 플로우 셀 내부의 복수의 표적 폴리뉴클레오티드 분자들에 상보적인 신생 핵산 복제 가닥들의 1회 연장을 위한 것임을 이해할 것이다. 이어서, 이 과정은 고체 지지체 상의 복수의 표적 폴리뉴클레오티드 분자들에 상보적인 신생 핵산 복제 가닥들의 각각의 반복적 연장에서 반복될 수 있다. 상보적 신생 핵산 복제 가닥이 추가로 연장되기 전에(즉, 다른 주기가 수행되기 전에), 3'-하이드록실 보호기는 단계 201에서 혼입된 4개의 서로 다른 뉴클레오티드로부터 절단되어야 한다(단계 203). 또한, 아직 절단되어 있지 않은 임의의 나머지 검출가능한 표지는 다음 연장 이전에 제거되어야 한다. 일부 실시형태에서, 3'-하이드록실 보호기 및 검출가능한 표지는 동일한 시약의 도입을 통해 제거된다.
도 3을 참조하면, 일부 실시형태에서, 본 발명은 고체 지지체 상의 복수의 서로 다른 표적 폴리뉴클레오티드 분자를 시퀀싱하는 방법을 제공한다. 일부 실시형태에서, 이 방법은 (i) 4개의 서로 다른 뉴클레오티드 중 하나를 복수의 표적 폴리뉴클레오티드 각각에 상보적인 핵산 가닥들에 혼입시키는 단계, 이때 4개의 서로 다른 뉴클레오티드 각각은 절단성 링커를 통해 핵염기에 커플링된 반응기 및 3'-하이드록실 보호기를 포함하고, 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 반응기를 포함한다 (단계 301). 일부 실시형태에서, 상기 4개의 서로 다른 뉴클레오티드는 화학식 (IA) 또는 (IB) 중 어느 하나에 제공된 구조를 가진다.
후속적으로, 이 방법은 (ii) 검출가능한 표지를 갖는 제1 접합체를 도입함으로써 상기 4개의 서로 다른 혼입된 뉴클레오티드 중 첫 번째를 표지하는 단계를 포함하고, 제1 접합체는 상기 4개의 서로 다른 혼입된 뉴클레오티드 중 첫 번째와 직교 반응성이다(단계 310). 일부 실시형태에서, 제1 접합체는 화학식 (IIA) 내지 (IIE)의 어느 하나의 접합체 구조를 갖는다. 도 3에 도시된 바와 같이, 상기 4개의 서로 다른 뉴클레오티드 중 첫 번째는 아데닌 핵염기를 포함하고, 따라서 제1 접합체는 아데닌 뉴클레오티드가 혼입된 것들에만 반응성이다. 일부 실시형태에서, 제1 접합체를 도입하면 검출가능한 제1 뉴클레오티드-접합체 복합체가 형성된다.
다음으로, 이 방법은 (iii) 상기 4개의 서로 다른 뉴클레오티드 중 첫 번째의 표지를 검출함으로써 고체 지지체 내부에서 상기 4개의 서로 다른 뉴클레오티드 중 첫 번째가 혼입된 상보적 핵산 가닥들의 위치를 결정하는 단계를 포함한다 (단계 311). 이어서, 이 방법은 (iv) 4개의 서로 다른 혼입된 뉴클레오티드들 중 첫 번째로부터 검출가능한 표지를 선택적으로 절단하는 단계 (단계 312)를 포함한다. 이어서, 이 과정은 적어도 2개 또는 그 이상의 서로 다른 혼입된 뉴클레오티드들, 예를 들어, 단계 301에서 혼입된 뉴클레오티드들에 대해 반복된다.
일부 실시형태에서, 이 방법은 (v) 검출가능한 표지를 갖는 제2 접합체를 도입함으로써 4개의 서로 다른 혼입된 뉴클레오티드 중 두 번째를 표지하는 단계를 포함하고, 제2 접합체는 4개의 서로 다른 혼입된 뉴클레오티드 중 두 번째와 직교 반응성이다(단계 320). 일부 실시형태에서, 제2 접합체는 화학식 (IIA) 내지 (IIE)의 어느 하나의 접합체 구조를 갖는다. 도 3에 도시된 바와 같이, 4개의 서로 다른 뉴클레오티드 중 두 번째는 구아닌 핵염기를 포함하고, 따라서 제2 접합체는 구아닌 뉴클레오티드가 혼입된 것들에만 반응성이다. 일부 실시형태에서, 제2 접합체를 도입하면 검출가능한 제2 뉴클레오티드-접합체 복합체가 형성된다.
다음으로, 이 방법은 (vi) 4개의 서로 다른 뉴클레오티드 중 두 번째의 표지를 검출함으로써 고체 지지체 내부에서 4개의 서로 다른 뉴클레오티드 중 두 번째가 혼입된 상보적 핵산 가닥의 위치를 결정하는 단계를 포함한다(단계 321). 이어서, 이 방법은 (vii) 4개의 서로 다른 혼입된 뉴클레오티드들 중 두 번째로부터 검출가능한 표지를 선택적으로 절단하는 단계 (단계 322)를 포함한다.
일부 실시형태에서, 이 방법은 (viii) 검출가능한 표지를 갖는 제3 접합체를 도입함으로써 4개의 서로 다른 혼입된 뉴클레오티드 중 세 번째를 표지하는 단계를 추가로 포함하고, 제3 접합체는 4개의 서로 다른 혼입된 뉴클레오티드 중 세 번째와 직교 반응성이다(단계 330). 일부 실시형태에서, 제3 접합체는 화학식 (IIA) 내지 (IIE)의 어느 하나의 접합체 구조를 갖는다. 도 3에 도시된 바와 같이, 4개의 서로 다른 뉴클레오티드 중 세 번째는 사이토신 핵염기를 포함하고, 따라서 제3 접합체는 사이토신 뉴클레오티드가 혼입된 것들에만 반응성이다. 일부 실시형태에서, 제3 접합체를 도입하면 검출가능한 제3 뉴클레오티드-접합체 복합체가 형성된다.
다음으로, 이 방법은 (ix) 4개의 서로 다른 뉴클레오티드 중 세 번째의 표지를 검출함으로써 고체 지지체 내부에서 4개의 서로 다른 뉴클레오티드 중 세 번째가 혼입되어 있는 상보적 핵산 가닥의 위치를 결정하는 단계를 포함한다(단계 331). 일부 실시형태에서, 이 방법은 (x) 4개의 서로 다른 혼입된 뉴클레오티드들 중 세 번째로부터 검출가능한 표지를 선택적으로 절단하는 단계 (단계 332)를 추가로 포함한다.
일부 실시형태에서, 고체 지지체 내부에서 상기 4개의 서로 다른 뉴클레오티드 중 네 번째가 혼입되어 있는 상보적 핵산 가닥의 위치는 추론에 의해 결정된다. 예를 들어, 첫 번째, 두 번째 및 세 번째 혼입된 뉴클레오티드의 위치를 (예를 들어, 상기 열거된 단계를 통해) 알면, 네 번째 혼입된 뉴클레오티드의 위치는 아직 검출되지 않았던 위치들을 확인하여 결정할 수 있다.
일부 실시형태에서, 이 방법은 (xi) 검출가능한 표지를 갖는 제4 접합체를 도입함으로써 4개의 서로 다른 혼입된 뉴클레오티드 중 네 번째를 표지하는 단계를 포함하고, 제4 접합체는 4개의 서로 다른 혼입된 뉴클레오티드 중 네 번째와 직교 반응성이다(단계 340). 일부 실시형태에서, 제4 접합체는 화학식 (IIA) 내지 (IIE)의 어느 하나의 접합체 구조를 갖는다. 도 3에 도시된 바와 같이, 4개의 서로 다른 뉴클레오티드 중 네 번째는 티민 또는 우라실 핵염기를 포함하고, 따라서 제4 접합체는 티민 또는 우라실 뉴클레오티드가 혼입된 것들에만 반응성이다. 일부 실시형태에서, 제4 접합체를 도입하면 검출가능한 제4 뉴클레오티드-접합체 복합체가 형성된다. 일부 실시형태에서, 이 방법은 다음으로 (xii) 4개의 서로 다른 뉴클레오티드 중 네 번째의 표지를 검출함으로써 고체 지지체 내부에서 4개의 서로 다른 뉴클레오티드 중 네 번째가 혼입되어 있는 상보적 핵산 가닥의 위치를 결정하는 단계를 포함한다(단계 341). 일부 실시형태에서, 이후 검출가능한 표지들은 선택적으로 절단될 수 있다 (단계 342).
일부 실시형태에서, 상기 방법은 상기 혼입된 뉴클레오티드들 각각으로부터 3'-하이드록실 보호기를 제거하는 단계 (단계 302), 예를 들어, 단계 (i)에서 혼입된 뉴클레오티드들 모두로부터 3'-하이드록실 보호기를 제거하는 단계를 추가로 포함한다 (단계 302 참조). 일부 실시형태에서, 상기 방법은 또한 아직 절단되지 않은 나머지 검출가능한 표지를 제거하는 단계를 포함한다. 다른 실시형태에서, 임의의 나머지 검출가능한 표지는 3'-하이드록실 보호기와 동시에 제거된다. 일부 실시형태에서, 적어도 단계 (i) 내지 (ix)가, 예를 들어, 각 주기 동안 반복된다. 다른 실시형태에서, 적어도 단계 (i) 내지 (x)가, 예를 들어, 각 주기 동안 반복된다. 다른 실시형태에서, 단계 (i) 내지 (xii)가 반복된다.
도 4A는 핵산 복제 가닥의 연장 동안 혼입된 4개의 서로 다른 뉴클레오티드의 순차적인 확인을 예시한다. 특히, 도 4A는 핵산 복제 가닥 연장 동안 혼입된 4개의 서로 다른 뉴클레오티드 중 적어도 3개의 순차적인 표지화 및 검출을 예시한다. 일부 실시형태에서, 4개의 서로 다른 혼입된 뉴클레오티드 중 적어도 3개의 순차적 표지화는 적어도 3개의 서로 다른 뉴클레오티드-접합체 복합체의 형성을 제공하며, 이때 형성된 서로 다른 뉴클레오티드-접합체 복합체 각각은 서로 다른 혼입된 뉴클레오티드로부터 유래된다.
일부 실시형태에서, 그리고 도 4A의 패널 A를 참조하면, 4개의 서로 다른 뉴클레오티드들(예를 들어, 화학식 (IA)의 것들)의 풀이 먼저 플로우 셀에 첨가된다. 패널 A에 도시된 바와 같이, 이들 4개의 서로 다른 뉴클레오티드 각각은 4개의 서로 다른 신생 핵산 가닥(“가닥 1”, “가닥 2”, “가닥 3”, 및 “가닥 4”로 표지됨) 중 하나에 혼입된다. 패널 A에 추가로 도시된 바와 같이, 4개의 혼입된 뉴클레오티드 각각은 도입된 접합체 (예를 들어, 화학식 (IIA)를 가지는 것들)의 서로 다른 Z2 모이어티 (Z2A, Z2B, Z2C, Z2D)와 직교 “반응” 가능한 서로 다른 Z1 모이어티 (Z1A, Z1B, Z1C, Z1D)를 포함한다. 추가적으로, 4개의 서로 다른 혼입된 뉴클레오티드 각각은 서로 다른 핵염기, 여기서 A, G, C, 및 T를 포함한다. 이러한 특정 예에서, 뉴클레오티드의 Z1A 모이어티는 접합체의 Z2A 모이어이티와 반응성이고; 뉴클레오티드의 Z1B 모이어티는 접합체의 Z2B 모이어티와 반응성이고; 뉴클레오티드의 Z1C 모이어티는 접합체의 Z2C 모이어티와 반응성이고; 그리고 뉴클레오티드의 Z1D 모이어티는 접합체의 Z2D 모이어티와 반응성이다.
이어서, 제1 접합체 (예를 들어, 화학식 (IIA)의 제1 접합체)는, 본 예에서, Z2B 모이어티를 포함하는 제1 접합체인 플로우 셀에 도입될 수 있다. 제1 접합체의 Z2B 모이어티는 가닥 2에 혼입된 제1 뉴클레오티드의 Z1B 모이어티와만 반응성이라는 점을 감안할 때, 가닥 2에 혼입된 제1 뉴클레오티드만 표지된다 (도 4A의 패널 B에서 “별표” 참조). 달리 말하면, 검출가능한 제1 뉴클레오티드-접합체 복합체가 형성되고, 여기서 제1 뉴클레오티드-접합체 복합체는 구아닌 핵염기 및 Z1B 모이어티를 갖는 제1 혼입된 뉴클레오티드에 상응한다. 이어서 이러한 제1 표지된 뉴클레오티드 (또는 제1 뉴클레오티드-접합체 복합체)가 검출되어, 가닥 2에 혼입된 뉴클레오티드를 결정할 수 있다. 일부 실시형태에서,제1 혼입된 뉴클레오티드가 표지된 후 (또는 제1 뉴클레오티드-접합체 복합체가 형성된 후), 검출가능한 표지는 제1 혼입된 뉴클레오티드 (또는 제1 뉴클레오티드-접합체 복합체)로부터 선택적으로 절단된다.
그런 다음 이 과정을 반복하여 연장하는 동안 혼입된 다른 뉴클레오티드 중 적어도 2개가 순차적으로 표지된다. 예를 들어, 제2 접합체 (예를 들어, 화학식 (IIA)의 제2 접합체)는, 본 예에서, Z2D 모이어티를 포함하는 제2 접합체인 플로우 셀에 도입될 수 있다. 제2 접합체의 Z2D 모이어티는 가닥 4에 혼입된 제2 뉴클레오티드의 Z1D 모이어티와만 반응성이라는 점을 감안할 때, 가닥 4에 혼입된 제2 뉴클레오티드만 표지된다 (도 4A의 패널 C에서 “별표” 참조). 달리 말하면, 검출가능한 제2 뉴클레오티드-접합체 복합체가 형성되고, 여기서 제2 뉴클레오티드-접합체 복합체는 티민 핵염기 및 Z1D 모이어티를 갖는 화학식 (IA)의 혼입된 뉴클레오티드에 상응한다. 이어서 이러한 제2 표지된 뉴클레오티드 (또는 제2 뉴클레오티드-접합체 복합체)가 검출될 수 있으며, 가닥 4에 혼입된 뉴클레오티드를 결정할 수 있다. 일부 실시형태에서, 검출가능한 표지는 제2 혼입된 뉴클레오티드의 표지가 검출된 후 제2 혼입된 뉴클레오티드로부터 선택적으로 절단된다.
일부 실시형태에서, 제3 접합체 (예를 들어, 화학식 (IIA)의 제3 접합체)는, 본 예에서, Z2C 모이어티를 포함하는 제3 접합체인 플로우 셀에 도입될 수 있다. 제3 접합체의 Z2C 모이어티는 가닥 3에 혼입된 제3 뉴클레오티드의 Z1C 모이어티와만 반응성이라는 점을 감안할 때, 가닥 3에 혼입된 제3 뉴클레오티드만 표지된다 (도 4A의 패널 D에서 “별표” 참조). 달리 말하면, 검출가능한 제3 뉴클레오티드-접합체 복합체가 형성되고, 여기서 제3 뉴클레오티드-접합체 복합체는 사이토신 핵염기 및 Z1C 모이어티를 갖는 제3 혼입된 뉴클레오티드에 상응한다. 이어서 이러한 제3 표지된 뉴클레오티드가 검출될 수 있으며, 가닥 3에 혼입된 뉴클레오티드를 결정할 수 있다. 일부 실시형태에서, 검출가능한 표지는 이후 제3 혼입된 뉴클레오티드의 표지가 검출된 후 제3 혼입된 뉴클레오티드로부터 선택적으로 절단된다. 일부 실시형태에서, 이 과정은 가닥 1에 혼입된 제4 뉴클레오티드를 표지하고 검출하기 위해 네 번째로 수행된다 (도 4A의 패널 E 참조, 이때 “별표”는 혼입된 아데닌 뉴클레오티드의 표지화를 나타낸다). 다른 실시형태에서, 가닥 1에 혼입된 뉴클레오티드는 추론을 통해 검출할 수 있다. 일부 실시형태에서, 검출가능한 표지는 각 검출 후에 절단되지 않고, 그 보다는 다음 연장 전에 3'-하이드록실 보호기가 제거됨과 동시에 절단된다.
각각의 신생 핵산 복제 가닥 내 혼입된 뉴클레오티드들 모두가 확인되면, 화학식 (IA)의 혼입된 뉴클레오티드들에 존재하는 3'-하이드록실 보호기는 제거될 수 있으며, 그리하여 각각의 신생 핵산 복제 가닥은 추가로 연장될 수 있다. 모든 3'-하이드록실 보호기의 제거 후, 4개의 서로 다른 뉴클레오티드의 풀을 후속적으로 추가하여 각각의 신생 핵산 복제 가닥을 추가로 연장할 수 있다. 다시 한 번, 4개의 추가된 뉴클레오티드 각각은 서로 다른 핵염기 및 도입된 접합체 (예를 들어, 화학식 (IIA)를 가지는 것들)의 서로 다른 Z2 모이어티 (Z2A, Z2B, Z2C, Z2D)와 직교 “반응” 가능한 서로 다른 Z1 모이어티 (Z1A, Z1B, Z1C, Z1D)를 포함한다. 도 4A의 패널 F는 4개의 핵산 복제 가닥의 제2 연장, 특히 4개의 핵산 복제 가닥으로의 서로 다른 뉴클레오티드의 혼입을 예시한다. 이 예에서, 가닥 1 및 2에 혼입된 화학식 (IA)의 뉴클레오티드는 둘 다 동일한 반면, 가닥 3 및 4에 혼입된 화학식 (IA)의 뉴클레오티드는 둘 다 상이하다. 이어서, 화학식 (IIA)의 서로 다른 접합체를 순차적으로 추가할 수 있다(예를 들어, 상기 기재된 바와 동일한 순서로). 이 과정은 복수의 핵산 복제 가닥 연장 주기 동안 반복될 수 있다.
본 발명의 합성에 의한 시퀀싱 방법은 도 4B를 참조하여 추가로 예시되며, 이는 뉴클레오티드-접합체 복합체(예를 들어, 화학식 (III)을 갖는 뉴클레오티드-접합체 복합체)의 서로 다른 서브세트의 순차적 형성 및 검출을 예시한다. 도 4A는 서로 다른 혼입된 뉴클레오티드들 (예를 들어, 화학식 (IA)의 것들)의 4개의 서로 다른 신생 핵산 가닥들로의 순차적 표지화 및 검출을 예시하는 반면, B는 이러한 개념을 확장시켜 병렬 시퀀싱에서 본 발명의 유용성을 예시한다. 특히, 도 4B는 화학식 (IA)의 서로 다른 혼입된 뉴클레오티드를 갖는 핵산 복제 가닥들의 서로 다른 집단들이 순차적으로 표지되고 검출될 수 있도록 하는 화학식 (IIA)의 서로 다른 접합체의 순차적 도입을 예시한다.
도 4B의 패널 A를 보면, 화학식 (IA) 또는 (IB) 중 어느 하나의 4개의 서로 다른 뉴클레오티드의 풀이 혼합물로 플로우 셀(400)에 도입된다고 가정하고, 이때 화학식 (IA)의 4개의 서로 다른 뉴클레오티드 각각은 서로 다른 핵염기 (예를 들어, A, G, C, T)와 서로 다른 모이어티 Z1을 가진다. 이때, 플로우 셀(400)에 제공된 화학식 (IA) 또는 (IB) 중 어느 하나의 4개의 서로 다른 뉴클레오티드 각각은 각각의 개별 신생 핵산 가닥에서 제1 염기로서 독립적으로 혼입된다. 이 예에서 화학식 (IA) 또는 (IB)의 4개의 서로 다른 뉴클레오티드의 혼입은 각각의 신생 핵산 가닥의 첫 번째 연장을 나타낸다.
첫 번째 연장에 이어, 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제1 접합체가 플로우 셀(400)에 추가되고, 이때 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제1 접합체는 모이어티 Z2를 포함하고, 이러한 모이어티는 신생 핵산에 혼입된 4개의 서로 다른 뉴클레오티드 중 첫 번째에만 반응성이다. 예를 들어, 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제1 접합체는 Z1B 모이어티를 갖는 화학식 (IA)의 혼입된 뉴클레오티드와만 반응성인 Z2B 모이어티를 포함할 수 있다. 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제1 접합체를 도입하면 화학식 (III)의 검출가능한 뉴클레오티드-접합체 복합체의 제1 서브세트(예를 들어, 신생 핵산에 혼입된 뉴클레오티드-접합체 복합체의 제1 서브세트)가 형성된다. 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제1 접합체의 직교 반응성을 고려할 때, 검출가능한 뉴클레오티드-접합체 복합체의 제1 서브세트에서 형성된 검출가능한 제1 뉴클레오티드-접합체 복합체 각각은 신생 핵산 가닥들에 혼입된 화학식 (IA) 또는 (IB) 중 어느 하나의 뉴클레오티드 중 단 하나로부터만 유래한다. 뉴클레오티드-접합체 복합체의 제1 서브세트 내에서 형성된 하나 이상의 제1 뉴클레오티드-접합체 복합체의 표지를 검출함으로써, 플로우 셀(400) 내부에서 4개의 서로 다른 뉴클레오티드 중 첫 번째가 혼입되어 있는 핵산 복제 가닥의 위치가 결정될 수 있다 (각각은 패널 A에서 “X”로 표시됨). 일부 실시형태에서, 제1 서브세트에서 형성된 제1 검출가능한 뉴클레오티드-접합체 복합체 각각의 검출가능한 표지는 절단될 수 있다(이러한 뉴클레오티드는 더 이상 검출가능하지 않으며 따라서 도 4B의 패널 B에서 “-”로 표시됨). 이어서 이 과정을 반복할 수 있다, 예를 들어, 2회 더 반복하거나 3회 더 반복할 수 있다.
예를 들어, 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제2 접합체가 플로우 셀(400)에 추가되고, 이때 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제2 접합체는 모이어티 Z2를 포함하고, 이러한 모이어티는 신생 핵산에 혼입된 4개의 서로 다른 뉴클레오티드 중 두 번째에만 반응성이다. 예를 들어, 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제2 접합체는 Z1D 모이어티를 갖는 화학식 (IA)의 혼입된 뉴클레오티드와만 반응성인 Z2D 모이어티를 포함할 수 있다. 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제2 접합체를 도입하면 화학식 (III)의 검출가능한 뉴클레오티드-접합체 복합체의 제2 서브세트가 형성된다. 화학식 (IIA) 내지 (IIE) 중 어느 하나의 제2 접합체의 직교 반응성을 고려할 때, 검출가능한 뉴클레오티드-접합체 복합체의 제2 서브세트에서 형성된 검출가능한 제2 뉴클레오티드-접합체 복합체 각각은 신생 핵산 가닥들에 혼입된 화학식 (IA) 또는 (IB) 중 어느 하나의 뉴클레오티드 중 단 하나로부터만 유래한다. 뉴클레오티드-접합체 복합체의 제2 서브세트 내에서 형성된 하나 이상의 제2 뉴클레오티드-접합체 복합체의 표지를 검출함으로써, 플로우 셀(400) 내부에서 4개의 서로 다른 뉴클레오티드 중 두 번째가 혼입되어 있는 핵산 복제 가닥의 위치가 결정될 수 있다 (각각은 패널 B에서 “X”로 표시됨). 일부 실시형태에서, 제2 서브세트에서 형성된 제2 검출가능한 뉴클레오티드-접합체 복합체 각각의 검출가능한 표지는 절단될 수 있다(이러한 뉴클레오티드는 더 이상 검출가능하지 않으며 따라서 도 4B의 패널 C에서 “-”로 표시됨).
도 4B의 패널 C 및 D를 참조하면, 일부 실시형태에서, 상기 단계는 세 번째로 수행되고 선택적으로 네 번째로 수행되어 뉴클레오티드-접합체 복합체의 제3 서브세트(신생 핵산 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 세 번째로부터 유래됨) 및 뉴클레오티드-접합체 복합체의 제4 서브세트(신생 핵산 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 네 번째로부터 유래됨)가 순차적으로 형성되고 검출될 수 있다. 신생 핵산 복제 가닥에 혼입된 4개 염기의 위치가 모두 검출되면 나머지 검출가능한 표지가 제거된다. 또한, 화학식 (IA) 또는 (IB) 중 어느 하나의 4가지 서로 다른 혼입된 뉴클레오티드 각각의 3'-하이드록실 보호기는 플로우 셀(400)에서 개별 신생 핵산 각각의 두 번째 연장을 촉진하기 위해 제거될 수 있다.
다른 실시형태에서, 상기 과정은 (신생 핵산 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 세 번째에서 유래한) 뉴클레오티드-접합체 복합체의 제3 서브세트만이 검출될 수 있도록 세 번째에만 수행된다. 이 특정 실시형태에서, 신생 핵산 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 네 번째는 추론에 의해 결정될 수 있다. 예를 들어, 플로우 셀(400)에서 신생 핵산 복제 가닥에 혼입된 제1, 제2 및 제3 뉴클레오티드에 해당하는 검출된 표지의 위치를 알면, 신생 핵산 복제 가닥에 혼입된 제4 뉴클레오티드의 위치는 표지가 검출되지 않은 위치들을 식별하여 결정될 수 있다.
일부 실시형태에서, 복수의 표적 폴리뉴클레오티드 분자들을 시퀀싱하는 방법은 다음 단계를 포함하고: (a) 핵산 가닥을 유체 챔버 내의 근위 벽에 결합시키는 단계; (b) 1회 이상의 추가 라운드에서, (i) 연장가능한 프라이머, 및 (ii) 복수의 핵산 중합효소 분자를 유체 챔버에 추가하는 단계; (c) 4개의 서로 다른 뉴클레오티드를 유체 챔버에 추가하는 단계, 이때 4개의 서로 다른 뉴클레오티드 각각은 (i) 3'-하이드록실 보호기, 및 (ii) 절단가능한 링커를 통해 핵염기에 커플링된 반응기를 포함하고, 이때 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 반응기를 포함하고; (d) 복수의 표적 폴리뉴클레오티드 분자를 시퀀싱하는 단계, 이때 복수의 표적 폴리뉴클레오티드 분자의 시퀀싱은 뉴클레오티드-접합체 복합체의 서로 다른 서브세트를 순차적으로 형성하는 것을 포함하고, 이때 형성된 뉴클레오티드-접합체 복합체의 각각의 서로 다른 서브세트 내의 각각의 뉴클레오티드-접합체 복합체는, 유체 챔버에 도입된 그리고 복수의 표적 폴리뉴클레오티드 분자 각각에 상보적인 신생 핵산 복제 가닥에 혼입된 서로 다른 뉴클레오티드들 중 단 하나로부터 유래된다.
일부 실시형태에서, 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트들의 순차적 형성은 다음 단계들을 포함한다: 검출가능한 표지를 포함하고 상보적 신생 핵산 복제 가닥에 혼입된 4개의 서로 다른 뉴클레오티드 중 단 하나와만 직교 반응성인 접합체를 도입하는 단계; 각각의 도입된 접합체의 표지를 검출함으로써 서브세트 내 각각의 뉴클레오티드-접합체 복합체의 형성을 검출하는 단계; 고체 지지체 내부에서 상기 서브세트 내 각각의 검출된 뉴클레오티드-접합체 복합체의 위치를 결정하는 단계; 그리고 상기 서브세트 내 형성된 검출가능한 뉴클레오티드-접합체 복합체 각각으로부터 적어도 검출가능한 표지를 선택적으로 절단하는 단계.
적합한 중합효소의 일부 예에는 3'-5' 엑소뉴클레아제 활성이 결여된 B-계열(유형 B) 중합효소가 포함된다.
일부 실시형태에서, 중합효소는 열안정성 중합효소이다. 열안정성 핵산 중합효소에는 써머스 아쿠아티커스 (Thermus aquaticus) Taq DNA 중합효소, 써머스 종 (Thermus sp.) Z05 중합효소, 써머스 플라버스 (Thermus flavus) 중합효소, 써모토가 마리티마(Thermotoga maritima) 중합효소, 예를 들어, TMA-25 및 TMA-30 중합효소, Tth DNA 중합효소, 써모코커스 종 (Thermococcus Sp.) 9N (및 변이체 종결자(Therminator) DNA 중합효소 및 종결자(Therminator) II DNA 중합효소), 파이로코커스 퓨리오서스(Pyrococcus furiosus) (Pfu), 파이로코커스 워에세이(Pyrococcus woesei) (Pwo), 써마토가 마리티마(Thermatoga maritima) (Tma) 및 써모코커스 리토랄리스(Thermococcus litoralis) (Tli 또는 Vent), 이들의 돌연변이체 등이 포함된다.
일부 실시형태에서, 중합효소에는 검출가능한 5'-3' 엑소뉴클레아제 활성이 없다. 5'에서 3'으로의 뉴클레아제 활성이 실질적으로 결여된 DNA 중합효소의 예에는 대장균 DNA 중합효소 I의 Klenow 단편; N-말단 235개 아미노산이 결여된 써머스 아쿠아티커스(Thermus Aquaticus) DNA 중합효소(Taq)(“Stoffel 단편”)이 포함되며, 미국 특허 제 5,616,494호를 참조하라. 다른 예는 5'-3' 뉴클레아제 활성을 담당하는 도메인을 제거하거나 불활성화시키기 위해 충분한 결실(예를 들어, N-말단 결실), 돌연변이 또는 변형을 갖는 열안정성 DNA 중합효소를 포함한다. 예를 들어, 미국 특허 제 5,795,762를 참조하라.
일부 실시형태에서, 중합효소에는 검출가능한 3'-5' 엑소뉴클레아제 활성이 없다. 3'-5' 엑소뉴클레아제 활성이 실질적으로 결여된 DNA 중합효소의 예에는 Taq 중합효소 및 그 유도체, 교정 도메인이 자연 발생 또는 조작되어 결실된 임의의 B-계열(B형) 중합효소가 포함된다.
일부 실시형태에서, 중합효소는 3'-변형된 뉴클레오티드와 같은 뉴클레오티드 유사체의 혼입을 가능하게 하거나 향상시키도록 변형되거나 조작되었다. 예를 들어, 미국 특허 제 10,150,454, 9,677,057 및 9,273,352호를 참조하라.
일부 실시형태에서, 중합효소는 5'-포스페이트-변형된 뉴클레오티드와 같은 뉴클레오티드 유사체의 혼입을 가능하게 하거나 향상시키도록 변형되거나 조작되었다. 예를 들어, 미국 특허 제 10,167,455 및 8,999,676호를 참조하라. 일부 실시형태에서, 이러한 중합효소는 phi29 유래 중합효소이며; 예를 들어, 미국 특허 제 8,257,954 및 8,420,366호를 참조하라. 일부 실시형태에서, 이러한 중합효소는 phiCPV4 유래 중합효소이며; 예를 들어, 미국 특허 공개공보 제 US20180245147호를 참조하라.
일부 실시형태에서, 중합효소는 원하는 변형된 뉴클레오티드를 성공적으로 혼입시키거나 원하는 정확도와 진행성을 가진 뉴클레오티드 및 뉴클레오티드 유사체를 혼입하기 위해 선별에 의해 변형되거나 조작된다. 이러한 변형된 중합효소의 선별 방법들은 해당 분야에 공지이다; 예를 들어, 발명의 명칭이 “Polymerase Compositions and Methods of Making and Using Same”인 미국 특허 공개공보 제 US20180312904A1을 참조하라.
뉴클레오티드 및 접합체의 합성
본원에 기재된 뉴클레오티드 및 접합체의 합성의 예를 아래에서 제시한다.
실시예 1 - 5'-티올 변형된 β-L-LNA 올리고뉴클레오티드의 합성:
5'-티올-변형된 β-L-LNA 올리고뉴클레오티드는 표준 자동화된 고체상 DNA 합성 절차를 이용하고 포스포라미디트 화학을 적용하여 ABI 394 DNA 합성장치로 2 x 1 μmole 규모 합성에서 합성하였다. Glen UnySupport PS(Glen Research 카탈로그 번호 26-5040) 및 β-L-LNA 포스포르아미다이트 및 티올 개질제 C6 S-S(Glen Research 카탈로그 번호 10-1936)가 빌딩 블록으로 사용되었다. β-L-LNA 포스포르아미다이트는 문헌에 따라 (Bioorg. Med. Chem. Lett. 2014, 24, 2699-2702; Tetrahedron 1998, 54, 3607-3630; Synthesis 2002, 6, 802-808) β-D-LNA 포스포르아미다이트와 유사하게 합성되었으나 D-글루코스 대신 L-글루코스에서 출발하며, 상기 문헌의 내용은 그 전문이 본원에 참고로 포함된다. 모든 포스포르아미다이트는 DNA 등급 아세토니트릴에서 0.1 M의 농도에서 적용되었다. 연장된 결합 시간(180초), 연장된 산화(45초) 및 탈트리틸화 시간(85초) 뿐만 아니라 표준 합성 시약 및 용매를 포함하는 표준 DNA 주기를 이용하였다. 올리고뉴클레오티드를 DMton으로 합성하였다. 농축 암모니아에 의한 지지체로부터 LNA 올리고뉴클레오티드의 절단을 위해 표준 절단 절차를 적용하였으며, 농축 암모니아 처리(56°C에서 8시간)에 의해 잔류 보호기를 또한 절단하였다. 조 5'-다이설파이드 변형된 β-L-LNA 올리고뉴클레오티드를 증발시키고 RP HPLC(컬럼 : PRP-1, 7 μm, 250 x 21.5 mm (Hamilton, 부품 번호 79352))에 의해 0.1M 트리에틸암모늄 아세테이트 pH 7/아세토니트릴 구배를 사용하여 정제하였다. 생성물 분획을 취합하고 물에 대한 투석에 의해(MWCO 1000, SpectraPor 6, 부품 번호 132638) 탈염시켜 농축시켰다. 그 후, 이황화물은 포스페이트 완충액 중 100mM DTT pH 8.3 - 8.5로 실온에서 30분 동안 절단되었다. 그런 다음 5'-티올-변형된 올리고뉴클레오티드를 물에 대한 투석에 의해(MWCO 1000, SpectraPor 6, 부품 번호 132638) 탈염시키고 정량화하고 동결건조시켰다.
수율은 약 200 내지 400 nmol 범위였다.
5'-티올-변형된 β-L-LNA 올리고뉴클레오티드는 0,1M 트리에틸암모늄 아세트산염 pH 7/아세토니트릴 구배를 이용하여 RP18 HPLC(Chromolith RP18e, Merck 부품 번호 1.02129.0001)에 의해 분석하였다. 일반적인 순도는 > 90%이다. 5'-티올-변형된 β-L-LNA 올리고뉴클레오티드의 식별은 LC-MS 분석에 의해 확인하였다.
5'-HS-헥실-β-LNA(TATCGC)-3' (서열 번호: 19)
5'-HS-헥실-β-LNA(TCTTCC)-3' (서열 번호: 6)
5'-HS-헥실-β-LNA(CTGTCA)-3' (서열 번호: 4)
5'-HS-헥실-β-LNA(ACCAAC)-3' (서열 번호: 31)
실시예 2 - 5'-아미노-변형된 β-L-LNA 올리고뉴클레오티드의 합성
5'-아미노-변형된 β-L-LNA 올리고뉴클레오티드는 표준 자동화된 고체상 DNA 합성 절차를 이용하고 포스포르아미다이트 화학을 적용하여 ABI 394 DNA 합성장치로 2 x 1 μmole 규모 합성에서 합성되었다. Glen UnySupport PS(Glen Research 카탈로그 번호 26-5040) 및 β-L-LNA 포스포르아미다이트(발명의 명칭이 “Hybridizing all-LNA nucleotides”인, 2019년 6월 7일에 출원된 유럽 특허 출원 제 19179046.8 참조, 이는 그 전문이 본원에 참조로 포함됨) 뿐만 아니라 스페이서 포스포르아미다이트 18(Sp18)(Glen Research 카탈로그 번호 10-1918) 및 5'-아미노-개질제 C6 포스포르아미다이트(Glen Research 카탈로그 번호 10-1906)는 빌딩 블록으로 사용된다. 모든 포스포르아미다이트는 DNA 등급 아세토니트릴에서 0.1 M의 농도로 적용되었다. MMTon에서 합성된 5'-아미노-변형 β-L-LNA 올리고뉴클레오티드의 조립을 위해 연장된 커플링 시간(240초) 및 연장된 산화(45초)를 사용하는 표준 DNA 주기, 뿐만 아니라 표준 합성 시약 및 용매를 사용하였다. 지지체로부터 LNA 올리고뉴클레오티드를 농축 암모니아에 의해 절단하기 위해 표준 절단 절차를 적용하였으며, 농축 암모니아 처리(56°C에서 8시간)에 의해 잔류 보호기를 또한 절단하였다. 조 5'-변형된 β-L-LNA 올리고뉴클레오티드를 증발시키고 RP HPLC(컬럼 : PRP-1, 12-20 μm, 250 x 30 mm (Hamilton, 부품 번호 79352))에 의해 0.1M 트리에틸암모늄 아세테이트 pH 7/아세토니트릴 구배를 사용하여 정제하였다. 생성물 분획을 취합하고 물에 대한 투석에 의해(MWCO 1000, SpectraPor 6, 부품 번호 132638) 탈염시킴으로써, MMTon 정제된 올리고뉴클레오티드의 MMT 기를 또한 절단하였다. 마지막으로, 5'-아미노-변형된 올리고뉴클레오티드들을 정량하고 동결건조시켰다.
일반적인 수율: ca. 300 내지 400 nmol.
5'-아미노-변형된 β-L-LNA 올리고뉴클레오티드는 0,1M 트리에틸암모늄 아세트산염 pH 7/아세토니트릴 구배를 이용하여 RP18 HPLC(Chromolith RP18e, Merck 부품 번호 1.02129.0001)에 의해 분석하였다. 일반적인 순도는 > 90%이다.
5'-아미노-변형된 β-L-LNA 올리고뉴클레오티드들의 식별은 LC-MS 분석으로 확인하였다.
5'-H2N-헥실-Sp18-β-LNA(GCGATA)-3' (서열 번호: 47)
5'-H2N-헥실-Sp18-β-LNA(GGAAGA)-3' (서열 번호: 34)
5'-H2N-헥실-Sp18-β-LNA(TGACAG)-3' (서열 번호: 32)
5'-H2N-헥실-Sp18-β-LNA(GTTGGT)-3' (서열 번호: 3)
실시예 3 - 뉴클레오티드의 합성
본 발명의 뉴클레오티드를 합성하는 방법이 본원에 예시되고 기재되어 있다.
Figure pct00040
Figure pct00041
Figure pct00042
Figure pct00043
Figure pct00044
링커 분자 1은 US 2017/0240961 A1에 기재된 절차에 따라 합성되었으나 PEG12 디아민 대신 3,6,9,12-테트라옥사테트라데칸-1,14-디아민 (CAS 68960-97-4, 예를 들어, Carbosynth사의 것 (FD164979))을 사용하였다는 것이 다르다.
우라실 및 사이토신의 5-위치 및 7-데아자-아데닌 및 7-데아자구아닌의 7-위치에서 3-아미노프로프-1-이닐기에 의해 변형된 3'-O-아지도메틸-뉴클레오시드 트리포스페이트들(화합물 4 ―7)을 WO 2004/018497에 기재된 절차에 따라 합성하였다. 프로파르길-변형된-3'-아지도메틸-dNTP (화합물 4-7)는 캘리포니아주 샌디에고 소재 MyChem, LLC사로부터 구입할 수도 있다.
링커 분자 3의 합성:
링커 분자 1 (1 mmol, 534 mg)을 DMF (10 ml) 및 N-메틸모르폴린 (1.2 ml)에 용해시켰다. 이 용액에 DMF(10ml) 중의 말레이미드-PEG2-숙신이미딜 에스터 2(Sigma Aldrich 746223)(1.1mmol(468mg))의 용액을 천천히 추가한 다음 주위 온도에서 16시간 동안 교반하였다. 용매를 진공하에 제거하였다. 1M HCl을 첨가하여 잔부를 산성화하고 생성물을 에틸 아세테이트로 추출하였다. 조합된 유기층을 물 및 염수로 세척하고 건조시켰다(Na2SO4). 용매를 감압하에 제거하고 조 생성물(0.8g)을 다음 단계에 사용하였다.
뉴클레오티드 링커 접합체 8 - 11의 합성:
건조 DMF(2 ml) 중 링커 분자 3(11.3 mg, 13.2 μmol)의 교반된 용액에 N,N'-디숙신이미딜 카보네이트(3.4 mg, 13.2 μmol) 및 4-디메틸아미노피리딘(1.6 mg, 13.2 μmol)을 추가했다. 반응 혼합물을 주변 온도에서 2시간 동안 교반했다. TLC는 완전한 전환을 나타내었다. 이 용액은 곧바로 0.1M NaHCO3/Na2CO3 완충액 pH 8.7(0.3ml)에서 뉴클레오티드 4 ―7(13μmol)과의 커플링에 사용되었다. 반응 혼합물을 주위 온도에서 3시간 동안 교반하고 역상 HPLC로 정제하여 뉴클레오티드 링커 접합체 8-11을 생성하였다. 일반적인 수율은 6 내지 8 μmol이었다.
뉴클레오티드 β-L-LNA 접합체 16 - 19의 합성:
뉴클레오티드 링커 접합체 8 - 11(240 nmol) 및 5'-티올 변형된 β-L-LNA(12 - 15)(200 nmol)를 각각 2 ml의 Dulbecco 포스페이트 완충 식염수(Sigma D8537)에 용해시키고 혼합했다. 주위 온도에서 10분 후 반응이 완료되었다(RP-HPLC로 제어). 그런 다음 반응 혼합물을 물에 대해 투석하고(MWCO 1000, SpectraPor 6, 부품 번호 132638), 0.1 M 트리에틸암모늄 아세테이트 pH 7/아세토니트릴 구배를 사용하는 RP HPLC(컬럼: XBridge prep C18 5 μm OBD, 19 x 250 mm(Waters, P/N 186004021))로 농축 및 정제했다. 생성물 분획을 취합하고 물에 대한 투석에 의해(MWCO 1000, SpectraPor 6, 부품 번호 132638) 탈염시키고, 정량하고 동결건조시켰다.
수율은 약 120 내지 160 nmol 범위였다.
뉴클레오티드 β-L-LNA 접합체 16 - 19는 0,1M 트리에틸암모늄 아세트산염 pH 7/아세토니트릴 구배를 이용하는 RP18 HPLC(Chromolith RP18e, Merck 부품 번호 1.02129.0001)로 분석하였다. 일반적인 순도는 > 95%였다. 뉴클레오티드 β-L-LNA 접합체 16 - 19의 식별은 LC-MS 분석으로 확인되었다.
실시예 4 - 접합체의 합성
본 발명의 접합체를 합성하는 방법이 본원에 예시되고 기재되어 있다.
Figure pct00045
카르복실 산화철 나노입자(예를 들어, Ocean NanoTech사의 직경 5~30 nm)를 EDC/설포-NHS를 사용하여 활성화한 다음 다른 비율을 사용하여 5'-아미노 변형된 βL-LNA 올리고뉴클레오티드에 접합시켜 낮은 올리고뉴클레오티드 부하 (24 - 27)를 갖는 자성 나노입자를 생성했다.
0.2mL의 재현탁된(DI 수) 자성 나노입자(5mg/mL)를 1.5mL 미세원심분리 튜브에 분취한 다음 0.2mL의 활성화 완충액(25mM MES, pH 6.0)을 첨가했다. 그 후, 0.01mL의 설포-NHS 용액(10mg/mL DI 수) 및 0.01mL의 EDC 용액(10mg/mL DI 수)을 첨가했다. 현탁액을 실온에서 15분 동안 연속적으로 혼합하였다. 그런 다음 미반응 EDC/설포-NHS를 NAP-10 컬럼(GE 17-0854-02)으로 분리하였다. 10 mM PBS 완충액 pH 7.4 중의 5'-아미노-변형된 올리고뉴클레오티드 (나노입자 1 mg 당 5 nmol 이하)를 컬럼으로부터 용리된 자성 나노입자에 첨가하고 연속으로 혼합하면서 실온에서 2.5 시간 동안 반응시켰다. 그 후, 상기 자성 나노입자 현탁액에 0.1mL의 퀀칭 완충액(100mM Tris-HCl, pH 7.4)을 첨가하고 연속으로 혼합하면서 실온에서 30분 동안 반응시켰다. 이어서 접합되지 않은 올리고뉴클레오티드를 자기 분리하여 제거하였다. 자성 나노입자를 저장 완충액(10mM PBS, pH 7.4)에 재현탁시켰다. 음이온 교환 HPLC 또는 겔 전기영동은 서로 다른 화학량론을 갖는 자성 나노입자를 분리하고 올리고뉴클레오티드로 단일작용기화된 자성 나노입자를 단리하기 위해 사용될 수 있다.
올리고뉴클레오티드가 다중 접합된 경우:
Figure pct00046
실시예 5
Z1을 포함하는 뉴클레오티드 또는 올리고-/폴리뉴클레오티드를 Z2를 포함하는 접합체(과량, 예를 들어 1pM - 1mM, 바람직하게는 0.1 - 25μM(칩의 센서 및 적용되는 과량에 따라 다름)의 접합체)와 반응시키기 위한 반응 조건:
실온에서 인큐베이션 시간 10초 내지 600초, 바람직하게는 10 내지 60초
1) 반응기: 올리고뉴클레오티드
접합체는, 예를 들어, Tris, Hepes, 소듐 포스페이트, 소듐 클로라이드, 포타슘 아세테이트 (바람직한 pH 6-8; 바람직한 염 농도 10 - 100 mM (1가) 및/또는 0- 10 mM 2가 이온 (Mg2+))를 함유하는 완충 용액에 처리되고; 세제, 예를 들어, 폴리도카놀 (Thesit)이 추가될 수 있다.
2) 반응기: 합텐 / 항체
접합체는, 예를 들어, Tris, Hepes, 소듐 포스페이트, 소듐 클로라이드, 포타슘 아세테이트 (바람직한 pH 6-8; 바람직한 염 농도 10 - 100 mM)를 함유하는 완충 용액에 처리되고; 세제, 예를 들어, 폴리도카놀 (Thesit)이 추가될 수 있다.
3) 반응기: 호스트 / 게스트
접합체는, 예를 들어, Tris, Hepes, 소듐 포스페이트, 소듐 클로라이드, 포타슘 아세테이트 (바람직한 pH 6-8; 바람직한 염 농도 10 - 100 mM)를 함유하는 완충 용액에 처리되고; 세제, 예를 들어, 폴리도카놀 (Thesit)이 추가될 수 있다.
4) 클릭
4a) CuAAC
접합체는, 예를 들어, Tris, Hepes, 소듐 포스페이트, 소듐 클로라이드, 포타슘 아세테이트 (바람직한 pH 6-8; 바람직한 염 농도 10 - 100 mM) 및 클릭 시약 (0,25 mM 황산 구리(II), 1.25 mM THPTA 리간드, 5 mM 소듐 아스코르베이트, 5 mM 아미노구아니딘)를 함유하는 완충 용액에 처리되고; 세제, 예를 들어, 폴리도카놀 (Thesit)이 추가될 수 있다.
4b) 구리가 없는 클릭
접합체는, 예를 들어, Tris, Hepes, 소듐 포스페이트, 소듐 클로라이드, 포타슘 아세테이트 (바람직한 pH 6-8; 바람직한 염 농도 10 - 100 mM)를 함유하는 완충 용액에 처리되고; 세제, 예를 들어, 폴리도카놀 (Thesit)이 추가될 수 있다.
4c) TCO/테트라진 클릭(역수요 Diels-Alder 고리화 첨가반응)
접합체는, 예를 들어, Tris, Hepes, 소듐 포스페이트, 소듐 클로라이드, 포타슘 아세테이트 (바람직한 pH 6-8; 바람직한 염 농도 10 - 100 mM)를 함유하는 완충 용액에 처리되고; 세제, 예를 들어, 폴리도카놀 (Thesit)이 추가될 수 있다.
실시예 6 - 5'-비오틴화 β-L-LNA 올리고뉴클레오티드의 합성
5'-비오틴화 β-L-LNA 올리고뉴클레오티드는 표준 자동화된 고체상 DNA 합성 절차를 이용하고 포스포르아미다이트 화학을 적용하여 ABI 394 DNA 합성장치로 2 x 1 μmole 규모 합성에서 합성되었다. Glen UnySupport PS(Glen Research 카탈로그 번호 26-5040) 및 β-L-LNA 포스포르아미다이트(발명의 명칭이 “Hybridizing all-LNA nucleotides”인, 2019년 6월 7일에 출원된 유럽 특허 출원 제 19179046.8 참조, 이는 그 전문이 본원에 참조로 포함됨) 뿐만 아니라 스페이서 포스포르아미다이트 18(Sp18)(Glen Research 카탈로그 번호 10-1918) 및 5'-비오틴 포스포르아미다이트(Glen Research 카탈로그 번호 10-5950)는 빌딩 블록으로 사용된다. 모든 포스포르아미다이트는 DNA 등급 아세토니트릴에서 0.1 M의 농도에서 적용되었다. DMToff에서 합성된 5'-비오틴화 β-L-LNA 올리고뉴클레오티드들의 조립을 위해 연장된 커플링 시간(240초) 및 연장된 산화(45초)를 사용하는 표준 DNA 주기, 뿐만 아니라 표준 합성 시약 및 용매를 사용하였다. 농축 암모니아에 의한 지지체로부터 LNA 올리고뉴클레오티드의 절단을 위해 표준 절단 절차를 적용하였으며, 농축 암모니아 처리(56°C에서 8시간)에 의해 잔류 보호기를 또한 절단하였다. 조 5'-비오틴화 β-L-LNA 올리고뉴클레오티드를 증발시키고 RP HPLC(컬럼 : PRP-1, 12-20 μm, 250 x 30 mm (Hamilton, 부품 번호 79352))에 의해 0.1M 트리에틸암모늄 아세테이트 pH 7/아세토니트릴 구배를 사용하여 정제하였다. 생성물 분획을 취합하고 물에 대한 투석에 의해 (MWCO 1000, SpectraPor 6, 부품 번호 132638) 탈염시켰다. 마지막으로, 5'-비오틴화 올리고뉴클레오티드들을 정량하고 동결건조시켰다.
일반적인 수율은 약 200 내지 약 400 nmol 범위였다.
5'-비오틴화 β-L-LNA 올리고뉴클레오티드는 0,1M 트리에틸암모늄 아세트산염 pH 7/아세토니트릴 구배를 이용하여 RP18 HPLC (Chromolith RP18e, Merck 부품 번호 1.02129.0001)에 의해 분석하였다. 일반적인 순도는 > 90%이다.
5'-비오틴화 β-L-LNA 올리고뉴클레오티드들의 식별은 LC-MS 분석으로 확인하였다.
5'-비오틴-Sp18-β-LNA(GCGATA)-3' (서열 번호: 47)
5'-비오틴-Sp18-β-LNA(GGAAGA)-3' (서열 번호: 34)
5'-비오틴-Sp18-β-LNA(TGAGTG)-3' (서열 번호: 57)
5'-비오틴-Sp18-β-LNA(GTTGGT)-3' (서열 번호: 3)
실시예 7 - 스트렙타비딘 코팅된 나노입자(NP10 nm, NP20 nm) 및 다른 비오틴화 L-LNA의 접합
재료
Figure pct00047
기구 :
1.5 mL LB-에펜도르프 바이얼
Vivaspin사의 스핀필터(Spinfilter) 시스템(Sartorius 500): 10K MWCO, 필터 부피 100μL, 상층액 부피 ca. 500μL
원심분리기: 에펜도르프 5415D; 13 200 rpm / 16 100 rcf 최대
원심분리기: 에펜도르프 5417R; 25 000 rcf 최대, 온도: (21℃)
열-진탕기 (Thermo-Shaker)
와류기 (Vortex)
실험
아래와 같이 각각 8개의 샘플(2개의 NP x 4개의 L-LNA)로 3가지 다른 실험을 수행했다:
(A) 0.5 mg NP; 정제: 원심분리: 에펜도르프 5417R; 25,000 rcf 최대, (21-∞C)
(B) 0.1 mg NP; 정제: 스핀필터 10K, 0.5mL, 원심분리기: 에펜도르프 5415D, 8000 rpm
(C) 0.3 mg NP; 정제: 스핀필터 10K, 0.5mL, 원심분리기: 에펜도르프 5417R, 5000 rcf
실험 (A)
0.5mg(500μL)의 나노입자를 1.5mL LB-에펜도르프 바이얼로 옮겼다(표 2 참조).
완충액 교환: 샘플을 상층액이 무색이 될 때까지 원심분리하고 (15분(NP20); 60분(NP10), 25,000 rcf), 상층액(10mM PBS, pH 7.4, 0.02% NaN3, 0.01% BSA)을 제거하고 500μL의 반응 완충액 KP 완충액(pH 7.4)을 첨가하고, 샘플을 와류시켜 재현탁시키고, 다시 원심분리하고, KP 완충액을 제거하고 최종적으로 50 μL KP 완충액을 첨가하였다(cNP=10 mg/mL).
NP10 및 NP20에 대한 스트렙타비딘 나노입자의 비오틴-결합능 (이하 “BiKA”)에 따라, 40-배 과량의 각각의 L-LNA를(KP-완충액 pH 7.4 중 100 nmol/mL ) 나노입자 현탁액에 첨가하여 각각 0.9 및 1.7 mg/mL의 반응 농도를 생성하였다.
접합은 열 진탕기를 사용하여 다음과 같이 수행되었다: 1h, 21℃, 1000 rpm
정제: 유리 L-LNA를 제거하기 위해 상층액이 무색이 될 때까지 샘플을 원심분리하고 (15분(NP20); 60분(NP10), 25000rcf) 상층액을 제거하고 500μL의 KP 완충액(pH 7.4)을 첨가했다. 이 세척 절차를 2회 반복하였다.
마지막으로, 나노입자 펠릿을 50 μL의 pH 7.4 KP 완충액에 재현탁시켰다 (c=10 mg/mL).
실험 (B) 및 (C)
멤브레인 습윤을 위한 스핀 필터의 전처리: 500 μL의 pH 7.4 KP 완충액으로 원심분리 2회
실험 (B)의 경우 0.1 mg (100 μL)의 나노입자들을 스핀 필터로 옮겼다
실험 (C)의 경우 0.3 mg (300 μL)의 나노입자들을 스핀 필터로 옮겼다
완충액 교환: 500 μL의 반응 완충액인 pH 7.4의 KP 완충액을 스핀 필터에 첨가하고 원심분리하였으며 (3분; 8000 rpm (NP10, NP20)), 이 절차를 2회 반복하였다.
필터의 NP-현탁액을 100-200μL의 pH 7.4 KP 완충액을 사용하여 1.5mL LB-에펜도르프 바이얼로 옮겼다.
NP10 및 NP20에 대한 BiKA에 따라 각각의 L-LNA의 40배 과량(B:100nmol/mL; C: pH 7.4 KP-완충액 중 250nmol/mL)을 나노입자 현탁액에 첨가하여, 실험 B의 경우 각각 0.5 및 0.7 mg/mL; 실험 C의 경우 0.9 및 1.2 mg/mL의 반응 농도를 생성하였다.
접합은 열 진탕기를 사용하여 다음과 같이 수행되었다: 1h, 21℃, 1000 rpm
정제: 유리 L-LNA를 제거하기 위해 스핀 필터 시스템(5-10분, 8000rpm)을 사용하여 샘플을 500μL의 pH 7.4 KP-완충액으로 3-6회 세척했다. 각 원심분리 단계 후 NP를 피펫팅하여 필터 내에 재현탁시켰다. 여과액을 수집하여 UV/Vis 분광법(260 nm)을 통해 L-LNA 양/세척 효능을 확인했다.
마지막으로, 나노입자 펠릿을 ~100 μL의 pH 7.4 KP 완충액에 재현탁시켰다 (c=1 mg/mL)
결과
DLS
반응 시리즈 A의 샘플들을 DLS 측정으로 분석했다(물 중 5 μL NP 현탁액)
Figure pct00048
샘플 1, 3, 5, 7(NP10)의 DLS 측정은 LNA 코팅된 입자에 대해 약 20 내지 약 40 nm의 크기 분포를 나타내었다. 이러한 직경은 전구체 입자(10 nm 카르복실 입자 및 스트렙타비딘 입자)와 유사했다.
접합 L-LNA(2700g/mol)에 의한 검출가능한 크기 증가는 관찰되지 않았다.
샘플 2, 4, 6, 8(NP20)의 DLS 측정은 대부분 측정할 수 없었다. 이는 NP20 접합체의 응집 문제로 인한 것으로 보인다.
스트렙타비딘으로 코팅된 두 가지 입자 모두 (NP10 및 NP20) 다른 재료 특성을 나타낸다.
원심분리 과정(스핀필터 유무에 관계없이)을 적용하면 NP20 입자들의 응집이 일어난다. NP20 입자가 여과막에 달라붙은 것으로 추정된다. 두 가지 사실 모두 L-LNA와의 접합 반응에서 NP20 샘플의 수율을 감소시킨다. 이는 NP10 대 NP20 샘플의 갈색 색상 강도를 비교하여 관찰할 수 있다.
비오틴 플루오레세인을 사용한 BiKA 분석
NP10: BiKA 3030 - 3060 pmol/mg (~ 3.0 nmol/mg)
NP20: BiKA 10.400 - 11.500 pmol/mg (~ 10.4-11.5 nmol/mg)
예상외로 NP20 입자는 NP10 입자보다 약 3 내지 약 4배 더 높은 BiKa를 보여주었다.
실험에서 경험적으로 결정된 NP10 및 NP20의 BiKa는 다음과 같이 결정되었다:
NP 10: 2.5 nmol/ mg 비드
NP 20: 1.25 nmol/ mg 비드
NP10의 경우 거의 전체가 일치한다 (2.5 nmol/ mg vs. 3.0 nmol/ mg).
NP20의 경우 실험적으로 결정된 Bika는 약 10배 더 높다 (1.25 nmol/ mg vs. 11 nmol/ mg).
그럼에도 불구하고, 모든 실험에 사용된 L-LNA의 40배 과량은 100% 로딩을 생성하기에 충분해야 하며 이는 비오틴-플루오레세인 분석(90 - 100% L-LNA 로딩)으로 확인할 수 있다.
추가 실시형태
다음 단계들을 포함하는, 고체 지지체 상에 배열된 복수의 표적 폴리뉴클레오티드를 시퀀싱하는 방법: 4개의 서로 다른 뉴클레오티드 중 하나를 복수의 표적 폴리뉴클레오티드 각각에 상보적인 핵산 복제 가닥들에 혼입시키는 단계, 이때 4개의 서로 다른 뉴클레오티드 각각은 (i) 3'-하이드록실 보호기, 및 (ii) 절단성 링커를 통해 핵염기에 커플링된 반응기를 포함하고, 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 반응기를 포함하고; 신생 핵산 가닥의 뉴클레오티드-접합체 복합체들의 서로 다른 서브세트들을 순차적으로 형성하는 단계, 이때 형성된 뉴클레오티드-접합체 복합체의 각각의 서로 다른 서브세트 내 각각의 뉴클레오티드-접합체 복합체는 신생 핵산 복제 가닥들에 혼입된 서로 다른 뉴클레오티드 중 단 하나로부터 유래되고, 이때 뉴클레오티드-접합체 복합체의 각각의 서로 다른 서브세트의 순차적 형성은 다음 단계들을 포함한다: 검출가능한 표지를 포함하고 상보적 핵산 복제 가닥들에 혼입된 4개의 서로 다른 뉴클레오티드 중 단 하나와 직교 반응성인 접합체를 도입하는 단계; 각각의 도입된 접합체의 표지를 검출함으로써 상기 서브세트 내 각 뉴클레오티드-접합체 복합체의 형성을 검출하는 단계; 고체 지지체 내부에서 상기 서브세트 내 각각의 검출된 뉴클레오티드-접합체 복합체의 위치를 결정하는 단계; 그리고 상기 서브세트 내 형성된 검출가능한 뉴클레오티드-접합체 복합체 각각으로부터 적어도 검출가능한 표지를 선택적으로 절단하는 단계.
본 명세서에서 언급되고 및/또는 출원 데이터 시트에 나열된 모든 미국 특허, 미국 특허 출원 공개공보, 미국 특허 출원, 외국 특허, 외국 특허 출원 및 비특허 간행물은 본원에 그 전문이 참고로 포함된다. 실시형태들의 양상들은 필요에 따라 다양한 특허, 출원 및 간행물의 개념을 사용하여 변형되어, 또 다른 실시형태를 제공할 수 있다.
본 발명은 다수의 예시적인 실시형태를 참고하여 설명되었으나, 본 발명의 원리의 범위 및 사상에 속하는 수많은 다른 변형 및 실시형태들이 당업자에 의해 고안될 수 있음을 이해하여야 한다. 보다 구체적으로, 본 발명의 범위를 벗어나지 않고 전술한 기재내용, 도면 및 첨부된 청구범위의 범위 내에서 본 발명의 조합 배열의 구성부 및/또는 배열에서 합리적인 변형 및 수정이 가능하다. 구성부 및/또는 배열의 변형 및 수정에 추가하여, 대안적인 용도 또한 당업자에게 명백할 것이다.
SEQUENCE LISTING <110> ROCHE SEQUENCING SOLUTIONS, INC. F. HOFFMANN-LA ROCHE AG ROCHE DIAGNOSTICS GMBH <120> METHODS OF SEQUENCING BY SYNTHESIS USING A CONSECUTIVE LABELING SCHEME <130> P35722-WO HIL <150> US 62/949,461 <151> 2019-12-18 <160> 58 <170> PatentIn version 3.5 <210> 1 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 cttcc 5 <210> 2 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 gctcc 5 <210> 3 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 gttggt 6 <210> 4 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 ctgtca 6 <210> 5 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 5 tgctcc 6 <210> 6 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 6 tcttcc 6 <210> 7 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 gttggtgt 8 <210> 8 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 gttggtg 7 <210> 9 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 tgctcctg 8 <210> 10 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 gtgcgtct 8 <210> 11 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 11 gttggtgt 8 <210> 12 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 12 tgctcctgt 9 <210> 13 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 13 gttggtgtg 9 <210> 14 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 14 ttctcttcc 9 <210> 15 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 15 gttggtgtgt tg 12 <210> 16 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 16 gttggtgtgt tggtg 15 <210> 17 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 17 aaaaaaaaa 9 <210> 18 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 18 aaaaaa 6 <210> 19 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 19 tatcgc 6 <210> 20 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 20 tctgac 6 <210> 21 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 agagag 6 <210> 22 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 22 cacaca 6 <210> 23 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 23 cagtggacga cgatagacat 20 <210> 24 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 24 agaggatcga ggagtacagg 20 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 25 agaaatggac gagatgctaa 20 <210> 26 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 26 actgaacttg tgagaaacgc 20 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 27 atggagagtc aggcaagttt 20 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 28 tgaagatgcg agtgatgaac 20 <210> 29 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 29 ggaag 5 <210> 30 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 30 ggagc 5 <210> 31 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 31 accaac 6 <210> 32 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 32 tgacag 6 <210> 33 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 33 ggagca 6 <210> 34 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 34 ggaaga 6 <210> 35 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 35 acaccaac 8 <210> 36 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 36 caccaac 7 <210> 37 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 37 caggagca 8 <210> 38 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 38 agacgcac 8 <210> 39 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 39 acaccaac 8 <210> 40 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 40 acaggagca 9 <210> 41 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 41 cacaccaac 9 <210> 42 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 42 ggaagagaa 9 <210> 43 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 43 caacacacca ac 12 <210> 44 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 44 caccaacaca ccaac 15 <210> 45 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 45 ttttttttt 9 <210> 46 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 46 tttttt 6 <210> 47 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 47 gcgata 6 <210> 48 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 48 gtcaga 6 <210> 49 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 49 ctctct 6 <210> 50 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 50 tgtgtg 6 <210> 51 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 51 atgtctatcg tcgtccactg 20 <210> 52 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 52 cctgtactcc tcgatcctct 20 <210> 53 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 53 ttagcatctc gtccatttct 20 <210> 54 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 54 gcgtttctca caagttcagt 20 <210> 55 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 55 aaacttgcct gactctccat 20 <210> 56 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 56 gttcatcact cgcatcttca 20 <210> 57 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 57 tgagtg 6 <210> 58 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 58 cactca 6

Claims (19)

  1. 고체 지지체 상에 배열된 복수의 표적 폴리뉴클레오티드를 시퀀싱하는 방법으로서, 이 방법은 다음 단계들을 포함하고:
    (i) 4개의 서로 다른 뉴클레오티드 중 하나를 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 복제 가닥들에 혼입시키는 단계, 이때 4개의 서로 다른 뉴클레오티드 각각은 (i) 3'-하이드록실 보호기, 및 (ii) 절단성 링커를 통해 핵염기에 커플링된 제1 반응기를 포함하고, 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 제1 반응기를 포함하고;
    (ii) 뉴클레오티드-접합체 복합체의 서로 다른 서브세트들을 순차적으로 형성하는 단계, 이때 형성된 뉴클레오티드-접합체 복합체의 각각의 서로 다른 서브세트 내 각각의 뉴클레오티드-접합체 복합체는 신생 핵산 복제 가닥들에 혼입된 서로 다른 뉴클레오티드 중 단 하나로부터 유래되고, 이때 뉴클레오티드-접합체 복합체의 각각의 서로 다른 서브세트의 순차적 형성은:
    a. 검출가능한 표지를 포함하고 신생 핵산 가닥들에 혼입된 4개의 서로 다른 뉴클레오티드 중 단 하나와 직교 반응성인 접합체를 도입하는 단계;
    b. 각각의 도입된 접합체의 표지를 검출함으로써 상기 서브세트 내 각 뉴클레오티드-접합체 복합체의 형성을 검출하는 단계;
    c. 고체 지지체 내부에서 상기 서브세트 내 각각의 검출된 뉴클레오티드-접합체 복합체의 위치를 결정하는 단계; 그리고
    d. 상기 서브세트 내 형성된 검출가능한 뉴클레오티드-접합체 복합체 각각으로부터 적어도 검출가능한 표지를 선택적으로 절단하는 단계를 포함하는, 방법.
  2. 청구항 1에 있어서, 4개의 서로 다른 뉴클레오티드는 화학식 (IC), (ID), (IE), 및 (IF)의 구조를 가지며:

    Figure pct00049
    (IC),
    Figure pct00050
    (ID),

    Figure pct00051
    (IE), 및
    Figure pct00052
    (IF),

    이때
    WA는 아데닌 핵염기이고, WG는 구아닌 핵염기이고; WC는 사이토신 핵염기이고; WR은 티민 핵염기 또는 우라실 핵염기 중 하나이고;
    Z1A, Z1B, Z1C, 및 Z1D는 각각 서로 다른 제1 반응기이고;
    Y는 -O-P(O)(OH)[-O-P(O)(OH)]z-OH이고, 이때 z는 2 내지 약 5의 범위이고;
    PG는 보호기이고; 그리고
    각각의 L1은 독립적으로 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자로 선택적으로 치환되며, 단, L1 은 하나 이상의 절단성 기를 포함하는,
    방법.
  3. 청구항 1에 있어서, 상기 도입된 접합체는 화학식 (IIA) 또는 (IIB) 중 어느 하나의 구조를 가지며:
    Figure pct00053
    (IIA),
    Figure pct00054
    (IIB),
    이때
    D는 검출가능한 표지 또는 검출가능한 표지를 포함하는 접합체이고;
    L2는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며;
    Z2는 반응기이고; 그리고
    p는 2 내지 약 1000 범위인,
    방법.
  4. 고체 지지체 상에 배열된 복수의 표적 폴리뉴클레오티드의 서열을 결정하는 방법으로서, 이 방법은 다음 단계를 포함하고:
    (i) 4개의 서로 다른 뉴클레오티드 중 하나를 복수의 표적 폴리뉴클레오티드 각각에 상보적인 신생 핵산 가닥들에 혼입시키는 단계, 이때 4개의 서로 다른 뉴클레오티드 각각은 절단성 링커를 통해 핵염기에 커플링된 제1 반응기 및 3'-하이드록실 보호기를 포함하고, 4개의 서로 다른 뉴클레오티드의 각각의 서로 다른 뉴클레오티드는 서로 다른 핵염기 및 서로 다른 제1 반응기를 포함하고;
    (ii) 신생 핵산 가닥들에 혼입된 4개의 서로 다른 뉴클레오티드의 각 하나를 순차적으로 표지하는 단계, 이때 이러한 순차적 표지 단계는:
    a. 검출가능한 표지를 포함하고 신생 핵산 가닥들에 혼입된 4개의 서로 다른 뉴클레오티드 중 단 하나와 직교 반응성인 접합체를 도입하여, 하나 이상의 표지된 뉴클레오티드를 제공하는 단계;
    b. 하나 이상의 표지된 뉴클레오티드의 표지를 검출하는 단계;
    c. 검출된 표지에 기초하여, 고체 지지체 내부에서 하나 이상의 표지된 뉴클레오티드의 위치를 확인하는 단계; 그리고
    d. 신생 핵산 가닥들에 혼입된 하나 이상의 표지된 뉴클레오티드로부터 적어도 검출가능한 표지를 선택적으로 절단하는 단계를 포함하는,
    방법.
  5. 화학식 (IA)로 정의된 구조를 갖는 화합물 또는 이의 임의의 염으로서:
    Figure pct00055
    (IA),
    이때
    Y는 -O-P(O)(OH)[-O-P(O)(OH)]z-OH 또는 -O-P(O)(OH)-올리고뉴클레오티드이고, 이때 z는 2 내지 약 5 범위의 정수이고;
    PG는 보호기이고;
    W는 핵염기이고;
    L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
    Z1은 올리고뉴클레오티드인,
    화합물.
  6. 청구항 5에 있어서, Z1은 LNA- 또는 PNA-변형된 올리고뉴클레오티드를 포함하는, 화합물.
  7. 청구항 5에 있어서, Z1은 L-배열의 단량체를 포함하는, 화합물.
  8. 청구항 5에 있어서, Z1 올리고뉴클레오티드는 서열 번호: 1 - 22 또는 29 - 50 중 어느 하나에서 선택된 서열을 포함하는, 화합물.
  9. 청구항 5에 있어서, 적어도 하나의 절단성 기는 화학적 절단성 기, 효소적 절단성 기 및 광절단성 기로 이루어진 군에서 선택되는, 화합물.
  10. 청구항 5에 있어서, 상기 화합물 또는 이의 염은 화학식 (IB)의 구조를 가지며:
    Figure pct00056
    (IB),
    이때
    Y는 -O-P(O)(OH)[-O-P(O)(OH)-]z-OH 또는 -O-P(O)(OH)-올리고뉴클레오티드이고, 이때 z는 2 내지 약 5의 범위이고;
    PG는 보호기이고;
    W는 핵염기이고;
    Q1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 모이어티이고 1 내지 약 25개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며;
    Q2는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 45개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며;
    X1은 절단성 기이고; 그리고
    Z1은 올리고뉴클레오티드인,
    화합물.
  11. 청구항 10에 있어서, Q1은 C1 - C10 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬 기를 포함하는, 화합물.
  12. 청구항 10에 있어서, Q2는 C1 - C20 직쇄 또는 분지쇄, 치환 또는 비치환 알킬 또는 헤테로알킬 기를 포함하는, 화합물.
  13. 청구항 10에 있어서, X1은 광절단성 기, 효소적 절단성 기, 화학적 절단성 기, 및 pH 민감성 기로 이루어진 군에서 선택되는, 화합물.
  14. (i) 3'-하이드록실 보호기, 및 (ii) 절단성 링커를 통해 핵염기에 커플링되는 반응기를 포함하는 뉴클레오티드로서, 이때 반응기는 LNA-변형된 올리고뉴클레오티드 또는 베타-L-LNA 변형된 올리고뉴클레오티드를 포함하고,
    이때 LNA-변형된 올리고뉴클레오티드 또는 베타-L-LNA 변형된 올리고뉴클레오티드는 서열 번호: 1 - 22 또는 29 - 50 중 어느 하나를 가지는 서열을 포함하는, 뉴클레오티드.
  15. (i) 청구항 10-13 중 어느 한 항의 화합물 또는 이의 염, 또는 청구항 14의 뉴클레오티드 또는 이의 염; 및 (ii) 화학식 (IIA) 또는 (IIB) 중 어느 하나의 구조를 가지는 접합체를 포함하는, 키트로서:
    Figure pct00057
    (IIA), 또는
    Figure pct00058
    (IIB),

    이때
    D는 검출가능한 표지 또는 검출가능한 표지를 포함하는 접합체이고;
    L2는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며;
    Z2는 Z1의 올리고뉴클레오티드에 상보적인 올리고뉴클레오티드이고; 그리고
    p는 2 내지 약 1000 범위의 정수인,
    키트.
  16. 화학식 (IC)의 뉴클레오티드 하나, 화학식 (ID)의 뉴클레오티드 하나, 화학식 (IE)의 뉴클레오티드 하나, 및 화학식 (IF)의 뉴클레오티드 하나를 포함하는 키트로서:
    Figure pct00059
    (IC),
    Figure pct00060
    (ID),

    Figure pct00061
    (IE), 및
    Figure pct00062
    (IF),
    이때
    Y는 -O-P(O)(OH)[-O-P(O)(OH)]z-OH이고, 이때 z는 2 내지 약 5의 범위이고;
    PG는 보호기이고;
    WA는 아데닌 핵염기이고;
    WG는 구아닌 핵염기이고;
    WC는 사이토신 핵염기이고;
    WR은 티민 핵염기 또는 우라실 핵염기이고;
    L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
    Z1A, Z1B, Z1C , 및 Z1D 각각은 서로 다른 제1 반응기를 포함하는,
    키트.
  17. 뉴클레오티드-접합체 복합체로서, 이때 이러한 뉴클레오티드-접합체 복합체는,
    (i) 화학식 (IA)를 가지며:

    Figure pct00063
    (IA),
    이때
    Y는 -O-P(O)(OH)[-O-P(O)(OH)]z-OH이고; 이때 z는 2 내지 약 5의 범위이고;
    PG는 보호기이고;
    W는 핵염기이고;
    L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자로 선택적으로 치환되며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
    Z1은 제1 반응기인, 뉴클레오티드를;
    (ii) 화학식 (IIA) 또는 (IIB) 중 어느 하나를 가지며:
    Figure pct00064
    (IIA), 또는
    Figure pct00065
    (IIB),
    이때
    D는 검출가능한 표지 또는 검출가능한 표지를 포함하는 접합체이고;
    L2는 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며;
    Z2 는 제1 반응기 Z1과 직교 반응성인 제2 반응기이고; 그리고
    p는 2 내지 약 1000 범위의 정수인, 접합체와 반응시키는 단계를 포함하는 공정에 의해 생성되는,
    뉴클레오티드-접합체 복합체.
  18. 간접적으로 커플링된 복수의 신생 핵산 복제 가닥들을 포함하는 고체 지지체로서, 이때 복수의 신생 핵산 복제 가닥들 각각은 화학식 (IA)를 갖는 혼입된 뉴클레오티드를 포함하고:
    Figure pct00066
    (IA),
    이때
    Y는 -O-P(O)(OH)-O-올리고뉴클레오티드이고, 이때
    PG는 보호기이고;
    W는 핵염기이고;
    L1은 직쇄 또는 분지쇄, 치환 또는 비치환, 포화 또는 불포화 지방족 또는 방향족 모이어티이고 1 내지 약 60개의 탄소 원자를 가지고 하나 이상의 헤테로원자를 선택적으로 포함하며, 단, L1 은 하나 이상의 절단성 기를 포함하고; 그리고
    Z1은 제1 올리고뉴클레오티드인,
    고체 지지체.
  19. 청구항 18의 고체 지지체 및 자성 나노입자를 포함하는 뉴클레오티드-접합체 복합체들의 서로 다른 형성된 서브세트들을 순차적으로 검출하기에 적합한 자성 센서 어레이를 포함하는 어셈블리.
KR1020227022926A 2019-12-18 2020-12-17 연속 표지화 방식을 사용하는 합성에 의한 시퀀싱 방법 KR20220111315A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962949461P 2019-12-18 2019-12-18
US62/949,461 2019-12-18
PCT/EP2020/086902 WO2021123074A1 (en) 2019-12-18 2020-12-17 Methods of sequencing by synthesis using a consecutive labeling scheme

Publications (1)

Publication Number Publication Date
KR20220111315A true KR20220111315A (ko) 2022-08-09

Family

ID=74183107

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227022926A KR20220111315A (ko) 2019-12-18 2020-12-17 연속 표지화 방식을 사용하는 합성에 의한 시퀀싱 방법

Country Status (7)

Country Link
US (1) US20230061438A1 (ko)
EP (1) EP4077344A1 (ko)
KR (1) KR20220111315A (ko)
CN (1) CN114829368B (ko)
AU (1) AU2020407267A1 (ko)
CA (1) CA3164781A1 (ko)
WO (1) WO2021123074A1 (ko)

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4363759A (en) 1978-04-10 1982-12-14 Miles Laboratories, Inc. Chemiluminescent-labeled haptens and antigens
US5795762A (en) 1986-08-22 1998-08-18 Roche Molecular Systems, Inc. 5' to 3' exonuclease mutations of thermostable DNA polymerases
US4981977A (en) 1989-06-09 1991-01-01 Carnegie-Mellon University Intermediate for and fluorescent cyanine dyes containing carboxylic acid groups
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
JPH06502303A (ja) 1990-10-05 1994-03-17 バーネス,ウェーン・エム 熱安定性dnaポリメラーゼ
US5990300A (en) 1994-09-02 1999-11-23 Andrew C. Hiatt Enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
US5866366A (en) 1997-07-01 1999-02-02 Smithkline Beecham Corporation gidB
US6794499B2 (en) 1997-09-12 2004-09-21 Exiqon A/S Oligonucleotide analogues
CA2303299C (en) 1997-09-12 2016-02-23 Exiqon A/S Oligonucleotide analogues
DE19821968A1 (de) 1998-05-18 1999-11-25 Studiengesellschaft Kohle Mbh Verfahren zur Modifizierung der Dispergiereigenschaften von metallorganisch-prästabilisierten bzw. -vorbehandelten Nanometallkolloiden
DE60033927T2 (de) * 1999-05-04 2007-11-29 Santaris Pharma A/S L-ribo-lna analoge
US6254662B1 (en) 1999-07-26 2001-07-03 International Business Machines Corporation Chemical synthesis of monodisperse and magnetic alloy nanocrystal containing thin films
US6399335B1 (en) 1999-11-16 2002-06-04 Advanced Research And Technology Institute, Inc. γ-phosphoester nucleoside triphosphates
WO2001037721A2 (en) 1999-11-22 2001-05-31 The Research Foundation Of State University Of New York Magnetic nanoparticles for selective therapy
GB0025414D0 (en) 2000-10-16 2000-11-29 Consejo Superior Investigacion Nanoparticles
WO2002093140A1 (en) 2001-05-14 2002-11-21 Johns Hopkins University Multifunctional magnetic nanowires
US6623198B2 (en) 2001-10-09 2003-09-23 Crown Cork & Seal Company, Inc. Dispenser for cosmetics containing sunscreen
US7045319B2 (en) * 2001-10-30 2006-05-16 Ribomed Biotechnologies, Inc. Molecular detection systems utilizing reiterative oligonucleotide synthesis
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
WO2003073444A1 (en) 2002-02-22 2003-09-04 Purdue Research Foundation Fe/au nanoparticles and methods
US7166478B2 (en) 2002-03-12 2007-01-23 Enzo Life Sciences, Inc., C/O Enzo Biochem, Inc. Labeling reagents and labeled targets, target labeling processes and other processes for using same in nucleic acid determinations and analyses
US7569575B2 (en) 2002-05-08 2009-08-04 Santaris Pharma A/S Synthesis of locked nucleic acid derivatives
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
GB2395954A (en) 2002-08-23 2004-06-09 Solexa Ltd Modified nucleotides
GB0313259D0 (en) 2003-06-09 2003-07-16 Consejo Superior Investigacion Magnetic nanoparticles
US7335768B2 (en) 2003-09-04 2008-02-26 University Of Maryland Cucurbit [n] uril compounds and analogs, and methods of making and using the same
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
US20070117104A1 (en) 2005-11-22 2007-05-24 Buzby Philip R Nucleotide analogs
US7476503B2 (en) 2004-09-17 2009-01-13 Pacific Biosciences Of California, Inc. Apparatus and method for performing nucleic acid analysis
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
JP4990886B2 (ja) 2005-05-10 2012-08-01 ソレックサ リミテッド 改良ポリメラーゼ
WO2007053719A2 (en) * 2005-10-31 2007-05-10 The Trustees Of Columbia University In The City Of New York Chemically cleavable 3'-o-allyl-dntp-allyl-fluorophore fluorescent nucleotide analogues and related methods
US8299269B2 (en) 2006-02-28 2012-10-30 University Of Maryland Nor-seco-bis-nor-seco, tris-nor-seco, and higher nor-seco-cucurbit[n]uril compounds
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
WO2008037568A2 (en) 2006-09-04 2008-04-03 Quiatech Ab Reversible terminators for efficient sequencing by synthesis
WO2008031612A1 (en) 2006-09-15 2008-03-20 Creabilis Therapeutics S.P.A. Polymer conjugates of box-a of hmgb1 and box-a variants of hmgb1
DK2444807T3 (da) 2006-11-01 2014-08-11 Ventana Med Syst Inc Mono- og dinitropyrazolhaptenkonjugater
AU2008262489B2 (en) 2007-05-23 2013-11-28 Ventana Medical Systems, Inc. Polymeric carriers for immunohistochemistry and in situ hybridization
GB0723714D0 (en) 2007-12-04 2008-01-16 Cambridge Entpr Ltd Supramolecular handcuffs in polymeric architecture
EP2942404B1 (en) 2008-03-31 2016-11-23 Pacific Biosciences of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
US8999676B2 (en) 2008-03-31 2015-04-07 Pacific Biosciences Of California, Inc. Recombinant polymerases for improved single molecule sequencing
US8420366B2 (en) 2008-03-31 2013-04-16 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
DK2334827T3 (da) 2008-08-22 2015-06-15 Ventana Med Syst Inc Metode til kromogen påvisning af to eller flere målmolekyler i en enkelt prøve
JP2013526616A (ja) 2010-05-26 2013-06-24 ザ ジェネラル ホスピタル コーポレイション 磁性ナノ粒子
US8759038B2 (en) 2010-09-29 2014-06-24 Illumina Cambridge Limited Compositions and methods for sequencing nucleic acids
US9439868B2 (en) 2011-07-26 2016-09-13 Cambridge Enterprise Limited Supramolecular capsules
US9238836B2 (en) 2012-03-30 2016-01-19 Pacific Biosciences Of California, Inc. Methods and compositions for sequencing modified nucleic acids
EP2876166B1 (en) 2013-11-20 2016-12-14 Roche Diagnostics GmbH New compound for sequencing by synthesis
CN107002051A (zh) 2014-09-30 2017-08-01 亿明达股份有限公司 用于核苷酸类似物的改善的掺入的经修饰的聚合酶
WO2016100438A2 (en) 2014-12-16 2016-06-23 Life Technologies Corporation Polymerase compositions and methods of making and using same
JP6222166B2 (ja) 2015-05-22 2017-11-01 トヨタ自動車株式会社 車両用ウィンドウォッシャ装置
US20170240961A1 (en) 2016-02-23 2017-08-24 Complete Genomics, Inc. Affinity tag labeled nucleosides and uses
US10590480B2 (en) 2016-02-29 2020-03-17 Roche Sequencing Solutions, Inc. Polymerase variants
MY196044A (en) 2016-12-22 2023-03-09 Illumina Inc Flow Cell Package And Method For Making The Same
MX2019006705A (es) 2016-12-22 2019-11-08 Illumina Inc Arreglos que incluyen una película de resina y una capa de polímero con patrón.
AU2018392919B2 (en) 2017-12-21 2021-04-15 Illumina Cambridge Limited Flow cells with hydrogel coating
US20210139976A1 (en) * 2018-03-15 2021-05-13 The Trustees Of Columbia University In The City Of New York Nucleotide analogues and use thereof for nucleic acid sequencing and analysis

Also Published As

Publication number Publication date
CN114829368B (zh) 2024-06-04
CA3164781A1 (en) 2021-06-24
WO2021123074A1 (en) 2021-06-24
US20230061438A1 (en) 2023-03-02
EP4077344A1 (en) 2022-10-26
JP2023506891A (ja) 2023-02-20
CN114829368A (zh) 2022-07-29
AU2020407267A1 (en) 2022-06-16

Similar Documents

Publication Publication Date Title
JP7334069B2 (ja) 非天然ヌクレオチドの取り込みによるインビトロの核酸の部位特異的な酵素標識のための方法
US10577646B2 (en) Nucleotide analogs
CN109562376B (zh) 一种基于荧光能量转移的单分子/集群dna合成测序
US11891651B2 (en) Compositions and methods for pairwise sequencing
CN113039191A (zh) 核苷酸类似物
JP4942484B2 (ja) 改良された感度および低バックグラウンドを備えるハイブリダイゼーションによるdna検出のための蛍光プローブ
US20060014191A1 (en) Analog probe complexes
Dziuba et al. Bodipy-labeled nucleoside triphosphates for polymerase synthesis of fluorescent DNA
US20060292586A1 (en) ID-tag complexes, arrays, and methods of use thereof
JP2003506670A (ja) 条件付きselex
JP2007516695A (ja) ユニバーサル塩基アナログを含む組合せ核酸塩基オリゴマーならびにこれらを作製する方法および使用する方法
Kupferschmitt et al. 15 N labeling of oligodeoxynucleotides for NMR studies of DNA-ligand interactions
Romainczyk et al. The RNA–DNA hybrid structure determined by EPR, CD and RNase H1
US20110262917A1 (en) Modified nucleotides
KR20220111315A (ko) 연속 표지화 방식을 사용하는 합성에 의한 시퀀싱 방법
JP7500727B2 (ja) 連続的な標識スキームを使用した合成による配列決定方法
US7323319B2 (en) RNA containing coenzymes, biotin, or fluorophores, and methods for their preparation and use
US20050239073A1 (en) Fluorescent entity comprising a fluorophore covalently attached to at least one oligonucleotide and comprising at least one functional group, and uses thereof
JP2000316587A (ja) 核酸プローブ
AU2017385424B2 (en) Single fluorescent dye based sequencing method
Walunj et al. Advances in the application of Pd-mediated transformations in nucleotides and oligonucleotides
Wilson Design, Synthesis, and Translational Applications of Fluorescent DNA Repair Probes
US20080207885A1 (en) Method for site-specific labeling of RNA using a deoxyribozyme
WO2024050815A1 (zh) 杂芳环化合物在核酸检测中的用途
Loakes Nucleotides and nucleic acids; oligo-and poly-nucleotides