KR20140059256A - Dna-코딩된 라이브러리에 태그부착하는 방법 - Google Patents

Dna-코딩된 라이브러리에 태그부착하는 방법 Download PDF

Info

Publication number
KR20140059256A
KR20140059256A KR1020147007749A KR20147007749A KR20140059256A KR 20140059256 A KR20140059256 A KR 20140059256A KR 1020147007749 A KR1020147007749 A KR 1020147007749A KR 20147007749 A KR20147007749 A KR 20147007749A KR 20140059256 A KR20140059256 A KR 20140059256A
Authority
KR
South Korea
Prior art keywords
building block
tag
headpiece
nucleotides
library
Prior art date
Application number
KR1020147007749A
Other languages
English (en)
Other versions
KR102124613B1 (ko
Inventor
안쏘니 디. 키페
리차드 더블유. 와그너
알렉산더 리토브치크
매튜 클라크
존 더블유. 쿠오쪼
윙 장
파올로 에이. 센트렐라
크리스토퍼 디. 후프
Original Assignee
엑스-켐, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=47832597&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR20140059256(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 엑스-켐, 인크. filed Critical 엑스-켐, 인크.
Publication of KR20140059256A publication Critical patent/KR20140059256A/ko
Application granted granted Critical
Publication of KR102124613B1 publication Critical patent/KR102124613B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1068Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1093General methods of preparing gene libraries, not provided for in other subgroups
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/14Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
    • C40B50/16Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support involving encoding steps
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07BGENERAL METHODS OF ORGANIC CHEMISTRY; APPARATUS THEREFOR
    • C07B2200/00Indexing scheme relating to specific properties of organic compounds
    • C07B2200/11Compounds covalently bound to a solid support

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Structural Engineering (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)

Abstract

본 발명은 올리고뉴클레오티드-코딩된 라이브러리, 및 상기 라이브러리에 태그부착하는 방법에 관한 것이다. 특히, 본 방법 및 올리고뉴클레오티드는 하나 이상의 2'-치환된 뉴클레오티드, 예컨대 2'-O-메틸 또는 2'-플루오로 뉴클레오티드, 및 효소적 라이게이션을 증진시키는 다른 조건 또는 시약, 또는 화학적 라이게이션을 지원하는 하나 이상의 화학적 관능기를 포함할 수 있다.

Description

DNA-코딩된 라이브러리에 태그부착하는 방법 {METHODS FOR TAGGING DNA-ENCODED LIBRARIES}
관련 출원에 대한 상호 참조
본 출원은 2011년 9월 7일자로 출원된 미국 가출원 제61/531,820호, 및 2011년 9월 20일자로 출원된 제61/536,929호를 우선권 주장하며, 이들 가출원은 본원에 참조로 포함된다.
본 발명의 분야
일반적으로, 본 발명은 화합물의 DNA-코딩된 라이브러리, 및 상기 라이브러리를 사용 및 생성하는 방법에 관한 것이다. 본 발명은 또한 상기 라이브러리에서 사용하기 위한 조성물에 관한 것이다.
본 발명의 배경
DNA-코딩된 조합 라이브러리는 신약 개발에 있어 많은 이점을 제공한다. 상기 라이브러리는 신속하게 스크리닝되고 검사될 수 있는 다수의 다양한 화합물을 제공할 수 있다. 추가로 복잡성을 증가시키기 위하여, 개발 과정 중 다양한 단계가 프로그램화되고 자동화될 수 있다. 이들 단계는 빌딩 블록을 원자 또는 다원자 스캐폴드에 첨가하는 다단계, 스플릿(split)-및-풀(pool) 합성 사용, 및 합성 단계 및 빌딩 블록 둘 모두를 코딩하는 DNA 태그를 첨가하기 위한 효소적 및/또는 화학적 라이게이션(ligation) 사용을 포함한다.
이러한 이점에도 불구하고, 매우 크거나 복잡한 라이브러리가 합성되고 디컨볼루션(deconvolution)되어야 하는 경우에는 많은 문제들이 제기될 수 있다. 라이브러리의 크기가 증가함에 따라, 높은 태그 라이게이션 수율을 제공하기 위해서는 개선된 방법이 요구될 수 있다. 다양한 반응 조건하에서 라이브러리를 생성하기 위해서는 안정적인 라이게이션된 뉴클레오티드 구축물, 예컨대 높은 pH 및 승온 조건하에서 안정적인 구축물이 이로울 수 있다. 태그의 디컨볼루션을 간소화시키기 위해, 태그의 서열은 DNA- 또는 RNA-의존성 폴리머라제에 의해 인식될 수 있고, 이로써, 태그 집단의 통계학적 정보는 주형-의존성 중합 및 서열 측정에 의해 측정될 수 있다. 이들 유익한 속성들 모두를 갖는 라이브러리를 생성할 때 어려움이 제기될 수도 있다. 따라서, DNA-코딩된 라이브러리에서 소형 화합물을 스크리닝하고 확인할 수 있는 보다 강력하고 개선된 방법이 요구되고 있다.
본 발명의 개요
본 발명은 태그의 단일 가닥 라이게이션을 개선시키는 하나 이상의 조건을 포함하는 라이브러리를 생성하는 방법, 및 라이브러리 생성에 사용하기 위한 조성물을 특징으로 한다. 예시적인 조건으로는 태그내 하나 이상의 2'-치환된 염기, 예컨대 2'-O-메틸 또는 2'-플루오로 사용; 특정 길이의 태그 사용; 하나 이상의 효소 사용; 임의로, 태그 디자인에서 오류-인식 능력 포함; 및/또는 라이게이션 동안 하나 이상의 작용제 사용을 포함한다.
따라서, 본 발명은 (i) 제1 관능기 및 제2 관능기를 갖는 헤드피스(headpiece)를 제공하는 단계로서, 여기서 헤드피스는 하나 이상의 2'-치환된 뉴클레오티드를 포함하는 것인 단계; (ii) 헤드피스의 제1 관능기를 화학적 엔티티의 제1 성분에 결합시키는 단계로서, 여기서 헤드피스는 제1 성분에 직접적으로 연결되거나 이관능성 링커 (예컨대, 폴리에틸렌 글리콜 링커 또는 -(CH2CH2O)nCH2CH2- (여기서, n은 정수 1 내지 50이다)에 의해 제1 성분에 간접적으로 연결되는 것인 단계; 및 (iii) 헤드피스의 제2 관능기를 제1 빌딩 블록 태그에 결합시켜 복합체를 형성함으로써 태그부착된 라이브러리를 제공하는 단계를 포함하며, 여기서 단계 (ii) 및 (iii)은 임의의 순서로 수행될 수 있고, 제1 빌딩 블록 태그는 단계 (ii)의 결합 반응을 코딩하는 것인, 올리고뉴클레오티드-코딩된 화학적 엔티티를 포함하는 제1 라이브러리에 태그부착하는 방법을 특징으로 한다.
일부 실시양태에서, 헤드피스는 헤드피스의 5'-말단, 3'-말단, 또는 내부 위치 중 하나 이상에 2'-치환된 뉴클레오티드를 포함한다. 특정 실시양태에서, 헤드피스는 5'-말단 또는 3'-말단에 2'-치환된 뉴클레오티드 및 제2 관능기를 포함한다.
다른 실시양태에서, 제1 빌딩 블록 태그는 하나 이상의 (예컨대, 적어도 2, 3, 4, 5개 이상의) 2'-치환된 뉴클레오티드를 포함한다. 특정 실시양태에서, 제1 빌딩 블록 태그는 제1 빌딩 블록 태그의 5'-말단, 3'-말단, 또는 내부 위치 중 하나 이상에 2'-치환된 뉴클레오티드 (예컨대, 5'- 및 3'-말단 둘 모두에 2'-O-메틸 뉴클레오티드 또는 2'-플루오로 뉴클레오티드)를 포함한다. 일부 실시양태에서, 제1 빌딩 블록 태그는 3'-말단 또는 5'-말단에 보호기를 포함한다.
본원에 기술된 임의의 실시양태에서, 2'-치환된 뉴클레오티드는 2'-O-메틸 뉴클레오티드 (예컨대, 2'-O-메틸 구아닌 또는 2'-O-메틸 우라실) 또는 2'-플루오로 뉴클레오티드 (예컨대, 2'-플루오로 구아닌, 또는 2'-플루오로 우라실)이다.
상기 임의의 실시양태에서, 단계 (ii)는 헤드피스를 제1 성분 (예컨대, 스캐폴드 또는 제1 빌딩 블록)에 직접적으로 연결, 결합, 또는 작동적으로 회합시키는 것을 포함할 수 있다. 추가의 다른 실시양태에서, 단계 (ii)는 헤드피스를 이관능성 링커를 통해 제1 성분 (예컨대, 스캐폴드 또는 제1 빌딩 블록)에 간접적으로 결합시키는 것을 포함한다 (예컨대, 본 방법은 헤드피스를 링커의 제1 관능기와 결합, 및 제1 성분을 링커의 제2 관능기와 결합시키는 것을 포함한다).
상기 임의의 실시양태에서, 본 방법은 (iv) 제2 빌딩 블록 태그를 복합체의 5'-말단 또는 3'-말단에 결합시키는 단계, 및 (v) 화학적 라이브러리의 제2 성분 (예컨대, 제1 빌딩 블록 또는 제2 빌딩 블록)을 제1 성분에 결합시키는 단계를 추가로 포함할 수 있고, 여기서 단계 (iv) 및 (v)는 임의의 순서로 수행될 수 있다. 일부 실시양태에서, 제2 빌딩 블록 태그는 단계 (v)의 결합 반응을 코딩한다. 다른 실시양태에서, 단계 (iv)는 제2 빌딩 블록 태그를 복합체의 5'-말단에 결합시키는 것을 포함할 수 있고; 복합체는 5'-말단에 포스페이트기를 포함하고; 제2 빌딩 블록 태그는 3'- 및 5'-말단 둘 모두에 히드록실기를 포함한다. 다른 실시양태에서, 단계 (iv)는 제2 빌딩 블록 태그를 결합시키기 이전에, 복합체를 정제하고 복합체를 폴리뉴클레오티드 키나제와 함께 반응시켜 5'-말단 상에 포스페이트기를 형성하는 것을 추가로 포함할 수 있다. 다른 실시양태에서, 단계 (iv)는 제2 빌딩 블록 태그를 복합체의 3'-말단에 결합시키는 것을 포함할 수 있고; 복합체는 3'-말단에 보호기를 포함하고; 제2 빌딩 블록 태그는 5'-말단에 포스페이트기 및 3'-말단에 보호기를 포함한다. 추가의 다른 실시양태에서, 단계 (iv)는 제2 빌딩 블록 태그를 복합체에 결합시키기 이전에, 복합체를 가수분해제와 반응시켜 복합체로부터 보호기를 방출시키는 것을 포함할 수 있다.
추가의 실시양태에서, 제2 빌딩 블록 태그는 제2 빌딩 블록 태그의 5'-말단, 3'-말단, 또는 내부 위치 중 하나 이상에 2'-치환된 뉴클레오티드 (예컨대, 2'-O-메틸 뉴클레오티드 또는 2'-플루오로 뉴클레오티드) (예컨대, 5'- 및 3'-말단 둘 모두에 2'-O-메틸 뉴클레오티드 및/또는 2'-플루오로 뉴클레오티드)를 포함한다.
일부 실시양태에서, 단계 (iv)는 RNA 리가제 (예컨대, T4 RNA 리가제) 및/또는 DNA 리가제 (예컨대, ssDNA 리가제)를 사용하여 제2 빌딩 블록 태그를 복합체에 결합시키는 것을 포함할 수 있다 (예컨대, RNA 리가제 및 DNA 리가제 둘 모두를 사용하는 것을 포함할 수 있다).
다른 실시양태에서, 단계 (iii)은 RNA 리가제 (예컨대, T4 RNA 리가제) 및/또는 DNA 리가제 (예컨대, ssDNA 리가제)를 사용하여 헤드피스를 제1 빌딩 블록 태그에 결합시키는 것을 포함할 수 있다 (예컨대, RNA 리가제 및 DNA 리가제 둘 모두를 사용하는 것을 포함할 수 있다).
추가의 실시양태에서, 단계 (iii) 및/또는 단계 (iv) (존재할 경우)는 폴리에틸렌 글리콜 및/또는 하나 이상의 가용성 다가 양이온 (예컨대, 염화마그네슘, 염화망가니즈(II), 또는 염화헥사민코발트(III))을 사용하는 것을 포함할 수 있다. 일부 실시양태에서, 폴리에틸렌 글리콜은 약 25% (w/v) 내지 약 35% (w/v)의 양 (예컨대, 약 25% (w/v) 내지 약 30% (w/v), 약 30% (w/v) 내지 약 35% (w/v), 또는 약 30% (w/v))으로 존재한다. 다른 실시양태에서, 폴리에틸렌 글리콜의 평균 분자량은 약 3,000 내지 약 5,500 달톤 (예컨대, 약 4,600 달톤)이다. 다른 실시양태에서, 하나 이상의 가용성 다가 양이온은 약 0.05 mM 내지 약 10.5 mM (예컨대, 0.05 mM 내지 0.5 mM, 0.05 mM 내지 0.75 mM, 0.05 mM 내지 1.0 mM, 0.05 mM 내지 1.5 mM, 0.05 mM 내지 2.0 mM, 0.05 mM 내지 3.0 mM, 0.05 mM 내지 4.0 mM, 0.05 mM 내지 5.0 mM, 0.05 mM 내지 6.0 mM, 0.05 mM 내지 7.0 mM, 0.05 mM 내지 8.0 mM, 0.05 mM 내지 9.0 mM, 0.05 mM 내지 10.0 mM, 0.1 mM 내지 0.5 mM, 0.1 mM 내지 0.75 mM, 0.1 mM 내지 1.0 mM, 0.1 mM 내지 1.5 mM, 0.1 mM 내지 2.0 mM, 0.1 mM 내지 3.0 mM, 0.1 mM 내지 4.0 mM, 0.1 mM 내지 5.0 mM, 0.1 mM 내지 6.0 mM, 0.1 mM 내지 7.0 mM, 0.1 mM 내지 8.0 mM, 0.1 mM 내지 9.0 mM, 0.1 mM 내지 10.0 mM, 0.1 mM 내지 10.5 mM, 0.5 mM 내지 0.75 mM, 0.5 mM 내지 1.0 mM, 0.5 mM 내지 1.5 mM, 0.5 mM 내지 2.0 mM, 0.5 mM 내지 3.0 mM, 0.5 mM 내지 4.0 mM, 0.5 mM 내지 5.0 mM, 0.5 mM 내지 6.0 mM, 0.5 mM 내지 7.0 mM, 0.5 mM 내지 8.0 mM, 0.5 mM 내지 9.0 mM, 0.5 mM 내지 10.0 mM, 0.5 mM 내지 10.5 mM, 0.75 mM 내지 1.0 mM, 0.75 mM 내지 1.5 mM, 0.75 mM 내지 2.0 mM, 0.75 mM 내지 3.0 mM, 0.75 mM 내지 4.0 mM, 0.75 mM 내지 5.0 mM, 0.75 mM 내지 6.0 mM, 0.75 mM 내지 7.0 mM, 0.75 mM 내지 8.0 mM, 0.75 mM 내지 9.0 mM, 0.75 mM 내지 10.0 mM, 0.75 mM 내지 10.5 mM, 1.0 mM 내지 1.5 mM, 1.0 mM 내지 2.0 mM, 1.0 mM 내지 3.0 mM, 1.0 mM 내지 4.0 mM, 1.0 mM 내지 5.0 mM, 1.0 mM 내지 6.0 mM, 1.0 mM 내지 7.0 mM, 1.0 mM 내지 8.0 mM, 1.0 mM 내지 9.0 mM, 1.0 mM 내지 10.0 mM, 1.0 mM 내지 10.5 mM, 1.5 mM 내지 2.0 mM, 1.5 mM 내지 3.0 mM, 1.5 mM 내지 4.0 mM, 1.5 mM 내지 5.0 mM, 1.5 mM 내지 6.0 mM, 1.5 mM 내지 7.0 mM, 1.5 mM 내지 8.0 mM, 1.5 mM 내지 9.0 mM, 1.5 mM 내지 10.0 mM, 1.5 mM 내지 10.5 mM, 2.0 mM 내지 3.0 mM, 2.0 mM 내지 4.0 mM, 2.0 mM 내지 5.0 mM, 2.0 mM 내지 6.0 mM, 2.0 mM 내지 7.0 mM, 2.0 mM 내지 8.0 mM, 2.0 mM 내지 9.0 mM, 2.0 mM 내지 10.0 mM, 및 2.0 mM 내지 10.5 mM)의 양으로 존재한다. 일부 실시양태에서, 하나 이상의 다가 양이온은 약 1 mM (예컨대, 0.5 mM 내지 1.5 mM)의 양으로 존재한다. 특정 실시양태에서, 다가 양이온은 염화헥사민코발트(III) 형태로 존재한다.
다른 실시양태에서, 본 방법은 결합 단계 (ii) 내지 (v) 중 어느 한 단계를 수행하기 전에, 임의의 비반응 태그 또는 비반응 헤드피스로부터 복합체를 분리시키는 단계를 포함한다. 다른 실시양태에서, 본 방법은 결합 단계 (ii) 내지 (v) 중 어느 한 단계를 수행하기 전에, 복합체를 정제하는 단계를 추가로 포함한다. 다른 실시양태에서, 본 방법은 결합 단계 (ii) 내지 (v) 중 어느 한 단계를 수행한 후에 임의의 순서로 하나 이상의 추가의 성분 (예컨대, 스캐폴드 또는 제1 빌딩 블록) 및 하나 이상의 추가의 빌딩 블록 태그를 결합시키는 단계를 추가로 포함한다.
본 발명은 또한 (i) 제1 관능기 및 제2 관능기를 갖는 헤드피스를 제공하는 단계로서, 여기서 헤드피스는 5'-말단에 2'-치환된 뉴클레오티드, 임의로 헤드피스의 내부 위치에 하나 이상의 뉴클레오티드, 및 3'-말단에 2'-위치 및/또는 3'-위치에 보호기를 포함하는 것인 단계; (ii) 헤드피스의 제1 관능기를 화학적 엔티티의 제1 성분에 결합시키는 단계로서, 여기서 헤드피스는 제1 성분에 직접적으로 연결되거나 또는 이관능성 링커에 의해 제1 성분에 간접적으로 연결되는 것인 단계; 및 (iii) 헤드피스의 제2 관능기를 제1 빌딩 블록 태그에 결합시켜 태그부착된 라이브러리를 제공하는 단계로서, 여기서 제1 빌딩 블록 태그는 5'-말단에 2'-치환된 뉴클레오티드 및 히드록실기, 임의로 태그의 내부 위치에 하나 이상의 뉴클레오티드, 및 3'-말단에 2'-치환된 뉴클레오티드 및 히드록실기를 포함하는 것인 단계를 포함하며, 여기서 단계 (ii) 및 (iii)은 임의의 순서로 수행될 수 있고, 제1 빌딩 블록 태그는 단계 (ii)의 결합 반응을 코딩하는 것인, 올리고뉴클레오티드-코딩된 화학적 엔티티를 포함하는 제1 라이브러리에 태그부착하는 방법을 특징으로 한다.
일부 실시양태에서, 2'-치환된 뉴클레오티드는 2'-O-메틸 뉴클레오티드 (예컨대, 2'-O-메틸 구아닌) 또는 2'-플루오로 뉴클레오티드 (예컨대, 2'-플루오로 구아닌)이다. 다른 실시양태에서, 헤드피스의 내부 위치의 하나 이상의 뉴클레오티드는 2'-데옥시뉴클레오티드이다. 추가의 다른 실시양태에서, 이관능성 링커는 폴리에틸렌 글리콜 링커 (예컨대, -(CH2CH2O)nCH2CH2- (여기서, n은 정수 1 내지 50이다))이다.
다른 실시양태에서, 하나 이상의 뉴클레오티드 (예컨대, 하나 이상의 2'-데옥시뉴클레오티드)는 헤드피스 또는 태그의 내부 위치에 존재한다.
일부 실시양태에서, 단계 (iii)은 하나 이상의 가용성 다가 양이온 (예컨대, 염화마그네슘, 염화망가니즈(II), 또는 염화헥사민코발트(III)), 폴리에틸렌 글리콜 (예컨대, 평균 분자량이 약 4,600 달톤), 및 RNA 리가제 (예컨대, T4 RNA 리가제)를 사용하는 것을 포함할 수 있다.
또 다른 측면에서, 본 발명은 올리고뉴클레오티드-코딩된 화학적 엔티티를 포함하는 제1 라이브러리에 태그부착하는 단계 (예컨대, 단계 (i) 내지 (iii) 포함, 및 임의로 단계 (iv) 내지 (v) 포함), 및 특정 특징 또는 기능에 대하여 선별하는 단계 (예컨대, 단백질 표적에의 결합에 대하여 선별하는 것은 올리고뉴클레오티드-코딩된 화학적 엔티티 또는 화학적 엔티티를 단백질 표적에 노출시키고, 단백질 표적에 결합한 하나 이상의 올리고뉴클레오티드-코딩된 화학적 엔티티 또는 화학적 엔티티를 (예컨대, 크기 배제 크로마토그래피에 의해) 선별하는 것을 포함)를 포함하는, 화학적 엔티티를 확인하고/거나 발견하는 방법을 특징으로 한다. 본 발명은 또한 헤드피스 및 빌딩 블록 태그를 포함하는 복합체로서, 여기서 태그는 5 내지 20개의 뉴클레오티드, 5'-말단에 2'-치환된 뉴클레오티드, 및 3'-말단에 2'-치환된 뉴클레오티드를 포함하는 것인 복합체를 특징으로 한다. 일부 실시양태에서, 5'-말단 및/또는 3'-말단의 2'-치환된 뉴클레오티드는 2'-O-메틸 뉴클레오티드 (예컨대, 2'-O-메틸 구아닌 또는 2'-O-메틸 우라실) 또는 2'-플루오로 뉴클레오티드 (예컨대, 2'-플루오로 구아닌 또는 2'-플루오로 우라실)이다. 특정 실시양태에서, 헤드피스는 헤어핀 구조를 포함한다. 일부 실시양태에서, 헤드피스는 헤드피스의 5'-말단, 3'-말단, 또는 내부 위치 중 하나 이상에 2'-치환된 뉴클레오티드를 포함한다. 다른 실시양태에서, 헤드피스는 프리아데닐화된 5'-말단을 추가로 포함한다. 추가의 다른 실시양태에서, 헤드피스는 5 내지 20개의 뉴클레오티드를 포함한다.
상기 임의의 실시양태에서, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 또는 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)는, 프리아데닐화된 5'-말단을 포함한다.
상기 임의의 실시양태에서, 본 방법은 하나 이상의 (예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의) 추가의 빌딩 블록 태그를 복합체에 결합시키는 단계, 및 하나 이상의 (예컨대, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개) 추가의 성분 (예컨대, 스캐폴드 또는 빌딩 블록)을 복합체에 결합시켜 태그부착된 라이브러리를 제공하는 단계를 포함하며, 여기서 하나 이상의 추가의 빌딩 블록 태그는 하나 이상의 추가의 성분을 코딩하거나, 하나 이상의 추가의 성분의 결합 반응을 코딩한다.
상기 임의의 실시양태에서, 2'-치환된 뉴클레오티드는 2'-O-메틸 뉴클레오티드, 예컨대 2'-O-메틸 구아닌, 2'-O-메틸 우라실, 2'-O-메틸 아데노신, 2'-O-메틸 티미딘, 2'-O-메틸 이노신, 2'-O-메틸 시티딘, 또는 2'-O-메틸 디아미노 퓨린이다. 별법으로, 상기 임의의 실시양태에서, 2'-치환된 뉴클레오티드는 2'-플루오로 뉴클레오티드, 예컨대 2'-플루오로 구아닌, 2'-플루오로 우라실, 2'-플루오로 아데노신, 2'-플루오로 티미딘, 2'-플루오로 이노신, 2'-플루오로 시티딘, 또는 2'-플루오로 디아미노 퓨린이다.
상기 임의의 실시양태에서, RNA 리가제는 T4 RNA 리가제이고/거나, DNA 리가제는 ssDNA 리가제이다.
상기 임의의 실시양태에서, 본 방법은 다수의 헤드피스를 포함한다. 본 방법의 일부 실시양태에서, 다수의 헤드피스의 각 헤드피스는 동일한 서열 영역 및 상이한 코딩 영역을 포함한다. 특정 실시양태에서, 동일한 서열 영역은 프라이머 결합 영역이다. 다른 실시양태에서, 상이한 코딩 영역은 헤드피스, 또는 개시 성분의 부가를 코딩하는 개시 빌딩 블록 태그이다.
상기 임의의 실시양태에서, 단계 (ii) 내지 (iv) (존재할 경우) 중 하나 이상의 단계에서의 결합은 효소적 라이게이션 및/또는 화학적 라이게이션을 포함한다. 일부 실시양태에서, 효소적 라이게이션은 RNA 리가제 (예컨대, T4 RNA 리가제) 또는 DNA 리가제 (예컨대, ssDNA 리가제)를 사용하는 것을 포함한다. 다른 실시양태에서, 효소적 라이게이션은 RNA 리가제 (예컨대, T4 RNA 리가제) 및 DNA 리가제 (예컨대, ssDNA 리가제)를 사용하는 것을 포함한다. 일부 실시양태에서, 화학적 라이게이션은 하나 이상의 화학적 공-반응성 쌍 (예컨대, 임의로 치환된 아지도기와 함께 임의로 치환된 알키닐기를 포함하는 쌍; 2π 전자계를 갖는 임의로 치환된 친디엔체(dienophile) 또는 임의로 치환된 이종친디엔체 (예컨대, 임의로 치환된 알케닐기 또는 임의로 치환된 알키닐기)와 함께 4π 전자계를 갖는 임의로 치환된 디엔 (예컨대, 임의로 치환된 1,3-불포화 화합물, 예컨대 임의로 치환된 1,3-부타디엔, 1-메톡시-3-트리메틸실릴옥시-1,3-부타디엔, 시클로펜타디엔, 시클로헥사디엔, 또는 푸란)을 포함하는 쌍; 변형된 헤테로시클릴 친전자체 (예컨대, 임의로 치환된 에폭시드, 아지리딘, 아지리디늄 이온, 또는 에피술포늄 이온)와 함께 친핵체 (예컨대, 임의로 치환된 아민 또는 임의로 치환된 티올)를 포함하는 쌍; 아이오도기 (예컨대, 3'-말단에 포스포로티오에이트기 및 5'-말단에 아이오도기)와 함께 포스포로티오에이트기를 포함하는 쌍; 또는 아미노기 (예컨대, 히드라지도기를 비롯한, 1급 아미노 또는 2급 아미노기)와 함께 알데히드기를 포함하는 쌍)을 사용하는 것은 포함한다. 특정 실시양태에서, 화학적 공-반응성 쌍은 약 4 내지 약 24개의 원자 (예컨대, 약 4 내지 약 10개의 원자)의 길이를 갖는 생성된 스페이서를 형성한다. 다른 실시양태에서, 화학적 라이게이션은 (예컨대, 3'-말단에) 포스포로티오에이트기, 및 (예컨대, 5'-말단에) 아이오도기를 사용하는 것을 포함한다. 추가의 실시양태에서, 화학적 라이게이션은 결합 반응에서 스플린트(splint) 올리고뉴클레오티드를 포함한다. 일부 실시양태에서, 화학적 라이게이션은 (예컨대, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 하나 이상의 추가의 빌딩 블록 태그, 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그 (존재할 경우)의 3'-말단에) 포스포로티오에이트기, (예컨대, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 하나 이상의 추가의 빌딩 블록 태그, 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그 (존재할 경우)의 5'-말단에) 아이오도기, 및 결합 반응에서 스플린트 올리고뉴클레오티드를 사용하는 것을 포함하며, 여기서 사용은 하나 이상의 보호기를 사용하는 것을 회피한다. 다른 실시양태에서, 다중 태그의 화학적 라이게이션은 연속 태그를 라이게이션시키기 위하여 오르토고날(orthogonal) 화학적 공-반응성 쌍 (예컨대, 본원에 기술된 임의의 2개 이상의 화학적 공-반응성 쌍)을 교대로 사용하는 것을 포함한다.
상기 임의의 실시양태에서, 헤드피스는 단일 가닥 (예컨대, 헤어핀) 구조를 포함할 수 있다.
상기 임의의 실시양태에서, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 하나 이상의 추가의 빌딩 블록 태그, 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그 (존재할 경우)는 본원에 기술된 임의의 서열 (예컨대, 서열 6-21, 26, 27, 또는 29-31 중 어느 하나의 서열)과 실질적으로 동일한 (예컨대, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상 동일한) 서열, 또는 본원에 기술된 임의의 서열 (예컨대, 서열 6-21, 26, 27, 또는 29-31 중 어느 하나의 서열)과 실질적으로 동일한 (예컨대, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상 동일한) 서열과 상보적인 서열을 포함한다. 특정 실시양태에서, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 하나 이상의 추가의 빌딩 블록 태그, 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그 (존재할 경우)는 서열 1 또는 서열 2의 서열과 실질적으로 동일한 (예컨대, 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 이상 동일한) 서열을 추가로 포함한다.
상기 임의의 실시양태에서, 본 방법 또는 복합체는 오직 단일 가닥 분자만을 포함하며, 여기서 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 및/또는 하나 이상의 추가의 빌딩 블록 태그는 단일 가닥이다. 일부 실시양태에서, 단일 가닥 분자 중 하나 이상은 헤어핀 구조를 가진다. 특정 실시양태에서, 헤드피스는 헤어핀 구조를 포함하고, 하나 이상의 빌딩 블록 태그는 헤어핀 구조를 포함하지 않는다.
상기 임의의 실시양태에서, 본 방법은 본원에 기술된 바와 같이, 라이브러리를 다양화하거나, 또는 라이브러리의 구성원을 검사하는 하나 이상의 임의적 단계를 추가로 포함한다. 한 실시양태에서, 본 방법은 관심의 대상이 되는 치료제 단백질에 결합하거나, 그를 불활성화시키는 소형 약물-유사 라이브러리의 구성원을 확인하는 단계를 추가로 포함한다. 다른 실시양태에서, 본 방법은 라이브러리의 하나 이상의 구성원이 표적에 결합하는 데 적합한 조건하에서 라이브러리의 구성원을 생물학적 표적과 접촉시키는 단계, 표적에 결합하지 못한 하나 이상의 라이브러리 구성원을 제거하는 단계, 및 그와 관련된 하나 이상의 올리고뉴클레오티드 태그를 분석하는 단계를 포함한다.
본원에 기술된 바와 같이, 단일 가닥 분자 (예컨대, 헤어핀 분자 포함)를 사용하는 데에는 많은 이점이 있을 수 있다. 따라서, 본원에 기술된 임의의 실시양태에서, 본 방법 및 복합체는, 하나 이상의 이중 가닥 분자 (예컨대, 이중 가닥 헤드피스 또는 이중 가닥 빌딩 블록 태그)를 포함하는 방법과 비교하여 질량이 감소되고/거나, (예컨대, 유기 용매 중에서의) 용해도가 증가되고/거나, 비용이 감소되고/거나, 반응성이 증가되고/거나, 표적 접근가능성이 증가되고/거나, 수력학적 반경이 감소되고/거나, 분석학적 평가의 정확도가 증가된 헤드피스, 하나 이상의 빌딩 블록 태그, 복합체, 화학적 엔티티, 분자, 또는 태그부착된 라이브러리의 임의의 구성원을 포함한다. 일부 실시양태에서, 각각의 빌딩 블록 태그 (예컨대, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 및/또는 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우))의 질량은 대략 동일하다 (예컨대, 각각의 빌딩 블록 태그는 2개 이상의 빌딩 블록 태그 사이의 평균 질량으로부터 약 +/-10%의 질량을 가진다. 특정 실시양태에서, 빌딩 블록 태그는 이중 가닥 태그 (예컨대, 질량이 약 15,000 달톤, 약 14,000 달톤, 약 13,000 달톤, 또는 약 12,000 달톤인 이중 가닥 태그)와 비교하여 감소된 질량 (예컨대, 약 15,000 달톤, 약 14,000 달톤, 약 13,000 달톤, 약 12,000 달톤, 약 11,000 달톤, 약 10,000 달톤, 약 9,000 달톤, 약 8,000 달톤, 약 7,500 달톤, 약 7,000 달톤, 약 6,000 달톤, 약 6,500 달톤, 약 5,000 달톤, 약 5,500 달톤, 약 4,000 달톤, 약 4,500 달톤, 또는 약 3,000 달톤 미만)을 가진다. 다른 실시양태에서, 빌딩 블록 태그는 이중 가닥 태그 (예컨대, 약 20개 미만의 뉴클레오티드, 약 19개 미만의 뉴클레오티드, 약 18개 미만의 뉴클레오티드, 약 17개 미만의 뉴클레오티드, 약 16개 미만의 뉴클레오티드, 약 15개 미만의 뉴클레오티드, 약 14개 미만의 뉴클레오티드, 약 13개 미만의 뉴클레오티드, 약 12개 미만의 뉴클레오티드, 약 11개 미만의 뉴클레오티드, 약 10개 미만의 뉴클레오티드, 약 9개 미만의 뉴클레오티드, 약 8개 미만의 뉴클레오티드, 또는 약 7개 미만의 뉴클레오티드의 길이를 갖는 이중 가닥 태그)와 비교하여 감소된 길이를 가진다. 일부 실시양태에서, 하나 이상의 빌딩 블록 태그 또는 라이브러리의 구성원은 (예컨대, 선별 단계, 예컨대 크기 배제 크로마토그래피를 사용하는 선별 단계 동안에는) 프라이머 결합 영역 및/또는 불변 영역을 포함하지 않는다. 일부 실시양태에서, 하나 이상의 빌딩 블록 태그 또는 라이브러리의 구성원은 감소된 불변 영역 (예컨대, 길이가 약 30개 미만의 뉴클레오티드, 약 25개 미만의 뉴클레오티드, 약 20개 미만의 뉴클레오티드, 약 19개 미만의 뉴클레오티드, 약 18개 미만의 뉴클레오티드, 약 17개 미만의 뉴클레오티드, 약 16개 미만의 뉴클레오티드, 약 15개 미만의 뉴클레오티드, 약 14개 미만의 뉴클레오티드, 약 13개 미만의 뉴클레오티드, 약 12개 미만의 뉴클레오티드, 약 11개 미만의 뉴클레오티드, 약 10개 미만의 뉴클레오티드, 약 9개 미만의 뉴클레오티드, 약 8개 미만의 뉴클레오티드, 또는 약 7개 미만의 뉴클레오티드인 것)을 가진다. 다른 실시양태에서, 본 방법은 분자, 화학적 엔티티의 일부, 단계 중 결합 반응 (예컨대, 화학적 또는 효소적 라이게이션), 또는 라이브러리의 아이덴티티(identity)를 코딩하는 헤드피스를 포함하며, 여기서 코딩 헤드피스로 인해 상기 정보를 코딩하는 추가의 빌딩 블록 태그의 필요성은 없어진다.
상기 임의의 실시양태에서, 올리고뉴클레오티드 (예컨대, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 및/또는 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우))는 라이브러리의 아이덴티티를 코딩한다. 일부 실시양태에서, 올리고뉴클레오티드 (예컨대, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 및/또는 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우))는 제1 라이브러리-확인 서열을 포함하며, 여기서 상기 서열은 제1 라이브러리의 아이덴티티를 코딩한다. 특정 실시양태에서, 올리고뉴클레오티드는 제1 라이브러리-확인 태그이다. 일부 실시양태에서, 본 방법은 제1 라이브러리-확인 태그를 제공하는 단계로서, 여기서 상기 태그는 제1 라이브러리를 코딩하는 서열을 포함하는 것인 단계, 및/또는 제1 라이브러리-확인 태그를 복합체에 결합시키는 단계를 포함한다. 일부 실시양태에서, 본 방법은 제2 라이브러리를 제공하는 단계, 및 제1 라이브러리를 제2 라이브러리와 조합하는 단계를 포함한다. 추가의 실시양태에서, 본 방법은 제2 라이브러리-확인 태그를 제공하는 단계로서, 여기서 상기 태그는 제2 라이브러리를 코딩하는 서열을 포함하는 것인 단계를 포함한다.
상기 임의의 실시양태에서, 올리고뉴클레오티드 (예컨대, 헤드피스 및/또는 하나 이상의 빌딩 블록)는 라이브러리의 구성원의 사용 (예컨대, 본원에 기술된 바와 같이, 선별 단계 또는 결합 단계에서의 사용)을 코딩한다. 일부 실시양태에서, 올리고뉴클레오티드 (예컨대, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 및/또는 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우))는 사용 서열을 포함하며, 여기서 상기 서열은 하나 이상의 단계 (예컨대, 선별 단계 및/또는 결합 단계)에서 라이브러리 중의 구성원의 서브세트의 사용을 코딩한다. 특정 실시양태에서, 올리고뉴클레오티드는 사용 서열을 포함하는 사용 태그이다. 일부 실시양태에서, 올리고뉴클레오티드 (예컨대, 헤드피스 및/또는 하나 이상의 빌딩 블록)는 라이브러리의 구성원 (예컨대, 라이브러리의 특정 일부분 중의 것)의 기원을 코딩한다. 일부 실시양태에서, 올리고뉴클레오티드 (예컨대, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 및/또는 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우))는 기원 서열 (예컨대, 약 10, 9, 8, 7, 또는 6개의 뉴클레오티드의 길이를 갖는 무작위 축퇴성 서열)을 포함하며, 여기서 상기 서열은 라이브러리 중의 구성원의 기원을 코딩한다. 특정 실시양태에서, 올리고뉴클레오티드는 기원 서열을 포함하는 기원 태그이다. 일부 실시양태에서, 본 방법은 사용 태그 및/또는 기원 태그를 복합체에 연결, 결합, 또는 작동적으로 회합시키는 단계를 추가로 포함한다.
상기 임의의 실시양태에서, 본 방법, 조성물, 및 복합체는 임의로 테일피스(tailpiece)를 포함하며, 여기서 상기 테일피스는 본원에 기술된 바와 같이, 라이브러리-확인 서열, 사용 서열, 또는 기원 서열 중 하나 이상을 포함한다. 특정 실시양태에서, 본 방법은 테일피스 (예컨대, 라이브러리-확인 서열, 사용 서열, 또는 기원 서열 중 하나 이상을 포함하는 것)를 복합체에 연결, 결합, 또는 작동적으로 회합시키는 단계를 추가로 포함한다.
상기 임의의 실시양태에서, 본 방법, 조성물, 및 복합체, 또는 그의 일부 (예컨대, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 및/또는 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우))는 3'-말단의 말단 뉴클레오티드와 말단 뉴클레오티드에 인접한 뉴클레오티드 사이에 변형된 포스페이트기 (예컨대, 포스포로티오에이트 또는 5'-N-포스포르아미다이트 연결부)를 포함한다. 특정 실시양태에서, 변형된 포스페이트기는 변형된 포스페이트기를 포함하지 않는 두 올리고뉴클레오티드 (예컨대, 헤드피스 및 빌딩 블록 태그, 또는 제1 빌딩 블록 태그 및 제2 빌딩 블록 태그) 사이의 라이게이션과 비교하여, 두 올리고뉴클레오티드 사이의 효소적 라이게이션 동안 셔플링(shuffling)을 최소화시킨다 (예컨대, 헤드피스의 빌딩 블록 태그에의, 또는 제1 빌딩 블록 태그와 제2 빌딩 블록 태그 사이의 라이게이션시키고자 하는 두 올리고뉴클레오티드 서열과 비교하여 최종 생성물 또는 복합체 중의 추가의 뉴클레오티드의 포함, 또는 뉴클레오티드의 배제를 최소화시킨다). 일부 실시양태에서, 복합체는 포스포로티오에이트 또는 트리아졸 기를 포함할 수 있다.
상기 임의의 실시양태에서, 본 방법, 조성물, 및 복합체, 또는 그의 일부 (예컨대, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 및/또는 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우))는 반-수성, 감소된 수성, 또는 비-수성 (예컨대, 유기) 조건하에서의 용해도를 지원하는 변형을 포함한다. 일부 실시양태에서, 이관능성 링커, 헤드피스, 또는 하나 이상의 빌딩 블록 태그는 유기 조건하에서 상기 DNA-코딩된 화학적 라이브러리의 구성원의 용해도를 증가시킬 수 있도록 변형된다. 일부 실시양태에서, 변형은 알킬 쇄, 폴리에틸렌 글리콜 단위, 양전하를 갖는 분지형 종, 또는 소수성 고리 구조 중 하나 이상의 것이다. 일부 실시양태에서, 변형은 소수성 모이어티를 갖는 하나 이상의 변형된 뉴클레오티드 (예컨대, T 또는 C 염기의 C5 위치에서 지방족 쇄로 변형된 것, 예컨대 5'-디메톡시트리틸-N4-디이소부틸아미노메틸리덴-5-(1-프로피닐)-2'-데옥시시티딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 5'-디메톡시트리틸-5-(1-프로피닐)-2'-데옥시우리딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 5'-디메톡시트리틸-5- 플루오로-2'-데옥시우리딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 및 5'-디메톡시트리틸-5-(피렌-1-일-에티닐)-2'-데옥시우리딘, 또는 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트) 또는 소수성 모이어티를 갖는 삽입부 (예컨대, 아조벤젠)를 포함한다. 일부 실시양태에서, 라이브러리의 구성원은 약 1.0 내지 약 2.5 (예컨대, 약 1.0 내지 약 1.5, 약 1.0 내지 약 2.0, 약 1.3 내지 약 1.5, 약 1.3 내지 약 2.0, 약 1.3 내지 약 2.5, 약 1.5 내지 약 2.0, 약 1.5 내지 약 2.5, 또는 약 2.0 내지 약 2.5)의 옥탄올:물 계수를 가진다.
상기 임의의 실시양태에서, 헤드피스, 테일피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 하나 이상의 추가의 빌딩 블록 태그, 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그 (존재할 경우)는 5 내지 20개의 뉴클레오티드 (예컨대, 5 내지 7개의 뉴클레오티드, 5 내지 8개의 뉴클레오티드, 5 내지 9개의 뉴클레오티드, 5 내지 10개의 뉴클레오티드, 5 내지 11개의 뉴클레오티드, 5 내지 12개의 뉴클레오티드, 5 내지 13개의 뉴클레오티드, 5 내지 14개의 뉴클레오티드, 5 내지 15개의 뉴클레오티드, 5 내지 16개의 뉴클레오티드, 5 내지 17개의 뉴클레오티드, 5 내지 18개의 뉴클레오티드, 5 내지 19개의 뉴클레오티드, 6 내지 7개의 뉴클레오티드, 6 내지 8개의 뉴클레오티드, 6 내지 9개의 뉴클레오티드, 6 내지 10개의 뉴클레오티드, 6 내지 11개의 뉴클레오티드, 6 내지 12개의 뉴클레오티드, 6 내지 13개의 뉴클레오티드, 6 내지 14개의 뉴클레오티드, 6 내지 15개의 뉴클레오티드, 6 내지 16개의 뉴클레오티드, 6 내지 17개의 뉴클레오티드, 6 내지 18개의 뉴클레오티드, 6 내지 19개의 뉴클레오티드, 6 내지 20개의 뉴클레오티드, 7 내지 8개의 뉴클레오티드, 7 내지 9개의 뉴클레오티드, 7 내지 10개의 뉴클레오티드, 7 내지 11개의 뉴클레오티드, 7 내지 12개의 뉴클레오티드, 7 내지 13개의 뉴클레오티드, 7 내지 14개의 뉴클레오티드, 7 내지 15개의 뉴클레오티드, 7 내지 16개의 뉴클레오티드, 7 내지 17개의 뉴클레오티드, 7 내지 18개의 뉴클레오티드, 7 내지 19개의 뉴클레오티드, 7 내지 20개의 뉴클레오티드, 8 내지 9개의 뉴클레오티드, 8 내지 10개의 뉴클레오티드, 8 내지 11개의 뉴클레오티드, 8 내지 12개의 뉴클레오티드, 8 내지 13개의 뉴클레오티드, 8 내지 14개의 뉴클레오티드, 8 내지 15개의 뉴클레오티드, 8 내지 16개의 뉴클레오티드, 8 내지 17개의 뉴클레오티드, 8 내지 18개의 뉴클레오티드, 8 내지 19개의 뉴클레오티드, 8 내지 20개의 뉴클레오티드, 9 내지 10개의 뉴클레오티드, 9 내지 11개의 뉴클레오티드, 9 내지 12개의 뉴클레오티드, 9 내지 13개의 뉴클레오티드, 9 내지 14개의 뉴클레오티드, 9 내지 15개의 뉴클레오티드, 9 내지 16개의 뉴클레오티드, 9 내지 17개의 뉴클레오티드, 9 내지 18개의 뉴클레오티드, 9 내지 19개의 뉴클레오티드, 9 내지 20개의 뉴클레오티드, 10 내지 11개의 뉴클레오티드, 10 내지 12개의 뉴클레오티드, 10 내지 13개의 뉴클레오티드, 10 내지 14개의 뉴클레오티드, 10 내지 15개의 뉴클레오티드, 10 내지 16개의 뉴클레오티드, 10 내지 17개의 뉴클레오티드, 10 내지 18개의 뉴클레오티드, 10 내지 19개의 뉴클레오티드, 10 내지 20개의 뉴클레오티드, 11 내지 12개의 뉴클레오티드, 11 내지 13개의 뉴클레오티드, 11 내지 14개의 뉴클레오티드, 11 내지 15개의 뉴클레오티드, 11 내지 16개의 뉴클레오티드, 11 내지 17개의 뉴클레오티드, 11 내지 18개의 뉴클레오티드, 11 내지 19개의 뉴클레오티드, 11 내지 20개의 뉴클레오티드, 12 내지 13개의 뉴클레오티드, 12 내지 14개의 뉴클레오티드, 12 내지 15개의 뉴클레오티드, 12 내지 16개의 뉴클레오티드, 12 내지 17개의 뉴클레오티드, 12 내지 18개의 뉴클레오티드, 12 내지 19개의 뉴클레오티드, 12 내지 20개의 뉴클레오티드, 13 내지 14개의 뉴클레오티드, 13 내지 15개의 뉴클레오티드, 13 내지 16개의 뉴클레오티드, 13 내지 17개의 뉴클레오티드, 13 내지 18개의 뉴클레오티드, 13 내지 19개의 뉴클레오티드, 13 내지 20개의 뉴클레오티드, 14 내지 15개의 뉴클레오티드, 14 내지 16개의 뉴클레오티드, 14 내지 17개의 뉴클레오티드, 14 내지 18개의 뉴클레오티드, 14 내지 19개의 뉴클레오티드, 14 내지 20개의 뉴클레오티드, 15 내지 16개의 뉴클레오티드, 15 내지 17개의 뉴클레오티드, 15 내지 18개의 뉴클레오티드, 15 내지 19개의 뉴클레오티드, 15 내지 20개의 뉴클레오티드, 16 내지 17개의 뉴클레오티드, 16 내지 18개의 뉴클레오티드, 16 내지 19개의 뉴클레오티드, 16 내지 20개의 뉴클레오티드, 17 내지 18개의 뉴클레오티드, 17 내지 19개의 뉴클레오티드, 17 내지 20개의 뉴클레오티드, 18 내지 19개의 뉴클레오티드, 18 내지 20개의 뉴클레오티드, 및 19 내지 20개의 뉴클레오티드)를 포함할 수 있다. 특정 실시양태에서, 헤드피스, 제1 빌딩 블록 태그, 제2 빌딩 블록 태그, 하나 이상의 추가의 빌딩 블록 태그, 라이브러리-확인 태그, 사용 태그, 및/또는 기원 태그 (존재할 경우)는 20개 미만의 뉴클레오티드 (예컨대, 19개 미만의 뉴클레오티드, 18개 미만의 뉴클레오티드, 17개 미만의 뉴클레오티드, 16개 미만의 뉴클레오티드, 15개 미만의 뉴클레오티드, 14개 미만의 뉴클레오티드, 13개 미만의 뉴클레오티드, 12개 미만의 뉴클레오티드, 11개 미만의 뉴클레오티드, 10개 미만의 뉴클레오티드, 9개 미만의 뉴클레오티드, 8개 미만의 뉴클레오티드, 또는 7개 미만의 뉴클레오티드)의 길이를 갖는다.
특정 실시양태에서, 제1 빌딩 블록 태그 및 제2 빌딩 블록 태그는 같은 개수의 뉴클레오티드를 포함한다. 다른 실시양태에서, 제1 빌딩 블록 태그 또는 제2 빌딩 블록 태그 중 하나는 8개 초과의 뉴클레오티드 (예컨대, 9개 초과의 뉴클레오티드, 10개 초과의 뉴클레오티드, 11개 초과의 뉴클레오티드, 12개 초과의 뉴클레오티드, 13개 초과의 뉴클레오티드, 14개 초과의 뉴클레오티드, 및 15개 초과의 뉴클레오티드)를 포함한다. 일부 실시양태에서, 제1 빌딩 블록 태그는 8 내지 20개의 뉴클레오티드 (예컨대, 8 내지 9개의 뉴클레오티드, 8 내지 10개의 뉴클레오티드, 8 내지 11개의 뉴클레오티드, 8 내지 12개의 뉴클레오티드, 8 내지 13개의 뉴클레오티드, 8 내지 14개의 뉴클레오티드, 8 내지 15개의 뉴클레오티드, 8 내지 16개의 뉴클레오티드, 8 내지 17개의 뉴클레오티드, 8 내지 18개의 뉴클레오티드, 8 내지 19개의 뉴클레오티드, 8 내지 20개의 뉴클레오티드, 9 내지 10개의 뉴클레오티드, 9 내지 11개의 뉴클레오티드, 9 내지 12개의 뉴클레오티드, 9 내지 13개의 뉴클레오티드, 9 내지 14개의 뉴클레오티드, 9 내지 15개의 뉴클레오티드, 9 내지 16개의 뉴클레오티드, 9 내지 17개의 뉴클레오티드, 9 내지 18개의 뉴클레오티드, 9 내지 19개의 뉴클레오티드, 9 내지 20개의 뉴클레오티드, 10 내지 11개의 뉴클레오티드, 10 내지 12개의 뉴클레오티드, 10 내지 13개의 뉴클레오티드, 10 내지 14개의 뉴클레오티드, 10 내지 15개의 뉴클레오티드, 10 내지 16개의 뉴클레오티드, 10 내지 17개의 뉴클레오티드, 10 내지 18개의 뉴클레오티드, 10 내지 19개의 뉴클레오티드, 10 내지 20개의 뉴클레오티드, 11 내지 12개의 뉴클레오티드, 11 내지 13개의 뉴클레오티드, 11 내지 14개의 뉴클레오티드, 11 내지 15개의 뉴클레오티드, 11 내지 16개의 뉴클레오티드, 11 내지 17개의 뉴클레오티드, 11 내지 18개의 뉴클레오티드, 11 내지 19개의 뉴클레오티드, 11 내지 20개의 뉴클레오티드, 12 내지 13개의 뉴클레오티드, 12 내지 14개의 뉴클레오티드, 12 내지 15개의 뉴클레오티드, 12 내지 16개의 뉴클레오티드, 12 내지 17개의 뉴클레오티드, 12 내지 18개의 뉴클레오티드, 12 내지 19개의 뉴클레오티드, 12 내지 20개의 뉴클레오티드, 13 내지 14개의 뉴클레오티드, 13 내지 15개의 뉴클레오티드, 13 내지 16개의 뉴클레오티드, 13 내지 17개의 뉴클레오티드, 13 내지 18개의 뉴클레오티드, 13 내지 19개의 뉴클레오티드, 13 내지 20개의 뉴클레오티드, 14 내지 15개의 뉴클레오티드, 14 내지 16개의 뉴클레오티드, 14 내지 17개의 뉴클레오티드, 14 내지 18개의 뉴클레오티드, 14 내지 19개의 뉴클레오티드, 14 내지 20개의 뉴클레오티드, 15 내지 16개의 뉴클레오티드, 15 내지 17개의 뉴클레오티드, 15 내지 18개의 뉴클레오티드, 15 내지 19개의 뉴클레오티드, 15 내지 20개의 뉴클레오티드, 16 내지 17개의 뉴클레오티드, 16 내지 18개의 뉴클레오티드, 16 내지 19개의 뉴클레오티드, 16 내지 20개의 뉴클레오티드, 17 내지 18개의 뉴클레오티드, 17 내지 19개의 뉴클레오티드, 17 내지 20개의 뉴클레오티드, 18 내지 19개의 뉴클레오티드, 18 내지 20개의 뉴클레오티드, 및 19 내지 20개의 뉴클레오티드)를 갖는 공여자 태그 (예컨대, 본원에 정의된 것과 같은 것)이다.
정의
"2'-치환된 뉴클레오티드"란 염기 중 리보스의 2'-위치에서 치환을 갖는 뉴클레오티드 염기를 의미한다.
"약"이란 언급된 값이 +/-10%라는 것을 의미한다.
"이관능성"이란 2개의 화학적 모이어티의 결합을 허용하는 2개의 반응성 기를 가진다는 것을 의미한다. 예를 들어, 이관능성 링커는 본원에 기술된 바와 같이, 헤드피스 및 화학적 엔티티의 결합을 허용하는 2개의 반응성 기를 갖는 링커이다.
"결합한다"란 공유 결합 또는 비공유 결합에 의해 부착된다는 것을 의미한다. 비공유 결합은 반 데르 발스의 힘, 수소 결합, 이온 결합, 포획 또는 물리적 캡슐화, 흡수, 흡착, 및/또는 다른 분자내 힘에 의해 형성된 것을 포함한다. 결합은 임의의 유용한 수단에 의해, 예컨대, 효소적 결합 (예컨대, 효소적 라이게이션)에 의해, 또는 화학적 결합 (예컨대, 화학적 라이게이션)에 의해 달성될 수 있다.
"빌딩 블록"이란 화학적 엔티티의 구조 단위로서, 여기서 단위는 다른 화학적 구조 단위에 직접적으로 연결되거나, 또는 스캐폴드를 통해 간접적으로 연결된 것을 의미한다. 화학적 엔티티가 중합체 또는 올리고머일 때, 빌딩 블록은 그 중합체 또는 올리고머의 단량체 단위이다. 빌딩 블록은 하나 이상의 다른 빌딩 블록 또는 스캐폴드의 추가를 허용하는 하나 이상의 다양성 노드(node)를 가질 수 있다. 대개의 경우, 각 다양성 노드는 하나 이상의 빌딩 블록 또는 스캐폴드와 반응하여 화학적 엔티티를 형성할 수 있는 관능기이다. 일반적으로, 빌딩 블록은 둘 이상의 다양성 노드 (또는 반응성 관능기)를 가지지만, 일부 빌딩 블록은 하나의 다양성 노드 (또는 반응성 관능기)를 가질 수 있다. 별법으로, 코딩된 화학적 또는 결합 단계는 수개의 화학적 성분 (예컨대, 다성분 축합 반응 또는 다단계 공정)을 포함할 수 있다. 상이한 두 빌딩 블록 상의 반응성 기는 상보적이어야 하며, 즉, 함께 반응하여 공유 결합 또는 비공유 결합을 형성할 수 있어야 한다.
"빌딩 블록 태그"란 성분 (즉, 스캐폴드 또는 빌딩 블록)의 (예컨대, 결합 반응에 의한) 첨가, 라이브러리 중의 헤드피스, 라이브러리의 아이덴티티, 라이브러리의 사용, 및/또는 라이브러리 구성원의 기원을 코딩하는 라이브러리의 올리고뉴클레오티드 일부를 의미한다. "수용자 태그"는 반응성 엔티티 (예컨대, 효소적 라이게이션인 경우, 3'-말단의 히드록실기)를 갖는 빌딩 블록 태그를 의미한다. "공여자 태그"는 수용자 태그 상의 반응성 엔티티와 반응할 수 있는 엔티티 (예컨대, 효소적 라이게이션인 경우, 5'-말단의 포스포릴기)를 갖는 빌딩 블록 태그를 의미한다.
"화학적 엔티티"란 하나 이상의 빌딩 블록 및 임의로 스캐폴드를 포함하는 화합물을 의미한다. 화학적 엔티티는 하나 이상의 원하는 특징, 예컨대 생물학적 표적에 결합할 수 있는 능력, 용해도, 수소 결합 공여자 및 수용자의 이용가능성, 결합의 회전 자유도, 양전하, 음전하 등을 가지도록 디자인 또는 구축된 임의의 소형 분자 또는 펩티드 약물 또는 약물 후보물질일 수 있다. 특정 실시양태에서, 화학적 엔티티는 추가로 이관능성 또는 삼관능성 (그 초과) 엔티티로서 반응할 수 있다.
"화학적 공-반응성 쌍"이란 고수율 및 높은 열역학적 획득으로 모듈식 반응에 참여하여 스페이서를 생성하는 반응성 기의 쌍을 의미한다. 예시적인 반응 및 화학적 공-반응성 쌍으로는 임의로 치환된 알키닐기 및 임의로 치환된 아지도기의 쌍과의 휘스겐 1,3-양극성 고리화첨가 반응; 4π 전자계를 갖는 임의로 치환된 디엔, 및 2π 전자계를 갖는 임의로 치환된 친디엔체 또는 임의로 치환된 이종친디엔체의 쌍과의 딜스-알더(Diels-Alder) 반응; 친핵체 및 변형된 헤테로시클릴 친전자체와의 개환 반응; 포스포로티오에이트기 및 아이오도기와의 스플린트 라이게이션 반응; 및 알데히드기 및 아미노기와의 환원성 아민화를 포함한다.
"복합체" 또는 "라이게이션된 복합체"란 공유 결합 또는 비공유 결합에 의해 화학적 엔티티 및/또는 하나 이상의 올리고뉴클레오티드 태그와 작동적으로 회합된 헤드피스를 의미한다. 복합체는 임의로 화학적 엔티티와 헤드피스 사이의 이관능성 링커를 포함할 수 있다.
화학적 엔티티의 "성분"이란 스캐폴드 또는 빌딩 블록을 의미한다.
"다양성 노드"란 또 다른 빌딩 블록의 첨가를 허용하는 스캐폴드 또는 빌딩 블록 중의 한 위치에 있는 관능기를 의미한다.
"헤드피스"란 화학적 엔티티의 성분에, 및 빌딩 블록 태그에 작동적으로 연결된, 라이브러리 합성을 위한 출발 올리고뉴클레오티드를 의미한다. 임의로, 이관능성 링커는 헤드피스를 성분에 연결시킨다.
"라이브러리"란 분자 또는 화학적 엔티티의 집합체를 의미한다. 임의로, 분자 또는 화학적 엔티티는 분자 또는 화학적 엔티티의 일부를 코딩하는 하나 이상의 올리고뉴클레오티드에 결합한다.
"링커"란 헤드피스를 화학적 엔티티에 연결시키는 화학적 연결 엔티티를 의미한다.
"다가 양이온"이란 1개 초과의 리간드 또는 음이온과 1개 초과의 결합을 형성할 수 있는 양이온을 의미한다. 다가 양이온은 이온 복합체 또는 배위 복합체를 형성할 수 있다. 예시적인 다가 양이온으로는 알칼리토 금속 (예컨대, 마그네슘) 및 전이 금속 (예컨대, 망가니즈(II) 또는 코발트(III))으로부터의 것, 및 예컨대, 클로라이드, 아민, 및/또는 에틸렌디아민과 같이, 임의로 하나 이상의 음이온 및/또는 하나 이상의 1가 또는 다배위자 리간드에 결합하는 것을 포함한다.
"올리고뉴클레오티드"는 5'-말단, 3'-말단, 및 5'-말단과 3'-말단 사이의 내부 위치에 있는 하나 이상의 뉴클레오티드를 갖는 뉴클레오티드의 중합체를 의미한다. 올리고뉴클레오티드는, 합성되어 염기-쌍 인식을 위해 사용될 수 있는, 당업계에 공지되어 있는 DNA, RNA, 또는 그의 임의의 유도체를 포함할 수 있다. 올리고뉴클레오티드는 인접한 염기들을 가질 필요는 없으며, 올리고뉴클레오티드 사이사이에 링커 모이어티가 산재되어 있을 수 있다. 올리고뉴클레오티드 중합체는 천연 염기 (예컨대, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시구아노신, 데옥시시티딘, 이노신, 또는 디아미노 퓨린), 염기 유사체 (예컨대, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, C5-프로피닐시티딘, C5-프로피닐우리딘, C5-브로모우리딘, C5-플루오로우리딘, C5-아이오도우리딘, C5-메틸시티딘, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, O(6)-메틸구아닌, 및 2-티오시티딘), 변형된 뉴클레오티드 (예컨대, 2'-치환된 뉴클레오티드, 예컨대 2'-O-메틸화된 염기 및 2'-플루오로 염기), 삽입된 염기, 변형된 당 (예컨대, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스), 및/또는 변형된 포스페이트기 (예컨대, 포스포로티오에이트 및 5'-N-포스포르아미다이트 연결부)를 포함할 수 있다. 다른 변형된 염기는 본원에 기술되어 있다. "수용자 올리고뉴클레오티드"란 반응성 엔티티 (예컨대, 효소적 라이게이션인 경우, 3'-말단의 히드록실기 또는 화학적 라이게이션인 경우, 임의로 치환된 아지도기)를 갖는 올리고뉴클레오티드를 의미한다. "공여자 올리고뉴클레오티드"란 수용자 올리고뉴클레오티드 상의 반응성 엔티티와 반응할 수 있는 엔티티 (예컨대, 예컨대 효소적 라이게이션인 경우, 5'-말단의 포스포릴기 또는 화학적 라이게이션인 경우, 임의로 치환된 알키닐기)를 갖는 올리고뉴클레오티드를 의미한다.
"작동적으로 연결된" 또는 "작동적으로 회합된"이란 2개 이상의 화학적 구조체가 직접 또는 간접적으로 함께 연결됨으로써 일어날 것으로 예상되는 다양한 조작을 통해서도 연결된 상태 그대로 유지될 수 있도록 하는 것을 의미한다. 전형적으로, 화학적 엔티티 및 헤드피스는 간접적인 방식으로 (예컨대, 적절한 링커를 통해 공유적으로) 작동적으로 연결된다. 예를 들어, 링커는 화학적 엔티티에 대한 부착 부위 및 헤드피스에 대한 부착 부위를 갖는 이관능성 모이어티일 수 있다. 추가로, 화학적 엔티티 및 올리고뉴클레오티드 태그는 (예컨대, 적절한 링커를 통해 공유적으로) 작동적으로 직접 또는 간접적으로 연결될 수 있다.
"보호기"란 DNA-코딩된 라이브러리에 태그부착하는 하나 이상의 결합 단계 동안 바람직하지 못한 반응으로부터 올리고뉴클레오티드의 3'-말단 또는 5'-말단를 보호하기 위한 기를 의미한다. 보편적으로 사용되는 보호기는 문헌 [Greene, "Protective Groups in Organic Synthesis," 4th Edition (John Wiley & Sons, New York, 2007)] (상기 문헌은 본원에 참조로 포함된다)에 개시되어 있다. 예시적인 보호기로는 비가역적 보호기, 예컨대 디데옥시뉴클레오티드 및 디데옥시뉴클레오시드 (ddNTP 또는 ddN), 및 더욱 바람직하게, 히드록실기에 대한 가역적 보호기, 예컨대 에스테르기 (예컨대, O-(α-메톡시에틸)에스테르, O-이소발레릴 에스테르, 및 O-레불리닐 에스테르), 트리틸기 (예컨대, 디메톡시트리틸 및 모노메톡시트리틸), 크산테닐기 (예컨대, 9-페닐크산텐-9-일 및 9-(p-메톡시페닐)크산텐-9-일), 아실기 (예컨대, 페녹시아세틸 및 아세틸), 및 실릴기 (예컨대, t-부틸디메틸실릴)를 포함한다.
"정제하다"라는 것은 후속 단계에서 사용하고자 하는 화학 물질 또는 생물학적 물질의 활성을 감소시킬 수 있는, 반응 혼합물 중의 임의의 비반응성 생성물 또는 임의의 물질을 제거하는 것을 의미한다. 정제는 제거하고자 하는 비반응성 생성물 또는 시약의 크로마토그래피 분리, 전기영동 분리, 및 침전 중 하나 이상의 것을 포함할 수 있다.
"스캐폴드"란 특정의 특별한 기하학적 형태로 하나 이상의 다양성 노드를 나타내는 화학적 모이어티를 의미한다. 다양성 노드는 전형적으로는 라이브러리 합성 동안 스캐폴드에 부착되지만, 일부 경우에서, 한 다양성 노드는 라이브러리 합성 이전에 스캐폴드에 부착될 수 있다 (예컨대, 하나 이상의 빌딩 블록 및/또는 하나 이상의 태그의 부착). 일부 실시양태에서, 스캐폴드는 유도체화됨으로써 이는 라이브러리 합성 동안 오르토고날 방식으로 탈보호될 수 있고, 이어서, 상이한 다양성 노드와 반응할 수 있다.
"소형 분자" 약물 또는 "소형 분자" 약물 후보물질은 분자량이 약 1,000 달톤 미만인 분자를 의미한다. 소형 분자는 (예컨대, 화합물 라이브러리 또는 천연 공급원으로부터) 단리되거나, 또는 공지된 화합물의 유도체화에 의해 수득된, 유기 또는 무기 물질일 수 있다.
"실질적 동일성" 또는 "실질적으로 동일한"이라는 것은 폴리펩티드 또는 폴리뉴클레오티드 서열이 각각 참조 서열과 동일한 폴리펩티드 또는 폴리뉴클레오티드 서열을 가지거나, 또는 각각 두 서열을 최적으로 정렬하였을 때, 참조 서열 내의 상응하는 위치에서 동일한 아미노산 잔기 또는 뉴클레오티드를 특정 비율로 가진다는 것을 의미하는 것이다. 예를 들어, 참조 서열과 "실질적으로 동일한" 아미노산 서열은 참조 아미노산 서열과 적어도 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 동일성을 가진다. 폴리펩티드의 경우, 비교 서열의 길이는 일반적으로 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 이상의 인접한 아미노산, 더욱 바람직하게, 25, 50, 75, 90, 100, 150, 200, 250, 300, 또는 350개 이상의 인접한 아미노산, 및 가장 바람직하게는 전장의 아미노산 서열이 될 것이다. 핵산의 경우, 비교 서열의 길이는 일반적으로 5개 이상의 인접한 뉴클레오티드, 바람직하게, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25개 이상의 인접한 뉴클레오티드, 및 가장 바람직하게는 전장의 뉴클레오티드 서열이 될 것이다. 서열 동일성은 디폴트 환경에서 서열 분석 소프트웨어 (예컨대, 미국 53705 위스콘신주 매디슨 유니버시티 애비뉴 1710 위스콘신 대학교 바이오테크놀로지 센터 제네틱스 컴퓨터 그룹의 서열 분석 소프트웨어 패키지)를 사용함으로써 측정될 수 있다. 상기 소프트웨어는 다양한 치환, 결실, 및 다른 변형에 상동성 정도를 배정함으로써 유사 서열을 매칭시킬 수 있다.
"테일피스"란 모든 빌딩 블록 태그의 첨가 후에 복합체에 부착되고, 라이브러리의 아이덴티티, 라이브러리의 사용, 및/또는 라이브러리 구성원의 기원을 코딩하는 라이브러리의 올리고뉴클레오티드 일부를 의미한다.
본 발명의 다른 특징 및 장점은 하기의 상세한 설명 및 특허청구범위로부터 자명해질 것이다.
도 1은 효소적 및/또는 화학적 라이게이션에 의해 순차적으로 연결되는, 단일 가닥 DNA 태그를 사용한 화학적 라이브러리의 일반 합성 방법에 관한 일례를 보여주는 것이다. "BB"는 빌딩 블록을 나타낸다.
도 2a-2b는 효소적 라이게이션을 사용하여 라이브러리의 단일 가닥 DNA 태그부착 방법에 관한 일례를 보여주는 것이다. 도 2a는 보호된 (재-설치된) 5'-모노포스페이트 (5'-P) 올리고뉴클레오티드와 함께 단일 가닥 효소적 라이게이션을 사용하여 라이브러리에 태그부착하는 방법에 관한 일례를 보여주는 것으로서, 여기서 회색 박스는 2'-OMe 뉴클레오티드를 나타내고, "X"는 화학적 엔티티의 성분 또는 보호기를 나타내고, "PNK"는 폴리뉴클레오티드 키나제를 나타낸다. 도 2b는 보호된 3'-OH 올리고뉴클레오티드와 함께 단일 가닥 라이게이션을 사용하여 라이브러리에 태그부착하는 방법에 관한 일례를 보여주는 것으로서, 여기서 -O-에 부착된 검은색 박스는 3'-OH 말단의 보호기를 나타내고, "LC"는 보호기의 액체 크로마토그래피 분리를 나타낸다.
도 3은 예컨대, 화학적 엔티티 (표지화된 "X-3'")에 의해 차단된 3'-말단과 5'-프리아데닐화된 (표지화된 "5'-App") 올리고뉴클레오티드 (헤드피스)와 함께 단일 가닥 라이게이션을 사용하여 라이브러리에 태그부착하는 방법에 관한 일례를 보여주는 것이다. 상기 방법은 ATP의 존재하에서 5'-인산화된 올리고뉴클레오티드 태그 (표지화된 "태그 A")를 헤드피스에, 및 3'-OH 말단을 갖는 추가의 태그 (표지화된 "태그 B" 및 "태그 C")를 복합체에 라이게이션시키는 데 사용될 수 있다.
도 4a-4e는 각각 헤드피스, 링커, 및 스캐폴드 ("S") 및 다양성 노드 A, B, 및 C를 포함하는 소형 분자를 갖는 예시적인 복합체를 보여주는 것이다. 진한 회색 박스는 2'-OMe 뉴클레오티드를 나타내고, 점선은 상보적인 염기가 존재함을 나타내는 것이다. 도 4a-4b는 단일 가닥 선형 올리고뉴클레오티드 헤드피스를 가진 복합체에 대한 개략도이며, 여기서 링커 및 소형 분자는 헤드피스의 3'-말단 (도 4a) 또는 5'-말단 (도 4b)에 연결되어 있다. 도 4c-4d는 단일 가닥 헤어핀 올리고뉴클레오티드 헤드피스를 가진 복합체에 대한 개략도이며, 여기서 링커 및 소형 분자는 헤드피스의 내부 위치 (도 4c) 또는 3'-말단 (도 4d)에 연결되어 있다. 도 4e는 헤어핀 올리고뉴클레오티드 헤드피스를 가진 라이브러리에 태그부착하는 방법에 관한 일례를 보여주는 것이며, 여기서 별표 표시는 화학적 모이어티를 나타내고, 3'-말단의 "Y"는 보호기를 나타낸다. 올리고뉴클레오티드 태그는 표지화된 1-4이고, 어댑터 서열은 5'-말단의 검은색 선이다.
도 5a-5c는 T4 RNA 리가제 또는 써클리가제(CircLigase)™ ssDNA 리가제에 의한 올리고뉴클레오티드 라이게이션을 보여주는 것이다. 도 5a는 효소적 라이게이션 반응의 개략도이다. 공여자 올리고뉴클레오티드는 5'-인산화된 것이고, 3'-플루오레세인 표지를 보유하며, 이는 3' 단부에 화학적 라이브러리를 포함하는 헤드피스를 모방한 것이다. 수용자 올리고뉴클레오티드는 인산화된 것이 아니다. 도 5b는 8 M 우레아/15% 폴리아크릴아미드 겔 (PAAG) 상의 라이게이션 반응의 겔 전기영동 분석을 보여주는 것이다. 상기 기술된 바와 같이, "SM"은 형광으로 표지화된 공여자를 나타내고, "생성물"은 라이게이션 생성물을 나타내고, "아데닐화된 공여자"는 5'App-공여자를 나타낸다. 도 5c는 고농도의 효소 및 올리고뉴클레오티드하에서 T4 RNA 리가제에 대해 달성된 고수율의 라이게이션을 보여주는 것이다.
도 6a-6b는 T4 RNA 리가제에 의해 최대 라이게이션 수율을 달성하기 위한 PEG 분자량 (도 6a) 및 농도 (도 6b)의 최적화를 나타내는 것이다. 반응 조건은 도 5a-5c에 대하여 상기 기술된 바와 같다. 도 6a는 분자량이 300 내지 20,000 (20K)인 25% (w/v) PEG와 함께 5시간 또는 20시간 동안 인큐베이션시킨 이후에 MNA/DNA 15 mer 공여자 및 수용자 태그를 이용한 라이게이션 반응의 전기영동 분석을 정량화한 그래프이다. 도 6b는 5% 내지 45% (w/v)의 PEG4600의 존재하에서 18-20시간 동안 인큐베이션시킨 이후에 농도가 라이게이션에 미치는 효과를 보여주는 것이다.
도 7a-7b는 써클리가제™ (도 7a) 및 T4 RNA 리가제 (도 7b)에 의한 라이게이션 효율과 공여자 또는 수용자 올리고뉴클레오티드의 길이 사이의 상관관계를 보여주는 것이다. 도 7a는 써클리가제™ 라이게이션 반응에서 수용자 길이가 라이게이션 수율에 미치는 효과를 정량화한 그래프를 도시한 것이다. 도 7b는 수용자 및 공여자 MNA/DNA 태그의 뉴클레오티드 길이가 T4 RNA 리가제와의 단일 가닥 라이게이션에 미치는 효과를 정량화한 그래프 및 표를 도시한 것이다. 상기 데이터는 450 nm 여기에서 형광성 겔의 밀도측정법에 의해 수득된 두 독립 실험의 평균값을 나타낸다.
도 8a-8b는 인산화 이전 및 이후의 MNA/DNA 태그에 대한 LC-MS 스펙트럼이다. 데이터는 T4 폴리뉴클레오티드 키나제 (5 nmole의 태그당 50 유닛)와의 반응 이전 (도 8a) 및 이후 (도 8b)의 15 mer 태그 5'-HO-mUAC GTA TAC GAC TGmG-OH-3' (서열 13) (250 μM)에 대한 것을 나타낸다.
도 9는 태그 A-C에 대한 순차적인 단일 가닥 라이게이션에 대한 전기영동 겔을 보여주는 것이다. 3'-말단은 라이브러리 화합물 (또는 화학적 엔티티)을 나타내는 플루오레세인을 포함하였고, 별표 (*)는 인산화 이전의 라이게이션된 생성물 (또는 복합체)의 정제를 나타내는 것이다.
도 10a-10b는 공여자 및 수용자 올리고뉴클레오티드 사이의 "화학적 공-반응성 쌍" 반응을 통해 5-원자의 "단쇄" 스페이서 (도 10a) 및 24-원자의 "장쇄" 스페이서 (도 10b)를 수득하는 것에 관한 개략도를 보여주는 것이다.
도 11a-11e는 도 10a-10b에 도시된 바와 같은 단쇄 또는 장쇄의 단일 스페이서를 함유하는 75 mer DNA 주형의 역전사 (RT) 및 PCR 분석 결과를 보여주는 것이다. 도 11a는 RT 반응의 개략도이다. 대조군 75 mer DNA 주형 (도 11b), 단일 5-원자의 ("단쇄") 스페이서를 함유하는 75 mer DNA 주형 (도 11c), 및 단일 24-원자의 ("장쇄") 스페이서를 함유하는 75 mer DNA 주형 (도 11d)에 대한 RT의 LC-MS 스펙트럼을 260 nm 및 650 nm 둘 모두에서 기록하였다. 도 11e는 대조군 75 mer DNA 주형 ("templ75"), 5-원자의 스페이서를 포함하는 75 mer DNA 주형 ("단쇄 클릭"), 및 24-원자의 스페이서를 포함하는 75 mer DNA 주형 ("장쇄 클릭")에 관한 RT-PCR 분석을 보여주는 것이다.
도 12a-12g는 상보적인 스플린트 올리고뉴클레오티드의 존재 또는 부재하에서의 5'-아이오도-변형된 DNA 올리고뉴클레오티드와 3'-포스포로티오에이트 DNA 올리고뉴클레오티드 사이의 화학적 라이게이션 반응의 결과를 보여주는 것이다. 도 12a는 반응에 관한 예시적인 개략도를 보여주는 것이다. 5'-아이오도 올리고뉴클레오티드는 3'-말단에서 6-FAM으로 표지화된 반면, 3'-포스포로티오에이트 올리고뉴클레오티드는 5'-말단에서 Cy5로 표지화된 것이다. 도 12b는 상보적인 스플린트의 존재 (+spl) 또는 부재 (-spl)하에서의 라이게이션 반응의 겔 전기영동 분석을 보여주는 것이다. CCy5 및 CFL은 각각 Cy5 및 플루오레세인-표지화된 출발 물질의 가시 밴드를 나타내는 것이다. 도 12c는 상기 조건하에서 시간 경과에 따른 스플린트형 라이게이션 반응을 나타내는 것으로서, 이는 Cy5 (635 nm) 및 플루오레세인 (450 nm) 검출을 사용하여 정량화된 것이다. 도 12d는 스플린트의 부재 (상단, 260 nm, 495 nm, 및 650 nm) 및 존재 (하단, 260 nm, 495 nm, 및 650 nm)하에서의 CFL 및 CCy5의 라이게이션의 LC-MS 분석을 보여주는 것으로서, 여기서 라이게이션 반응은 7일 동안 인큐베이션시킴으로써 이루어졌다. 도 12e는 스플린트 (260 nm, 495 nm, 및 650 nm)의 부재하에서 CFL 및 CCy5의 라이게이션의 LC-MS 분석을 보여주는 것으로서, 여기서 라이게이션 반응은 8일 동안 인큐베이션시킴으로써 이루어졌다. 도 12f는 CFL 올리고뉴클레오티드와 피페리딘의 반응에 관한 MS 분석을 보여주는 것으로서, 여기서 상기 반응은 아이오딘을 대체시키고자 하는 것이었다. 반응 조건으로는 실온에서 20 hr 동안 100 mM 보레이트 완충제 (pH 9.5) 중 피페리딘 40 mM (400 당량), 올리고뉴클레오티드 100 μM (좌측); 및 65℃에서 2 hr 동안 200 mM 보레이트 완충제 (pH 9.5) 중 피페리딘 2 M (4,000 당량), 올리고뉴클레오티드 400 μM (우측). 도 12g는 실온에서 20 hr 동안 100 mM 보레이트 완충제 (pH 9.5) 중 400 당량의 피페리딘의 존재하에서 수행된 50 μM의 CFL 및 CCy5 올리고뉴클레오티드의 스플린트형 라이게이션 반응에 관한 MS 분석을 보여주는 것이다.
도 13a-13c는 셔플링을 최소화시키기 위한 변형된 올리고뉴클레오티드의 사용을 보여주는 것이다. 도 13a는 5'-인산화된 헤드피스 ssHP (3,636 Da)와 2'-O 메틸 뉴클레오티드를 갖는 태그 (태그 15; 2,469 Da)의 단일 가닥 라이게이션 반응에 관한 LC-MS 분석을 보여주는 것이다. LC-MS 분석을 통해 3개의 피크가 나타났다: 태그 (2,469 Da)에 대한 피크 1; 아데닐화된 헤드피스 (3,965 Da)에 대한 피크 2; 및 분자량이 6,089 Da (예상치 라이게이션 생성물); 5,769 Da (예상치 6,089 Da - 320 Da); 및 6,409 Da (예상치 6,089 Da + 320 Da)인 생성물을 함유하는 2개 (일부 경우에는 3개)의 서브피크를 갖는 피크 3. 이러한 320 Da의 질량차는 정확하게는 추가의 2'-O-Me C 뉴클레오티드의 제거 또는 부가에 상응하는 것이다. 도 13ba 내지 13bc는 뉴클레오티드 셔플링의 비제한적인 제안된 기전을 보여주는 것으로서, 여기서 반응 중 약 90%는 예상된 (정상) 라이게이션 생성물을 제공하고, 반응의 약 10%는 비정상적인 라이게이션 생성물 ("생성물-1 nt" 및 "생성물+1 nt")을 제공한다. 도 13c는 헤드피스 HP-PS와 태그 15의 라이게이션에 관한 LC-MS 분석을 보여주는 것이다. 헤드피스 HP-PS는 서열 헤드피스 ssHP를 가지지만, 5'-말단에 포스포로티오에이트 연결부를 포함한다. LC 분석을 통해 3개의 피크가 나타났다: 태그 (2,469)에 대한 피크 1, 아데닐화된 헤드피스 (3,984)에 대한 피크 2, 및 어떤 뉴클레오티드 셔플링도 거의 관찰되지 않은 단일 라이게이션 생성물 (6,107)에 대한 피크 3. +/- 320 피크의 트레이스는 가능하게는 포스포로티오에이트 연결부의 천연 포스포디에스테르 연결부로의 산화적 전환에 상응하는 것일 수 있거나, 또는 불완전 황화에 기인하는 것일 수 있다.
도 14는 크기 배제 크로마토그래피를 사용한 라이브러리 구성원의 분리를 보여주는 그래프로서, 여기서 표적-결합된 라이브러리 구성원 (그래프 상에서 좌측)은 비결합 라이브러리 구성원 (그래프 상에서 우측)보다 보다 짧은 시간에 용리된다.
도 15a는 스플린트-의존성이 아닌 단일 화학물질, 예컨대 5'-아지도/3'-알키닐을 사용한 코딩 DNA 태그의 화학적 라이게이션을 보여주는 예시적인 개략도이다. 반응성 기는 각 태그 (태그 A, B, 및 C)의 3' 및 5' 단부에 존재하고, 둘 중 한 단부 (예를 들어, 3' 단부) 상의 반응성 기 중 하나는 태그의 고리화, 중합, 또는 오작동-사이클 라이게이션을 막기 위해 보호된다. 태그 라이게이션의 사이클은 화학적 라이게이션 이후, 남은 관능기의 탈보호를 통해 성장 라이게이션된 엔티티를 다음 사이클의 라이게이션에 적격인 것으로 만드는 것을 포함한다. 각 사이클은 또한 하나 이상의 빌딩 블록 (BBA, BBB, 및 BBC, 이는 각각 태그 A, B, 및 C에 의해 코딩)의 첨가를 포함한다. 화학적 라이게이션 과정은 임의로 테일피스의 첨가를 포함한다.
도 15b는 스플린트-의존성인 단일 화학물질을 사용한 코딩 DNA 태그의 화학적 라이게이션을 보여주는 예시적인 개략도이다. 상기 접근법의 주형-의존성 성질은 태그 중합, 태그 고리화 뿐만 아니라, 착오태그부착 사례의 발생 빈도를 감소시킨다. 도 15a와 유사하게, 상기 방식은 태그 (태그 A, B, 및 C) 및 태그 (BBA, BBB, 및 BBC)에 의해 코딩된 하나 이상의 빌딩 블록을 포함한다.
도 15c는 화학적으로 라이게이션된 접합부를 판독할 수 있는 주형-의존성 폴리머라제를 사용할 뿐만 아니라, 주형-의존성 중합에 대한 주형으로서 일련의 화학적으로 라이게이션된 태그를 사용함으로써 PCR 증폭 및 서열 분석에 적격인 cDNA를 보여주는 예시적인 개략도이다.
도 16a는 TIPS-보호된 알키닐 태그 및 "클릭" 화학을 사용하는 코딩 DNA 태그의 화학적 라이게이션을 보여주는 예시적인 개략도이다. 라이브러리 합성의 각 사이클은 TIPS-보호된 태그의, 이전 사이클로부터의 탈보호된 알킨에 대한 Cu(I)-촉매된 화학적 라이게이션을 포함한다. 라이게이션 후, TIPS 기는 제거 (탈보호)되어, 다음 화학적 라이게이션 단계를 위한 알킨을 활성화시킨다.
도 16b는 3'-말단에 3'-O-TIPS-프로파르길 우리딘을 보유하는 올리고뉴클레오티드의 고체상 합성을 개시하는 데 사용되는 DMT-숙시닐-3'-O-TIPS-프로파르길 우리딘 CPG의 구조를 보여주는 것이다.
도 16c는 "클릭" 화학적으로 라이게이션된 접합부를 판독할 수 있는 주형-의존성 폴리머라제를 사용할 뿐만 아니라, 주형-의존성 중합에 대한 주형으로서 일련의 "클릭" 화학적으로 라이게이션된 태그를 사용함으로써 PCR 증폭 및 서열 분석에 적격인 cDNA를 보여주는 예시적인 개략도이다.
도 17a-17c는 5'-비오티닐화된, "단일-클릭" 주형 Y55 및 Y185의 합성을 보여주는 것이다. 도 17a는 예시적인 개략도를 제공한다. 도 17b 및 도 17c는 각각 Y55 및 Y185의 LC-MS 분석을 보여주는 것이다.
도 18a-18c는 "단일-클릭" 주형의 "판독"을 위한 검정법에 관한 일례를 제공한다. 도 18a는 제조사의 권고된 조건에 따라 FAM-표지화된 프라이머를 비오티닐화된 주형에 어닐링시키고, 주형-의존성 폴리머라제와 함께 인큐베이션시킨 개략도를 보여주는 것이다. 이어서, 복합체를 스트렙타비딘 비드와 함께 인큐베이션시키고, 세척하고, NaOH로 용리시킨 후, 중화시킨다. 중화 후, LC-MS에 의해 샘플을 분석한다. 도 18b 및 도 18c는 각각 주형 Y55 및 Y185의 클레나우(Klenow) 단편 카피의 LC-MS 데이터를 보여주는 것이다.
도 19a-19d는 TIPS-보호된 알키닐 태그를 사용하여 5'-비오티닐화된 "이중-클릭" 주형 YDC 및 "삼중-클릭 주형" YTC의 합성을 제공하는 것이다. 도 19a 및 19b는 상기 합성에 관한 예시적인 개략도를 보여주는 것이다. 도 19c 및 19d는 각각 YDC 및 YTC 주형에 관한 LC-MS 분석을 보여주는 것이다.
도 20a-20c는 "이중-클릭" 및 "삼중-클릭" 주형을 사용한 클릭 "판독" 검정법의 일례를 제공하는 것이다. 도 20a는 제조사의 권고된 조건에 따라 FAM-표지화된 프라이머를 비오티닐화된 주형에 어닐링시키고, 이. 콜라이(E. coli) DNA 폴리머라제 I의 클레나우 단편과 함께 인큐베이션시킨 개략도를 보여주는 것이다. 복합체를 스트렙타비딘 비드와 함께 인큐베이션시키고, 세척하고, NaOH로 용리시킨 후, 중화시킨다. 중화 후, LC-MS에 의해 샘플을 분석한다. 도 20b 및 도 20c는 각각 주형 YDC 및 YTC의 클레나우 단편 카피의 LC-MS 데이터를 보여주는 것이다.
도 21은 대조군 "클릭이 없는" DNA 주형과의 비교로 "단일-클릭", "이중-클릭" 및 "삼중-클릭" 주형을 사용한 클릭 "판독"의 효율을 보여주는 그래프이다. 상기 데이터는 본원에 기술된 "판독" 검정법을 사용하여 수득하였고, 수율은 내부 표준과의 비교에 의한 LC-MS 분석에 의해 측정하였다.
도 22a-22c는 오르토고날 화학 물질을 이용한 화학적 라이게이션에 관한 예시적인 개략도를 제공한다. 도 22a는 (ii) 이용가능한 판독 전략법에 대해 (i) 2개의 연속 오르토고날 화학 물질을 사용하는 DNA 코딩 태그에 대한 화학적 라이게이션 전략법에 관한 개략도이다. 각 태그는 2개의 오르토고날 반응성 기를 포함하며, 이는 각 태그의 5'-말단 및 3'-말단에 대해 다른 기호로 표시되어 있다. 화학적 라이게이션의 각 연속 사이클에서, 오르토고날 화학 물질이 사용된다. 이러한 전략법을 통해 착오태그부착 사례의 발생 빈도는 감소하게 되고, 이는 또한 반응성 말단 기의 보호 없이도 사용될 수 있다. 도 22b는 태그 서열의 추론의 기원이 되는 cDNA를 생성하기 위해 수행되는 오르토고날 DNA 태그의 오르토고날 화학적 라이게이션에 의해 생성된 주형의 주형-의존성 중합 "판독"에 관한 개략도이다. 도 22c는 도 22b와 동일하되, 단, 자기-프라이밍 테일피스를 포함하며, 이는 PCR 증폭 동안 가닥 분리를 촉진시키는 제한 분해에 의해 이중 가닥화될 수 있다.
도 23은 특정의 두 연속 오르토고날 화학 물질을 사용하는 DNA 코딩 태그에 대한 화학적 라이게이션 전략법을 보여주는 예시적인 개략도이다. 각 태그는 클릭-반응성 및 포스포로티오에이트/아이오도-반응성 기를 포함한다. 그의 3' 및 5' 단부에 오르토고날 반응성 기를 보유하는 태그는 중합이 불가능하고, 착오태그부착 사례의 발생 빈도는 감소되어 있다. 이론으로 제한하고자 하지 않으면서, 이러한 접근법에서는 3'-알킨의 TIPS-보호가 필요하지 않을 수도 있다. 사이클 A에서, 3'-포스포로티오에이트 헤드피스에의 스플린트-의존성 라이게이션을 사용하여 5'-아이오도/3'-알키닐 태그를 라이게이션시키고, 이를 통해 5'-아지도/3'-포스포로티오에이트 태그에 대하여 화학적 라이게이션이 이루어지는 다음 사이클에 대한 반응성 3' 알킨이 남게 된다. 원하는 횟수만큼 오르토고날 라이게이션 사이클을 반복할 수 있다.
도 24a-24b는 DNA 태그 상의 3'-포스포로티오에이트/5'-아이오도기의 보호 및 사용을 보여주는 것이다. 도 24a는 상기 태그에 대해 보호기 (PG)를 사용하는 것에 관한 예시적인 개략도를 보여주는 것이다. 도 24b는 5'-말단 상에 공유적으로 설치된 화학적 라이브러리를 코딩하는 일련의 코딩 DNA 태그를 화학적으로 라이게이션시키는 3'-포스포로티오에이트/5'-아이오도 태그의 사용에 관한 예시적인 개략도를 보여주는 것이다.
도 25a-25b는 DNA 태그 상의 3'-포스포로티오에이트기의 보호 및 사용을 보여주는 것이다. 도 25a는 상기 기의 보호에 대한 개략도를 보여주는 것이다. 도 25b는 5'-말단 상에 공유적으로 설치된 화학적 라이브러리를 코딩하는 일련의 오르토고날 코딩 DNA 태그를 화학적으로 라이게이션시키는 3'-포스포로티오에이트/5'-아지도 및 3'-프로파르길/5'-아이오도 태그의 사용에 관한 개략도를 보여주는 것이다.
상세한 설명
본 발명은 화학적 엔티티-올리고뉴클레오티드 복합체 상에 올리고뉴클레오티드 태그를 설치하기 위하여 단일 가닥 라이게이션을 사용하는 방법을 특징으로 한다. 본 방법은 특정 태그와 특정 화학적 반응 또는 빌딩 블록 사이의 코딩된 관계를 확립함으로써 선별가능한 화학적 엔티티의 다양한 라이브러리를 형성하는 데 사용될 수 있다. 하나 이상의 화학적 엔티티를 확인하기 위하여, 올리고뉴클레오티드 태그는 확립된 관계를 사용함으로써 증폭, 클로닝, 서열 분석, 및 상호 연관될 수 있다. 특히, 태그의 단일 가닥 라이게이션을 촉진시키는 반응 조건을 확인하였다. 상기 조건으로는 하나 이상의 2'-치환된 뉴클레오티드 (예컨대, 2'-O-메틸 뉴클레오티드 또는 2'-플루오로 뉴클레오티드)의 사용; 특정 길이 (예컨대, 5 내지 15개의 뉴클레오티드)의 태그 사용, 하나 이상의 효소 (예컨대, RNA 리가제 및/또는 DNA 리가제) 사용, 및/또는 라이게이션 동안 하나 이상의 작용제 (예컨대, 폴리에틸렌 글리콜 및/또는 가용성 다가 양이온, 예컨대 Co(NH3)6Cl3) 사용을 포함한다. 이러한 방법은 올리고뉴클레오티드를 화학적으로 연결시킴으로써, 연결된 올리고뉴클레오티드 생성물의 서열이 주형-의존성 폴리머라제 반응의 주형으로서 사용될 수 있도록 하는 방법을 추가로 포함한다. 상기 복합체의 라이브러리를 형성하고 태그부착하는 방법은 하기에서 상세하게 기술한다.
코딩된 라이브러리에 태그부착하는 방법
본 방법은 올리고뉴클레오티드 태그를 화학적 엔티티에 작동적으로 연결시킴으로써 태그 서열과 화학적 엔티티의 구조적 단위 (또는 빌딩 블록) 사이에 관계가 확립될 수 있도록 하는 방법을 특징으로 한다. 특히, 화학적 엔티티의 아이덴티티 및/또는 히스토리는 올리고뉴클레오티드의 염기 서열로부터 추론될 수 있다. 이러한 방법을 사용하여 다양한 화학적 엔티티 또는 구성원 (예컨대, 소형 분자 또는 펩티드)을 포함하는 라이브러리를 특정 태그 서열로 어드레싱할 수 있다.
일반적으로, 이러한 방법은 화학적으로 정교화될 수 있는 하나 이상의 관능기, 및 단일 가닥 올리고뉴클레오티드가 결합 (또는 라이게이션)될 수 있는 하나 이상의 관능기를 갖는 헤드피스를 사용하는 것을 포함한다. 결합은 임의의 유용한 수단, 예컨대 효소적 결합 (예컨대, RNA 리가제 및/또는 DNA 리가제 중 하나 이상의 것과의 라이게이션)에 의해 또는 화학적 결합에 의해 (예컨대, 두 관능기, 예컨대 친핵체 및 이탈기 사이의 치환 반응에 의해) 달성될 수 있다.
라이브러리내 다수의 화학적 엔티티를 형성하기 위하여 헤드피스를 함유하는 용액을 다중 분취량으로 나눈 후, 이를 다수의 물리적으로 별개인 구획, 예컨대 다중 플레이트의 웰에 배치시킬 수 있다. 일반적으로, 이 단계가 "스플릿" 단계이다. 각 구획 또는 웰 내에서 각 분취량 내의 단일 가닥 태그를 이용하여 연속 화학적 반응 및 라이게이션 단계를 수행한다. 화학적 반응 조건과 단일 가닥 태그의 서열 사이의 관계를 기록한다. 반응 및 라이게이션 단계는 임의의 순서로 수행될 수 있다. 이어서, 반응 및 라이게이션된 분취량을 조합하거나, 또는 "풀링하고," 임의로 이 시점에서 정제를 수행할 수 있다. 이러한 스플릿 및 풀 단계를 임의로 반복할 수 있다.
이어서, 본원에 기술된 바와 같이, 특정 특징 또는 기능에 대하여 라이브러리를 시험하고/거나, 선별할 수 있다. 예를 들어, 태그부착된 화학적 엔티티의 혼합물을, 제1 집단은 특정 생물학적 표적에 결합하는 것이고, 제2 집단은 그렇지 못한 것인 둘 이상의 집단으로 분리할 수 있다. 이어서, 제1 집단을 (예컨대, 칼럼 상에서 용리시킴으로써 관심의 대상이 되는 표적을 제공하거나, 또는 분취량을 관심의 대상이 되는 표적과 인큐베이션시키거나 함으로써) 선택적으로 포획할 수 있고, 임의로, 예컨대 임의적인 세척, 정제, 음성 선별, 양성 선별, 또는 분리 단계를 통해 추가로 분석하거나, 시험할 수 있다.
마지막으로, 선별된 집단 내의 하나 이상의 구성원 (또는 화학적 엔티티)의 화학적 히스토리는 작동적으로 연결된 올리고뉴클레오티드의 서열에 의해 측정될 수 있다. 서열과 특정 빌딩 블록과의 상관 관계를 살펴볼 때, 본 방법은 선택된 특징 (예컨대, 표적 단백질에 결합하여 치료학적 효과를 유도하고자 하는 경향의 증가)을 이용하여 개별 라이브러리의 구성원을 확인할 수 있다. 이어서, 추가의 시험 및 최적화를 위해, 그의 회합된 올리고뉴클레오티드 태그를 이용하거나, 또는 이용하지 않으면서 확인된 라이브러리 구성원을 합성함으로써 후보물질인 치료학적 화합물을 제조할 수 있다.
도 1-3은 태그가 헤드피스의 5'-말단 또는 3'-말단 상에 라이게이션될 수 있는, 헤드피스와의 단일 가닥 라이게이션을 사용하여 라이브러리에 태그부착하는 방법에 관한 다양한 일례를 제공한다. 태그가 라이게이션되는 순서를 제어하기 위해, 및 부반응을 감소시키기 위해, 본 방법은 오직 한 반응성 5'-말단 및 한 반응성 3'-말단만이 라이게이션 동안에 존재하도록 한다. 추가로, 이러한 예시적인 방법은 태그내 2'-치환된 뉴클레오티드 (예컨대, 혼합된 2'-데옥시/2'-O-메틸 뉴클레오티드)를 사용하며, 이 태그는 주형-의존 방식으로 뉴클레오티드를 중합시킬 수 있는 DNA- 또는 RNA-의존성 폴리머라제에 대한 주형으로서의 역할을 한다. 이론으로 제한하고자 하지 않으면서, 태그내 하나 이상의 2'-치환된 뉴클레오티드 (예컨대, 2'-O-메틸 뉴클레오티드 및/또는 2'-플루오로 뉴클레오티드) 사용은 기록 매체의 물리적 및 화학적 강건성 둘 모두를 보존할 뿐만 아니라, 주형-의존성 중합을 사용하는 서열 정보를 추출해낼 수 있는 능력도 보존하면서, 더욱더 유사한 RNA에 의해 RNA 리가제에 의한 라이게이션을 촉진시킬 수 있다.
도 1은 라이게이션된 복합체 및 태그가 반응성 3'-OH 및 5'-모노포스페이트 ("5'-P") 기 사이의 원치않는 반응을 피할 수 있도록 디자인된 것인, 부반응을 감소시키는 방법에 관한 일례를 제공한다. 특히, 상기 개략도에는 인산화-라이게이션 사이클 접근법이 도시되어 있다. 라이게이션 동안 오직 단 하나의 (태그 중의) 3'-OH 기 및 단 하나의 (헤드피스 중의) 5'-P 기가 이용가능하고, 이로써 단 한번의 라이게이션 사례만이 가능하다. 라이게이션 및 정제 단계 이후, 복합체에서 5'-OH 기가 형성되고, 이 기는 다음 올리고뉴클레오티드 태그의 첨가를 위해 5'-P로 전환될 수 있다. 복합체의 3'-말단은 보호기 또는 화학적 엔티티의 성분 (예컨대, 임의로 화학적 엔티티와 헤드피스 사이의 스페이서로서의 역할을 하는 링커 포함)일 수 있는 X에 의해 차단된다.
도 1에 제시되어 있는 바와 같이, 예시적인 방법은 빌딩 블록 태그 1 ("태그 1")을 헤드피스의 5'-말단에 라이게이션시켜 복합체를 형성하고, 복합체의 5'-말단에의 연속 라이게이션을 수행하는 것을 포함한다. 반응성 5'-말단은 복합체 상의 포스페이트기이고, 반응성 3'-말단은 태그 상의 히드록실기이다. 각 태그를 첨가한 후, 라이게이션된 복합체를 비반응, 비-라이게이션된 헤드피스 및 태그로부터, 및 다른 시약 (예컨대, 라이게이션 단계 동안 존재하는 포스페이트, 코발트, 또는 다른 시약)으로부터 분리한다. 분리는 임의의 유용한 방법에 의해 (예컨대, 라이게이션된 및 비-라이게이션된 생성물의 크로마토그래피 또는 전기영동 분리에 의해, 또는 시약의 침전에 의해) 달성될 수 있다. 이어서, 라이게이션된 복합체를 작용제 (예컨대, 폴리뉴클레오티드 키나제 또는 화학적 인산화제)에 노출시켜 복합체의 5'-말단 상에 포스페이트기를 형성한다. 분리 및 인산화 단계는 어느 순서로든 수행될 수 있다. 특히, 인산화 단계에서 키나제가 사용되는 경우, 키나제는, 5'-OH 기 또한 함유할 수 있는 다음 태그의 첨가 이전에 불활성화 또는 제거되어야 하거나, 키나제를 억제시킬 수 있는 임의의 시약은 인산화 단계 이전에 반응 혼합물로부터 제거되어야 한다.
또 다른 실시양태에서, 본 방법은 이전 라이게이션된 복합체의 3'-말단으로부터의 연속 태그를 결합시키는 것을 포함한다. 본 방법에서, 라이게이션 단계 직후, 라이게이션된 복합체에는 반응성 3'-OH 기가 없지만, (예컨대, 보호기의 유리에 의해) 3'-OH 기로 전환될 수 있는 기는 함유하고 있다. 도 2a는 복합체의 3'-말단을 태그부착하는 방법의 일례를 보여주는 개략도를 제공하는 것이고, 도 2b는 3'-연결된 보호기 방출시 전환가능한 3'-OH 기를 함유하는 보호된 3'-말단에 대한 예시적인 반응 개략도를 제공하는 것이다. 도 2a에 제시되어 있는 바와 같이, 빌딩 블록 태그 1 ("태그 1")은 3'-보호된 기를 가진다. 제1 단계에서, 예시적인 방법은 태그를 헤드피스의 3'-말단에 라이게이션시킴으로써 복합체를 형성하는 것을 포함한다. 복합체의 3'-말단에 대하여 연속 라이게이션이 수행된다. 반응성 5'-말단은 태그 상의 포스페이트기이고, 반응성 3'-말단은 복합체 상의 히드록실기이다. 각 태그의 첨가 후, 라이게이션된 복합체는 (예컨대, 가수분해제의 첨가에 의해) 탈보호되어 3'-보호기를 방출시킨다.
추가의 또 다른 실시양태에서, 본 방법은 5'-프리아데닐화된 (5'-App) 올리고뉴클레오티드 및 리가제 (예컨대, T4 RNA 리가제)를 이용함으로써 수행되는 연속 태그를 결합시키는 것을 포함한다. ATP의 존재하에서, T4 RNA 리가제는 라이게이션 이전에 아데닐화된 중간체를 형성하기 위하여 ATP 보조 인자를 사용하게 될 것이다. ATP의 부재하에서, T4 RNA 리가제는 오직 프리아데닐화된 올리고뉴클레오티드만을 라이게이션시킬 것이며, 5'-P 올리고뉴클레오티드와의 가능한 부반응은 일어나지 않을 것이다. 따라서, 5'-모노인산화된 태그의 존재하에서 화학적으로 합성된 5'-App 올리고뉴클레오티드를 이용함으로써 부반응이 감소된 단일 가닥 라이게이션을 수행할 수 있고, 여기서 5'-App 올리고뉴클레오티드는 태그부착 이전에 헤드피스에, 또는 다회에 걸친 태그부착 이후에 형성된 복합체에 라이게이션될 수 있다.
도 3은 프리아데닐화된 헤드피스의 5'-말단을 태그부착하는 방법의 일례를 보여주는 개략도를 제공하는 것이다. 5'-포스페이트기에서 공여자 뉴클레오티드를 프리아데닐화하는 것이 라이게이션 반응에서 제1 단계이고, 이 반응은 일반적으로 ATP 한 분자를 필요로 한다. 제2 단계에서, 수용자 올리고뉴클레오티드의 3'-OH 기는 아데닐화된 공여자와 반응하고, 두 올리고뉴클레오티드 사이에 디에스테르 결합을 형성하고, 이로써, AMP 한 분자가 유리된다. 공여자 올리고뉴클레오티드의 화학적으로 아데닐화된 5'-포스페이트기는 라이게이션 반응의 제1 단계의 생성물을 모방하고, ATP의 부재하에서 제2 올리고뉴클레오티드에 라이게이션될 수 있다. 하기 방식에서, 5'-App 헤드피스는 5'-인산화된 올리고뉴클레오티드 태그 (표지화된 "태그 A")의 3'-OH 기에 라이게이션된다. 올리고뉴클레오티드의 아데닐화된 5'-말단이 존재하기 때문에, 라이게이션은 ATP의 부재하에서도 일어날 수 있다. 이러한 조건하에서, 태그 A의 5'-포스페이트기는 라이게이션 공여자로서의 역할을 하지 못한다. 빌딩 블록 태그 B는 ATP의 존재하에서 3'-OH 말단을 갖는 뉴클레오티드 (표지화된 "태그 B")를 제공함으로써 라이게이션될 수 있고, 추가의 태그 (표지화된 "태그 C")가 포함될 수 있다.
도 3에서, 헤드피스의 3'-말단은 임의의 보호기 (예컨대, 비가역적 보호기, 예컨대 ddN, 또는 가역적 보호기)에 의해 차단될 수 있다. 제1 단계에서, 본 방법은 ATP의 부재하에서 태그를 헤드피스의 5'-말단에 라이게이션시킴으로써 복합체를 형성하는 것을 포함한다. ATP의 존재하에서 복합체의 5'-말단에의 연속 라이게이션이 수행된다. 본 방법은 복합체의 3'-말단에의 연속 라이게이션을 수행하기 위해 변형될 수 있다. 예를 들어, 본 방법은 5'-프리아데닐화된 태그 및 반응성 3'-OH 말단을 갖는 헤드피스를 사용하는 것을 포함할 수 있다. 본 방법은 예컨대, 상기 및 도 2에 기술되어 있는 방법과 같이, 태그 사이의 교차 반응을 피하기 위해 태그의 3'-말단을 차단시키는 것을 추가로 필요로 할 수 있다.
도 3에 제공된 일반 방법은 프라이머를 헤드피스로 대체함으로써 변형될 수 있다. 이러한 경우, 헤드피스는 5'-말단에서 화학적으로 아데닐화되어야 하고, 태그 A는 5'-말단에서 인산화된다. 상기 인산화된 태그 A의 아데닐화된 헤드피스에의 라이게이션은 본원에 기술된 바와 같은 표준 조건하에서, 단, ATP가 생략된 조건하에서 이루어진다. 상기 라이게이션 조건을 사용함으로써, 인산화된 5' 말단의 라이게이션을 막을 수 있다. 다음 단계에서, 태그 B의 라이게이션은 상기 태그가 5'-말단에 유리 히드록실기를 갖는 것 (즉, 비-인산화된 것)을 필요로 한다. ATP의 존재하에서 연속 라이게이션 반응이 수행될 수 있고, 이어서, 태그 (예컨대, 도 3에서 태그 C)의 추가의 연장이 요구되는 경우, 생성된 올리고뉴클레오티드의 5'-말단의 인산화가 이루어진다.
본원에 기술된 방법은 라이브러리를 다양화시키거나, 라이브러리의 구성원을 검사하기 위해 임의의 개수의 임의적 단계를 포함할 수 있다. (예컨대, 도 1-3에서와 같이) 본원에 기술된 임의의 태그부착 방법을 위해, 태그의 연속 "n" 횟수는 라이게이션, 분리, 및/또는 인산화 단계의 추가의 "n" 횟수와 부가될 수 있다. 예시적인 임의적 단계는 하나 이상의 제한 엔도뉴클레아제를 사용한 라이브러리 구성원의 제한; 예컨대, 증폭 및 서열 분석을 위한 프라이밍 서열을 제공하거나, 서열의 고정화를 위한 표지, 예컨대 비오틴을 제공하는 하나 이상의 어댑터 서열과 같이, 하나 이상의 어댑터 서열의 라이브러리 말단 중 하나 또는 그 둘 모두에의 라이게이션; 역전사효소, 전사효소, 또는 또 다른 주형-의존성 폴리머라제를 사용하는 복합체 중 조립된 태그의 역전사 또는 전사 이후, 임의로 역전사; 예컨대, PCR을 이용한 복합체 중 조립된 태그의 증폭; 예컨대, 박테리아 형질전환 사용, 에멀젼 형성, 희석, 표면 포획 기법 등에 의한 복합체 중 조립된 태그의 하나 이상의 집단의 클론 단리물 생성; 예컨대, 뉴클레오티드의 주형-의존성 중합을 위한 주형으로서 클론 단리물을 사용함으로써 복합체 중 조립된 태그의 하나 이상의 집단의 클론 단리물 증폭; 및 예컨대, 형광으로 표지화된 뉴클레오티드와 함께 주형-의존성 중합을 위한 주형으로서 클론 단리물을 사용함으로써 복합체 중 조립된 태그의 하나 이상의 집단의 클론 단리물의 서열을 확인하는 것을 포함한다. 올리고뉴클레오티드 태그를 증폭시키고, 서열 분석하는 추가의 방법은 본원에 기술되어 있다.
본 방법을 사용하여 예컨대, 선별 단계에서 특정 특징 또는 기능을 갖는 임의의 개수의 화학적 엔티티를 확인 및 발견할 수 있다. 라이브러리 중의 원하는 기능을 갖는 구성원 또는 관련된 구성원 중 하나 이상을 동시에 강화시키면서, 라이브러리를 둘 이상의 부분으로 나누기 위한 기초로서 원하는 특징 또는 기능이 사용될 수 있다. 특정 실시양태에서, 본 방법은 관심의 대상이 되는 치료학적 단백질에 결합하거나, 그를 불활성화시키는 소형 약물-유사 라이브러리 구성원을 확인하는 것을 포함한다. 또 다른 실시양태에서, 정의된 화학적 조건하에서 선택된 빌딩 블록의 반응을 통해, 하나 이상의 분자가 특정 단백질에 대한 치료제로서의 유용성을 가질 수 있는 다수의 분자의 조합 (또는 분자의 라이브러리)를 생성할 수 있도록 화학적 반응 순서가 디자인되고, 빌딩 블록 세트는 선택된다. 예를 들어, 화학적 반응 및 빌딩 블록은 통상 키나제 억제제에 존재하는 구조적 기를 갖는 라이브러리를 형성하도록 선택된다. 상기 경우 중 임의의 경우에서, 태그는 라이브러리 구성원의 화학적 히스토리를 코딩하고, 각 경우에서, 화학적 가능성의 집한체는 임의의 특정 태그 조합에 의해 나타낼 수 있다.
한 실시양태에서, 하나 이상의 라이브러리의 구성원이 표적에 결합하는 데 적합한 조건하에서 화학적 엔티티의 라이브러리, 또는 그의 일부를 생물학적 표적에 접촉시킨 후, 표적에 결합하지 않은 라이브러리 구성원을 제거하고, 그에 회합된 하나 이상의 올리고뉴클레오티드 태그를 분석한다. 상기 방법은 임의로 당업계에 공지된 방법에 의해 태그를 증폭시키는 것을 포함할 수 있다. 예시적인 생물학적 표적으로는 효소 (예컨대, 키나제, 포스파타제, 메틸라제, 데메틸라제, 프로테아제, 및 DNA 수복 효소), 단백질:단백질 상호작용에 관여하는 단백질 (예컨대, 수용체에 대한 리간드), 수용체 표적 (예컨대, GPCR 및 RTK), 이온 채널, 박테리아, 바이러스, 기생충, DNA, RNA, 프리온, 및 탄수화물을 포함한다.
또 다른 실시양태에서, 표적에 결합한 화학적 엔티티를 증폭시키지 않고, 직접 분석한다. 분석 방법의 예로는 소산 공명 광 결정 분석을 비롯한, 마이크로어레이 분석; (예컨대, his-태그를 사용함으로써 수행되는) 태그를 디컨볼루션하는 비드-기반 방법; 무표지 광 결정 바이오센서 분석 (예컨대, SRU 바이오시스템즈 인코퍼레이티드(SRU Biosystems, Inc.: 미국 매사추세츠주 워번)로부터의 바인드® 판독기(BIND® Reader); 또는 (예컨대, 태그의 라이브러리에 존재하는 서열에 상보적인 고정화된 올리고뉴클레오티드의 어레이를 사용함으로써 수행되는) 하이브리드화-기반 접근법을 포함한다.
추가로, 화학적 공-반응성 쌍 (또는 관능기)은 고체상 올리고뉴클레오티드 합성 방식에 쉽게 포함될 수 있고, 올리고뉴클레오티드의 효율적인 화학적 라이게이션을 지원할 것이다. 추가로, 생성된 라이게이션된 올리고뉴클레오티드는 하나 이상의 폴리머라제를 이용하는 주형-의존성 중합에 대한 주형으로서의 역할을 할 수 있다. 따라서, 본원에 기술된, 코딩된 라이브러리에 태그부착하기 위한 결합 단계 중 임의의 단계는 효소적 라이게이션 및/또는 화학적 라이게이션 기법 중 하나 이상을 포함하도록 변형될 수 있다. 예시적인 라이게이션 기법으로는 효소적 라이게이션, 예컨대 하나 이상의 RNA 리가제 및/또는 DNA 리가제 사용; 및 화학적 라이게이션, 예컨대 화학적 공-반응성 쌍 (예컨대, 임의로 치환된 알키닐 및 아지도 관능기를 포함하는 쌍) 사용을 포함한다.
추가로, 하나 이상의 라이브러리는 스플릿-및-혼합 단계에서 조합될 수 있다. 2개 이상의 라이브러리가 혼합될 수 있도록 하기 위해, 라이브러리 구성원은 본원에 기술된 바와 같이, 예컨대 라이브러리-확인 태그 중, 라이게이션된 빌딩 블록 태그 중, 또는 헤드피스 서열의 일부로서 하나 이상의 라이브러리-확인 서열을 포함할 수 있다.
감소된 질량을 갖는 방법
단일 가닥 코딩 전략법에 대한 동기 중 상당부는 이중 가닥 태그와 비교하여 감소된 단일 가닥 태그의 질량으로부터 발생된 것이다. 질량 감소는 잠재적으로는 용해도 증가, 비용 절감, 반응성 증가, 표적 접근가능성 증가, 수력학적 반경 감소, 분석 평가의 정확도 증가 등을 비롯한 수개의 이점을 부여한다. 단일 가닥 태그부착 방법을 사용하는 것 이외에도, 하기: 길이가 단축된 하나 이상의 태그, 일정한 질량 태그 세트, 코딩 헤드피스, 프라이머 결합 영역 및/또는 불변 영역이 없는 라이브러리의 하나 이상의 구성원, 불변 영역이 감소된 라이브러리의 하나 이상의 구성원, 또는 본원에 기술된 임의의 다른 방법 중 하나 이상을 사용하는 것을 포함함으로써 추가의 질량 감소를 달성할 수 있다.
라이브러리 중 구성원의 질량을 최소화시키기 위해, 하나 이상의 빌딩 블록 태그의 길이를, 예컨대 각 스플릿 크기를 코딩할 정도로 가능한 짧은 길이까지로 단축시킬 수 있다. 특히, 태그는 20개 미만의 뉴클레오티드 (예컨대, 19개 미만의 뉴클레오티드, 18개 미만의 뉴클레오티드, 17개 미만의 뉴클레오티드, 16개 미만의 뉴클레오티드, 15개 미만의 뉴클레오티드, 14개 미만의 뉴클레오티드, 13개 미만의 뉴클레오티드, 12개 미만의 뉴클레오티드, 11개 미만의 뉴클레오티드, 10개 미만의 뉴클레오티드, 9개 미만의 뉴클레오티드, 8개 미만의 뉴클레오티드, 또는 7개 미만의 뉴클레오티드)일 수 있다. 하기 실시예에서 기술되는 바와 같이, 보다 짧은 태그 (예컨대, 약 10개 이하의 뉴클레오티드)가 태그 라이게이션에 사용될 수 있다.
일정한 질량의 전략법 또한 사용될 수 있으며, 이는 라이브러리 합성 동안 분석에 도움을 줄 수 있다. 추가로, 일정한 질량 태그 세트를 통해 모든 단일 오류 발생 (예컨대, 서열의 오판독으로부터 또는 태그의 화학적 또는 효소적 라이게이션로부터 발생된 오류), 및 대부분의 다중의 오류 발생을 인식할 수 있다. 일정한 질량 단일 가닥 태그 세트의 길이와 코딩 능력 사이의 관계 (예컨대, 특정 빌딩 블록 스플릿 크기 또는 라이브러리 아이덴티티 등을 지원하는 최소 길이)는 하기 표 1에 개요되어 있다. 따라서, 아이덴티티 세트 사용은 라이브러리 형성 동안 오류 인식을 유지하면서, 유익한 코딩 능력을 제공하는 데 사용될 수 있다.
Figure pct00001
라이브러리 질량을 최소화시키기 위해, 화학적 모이어티 및 태그를 연결시키는 데 뿐만 아니라, 특정 라이브러리의 아이덴티티, 또는 특정 단계를 코딩하는 데에도 헤드피스가 사용될 수 있다. 예를 들어, 헤드피스는 예컨대, 특이적인 라이브러리와 관련된 특정 서열을 사용함으로써 제1 스플릿(들) 또는 라이브러리의 아이덴티티를 코딩하는 다수의 헤드피스와 같은 정보를 코딩할 수 있다.
추가로, DNA-코딩된 화학적 엔티티의 라이브러리로부터 프라이머 결합 (예컨대, 불변) 영역은 선별 단계(들) 동안 배제될 수 있다. 이어서, 상기 영역은 선별 이후, 예컨대 단일 가닥 라이게이션에 의해 부가될 수 있다. 한 예시적인 전략법은 본원에 기술된 바와 같이, 코딩 올리고뉴클레오티드의 5'-말단에 화학적 엔티티를 제공하고, 임의의 유용한 특정 특징 또는 기능에 기초하여 특정 화학적 엔티티를 선별하고, 프라이머 결합 서열을 포함하고, 임의로 하나 이상의 태그, 예컨대 "사용" 태그, "기원" 태그 등을 함유할 수 있는 코딩 올리고뉴클레오티드의 3'-말단에 테일피스 올리고뉴클레오티드를 라이게이션시키는 것을 포함할 것이다. 이어서, 상기 프라이머 결합 서열은 주형-의존성 중합을 개시하여 선별된 라이브러리 구성원에 상보적인 cDNA (또는 cRNA)를 생성하는 데 사용될 수 있다. 이어서, cDNA 또는 cRNA는 그의 3'-말단에서 프라이머 결합 서열을 포함하는 올리고뉴클레오티드에 라이게이션되고, 코딩 정보 양측 모두에 프라이머 결합 서열이 존재하는 바, 올리고뉴클레오티드는, 예컨대 본원에 기술된 것과 같은 확립된 접근법을 사용하여 서열 분석될 수 있고/거나, 증폭될 수 있다.
질량은 코딩 태그를 분리시키는 하나 이상의 불변 서열을 생략하거나, 그의 크기를 축소시킴으로써 추가로 최소화될 수 있다. 단일-가닥 라이게이션은 라이게이션되는 양 말단 사이에, 또는 상기 말단과 스플린트 사이에 어떤 상보적인 관계도 필요로 하지 않는다. 그러므로, 효소적 라이게이션을 지원하는 어떤 고정 서열도 요구되지 않는다. 태그 사이의 짧은 고정 영역이 태그의 정보 분석 또는 다른 인실리코 디컨볼루션 과정에 유용할 수 있다.
올리고뉴클레오티드 태그
본원에 기술된 올리고뉴클레오티드 태그 (예컨대, 빌딩 블록 태그 또는 헤드피스의 일부)는 임의의 유용한 정보, 예컨대 분자, 화학적 엔티티의 일부, 성분 (예컨대, 스캐폴드 또는 빌딩 블록) 부가, 라이브러리 중의 헤드피스, 라이브러리의 아이덴티티, 하나 이상의 라이브러리 구성원 사용 (예컨대, 분취량의 라이브러리 중 구성원의 사용), 및/또는 라이브러리 구성원의 기원 (예컨대, 기원 서열의 사용에 의한 것)을 코딩하는 데 사용될 수 있다.
올리고뉴클레오티드 중의 임의의 서열은 임의의 정보를 코딩하는 데 사용될 수 있다. 따라서, 한 올리고뉴클레오티드 서열은 예컨대, 2가지 이상의 정보 유형을 코딩하는 데, 또는 또한 1가지 이상의 정보 유형을 코딩하는 출발 올리고뉴클레오티드를 제공하는 데 1가지 초과의 도움을 제공할 수 있다. 예를 들어, 제1 빌딩 블록 태그는 제1 빌딩 블록 부가 뿐만 아니라, 라이브러리의 확인을 코딩할 수 있다. 또 다른 일례에서, 헤드피스는 화학적 엔티티를 빌딩 블록 태그에 작동적으로 연결시키는 출발 올리고뉴클레오티드를 제공하는 데 사용될 수 있으며, 여기서 헤드피스는 추가로 라이브러리의 아이덴티티를 코딩하는 서열 (즉, 라이브러리-확인 서열)을 포함한다. 따라서, 본원에 기술된 정보 중 임의의 것은 별개의 올리고뉴클레오티드 태그로 코딩될 수 있거나, 조합되고, 동일한 올리고뉴클레오티드 서열 (예컨대, 올리고뉴클레오티드 태그, 예컨대 빌딩 블록 태그, 또는 헤드피스)로 코딩될 수 있다.
빌딩 블록 서열은 빌딩 블록의 아이덴티티, 및/또는 빌딩 블록으로 수행된 결합 반응의 유형을 코딩한다. 이러한 빌딩 블록 서열은 빌딩 블록 태그에 포함되어 있으며, 여기서 태그는 임의로 하기 기술되는 하나 이상의 서열 유형 (예컨대, 라이브러리-확인 서열, 사용 서열, 및/또는 기원 서열)을 포함할 수 있다.
라이브러리-확인 서열은 특정 라이브러리의 아이덴티티를 코딩한다. 2개 이상의 라이브러리가 혼합될 수 있도록 하기 위해, 라이브러리 구성원은 예컨대, 라이브러리-확인 태그 (즉, 라이브러리-확인 서열을 포함하는 올리고뉴클레오티드)에, 라이게이션된 빌딩 블록 태그에, 헤드피스 서열의 일부에 또는 테일피스 서열에 하나 이상의 라이브러리-확인 서열을 포함할 수 있다. 이러한 라이브러리-확인 서열은 코딩 관계를 추론하는 데 사용될 수 있으며, 여기서 태그의 상기 서열은 번역되고, 화학적 (합성) 히스토리 정보와의 상관 관계가 밝혀진다. 따라서, 이러한 라이브러리-확인 서열을 통해 2개 이상의 라이브러리는 선별, 증폭, 정제, 서열 분석 등을 위해 함께 혼합될 수 있다.
사용 서열은 개별 분취량의 라이브러리 중 하나 이상의 라이브러리 구성원의 히스토리 (즉, 사용)를 코딩한다. 예를 들어, 개별 분취량은 상이한 반응 조건, 빌딩 블록, 및/또는 선별 단계로 처리될 수 있다. 특히, 이러한 서열은 상기 분취량을 확인하고, 그의 히스토리 (사용)을 추론함으로써 선별, 증폭, 정제, 서열 분석 등을 위해 샘플을 함께 혼합시키고자 하는 목적으로 히스토리 (사용)가 다른 (예컨대, 상이한 선별 실험) 분취량의 동일한 라이브러리를 함께 혼합할 수 있도록 하는 데 사용될 수 있다. 이러한 사용 서열은 헤드피스, 테일피스, 빌딩 블록 태그, 사용 태그 (즉, 사용 서열을 포함하는 올리고뉴클레오티드), 또는 본원에 기술된 임의의 다른 태그 (예컨대, 라이브러리-확인 태그 또는 기원 태그)에 포함될 수 있다.
기원 서열은 라이브러리 구성원의 기원을 코딩하는 임의의 유용한 길이 (예컨대, 약 6개의 올리고뉴클레오티드)의 축퇴성 (무작위) 올리고뉴클레오티드 서열이다. 이러한 서열은 그 외에는 모든 면에서 동일한 라이브러리 구성원을 서열 정보에 의해 식별가능한 엔티티로 확률적으로 세분하는 역할을 하며, 이로써, 독특한 전구체 주형 (예컨대, 선별된 라이브러리 구성원)으로부터 유도된 증폭 생성물의 관찰 결과는 동일한 전구체 주형 (예컨대, 선별된 라이브러리 구성원)으로부터 유도된 다중의 증폭 생성물에 대한 관찰 결과로부터 구별될 수 있다. 예를 들어, 라이브러리 형성 이후, 및 선별 단계 이전에, 각 라이브러리 구성원은 예컨대, 기원 태그에 상이한 기원 서열을 포함할 수 있다. 선별 이후, 선별된 라이브러리 구성원은 증폭되어 증폭 생성물로 제조될 수 있고, (예컨대, 기원 태그에) 기원 서열을 포함할 것으로 예상되는 라이브러리 구성원의 일부가 관찰될 수 있고, 이는 각각의 다른 라이브러리 구성원 중의 기원 서열과 비교될 수 있다. 기원 서열은 축퇴성이기 때문에, 각 라이브러리 구성원의 각 증폭 생성물은 상이한 기원 서열을 가져야 한다. 그러나, 증폭 생성물 중의 동일한 기원 서열의 관찰 결과는 예컨대, 반복 서열을 형성하는 서열 중의 증폭 오류 또는 고리화 오류와 같은 오류의 근원을 나타낼 수 있고, 이러한 오류의 출발점 또는 근원은 라이브러리를 사용하는 각 단계 (예컨대, 각각의 선별 단계 또는 증폭 단계)에서 기원 서열을 관찰함으로써 추적될 수 있다. 이러한 기원 서열은 헤드피스, 테일피스, 빌딩 블록 태그, 기원 태그 (즉, 기원 서열을 포함하는 올리고뉴클레오티드), 또는 본원에 기술된 임의의 다른 태그 (예컨대, 라이브러리-확인 태그 또는 사용 태그)에 포함되어 있을 수 있다.
본원에 기술된 서열 유형 중 임의의 것이 헤드피스에 포함되어 있을 수 있다. 예를 들어, 헤드피스는 빌딩 블록 서열, 라이브러리-확인 서열, 사용 서열, 또는 기원 서열 중 하나 이상을 포함할 수 있다.
본원에 기술된 상기 서열 중 임의의 것은 테일피스에 포함되어 있을 수 있다. 예를 들어, 테일피스는 라이브러리-확인 서열, 사용 서열, 또는 기원 서열 중 하나 이상을 포함할 수 있다.
이러한 서열은 올리고뉴클레오티드에 대하여 본원에 기술된 임의의 변형, 예컨대 유기 용매 중의 용해도를 촉진시키거나 (예컨대, 헤드피스의 경우, 본원에 기술된 임의의 것), 천연 포스포디에스테르 연결부의 유사체 (예컨대, 포스포로티오에이트 유사체)를 제공하거나, 하나 이상의 비-천연 올리고뉴클레오티드 (예컨대, 2'-치환된 뉴클레오티드, 예컨대 2'-O-메틸화된 뉴클레오티드 및 2'-플루오로 뉴클레오티드, 또는 본원에 기술된 임의의 것)를 제공하는 하나 이상의 변형을 포함할 수 있다.
이러한 서열은 올리고뉴클레오티드에 대한 본원에 기술된 임의의 특징을 포함할 수 있다. 예를 들어, 이러한 서열은 20개 미만의 뉴클레오티드인 태그 (예컨대, 본원에 기술된 바와 같은 것)에 포함되어 있을 수 있다. 다른 일례에서, 상기 서열 중 하나 이상을 포함하는 태그는 거의 동일한 질량을 가지거나 (예컨대, 각 태그는 2개 이상의 태그 사이의 평균 질량으로부터 약 +/-10%인 질량을 가지거나); 프라이머 결합 (예컨대, 불변) 영역을 포함하지 않거나; 불변 영역을 포함하지 않거나; 길이가 단축된 (예컨대, 30개 미만의 뉴클레오티드, 25개 미만의 뉴클레오티드, 20개 미만의 뉴클레오티드, 19개 미만의 뉴클레오티드, 18개 미만의 뉴클레오티드, 17개 미만의 뉴클레오티드, 16개 미만의 뉴클레오티드, 15개 미만의 뉴클레오티드, 14개 미만의 뉴클레오티드, 13개 미만의 뉴클레오티드, 12개 미만의 뉴클레오티드, 11개 미만의 뉴클레오티드, 10개 미만의 뉴클레오티드, 9개 미만의 뉴클레오티드, 8개 미만의 뉴클레오티드, 또는 7개 미만의 뉴클레오티드 길이) 불변 영역을 가진다.
상기 길이의 라이브러리 및 올리고뉴클레오티드를 서열 분석하는 전략법은 임의로 각각 판독 충실도 또는 서열 분석 심도를 증가시키기 위해서 연결 또는 연쇄화 전략법을 포함할 수 있다. 특히, 프라이머 결합 영역을 포함하지 않는 코딩된 라이브러리의 선별은 SELEX에 대한 문헌에 기술되어 있으며, 예컨대 문헌 [Jarosch et al., Nucleic Acids Res . 34: e86 (2006)] (이는 본원에 참조로 포함된다)에 기술되어 있다. 예를 들어, 라이브러리 구성원은 복합체의 5'-말단 상에 제1 어댑터 서열, 및 복합체의 3'-말단 상에 제2 어댑터 서열을 포함하도록 (예컨대, 선별 단계 이후) 변형될 수 있으며, 여기서 제1 서열은 실질적으로 제2 서열과 상보적이고, 이로써 이중체를 형성하게 된다. 수율을 추가로 개선시키기 위하여 2개의 고정된 현수형 뉴클레오티드 (예컨대, CC)가 5'-말단에 부가된다. 특정 실시양태에서, 제1 어댑터 서열은 5'-GTGCTGC-3' (서열 1)이고, 제2 어댑터 서열은 5'-GCAGCACCC-3' (서열 2)이다.
헤드피스
라이브러리에서, 헤드피스는 각 화학적 엔티티를 그의 코딩 올리고뉴클레오티드 태그에 작동적으로 연결시킨다. 일반적으로, 헤드피스는 추가로 유도체화될 수 있는 2개의 관능기를 갖는 출발 올리고뉴클레오티드이며, 여기서 제1 관능기는 화학적 엔티티 (또는 그의 성분)를 헤드피스에 작동적으로 연결시키고, 제2 관능기는 하나 이상의 태그를 헤드피스에 작동적으로 연결시킨다. 링커는 임의로 헤드피스와 화학적 엔티티 사이의 스페이서로서 사용될 수 있다.
헤드피스의 관능기는 화학적 엔티티의 성분과의 공유 결합, 및 태그와의 또 다른 공유 결합을 형성하는 데 사용될 수 있다. 성분은 예컨대, 다양성 노드를 갖는 스캐폴드 또는 빌딩 블록과 같은 소형 분자의 임의의 일부일 수 있다. 별법으로, 헤드피스는 화학적 엔티티의 성분과 공유 결합을 형성하는 데 사용되는, 관능기 (예컨대, 히드록실, 아민, 카르복실, 술프히드릴, 알키닐, 아지도, 또는 포스페이트기)로 종결되는 링커 (즉, 라이브러리에서 형성하고자 하는 소형 분자로부터 헤드피스를 분리시키는 스페이서)를 제공하도록 유도체화될 수 있다. 링커는 헤드피스의 5'-말단, 내부 위치 중 한쪽에, 또는 3'-말단에 부착될 수 있다. 링커가 내부 위치 중 한쪽에 부착될 경우, 링커는 유도체화된 염기 (예컨대, C5 위치의 우리딘)에 작동적으로 연결될 수 있거나, 또는 당업계에 공지된 표준 기법을 사용하여 올리고뉴클레오티드 내에 내부적으로 배치될 수 있다. 예시적인 링커는 본원에 기술되어 있다.
헤드피스는 임의의 유용한 구조를 가질 수 있다. 헤드피스의 길이는 예컨대, 1 내지 100개의 뉴클레오티드 길이, 바람직하게, 5 내지 20개의 뉴클레오티드 길이, 및 가장 바람직하게, 5 내지 15 뉴클레오티드 길이일 수 있다. 헤드피스는 단일 가닥 또는 이중 가닥일 수 있고, 본원에 기술된 바와 같이, 천연 또는 변형된 뉴클레오티드로 구성될 수 있다. 헤드피스의 특정 예시적인 실시양태는 도 4a-4d에 기술되어 있다. 예를 들어, 화학적 모이어티는 헤드피스의 3'-말단 (도 4a) 또는 5'-말단 (도 4b)에 작동적으로 연결될 수 있다. 특정 실시양태에서, 헤드피스는 서열 내에 상보적인 염기에 의해 형성된 헤어핀 구조를 포함한다. 예를 들어, 화학적 모이어티는 헤드피스의 내부 위치 (도 4c), 3'-말단 (도 4d), 또는 5'-말단에 작동적으로 연결될 수 있다.
일반적으로, 헤드피스는 5'- 또는 3'-말단 상에 중합, 효소적 라이게이션, 또는 화학적 반응에 의해 올리고뉴클레오티드 태그를 결합시킬 수 있는 비-상보적인 서열을 포함한다. 도 4e에서, 예시적인 헤드피스를 통해 올리고뉴클레오티드 태그 (1-4로 표지화)는 라이게이션될 수 있고, 본 방법은 정제 및 인산화 단계를 포함한다. 태그 4의 부가 후, 추가의 어댑터 서열을 태그 4의 5'-말단에 부가할 수 있다. 예시적인 어댑터 서열은 프라이머 결합 서열 또는 표지 (예컨대, 비오틴)을 갖는 서열을 포함한다. 다수의 빌딩 블록 및 상응하는 태그 (예컨대, 100개의 태그)가 사용되는 경우, 필요한 개수의 태그를 형성하기 위해 올리고뉴클레오티드 합성 단계 동안 혼합-및-스플릿 전략법이 사용될 수 있다. DNA 합성을 위한 상기의 혼합-및-스플릿 전략법은 당업계에 공지되어 있다. 엔티티 대 관심의 대상이 되는 표적(들) 결합에 대한 선별 후, 생성된 라이브러리 구성원을 PCR에 의해 증폭시킬 수 있다.
헤드피스 또는 복합체는 임의로 하나 이상의 프라이머 결합 서열을 포함할 수 있다. 예를 들어, 헤드피스는 헤어핀의 루프 영역에 증폭을 위한 프라이머 결합 영역으로서의 역할을 하는 서열을 가지며, 여기서 프라이머 결합 영역은 그의 상보적인 프라이머 (예컨대, 측면에 위치하는 식별자 영역을 포함할 수 있다)에 대한 융점이 헤드피스 중의 서열에 대한 것보다 더 높다. 다른 실시양태에서, 복합체는 하나 이상의 빌딩 블록을 코딩하는 하나 이상의 태그의 양측에 (예컨대, PCR 반응을 수행할 수 있는) 2개의 프라이머 결합 서열을 포함한다. 별법으로, 헤드피스는 5'- 또는 3'-말단 상에 하나의 프라이머 결합 서열을 포함할 수 있다. 다른 실시양태에서, 헤드피스는 헤어핀이고, 루프 영역은 프라이머 결합 부위를 형성하거나, 또는 프라이머 결합 부위는 루프의 3'측 상에서의 헤드피스에의 올리고뉴클레오티드의 하이브리드화를 통해 도입된다. 헤드피스의 3'-말단과 상동성인 영역을 포함하고, 그의 5'-말단 상에 (예컨대, PCR 반응을 수행할 수 있는) 프라이머 결합 영역을 보유하는 프라이머 올리고뉴클레오티드는 헤드피스와 하이브리드화될 수 있고, 빌딩 블록, 또는 빌딩 블록의 부가를 코딩하는 태그를 포함한다. 프라이머 올리고뉴클레오티드는 생물정보학적 분석을 위해 포함되는 추가의 정보, 예컨대 무작위화된 뉴클레오티드의 영역, 예컨대 2 내지 16개의 뉴클레오티드 길이를 포함할 수 있다.
헤드피스는 임의로, 임의의 유용한 방법에 의해 달성될 수 있는 헤어핀 구조를 포함할 수 있다. 예를 들어, 헤드피스는 예컨대, ?슨 크릭(Watson-Crick) DNA 염기쌍 형성 (예컨대, 아데닌-티민 및 구아닌-시토신)에 의해 및/또는 워블(wobble) 염기쌍 형성 (예컨대, 구아닌-우라실, 이노신-우라실, 이노신-아데닌, 및 이노신-시토신)에 의해 분자간 염기쌍 형성 파트너를 형성하는 상보적인 염기를 포함할 수 있다. 또 다른 일례에서, 헤드피스는 비변형된 뉴클레오티드와 비교하여 더 높은 친화도로 이중체를 형성할 수 있는 변형된 또는 치환된 뉴클레오티드를 포함할 수 있으며, 상기 변형된 또는 치환된 뉴클레오티드는 당업계에 공지된 것이다. 추가의 또 다른 일례에서, 헤드피스는 헤어핀 구조를 형성하는 하나 이상의 가교된 염기를 포함한다. 예를 들어, 단일 가닥 내의 염기 또는 상이한 이중 가닥 중의 염기는 예컨대, 소랄렌(psoralen)을 사용함으로써 가교될 수 있다.
헤드피스 또는 복합체는 임의로 검출될 수 있도록 허용하는 하나 이상의 표지를 포함할 수 있다. 예를 들어, 헤드피스, 하나 이상의 올리고뉴클레오티드 태그, 및/또는 하나 이상의 프라이머 서열은 동위원소, 방사성 영상화제, 마커, 트레이서, 형광성 표지 (예컨대, 로다민 또는 플루오레세인), 화학발광성 표지, 양자점, 및 리포터 분자 (예컨대, 비오틴 또는 his-태그)를 포함할 수 있다.
다른 실시양태에서, 헤드피스 또는 태그는 반-수성, 감소된 수성, 또는 비-수성 (예컨대, 유기) 조건하에서의 용해도를 지원하도록 변형될 수 있다. 예를 들어, 그의 상보적인 염기에 수소 결합할 수 있는 그의 능력은 유의적으로 파괴시키지 않으면서, T 또는 C 염기의 C5 위치를 지방족 쇄로 변형시킴으로써 헤드피스 또는 태그의 뉴클레오티드 염기의 소수성은 더 증가될 수 있다. 예시적인 변형된 또는 치환된 뉴클레오티드는 5'-디메톡시트리틸-N4-디이소부틸아미노메틸리덴-5-(1-프로피닐)-2'-데옥시시티딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 5'-디메톡시트리틸-5-(1-프로피닐)-2'-데옥시우리딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 5'-디메톡시트리틸-5-플루오로-2'-데옥시우리딘, 3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 및 5'-디메톡시트리틸-5-(피렌-1-일-에티닐)-2'-데옥시우리딘, 또는 3'-[(2-시아노에틸)-(N,N-디이소프로필)]- 포스포르아미다이트이다.
추가로, 헤드피스 올리고뉴클레오티드 사이에는 유기 용매 중에서의 용해도를 촉진시키는 변형이 배치되어 있을 수 있다. 예를 들어, 아조벤젠 포스포르아미다이트는 헤드피스 디자인 내로 소수성 모이어티를 도입할 수 있다. 소수성 아미다이트의 헤드피스 내로의 상기와 같은 삽입은 분자 중 어디에서나 이루어질 수 있다. 그러나, 삽입은 일단 선별이 완료되면, 라이브러리 합성 또는 후속 PCR 동안, 또는 태그 디컨볼루션에 사용될 경우, 마이크로어레이 분석 동안 추가의 DNA 태그를 사용하는 후속 태그부착을 방해할 수는 없다. 본원에 기술된 헤드피스 디자인에의 상기와 같은 부가는 예를 들어, 예를 들어, 15%, 25%, 30%, 50%, 75%, 90%, 95%, 98%, 99%, 또는 100% 유기 용매 중에서 헤드피스가 가용성이 되게 한다. 따라서, 헤드피스 디자인 내로의 소수성 잔기의 부가는 헤드피스가 핵산 태그부착에 대하여 적격성이 되도록 하면서, 반-수성 또는 비-수성 (예를 들어, 유기) 조건에서의 용해도를 개선시킨다. 추가로, 이어서 라이브러리 내로 도입되는 DNA 태그는 또한 T 또는 C 염기의 C5 위치에서도 변형될 수 있으며, 이로써, 이들은 또한 라이브러리 합성의 후속 단계를 위해 라이브러리의 소수성을 더욱 증가시키고, 유기 용매 중에서의 가용성을 증가시킨다.
특정 실시양태에서, 헤드피스 및 제1 빌딩 블록 태그는 동일한 엔티티일 수 있으며, 즉, 다수의 헤드피스-태그 엔티티는, 모두가 공통부 (예컨대, 프라이머 결합 영역)는 공유하고, 모두가 또 다른 부분 (예컨대, 코딩 영역)에서는 차이를 보이도록 구축될 수 있다. 이들은 "스플릿" 단계에서 사용될 수 있고, 그가 코딩하는 사례 발생 이후에 풀링될 수 있다.
특정 실시양태에서, 헤드피스는 예컨대, 특이적인 라이브러리와 관련된 특정 서열을 사용하여 예컨대, 제1 스플릿(들) 단계를 코딩하는 서열, 또는 라이브러리의 아이덴티티를 코딩하는 서열을 포함함으로써 정보를 코딩할 수 있다.
효소적 라이게이션 및 화학적 라이게이션 기법
다양한 라이게이션 기법은 스캐폴드, 빌딩 블록, 링커, 빌딩 블록 태그, 및/또는 헤드피스를 부가하여 복합체를 제조하는 데 사용될 수 있다. 따라서, 본원에 기술된 결합 단계 중 임의의 단계는 임의의 유용한 라이게이션 기법, 예컨대 효소적 라이게이션 및/또는 화학적 라이게이션을 포함할 수 있다. 이러한 결합 단계는 하나 이상의 빌딩 블록 태그의 헤드피스 또는 복합체에의 부가; 링커의 헤드피스에의 부가; 및 하나 이상의 스캐폴드 또는 빌딩 블록의 헤드피스 또는 복합체에의 부가를 포함할 수 있다. 특정 실시양태에서, 임의의 올리고뉴클레오티드에 대하여 사용되는 라이게이션 기법은 전사 및/또는 역전사되어 라이브러리의 디코딩, 또는 하나 이상의 DNA 또는 RNA 폴리머라제를 이용하는 주형-의존성 중합을 허용하도록 할 수 있는 생성된 생성물을 제공한다.
일반적으로, 효소적 라이게이션을 통해 전사 및/또는 역전사될 수 있는, 천연 포스포디에스테르 결합을 갖는 올리고뉴클레오티드가 제조된다. 효소적 라이게이션 방법의 일례는 본원에 제공되어 있으며, 이는 하나 이상의 RNA 또는 DNA 리가제, 예컨대 T4 RNA 리가제, T4 DNA 리가제, 써클리가제™ ssDNA 리가제, 써클리가제™ II ssDNA 리가제, 및 써모파지(ThermoPhage)™ ssDNA 리가제 (프로카자임 리미티드(Prokazyme Ltd.: 아이슬란드 레이캬비크))의 사용을 포함한다.
화학적 라이게이션은 또한 전사 또는 역전사될 수 있는 올리고뉴클레오티드를 제조하는 데 사용될 수 있다. 화학적 라이게이션의 한가지 이점은 상기 올리고뉴클레오티드의 고체상 합성이 효율적인 라이게이션 수율을 지원하는 데 최적화될 수 있다는 점이다. 그러나, 전사 또는 역전사될 수 있는 올리고뉴클레오티드를 제공하는 화학적 라이게이션 기법의 효과는 시험될 필요가 있을 수 있다. 이러한 효과는 임의의 유용한 방법, 예컨대 액체 크로마토그래피-질량 분석법, RT-PCR 분석, 및/또는 PCR 분석에 의해 시험될 수 있다. 이러한 방법의 예는 실시예 5에 제공되어 있다.
특정 실시양태에서, 화학적 라이게이션은 전사 또는 역전사될 수 있는 스페이서를 제공하기 위해 하나 이상의 화학적 공-반응성 쌍을 사용하는 것을 포함한다. 특히, 화학적 공-반응성 쌍에 적합한 반응은 고리화 공정에 바람직한 후보물질이 된다 (문헌 [Kolb et al., Angew . Chem . Int . Ed ., 40:2004-2021 (2001)]; [Van der Eycken et al., QSAR Comb . Sci ., 26:1115-1326 (2007)]). 예시적인 화학적 공-반응성 쌍은 휘스겐 1,3-양극성 고리화첨가 반응을 통해 트리아졸 스페이서를 형성하는 임의로 치환된 알키닐기 및 임의로 치환된 아지도기; 딜스-알더 반응을 통해 시클로알케닐 스페이서를 형성하는 4π 전자계를 갖는 임의로 치환된 디엔 (예컨대, 임의로 치환된 1,3-불포화 화합물, 예컨대 임의로 치환된 1,3-부타디엔, 1-메톡시-3-트리메틸실릴옥시-1,3-부타디엔, 시클로펜타디엔, 시클로헥사디엔, 또는 푸란) 및 2π 전자계를 갖는 임의로 치환된 친디엔체 또는 임의로 치환된 이종친디엔체 (예컨대, 임의로 치환된 알케닐기 또는 임의로 치환된 알키닐기); 개환 반응을 통해 헤테로알킬 스페이서를 형성하는 친핵체 (예컨대, 임의로 치환된 아민 또는 임의로 치환된 티올)와 변형된 헤테로시클릴 친전자체 (예컨대, 임의로 치환된 에폭시드, 아지리딘, 아지리디늄 이온, 또는 에피술포늄 이온); 예컨대, 5'-아이오도 dT를 함유하는 올리고뉴클레오티드와 3'-포스포로티오에이트 올리고뉴클레오티드의 스플린트형 라이게이션에서와 같이, 포스포로티오에이트기와 아이오도기; 및 임의로 상업적으로 이용가능한 3'-글리세릴-변형된 올리고뉴클레오티드를 산화시킴으로써 수득될 수 있는 3'-알데히드-변형된 올리고뉴클레오티드와 5'-아미노 올리고뉴클레오티드 (즉, 환원성 아민화 반응에서) 또는 5'-히드라지도 올리고뉴클레오티드와의 반응과 같이, 알데히드기와 아미노기를 비롯한 쌍이다.
다른 실시양태에서, 화학적 라이게이션은 예컨대, 선별 후 PCR 분석 및 서열 분석을 위해 포스포디에스테르 결합의 유사체를 도입하는 것을 포함한다. 포스포디에스테르의 유사체의 예로는 포스포로티오에이트 연결부 (예컨대, 포스포로티오에이트기 및 이탈기, 예컨대 아이오도기의 사용에 의해 도입된 것과 같은 것), 포스포르아미드 연결부, 또는 포스포로디티오에이트 연결부 (예컨대, 포스포로디티오에이트기 및 이탈기, 예컨대 아이오도기의 사용에 의해 도입된 것과 같은 것)를 포함한다.
효소적 라이게이션 또는 화학적 라이게이션 촉진시키기 위한 반응 조건
본 발명은 또한 헤드피스와 태그 사이, 또는 두 태그 사이의 효소적 또는 화학적 라이게이션을 촉진시키는 하나 이상의 반응 조건을 특징으로 한다. 이러한 반응 조건으로는 본원에 기술된 바와 같이, 태그내 변형된 뉴클레오티드를 사용하는 것; 길이가 상이한 공여자 태그 및 수용자 태그를 사용하고, 태그의 농도를 달리하는 것; 상이한 유형의 리가제 뿐만 아니라, 그의 조합 (예컨대, 써클리가제™ DNA 리가제 및/또는 T4 RNA 리가제)을 사용하고, 그의 농도를 달리하는 것; 분자량이 상이한 폴리에틸렌 글리콜 (PEG)을 사용하고, 그의 농도를 달리하는 것; 비-PEG 집중화제 (예컨대, 베타인 또는 소혈청 알부민)을 사용하는 것; 라이게이션 온도 및 지속 시간을 달리하는 것; ATP, Co(NH3)6Cl3, 및 효모 무기 피로포스페이트를 비롯한, 다양한 작용제의 농도를 달리하는 것; 효소적으로 또는 화학적으로 인산화된 올리고뉴클레오티드 태그를 사용하는 것; 3'-보호된 태그를 사용하는 것; 및 프리아데닐화된 태그를 사용하는 것을 포함한다. 이러한 반응 조건은 또한 화학적 라이게이션도 포함한다.
헤드피스 및/또는 태그는 하나 이상의 변형된 또는 치환된 뉴클레오티드를 포함할 수 있다. 바람직한 실시양태에서, 헤드피스 및/또는 태그는 효소적 라이게이션을 촉진시키는 하나 이상의 변형된 또는 치환된 뉴클레오티드, 예컨대 2'-O-메틸 뉴클레오티드 (예컨대, 2'-O-메틸 구아닌 또는 2'-O-메틸 우라실), 2'-플루오로 뉴클레오티드, 또는 라이게이션에 대하여 기질로서 사용되는 임의의 다른 변형된 뉴클레오티드를 포함한다. 별법으로, 헤드피스 및/또는 태그는 화학적 라이게이션을 지원하는 하나 이상의 화학적으로 반응성 기 (예컨대, 임의로 치환된 알키닐기 및 임의로 치환된 아지도기)를 포함하도록 변형된다. 임의로, 태그 올리고뉴클레오티드는 양 말단 모두에서 화학적으로 반응성 기로 관능화되고, 임의로, 이들 말단 중 하나는 보호되고, 이로써, 기는 독립적으로 어드레싱될 수 있고, 부반응은 감소될 수 있다 (예컨대, 중합 부반응은 감소).
효소적 라이게이션은 하나 이상의 리가제를 포함할 수 있다. 예시적인 리가제는 써클리가제™ ssDNA 리가제 (에피센터 바이오테크놀로지스(EPICENTRE Biotechnologies: 미국 위스콘신주 매디슨)), 써클리가제™ II ssDNA 리가제 (이 또한 에피센터 바이오테크놀로지스로부터 입수), 써모파지™ ssDNA 리가제 (프로카자임 리미티드: 아이슬란드 레이캬비크), T4 RNA 리가제, 및 T4 DNA 리가제를 포함한다. 바람직한 실시양태에서, 라이게이션은 RNA 리가제, 또는 RNA 리가제 및 DNA 리가제의 조합을 사용하는 것을 포함한다. 라이게이션은 추가로 하나 이상의 리가제와 함께 조합하여 하나 이상의 가용성 다가 양이온, 예컨대 Co(NH3)6Cl3을 포함한다.
라이게이션 단계 이전 또는 이후, 복합체는 3가지 이유에서 정제될 수 있다. 첫째, 복합체는 교차 반응을 일으킬 수 있고, 코딩 과정에 "잡음"을 도입할 수 있는 비반응 헤드피스 또는 태그를 제거하기 위해 정제될 수 있다. 둘째, 복합체는 리가제의 라이게이션 활성을 억제시키거나 저하시킬 수 있는 임의의 시약 또는 비반응 출발 물질을 제거하기 위해 정제될 수 있다. 예를 들어, 포스페이트는 라이게이션 활성을 저하시킬 수 있다. 세째, 화학적 또는 라이게이션 단계로 도입되는 엔티티는 후속 화학적 또는 라이게이션 단계가 수행될 수 있도록 하기 위해서 제거되어야 할 필요가 있을 수 있다. 복합체를 정제하는 방법은 본원에 기술되어 있다.
효소적 및 화학적 라이게이션은 평균 분자량이 300 달톤 초과 (예컨대, 600 달톤 초과, 3,000 달톤 초과, 4,000 달톤 초과, 또는 4,500 달톤 초과)인 폴리에틸렌 글리콜을 포함할 수 있다. 특정 실시양태에서, 폴리에틸렌 글리콜의 평균 분자량은 약 3,000 달톤 내지 9,000 달톤 (예컨대, 3,000 달톤 내지 8,000 달톤, 3,000 달톤 내지 7,000 달톤, 3,000 달톤 내지 6,000 달톤, 및 3,000 달톤 내지 5,000 달톤)이다. 바람직한 실시양태에서, 폴리에틸렌 글리콜의 평균 분자량은 약 3,000 달톤 내지 약 6,000 달톤 (예컨대, 3,300 달톤 내지 4,500 달톤, 3,300 달톤 내지 5,000 달톤, 3,300 달톤 내지 5,500 달톤, 3,300 달톤 내지 6,000 달톤, 3,500 달톤 내지 4,500 달톤, 3,500 달톤 내지 5,000 달톤, 3,500 달톤 내지 5,500 달톤, 및 3,500 달톤 내지 6,000 달톤, 예컨대 4,600 달톤)이다. 폴리에틸렌 글리콜은 임의의 유용한 양으로, 예컨대 약 25% (w/v) 내지 약 35% (w/v), 예컨대 30% (w/v)로 존재할 수 있다.
본 발명의 바람직한 실시양태에서, 빌딩 블록 태그는 하기 개요된 라이게이션 프로토콜을 사용하여 단일 가닥 올리고뉴클레오티드를 단일 가닥 올리고뉴클레오티드에 라이게이션시킴으로써 설치된다:
헤드피스: 25 μM (5' 말단: 5'-모노포스포/2'-OMe G,
개재 뉴클레오티드: 2'-데옥시, 및 3'말단: 2'-
차단/3'-차단)
빌딩 블록 태그: 25 μM (5'-말단: 2'-OMe/5'-OH G, 개재
뉴클레오티드: 2'-데옥시, 및 3'-말단: 3'-OH/2'-OMe)
Co(NH3)6Cl3: 1 mM
PEG 4600: 30% (w/v)
T4 RNA 리가제 (프로메가(Promega)): 1.5 유닛/㎕
효모 무기 피로포스파타제: 0.0025 유닛/㎕
트리스: 50 mM
MgCl2: 10 mM
ATP: 1 mM
pH: 7.5
물: 잔량(Balance)
추가의 실시양태에서, 프로토콜은 37℃에서 20시간 동안 인큐베이션시키는 것을 포함한다. 실제 라이브러리를 구축하기 위한 목적으로, 보다 고농도의 헤드피스, 태그, 및/또는 리가제가 사용될 수 있으며, 이러한 농도에 대한 상기와 같은 변형 당업자에게 자명할 것이다.
라이브러리내 화학적 엔티티를 코딩하는 방법
본 발명의 방법은 올리고뉴클레오티드 태그에 의해 코딩되는 다양한 개수의 화학적 엔티티를 갖는 라이브러리를 합성하는 데 사용될 수 있다. 빌딩 블록 및 코딩 DNA 태그의 예는 미국 특허 출원 공개 번호 2007/0224607 (이는 본원에 참조로 포함된다)에서 살펴볼 수 있다.
각 화학적 엔티티는 하나 이상의 빌딩 블록 및 임의로 스캐폴드로부터 형성된다. 스캐폴드는 특정의 기하학적 형태로 하나 이상의 다양성 노드를 제공하는 역할을 한다 (예컨대, 트리아진은 헤테로아릴 고리 또는 선형 기하학적 형태 주변에 공간적으로 배열된 3개의 노드를 제공한다).
빌딩 블록 및 그의 코딩 태그는 직접적으로 또는 (예컨대, 링커를 통해) 간접적으로 헤드피스에 부가됨으로써 복합체를 형성할 수 있다. 헤드피스가 링커를 포함하는 경우, 빌딩 블록 또는 스캐폴드는 링커의 단부에 부가된다. 링커가 존재하지 않을 경우, 빌딩 블록은 헤드피스에 직접적으로 부가될 수 있거나, 또는 빌딩 블록 그 자체는 헤드피스의 관능기와 반응하는 링커를 포함할 수 있다. 예시적인 링커 및 헤드피스는 본원에 기술되어 있다.
스캐폴드는 임의의 유용한 방식으로 부가될 수 있다. 예를 들어, 스캐폴드는 링커 또는 헤드피스의 단부에 부가될 수 있고, 연속 빌딩 블록은 스캐폴드의 이용가능한 다양성 노드에 부가될 수 있다. 또 다른 일례에서, 빌딩 블록 An은 먼저 링커 또는 헤드피스에 부가된 후, 이어서, 스캐폴드 S의 다양성 노드는 빌딩 블록 An 중의 관능기와 반응한다. 특정 스캐폴드를 코딩하는 올리고뉴클레오티드 태그는 임의로 헤드피스 또는 복합체에 부가될 수 있다. 예를 들어, Sn은 n개의 반응 용기 중의 복합체에 부가되고 (여기서, n은 1 초과의 정수이다), 태그 Sn (즉, 태그 S1, S2, ... Sn -1, Sn)은 복합체의 관능기에 결합하게 된다.
빌딩 블록은 다중의 합성 단계로 부가될 수 있다. 예를 들어, 분취량의, 임의로 링커가 부착되어 있는 헤드피스를 n개의 반응 용기로 분리한다 (여기서, n은 2 이상의 정수이다). 제1 단계, 빌딩 블록 An을 각 n 반응 용기에 첨가하고 (즉, 빌딩 블록 A1, A2, ... An -1, An을 반응 용기 1, 2, ... n-1, n에 첨가한다 (여기서, n은 정수이고, 각각의 빌딩 블록 An은 유일의 것이다). 제2 단계에서, 스캐폴드 S를 각 반응 용기에 첨가하여 An-S 복합체를 형성한다. 임의로, 스캐폴드 Sn을 각 반응 용기에 첨가하여 An-Sn 복합체를 형성할 수 있다 (여기서, n은 2 초과의 정수이고, 각 스캐폴드 Sn은 유일의 것일 수 있다). 제3 단계에서, 빌딩 블록 Bn을 An-S 복합체를 함유하는 각 n 반응 용기에 첨가하고 (즉, 빌딩 블록 B1, B2, ... Bn -1, Bn을, A1-S, A2-S, ... An -1-S, An-S 복합체를 함유하는 반응 용기 1, 2, ... n-1에 첨가한다 (여기서, 각각의 빌딩 블록 Bn은 유일의 것이다). 추가의 단계에서, 빌딩 블록 Cn을 Bn-An-S 복합체를 함유하는 각 n 반응 용기에 첨가할 수 있다 (즉, 빌딩 블록 C1, C2, ... Cn-1, Cn을 B1-A1-S ... Bn-An-S 복합체를 함유하는 반응 용기 1, 2, ... n-1에 첨가한다) (여기서, 각각의 빌딩 블록 Cn은 유일의 것이다). 생성된 라이브러리는 n3개의 태그를 갖는 n3개의 복합체를 가질 것이다. 이러한 방식으로, 추가의 합성 단계를 사용하여 추가의 빌딩 블록을 결합시킴으로써 라이브러리를 추가로 다양화시킬 수 있다.
라이브러리를 형성한 후, 생성된 복합체를 임의로 정제하고, 하나 이상의 프라이머를 사용하여 중합 또는 라이게이션 반응을 수행할 수 있다. 상기 일반 전략법은 추가의 다양성 노드 및 빌딩 블록 (예컨대, D, E, F 등)을 포함하도록 확장시킬 수 있다. 예를 들어, 제1 다양성 노드는 빌딩 블록 및/또는 S와 반응하고, 올리고뉴클레오티드 태그에 의해 코딩된다. 이어서, 추가의 빌딩 블록은 생성된 복합체와 반응하고, 후속 다양성 노드는 추가의 빌딩 블록에 의해 유도체화되며, 이는 중합 또는 라이게이션 반응에 사용되는 프라이머를 코딩한다.
코딩된 라이브러리를 형성하기 위해, 각 합성 단계 이후, 또는 이전에 올리고뉴클레오티드 태그를 복합체에 부가할 수 있다. 예를 들어, 빌딩 블록 An을 각 반응 용기에 첨가하기 이전, 또는 그 이후에, 태그 An을 헤드피스의 관능기에 결합시킨다 (즉, 태그 A1, A2, ... An -1, An을 헤드피스를 함유하는 반응 용기 1, 2, ... n-1에 첨가한다). 각 태그 An은 각 유일의 빌딩 블록 An과 상관 관계가 있는 상이한 서열을 가지며; 태그 An의 서열을 측정함으로써 빌딩 블록 An의 화학적 구조를 제공할 수 있다. 이러한 방식으로, 추가의 태그는 추가의 빌딩 블록 또는 추가의 스캐폴드를 코딩하는 데 사용된다.
추가로, 복합체에 부가된 마지막 태그는 프라이머 서열을 포함할 수 있거나, 또는 (예컨대, 라이게이션에 의한) 프라이머 서열의 결합을 허용하는 관능기를 제공할 수 있다. 프라이머 서열은 복합체의 올리고뉴클레오티드 태그를 증폭시키고/거나, 서열 분석하는 데 사용될 수 있다. 증폭 및 서열 분석 방법의 예로는 중합효소 연쇄 반응 (PCR), 선형 연쇄 증폭 (LCR), 회전 환 증폭 (RCA), 또는 당업계에 공지된, 핵산 서열을 증폭 또는 측정하는 임의의 다른 방법을 포함한다.
상기 방법을 사용함으로써, 다수의 코딩된 화학적 엔티티를 갖는 대형 라이브러리를 형성할 수 있다. 예를 들어, 헤드피스는 1,000개의 상이한 변이체를 포함하는 (즉, n = 1,000) 링커 및 빌딩 블록 An과 반응한다. 각각의 빌딩 블록 An의 경우, DNA 태그 An은 헤드피스에 라이게이션되거나, 프라이머 연장된다. 이러한 반응은 1,000-웰 플레이트 또는 10 x 100 웰 플레이트에서 수행될 수 있다. 모든 반응을 풀링하고, 임의로 정제하고, 제2 플레이트 세트로 분할 수 있다. 이어서, 이 역시 1,000개의 상이한 변이체를 포함하는 빌딩 블록 Bn을 이용하여 동일한 방법을 수행할 수 있다. DNA 태그 Bn을 An-헤드피스 복합체에 라이게이션시킬 수 있고, 모든 반응을 풀링시킬 수 있다. 생성된 라이브러리는 1,000,000개의 상이한 태그 조합에 의해 태그부착된 1,000 x 1,000개의 An x Bn 조합 (즉, 1,000,000개의 화합물)을 포함한다. 동일한 접근법을 확장시켜 빌딩 블록 Cn, Dn, En 등을 부가시킬 수 있다. 이어서, 생성된 라이브러리를 사용하여 표적에 결합하는 화합물을 확인할 수 있다. DNA 태그의 PCR 및 서열 분석에 의해 라이브러리에 결합하는 화학적 엔티티의 구조를 임의로 평가함으로써 강화된 화합물을 확인할 수 있다.
각각의 빌딩 블록의 부가 이후 태그부착을 피하기 위해, 또는 풀링 (또는 혼합)을 피하기 위해 상기 방법을 변형시킬 수 있다. 예를 들어, 본 방법은 빌딩 블록 An을 n개의 반응 용기 (여기서, n은 1 초과의 정수이다)에 첨가함으로써, 동일한 빌딩 블록 Bn을 각 반응 웰에 첨가함으로써 변형될 수 있다. 여기서, B1은 각 화학적 엔티티에 대하여 동일하며, 따라서, 상기 빌딩 블록을 코딩하는 올리고뉴클레오티드 태그는 요구되지 않는다. 빌딩 블록 부가 후, 복합체를 풀링시킬 수 있거나, 풀링시키지 않을 수 있다. 예를 들어, 빌딩 블록을 부가하는 최종 단계 후, 라이브러리를 풀링시키지 않고, 풀을 개별적으로 스크리닝하여 표적에 결합하는 화합물(들)을 확인한다. 합성 후, 모든 반응의 풀링을 회피하기 위해, 예를 들어, (SRU 바이오시스템즈 인코퍼레이티드로부터 입수한) 바인드® 판독기를 사용하여 고처리량 포맷으로 (예컨대, 384개의 웰 플레이트 및 1,536개의 웰 플레이트) 센서 표면 상에서의 결합을 모니터링할 수 있다. 예를 들어, 빌딩 블록 An은 DNA 태그 An으로 코딩될 수 있고, 빌딩 블록 Bn은 웰 플레이트 내의 그의 위치에 의해 코딩될 수 있다. 이어서, 후보물질 화합물은 (예컨대, 이 또한 SRU 바이오시스템즈 인코퍼레이티드에 의해 이용가능한 바인드® 바이오센서를 사용하거나, 또는 ELISA 검정법을 사용하여) 결합 검정법을 이용함으로써, 및 서열 분석, 마이크로어레이 분석 및/또는 제한 분해 분석에 의해 An 태그를 분석함으로써 확인될 수 있다. 이러한 분석을 통해 원하는 분자를 형성하는 빌딩 블록 An 및 Bn의 조합을 확인할 수 있다.
증폭 방법은 임의로 유중수 에멀젼을 형성하여 다수의 수성 마이크로반응기를 생성하는 것을 포함한다. 반응 조건 (예컨대, 복합체의 농도 및 마이크로반응기의 크기)는 평균적으로 화합물로 이루어진 라이브러리의 하나 이상의 구성원을 갖는 마이크로반응기를 제공할 수 있도록 조정될 수 있다. 각 마이크로반응기는 또한 표적, 복합체 또는 복합체의 일부 (예컨대, 하나 이상의 태그)에 결합 및/또는 상기 표적에 결합할 수 있는 단일 비드, 및 핵산 증폭을 수행하기 위한 하나 이상의 필요 시약을 갖는 증폭 반응 용액을 함유할 수 있다. 마이크로반응기 중에서 태그를 증폭시킨 후, 마이크로반응기 중에서 증폭된 태그의 카피를 비드에 결합시키고, 임의의 유용한 방법에 의해 코팅된 비드를 확인할 수 있다.
일단 관심의 대상이 되는 표적에 결합하는 빌딩 블록을 제1 라이브러리로부터 확인하고 나면, 반복 양식으로 제2 라이브러리를 제조할 수 있다. 예를 들어, 본원에 기술된 바와 같이, 1 또는 2개의 추가의 다양성 노도를 첨가할 수 있고, 제2 라이브러리를 생성하고, 샘플링한다. 상기 과정은 원하는 분자적 및 제약상 특성을 갖는 분자를 생성하는 데 필요한 횟수만큼 반복 수행할 수 있다.
다양한 라이게이션 기법을 사용하여 스캐폴드, 빌딩 블록, 링커, 및 빌딩 블록 태그를 부가할 수 있다. 따라서, 본원에 기술된 결합 단계 중 임의의 단계는 임의의 유용한 라이게이션 기법 또는 기법들을 포함할 수 있다. 예시적인 라이게이션 기법은 본원에 기술된 바와 같이, 효소적 라이게이션, 예컨대 하나 이상의 RNA 리가제 및/또는 DNA 리가제의 사용; 및 본원에 기술된 바와 같이, 화학적 라이게이션, 예컨대 화학적 공-반응성 쌍의 사용을 포함한다.
스캐폴드 및 빌딩 블록
스캐폴드 S는 단일 원자 또는 분자 스캐폴드일 수 있다. 예시적인 단일 원자스캐폴드는 탄소 원자, 붕소 원자, 질소 원자, 또는 인 원자 등을 포함한다. 예시적인 다원자 스캐폴드는 시클로알킬기, 시클로알케닐기, 헤테로시클로알기, 헤테로시클로알케닐기, 아릴기, 또는 헤테로아릴기를 포함한다. 헤테로아릴 스캐폴드의 구체적인 실시양태는 트리아진, 예컨대 1,3,5-트리아진, 1,2,3-트리아진, 또는 1,2,4-트리아진; 피리미딘; 피라진; 피리다진; 푸란; 피롤; 피롤린; 피롤리딘; 옥사졸; 피라졸; 이속사졸; 피란; 피리딘; 인돌; 인다졸; 또는 퓨린을 포함한다.
스캐폴드 S는 임의의 유용한 방법에 의해 태그에 작동적으로 연결될 수 있다. 일례에서, S는 헤드피스에 직접적으로 연결되는 트리아진이다. 이러한 예시적인 스캐폴드를 수득하기 위해, 트리클로로트리아진 (즉, 염소 3개를 갖는, 트리아진의 염소화된 전구체)을 헤드피스의 친핵성 기와 반응시킨다. 상기 방법을 사용함으로써 S는 3개의 위치에서 치환에 이용될 수 있는 염소를 가지게 되는데, 여기서 2개의 위치는 이용가능한 다양성 노드이고, 한 위치는 헤드피스에 부착된다. 이어서, 빌딩 블록 An을 스캐폴드의 다양성 노드에 부가하고, 빌딩 블록 An을 코딩하는 태그 An ("태그 An")을 헤드피스에 라이게이션시키는데, 여기서 상기 두 단계는 임의의 순서로 수행될 수 있다. 이어서, 빌딩 블록 Bn을 남은 다양성 노드에 부가하고, 빌딩 블록 Bn을 코딩하는 태그 Bn을 태그 An의 단부에 라이게이션시킨다. 또 다른 일례에서, S는 태그의 링크에 작동적으로 연결되는 트리아진이며, 여기서 트리클로로트리아진은 PEG, 태그의 지방족, 또는 방향족 링커의 친핵성 기 (예컨대, 아미노기)와 반응한다. 빌딩 블록 및 회합된 태그는 본원에 기술된 바와 같이 부가될 수 있다.
추가의 또 다른 일례에서, S는 빌딩 블록 An에 작동적으로 연결되는 트리아진이다. 이러한 스캐폴드를 수득하기 위해, 2개의 다양성 노드 (예컨대, 친전자성 기 및 친핵성 기, 예컨대 Fmoc-아미노산)를 갖는 빌딩 블록 An을 링커의 친핵성 기 (예컨대, 헤드피스에 부착되는, PEG, 지방족, 또는 방향족 링커의 말단 기)와 반응시킨다. 이어서, 트리클로로트리아진을 빌딩 블록 An의 친핵성 기와 반응시킨다. 상기 방법을 사용함으로써, S의 3개의 염소 위치는 모두 빌딩 블록에 대한 다양성 노드로서 사용된다. 본원에 기술된 바와 같이, 추가의 빌딩 블록 및 태그를 부가할 수 있고, 추가의 스캐폴드 Sn을 부가할 수 있다.
예시적인 빌딩 블록 An'은 예컨대, 아미노산 (예컨대, 알파-, 베타-, 감마-, 델타-, 및 엡실론-아미노산 뿐만 아니라, 천연 및 비천연 아미노산의 유도체), 아민과 화학적으로 공반응성인 반응 물질 (예컨대, 아지드 또는 알킨 쇄), 또는 티올 반응 물질, 또는 그의 조합을 포함한다. 빌딩 블록 An을 선택하는 것은 예를 들어, 링커에 사용되는 반응성 기의 성질, 스캐폴드 모이어티의 성질, 및 화학적 합성에 사용되는 용매에 따라 달라진다.
예시적인 빌딩 블록 Bn' 및 Cn'은 화학적 엔티티의 임의의 유용한 구조적 단위, 예컨대 임의로 치환된 방향족 기 (예컨대, 임의로 치환된 페닐 또는 벤질), 임의로 치환된 헤테로시클릴기 (예컨대, 임의로 치환된 퀴놀리닐, 이소퀴놀리닐, 인돌릴, 이소인돌릴, 아자인돌릴, 벤즈이미다졸릴, 아자벤즈이미다졸릴, 벤즈이속사졸릴, 피리디닐, 피페리딜, 또는 피롤리디닐), 임의로 치환된 알킬기 (예컨대, 임의로 치환된 선형 또는 분지형 C1 -6 알킬기 또는 임의로 치환된 C1 -6 아미노알킬기), 또는 임의로 치환된 카르보시클릴기 (예컨대, 임의로 치환된 시클로프로필, 시클로헥실, 또는 시클로헥세닐)를 포함한다. 특히 유용한 빌딩 블록 Bn' 및 Cn'은 예컨대, 반응성 기이거나, 또는 반응성 기를 형성하도록 화학적으로 변형될 수 있는 하나 또는 임의적 치환기를 갖는 임의로 치환된 기 (예컨대, 본원에 기술된 임의의 것)와 같이, 하나 이상의 반응성 기를 갖는 것을 포함한다. 예시적인 반응성 기는 아민 (-NR2, 여기서 각 R은 독립적으로 H 또는 임의로 치환된 C1 -6 알킬이다), 히드록시, 알콕시 (-OR, 여기서 R은 임의로 치환된 C1 -6 알킬, 예컨대 메톡시이다), 카르복시 (-COOH), 아미드, 또는 화학적으로 공반응성인 치환기 중 하나 이상의 것을 포함한다. 예를 들어, Bn 또는 Cn에 제한 부위가 도입될 수 있으며, 여기서 복합체는 PCR 및 상응하는 제한 효소 중 하나를 이용하는 제한 분해를 수행함으로써 확인될 수 있다.
링커
적절한 스페이서를 제공하고/거나, 유기 용매 중의 헤드피스의 용해도를 증가시키기 위해 헤드피스와 화학적 엔티티 사이의 이관능성 링커를 달리할 수 있다. 헤드피스를 소형 분자 라이브러리와 커플링시킬 수 있는 매우 다양한 링커가 상업적으로 이용가능하다. 링커는 전형적으로 선형 또는 분지형 쇄로 구성되고, 이는 C1 -10 알킬, 1 내지 10개의 원자로 이루어진 헤테로알킬, C2 -10 알케닐, C2 -10 알키닐, C5 -10 아릴, 3 내지 20개의 원자로 이루어진 시클릭 또는 폴리시클릭 시스템, 포스포디에스테르, 펩티드, 올리고당, 올리고뉴클레오티드, 올리고머, 중합체, 또는 폴리 알킬 글리콜 (예컨대, 폴리에틸렌 글리콜, 예컨대 -(CH2CH2O)nCH2CH2- (여기서, n은 정수 1 내지 50이다), 또는 그의 조합을 포함할 수 있다.
이관능성 링커는 라이브러리의 화학적 엔티티와 헤드피스 사이의 적절한 스페이서를 제공할 수 있다. 특정 실시양태에서, 이관능성 링커는 3 파트를 포함한다. 파트 1은 DNA와 공유 결합을 형성하는 반응성 기, 예컨대 바람직하게, DNA (예컨대, 아미노-변형된 dT) 상의 아미노기와 반응하도록 N-히드록시 숙신이미드 (NHS) 에스테르에 의해 활성화된 카르복실산, (표준 올리고뉴클레오티드 화학에 의해 달성되는) 단일 가닥 헤드피스의 5' 또는 3'-말단을 변형시키는 아미다이트, 화학적 공-반응성 쌍 (예컨대, Cu(I) 촉매 존재하의 아지도-알킨 고리화첨가, 또는 본원에 기술된 임의의 것), 또는 티올 반응성 기일 수 있다. 파트 2는 또한 화학적 엔티티, 빌딩 블록 An 또는 스캐폴드 중 하나와 공유 결합을 형성하는 반응성 기일 수 있다. 상기 반응성 기는 예컨대, 아민, 티올, 아지드, 또는 알킨일 수 있다. 파트 3은 파트 1과 2 사이에 도입된, 가변 길이의 화학적으로 불활성 스페이서일 수 있다. 상기 스페이서는 에틸렌 글리콜 단위의 쇄 (예컨대, 상이한 길이의 PEG), 알칸, 알켄, 폴리엔 쇄, 또는 펩디드 쇄일 수 있다. 링커는 유기 용매 중 헤드피스의 용해도를 개선시키기 위한 소수성 모이어티 (예컨대, 벤젠 고리) 뿐만 아니라, 라이브러리 검출 목적에 사용되는 형광성 모이어티 (예컨대, 예컨대 플루오레세인 또는 Cy-3)도 포함하는 분지체 또는 삽입체를 포함할 수 있다. 헤드피스 디자인 중 소수성 잔기는 유기 용매 중에서의 라이브러리 합성을 촉진시키기 위하여 링커 디자인에 따라 달라질 수 있다. 예를 들어, 헤드피스 및 링커 조합은 옥탄올:물 계수 (Poct)가 예컨대, 1.0 내지 2.5인, 적절한 잔기를 가지도록 디자인된다.
링커는 주어진 소형 분자 라이브러리 디자인에 대하여 실험적으로 선택될 수 있고, 이로써, 라이브러리는 유기 용매, 예를 들어, 15%, 25%, 30%, 50%, 75%, 90%, 95%, 98%, 99%, 또는 100% 유기 용매 중에서 합성될 수 있다. 링커는 유기 용매 중에 헤드피스를 가용화시키는 적절한 쇄 길이를 선별하기 위하여 라이브러리 합성 이전에 모델 반응을 이용하여 변화시킬 수 있다. 예시적인 링커로는 알킬 쇄 길이가 증가된 것, 폴리에틸렌 글리콜 단위가 증가된 것, (헤드피스 상의 포스페이트 음전하를 중화시키는) 양전하를 포함하는 분지형 종을 갖는 것, 또는 소수성 양이 증가된 것 (예를 들어, 벤젠 고리 구조의 부가)을 포함한다.
상업적으로 이용가능한 링커의 예로는 아미노-카르복실산 링커, 예컨대 펩티드인 것 (예컨대, Z-Gly-Gly-Gly-Osu (N-알파-벤질옥시카르보닐-(글리신)3-N-숙신이미딜 에스테르) 또는 Z-Gly-Gly-Gly-Gly-Gly-Gly-Osu (N-알파-벤질옥시카르보닐-(글리신)6-N-숙신이미딜 에스테르, 서열 3)), PEG (예컨대, Fmoc-아미노PEG2000-NHS 또는 아미노-PEG (12-24)-NHS), 또는 알칸 산 쇄 (예컨대, Boc-ε-아미노카프로산-Osu); 화학적 공-반응성 쌍 링커, 예컨대 펩티드 모이어티 (예컨대, 아지도호모알라닌-Gly-Gly-Gly-OSu (서열 4) 또는 프로파르길글리신-Gly-Gly-Gly-OSu (서열 5)), PEG (예컨대, 아지도-PEG-NHS), 또는 알칸 산 쇄 모이어티 (예컨대, 5-아지도펜탄산, (S)-2-(아지도메틸)-1-Boc-피롤리딘, 4-아지도아닐린, 또는 4-아지도-부탄-1-산 N-히드록시숙신이미드 에스테르)와 함께 조합된, 본원에 기술된 화학적 공-반응성 쌍인 것; 티올-반응성 링커, 예컨대 PEG인 것 (예컨대, SM(PEG)n NHS-PEG-말레이미드), 알칸 쇄 (예컨대, 3-(피리딘-2-일디술파닐)-프로피온산-Osu 또는 술포숙신이미딜 6-(3'-[2-피리딜디티오]-프로피온아미도)헥사노에이트)); 및 올리고뉴클레오티드 합성을 위한 아미다이트, 예컨대 아미노 개질제 (예컨대, 6-(트리플루오로아세틸아미노)-헥실-(2-시아노에틸)-(N,N-디이소프로필)-포스포르아미다이트), 티올 개질제 (예컨대, S-트리틸-6-메르캅토헥실-1-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트, 또는 화학적 공-반응성 쌍 개질제 (예컨대, 6-헥신-1-일-(2-시아노에틸)-(N,N-디이소프로필)-포스포르아미다이트, 3-디메톡시트리틸옥시-2-(3-(3-프로파르길옥시프로판아미도)프로판아미도)프로필-1-O-숙시노일, 장쇄 알킬아미노 CPG, 또는 4-아지도-부탄-1-산 N-히드록시숙신이미드 에스테르))를 포함한다. 추가의 링커가 당업계에 공지되어 있으며, 라이브러리 합성 동안 사용될 수 있는 것으로는 5'-O-디메톡시트리틸-1',2'-디데옥시리보스-3'-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 9-O-디메톡시트리틸-트리에틸렌 글리콜, 1-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 3-(4,4'-디메톡시트리틸옥시)프로필-1-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트; 및 18-O-디메톡시트리틸 헥사에틸렌글리콜, 1-[(2-시아노에틸)-(N,N-디이소프로필)]-포스포르아미다이트를 포함하나, 이에 한정되지 않는다. 본원의 링커 중 임의의 것은 상이한 조합으로 서로에 대하여 직렬식으로 부가되어 원하는 상이한 길이의 링커를 생성할 수 있다.
링커는 또한 분지형일 수 있으며, 여기서 분지형 링커는 당업계에 주지되어 있고, 대칭 또는 비대칭 더블러(doubler) 또는 대칭 트레블러(trebler)로 이루어질 수 있다. 예를 들어, 문헌 [Newcome et al., Dendritic Molecules: Concepts, Synthesis, Perspectives, VCH Publishers (1996)]; [Boussif et al., Proc . Natl . Acad. Sci . USA 92:7297-7301 (1995)]; 및 [Jansen et al., Science 266: 1226 (1994)]를 참조할 수 있다.
실시예 1
DNA 태그의 단일 가닥 라이게이션을 개선시키기 위한 일반 전략법
다양한 반응 조건을 사용하여 태그의 단일 가닥 라이게이션을 개선시킴으로써 코딩된 라이브러리를 형성하였다. 상기 반응 조건으로는 태그내 변형된 뉴클레오티드를 사용하는 것 (예컨대, 2'-OMe 기를 갖는 하나 이상의 뉴클레오티드를 사용하여 MNA/DNA 태그 (여기서, "MNA"는 하나 이상의 2'-O-메틸 뉴클레오티드를 갖는 올리고뉴클레오티드를 나타낸다)를 형성하는 것); 길이가 상이한 공여자 태그 및 수용자 태그를 사용하고, 태그의 농도를 달리하는 것; 상이한 유형의 리가제 뿐만 아니라, 그의 조합 (예컨대, 써클리가제™ ssDNA 리가제 및/또는 T4 RNA 리가제)을 사용하고, 그의 농도를 달리하는 것; 비반응 출발 물질을 제거함으로써 복합체를 정제하는 것; 분자량이 상이한 폴리에틸렌 글리콜 (PEG)을 사용하고, 그의 농도를 달리하는 것; 반응, 예컨대 라이게이션 온도 및 지속 시간을 달리하는 것; ATP, Co(NH3)6Cl3, 및 효모 무기 피로포스페이트를 비롯한, 다양한 작용제의 농도를 달리하는 것; 효소적으로 또는 화학적으로 인산화된 올리고뉴클레오티드 태그를 사용하는 것; 3'-보호된 태그를 사용하는 것; 및 5'-화학적으로 아데닐화된 태그를 사용하는 것을 포함하였다.
상이한 조건하에서의 완전한 분석 후, 비-라이게이션된 출발 반응 물질에 대한 라이게이션된 최종 생성물의 분율 ("라이게이션 분율")에 의해 측정된 바, 최대 90%까지의 라이게이션 효율을 제공하는 파라미터의 최적의 조합 (예컨대, 도 5c)을 찾아내었다. 리가제를 사용한 라이게이션 반응의 개략도는 도 5a에 제시되어 있고, 전형적인 변성 폴리아크릴아미드 겔 전기영동은 도 5b에 제시되어 있다. 공여자 올리고뉴클레오티드를 3'-말단에서 표지화시키고, 스톰(Storm)™ 800 포스포르이미저(PhosphorImager) 상에서 450 nm 여기에서 스캐닝하여 겔 상에서 검출할 수 있었다. 겔은 비-라이게이션된 공여자 (또는 출발 물질) 및 라이게이션된 생성물을 나타낸다. 특히, 아데닐화된 공여자는 상기 겔 상에서 출발 물질로부터 분할 및 구별될 수 있다.
하기 표 2는 올리고뉴클레오티드의 조성 (즉, DNA 뉴클레오티드 모두를 포함하는 올리고뉴클레오티드 대 표지화된 "MNA"인, 하나 이상의 2'-O-메틸 뉴클레오티드를 포함하는 올리고뉴클레오티드), 및 리가제 유형 (즉, RNA 리가제 대 ssDNA 리가제)의 함수로서 측정된 라이게이션 효율을 제공한다. 상기 라이게이션 실험은 하기 태그: 5'-P-GCT GTG CAG GTA GAG TGC-6-FAM-3'의 서열 (서열 6)을 갖는 모든-DNA 공여자; 5'-P-mGCT GTG CAG GTA GAG TGC-6-FAM-3'의 서열 (서열 7)을 갖는 5'-MNA-DNA 공여자; 5'-P-mGmUmG mCmAmG mGmUmA mGmAmG mUmGmC-6-FAM-3'의 서열 (서열 8)을 갖는 모든-MNA 공여자; 5'-HO-TAC GTA TAC GAC TGmG-OH-3'의 서열 (서열 9)을 갖는 DNA-3'MNA 수용자; 5'-HO-GCA GAC TAC GTA TAC GAC TGG-OH-3'의 서열 (서열 10)을 갖는 모든-DNA 수용자; 및 5'-HO-mUmAmC mGmUmA mUmAmC mGmAmC mUmGmG-OH-3'의 서열 (서열 11)을 갖는 모든-MNA 수용자 (여기서, "m"은 2'-OMe 염기를 나타내고, "P"는 인산화된 뉴클레오티드를 나타내고, "FAM"은 플루오레세인을 나타낸다)를 포함하였다.
라이게이션 생성물로부터의 강도 대 라이게이션 생성물 및 비-라이게이션된 출발 물질로부터의 강도의 총합의 비로서 겔 밀도측정법 데이터로부터 라이게이션 효율을 계산하였다. T4 RNA 리가제에 대한 반응 조건으로는 하기를 포함하였다: 50 mM 트리스 HCl, 10 mM MgCl2, 1 mM 염화헥사민코발트, 1 mM ATP, 25% PEG4600, 및 5 유닛의 T4 RNA 리가제 (NEB-새 유닛)를 함유하는 완충제 용액 (pH 7.5) 중 5 μM의 각 공여자 및 수용자 올리고뉴클레오티드 (15-18개의 뉴클레오티드 (nt) 길이). 반응을 37℃에서 16시간 동안 인큐베이션시켰다. 써클리가제™에 대한 반응 조건으로는 하기를 포함하였다: 20 유닛의 써클리가제™ (에피센터(Epicentre))와 함께, 50 mM MOPS (pH 7.5), 10 mM KCl, 5 mM MgCl2, 1 mM DTT, 0.05 mM ATP, 2.5 mM MnCl2, 및 25% (w/v) PEG 8000을 함유하는 완충제 중 5 μM의 각 공여자 및 수용자 올리고뉴클레오티드 (길이 15 또는 18 nt)를 50℃에서 16시간 동안 인큐베이션. 반응을 8 M 우레아/15% PAAG 상에서 분할한 후, 450 nm에서의 여기를 사용하여 밀도측정법을 수행하였다.
Figure pct00002
일반적으로, 써클리가제™를 통해서 T4 RNA 리가제보다 더 높은 라이게이션 수율을 얻었다 (표 2). 공여자 및 수용자 둘 모두가 DNA MNA 하이브리드 올리고뉴클레오티드였을 때, T4 RNA 리가제를 통해 효율적인 라이게이션이 이루어졌다.
도 5c는 고농도의 효소 및 올리고뉴클레오티드하에서 T4 RNA 리가제에 대해 달성된 고수율의 라이게이션을 보여주는 것이다. 반응 조건으로는 하기를 포함하였다: 50 mM 트리스 HCl, 10 mM MgCl2, 1 mM 염화헥사민코발트, 2.5 mM ATP, 30% (w/v) PEG4600 (pH 7.5), 상이한 양의 T4 RNA 리가제 40 유닛/㎕ (NEB-새 유닛), 및 0.1 유닛의 효모 무기 피로포스파타제를 함유하는 완충제 중 250 μM의 각 공여자 및 수용자 올리고뉴클레오티드. 반응을 37℃에서 5 및 20시간 동안 인큐베이션시키고, 반응을 8 M 우레아/15% PAAG 상에서 분할한 후, 450 nm에서의 여기를 사용하여 밀도측정법을 수행하였다.
전반적으로 상기 데이터는 효소적 라이게이션이 하나 이상의 변형된 2'-뉴클레오티드를 포함함으로써 및/또는 RNA 또는 DNA 리가제를 사용함으로써 최적화될 수 있다는 것을 제안한다. 라이게이션 효율에 기여할 수 있는 시험된 수개의 다른 조건, 예컨대 PEG 또는 태그 길이에 대한 상세한 설명은 하기에서 논의한다.
실시예 2
PEG 가 단일 가닥 라이게이션에 미치는 효과
PEG 분자량 (MW)이 라이게이션에 미치는 효과를 측정하기 위하여, 단일 가닥 태그를 MW가 300 내지 20,000 달톤인 25% (w/v)의 PEG와 라이게이션시켰다. 도 6a에 제시되어 있는 바와 같이, MW가 3,350, 4,000, 6,000, 8,000, 및 20,000인 PEG에 대해 80% 이상의 라이게이션이 관찰되었다. 본 라이게이션 실험은 하기 태그를 포함하였다: 5'-P-mGTG CAG GTA GAG TGC-6-FAM-3'의 서열 (서열 12)을 갖는 15 mer 공여자 및 5'-HO-mUAC GTA TAC GAC TGmG-OH-3'의 서열 (서열 13)을 갖는 15 mer 수용자. 상기 올리고뉴클레오티드 태그는 1개 또는 2개의 말단 2' O-메틸 (2'-OMe) RNA 염기 (예컨대, 2'-OMe-U (mU) 또는 2'-OMe-G (mG))를 갖는 DNA 서열이었다.
PEG 농도가 미치는 효과를 측정하는 실험 또한 수행하였다. 단일-가닥 태그를 다양한 농도의, MW가 4,600 달톤인 PEG (PEG4600)와 라이게이션시켰다. 도 6b에 제시되어 있는 바와 같이, 25% (w/v) 내지 35% (w/v) PEG4600에 대하여 평균적으로 70% 이상의 라이게이션이 관찰되었다.
실시예 3
태그 길이가 단일 가닥 라이게이션에 미치는 효과
태그 길이가 라이게이션에 미치는 효과를 측정하기 위해, 다양한 길이의 수용자 및 공여자 태그를 구축하였다. 써클리가제™ 실험을 위해, 서열 5'-P-mGTG CAG GTA GAG TGC-6-FAM-3' (서열 12)을 갖는 15 mer 공여자를 사용하고, 10, 12, 14, 16, 및 18 mer DNA 수용자 올리고뉴클레오티드와 쌍을 형성하도록 하였다. T4 RNA 리가제 실험을 위해, 태그는 하나 이상의 2'-OMe-염기를 포함하였다 (MNA/DNA 태그로 지정). 하기 표 3은 3개의 공여자 태그 (15 mer, 8 mer, 및 5 mer) 및 3개의 수용자 태그 (15 mer, 8 mer, 및 5 mer)에 대한 서열을 제공한다.
Figure pct00003
전기영동 겔의 밀도측정법에 의해 라이게이션 정도를 분석하였다 (도 7a-7b). 써클리가제™ 반응의 결과는 라이게이션 수율이 수용자 올리고뉴클레오티드의 길이에 강하게 의존한다는 것을 시사한다 (도 7a). 18 mer 수용자일 때, 최고 라이게이션 수율이 관찰된 반면 (62%), 10 mer 수용자일 때에는 라이게이션 수율이 10% 미만이었다. T4 RNA 리가제 반응의 결과는 8 mer 수용자와 8 mer 공여자의 조합이 최고 수율을 제공하였으며, 시험된 수용자 중 임의의 것과 15 mer 공여자를 갖는 조합이 75% 초과의 수율을 제공하였다는 것을 시사한다 (도 7b). 라이브러리가 보다 짧은 단쇄의 태그 (즉, 약 10 mer 이하)를 포함할 경우, 이때 T4 RNA 리가제는 태그 라이게이션에 바람직할 수 있다. 다른 경우에서, 써클리가제™ 또는 T4 RNA 리가제 및 써클리가제™의 조합을 사용함으로써 라이게이션은 추가로 최적화될 수 있다.
실시예 4
정제가 단일 가닥 라이게이션에 미치는 효과
정제가 라이게이션에 미치는 효과를 측정하기 위해, 라이브러리 합성 과정을 모방하도록 단일 가닥 태그를 라이게이션시켰다. 상기 실험을 위해, 태그는 상기 표 3에 제공된 바와 같이, 15 mer 공여자 및 15 mer 수용자 태그를 포함하였다. 화학적 엔티티를 라이브러리의 3'-말단에 결합시켰으며, 여기서 화학적 엔티티는 본 실시예에서 시각화를 지원하기 위해 플루오레세인이었다. 도 9 (우측)에 제시되어 있는 바와 같이, T4 PNK에 의한 인산화 후, 연속 태그를 복합체의 5'-OH 기에 라이게이션시켰다.
또한, 라이게이션 반응에 유용한 특정의 작용제 (예컨대, 포스페이트, 코발트, 및/또는 비반응 태그)가 PNK를 이용하는 인산화 반응을 억제시킬 수 있거나, 라이게이션 수율을 감소시킬 수 있는 바, PNK 반응 이전에 라이게이션된 생성물 (즉, 복합체)을 정제시킴으로써 실험을 수행하였다. 도 9 (좌측)에 제시되어 있는 바와 같이, PNK 반응 이전에 복합체를 정제시킨 결과 (즉, 최소 침전), 라이게이션은 증가하였다 (정제를 나타내는 *로 마킹된 데이터 참조). 도 8a-8b는 인산화 이전 및 이후의 15 mer MNA/DNA 태그에 대한 LC-MS 스펙트럼을 보여주는 것이다. DTT의 존재 또는 부재가 인산화에는 어떤 영향도 미치지 않았다.
실시예 5
접합부의 화학적 공-반응성 쌍 라이게이션 역전사
본원에 기술된 방법은 효소적 라이게이션 기법 뿐만 아니라, 화학적 공-반응성 쌍 라이게이션 기법도 추가로 포함할 수 있다. 따라서, 화학적 라이게이션의 일례로서, 다양한 변이체에서 예시적인 화학적 공-반응성 쌍 (즉, 고리화첨가 반응에서 알킨 및 아지도 쌍): 단쇄의 화학적 공-반응성 쌍 및 장쇄의 화학적 공-반응성 쌍을 사용하였다.
물질
제1 변이체에서, 단쇄의 화학적 공-반응성 쌍 (도 10a)을 사용하였다. 쌍은 (i) 서열 5'-GCG TGA ACA TGC ATC TCC CGT ATG CGT ACA GTC CAT T/프로파르길G/-3' ("5단부3프로파르길," 서열 18)을 갖는 올리고뉴클레오티드 및 (ii) 서열 5'-/아지도T/ATA GCG CGA TAT ACA CAC TGG CGA GCT TGC GTA CTG-3' ("3단부5아지도," 서열 19)을 갖는 올리고뉴클레오티드를 포함하였다. 상기 올리고뉴클레오티드 쌍은 트리링크 바이오테크놀로지스 인코퍼레이티드(TriLink BioTechnologies, Inc.: 미국 캘리포니아주 샌디에고)에 의해 제조되었다. 라이게이션시 두 올리고뉴클레오티드 사이에 짧은 단쇄의 스페이서를 형성하도록 상기 올리고뉴클레오티드를 디자인하였는데, 여기서 링커 길이는 (5단부3프로파르길 올리고뉴클레오티드의 C3'-위치에서부터 3단부5아지도 올리고뉴클레오티드의 C5'-위치까지 계수하였을 때) 5개 원자의 길이가 될 것이다. 추가로, 5'-아지도 올리고뉴클레오티드 (3단부5아지도)는 상응하는 5'-아이오도 올리고뉴클레오티드 중의 아이오도기를 아지도기로 전환시킴으로써 제조하였다.
제2 변이체에서, 장쇄의 화학적 공-반응성 쌍 (도 10b)을 사용하였다. 쌍은 (i) 서열 5'-GCG TGA ACA TGC ATC TCC CGT ATG CGT ACA GTC CAT TG/스페이서7-아지드/-3' ("5단부3아지드," 서열 20)을 갖는 올리고뉴클레오티드 및 (ii) 서열 5'-/헥시닐/TA GCG CGA TAT ACA CAC TGG CGA GCT TGC GTA CTG-3' ("3단부5헥시닐," 서열 21)을 갖는 올리고뉴클레오티드를 포함하였다. 상기 올리고뉴클레오티드 쌍은 인터그레이티드 DN테크놀로지스 인코퍼레이티드(IDT DNA: Integrated DNA Technologies, Inc.: 미국 캘리포니아주 샌디에고, 및 아이오와주 코럴빌)에 의해 제조되었다. 아지도부티레이트 N-히드록시숙신이미드 에스테르를, 올리고뉴클레오티드 칼럼 합성 동안에 도입시킨 3'-아미노-개질제 C7 (2-디메톡시트리틸 옥시메틸-6-플루오레닐메톡시카르보닐아미노-헥산-1-숙시노일-장쇄 알킬아미노)과 반응시킴으로써 5단부3아지드 올리고뉴클레오티드를 제조하였다. (5단부3아지드 올리고뉴클레오티드의 C3'-위치에서부터 3단부5헥시닐 올리고뉴클레오티드의 C5'-위치까지 계수하였을 때) 올리고뉴클레오티드 사이의 24개 원자의 긴 스페이서를 형성하도록 상기 쌍을 디자인하였다.
(도 11a의 개략도에 의해 제시된 바와 같이) 역전사를 위해, 프라이머 및 주형은 하기를 포함하였다: 5'-/Cy5/ CAG TAC GCA AGC TCG-3'의 서열 ("Cy5s_프라이머15," 서열 22)을 갖는 역전사 프라이머; 5'-GCG TGA ACA TGC ATC TCC CGT ATG CGT ACA GTC CAT TGT ATA GCG CGA TAT ACA CAC TGG CGA GCT TGC GTA CTG-3'의 서열 ("templ75," 서열 23)을 갖는 대조군 주형; 5'-GCG TGA ACA TGC ATC TCC-3'의 서열 (서열 24)을 갖는 5'-PCR 프라이머; 및 5'-CAG TAC GCA AGC TCG CC-3'의 서열 (서열 25)을 갖는 3'-PCR 프라이머 (이들 서열은 IDT DNA로부터 입수하였다). LC에 의해 역전사 생성물이 별개로 검출될 수 있도록 하기 위해 본 실험에서는 Cy5-표지화된 DNA 프라이머를 사용하였다.
실험 조건
화학적 공-반응성 쌍 라이게이션을 위해, 1 mM의 화학적 공-반응성 쌍, 예컨대 5단부3프로파르길+3단부5아지도 (단쇄) 또는 5단부3아지드+3단부5헥시닐 (장쇄) 용액을 물/디메틸 아세테이트 혼합물 중 100 당량의 TBTA 리간드 (트리스-[(1-벤질-1H-1,2,3-트리아졸-4-일)메틸]아민) 및 50 당량의 CuBr의 존재하에서 12시간 동안 인큐베이션시켰다. 반응 후, 과량의 EDTA를 첨가하고, 제바 스핀 탈염 칼럼(Zeba Spin Desalting Columns) (인비트로겐 코포레이션(Invitrogen Corp.: 미국 캘리포니아주 칼즈배드))을 사용하여 반응 혼합물을 탈염시킨 후, 에탄올 침전을 수행하였다. 역전사 반응을 위해, 8 M 우레아를 함유하는 15% 폴리아크릴아미드 겔 상에서 주형을 정제하였다.
ACE 3 C18-300 (50 x 2.1 mm) 칼럼, 및 완충제 A (1% 헥사플루오로이소프로판올 (HFIP), 0.1% 디이소프로필에틸 아민 (DIEA), 물 중 10 μM EDTA) 및 완충제 B (0.075% HFIP, 0.0375% DIEA, 10 μM EDTA, 65% 아세토니트릴/35% 물)를 사용하는 5-35%의 완충제 B의 5분 구배를 이용하여 써모 사이언티픽 LCQ 플리트(Thermo Scientific LCQ Fleet) 상에서 액체 크로마토그래피-질량 분석법 (LC-MS)을 수행하였다. 260 nm 및 650 nm에서 LC를 모니터링하였다. 음성 모드로 MS를 검출하고, 프로매스(ProMass) 소프트웨어를 사용하여 질량 피크 디컨볼루션을 수행하였다.
50℃에서 1-2시간 동안 제조사의 프로토콜에 따라 써모스크립트(ThermoScript)™ RT (인비트로겐 코포레이션)을 사용하여 역전사 반응을 수행하였다. LC-MS 및 PCR에 의해 결과를 분석하였다. 플래티넘® 슈퍼믹스(Platinum® SuperMix)를 사용하여 PCR을 수행하고, 4% 아가로스 E-겔(E-Gels) (둘 모두 인비트로겐 코포레이션으로부터 입수) 상에서 분할하였다. 선행 RT 반응을 수행하거나, 수행하지 않고 11회 및 18회의 PCR 사이클을 수행하였다. 75 mer 주형은 역전사시키지 않고, PCR 정제에 직접 사용하였다.
결과 및 논의
단쇄 스페이서 및 장쇄 스페이서를 형성하는 두 라이게이션 모두에서, LC-MS에 의해 분석된 바, 반응 수율은 높았고, 정량적인 값에 근접하였다. 따라서, 화학적 라이게이션은 헤드피스를 하나 이상의 빌딩 블록 태그에 결합 또는 작동적으로 회합시키는 고수율의 기법을 제공한다.
DNA-코딩된 라이브러리를 제조하는 데 실현가능한 화학적 라이게이션 전략법을 위해, 생성된 복합체는 추가의 서열 분석 적용을 위해 PCR 또는 RT-PCR을 수행할 수 있어야 한다. 예컨대, 상기 기술된 바와 같이, 효소적으로 라이게이션된 태그에 있어서는 PCR 및 RT-PCR이 문제가 되지 않을 수도 있지만, 비천연 화학적 링커는 RNA 또는 DNA 폴리머라제에 의해 프로세싱하기 어려울 수 있다. 도 11b-11e에 제공된 데이터는 특정 길이의 스페이서를 갖는 올리고뉴클레오티드가 전사 및/또는 역전사될 수 있다는 것을 제안한다.
트리아졸-연결된 올리고뉴클레오티드를 생성하는 화학적 공-반응성 쌍 링커의 경우, 링커의 길이에 의존하는 것이 관찰되었다. 단쇄의 화학적 공-반응성 쌍의 경우, 생성된 주형을 역전사시키고, LC-MS에 의해 분석하였다. LC 분석을 통해 260 nm일 때에는 2.79분, 3.47분, 및 3.62분에서 3개의 주요 흡수 피크가 나타났고, 여기서 3.47분 및 3.62분에서의 피크는 650 nm일 때에도 또한 흡수 피크를 제공하였다. 3.47분에서의 피크의 MS 분석 결과, 오직 주형 23097.3 (계산치 23,098.8)만이 존재하는 것으로 나타났고, 3.62분에서의 피크는 주형 (23,098.0) 및 완전하게 연장된 프라이머 (23,670.8, 계산치: 23,671.6)를 대략 1.7:1의 비율로 함유하는 것으로 나타났으며, 이는 상기 RT 반응에 대한 수율이 50-60%임을 제안한다 (도 11c). 비교를 위해, 모든-DNA 주형을 갖는 대조군에 대한 역전사 (RT) 결과, 대략 주형 (23,078.7)과 등가인 양으로 연장된 프라이머 (피크 23,068.9)가 제조되었고, 이는 수율이 100%에 근접한다는 것을 제안한다 (도 11b).
장쇄의 화학적 공-반응성 쌍의 경우, RT 반응의 LC를 통해 260 nm일 때에는 2.77분 및 3.43분에서 2개의 흡수 피크가 나타났고, 여기서 3.43분에서의 피크는 650 nm일 때에도 또한 흡수 피크를 제공하였으며, 즉, 예상되는 RT 생성물인 Cy5 표지화된 물질을 함유하였다. 3.43분에서의 피크의 MS 분석 결과, 주형 (관측치: 23,526.6, 계산치: 23,534.1) 뿐만 아니라, 링커에 연장된 Cy5 프라이머 (11,569.1)도 나타났다. LC-MS에 의해서 전장의 생성물은 전혀 관찰되지 않았는데, 이는 RT 반응이 측정가능한 양으로 일어나지 않았다는 것을 시사하는 것이다 (도 11d).
상기 기술된 바와 같은 주형을 사용하여 RT-PCR을 수행하였고, 이를 통해 오직 단쇄 링커만이 비록 5-10 더 낮은 효율이기는 하지만, 역전사 생성물을 생성하는 것으로 나타났다 (도 11e). RT의 효율은 주형 (templ75)보다 약 2배 더 낮은 것으로 추정되었다. 예를 들어, 모든-DNA 주형 75 (templ75)의 PCR 생성물과 비교하였을 때, 단쇄 라이게이션된 주형의 PCR 생성물은 RT 수행 후에는 약 2배 더 낮았고, RT를 수행하지 않은 경우에는 약 5-10배 더 낮았다. 따라서, 상기 데이터는 역전사 및/또는 전사될 수 있는 복합체를 형성하기 위해 화학적 라이게이션을 사용할 수 있고, 화학적으로 라이게이션된 헤드피스 및/또는 태그는 코딩된 라이브러리를 형성하는 데 본원에 기술된 결합 단계 중 임의의 단계에서 사용될 수 있다는 것을 지지한다.
실시예 6
3'- 포스포로티오에이트 올리고뉴클레오티드와 5'- 아이오도 올리고뉴클레오티드의 라이게이션
본원에 기술된 본 방법의 유연성을 측정하기 위해, 다른 변형을 갖는 올리고뉴클레오티드의 라이게이션 효율을 측정하였다. 특히, 천연 포스포디에스테르 연결부의 유사체 (예컨대, 포스포로티오에이트 유사체)는 선별 후 PCR 분석 및 서열 분석을 위한 대체 모이어티를 제공할 수 있다.
트리링크 바이오테크놀로지스 인코퍼레이티드 (미국 캘리포니아주 샌디에고)에 의해 하기 올리고뉴클레오티드를 합성하였다: (i) 5'-/Cy5/CGA TAT ACA CAC TGG CGA GCT/티오포스페이트/-3' ("CCy5," 서열 26), (ii) 도 12a에 제시된 바와 같은, 5'-/아이오도dT/ GC GTA CTG AGC/6-FAM/-3' ("CFL," 서열 27), 및 (iii) CAG TAC GCA AGC TCG CC의 서열 ("spl," 서열 28)을 갖는 스플린트 올리고뉴클레오티드. 실온에서 50 mM 트리스 HCl (pH 7.0), 100 mM NaCl, 및 10 mM MgCl2 ("라이게이션 완충제")를 함유하는 완충제 중에서 100 μM의 각 반응 물질 올리고뉴클레오티드를 이용하여 라이게이션 반응을 수행하였다. 하기 중 하나로 라이게이션 반응을 보충하였다: 100 μM의 스플린트 올리고뉴클레오티드, 10 mM Co(NH3)6Cl3, 40% (w/v)의 PEG4000, 또는 80% (w/v)의 PEG300. 최대 48시간까지 계속해서 반응을 진행시켰다. 260 nm, 495 nm, 및 650 nm에서의 검출을 사용하는 LC-MS에 의해서 뿐만 아니라, 스톰™ 800 포스포르이미저 상에서 450 및 635 nm 여기에서 추가로 스캐닝하는 8 M 우레아/15% 폴리아크릴아미드 겔 (PAAG)에 의해서 라이게이션 생성물을 분석하였다.
스플린트 올리고뉴클레오티드의 부재하에서는 어떤 라이게이션도 관찰되지 않았다 (도 12b, "-spl"로 표지화된 레인). 스플린트 올리고뉴클레오티드의 존재하에서, 라이게이션이 일어났고, 48시간 경과 후 약 60%의 라이게이션 분율에 도달하였다 (도 12b-12c). LC-MS를 통해 크로마토그램에서 수개의 피크가 나타났는데, 3.00분에서 260 nm, 495 nm, 및 650 nm에서의 흡수 피크를 나타내었다. 상기 피크의 MS를 통해 대개 11,539.6 Da (계산치 11,540)에서 라이게이션 생성물이 나타났고, 10% 미만의 CCy5 올리고뉴클레오티드는 7,329.8 Da (계산치 7,329.1)에서 나타났다. PEG 및 헥사민 코발트의 존재하에서는 저수준의 라이게이션이 검출되었는데, 여기서 헥사민 코발트는 Cy5-표지화된 올리고뉴클레오티드의 침전을 일으켰다. 상기 데이터는 변형된 포스페이트기 (예컨대, 변형된 포스포디에스테르 연결부, 예컨대 포스포로티오에이트 연결부)를 갖는 헤드피스 및/또는 태그는 코딩된 라이브러리를 형성하는 데 본원에 기술된 결합 단계 중 임의의 단계에서 사용될 수 있다는 것을 제안한다.
아이오도-포스포로티오에이트 라이게이션 반응을 추가로 연구하기 위해, 상이한 반응 조건하에 스플린트의 부재 및 존재하에서 5'-I dT-올리고-3'-FAM (CFL) 및 5'-Cy5-올리고-3'-PS (CCy5)의 라이게이션을 수행하였다.
제1 조건 세트에서, 7 내지 8일 동안 인큐베이션시키면서 라이게이션 실험을 수행하였다. 50 μM의 각 올리고뉴클레오티드를 이용하여 상기와 동일한 라이게이션 완충제 중에서 본 실험을 수행하였고, 실온에서 1주일 동안 인큐베이션시켰다. 도 12d는 스플린트 (양성 대조군)의 부재 (상단) 및 존재 (하단)하에서의 CFL 및 CCy5의 라이게이션의 LC-MS 분석을 보여주는 것으로서, 여기서 라이게이션 반응은 7일 동안 인큐베이션시킴으로써 이루어졌다. (모든 핵산을 검출하는) 260 nm, (CFL 올리고뉴클레오티드 및 라이게이션 생성물을 검출하는) 495 nm, 및 (CCy5 올리고뉴클레오티드 및 라이게이션 생성물을 검출하는) 650 nm에서의 각 반응에 대하여 3개의 LC 트레이스가 보고되었다.
스플린트 부재하에서는, 어떤 라이게이션도 이루어지지 않았고, 오직 출발 물질 CFL (4339 Da) 및 CCy5 (7329 Da)만이 검출되었다 (도 12d, 상단). 스플린트 올리고뉴클레오티드가 7일 동안 존재하였을 때, 체류 시간은 2.98분으로 495 nm 채널에서 특징적인 피크가 관찰되었으며, 이는 라이게이션된 생성물 (11,542 Da)에 상응하는 것이었다 (도 12d, 하단). 상기 피크는 650 nm 채널에서 관찰된 CCy5 올리고뉴클레오티드에 대한 것과 중복되었으며, 따라서, 650 nm에서는 CCy5와 구별되지 못했다.
도 12e는 스플린트의 부재하에서 CFL 및 CCy5의 LC-MS 분석을 보여주는 것으로서, 여기서 라이게이션 반응은 400 μM의 각 올리고뉴클레오티드를 이용하여 8일 동안 인큐베이션시킴으로써 이루어졌다. 어떤 라이게이션 생성물도 검출되어 않았다. 피크 1 (495 nm)은 CFL 출발 물질 (4,339 Da) 뿐만 아니라, 미량의 아이오딘 생성물 손실 (4,211 Da), 및 비공지된 분해 생성물 (4,271 Da, 가능하게는 에틸 메르캅탄 대체)을 함유하였다. 피크 2 (650 nm)는 CCy5 출발 물질 (7,329 Da) 및 산화된 CCy5 올리고뉴클레오티드 (7317 Da)를 함유하였다. 피크 3 (650 nm)은 이량체화된 CCy5 (14,663 Da)를 함유하였다.
제2 조건 세트에서, 피페리딘의 존재하에서 pH 7.0보다 높은 pH에서 아이오딘 대체 반응을 수행하였다. 도 12f는 CFL 올리고뉴클레오티드와 피페리딘의 반응에 관한 MS 분석을 보여주는 것으로서, 여기서 상기 반응은 CFL에 존재하는 말단 아이오딘을 대체시키고자 하는 것이었다. 한 반응 조건은 실온에서 20 hr 동안 100 mM 보레이트 완충제 (pH 9.5) 중 피페리딘 40 mM (400 당량), 올리고뉴클레오티드 100 μM을 포함하였고 (데이터는 도 12f의 좌측 패널에 제시되어 있다); 또 다른 반응 조건은 65℃에서 2 hr 동안 200 mM 보레이트 완충제 (pH 9.5) 중 피페리딘 2 M (4,000 당량), 올리고뉴클레오티드 400 μM을 포함하였다 (데이터는 도 12f의 우측 패널에 제시되어 있다).
40 mM의 피페리딘을 포함하는 반응 조건에서 (도 12f, 좌측), 어떤 피페리딘 대체도 관찰되지 않았고, 소량의 가수분해 생성물이 검출되었다 (4,229 Da). 추가로, 미량의 아이오딘 손실 (4,211 Da), 및 비공지된 분해 생성물 (4,271 Da)이 관찰되었다. 2 M의 피페리딘을 포함하는 반응 조건에서 (도 12f, 우측), 아이오딘의 피페리딘 대체가 관찰되었고 (4,296 Da), 출발 물질의 양은 상당 수준 감소되었다 (4,339 Da). 추가로, (OH의 대체에 의한) 아이오딘의 가수분해 또는 불순물 (4,229 Da) 및 아이오딘 손실 (4,214 Da)에 상응하는 피크 또한 관찰되었다. 상기 데이터는 아민 (예컨대, 화학적 라이브러리 합성의 일부로서의 것)의 존재가 라이브러리 구성원의 올리고뉴클레오티드 일부에 불리하게 영향을 미치고/거나, 상기 라이게이션 전략법을 방해하지 않을 것이라는 것을 나타낸다.
제3 조건 세트에서, 피페리딘의 존재하에서 pH 7.0보다 높은 pH에서 스플린트 라이게이션 반응을 수행하였다. 도 12g는 실온에서 20 hr 동안 100 mM 보레이트 완충제 (pH 9.5) 중 400 당량의 피페리딘의 존재하에서 수행된 50 μM의 CFL 및 CCy5 올리고뉴클레오티드의 스플린트 라이게이션 반응을 보여주는 것이다. LC 트레이스에서 검출된 특징적인 피크 (495 nm)는 주로 11,541.3 Da (계산치 11,540 Da)의 라이게이션 생성물을 함유하였다. 상기 결과에 기초하여, 피페리딘은 효소적 라이게이션을 손상시키지 않으며, 다른 아민 (예컨대, 화학적 라이브러리 합성의 일부로서의 것)의 존재가 상기 라이게이션 전략법을 방해할 가능성은 없다고 결론지을 수 있다.
종합하면, 상기 데이터는 상기 라이게이션 전략법이 연장된 인큐베이션 시간, 상승된 pH 조건, 및/또는 하나 이상의 아민의 존재를 비롯한, 광범위한 화학적 변환에 적합한 다양한 반응 조건하에서 수행될 수 있다는 것을 시사한다. 따라서, 본 방법은 다양한 반응 조건을 이용하여 라이브러리 구성원을 개발하고, 예컨대 침전 또는 다른 자원-집약 방법과 같이, 완충제를 교환할 필요가 없게 하는 데 유용할 수 있다.
실시예 7
변형된 뉴클레오티드를 이용한 셔플링 최소화
T4 RNA 리가제와의 단일 가닥 효소적 라이게이션 동안, 낮은 정도 내지 중간 정도의 말단 뉴클레오티드 셔플링이 일어날 수 있다. 셔플링으로 인해 뉴클레오티드가 포함되거나, 배제될 수 있으며, 여기서 최종 생성물 또는 복합체는 예상된 라이게이션된 서열 (즉, 수용자 및 공여자 올리고뉴클레오티드 둘 모두에 대한 완전한 서열을 갖는 서열)과 비교하여 뉴클레오티드를 포함하거나, 배제시킬 수 있다.
비록 낮은 수준의 셔플링은 허용될 수 있기는 하지만, 변형된 포스페이트기를 포함시킴으로써 셔플링을 최소화시킬 수 있다. 특히, 변형된 포스페이트기는 수용자 올리고뉴클레오티드의 3'-말단의 말단 뉴클레오티드와 말단 뉴클레오티드에 인접한 뉴클레오티드 사이의 포스포로티오에이트 연결부이다. 상기 포스포로티오에이트 연결부를 사용함으로써, 셔플링은 현저하게 감소되었다. 질량 분석법에 의해서 오직 잔류 셔플링만이 검출되었는데, 여기서 셔플링은 가능하게는 천연 포스포디에스테르 연결부의 포스포로티오에이트 연결부로의 불완전한 전환, 또는 저수준의 포스포로티오에이트 연결부의 산화에 이은, 천연 포스포디에스테르 연결부로의 전환에 기인하여 유발된 것일 수 있다. 상기 데이터 및 실시예 6의 라이게이션 데이터를 종합해 보면, 단일 가닥 라이게이션 동안 셔플링을 최소화시키기 위해서 하나 이상의 변형된 포스페이트기 (예컨대, 포스포로티오에이트 또는 5'-N-포스포르아미다이트 연결부)를 본원에 기술된 임의의 올리고뉴클레오티드 서열에 (예컨대, 헤드피스, 복합체, 빌딩 블록 태그, 또는 본원에 기술된 임의의 태그의 3'-말단의 말단 뉴클레오티드와 말단 뉴클레오티드에 인접한 뉴클레오티드 사이에) 포함시킬 수 있다.
단일 가닥 헤드피스 (ssHP, 3,636 Da)를 5'-말단에서 인산화시키고, 3'-말단에서 헥실아민 링커로 변형시켜 5'-P-mCGAGTCACGTC/아미노헥스/-3'의 서열 (서열 29)을 제공하였다. 헤드피스를 5'-mCAGTGTCmA-3'의 서열 (서열 30) (여기서, mC 및 mA는 2'-O 메틸 뉴클레오티드를 나타낸다)을 갖는 태그 (태그 15, XTAGSS000015, 2,469 Da)에 라이게이션시켰다. LC-MS 분석 (도 13a)을 통해 라이게이션 생성물 피크는 최대 3종을 함유하는 것으로 나타났으며, 이를 LC에 의해 부분적으로 분리시켰고, 이는 하기 분자량을 가졌다: 6,089 Da (예상치), 5,769 Da (예상치로부터 -320 Da) 및 6,409 Da (예상치로부터 +320 Da). 이러한 320 Da의 질량차는 정확하게는 추가의 O-Me C 뉴클레오티드의 제거 또는 부가 ("말단 뉴클레오티드 셔플링")에 상응하는 것이다.
말단 2'-플루오로 뉴클레오티드 뿐만 아니라, 다른 말단 O-Me 뉴클레오티드도 이용하여 실험함으로써 셔플링은 가능하게는 아마도 공여자 올리고뉴클레오티드의 아데닐화 이후에, 공여자 올리고뉴클레오티드의 5'-말단 뉴클레오티드의 절단에 의해 일어나는 것임을 확인하였다. 상기 사례의 기전은 알려져 있지 않다. 기전에 의해 제한하지 않으면서, 도 13b는 헤드피스 및 태그 사이의 T4 RNA 리가제 반응 동안 뉴클레오티드의 재셔플링에 대한 가능한 방식을 도시한 것으로서, 여기서 당업자는 상기 반응이 임의의 공여자와 수용자 올리고뉴클레오티드 사이에 (예컨대, 한 태그는 공여자 올리고뉴클레오티드이고, 나머지 다른 한 태그는 수용자 올리고뉴클레오티드인, 두 태그 사이에) 일어날 수 있다는 것을 이해할 것이다.
일반적으로, T4 RNA 리가제 (T4Rnl1)와 이루어지는 대다수의 라이게이션 반응은 공여자 및 수용자 올리고뉴클레오티드 둘 모두의 조합된 서열을 갖는 예상된 (정상) 라이게이션 생성물을 제공한다 (도 13ba, 좌측 반응). 소수의 반응은 비정상적인 라이게이션 생성물 (도 13ba, 우측 반응)을 제공하는데, 여기서 상기 비정상적인 생성물은 말단 뉴클레오티드의 제거 또는 부가를 갖는 것 (도 13bb에서, 각각 "생성물-1 nt" 및 "생성물+1 nt")을 포함한다.
기전에 의해 제한하지 않으면서, 공여자 올리고뉴클레오티드 (도 13ba에서 "헤드피스" 또는 "HP")의 절단은 수용자 ("태그")의 3'-OH 기와의 반응에 의해 일어날 수 있고, 이로써 1개의 뉴클레오티드가 없는 5'-인산화된 공여자 ("HP-1 nt") 및 접근가능한 3'-OH 기를 포함하는 아데닐화된 뉴클레오티드 ("1 nt")가 제공된다. 도 13bb는 헤드피스 (HP), 태그, HP-1 nt, 및 1 nt 사이의 반응에 관한 두 예시적인 개략도를 보여주는 것이다. 말단 뉴클레오티드이 절단된 생성물을 제공하기 위해 (도 13bb, 좌측), 1개의 뉴클레오티드가 없는 5'-인산화된 공여자 ("HP-1 nt")가 라이게이션 사례에 대한 기질로서의 역할을 한다. 상기 HP-1 nt 헤드피스는 T4 RNA 리가제에 의해 재아데닐화되고 (이로서, 도 13bb에서 "아데닐화된 HP-1 nt"을 제공하고), 태그에 라이게이션됨으로써 1개의 뉴클레오티드가 없는 라이게이션 생성물 ("생성물-1 nt")이 생성된다. 추가의 말단 뉴클레오티드를 포함하는 생성물을 제공하기 위해 (도 13bb, 좌측), 아데닐화된 뉴클레오티드 (1 nt)는 가능하게는 태그에의 라이게이션에 대한 기질로서의 역할을 할 수 있고, 이로써, 수용자보다 1개의 뉴클레오티드만큼 더 긴 올리고뉴클레오티드 ("태그+1 nt")가 생성될 수 있다. 상기 태그+1 nt 올리고뉴클레오티드는 가능하게는 변경되지 않은 헤드피스에 대한 수용자로서의 역할을 할 수 있고, 여기서 상기 반응을 통해 추가의 뉴클레오티드를 갖는 라이게이션 생성물 ("생성물+1 nt")이 제공된다. "생성물", "생성물-1 nt," 및 "생성물+1 nt"에 대한 LC-MS 분석을 수행하였다 (도 13bc). 비정상적인 태그 및 비정상적인 헤드피스 (즉, 각각 태그+1 nt 및 HP-1 nt)가 재조합되었을 때, 이때 생성된 라이게이션 생성물은 예상된 생성물로부터 구별이 불가능하였다.
말단 뉴클레오티드 재셔플링의 기전을 추가로 연구하기 위해, 5'P-mC*GAGTCACGTC/아미노헥스/-3'의 서열 (서열 31)을 갖는 헤드피스 (HP-PS)를 제조하였다. 헤드피스 HP-PS는 ssHP와 동일한 서열을 가지지만, 1가지 변형을 포함하고, 즉, 5'-말단 뉴클레오티드 mC와 다음 G 사이의 제1 포스포디에스테르 연결부를 포스포로티오에이트 연결부로서 합성하였다 (하나의 비-가교 포스페이트 산소는 황으로 치환되었다). 태그 15에의 HP-PS 라이게이션에 관한 LC-MS 분석 결과, 셔플링이 거의 완전하게 억제된 것으로 나타났다 (도 13c). +/- 320 피크의 트레이스는 가능하게는 포스포로티오에이트 연결부의 천연 포스포디에스테르 연결부로의 산화적 전환, 또는 불완전 황화에 상응하는 것일 수 있다.
실시예 8
라이브러리 구성원의 크기 배제 크로마토그래피
코딩 요소로서 단쇄의 단일 가닥 올리고뉴클레오티드를 사용하여 생성되는 화학적 엔티티의 라이브러리는 크기 배제 크로마토그래피 (SEC)를 통해 결합제 강화를 위해 잘 적합화될 수 있다. SEC는 크기에 기초하여 분자를 분리하는 크로마토그래피 기법으로서, 여기서 보다 고분자량의 보다 큰 분자일수록, 보다 저분자량의 보다 작은 소형 분자보다 더 빠르게 칼럼을 통해 유동하게 된다.
단백질과 ssDNA 라이브러리 구성원의 복합체는 SEC를 사용함으로써 비결합 라이브러리 구성원으로부터 쉽게 분리될 수 있다. 도 14는 단쇄의 ssDNA에 공유적으로 부착된 소형 분자 (20-50 mer 범위의 정의된 길이를 갖는 다양한 올리고뉴클레오티드)를 소형 분자에 결합하는 것으로 알려져 있는 단백질 표적과 혼합하여 수행된 SEC 실험으로부터 얻은 자외선 트레이스이다. 11-13분 시간 범위에서 칼럼으로부터 첫번째로 용리된 피크는 표적-회합된 라이브러리 구성원을 나타낸다. 14-17분에 용리된 후자의 피크는 비결합 라이브러리 구성원을 나타낸다. 도 14에서 관찰되는 바와 같이, 단백질 표적 대 라이브러리 분자의 비는 2:1이었고, 이로써, 라이브러리 분자 중 대략 50%가 조기 용리 분획 중 단백질과 회합되어야 한다. 비결합 라이브러리 구성원은 SEC에서 결합 라이브러리 구성원과 함께 공동으로 이동하는 바, 상기 방법을 사용해서는 보다 큰 이중 가닥 올리고뉴클레오티드 코딩 영역을 갖는 라이브러리를 선별할 수 없다. 따라서, 20-50 mer 길이 범위의 코딩 단일 가닥 올리고뉴클레오티드에 부착된 소형 분자 라이브러리를 통해 하나 이상의 표적, 예컨대 임의로 태그부착되지 않고/거나, 야생형인 단백질인 신규한 단백질 표적에 대한 소형 분자 결합제의 효과적인 선택에 필요한 신호 대 잡음비를 유의적으로 증가시킬 수 있는 잠재능을 갖는 강력한 분리 기법 사용이 가능해진다. 특히, 이러한 접근법을 통해 표적 (예컨대, 단백질 표적)을 태그부착하거나 고정화시킬 필요없이도, 조합적으로 생성된 코딩된 라이브러리 중 표적-결합 화학적 엔티티를 확인할 수 있다.
실시예 9
라이게이션 단계를 위한 동일한 화학을 사용한 화학적으로 라이게이션된 DNA 태그를 이용한 코딩
코딩 DNA 태그를 효소적으로 또는 화학적으로 라이게이션시킬 수 있다. 화학적 DNA 태그 라이게이션에 관한 일반 접근법은 도 15a에 도시되어 있다. 각 태그는 그의 5' 및 3' 단부 상에 공-상보적인 반응성 기를 보유한다. 태그의 중합 또는 고리화를 막기 위해, (i) 예컨대, TIPS-보호된 3' 알킨의 경우, 하나 또는 둘 모두의 반응성 기의 보호 (도 15a), 또는 (ii) 예컨대, 5'-아이오도/3'-포스포로티오에이트 라이게이션인 경우, 스플린트-의존성 라이게이션 화학 (도 15b)이 사용된다. (i)의 경우, 비-라이게이션된 태그는 탈보호된 태그의 착오태그부착 또는 중합을 막기 위해 각 라이브러리 사이클 이후 제거되거나, 캡핑될 수 있다. 상기 단계는 (ii)의 경우에는 임의적일 수 있지만, 여전히 포함될 수 있다. 화학적으로 라이게이션된 접합부를 판독할 수 있는 폴리머라제 효소를 사용하는 프라이머 연장 반응 또한 수행함으로써 라이게이션된 태그가 판독가능하고, 이로써 코딩된 정보는 선별 후 증폭 및 서열 분석에 의해 회복가능한 것임을 입증할 수 있다 (도 15c).
"클릭-화학"을 사용하여 태그 라이게이션을 실행하는 라이브러리 태그부착 전략법 (Cu(I) 촉매된 아지드/알킨 고리화첨가)은 도 16a에 제시되어 있다. 상기 전략법을 실행하는 것은 착오태그부착, 및 태그 중합을 회피하면서, 태그의 정확한 연속 라이게이션을 수행할 수 있는 능력 뿐만 아니라, 선별 후 증폭 및 서열 분석을 위한 화학적으로 라이게이션된 DNA를 증폭가능한 천연 DNA (cDNA)로 카피할 수 있는 능력에 의존한다 (도 16c).
정확한 태그 라이게이션을 달성하기 위해, (올리고뉴클레오티드 합성을 위해 사용된 CPG 매트리스 형태의 프로파르길 U로부터 합성된) 트리이소프로필실릴 (TIPS)-보호된 3'프로파르길 뉴클레오티드가 사용되었다 (도 16b). 60℃에서 1-4시간 동안 DMF 중 테트라부틸암모늄 플루오라이드 (TBAF)로 처리함으로써 TIPS 보호기를 특별히 제거할 수 있다. 그 결과, 라이브러리 합성 동안 라이게이션은 클릭 반응을 통해 헤드피스의 3'-프로파르길과 반응하는 5'-아지도/3'-TIPS-프로파르길 뉴클레오티드 (태그 A)를 포함하였다. 정제 후, 이전 사이클을 TBAF로 처리하여 TIPS를 제거하고, 결국에는 다음 사이클 태그와 반응하는 반응성 알킨을 생성하였다. 2, 3 또는 4개 이상의 연속적으로 설치된 코딩 태그를 제조하는 필요한 만큼의 사이클을 위해 상기 절차를 반복하였다 (도 16a).
물질 및 방법
올리고: 하기 올리고는 트리링크 바이오테크놀로지스(미국 캘리포니아주 샌디에고)에 의해 합성되었다: ss-HP-알킨: 5'-NH2-TCG AAT GAC TCC GAT AT (3'-프로파르길 G)-3'(서열 32); ss-아지도-TP: 5'-아지도 dT ATA GCG CGA TAT ACA CAC TGG CGA GCT TGC GTA CTG-3'(서열 33); 및 B-아지도: 5'-아지도 dT ACA CAC TGG CGA GCT TGC GTA CTG-3'(서열 34).
클릭 태그-TIPS: 5'-아지도 dT AT GCG TAC AGT CC (프로파르길 U-TIPS)-3'(서열 35) 및 5'-디메톡시트리틸 2'-숙시닐 3'-O-(트리이소프로필 실릴) 프로파르길 우리딘 cpg는 프라임 오가닉스(Prime Organics: 미국 매사추세츠주 워번)에 의해 합성되었다.
하기 올리고는 IDT DNA 테크놀로지스 (미국 캘리포니아주 샌디에고, 및 아이오와주 코럴빌)에 의해 합성되었다: FAM-클릭-프라이머: (5'-6-FAM) CAG TAC GCA AGC TCG CC-3' (서열 36) 및 Cy5-클릭-프라이머: (5'-Cy5) CAG TAC GCA AGC TCG CC-3' (서열 37).
DNA55-대조군: /5'비오틴-TEG//ispC3//ispC3/-TCGAATGACTCCGATATGT ATA GCG CGA TAT ACA CAC TGG CGA GCT TGC GTA CTG-3' (서열 38).
rDNA55-대조군: /5'바이오-TEG//ispC3//ispC3/-TCGAATGACTCCGATAT(리보G)T ATA GCG CGA TAT ACA CAC TGG CGA GCT TGC GTA CTG-3' (서열 39)
주형 합성: 하기 실시예에서, "화학적으로 라이게이션된 태그"라는 어구 또는 그와 관련된 대조군 서열은, 후속 단계 ("판독")가 그를 주형-의존성 중합을 위한 주형으로서 사용하는 바, "주형"으로 지칭된다.
태그 라이게이션: 500 mM 포스페이트 완충제 (pH 7.0) 중 당량 (1 mM)의 ssHP-알킨 및 1 당량 (1 mM)의 ss-아지도TP의 용액에 DMF/물 중의 사전 혼합된 2 당량의 아세트산Cu(II) (최종 농도 2 mM), 4 당량의 아스코르브산나트륨 (최종 농도 4 mM), 1 당량의 TBTA (최종 농도 1 mM)의 용액을 첨가하였다. 실온에서 밤새도록 혼합물을 인큐베이션시켰다. 반응이 완료되었음을 LC-MS로 확인한 후, 염/에탄올을 사용하여 반응을 침전시켰다.
ss-HP-알킨을 각각 ss-아지도-TP 및 B-아지도와 반응시켜 "단일 클릭" 주형 Y55 및 Y185를 합성하였다. ss-HP-알킨을 클릭태그-TIPS와 클릭 라이게이션시킨 후, 60℃에서 1시간 동안 DMF 중 TBAF (테트라부틸암모늄 플루오라이드)를 사용하여 TIPS를 탈보호한 후, ss-아지도 TP와 클릭 라이게이션시킴으로써 이중 및 삼중 클릭 주형 (YDC 및 YTC)을 합성하였다. 삼중 클릭 주형 (YTC)의 경우, 클릭태그-TIPS의 라이게이션 및 탈보호를 2회 반복하였다.
주형을 비오틴-(EG)4-NHS와 반응시키고, 탈염시켰다 (도 17a). RP HPLC에 의해 및/또는 15-20% 폴리아크릴아미드 겔/8 M 우레아 상에서 최종 생성물을 정제하고, LC-MS에 의해 분석하였다.
효소: 하기 DNA 폴리머라제는 그의 반응 완충제와 함께 뉴 잉글랜드 바이오랩스(New England Biolabs)로부터 구입하였다: 이. 콜라이 DNA 폴리머라제 I의 클레나우 단편, 클레나우 단편 (엑소-), 이. 콜라이 DNA 폴리머라제 I, 써미네이터(Therminator)™, 9°N™, 슈퍼스크립트 III(Superscript III)™.
스트렙타비딘 자기 다이나비즈(Dynabeads)® M280은 인비트로겐(Invitrogen)으로부터 구입하였다.
주형-의존성 중합 평가: 제조사의 가이드라인에 따라 반응 조건을 사용하여 40 내지 50 ㎕의 상응하는 1x 반응 완충제 및 각 효소 중 1 당량의 Cy5 또는 FAM 클릭-프라이머와 함께 각 주형 (5 μM)을 1시간 동안 인큐베이션시켰다. 특정 반응 (예컨대, SSII 또는 SSIII 전사)은 추가로 1 mM MnCl2로 보충하였다. 반응 생성물을 진탕시키면서 30분 동안 125 ㎕의 사전에 세척된 SA 비드 상에 로딩하였다. 이어서, 비드를 수집하고, 통과액은 폐기하였다. 비드를 1 mL의 트리스-완충처리된 염수 (pH 7.0)로 세척하고, 35 ㎕의 100 mM NaOH로 용리시켰다. 10 ㎕의 1 M 트리스 HCl (pH 7.0)을 첨가하여 용리액을 즉시 중화시켰다. LC-MS를 사용하여 생성물을 분석하였다.
결과 및 논의
주형 제조: 각 주형, Y55, Y185 (도 17b 및 17c), YDC 및 YTC (도 19)를 합성하고, 85% 초과의 순도로 정제하였다 (주요 불순물은 비-비오티닐화된 주형이었다). LC-MS를 통해 주형에 대한 MW는 하기와 같이 나타났다: Y55 17,624 (계산치 17,619) Da; YDC 22,228 (계산치 22,228) Da; 및 YTC 26,832 (계산치 26,837) Da.
단 하나의 클릭 화학 관능기 (알킨 또는 아지드)를 보유하는 올리고뉴클레오티드로부터 단일 클릭 주형 Y55 및 Y185 (도 17b 및 17c)를 합성하였다. 계내에서 생성된 Cu(I) 촉매를 사용하여 밤새도록 진행된 반응에서 클릭 반응 (화학적 라이게이션)의 효율은 90%를 초과하였다.
주형 YDC 및 YTC (도 19a-19d)는 연속 화학적 라이게이션을 입증하는 역할을 한다. YDC 및 YTC 둘 모두 아지도 및 TIPS-보호된 알킨 관능기 둘 모두를 동시에 포함하는 개별 태그를 사용한다. 주형 YTC는 3단계의 화학적 라이브러리 생성을 코딩하는 데 사용될 수 있는 바, 3 연속 태그부착 사이클을 입증한다.
라이게이션된 태그가 판독가능한지, 그리고 이로써 코딩된 정보가 회복가능한지를 입증하기 위해 상기 주형들 모두를 클릭-라이게이션 연결부를 통해 그 이상으로 진행되는 프라이머 연장에 대하여 시험하였다.
"단일-클릭" 주형 Y55 를 사용한 주형-의존성 중합: 트리아졸 클릭 연결부 판독에 대하여 큰 폴리머라제 세트를 시험하였다 (도 18a). 초기 실험은 Cy5-클릭-프라이머를 사용하여 수행하였다. 후속 실험에서는 FAM-클릭-프라이머를 사용하였다. 형광단이 주형의 카피에는 어떤 영향도 미치지 않았으며, 즉, 그 결과는 어떤 프라이머를 사용하든지 간에 동일하였다. (클릭 라이게이션에 대해 사용된 프로파르길-G가 리보뉴클레오티드 유도체인 바, 주형에서 단일 리보뉴클레오티드의 효과를 시험하기 위해) 대조군으로서 주형 DNA55-대조군 및 rDNA55-대조군을 사용하였다.
3개의 주형 모두에서 예상되는 전장의 생성물의 분자량은 17,446 (FAM 프라이머) (도 18b) 또는 17,443 (Cy5 프라이머)으로 동일하였다. 일부 폴리머라제에 대해서는 최대 클릭 라이게이션 연결부까지 이루어졌지만, 그 위치에서 중단된 프라이머 연장에 상응하는 소량의 생성물 (11,880 Da) 또한 관찰되었다.
클릭 연결부를 상당한 정도로 판독할 수 있는 (전장의 cDNA의 생산) 폴리머라제 세트를 발견하였고, 이를 하기에 표로 작성하였다.
Figure pct00004
클레나우 단편을 사용하여 37℃에서 인큐베이션시켰을 때, 최대 수율 (단일 클릭 접합부에서 80% 초과의 판독)을 달성하였다 (도 18b). 이. 콜라이 DNA 폴리머라제 I를 사용한 경우에는 다소 더 낮은 수율이 관찰되었다. 써미네이터™ 및 9°N™ 폴리머라제 뿐만 아니라, 클레나우 단편 엑소-를 사용한 경우에는 50%의 수율을 달성하였다.
완충제를 1 mM MnCl2로 보충하였을 때에는 슈퍼스크립트 III™ 역전사효소를 통해 약 50%의 수율로 cDNA를 수득하였다. 그러나, MS를 통해 관찰되는 바, 망가니즈로 인해 뉴클레오티드는 잘못 혼입되었고, 즉, 중합 충실도는 감소되었다.
"단일-클릭" 주형 Y185 를 사용한 주형-의존성 중합: 주형 Y185는 본 실시예에서 사용된 모든 주형과 동일한 프라이머 결합 부위를 특징으로 하되, 단, 예외적으로, 상이한 테일피스 B-아지도에 기인하여, Y55 및 모든 다른 주형의 경우, 20개의 뉴클레오티드 길이인 것과 비교하여 프라이머 결합 부위의 마지막 뉴클레오티드에서부터 클릭 연결부까지의 거리는 8개의 뉴클레오티드 길이이다. 효소가 개시-조기 신장 형태 구조로 존재할 때, 클릭 연결부의 전사가 여전히 가능한지 여부를 시험하기 위하여 주형을 사용하였다. 클릭-라이게이션된 코딩 태그의 길이를 단축시킬 수 있는 가능성의 여지를 남겨 놓은 상태에서, 클레나우는 Y55와 유사한 효율로 Y185 주형을 카피할 수 있었다 (도 18c).
이중 및 삼중 클릭-라이게이션 주형 YDC YTC 를 사용한 주형-의존성 중합: 사용된 검정 조건하에서 클릭 라이게이션 연결부를 판독시키는 데 클레나우 단편이 가장 효율적인 효소라는 것을 확립한 후, YDC 및 YTC 주형을 사용하여 cDNA (도 20a-20c) 또한 생성하였다. YDC 및 YTC 주형 둘 모두를 이용한 프라이머 연장 반응을 통해 전장의 생성물을 수득하였다. 총 반응 결과물의 약 10-15%를 차지하는 관찰된 다른 생성물, 예컨대 11,880 Da 및 16,236 Da은 각 클릭 접합부에서 정지된, 부분적으로 연장된 프라이머에 상응하는 것이었다. 내부 표준의 존재하에서 LC-MS 분석에 의해 수율을 측정하였고, 이는 접합부당 약 80-90%였다 (즉, 1 클릭 주형의 경우, 약 85%, 2 클릭 주형의 경우, 약 55%, 및 3 클릭 주형의 경우, 약 50%, 도 21 참조).
YDC 전사 생성물에는 1 dA 뉴클레오티드가 없었고 (계산치 22,110, 관찰치 27,197 Da; -313 dA, 도 20b) YTC 전사 생성물에는 2 dA 뉴클레오티드가 없었다 (계산치 26,773, 관찰치 26,147; -626 2 x dA) (도 20c). 이는 주형 중의 프로파르길 U 뉴클레오티드의 개수와 상관 관계가 있는 것이었다. 기전에 의해 제한하지 않으면서, T-트리아졸-U 접합부와 관련하여 클레나우가 상기 U를 스킵한 것으로 가정할 수 있었다. 대조적으로, 프로파르길 G 뉴클레오티드는 제1 클릭 접합부에서 정확하게 카피되었다.
실시예 10
5'-말단 상에 공유적으로 설치된 화학적 라이브러리를 코딩하는 일련의 코딩 DNA 태그를 화학적으로 라이게이션시키는 3'- 포스포로티오에이트 /5'- 아이오도 태그의 사용
태그 상의 3'- 포스포로티오에이트 보호: 도 24a에 제시되어 있는 바와 같이, 5'-아이오도-3'-포스포로티오에이트 태그 (1 당량)를 물에 용해시켜 최종 농도가 5 mM가 되도록 만들었다. 이어서, 비닐 메틸 술폰 (20 당량)을 첨가하고, 실온에서 밤새도록 반응을 인큐베이션시켰다. 반응 완료 후, 에탄올에 의해 생성물을 침전시켰다.
라이브러리 합성 (도 24b)
사이클 A: 스플릿 중 각 웰에 단일 가닥 DNA 헤드피스 (1 당량, 500 mM 보레이트 완충제 (pH 9.5) 중 1 mM 용액), 한 사이클 A 보호된 태그 (1.5 당량), 및 스플린트 (1.2 당량)를 첨가하였다. 실온에서 밤새도록 화학적 라이게이션을 인큐베이션시켰다. 이어서, (스플릿 중) 각 웰에 한 Fmoc 아미노산 (100 당량)을 첨가한 후, 이어서, 4-(4,6-디메톡시-1,3,5-트리아진-2-일)-4-메틸모르폴리늄 클로라이드 (100 당량)를 첨가하였다. 실온에서 밤새도록 화학적 반응을 인큐베이션시켰다. 완료 후, 모든 웰을 풀링하고, 에탄올을 사용하여 생성물을 침전시켰다. LC를 사용하여 사이클 A 풀을 정제하고, 건조될 때까지 동결건조시킨 후, 물에 용해시켜 최종 농도 1 mM로 만들고, 피페리딘 (10% v/v)을 첨가하여 사이클 A 태그의 탈보호를 수행하였다 (60℃, 2h). 에탄올을 사용하여 탈보호된 생성물을 다시 침전시켰다.
사이클 B: 탈보호된 사이클 A 풀을 500 mM 보레이트 완충제 (pH 9.5) 중에 용해시켜 1 mM 농도로 만든 후, 별개의 반응 웰로 분할하였다 (각 웰에 1 당량의 사이클 A 생성물). 각 웰에 한 사이클 B 보호된 태그 (1.5 당량), 및 스플린트 (1.2 당량)를 첨가하였다. 실온에서 밤새도록 화학적 라이게이션을 인큐베이션시켰다. (스플릿 중) 각 웰에 한 포르밀 산 (100 당량), 디이소프로필 카르보디이미드 (100 당량) 및 1-히드록시-7-아자-벤조트리아졸 (100 당량)의 혼합물을 첨가하였다. 실온에서 밤새도록 화학적 반응을 인큐베이션시켰다. 완료 후, 모든 웰을 풀링시키고, 에탄올을 사용하여 생성물을 침전시켰다. LC를 사용하여 사이클 B 풀을 정제하고, 건조될 때까지 동결건조시킨 후, 물에 용해시켜 최종 농도 1 mM로 만들고, 피페리딘 (10% v/v)을 첨가하여 사이클 B 태그의 탈보호를 수행하였다 (60℃, 2h). 에탄올을 사용하여 탈보호된 생성물을 다시 침전시켰다.
사이클 C: 탈보호된 사이클 B 풀을 500 mM 포스페이트 완충제 (pH 5.5) 중에 용해시켜 1 mM 농도로 만든 후, 별개의 반응 웰로 분할하였다 (각 웰에 1 당량의 사이클 B 생성물). 각 웰에 한 사이클 C 태그 (1.5 당량) 및 스플린트 (1.2 당량)를 첨가하였다. 실온에서 밤새도록 화학적 라이게이션을 인큐베이션시켰다. (스플릿 중) 각 웰에 아민 (80 당량) 및 나트륨 시아노보로히드라이드 (80 당량)를 첨가하였다. 60℃에서 16h 동안 화학적 반응을 인큐베이션시켰다. 완료 후, 모든 웰을 풀링시키고, 에탄올을 사용하여 생성물을 침전시켰다. LC를 사용하여 사이클 C 풀을 정제하고, 건조될 때까지 동결건조시켰다.
실시예 11
각 연속 태그 라이게이션 단계를 위한 한쌍의 오르토고날 화학 물질을 사용한 화학적으로 라이게이션된 DNA 태그를 이용한 코딩
화학적으로 라이게이션된 코딩 DNA 태그를 생성하는 또 다른 접근법은 연속 라이게이션을 위해 한쌍의 오르토고날 화학 물질을 사용하는 것이다 (도 22a). 그의 단부에 오르토고날 반응성 기를 보유하는 태그는 태그 중합 또는 고리화하지 않을 것이며, 연속 라이게이션 단계의 오르토고날 성질은 착오태그부착 사례의 빈도를 감소시킬 것이다. 그러한 접근법은 (i) 올리고뉴클레오티드 접합에 이용가능한 둘 이상의 오르토고날 화학 물질을 가져야 하고, (ii) 그렇게 형성된 각 접합부에 대해 이용가능한 판독 전략법 (도 22b 및 22c)을 필요로 한다. 이러한 접근법은 또한 보호기 또는 캡핑 단계 사용의 필요성을 소거시킬 수 있으며, 이로써 태그 라이게이션 과정은 간소화될 수 있다.
연속 단계를 위해 5'- 아지도 /3'- 알키닐 및 5'-아이오도/3'- 포스포로티오에이 라이게이션을 사용하는 오르토고날 화학적 라이게이션 전략법: 두 오르토고날 화학 물질 태그 라이게이션 사용에 관한 일례는 5'-아지도/3'-알키닐 및 5'-아이오도/3'-포스포로티오에이트 라이게이션의 조합이다. 도 23은 이러한 연속 라이게이션 화학 물질을 사용하는 3-사이클 오르토고날 화학적 라이게이션 태그부착 전략법의 합성에 관한 예시적인 개략도를 보여주는 것이다. 도 25a-25b는 5'-말단 상에 공유적으로 설치된 화학적 라이브러리를 코딩하는 일련의 오르토고날 코딩 DNA 태그를 화학적으로 라이게이션시키는 3'-포스포로티오에이트/5'-아지도 및 3'-프로파르길/5'-아이오도 태그의 사용에 관한 일례를 보여주는 것이다.
태그 상의 3'- 포스포로티오에이트 보호: 도 25a에 제시되어 있는 바와 같이, 5'-아지도-3'-포스포로티오에이트 태그 (1 당량)를 물에 용해시켜 최종 농도가 5 mM가 되도록 만들었다. 이어서, 비닐 메틸 술폰 (20 당량)을 첨가하고, 실온에서 밤새도록 반응을 인큐베이션시켰다. 반응 완료시, 에탄올에 의해 생성물을 침전시켰다.
라이브러리 합성 (도 25b)
사이클 A: 스플릿 중 각 웰에 단일 가닥 DNA 헤드피스 (1 당량, 500 mM 보레이트 완충제 (pH 9.5) 중 1 mM 용액), 한 사이클 A 태그 (1.5 당량), 및 스플린트 (1.2 당량)를 첨가하였다. 실온에서 밤새도록 화학적 라이게이션을 인큐베이션시켰다. 이어서, (스플릿 중) 각 웰에 한 Fmoc 아미노산 (100 당량)을 첨가한 후, 이어서, 4-(4,6-디메톡시-1,3,5-트리아진-2-일)-4-메틸모르폴리늄 클로라이드 (100 당량)를 첨가하였다. 실온에서 밤새도록 화학적 반응을 인큐베이션시켰다. 완료 후, 모든 웰을 풀링하고, 에탄올을 사용하여 생성물을 침전시켰다. LC를 사용하여 사이클 A 풀을 정제하고, 건조될 때까지 동결건조시켰다. 실온에서 2 h 동안 풀 (물 중 1 mM)을 피페리딘 (10% v/v)으로 처리하여 사이클 A 풀 상에서 Fmoc 탈보호를 수행하였다. 에탄올을 사용하여 탈보호된 생성물을 다시 침전시켰다.
사이클 B: 정제된 사이클 A 풀을 500 mM 포스페이트 완충제 (pH 7.0) 중에 용해시켜 1 mM 농도로 만든 후, 별개의 반응 웰로 분할하였다 (각 웰에 1 당량의 사이클 A 생성물). 각 웰에 한 사이클 B 보호된 태그 (1.2 당량), 아세트산구리(II) (2 당량), 아스코르브산나트륨 (4 당량), 및 트리스-(벤질트리아졸릴메틸)아민 (1 당량)을 첨가하였다. 실온에서 밤새도록 화학적 라이게이션을 인큐베이션시켰다. 완료 후, 에탄올을 사용하여 생성물을 (스플릿 중에서) 침전시킨 후, 500 mM 보레이트 완충제 (pH 9.5)를 사용하여 1 mM 농도로 희석시켰다. 이어서, (스플릿 중) 각 웰에 한 포르밀 산 (100 당량), 디이소프로필 카르보디이미드 (100 당량), 및 1-히드록시-7-아자-벤조트리아졸 (100 당량)의 혼합물을 첨가하였다. 실온에서 밤새도록 화학적 반응을 인큐베이션시켰다. 완료 후, 모든 웰을 풀링시키고, 에탄올을 사용하여 생성물을 침전시켰다. 이어서, 사이클 B 풀을 물에 용해시켜 최종 농도 1 mM로 만들고, 피페리딘 (10% v/v)을 첨가하여 사이클 B 태그의 탈보호를 수행하였다 (실온, 18h). 에탄올을 사용하여 탈보호된 생성물을 다시 침전시켰다. LC를 사용하여 탈보호된 사이클 B 풀을 정제하고, 건조될 때까지 동결건조시켰다.
사이클 C: 정제된 사이클 B 풀을 500 mM 포스페이트 완충제 (pH 5.5) 중에 용해시켜 1 mM 농도로 만든 후, 별개의 반응 웰로 분할하였다 (각 웰에 1 당량의 사이클 B 생성물). 각 웰에 한 사이클 C 태그 (1.5 당량) 및 스플린트 (1.2 당량)를 첨가하였다. 실온에서 밤새도록 화학적 라이게이션을 인큐베이션시켰다. (스플릿 중) 각 웰에 아민 (80 당량) 및 나트륨 시아노보로히드라이드 (80 당량)를 첨가하였다. 60℃에서 16h 동안 화학적 반응을 인큐베이션시켰다. 완료 후, 모든 웰을 풀링시키고, 에탄올을 사용하여 생성물을 침전시켰다. LC를 사용하여 사이클 C 풀을 정제하고, 건조될 때까지 동결건조시켰다.
다른 실시양태
본원에서 언급된 모든 공개 문헌, 특허 출원, 및 특허는 본원에 참조로 포함된다.
본 발명의 기술된 방법 및 시스템의 다양한 수정 및 변형은 본 발명의 범주 및 취지로부터 벗어남 없이 당업자에게 자명할 것이다. 비록 본 발명이 원하는 구체적인 실시양태와 관련하여 기술되기는 하였지만, 청구되는 본 발명은 상기의 구체적인 실시양태로 과도하게 제한되지 않아야 한다는 것을 이해하여야 한다. 실제로, 의약 분야, 약리학 분야 또는 관련 분야의 당업자에게 명백한 본 발명을 수행하기 위해 기술된 방식에 관한 다양한 수정을 본 발명의 범주 내에 포함시키고자 한다.
SEQUENCE LISTING <110> X-CHEM, INC. <120> METHODS FOR TAGGING DNA-ENCODED LIBRARIES <130> 50719-006WO3 <140> PCT/US12/54228 <141> 2012-09-07 <150> 61/536,929 <151> 2011-09-20 <150> 61/531,820 <151> 2011-09-07 <160> 39 <170> PatentIn version 3.5 <210> 1 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 1 gtgctgc 7 <210> 2 <211> 9 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 2 gcagcaccc 9 <210> 3 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa is N-alpha-benzyloxycarbonyl <220> <221> MISC_FEATURE <222> (8)..(8) <223> Xaa is OSu (N-succinimidyl ester) <400> 3 Xaa Gly Gly Gly Gly Gly Gly Xaa 1 5 <210> 4 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa is azidohomoalanine <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is OSu (N-succinimidyl ester) <400> 4 Xaa Gly Gly Gly Xaa 1 5 <210> 5 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> MISC_FEATURE <222> (1)..(1) <223> Xaa is propargylglycine <220> <221> MISC_FEATURE <222> (5)..(5) <223> Xaa is OSu (N-succinimidyl ester) <400> 5 Xaa Gly Gly Gly Xaa 1 5 <210> 6 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal phosphate group <220> <221> misc_feature <222> (18)..(18) <223> 3' terminal 6-FAM <400> 6 gctgtgcagg tagagtgc 18 <210> 7 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal phosphate group <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (18)..(18) <223> 3' terminal 6-FAM <400> 7 gctgtgcagg tagagtgc 18 <210> 8 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal phosphate group <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (2)..(2) <223> 2'-OMe is attached to u <220> <221> misc_feature <222> (3)..(3) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (4)..(4) <223> 2'-OMe is attached to c <220> <221> misc_feature <222> (5)..(5) <223> 2'-OMe is attached to a <220> <221> misc_feature <222> (6)..(6) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (7)..(7) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (8)..(8) <223> 2'-OMe is attached to u <220> <221> misc_feature <222> (9)..(9) <223> 2'-OMe is attached to a <220> <221> misc_feature <222> (10)..(10) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (11)..(11) <223> 2'-OMe is attached to a <220> <221> misc_feature <222> (12)..(12) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (13)..(13) <223> 2'-OMe is attached to u <220> <221> misc_feature <222> (14)..(14) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (15)..(15) <223> 2'-OMe is attached to c <220> <221> misc_feature <222> (15)..(15) <223> 3' terminal 6-FAM <400> 8 gugcagguag agugc 15 <210> 9 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal HO- <220> <221> misc_feature <222> (15)..(15) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (15)..(15) <223> 3' terminal -OH <400> 9 tacgtatacg actgg 15 <210> 10 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal HO- <220> <221> misc_feature <222> (21)..(21) <223> 3' terminal -OH <400> 10 gcagactacg tatacgactg g 21 <210> 11 <211> 15 <212> RNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal HO- <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to u <220> <221> misc_feature <222> (2)..(2) <223> 2'-OMe is attached to a <220> <221> misc_feature <222> (3)..(3) <223> 2'-OMe is attached to c <220> <221> misc_feature <222> (4)..(4) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (5)..(5) <223> 2'-OMe is attached to u <220> <221> misc_feature <222> (6)..(6) <223> 2'-OMe is attached to a <220> <221> misc_feature <222> (7)..(7) <223> 2'-OMe is attached to u <220> <221> misc_feature <222> (8)..(8) <223> 2'-OMe is attached to a <220> <221> misc_feature <222> (9)..(9) <223> 2'-OMe is attached to c <220> <221> misc_feature <222> (10)..(10) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (11)..(11) <223> 2'-OMe is attached to a <220> <221> misc_feature <222> (12)..(12) <223> 2'-OMe is attached to c <220> <221> misc_feature <222> (13)..(13) <223> 2'-OMe is attached to u <220> <221> misc_feature <222> (14)..(14) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (15)..(15) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (15)..(15) <223> 3' terminal -OH <400> 11 uacguauacg acugg 15 <210> 12 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal phosphate group <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (15)..(15) <223> 3' terminal 6-FAM <400> 12 gtgcaggtag agtgc 15 <210> 13 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal HO- <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to u <220> <221> misc_feature <222> (15)..(15) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (15)..(15) <223> 3' terminal -OH <400> 13 uacgtatacg actgg 15 <210> 14 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal phosphate group <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (8)..(8) <223> 3' terminal 6-FAM <400> 14 gtgagtgc 8 <210> 15 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal HO- <220> <221> misc_feature <222> (8)..(8) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (8)..(8) <223> 3' terminal -OH <400> 15 cagactgg 8 <210> 16 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal phosphate group <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (5)..(5) <223> 3' terminal 6-FAM <400> 16 gtgac 5 <210> 17 <211> 5 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal HO- <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to a <220> <221> misc_feature <222> (5)..(5) <223> 2'-OMe is attached to g <220> <221> misc_feature <222> (5)..(5) <223> 3' terminal -OH <400> 17 actgg 5 <210> 18 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (38)..(38) <223> g is propargylG <400> 18 gcgtgaacat gcatctcccg tatgcgtaca gtccattg 38 <210> 19 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> t is azidoT <400> 19 tatagcgcga tatacacact ggcgagcttg cgtactg 37 <210> 20 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (38)..(38) <223> 3' terminal includes spacer7-azide <400> 20 gcgtgaacat gcatctcccg tatgcgtaca gtccattg 38 <210> 21 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal hexynyl <400> 21 tagcgcgata tacacactgg cgagcttgcg tactg 35 <210> 22 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal Cy5 <400> 22 cagtacgcaa gctcg 15 <210> 23 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 23 gcgtgaacat gcatctcccg tatgcgtaca gtccattgta tagcgcgata tacacactgg 60 cgagcttgcg tactg 75 <210> 24 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 24 gcgtgaacat gcatctcc 18 <210> 25 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 25 cagtacgcaa gctcgcc 17 <210> 26 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal Cy5 <220> <221> misc_feature <222> (21)..(21) <223> 3' terminal thiophosphate <400> 26 cgatatacac actggcgagc t 21 <210> 27 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> t is IododT <220> <221> misc_feature <222> (12)..(12) <223> 3' terminal 6-FAM <400> 27 tgcgtactga gc 12 <210> 28 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <400> 28 cagtacgcaa gctcgcc 17 <210> 29 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal phosphate group <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to c <220> <221> misc_feature <222> (11)..(11) <223> 3' terminal aminohex <400> 29 cgagtcacgt c 11 <210> 30 <211> 8 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to c <220> <221> misc_feature <222> (8)..(8) <223> 2'-OMe is attached to a <400> 30 cagtgtca 8 <210> 31 <211> 11 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal phosphate group <220> <221> misc_feature <222> (1)..(1) <223> 2'-OMe is attached to c <220> <221> misc_feature <222> (2)..(2) <223> g is synthesized as a phosphorothioate linkage <220> <221> misc_feature <222> (11)..(11) <223> 3' terminal aminohex <400> 31 cgagtcacgt c 11 <210> 32 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> amidation <220> <221> misc_feature <222> (18)..(18) <223> g is propargylG <400> 32 tcgaatgact ccgatatg 18 <210> 33 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> t is azido dT <400> 33 tatagcgcga tatacacact ggcgagcttg cgtactg 37 <210> 34 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> t is azido dT <400> 34 tacacactgg cgagcttgcg tactg 25 <210> 35 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> t is azido dT <220> <221> misc_feature <222> (15)..(15) <223> u is propargyl U-TIPS <400> 35 tatgcgtaca gtccu 15 <210> 36 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal 6-FAM <400> 36 cagtacgcaa gctcgcc 17 <210> 37 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal Cy5 <400> 37 cagtacgcaa gctcgcc 17 <210> 38 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal Biotin-TEG//ispC3//ispC3 <400> 38 tcgaatgact ccgatatgta tagcgcgata tacacactgg cgagcttgcg tactg 55 <210> 39 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Synthetic Construct <220> <221> misc_feature <222> (1)..(1) <223> 5' terminal Bio-TEG//ispC3//ispC3 <220> <221> misc_feature <222> (18)..(18) <223> g is riboG <400> 39 tcgaatgact ccgatatgta tagcgcgata tacacactgg cgagcttgcg tactg 55

Claims (94)

  1. (i) 제1 관능기 및 제2 관능기를 갖는 헤드피스(headpiece)를 제공하는 단계로서, 여기서 상기 헤드피스는 하나 이상의 2'-치환된 뉴클레오티드를 포함하는 것인 단계;
    (ii) 상기 헤드피스의 상기 제1 관능기를 올리고뉴클레오티드-코딩된 화학적 엔티티(entity)의 제1 성분에 결합시키는 단계로서, 여기서 상기 헤드피스는 상기 제1 성분에 직접적으로 연결되거나 또는 이관능성 링커에 의해 상기 제1 성분에 간접적으로 연결되는 것인 단계; 및
    (iii) 상기 헤드피스의 상기 제2 관능기를 제1 빌딩 블록 태그에 결합시켜 복합체를 형성함으로써 태그부착된 라이브러리를 제공하는 단계
    를 포함하며, 상기 단계 (ii) 및 (iii)은 임의의 순서로 수행될 수 있고, 상기 제1 빌딩 블록 태그는 상기 단계 (ii)의 결합 반응을 코딩하는 것인,
    올리고뉴클레오티드-코딩된 화학적 엔티티를 포함하는 제1 라이브러리에 태그부착하는 방법.
  2. 제1항에 있어서, 상기 헤드피스가 상기 헤드피스의 5'-말단, 3'-말단, 또는 내부 위치 중 하나 이상에 2'-치환된 뉴클레오티드를 포함하는 것인 방법.
  3. 제2항에 있어서, 상기 헤드피스가 5'-말단 또는 3'-말단에 상기 2'-치환된 뉴클레오티드 및 상기 제2 관능기를 포함하는 것인 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1 빌딩 블록 태그가 하나 이상의 2'-치환된 뉴클레오티드를 포함하는 것인 방법.
  5. 제4항에 있어서, 상기 제1 빌딩 블록 태그가 상기 제1 빌딩 블록 태그의 5'-말단, 3'-말단, 또는 내부 위치 중 하나 이상에 2'-치환된 뉴클레오티드를 포함하는 것인 방법.
  6. 제5항에 있어서, 상기 제1 빌딩 블록 태그가 5'- 및 3'-말단 둘 모두에 상기 2'-치환된 뉴클레오티드를 포함하는 것인 방법.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 상기 2'-O-치환된 뉴클레오티드가 2'-O-메틸 뉴클레오티드 또는 2'-플루오로 뉴클레오티드인 방법.
  8. 제7항에 있어서, 상기 2'-O-치환된 뉴클레오티드가 2'-O-메틸 구아닌 또는 2'-O-메틸 우라실로부터 선택되는 상기 2'-O-메틸 뉴클레오티드인 방법.
  9. 제7항에 있어서, 2'-O-치환된 뉴클레오티드가 2'-플루오로 구아닌 또는 2'-플루오로 우라실로부터 선택되는 상기 2'-플루오로 뉴클레오티드인 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 제1 빌딩 블록 태그가 3'-말단 또는 5'-말단에 보호기를 포함하는 것인 방법.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 단계 (ii)가 상기 헤드피스를 상기 제1 성분에 직접적으로 결합시키는 것을 포함하는 것인 방법.
  12. 제11항에 있어서, 상기 성분이 스캐폴드 또는 제1 빌딩 블록인 방법.
  13. 제1항 내지 제10항 중 어느 한 항에 있어서, 단계 (ii)가 상기 헤드피스를 이관능성 링커를 통해 상기 제1 성분에 간접적으로 결합시키는 것을 포함하는 것인 방법.
  14. 제13항에 있어서, 상기 헤드피스를 상기 링커의 제1 관능기와 결합시키고 상기 제1 성분을 상기 링커의 제2 관능기와 결합시키는 단계를 포함하는 방법.
  15. 제14항에 있어서, 상기 제1 성분이 스캐폴드 또는 제1 빌딩 블록인 방법.
  16. 제1항 내지 제15항 중 어느 한 항에 있어서,
    (iv) 제2 빌딩 블록 태그를 상기 복합체의 5'-말단 또는 3'-말단에 결합시키는 단계; 및
    (v) 상기 화학적 라이브러리의 제2 성분을 상기 제1 성분에 결합시키는 단계
    를 추가로 포함하며, 상기 단계 (iv) 및 (v)는 임의의 순서로 수행될 수 있는 것인 방법.
  17. 제16항에 있어서, 단계 (iv)가 상기 제2 빌딩 블록 태그를 상기 복합체의 5'-말단에 결합시키는 것을 포함하고; 상기 복합체가 5'-말단에 포스페이트기를 포함하고; 상기 제2 빌딩 블록 태그가 3'- 및 5'-말단 둘 모두에 히드록실기를 포함하는 것인 방법.
  18. 제17항에 있어서, 단계 (iv)가 상기 제2 빌딩 블록 태그를 결합시키기 이전에, 상기 복합체를 정제하고 상기 복합체를 폴리뉴클레오티드 키나제와 반응시켜 5'-말단 상에 포스페이트기를 형성하는 것을 추가로 포함하는 것인 방법.
  19. 제16항에 있어서, 단계 (iv)가 상기 제2 빌딩 블록 태그를 상기 복합체의 3'-말단에 결합시키는 것을 포함하고; 상기 복합체가 3'-말단에 보호기를 포함하고; 상기 제2 빌딩 블록 태그가 5'-말단에 포스페이트기 및 3'-말단에 보호기를 포함하는 것인 방법.
  20. 제19항에 있어서, 단계 (iv)가 상기 제2 빌딩 블록 태그를 상기 복합체에 결합시키기 이전에, 상기 복합체를 가수분해제와 반응시켜 상기 복합체로부터 상기 보호기를 방출시키는 것을 추가로 포함하는 것인 방법.
  21. 제16항 내지 제20항 중 어느 한 항에 있어서, 상기 제2 빌딩 블록 태그가 상기 제2 빌딩 블록 태그의 5'-말단, 3'-말단, 또는 내부 위치 중 하나 이상에 2'-치환된 뉴클레오티드를 포함하는 것인 방법.
  22. 제16항 내지 제21항 중 어느 한 항에 있어서, 상기 제2 성분이 제1 빌딩 블록 또는 제2 빌딩 블록인 방법.
  23. 제16항 내지 제22항 중 어느 한 항에 있어서, 상기 단계 (iv)가 상기 제2 빌딩 블록 태그를 상기 복합체에 결합시키는 RNA 리가제 및/또는 DNA 리가제를 포함하는 것인 방법.
  24. 제23항에 있어서, 상기 단계 (iv)가 상기 RNA 리가제를 포함하고, 상기 RNA 리가제가 T4 RNA 리가제인 방법.
  25. 제23항에 있어서, 상기 단계 (iv)가 상기 DNA 리가제를 포함하고, 상기 DNA 리가제가 ssDNA 리가제인 방법.
  26. 제23항에 있어서, 상기 단계 (iv)가 상기 RNA 리가제 및 상기 DNA 리가제를 포함하는 것인 방법.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 상기 단계 (iii)이 상기 헤드피스를 상기 제1 빌딩 블록 태그에 결합시키는 RNA 리가제 및/또는 DNA 리가제를 포함하는 것인 방법.
  28. 제27항에 있어서, 상기 단계 (iii)이 상기 RNA 리가제를 포함하고, 상기 RNA 리가제가 T4 RNA 리가제인 방법.
  29. 제27항에 있어서, 상기 단계 (iii)이 상기 DNA 리가제를 포함하고, 상기 DNA 리가제가 ssDNA 리가제인 방법.
  30. 제27항에 있어서, 상기 단계 (iii)이 상기 RNA 리가제 및 상기 DNA 리가제를 포함하는 것인 방법.
  31. 제1항 내지 제30항 중 어느 한 항에 있어서, 상기 단계 (iii) 및/또는 상기 단계 (iv) (존재할 경우)가 폴리에틸렌 글리콜 및/또는 하나 이상의 가용성 다가 양이온을 포함하는 것인 방법.
  32. 제31항에 있어서, 상기 단계 (iii) 및/또는 상기 단계 (iv) (존재할 경우)가 상기 폴리에틸렌을 약 25% (w/v) 내지 약 35% (w/v)의 양으로 포함하는 것인 방법.
  33. 제32항에 있어서, 상기 폴리에틸렌 글리콜의 평균 분자량이 약 3,000 내지 약 5,500 달톤인 방법.
  34. 제33항에 있어서, 상기 폴리에틸렌 글리콜의 평균 분자량이 약 4,600 달톤인 방법.
  35. 제31항 내지 제34항 중 어느 한 항에 있어서, 상기 단계 (iii) 및/또는 상기 단계 (iv) (존재할 경우)가 상기 하나 이상의 가용성 다가 양이온을 약 0.05 mM 내지 약 10.5 mM의 양으로 포함하는 것인 방법.
  36. 제35항에 있어서, 상기 하나 이상의 다가 양이온이 염화마그네슘, 염화망가니즈(II), 및 염화헥사민코발트(III)로 이루어진 군으로부터 선택되는 것인 방법.
  37. 제35항 또는 제36항에 있어서, 상기 하나 이상의 다가 양이온이 약 0.5 mM 내지 약 1.5 mM의 양으로 존재하는 것인 방법.
  38. 제1항 내지 제37항 중 어느 한 항에 있어서, 결합 단계 (ii) 내지 (v) 중 어느 한 단계 이전에 임의의 비반응 태그 또는 비반응 헤드피스로부터 상기 복합체를 분리시키는 단계를 추가로 포함하는 방법.
  39. 제1항 내지 제38항 중 어느 한 항에 있어서, 결합 단계 (ii) 내지 (v) 중 어느 한 단계 이전에 상기 복합체를 정제하는 단계를 추가로 포함하는 방법.
  40. 제1항 내지 제39항 중 어느 한 항에 있어서, 하나 이상의 추가의 빌딩 블록 태그를 상기 복합체에 결합시키고 하나 이상의 추가의 성분을 상기 복합체에 결합시키는 단계를 추가로 포함하는 방법.
  41. 제1항 내지 제40항 중 어느 한 항에 있어서, 상기 헤드피스, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)가 프리아데닐화된 5'-말단을 포함하는 것인 방법.
  42. 제1항 내지 제41항 중 어느 한 항에 있어서, 상기 헤드피스가 헤어핀 구조를 포함하는 것인 방법.
  43. 제1항 내지 제42항 중 어느 한 항에 있어서, 상기 헤드피스, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 및/또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)가 5 내지 20개의 뉴클레오티드를 포함하는 것인 방법.
  44. 제43항에 있어서, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 및/또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)의 질량이 대략 동일한 것인 방법.
  45. 제1항 내지 제44항 중 어느 한 항에 있어서, 상기 헤드피스, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 및/또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)가 제1 라이브러리-확인 서열을 추가로 포함하는 것인 방법.
  46. 제1항 내지 제44항 중 어느 한 항에 있어서, 제1 라이브러리-확인 태그를 상기 복합체에 결합시키는 단계를 추가로 포함하는 방법.
  47. 제45항 또는 제46항에 있어서, 제2 라이브러리를 제공하고 상기 제1 라이브러리를 상기 제2 라이브러리와 조합하는 단계를 추가로 포함하는 방법.
  48. 제1항 내지 제47항 중 어느 한 항에 있어서, 상기 헤드피스, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 및/또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)가 사용 서열 및/또는 기원 서열을 추가로 포함하는 것인 방법.
  49. 제1항 내지 제47항 중 어느 한 항에 있어서, 사용 태그 및/또는 기원 태그를 상기 복합체에 결합시키는 단계를 추가로 포함하는 방법.
  50. 제1항 내지 제49항 중 어느 한 항에 있어서, 테일피스(tailpiece)를 상기 복합체에 결합시키는 단계를 추가로 포함하는 방법.
  51. (i) 제1 관능기 및 제2 관능기를 갖는 헤드피스를 제공하는 단계로서, 여기서 상기 헤드피스는 5'-말단에 2'-치환된 뉴클레오티드, 임의로 상기 헤드피스의 내부 위치에 하나 이상의 뉴클레오티드, 및 3'-말단의 2'-위치 및/또는 3'-위치에 보호기를 포함하는 것인 단계;
    (ii) 상기 헤드피스의 상기 제1 관능기를 올리고뉴클레오티드-코딩된 화학적 엔티티의 제1 성분에 결합시키는 단계로서, 여기서 상기 헤드피스는 상기 제1 성분에 직접적으로 연결되거나 또는 이관능성 링커에 의해 상기 제1 성분에 간접적으로 연결되는 것인 단계; 및
    (iii) 상기 헤드피스의 상기 제2 관능기를 제1 빌딩 블록 태그에 결합시켜 태그부착된 라이브러리를 제공하는 단계로서, 여기서 상기 제1 빌딩 블록 태그는 5'-말단에 2'-치환된 뉴클레오티드 및 히드록실기, 임의로 상기 태그의 내부 위치에 하나 이상의 뉴클레오티드, 및 3'-말단에 2'-치환된 뉴클레오티드 및 히드록실기를 포함하는 것인 단계
    를 포함하며, 상기 단계 (ii) 및 (iii)은 임의의 순서로 수행될 수 있고, 상기 제1 빌딩 블록 태그는 상기 단계 (ii)의 결합 반응을 코딩하는 것인,
    올리고뉴클레오티드-코딩된 화학적 엔티티를 포함하는 제1 라이브러리에 태그부착하는 방법.
  52. 제51항에 있어서, 상기 2'-치환된 뉴클레오티드가 2'-O-메틸 구아닌인 2'-O-메틸 뉴클레오티드인 방법.
  53. 제51항 또는 제52항에 있어서, 상기 하나 이상의 뉴클레오티드가 상기 헤드피스의 내부 위치에 존재하는 것인 방법.
  54. 제51항 내지 제53항 중 어느 한 항에 있어서, 상기 하나 이상의 뉴클레오티드가 상기 태그의 내부 위치에 존재하는 것인 방법.
  55. 제53항 또는 제54항에 있어서, 상기 헤드피스 및/또는 상기 태그의 상기 하나 이상의 뉴클레오티드가 하나 이상의 2'-데옥시뉴클레오티드인 방법.
  56. 제51항 내지 제55항 중 어느 한 항에 있어서, 상기 단계 (iii)이 하나 이상의 가용성 다가 양이온, 폴리에틸렌 글리콜, 및 RNA 리가제를 포함하는 것인 방법.
  57. 제56항에 있어서, 상기 폴리에틸렌 글리콜의 평균 분자량이 약 4,600 달톤이고, 상기 RNA 리가제가 T4 RNA 리가제인 방법.
  58. 제56항 또는 제57항에 있어서, 상기 하나 이상의 다가 양이온이 염화마그네슘, 염화망가니즈(II), 및 염화헥사민코발트(III)로 이루어진 군으로부터 선택되는 것인 방법.
  59. 제51항 내지 제57항 중 어느 한 항에 있어서, 상기 헤드피스 및/또는 상기 제1 빌딩 블록 태그가 5 내지 20개의 뉴클레오티드를 포함하는 것인 방법.
  60. 제59항에 있어서, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 및/또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)의 질량이 대략 동일한 것인 방법.
  61. 제51항 내지 제60항 중 어느 한 항에 있어서, 상기 헤드피스, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 및/또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)가 제1 라이브러리-확인 서열을 추가로 포함하는 것인 방법.
  62. 제51항 내지 제60항 중 어느 한 항에 있어서, 제1 라이브러리-확인 태그를 상기 복합체에 결합시키는 단계를 추가로 포함하는 방법.
  63. 제61항 또는 제62항에 있어서, 제2 라이브러리를 제공하고 상기 제1 라이브러리를 상기 제2 라이브러리와 조합하는 단계를 추가로 포함하는 방법.
  64. 제51항 내지 제63항 중 어느 한 항에 있어서, 상기 헤드피스, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 및/또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)가 사용 서열 또는 기원 서열을 추가로 포함하는 것인 방법.
  65. 제51항 내지 제63항 중 어느 한 항에 있어서, 사용 태그 및/또는 기원 태그를 상기 복합체에 결합시키는 단계를 추가로 포함하는 방법.
  66. 제51항 내지 제65항 중 어느 한 항에 있어서, 테일피스를 상기 복합체에 결합시키는 단계를 추가로 포함하는 방법.
  67. 제1항 또는 제51항에 있어서, 상기 2'-치환된 뉴클레오티드가 2'-O-메틸 구아닌, 2'-O-메틸 우라실, 2'-O-메틸 아데노신, 2'-O-메틸 티미딘, 2'-O-메틸 이노신, 2'-O-메틸 시티딘, 2'-O-메틸 디아미노 퓨린, 2'-플루오로 구아닌, 2'-플루오로 우라실, 2'-플루오로 아데노신, 2'-플루오로 티미딘, 2'-플루오로 이노신, 2'-플루오로 시티딘, 및 2'-플루오로 디아미노 퓨린으로 이루어진 군으로부터 선택되는 것인 방법.
  68. 제1항 내지 제67항 중 어느 한 항에 있어서, 다수의 헤드피스를 포함하는 방법.
  69. 제68항에 있어서, 상기 다수의 헤드피스의 각 헤드피스가 동일한 서열 영역 및 상이한 코딩 영역을 포함하는 것인 방법.
  70. 제69항에 있어서, 상기 동일한 서열 영역이 프라이머 결합 영역인 방법.
  71. 제69항 또는 제70항에 있어서, 상기 상이한 코딩 영역이 상기 헤드피스, 또는 개시 성분의 부가를 코딩하는 개시 빌딩 블록 태그인 방법.
  72. 제1항 내지 제71항 중 어느 한 항에 있어서, 단계 (ii) 내지 (iv) (존재할 경우) 중 하나 이상의 단계에서 상기 결합이 효소적 라이게이션을 포함하는 것인 방법.
  73. 제72항에 있어서, 상기 효소적 라이게이션이 RNA 리가제 및/또는 DNA 리가제의 사용을 포함하는 것인 방법.
  74. 제1항 내지 제73항 중 어느 한 항에 있어서, 단계 (ii) 내지 (iv) (존재할 경우) 중 하나 이상의 단계에서 상기 결합이 화학적 라이게이션을 포함하는 것인 방법.
  75. 제74항에 있어서, 상기 화학적 라이게이션이 하나 이상의 화학적 공-반응성 쌍의 사용을 포함하는 것인 방법.
  76. 제75항에 있어서, 상기 화학적 공-반응성 쌍이 임의로 치환된 알키닐기 및 임의로 치환된 아지도기인 방법.
  77. 제75항에 있어서, 상기 화학적 공-반응성 쌍이 포스포로티오에이트기 및 아이오도기인 방법.
  78. 제77항에 있어서, 상기 포스포로티오에이트기가 올리고뉴클레오티드의 5'-말단에 존재하고, 상기 아이오도기가 올리고뉴클레오티드의 3'-말단에 존재하는 것인 방법.
  79. 제77항 또는 제78항에 있어서, 상기 화학적 라이게이션이 상기 화학적 공-반응성 쌍 사이의 결합 반응에서 스플린트(splint) 올리고뉴클레오티드를 추가로 포함하는 것인 방법.
  80. 제75항 내지 제79항 중 어느 한 항에 있어서, 상기 화학적 공-반응성 쌍이 약 4 내지 약 24개 원자의 길이를 갖는 스페이서를 생성하는 것인 방법.
  81. 제80항에 있어서, 상기 스페이서가 약 4 내지 약 10개 원자의 길이를 갖는 것인 방법.
  82. 제74항 내지 제81항 중 어느 한 항에 있어서, 하나 이상의 빌딩 블록 태그의 상기 화학적 라이게이션이 연속 빌딩 블록 태그를 라이게이션시키기 위한 오르토고날(orthogonal) 화학적 공-반응성 쌍을 포함하는 것인 방법.
  83. 제82항에 있어서, 상기 오르토고날 화학적 공-반응성 쌍이 (i) 임의로 치환된 알키닐기 및 임의로 치환된 아지도기 및 (ii) 포스포로티오에이트기 및 아이오도기를 포함하는 것인 방법.
  84. 제1항 내지 제83항 중 어느 한 항에 있어서, 상기 복합체, 상기 헤드피스, 상기 제1 빌딩 블록 태그, 상기 제2 빌딩 블록 태그, 및/또는 상기 하나 이상의 추가의 빌딩 블록 태그 (존재할 경우)가, 3'-말단의 말단 뉴클레오티드와 상기 말단 뉴클레오티드에 인접한 뉴클레오티드 사이에 변형된 포스페이트기를 포함하는 것인 방법.
  85. 헤드피스 및 빌딩 블록 태그를 포함하는 복합체로서, 여기서 상기 태그는 5 내지 20개의 뉴클레오티드, 5'-말단에 2'-치환된 뉴클레오티드, 및 3'-말단에 2'-치환된 뉴클레오티드를 포함하는 것인 복합체.
  86. 제85항에 있어서, 5'-말단 및/또는 3'-말단의 상기 2'-치환된 뉴클레오티드가 2'-O-메틸 뉴클레오티드 또는 2'-플루오로 뉴클레오티드인 복합체.
  87. 제85항 또는 제86항에 있어서, 상기 헤드피스가 헤어핀 구조를 포함하는 것인 복합체.
  88. 제85항 내지 제87항 중 어느 한 항에 있어서, 상기 헤드피스가 상기 헤드피스의 5'-말단, 3'-말단, 또는 내부 위치 중 하나 이상에 2'-치환된 뉴클레오티드를 포함하는 것인 복합체.
  89. 제85항 내지 제88항 중 어느 한 항에 있어서, 상기 헤드피스가 프리아데닐화된 5'-말단을 추가로 포함하는 것인 복합체.
  90. 제85항 내지 제89항 중 어느 한 항에 있어서, 상기 2'-치환된 뉴클레오티드가 2'-O-메틸 뉴클레오티드 또는 2'-플루오로 뉴클레오티드인 복합체.
  91. 제90항에 있어서, 상기 2'-치환된 뉴클레오티드가 2'-O-메틸 구아닌, 2'-O-메틸 우라실, 2'-O-메틸 아데노신, 2'-O-메틸 티미딘, 2'-O-메틸 이노신, 2'-O-메틸 시티딘, 2'-O-메틸 디아미노 퓨린, 2'-플루오로 구아닌, 2'-플루오로 우라실, 2'-플루오로 아데노신, 2'-플루오로 티미딘, 2'-플루오로 이노신, 2'-플루오로 시티딘, 및 2'-플루오로 디아미노 퓨린으로 이루어진 군으로부터 선택되는 것인 복합체.
  92. 제85항 내지 제91항 중 어느 한 항에 있어서, 테일피스를 추가로 포함하는 복합체.
  93. 제85항 내지 제92항 중 어느 한 항에 있어서, 상기 복합체, 상기 헤드피스, 또는 상기 빌딩 블록 태그가 3'-말단의 말단 뉴클레오티드와 상기 말단 뉴클레오티드에 인접한 뉴클레오티드 사이에 변형된 포스페이트기를 포함하는 것인 복합체.
  94. 제85항 내지 제93항 중 어느 한 항에 있어서, 포스포로티오에이트 또는 트리아졸 기를 포함하는 복합체.
KR1020147007749A 2011-09-07 2012-09-07 Dna-코딩된 라이브러리에 태그부착하는 방법 KR102124613B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161531820P 2011-09-07 2011-09-07
US61/531,820 2011-09-07
US201161536929P 2011-09-20 2011-09-20
US61/536,929 2011-09-20
PCT/US2012/054228 WO2013036810A1 (en) 2011-09-07 2012-09-07 Methods for tagging dna-encoded libraries

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020207017041A Division KR102242879B1 (ko) 2011-09-07 2012-09-07 Dna-코딩된 라이브러리에 태그부착하는 방법

Publications (2)

Publication Number Publication Date
KR20140059256A true KR20140059256A (ko) 2014-05-15
KR102124613B1 KR102124613B1 (ko) 2020-06-19

Family

ID=47832597

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020147007749A KR102124613B1 (ko) 2011-09-07 2012-09-07 Dna-코딩된 라이브러리에 태그부착하는 방법
KR1020207017041A KR102242879B1 (ko) 2011-09-07 2012-09-07 Dna-코딩된 라이브러리에 태그부착하는 방법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020207017041A KR102242879B1 (ko) 2011-09-07 2012-09-07 Dna-코딩된 라이브러리에 태그부착하는 방법

Country Status (18)

Country Link
US (2) US10865409B2 (ko)
EP (3) EP3351631B1 (ko)
JP (3) JP6674738B2 (ko)
KR (2) KR102124613B1 (ko)
CN (1) CN103998658B (ko)
AP (1) AP2014007483A0 (ko)
AU (3) AU2012304387B2 (ko)
BR (1) BR112014005205A2 (ko)
CA (2) CA3077662A1 (ko)
DK (2) DK3351631T3 (ko)
EA (1) EA032438B1 (ko)
ES (2) ES2675111T3 (ko)
HK (1) HK1258815A1 (ko)
IL (2) IL231191B (ko)
IN (1) IN2014CN02574A (ko)
MX (2) MX360438B (ko)
SG (2) SG10201605812YA (ko)
WO (1) WO2013036810A1 (ko)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE414769T1 (de) * 2002-03-15 2008-12-15 Nuevolution As Eine verbesserte methode zur synthese von matritzenabhängigen molekülen
EP3216874A1 (en) 2008-09-05 2017-09-13 TOMA Biosciences, Inc. Methods for stratifying and annotating cancer drug treatment options
EA035311B1 (ru) 2009-02-13 2020-05-27 Икс-Чем, Инк. Способ маркировки днк-кодируемых химических библиотек
EP3572528A1 (en) 2010-09-24 2019-11-27 The Board of Trustees of the Leland Stanford Junior University Direct capture, amplification and sequencing of target dna using immobilized primers
BR112014005205A2 (pt) 2011-09-07 2017-03-21 X-Chem Inc métodos para etiquetar bibliotecas codificadas com dna
US11674135B2 (en) * 2012-07-13 2023-06-13 X-Chem, Inc. DNA-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
RU2015126650A (ru) * 2012-12-10 2017-01-12 Фред Хатчинсон Кэнсер Рисёрч Сентер Партнеры липокалина по слиянию
US10550385B2 (en) * 2012-12-20 2020-02-04 Sirna Therapeutics, Inc. Post-synthetic orthogonal amidation plus metal catalyzed azide-alkyne cycloaddition click chemistry on siRNA
CN103882532B (zh) * 2012-12-20 2015-10-21 成都先导药物开发有限公司 一种先导化合物的合成及筛选方法与试剂盒
GB201322692D0 (en) * 2013-12-20 2014-02-05 Philochem Ag Production of encoded chemical libraries
GB201404552D0 (en) * 2014-03-14 2014-04-30 Philochem Ag Purification of dna-conjugate products
MA41298A (fr) * 2014-12-30 2017-11-07 X Chem Inc Procédés de marquage de banques codées par de l'adn
CN104894651B (zh) * 2015-06-29 2017-04-12 天津诺禾医学检验所有限公司 微量起始dna的高通量测序文库构建方法及其所构建的高通量测序文库
US11186836B2 (en) * 2016-06-16 2021-11-30 Haystack Sciences Corporation Oligonucleotide directed and recorded combinatorial synthesis of encoded probe molecules
CN107130300A (zh) * 2016-10-08 2017-09-05 深圳劲宇生物科技有限公司 一种dna编码分子库的合成方法及dna模板
WO2018107093A1 (en) * 2016-12-09 2018-06-14 University Of Southern California Genome-wide mapping of dna-dna proximities in the nucleus
EP3360962A1 (en) * 2017-02-14 2018-08-15 Technische Universität Dortmund Synthesis of dna-encoded libraries by micellar catalysis
EP3515880B1 (en) 2017-03-17 2023-05-10 Hitgen Inc. Methods and compositions for synthesis of encoded libraries
EP3619340A4 (en) * 2017-05-02 2021-01-20 Haystack Sciences Corporation MOLECULES FOR THE VERIFICATION OF OLIGONUCLEOTIDE DIRECTED COMBINATIONAL SYNTHESIS AND METHOD OF MANUFACTURING AND USING THEREOF
CA3068446A1 (en) * 2017-06-30 2019-01-02 The Regents Of The University Of California Methods and systems for evaluating dna methylation in cell-free dna
EP3688156A4 (en) * 2017-09-25 2021-06-30 Haystack Sciences Corporation MULTINOMIAL CODING FOR OLIGONUCLEOTIDE-DIRECTED COMBINATORIAL CHEMISTRY
CN108070009B (zh) * 2017-12-12 2021-04-13 上海药明康德新药开发有限公司 一种制备dna编码化合物文库的方法及起始头片段化合物和制得的dna编码化合物
WO2019140353A1 (en) * 2018-01-12 2019-07-18 Camena Bioscience Limited Compositions and methods for template-free geometric enzymatic nucleic acid synthesis
WO2019149198A1 (zh) * 2018-01-31 2019-08-08 成都先导药物开发股份有限公司 一种dna编码化合物库及化合物筛选方法
WO2019157692A1 (zh) * 2018-02-14 2019-08-22 深圳劲宇生物科技有限公司 Dna 编码分子库及无靶点限制的化合物筛选方法
WO2019157693A1 (zh) * 2018-02-14 2019-08-22 深圳劲宇生物科技有限公司 Dna编码分子库及应用广的化合物筛选方法
WO2019195346A1 (en) 2018-04-02 2019-10-10 Progenity, Inc. Methods, systems, and compositions for counting nucleic acid molecules
WO2020001560A1 (zh) * 2018-06-29 2020-01-02 成都先导药物开发股份有限公司 一种合成dna编码化合物中的反应监测方法
CN109468310B (zh) * 2018-10-25 2020-12-01 深圳劲宇生物科技有限公司 Dna编码碎片分子库的合成方法和连接基团的筛选方法
WO2020124213A1 (en) 2018-12-20 2020-06-25 Krylov Sergey N Binder selection using capillary electrophoresis
CN113439085A (zh) * 2019-02-18 2021-09-24 味之素株式会社 包含互补部分的修饰寡核苷酸的制造方法
WO2020206170A1 (en) 2019-04-02 2020-10-08 Progenity, Inc. Methods, systems, and compositions for counting nucleic acid molecules
WO2020227654A1 (en) * 2019-05-09 2020-11-12 Pacific Biosciences Of California, Inc. Compositions and methods for improved cdna synthesis
US20220275362A1 (en) * 2019-07-25 2022-09-01 X-Chem, Inc. Methods for tagging and encoding of pre-existing compound libraries
WO2023077001A1 (en) * 2021-10-27 2023-05-04 Juan Pablo Maianti Dna-encoded and affinity-tagged masked-warhead compounds and use thereof in assembling libraries of small molecules enabled for late-stage purification and multiplexed screening of covalent ligands
WO2024069235A2 (en) 2022-09-30 2024-04-04 Sixfold Bioscience Ltd. Compositions containing oligonucleotides with theranostic applications

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6867290B2 (en) * 1999-04-30 2005-03-15 Cyclops Genome Sciences, Ltd. Modified polynucleotides and uses thereof
US20110104785A1 (en) * 2009-11-05 2011-05-05 Ramesh Vaidyanathan Methods and kits for 3'-end-tagging of rna

Family Cites Families (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3788914T2 (de) 1986-09-08 1994-08-25 Ajinomoto Kk Verbindungen zur Spaltung von RNS an eine spezifische Position, Oligomere, verwendet bei der Herstellung dieser Verbindungen und Ausgangsprodukte für die Synthese dieser Oligomere.
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US5025388A (en) 1988-08-26 1991-06-18 Cramer Richard D Iii Comparative molecular field analysis (CoMFA)
US5670633A (en) 1990-01-11 1997-09-23 Isis Pharmaceuticals, Inc. Sugar modified oligonucleotides that detect and modulate gene expression
US6005087A (en) * 1995-06-06 1999-12-21 Isis Pharmaceuticals, Inc. 2'-modified oligonucleotides
US5660985A (en) 1990-06-11 1997-08-26 Nexstar Pharmaceuticals, Inc. High affinity nucleic acid ligands containing modified nucleotides
US5723289A (en) 1990-06-11 1998-03-03 Nexstar Pharmaceuticals, Inc. Parallel selex
JP2780572B2 (ja) 1991-09-13 1998-07-30 株式会社島津製作所 オリゴヌクレオチドの酵素的合成法及びオリゴヌクレオチドのプライマーとしての使用
US5639603A (en) 1991-09-18 1997-06-17 Affymax Technologies N.V. Synthesizing and screening molecular diversity
ATE148889T1 (de) 1991-09-18 1997-02-15 Affymax Tech Nv Verfahren zur synthese der verschiedenen sammlungen von oligomeren
US5573905A (en) 1992-03-30 1996-11-12 The Scripps Research Institute Encoded combinatorial chemical libraries
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
HUT72495A (en) 1992-10-01 1996-05-28 Cold Spring Harbor Lab Complex combinatorial chemical libraries encoded with tags
US6503759B1 (en) 1992-10-01 2003-01-07 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
US5807683A (en) 1992-11-19 1998-09-15 Combichem, Inc. Combinatorial libraries and methods for their use
ATE246702T1 (de) 1993-04-12 2003-08-15 Univ Northwestern Verfahren zur darstellung von oligonukleotiden
US5681943A (en) 1993-04-12 1997-10-28 Northwestern University Method for covalently linking adjacent oligonucleotides
ATE232882T1 (de) 1993-05-27 2003-03-15 Selectide Corp Topologisch getrennte kodierende festphasen- bibliotheken
US5840485A (en) 1993-05-27 1998-11-24 Selectide Corporation Topologically segregated, encoded solid phase libraries
WO1995001365A1 (en) 1993-07-02 1995-01-12 Lynx Therapeutics, Inc. Synthesis of branched nucleic acids
US5571903A (en) 1993-07-09 1996-11-05 Lynx Therapeutics, Inc. Auto-ligating oligonucleotide compounds
US6087186A (en) 1993-07-16 2000-07-11 Irori Methods and apparatus for synthesizing labeled combinatorial chemistry libraries
GB9315847D0 (en) 1993-07-30 1993-09-15 Isis Innovation Tag reagent and assay method
DK96093D0 (da) 1993-08-25 1993-08-25 Symbicom Ab Improvements in molecular modelling and drug design
US5658782A (en) 1993-10-20 1997-08-19 State Of Oregon, Acting By And Through The Oregon State Board Of Higher Education On Behalf Of The Oregon Health Sciences University A Non-Profit Organization Amino acid transporters and uses
JPH09508353A (ja) 1993-11-02 1997-08-26 アフィマックス テクノロジーズ ナムローゼ フェンノートシャップ 分子多様性の合成及びスクリーニング
US6117976A (en) 1993-11-04 2000-09-12 Medical Research Council Manufacture and use of polypeptides tagged using binding molecules
JPH09506629A (ja) 1993-12-17 1997-06-30 キュビッチョッティ,ロジャー・エス ヌクレオチドに支配された生体分子および多分子薬物の集合並びに装置
US6936477B2 (en) 1994-04-13 2005-08-30 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
JPH08268A (ja) 1994-06-16 1996-01-09 Koichi Nishigaki 連結した2本鎖dnaの製造方法
US5525734A (en) 1994-06-22 1996-06-11 Affymax Technologies N.V. Methods for synthesizing diverse collections of pyrrolidine compounds
US5525735A (en) 1994-06-22 1996-06-11 Affymax Technologies Nv Methods for synthesizing diverse collections of pyrrolidine compounds
JPH10506379A (ja) 1994-07-26 1998-06-23 ザ・スクリプス・リサーチ・インスティチュート 可溶性の組合せライブラリー
US6654505B2 (en) 1994-10-13 2003-11-25 Lynx Therapeutics, Inc. System and apparatus for sequential processing of analytes
US5604097A (en) 1994-10-13 1997-02-18 Spectragen, Inc. Methods for sorting polynucleotides using oligonucleotide tags
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US6013445A (en) 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
USRE43097E1 (en) 1994-10-13 2012-01-10 Illumina, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
WO1996038726A1 (en) 1995-05-30 1996-12-05 Ecole Polytechnique Federale De Lausanne (Epfl) Covalently immobilized phospholipid bilayers on solid surfaces
US5780613A (en) 1995-08-01 1998-07-14 Northwestern University Covalent lock for self-assembled oligonucleotide constructs
DE19646372C1 (de) 1995-11-11 1997-06-19 Evotec Biosystems Gmbh Genotyp und Phänotyp koppelnde Verbindung
US5962228A (en) 1995-11-17 1999-10-05 Lynx Therapeutics, Inc. DNA extension and analysis with rolling primers
US5763175A (en) 1995-11-17 1998-06-09 Lynx Therapeutics, Inc. Simultaneous sequencing of tagged polynucleotides
US5780231A (en) 1995-11-17 1998-07-14 Lynx Therapeutics, Inc. DNA extension and analysis with rolling primers
US6537776B1 (en) 1999-06-14 2003-03-25 Diversa Corporation Synthetic ligation reassembly in directed evolution
US5846839A (en) 1995-12-22 1998-12-08 Glaxo Group Limited Methods for hard-tagging an encoded synthetic library
US6027890A (en) 1996-01-23 2000-02-22 Rapigene, Inc. Methods and compositions for enhancing sensitivity in the analysis of biological-based assays
US5898031A (en) 1996-06-06 1999-04-27 Isis Pharmaceuticals, Inc. Oligoribonucleotides for cleaving RNA
DE19642751A1 (de) 1996-10-16 1998-04-23 Deutsches Krebsforsch Saccharid-Bibliothek
EP1712623B1 (en) 1997-01-21 2011-10-19 The General Hospital Corporation Selection of proteins using RNA-protein fusions
US5888737A (en) 1997-04-15 1999-03-30 Lynx Therapeutics, Inc. Adaptor-based sequence analysis
JP4294740B2 (ja) 1997-05-23 2009-07-15 ソレクサ・インコーポレイテッド 分析物の系列的プロセシングのためのシステムおよび装置
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US20020034732A1 (en) 1997-07-30 2002-03-21 Daniel J. Capon Compositions and methods for determining anti-viral drug susceptibility and resistance and anti-viral drug screening
WO1999010485A1 (en) 1997-08-29 1999-03-04 Selective Genetics, Inc. Methods using phage display for selecting internalizing ligands for gene delivery
US6607878B2 (en) 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
US6329177B1 (en) * 1998-06-22 2001-12-11 Larova Biochemie Gmbh Enzymatic methods of preparing polymers from nucleotide and/or non-nucleotide monomers
US6846655B1 (en) 1998-06-29 2005-01-25 Phylos, Inc. Methods for generating highly diverse libraries
WO2000020639A1 (en) 1998-10-05 2000-04-13 Lynx Therapeutics, Inc. Enzymatic synthesis of oligonucleotide tags
US7479472B1 (en) 1998-10-19 2009-01-20 The Board Of Trustees Of The Leland Stanford Junior University DNA-templated combinatorial library chemistry
US5942609A (en) 1998-11-12 1999-08-24 The Porkin-Elmer Corporation Ligation assembly and detection of polynucleotides on solid-support
IL143238A0 (en) 1998-12-02 2002-04-21 Phylos Inc Dna-protein fusions and uses thereof
US6087112A (en) 1998-12-30 2000-07-11 Oligos Etc. Inc. Arrays with modified oligonucleotide and polynucleotide compositions
US7033753B1 (en) 1999-01-15 2006-04-25 University Of Rochester Compositions and methods for nonenzymatic ligation of oligonucleotides and detection of genetic polymorphisms
CA2403209A1 (en) 1999-04-08 2000-10-19 Pavel V. Sergeev Synthesis of biologically active compounds in cells
US7270969B2 (en) 1999-05-05 2007-09-18 Phylogica Limited Methods of constructing and screening diverse expression libraries
US6436665B1 (en) 1999-08-27 2002-08-20 Phylos, Inc Methods for encoding and sorting in vitro translated proteins
ATE363074T1 (de) 1999-09-14 2007-06-15 Xenoport Inc Substrate und screeningverfahren für transportproteine
CA2386239A1 (en) 1999-10-04 2001-04-12 University Of Medicine And Dentistry Of New Jersey Methods for identifying rna binding compounds
US6844324B1 (en) 1999-11-12 2005-01-18 Massachusetts Institute Of Technology Modular peptide mediated intracellular delivery system and uses therefore
US20010031475A1 (en) 2000-02-23 2001-10-18 Gallop Mark A. Self-encoded combinatorial synthesis of compound multiplets
US6936467B2 (en) * 2000-03-27 2005-08-30 University Of Delaware Targeted chromosomal genomic alterations with modified single stranded oligonucleotides
US7998673B2 (en) 2000-03-29 2011-08-16 Lgc Limited Hybridisation beacon and method of rapid sequence detection and discrimination
US6479262B1 (en) * 2000-05-16 2002-11-12 Hercules, Incorporated Solid phase enzymatic assembly of polynucleotides
US6994963B1 (en) 2000-07-10 2006-02-07 Ambion, Inc. Methods for recombinatorial nucleic acid synthesis
US20020072887A1 (en) 2000-08-18 2002-06-13 Sandor Szalma Interaction fingerprint annotations from protein structure models
US6627748B1 (en) 2000-09-11 2003-09-30 The Trustees Of Columbia University In The City Of New York Combinatorial fluorescence energy transfer tags and their applications for multiplex genetic analyses
EP2187317B1 (en) 2000-09-20 2012-12-05 ARKRAY, Inc. Client support system requesting a page of the manual in accordance with the status of a client
KR20040036676A (ko) 2000-10-27 2004-04-30 리서치 디벨럽먼트 파운데이션 시그날링 압타머의 시험관내 선별 방법
JP2002315577A (ja) 2000-11-14 2002-10-29 Gencom Co 核酸ライブラリーの作製方法
US20030049616A1 (en) 2001-01-08 2003-03-13 Sydney Brenner Enzymatic synthesis of oligonucleotide tags
AU2002306777C1 (en) 2001-03-19 2008-04-24 President And Fellows Of Harvard College Evolving new molecular function
WO2002102820A1 (en) 2001-06-20 2002-12-27 Nuevolution A/S Nucleoside derivatives for library preparation
JP2004535193A (ja) 2001-06-20 2004-11-25 ヌエヴォリューション・アクティーゼルスカブ 鋳型化された分子およびかかる分子の使用方法
US20060234231A1 (en) 2001-06-20 2006-10-19 Nuevolution A/S Microarrays displaying encoded molecules
US20030143561A1 (en) 2001-06-20 2003-07-31 Nuevolution A/S Nucleoside derivatives for library preparation
WO2003078445A2 (en) 2002-03-15 2003-09-25 Nuevolution A/S A building block forming a c=c double bond upon reaction
EA006965B1 (ru) 2002-03-08 2006-06-30 Айдгенёссише Текнише Хохшуле Цюрих Закодированные самособирающиеся химические библиотеки
AU2003253069A1 (en) 2002-03-15 2003-09-29 Nuevolution A/S A building block forming a c-c bond upon reaction
WO2003078446A2 (en) 2002-03-15 2003-09-25 Nuevolution A/S A building block forming a c-c or a c-hetero atom bond upon reaction
AU2003218630A1 (en) 2002-03-15 2003-09-29 Nuevolution A/S A building block capable of functional entity transfer to nucleophil
ATE414769T1 (de) 2002-03-15 2008-12-15 Nuevolution As Eine verbesserte methode zur synthese von matritzenabhängigen molekülen
AU2003240436A1 (en) 2002-06-20 2004-01-06 Nuevolution A/S Microarrays displaying encoded molecules
AU2003256587A1 (en) 2002-07-18 2004-02-09 The Board Of Trustees Of The Leland Stanford Junior University Detection of chemical ligation using fluorescence quenching leaving groups
WO2004009814A1 (en) 2002-07-23 2004-01-29 Nuevolution A/S Gene shuffling by template switching
WO2004013070A2 (en) 2002-08-01 2004-02-12 Nuevolution A/S Multi-step synthesis of templated molecules
AU2003263937B2 (en) 2002-08-19 2010-04-01 The President And Fellows Of Harvard College Evolving new molecular function
EP1539953A2 (en) 2002-09-12 2005-06-15 Nuevolution A/S Proximity-aided synthesis of templated molecules
LT2348125T (lt) 2002-10-30 2017-09-11 Nuevolution A/S Bifunkcinio komplekso sintezės būdas
ATE450609T1 (de) 2002-12-19 2009-12-15 Nuevolution As Durch quasizufallsstrukturen und funktionen geführte synthesemethode
US20060269920A1 (en) 2003-02-21 2006-11-30 Nuevolution A/S Method for obtaining structural information about an encoded molecule
WO2004074429A2 (en) 2003-02-21 2004-09-02 Nuevolution A/S Method for producing second-generation library
EP1608748B1 (en) 2003-03-20 2009-03-04 Nuevolution A/S Ligational encoding of small molecules
US20070134662A1 (en) 2003-07-03 2007-06-14 Juswinder Singh Structural interaction fingerprint
CN1836050A (zh) 2003-07-07 2006-09-20 单细胞系统公司 发夹标记的探针及其使用方法
EP1533385A1 (en) 2003-09-05 2005-05-25 Nuevolution A/S Templated compounds for generation of encoded molecules and directional methods using such compounds
US7365179B2 (en) 2003-09-09 2008-04-29 Compass Genetics, Llc Multiplexed analytical platform
US11118215B2 (en) 2003-09-18 2021-09-14 Nuevolution A/S Method for obtaining structural information concerning an encoded molecule and method for selecting compounds
US20050255491A1 (en) 2003-11-13 2005-11-17 Lee Frank D Small molecule and peptide arrays and uses thereof
KR101300315B1 (ko) 2003-12-17 2013-08-28 프래시스 파마슈티컬즈 인코포레이티드 코드된 라이브러리의 합성 방법
US7972994B2 (en) 2003-12-17 2011-07-05 Glaxosmithkline Llc Methods for synthesis of encoded libraries
US20050153321A1 (en) 2003-12-30 2005-07-14 Saba James A. Libraries of multiple-ligand-conjugated nucleic acids
JP2007521833A (ja) 2004-02-12 2007-08-09 コンパス ジェネティクス エルエルシー 配列特異的分類による遺伝的分析
EP1723255B1 (en) 2004-02-17 2010-12-29 Nuevolution A/S Method for enrichment involving elimination by mismatch hybridisation
DE602005017370D1 (de) 2004-03-22 2009-12-10 Nuevolution As Ligationscodierung unter verwendung von oligonukleotidbausteinen
US7405287B2 (en) 2004-08-03 2008-07-29 Board Of Regents, The University Of Texas System Method of treating a cancer
US7745614B2 (en) 2004-09-03 2010-06-29 The Board Of Trustees Of The Leland Stanford Junior University Universal linker compositions for the release or transfer of chemical agents from a polynucleotide
WO2006047791A2 (en) 2004-10-27 2006-05-04 The Board Of Trustees Of The Leland Stanford Junior University Dna-templated combinatorial library device and method for use
DK1809743T3 (da) 2004-11-08 2009-05-04 Vipergen Aps Strukturel nukleinsyre-styret kemisk syntese
US8168381B2 (en) 2004-11-22 2012-05-01 Peter Birk Rasmussen Template directed split and mix systhesis of small molecule libraries
CA2591582A1 (en) 2004-12-17 2006-06-22 Dynavax Technologies Corporation Methods and compositions for induction or promotion of immune tolerance
CN101090979A (zh) * 2004-12-22 2007-12-19 埃克斯魁恩公司 用于分析核酸混合物的探针、文库和试剂盒及其构建方法
WO2006079061A2 (en) 2005-01-21 2006-07-27 President And Fellows Of Harvard College Free reactant use in nucleic acid-templated synthesis
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US7407757B2 (en) 2005-02-10 2008-08-05 Population Genetics Technologies Genetic analysis by sequence-specific sorting
WO2006099604A2 (en) 2005-03-16 2006-09-21 Compass Genetics, Llc Methods and compositions for assay readouts on multiple analytical platforms
DK1910538T3 (da) 2005-06-09 2011-08-08 Praecis Pharm Inc Fremgangsmåder til syntese af kodede biblioteker
US20090035824A1 (en) 2005-06-17 2009-02-05 Liu David R Nucleic acid-templated chemistry in organic solvents
CA2616404A1 (en) 2005-07-26 2007-02-01 Oregon Health & Science University Nanoparticle probes for capture, sorting and placement of targets
WO2007016488A2 (en) 2005-07-29 2007-02-08 Ensemble Discovery Corporation Analysis of encoded chemical libraries
WO2007041201A2 (en) 2005-10-03 2007-04-12 Applera Corporation Compositions, methods, and kits for amplifying nucleic acids
JP2009513135A (ja) 2005-10-28 2009-04-02 プリーシス・ファーマシューティカルズ・インコーポレイテッド エンコードされたライブラリーを用いて興味のある化合物を同定する方法
DK2341140T3 (da) 2005-12-01 2017-11-06 Nuevolution As Fremgangsmåde til enzymatisk kodning ved effektiv syntese af store biblioteker
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
EP2021470A1 (en) 2006-05-03 2009-02-11 Vipergen APS A method for preparing compounds by nucleic acid directed synthesis
WO2008050661A1 (fr) 2006-10-26 2008-05-02 Sumitomo Chemical Company, Limited Procédé servant à produire un cristal de complexe asymétrique du cuivre
CN101219219B (zh) 2007-01-10 2013-02-13 北京普罗吉生物科技发展有限公司 包含血管抑素或其片段的复合物、其制备方法及应用
WO2009053679A1 (en) 2007-10-22 2009-04-30 Lgc Limited Oligonucleotides and uses thereof
US8481714B2 (en) 2007-11-19 2013-07-09 Japan Advanced Institute Of Science And Technology Light-responsive artificial nucleotide having photo-crosslinking ability
WO2009077173A2 (en) * 2007-12-19 2009-06-25 Philochem Ag Dna-encoded chemical libraries
US20120107840A1 (en) 2008-04-09 2012-05-03 Sru Biosystems, Inc Methods for Label Free Testing of Cells
JP4814904B2 (ja) 2008-04-16 2011-11-16 国立大学法人北陸先端科学技術大学院大学 核酸類の配列選択的な精製方法
CN102076851A (zh) * 2008-05-02 2011-05-25 Epi中心科技公司 Rna的选择性的5′连接标记
TW201011006A (en) 2008-06-16 2010-03-16 Nuevolution As IAP binding compounds
EP3629022A1 (en) 2008-07-25 2020-04-01 Richard W. Wagner Protein screening methods
CN102439043A (zh) 2009-01-30 2012-05-02 牛津纳米孔技术有限公司 杂交连接物
AU2010213497A1 (en) 2009-02-13 2011-08-25 X-Body, Inc. Identification of nucleic acid delivery vehicles using DNA display
EA035311B1 (ru) * 2009-02-13 2020-05-27 Икс-Чем, Инк. Способ маркировки днк-кодируемых химических библиотек
CN102317475B (zh) 2009-02-16 2014-07-16 阿霹震中科技公司 单链dna的不依赖模板的连接
JP5903379B2 (ja) 2009-07-06 2016-04-13 トリリンク バイオテクノロジーズ インコーポレイテッド 化学修飾リガーゼ補因子、ドナーおよびアクセプター
DE102009058769A1 (de) * 2009-12-16 2011-06-22 MagForce Nanotechnologies AG, 10589 Temperaturabhängige Aktivierung von katalytischen Nukleinsäuren zur kontrollierten Wirkstofffreisetzung
JP2013523095A (ja) 2010-03-26 2013-06-17 エックス−ボディ インコーポレイテッド 化合物ライブラリーをスクリーニングするための人工多能性細胞および他の細胞の使用法
SI2558577T1 (sl) 2010-04-16 2019-05-31 Nuevolution A/S Bifunkcionalni kompleksi in metode za pripravo in uporabo takšnih kompleksov
ES2926988T3 (es) 2011-03-15 2022-10-31 X Body Inc Métodos de cribado de anticuerpos
US8846883B2 (en) 2011-08-16 2014-09-30 University Of Southhampton Oligonucleotide ligation
BR112014005205A2 (pt) 2011-09-07 2017-03-21 X-Chem Inc métodos para etiquetar bibliotecas codificadas com dna
US11674135B2 (en) 2012-07-13 2023-06-13 X-Chem, Inc. DNA-encoded libraries having encoding oligonucleotide linkages not readable by polymerases
GB201322692D0 (en) 2013-12-20 2014-02-05 Philochem Ag Production of encoded chemical libraries

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6867290B2 (en) * 1999-04-30 2005-03-15 Cyclops Genome Sciences, Ltd. Modified polynucleotides and uses thereof
US20110104785A1 (en) * 2009-11-05 2011-05-05 Ramesh Vaidyanathan Methods and kits for 3'-end-tagging of rna

Also Published As

Publication number Publication date
JP2020176121A (ja) 2020-10-29
EP2748357A4 (en) 2015-04-15
AU2019200965A1 (en) 2019-02-28
JP2014528713A (ja) 2014-10-30
EP3351631A3 (en) 2018-08-29
EP3828271A1 (en) 2021-06-02
EP2748357B1 (en) 2018-04-04
CA2848023C (en) 2022-03-15
EP3351631B1 (en) 2020-11-04
CN103998658A (zh) 2014-08-20
EP3351631A2 (en) 2018-07-25
JP2018138590A (ja) 2018-09-06
AU2012304387A1 (en) 2014-03-20
EP2748357A1 (en) 2014-07-02
WO2013036810A1 (en) 2013-03-14
HK1258815A1 (zh) 2019-11-22
JP6674738B2 (ja) 2020-04-01
IN2014CN02574A (ko) 2015-06-26
AP2014007483A0 (en) 2014-03-31
CA2848023A1 (en) 2013-03-14
EA201490534A1 (ru) 2014-06-30
SG11201400374TA (en) 2014-09-26
KR102124613B1 (ko) 2020-06-19
IL231191B (en) 2022-02-01
US20140315762A1 (en) 2014-10-23
ES2675111T3 (es) 2018-07-06
KR102242879B1 (ko) 2021-04-20
MX2018013367A (es) 2021-11-16
US20210002630A1 (en) 2021-01-07
DK3351631T3 (da) 2021-01-18
AU2017201146A1 (en) 2017-03-09
IL231191A0 (en) 2014-04-30
KR20200074248A (ko) 2020-06-24
NZ621592A (en) 2016-08-26
EA032438B1 (ru) 2019-05-31
JP6703034B2 (ja) 2020-06-03
SG10201605812YA (en) 2016-09-29
IL279796A (en) 2021-01-31
AU2017201146B2 (en) 2019-02-28
AU2012304387B2 (en) 2017-03-16
US10865409B2 (en) 2020-12-15
AU2019200965B2 (en) 2021-01-28
ES2852073T3 (es) 2021-09-10
CA3077662A1 (en) 2013-03-14
NZ722289A (en) 2020-11-27
MX2014002854A (es) 2016-06-24
CN103998658B (zh) 2021-06-18
MX360438B (es) 2018-11-01
DK2748357T3 (en) 2018-07-16
BR112014005205A2 (pt) 2017-03-21

Similar Documents

Publication Publication Date Title
AU2019200965B2 (en) Methods for tagging DNA-encoded libraries
KR102270554B1 (ko) 폴리머라제에 의해 판독가능하지 않은 코딩 올리고뉴클레오티드 연결을 갖는 dna-코딩된 라이브러리
KR20170094445A (ko) Dna-코딩된 라이브러리에 태그부착하는 방법
NZ621592B2 (en) Methods for tagging dna-encoded libraries
NZ722289B2 (en) Methods for tagging dna-encoded libraries

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right