KR102550778B1 - 고-처리량 폴리뉴클레오타이드 라이브러리 시퀀싱 및 전사체 분석 - Google Patents

고-처리량 폴리뉴클레오타이드 라이브러리 시퀀싱 및 전사체 분석 Download PDF

Info

Publication number
KR102550778B1
KR102550778B1 KR1020197038441A KR20197038441A KR102550778B1 KR 102550778 B1 KR102550778 B1 KR 102550778B1 KR 1020197038441 A KR1020197038441 A KR 1020197038441A KR 20197038441 A KR20197038441 A KR 20197038441A KR 102550778 B1 KR102550778 B1 KR 102550778B1
Authority
KR
South Korea
Prior art keywords
delete delete
polynucleotide
barcoded
polynucleotides
cell
Prior art date
Application number
KR1020197038441A
Other languages
English (en)
Other versions
KR20200039623A (ko
Inventor
스테픈 제이콥 골드플레스
에이드리언 랭검 브릭스
라자고팰 채리
유에 지앙
로날드 하우스
프랑수와 비그놀트
Original Assignee
에이비비트로 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이비비트로 엘엘씨 filed Critical 에이비비트로 엘엘씨
Publication of KR20200039623A publication Critical patent/KR20200039623A/ko
Application granted granted Critical
Publication of KR102550778B1 publication Critical patent/KR102550778B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/159Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)

Abstract

본원에서, 단일 세포에서의 유전자 발현 분석과 관련된, 표적 유전자 시퀀싱 방법 및 단일 세포 바코딩 방법이 제공된다. 일부 구체예에서, 상기 표적 유전자는 면역 분자, 예컨대 항체 또는 TCR이다. 일부 구체예에서, 상기 방법은 전사체 시퀀싱, 예를 들어 RNA 시퀀싱을 수행하여 완전한 수용체 면역 수용체 서열과 페어링된 단일 세포의 전사체를 포착하여 세포의 면역 레퍼토리 및 전사체에 대한 정보를 결정할 수 있다. 또한, 전사체 분석 및 면역 분자, 예를 들어 항체 또는 TCR 시퀀싱을 수행하는데 사용하기 위한 폴리 뉴클레오타이드 라이브러리가 제공된다.

Description

고-처리량 폴리뉴클레오타이드 라이브러리 시퀀싱 및 전사체 분석
관련 출원에 대한 상호-참조
본 출원은 2017 년 5 월 26 일자로 출원된 "고-처리량 폴리뉴클레오타이드 라이브러리 시퀀싱 및 전사체 분석"이라는 제목의 미국 가출원 번호 62/511,949로부터의 우선권을 주장하며, 그 내용 전체가 참조로서 포함된다.
서열 목록의 참조로서의 포함
본 출원은 전자 형식의 서열 목록과 함께 출원된다. 서열 목록은 크기가 444,416 바이트인, 2018 년 5 월 25 일자로 생성된, 735042011740SeqList.txt라는 제목의 파일로서 제공된다. 서열 목록의 전자적 형식 정보는 그 전체가 참조로서 포함된다.
분야
본 발명은 단일 세포에서의 유전자 발현의 분석과 관련된 표적 유전자 시퀀싱 방법 및 단일 세포 바코딩 방법에 관한 것이다. 일부 구체예에서, 상기 표적 유전자는 면역 분자, 예컨대 항체 또는 TCR이다. 일부 구체예에서, 상기 방법은 전사체 시퀀싱, 예를 들어 RNA 시퀀싱을 수행하여 완전한 수용체 면역 수용체 서열과 페어링된 단일 세포의 전사체를 포착하여 세포의 면역 레퍼토리 및 전사체에 대한 정보를 결정할 수 있다. 본 발명은 또한 전사체 분석 및 면역 분자, 예를 들어 항체 또는 TCR의 시퀀싱을 수행하는데 사용하기 위한 폴리뉴클레오타이드 라이브러리에 관한 것이다.
배경
세포 또는 조직의 전사체 양의 결정 (즉, "유전자 발현 프로파일링")은 세포 또는 조직의 "상태"에 대한 특성화 정보를 제공하거나 세포의 하위 집단의 특성을 동정하는 것을 포함하여, 정상 및 병든 세포 또는 조직의 기능적 분석 방법을 제공한다. 단일 세포 전사체 시퀀싱을 위한 기존 도구는 그 처리량 (throughput)이 제한되고 및/또는 전장 면역 수용체 서열을 포착할 수 없다. 따라서, 개선된 방법이 필요하다. 그러한 요구를 충족시키는 방법 및 조성물이 제공된다.
요약
그 집합체가 실질적으로 하나의 세포 또는 복수 개 세포의 전사체 또는 게놈을 나타내는 것인, 다수의 바코딩된 폴리뉴클레오타이드 서열을 동시-생성 (co-generating)하면서, 하나 이상의 전장 바코딩된 표적 폴리뉴클레오타이드 서열 또는 그의 선택된 단편이 생성되는, 개별 세포 또는 복수 개 세포로부터의 폴리뉴클레오타이드 라이브러리를 제조하는 방법이 제공된다. 바코딩은 동일한 세포로부터의 폴리뉴클레오타이드의 발현 또는 존재의 분석 및 정량화를 허용한다. 또한, 본원의 방법에 의해 생성된 폴리뉴클레오타이드 라이브러리가 제공된다. 또한, 단일 세포 또는 다수의 세포로부터의 전사체 분석 방법 및 전사체 분석을 표적 서열(들)의 분석과 조합하는 방법이 제공된다.
일부 구체예에서, 상기 방법은 폴리뉴클레오타이드 라이브러리를 생성하는 단계를 포함하며, 이는 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 부착된 제1 어댑터와 대향하는 말단에서 또는 말단 근처에서 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 제2 어댑터를 부가하는 단계를 포함하고, 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드는: (i) 세포 집단 중의 하나의 세포에 존재하는, 하나 이상의 표적 폴리뉴클레오타이드(들) 또는 그의 상보체(들)의 앰플리콘을 포함하는, 하나 이상의 표적 단일-가닥 폴리뉴클레오타이드(들); 및 (ii) 세포 내에서, 각각이 폴리뉴클레오타이드 또는 그의 상보체의 앰플리콘을 함유하는 단일-가닥 폴리뉴클레오타이드의 집합을 함유하고; 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 세포 집단의 동일한 세포로부터의 (i) 및 (ii)로부터의 모든 폴리뉴클레오타이드에 대해 동일한 용기 바코드 (vessel barcode)를 포함한다.
일부 구체예에서, 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드는 세포 집단에서 복수 개의 세포의 (i) 및 (ii)의 폴리뉴클레오타이드를 포함한다. 일부 구체예에서, 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드는 각각의 단일-가닥 폴리뉴클레오타이드 또는 이의 증폭된 생성물에 고유한 분자 바코드를 더 함유한다.
일부 구체예에서, 세포 집단의 각 세포로부터의 단일-가닥 폴리뉴클레오타이드의 집합체는, 집합적으로, 전사체 또는 부분적 전사체의 상보적 DNA (cDNA) 가닥을 함유한다. 일부 구체예에서, 상기 전사체 또는 부분적 전사체는, 집합적으로, 상기 세포의 게놈에 존재하는 전사물의 적어도 60%, 70%, 75%, 80%, 85% 90% 95%, 96%, 97%, 98%, 99% 또는 100%를 함유한다.
본 방법의 일부 구체예에서, 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 (약) 50 개 이상의 염기쌍, 100 개 이상의 염기쌍 또는 200 개 이상의 염기쌍의 크기를 갖는다. 일부 구체예에서, 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 (약) 50 개의 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp의 크기를 갖는다.
본 방법의 일부 구체예에서, 제2 어댑터는 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드를 함유하는 균질 혼합물에 부가된다.
일부 구체예에서, 제1 어댑터는 용기 바코드를 함유한다.
폴리뉴클레오타이드 라이브러리를 생성하는 방법의 일부 구체예에서, 상기 방법은: (a) 복수 개의 각각의 용기 내의 세포를 용해시키는 단계로서, 상기 용기 각각은 세포 집단을 함유하는 샘플로부터의 세포를 함유하는 것인 단계; (b) 각각의 용기에서, 복수 개의 상보적 폴리뉴클레오타이드를 생산하는 단계로서, 상기 복수 개의 상보적 폴리뉴클레오타이드의 생산은 (i) 하나 이상의 표적-특이적 프라이머를 사용하여 상기 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드(들)에 상보적인 하나 이상의 표적 폴리뉴클레오타이드(들)을 생산하는 것; 및 (ii) 그 각각이 상기 세포 내 폴리뉴클레오타이드에 상보적인 것인, 폴리뉴클레오타이드의 집합체를 생산하는 것을 포함하는 것인, 단계를 포함한다. 일부 구체예에서, (ii)에서 폴리뉴클레오타이드의 집합체는 무작위 및/또는 축퇴 및/또는 비-특이적 올리고 프라이머를 사용하여 생성된다. 일부 구체예에서, (ii)에서 폴리뉴클레오타이드의 집합체는 올리고 dT 프라이머를 사용하여 생성된다.
일부 구체예에서, 상기 용기 각각은 복수 개의 분자 바코딩된 올리고뉴클레오타이드, 용기 바코딩된 올리고뉴클레오타이드의 풀, 및 임의로 제1 어댑터를 더 포함하고, 상기 방법은: (c) 복수 개의, 임의로 복수 개 중의 각각의, 상보적 폴리뉴클레오타이드에 복수 개의 분자 바코딩된 올리고뉴클레오타이드 중 하나를 부착시켜, 그에 의하여 복수 개의 바코딩된 폴리뉴클레오타이드, 예컨대 분자 바코딩된 폴리뉴클레오타이드를 생성하는 단계로서, 이들 각각은 분자 바코드를 함유하며, 여기서 임의로 상기 분자 바코드는 상기 복수 개 내 다른 바코딩된 폴리뉴클레오타이드에 의하여 함유된 분자 바코드와는 구별되고 및/또는 고유한 분자 바코드인 단계; (d) 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀 또는 이의 증폭된 생성물 중 하나를, 복수 개의, 임의로 각각의, 상기 바코딩된 폴리뉴클레오타이드에 부착시켜, 그에 의하여 복수 개의 이중-바코딩된 폴리뉴클레오타이드를 생성하는 단계로서, 여기서 동일한 용기 내 상기 이중-바코딩된 폴리뉴클레오타이드 각각은 동일한 용기 바코드를 함유하는 것인 단계를 더 포함한다. 일부 구체예에서, 단계 (d)는 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀 또는 이의 증폭 된 생성물 중 하나, 및 제1 어댑터 또는 제1 어댑터의 풀 중 하나 또는 이의 증폭 된 생성물을, 복수 개의, 임의로 각각의, 상기 분자 바코딩된 폴리뉴클레오타이드에 부착시켜, 그에 의하여 복수 개의 이중-바코딩된 폴리뉴클레오타이드, 임의로 단일-가닥 이중-바코딩된 폴리뉴클레오타이드를 생성하는 단계를 포함하고, 상기 이중-바코딩된 폴리뉴클레오타이드 각각은 분자 바코드 및 용기 바코드를 포함하고, 여기서 동일 용기 내 이중-바코딩된 폴리뉴클레오타이드 각각은 동일한 용기 바코드를 포함한다.
일부 구체예에서, 상기 방법은 (e) 복수 개의, 임의로 각각의, 상기 복수 개의 이중-바코딩된 폴리뉴클레오타이드의 단일-가닥 앰플리콘을 생성하는 단계 및/또는 (f) 상기 단일-가닥 앰플리콘 각각에 제2 어댑터를 부가하여, 그에 의하여 상기 어댑터를 이중-바코딩된 단일-가닥 폴리뉴클레오타이드에 부가하는 단계로서, 여기서 상기 제1 어댑터 및 제2 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드 각각의 반대 말단에 또는 그 근처에 존재하는 것인 단계를 더 포함한다.
일부 구체예에서, 폴리뉴클레오타이드 라이브러리를 생성하는 상기 방법은: (a) 복수 개의 용기 각각 내의 세포를 용해시키는 단계로서, 상기 용기 각각은 세포 집단을 함유하는 샘플로부터의 세포, 복수 개의 분자 바코딩된 올리고뉴클레오타이드, 및 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀, 및, 임의로 제1 어댑터 또는 제1 어댑터의 풀을 함유하는 것인 단계; (b) 각 용기에서, 복수 개의 상보적인 폴리뉴클레오타이드를 생성하는 단계로서, 상기 복수 개를 생성하는 것은, (i) 상기 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드(들)에 상보적인 하나 이상의 표적 폴리뉴클레오타이드(들)를 생성하는 것; 및 (ii) 각각이 상기 세포 내 폴리뉴클레오타이드에 개별적으로 상보적인 폴리뉴클레오타이드의 집합체를 생성하는 것을 포함하는 것인 단계; (c) 각각의 상보적인 폴리뉴클레오타이드에 복수 개의 분자 바코딩된 올리고뉴클레오타이드 중 하나를 부착시켜, 그에 의하여 각각이 고유한 분자 바코드를 함유하는 복수 개의 바코딩된 폴리뉴클레오타이드를 생성하는 단계; (d) 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀, 또는 이의 증폭된 생성물 중 하나, 및 상기 제1 어댑터 또는 제1 어댑터의 풀 중 하나, 또는 이의 증폭된 생성물을, 상기 바코딩된 폴리뉴클레오타이드 각각에 부착시켜, 그에 의하여 복수 개의 이중-바코딩된 폴리뉴클레오타이드, 임의로 단일-가닥 이중-바코딩된 폴리뉴클레오타이드를 생성하는 단계로서, 여기서 상기 이중-바코딩된 폴리뉴클레오타이드 각각은 분자 바코드 및 용기 바코드를 포함하고, 동일 용기 내의 상기 이중-바코딩된 폴리뉴클레오타이드 각각은 동일한 용기 바코드를 포함하는 것인 단계; 및 (e) 상기 복수 개의 이중-바코딩된 폴리뉴클레오타이드 각각의 단일-가닥 앰플리콘을 생성하는 단계; 및 (f) 상기 단일-가닥 앰플리콘 각각에 제2 어댑터를 부가하여, 그에 의하여 상기 제2 어댑터를 이중-바코딩된 단일-가닥 폴리뉴클레오타이드에 부가하는 단계로서, 여기서 상기 제1 어댑터 및 제2 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드 각각의 반대 말단에 또는 그 근처에 존재하는 것인 단계를 포함한다.
일부 구체예에서, 상기 어댑터, 예컨대 상기 제1 어댑터는 상기 용기 바코딩된 올리고뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 용기 바코딩된 올리고뉴클레오타이드는 상기 제1 어댑터를 함유한다. 일부 구체예에서, 상기 세포 집단의 각각의 세포로부터의 폴리뉴클레오타이드의 집합체는, 집합적으로, 세포의 전사체 또는 부분적인 전사체의 전사물에 상보적인 서열을 함유한다. 일부 구체예에서, 상기 전사체 또는 부분적인 전사체는 상기 세포의 게놈에 존재하는 상기 전사물의 최소 60%, 70%, 75%, 80%, 85% 90% 95%, 96%, 97%, 98%, 99% 또는 100%를 함유한다.
일부 구체예에서, 세포 내 상기 하나 이상의 표적 폴리뉴클레오타이드(들) 및/또는 폴리뉴클레오타이드는 DNA이다. 일부 구체예에서, (i)로부터의 상기 하나 이상의 표적 폴리뉴클레오타이드(들) 및/또는 (ii)로부터의 상기 폴리뉴클레오타이드는, 이들로부터 상기 (i)의 앰플리콘 및/또는 상기 (ii)의 앰플리콘이 유래하는 것인데, DNA이다. 일부 구체예에서, 세포 내 상기 하나 이상의 표적 폴리뉴클레오타이드(들) 및/또는 상기 폴리뉴클레오타이드는 RNA, 예컨대 mRNA이다. 일부 구체예에서, (i)로부터의 상기 하나 이상의 표적 폴리뉴클레오타이드(들) 및/또는 (ii)로부터의 상기 폴리뉴클레오타이드는, 이들로부터 상기 (i)의 앰플리콘 및/또는 상기 (ii)의 앰플리콘이 유래하는 것인데, RNA, 예컨대 mRNA이다.
일부 구체예에서, 각각의 또는 하나 이상의 (b)의 상보적인 폴리뉴클레오타이드는 cDNA이다. 일부 구체예에서, 각각의 또는 하나 이상의 상기 바코딩된 단일-가닥 폴리뉴클레오타이드(들)은 cDNA의 가닥이다.
상기 방법의 일부 구체예에서, 상기 제1 어댑터 및/또는 제2 어댑터는 하나 이상의 범용 프라이밍 부위를 함유한다. 일부 구체예에서, 상기 제1 어댑터 및 제2 어댑터는 상이하고; 및/또는 상기 제1 어댑터는 제1 범용 프라이밍 부위를 함유하고 상기 제2 어댑터는 제2 범용 프라이밍 부위를 함유하며, 여기서 임의로 상기 제1 범용 프라이밍 부위 및 제2 범용 프라이밍 부위는 상이하다. 일부 구체예에서, 상기 제1 범용 프라이밍 부위 및/또는 제2 범용 프라이밍 부위는 P7 프라이밍 부위 (C7) 또는 이의 인접 부분 또는 P5 프라이밍 부위 또는 이의 인접 부분이거나 이들을 함유하며, 여기서 임의로 이들의 상기 인접 부분은 상보적 서열에 어닐링하기에 충분하다. 일부 구체예에서, 상기 제1 범용 프라이밍 부위는 상기 P7 프라이밍 부위 (C7) 또는 이의 인접 부분이거나 이를 함유하고, 상기 제2 범용 프라이밍 부위는 상기 P5 프라이밍 부위 (C5) 또는 이의 인접 부분이거나 이를 함유한다. 일부 구체예에서, 상기 P7 프라이밍 부위 (C7)은 서열 AGATCGGAAGAGCACACGTCTGAACTCCA (SEQ ID NO:77)을 함유하거나, 이의 인접 부분이다. 일부 구체예에서, 상기 P5 프라이밍 부위는 서열 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCC GTATCATT (SEQ ID NO:78)을 함유하거나, 이의 인접 부분이다. 일부 구체예에서, 상기 인접 부분은 길이 (약) 15, 20, 25 또는 30 개 이상의 뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 P5 프라이밍 부위는 SEQ ID NO:25 (AGATCGGAAGAGCGTCGTGT)에 기재된 인접 부분이다.
일부 구체예에서, 상기 제2 어댑터를 부가하는 것은 제2 범용 프라이밍 부위를 포함하는 올리고뉴클레오타이드의 존재 하에서 상기 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 스플린트 올리고뉴클레오타이드 (splint oligonucleotide)를 혼성화하는 것을 포함하고, 여기서, 상기 스플린트 올리고뉴클레오타이드는 (i) 상기 제2 범용 프라이밍 부위에 상보적인 서열 및 (ii) 상기 바코딩된 단일-가닥 폴리뉴클레오타이드의 3' 말단에 무작위로 어닐링할 수 있는 축퇴 오버행 (overhang) 서열을 함유한다. 일부 경우에, 상기 혼성화 전에, 상기 슬를린트 올리고뉴클레오타이드 및 상기 제2 범용 프라이밍 부위를 함유하는 올리고뉴클레오타이드는 어닐링되어 스플린트-어댑터 이중체를 형성한다. 일부 측면에서, 상기 축퇴 오버행 서열은 서열 (N)3-12을 함유하고, 여기서 N은 임의의 뉴클레오타이드이다.
임의의 이러한 구체예 중 일부에서, 상기 축퇴 오버행 서열은 서열 NNNNNN을 함유하고, 여기서 N은 임의의 뉴클레오타이드이다 (SEQ ID NO:24). 일부 구체예에서, 상기 스플린트 올리고뉴클레오타이드는 서열 ACACGACGCTCTTCCGATCTNNNNNN을 함유하고, 여기서 N은 임의의 아미노산이다 (SEQ ID NO:26). 임의의 이러한 구체예 중 일부에서, 상기 제2 범용 프라이밍 부위를 함유하는 상기 올리고뉴클레오타이드는 서열 AGATCGGAAGAGCGTCGTGT를 함유한다 (SEQ ID NO:25).
임의의 이러한 구체예 중 일부에서, 상기 용기 바코딩된 올리고뉴클레오타이드는 (약) 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40 또는 50 개 이상의 뉴클레오타이드를 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 용기 바코딩된 올리고뉴클레오타이드는 (약) 10 내지 30 개 뉴클레오타이드부터 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 용기 바코딩된 올리고뉴클레오타이드는 축퇴 서열을 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 용기 바코딩된 올리고뉴클레오타이드는 서열 (N)14-17을 함유하고, 여기서 N은 임의의 뉴클레오타이드이고, 여기서 임의로 상기 서열에서 최소 1 또는 2 개의 N은 W이고, 여기서 W는 아데닌 또는 티민이다. 임의의 이러한 구체예 중 일부에서, 상기 용기 바코딩된 올리고뉴클레오타이드는 서열 NNNNWNNNNWNNNN (SEQ ID NO:80), WNNNNWNNNNWNNNN (SEQ ID NO:81), NWNNNWNNNNWNNNN (SEQ ID NO:82) 또는 NNWNNNNWNNNNWNNNN (SEQ ID NO:83)을 함유하고, 여기서 N은 임의의 뉴클레오타이드이고, W는 아데닌 또는 티민이다.
임의의 이러한 구체예 중 일부에서, 각각의 용기은 제1 어댑터의 풀을 함유하고, 여기서 제1 어댑터의 상기 풀의 각각의 용기 바코딩된 올리고뉴클레오타이드는 상기 풀 내의 다른 용기 바코딩된 올리고뉴클레오타이드 중 적어도 하나와 비교하여, 적어도 하나의 염기-시프트 또는 염기 첨가를 함유한다. 임의의 이러한 구체예 중 일부에서, 제1 어댑터의 상기 풀의 상기 용기 바코딩된 올리고뉴클레오타이드는 서열 NNNNWNNNNWNNNN (SEQ ID NO:80), WNNNNWNNNNWNNNN (SEQ ID NO:81), NWNNNWNNNNWNNNN (SEQ ID NO:82) 및 NNWNNNNWNNNNWNNNN (SEQ ID NO:83)을 함유하고, 여기서 N은 임의의 뉴클레오타이드이고, W는 아데닌 또는 티민이다.
임의의 이러한 구체예 중 일부에서, 단계 (d)에서, 상기 방법은 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 그의 풀 또는 상기 제1 어댑터 중 하나 또는 그의 풀을 증폭하는 단계를 더 포함하고, 여기서 상기 제1 어댑터는 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 그의 풀을 포함하고, 여기서 상기 증폭은 상기 용기 바코딩된 올리고뉴클레오타이드를 상기 분자 바코딩된 폴리뉴클레오타이드에 부착하기 전 또는 그와 동시에 수행된다. 일부 구체예에서, 상기 용기 바코딩된 올리고뉴클레오타이드를 부착하는 것은 상기 용기 바코딩된 올리고뉴클레오타이드의 한 영역을 상기 상보적인 폴리뉴클레오타이드 각각의 영역에 또는 분자 바코드를 함유하는 상기 분자 바코딩된 폴리뉴클레오타이드 각각의 영역에 혼성화하는 것을 포함한다. 일부 경우에, 상기 영역은 상기 바코딩된 폴리뉴클레오타이드의 상기 분자 바코드의 3' 말단 영역에 상보적인 3' 태깅 폴리뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 영역은 상기 분자 바코딩된 올리고뉴클레오타이드의 5' 말단 영역에 상보적인 3' 태깅 폴리뉴클레오타이드를 함유한다.
임의의 이러한 구체예 중 일부에서, 단계 (b)에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 역전사 효소 및 상기 표적 폴리뉴클레오타이드(들의 표적 서열에 상보적인 하나 이상의 표적-특이적 프라이머(들)의 존재 하에서 상기 표적 폴리뉴클레오타이드(들)의 역전사에 의하여 생성되고; 및/또는 상기 폴리뉴클레오타이드의 집합체는 상기 세포 내 역전사 효소 및 폴리뉴클레오타이드, 예컨대 폴리뉴클레오타이드 전사물에 상보적인 하나 이상의 전사체 프라이머의 존재 하에서, 상기 세포 내 폴리뉴클레오타이드, 예컨대 폴리뉴클레오타이드 전사물의 역전사에 의하여 생성된다.
임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 면역 분자 또는 이의 사슬의 폴리뉴클레오타이드를 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 적어도 2 개의 표적 포리뉴클레오타이드를 함유하고, 각각은 면역 분자 사슬의 폴리뉴클레오타이드를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 TCR 또는 이의 사슬의 폴리뉴클레오타이드를 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드는 T-세포 수용체 알파 (TCRα)의 제1 폴리뉴클레오타이드 및 T-세포 수용체 (TCRβ)의 제2 폴리뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 T-세포 수용체 감마 (TCRγ)의 제1 폴리뉴클레오타이드 및 T-세포 수용체 델타 (TCR델타)의 제2 폴리뉴클레오타이드를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 항체 또는 이의 사슬의 폴리뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 중쇄 면역글로불린 (IgH) 폴리뉴클레오타이드의 제1 폴리뉴클레오타이드 및 경쇄 면역글로불린 (IgL) 폴리뉴클레오타이드의 제2 폴리뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 하나 이상의 표적-특이적인 프라이머 및/또는 상기 하나 이상의 전사체 프라이머는 폴리 (T) 서열을 포함한다.
임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 전사체 프라이머는 무작위의 6량체 올리고뉴클레오타이드 프라이머의 혼합물을 함유한다. 일부 구체예에서, 상기 하나 이상의 표적-특이적 프라이머는 상기 표적 폴리뉴클레오타이드의 표적 서열(들)의 서열(들)에 상보적인 하나 이상의 프라이머를 함유한다. 일부 경우에, 상기 하나 이상의 표적-특이적 프라이머는 적어도 2 개의 프라이머, 예컨대 제1 프라이머 및 제2 프라이머를 함유한다. 일부 구체예에서, 상기 하나 이상의 표적-특이적 프라이머는 각각이 면역 분자 또는 이의 사슬을 인코딩하는 복수 개의 표적 폴리뉴클레오타이드의 표적 서열에 대한 프라이머를 함유한다. 일부 측면에서, 상기 면역 분자는 T 세포 수용체 또는 항체이다.
임의의 이러한 구체예 중 일부에서, 적어도 상기 제1 프라이머는 면역 분자의 제1 사슬의 폴리뉴클레오타이드의 표적 서열에 대하여 상보적이고, 제2 프라이머는 상기 면역 분자의 제2 사슬의 폴리뉴클레오타이드의 표적 서열에 상보적이다. 일부 구체예에서, 상기 제1 및 제2 프라이머는 TCR의 서로 다른 TCR 사슬 폴리뉴클레오타이드의 표적 서열에 상보적이다.
임의의 이러한 구체예 중 일부에서, 상기 제1 프라이머는 TCR알파 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고, 상기 제2 프라이머는 TCR베타 폴리뉴클레오타이드 서열의 표적 서열에 상보적이거나; 또는 상기 제1 프라이머는 TCR감마 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고 상기 제2 프라이머는 TCR델타 폴리뉴클레오타이드 서열의 표적 서열에 상보적이다. 일부 측면에서, 상기 TCR 사슬 폴리뉴클레오타이드의 상기 표적 서열은 불변 영역 서열이다.
임의의 이러한 구체예 중 일부에서, 상기 제1 프라이머는 TCR알파 불변 영역 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고, 상기 제2 프라이머는 TCR베타 불변 영역 폴리뉴클레오타이드 서열의 표적 서열에 상보적이거나; 또는 상기 제1 프라이머는 TCR감마 불변 영역 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고, 상기 제2 프라이머는 TCR델타 불변 영역 폴리뉴클레오타이드 서열의 표적 서열에 상보적이다. 일부 구체예에서, 적어도 상기 제1 및 제2 프라이머는 항체의 서로 다른 항체 사슬 폴리뉴클레오타이드의 표적 서열에 상보적이다. 일부 구체예에서, 상기 제1 프라이머는 중쇄 면역글로불린 (IgH) 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고, 상기 제2 프라이머는 경쇄 면역글로불린 (IgL) 폴리뉴클레오타이드 서열의 표적 서열에 상보적이다. 일부 구체예에서, 상기 항체 사슬 폴리뉴클레오타이드의 표적 서열은 불변 영역 서열이다.
임의의 이러한 구체예 중 일부에서, 상기 제1 프라이머는 중쇄 불변 영역 (CH) 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고, 상기 제2 프라이머는 경쇄 불변 영역 (CL) 폴리뉴클레오타이드 서열의 표적 서열에 상보적이다. 일부 경우에, 상기 CH 폴리뉴클레오타이드의 표적 서열은 IgM, IgD, IgA, IgE 또는 IgG, 또는 이의 조합으로부터 유래하고; 및/또는 상기 CL 폴리뉴클레오타이드 서열의 표적 서열은 Ig카파, Ig람다 또는 이의 조합으로부터 유래한다.
임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 전장 코딩 서열을 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들) 및 상기 폴리뉴클레오타이드의 집합체는 동일한 반응 부피로 용기 내에서 생성된다.
상기 방법의 임의의 이러한 구체예 중 일부에서, 단계 (b)에서, 상기 복수 개의 상보적 폴리뉴클레오타이드를 생성하는 것은 비-주형 말단 전이효소의 사용을 포함하고, 여기서 3 개 이상의 비-주형 뉴클레오타이드, 리보뉴클레오타이드 또는 이의 유사체가 각각의 생성되는 상보적 폴리뉴클레오타이드의 3' 말단에 첨가된다. 일부 경우에서, 상기 비-주형 말단 전이효소는 역전사효소 또는 중합효소이다. 일부 측면에서, 상기 비-주형 말단 전이 효소는 역전사 효소이고, 여기서 상기 역전사 효소는 수퍼스크립트 II 역전사 효소, 맥시마 역전사 효소, 프로토스크립트 II 역전사 효소, 말로니 뮤린 백혈병 바이러스 역전사 효소 (MMLV-RT), 하이스크라이버 역전사 효소, 조류 골수아세포증 바이러스 (AMV) 역전사 효소, 말단 데옥시뉴클레오티딜 전이 활성을 포함하는 임의의 역전사 효소, 및 이의 조합 중에서 선택된다.
상기 방법의 임의의 이러한 구체예 중 일부에서, 단계 (c)에서, 상기 부착은 상기 복수 개의 분자 바코딩된 올리고뉴클레오타이드 중 하나의 영역을 상기 상보적 폴리뉴클레오타이드 각각의 상기 3 개 이상의 비-주형 뉴클레오타이드에 혼성화하는 것을 포함한다. 일부 구체예에서, 상기 복수 개의 분자 바코딩된 올리고뉴클레오타이드는 각각이 상기 3 개 이상의 비-주형 뉴클레오타이드에 상보적인 3' 부분을 포함하는 복수 개의 주형 스위치 올리고뉴클레오타이드로서 제공된다. 일부 경우에, 상기 주형 스위치 올리고뉴클레오타이드는 상기 용기 바코드를 포함하는 제1 어댑터의 3' 태깅 폴리뉴클레오타이드에 상보적인 5' 말단 영역을 더 포함한다. 일부 경우에, 상기 주형 스위치 올리고뉴클레오타이드는 상기 제1 어댑터의 부분에 상보적인 5' 말단 영역을 더 포함하고, 여기서 상기 제1 어댑터는 상기 용기 바코딩된 올리고뉴클레오타이드를 포함한다.
임의의 이러한 구체예 중 일부에서, 상기 역전사 효소는 주형 스위칭 활성을 가지며; 상기 복수 개의 생성된 상보적 폴리뉴클레오타이드의 적어도 일부 가닥은 3 개 이상의 비-주형 뉴클레오타이드를 함유하는 3' 오버행을 함유하고; 상기 복수 개의 분자 바코딩된 올리고뉴클레오타이드는 각각이 (1) 상기 제1 어댑터 및 상기 용기 바코딩된 올리고뉴클레오타이드를 포함하는 3' 태깅 올리고뉴클레오타이드에 상보적인 5' 말단 영역, (2) 상기 분자 바코드 및 (3) 상기 3' 오버행의 상기 3 개 이상의 비-주형 뉴클레오타이드에 상보적인 3' 부분을 함유하는 복수 개의 주형 스위치 올리고뉴클레오타이드로서 제공되고; 및 상기 주형 스위치 올리고뉴클레오타이드는 상기 역전사 효소에 대한 주형으로 작용하여 그로써, 상기 분자 바코드는 각각의 상보적인 폴리뉴클레오타이드 내로 혼입되어 상기 분자 바코딩된 폴리뉴클레오타이드를 생성한다.
임의의 이러한 구체예 중 일부에서, 상기 3 개 이상의 비-주형 뉴클레오타이드에 상보적인 상기 3' 부분은 뉴클레오타이드, 리보뉴클레오타이드 또는 이의 유사체를 포함한다. 임의의 이러한 구체예 중 일부에서, 상기 3 개 이상의 비-주형 뉴클레오타이드는 3 개 이상의 C 뉴클레오타이드를 포함하고, 상기 3 개 이상의 비-주형 뉴클레오타이드에 상보적인 상기 3' 부분은 하나 이상의 G 뉴클레오타이드 또는 리보뉴클레오타이드 또는 이의 유사체를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 주형 스위치 올리고뉴클레오타이드는 역전사 효소 또는 DNA 중합효소에 의하여 상기 주형 스위치 올리고뉴클레오타이드의 연장을 차단하는 3' 변형된 뉴클레오타이드를 더 함유한다. 일부 경우에, 상기 변형은 상기 3' 말단 뉴클레오타이드의 데옥시, 포스페이트, 아미노 또는 알킬 변형이다.
상기 방법의 임의의 이러한 구체예 중 일부에서, 단계 (d)는 상기 부착 후 상기 복수 개의 상보적 폴리뉴클레오타이드 각각을 연장하는 것을 더 포함한다. 일부 구체예에서, 단계 (d)는 상기 복수 개의 이중-바코딩된 폴리뉴클레오타이드를 생성하기 위한 상기 부착 후 상기 복수 개의 분자 바코딩된 폴리뉴클레오타이드 각각을 연장하는 것을 더 포함한다.
임의의 이러한 구체예 중 일부에서, 상기 용기은 웰, 에멀젼, 액적 (droplet) 또는 마이크로캡슐이다.
임의의 이러한 구체예 중 일부에서, 상기 방법은, 단계 (e) 전에, 상기 복수 개의 용기 중 2 이상의 컨텐츠 (contents)를 조합하여, 그에 의하여 상기 복수 개의 이중-바코딩된 단일-가닥 폴리뉴클레오타이드 중 2 이상을 포함하는 균질 혼합물을 생성하는 단계를 포함한다. 일부 측면에서, 상기 복수 개의 용기의 컨텐츠를 조합하는 것은 상기 복수 개의 용기 중 2 이상을 부수고 상기 2 이상의 부서진 용기로부터 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드를 풀화하는 것 (pooling)을 포함한다.
일부 구체예에서, 상기 방법은, 단계 (e) 전에, (약) 50 개 염기쌍보다 큰, 100 개 염기쌍보다 큰, 또는 200 개 염기쌍보다 큰 크기를 갖는 이중-바코딩된 단일-가닥 폴리뉴클레오타이드를 선별하거나 정제하는 단계를 포함한다. 일부 구체예에서, 상기 방법은, 단계 (e) 전에, (약) 50 개 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp 크기를 갖는 이중-바코딩된 단일-가닥 폴리뉴클레오타이드를 선별하거나 정제하는 단계를 포함한다.
임의의 이러한 구체예 중 일부에서, 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드는 순서대로 (5'에서 3'으로): 제1 어댑터, 용기 바코드, 분자 바코드 및 제2 어댑터를 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 제1 어댑터는 상기 단일-가닥 바코딩된 폴리뉴클레오타이드, 임의로 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드의 5' 영역에 또는 그 근처에 위치한다. 임의의 이러한 구체예 중 일부에서, 상기 제2 어댑터는 상기 단일-가닥 바코딩된 폴리뉴클레오타이드, 임의로 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드의 3' 영역에 또는 그 근처에 위치한다.
상기 방법의 임의의 이러한 구체예 중 일부에서, 단계 (a)-(f) 중 하나 이상은 용액 내에서 수행되고 및/또는 고체 기재, 임의로 상기 기재가 비드인 고체 기재의 존재 하에서 수행되지 않는다. 임의의 이러한 구체예 중 일부에서, 적어도 단계 (c) 및 (d)는 용액 내에서 수행되고 및/또는 고체 기재, 임의로 상기 기재가 비드인 고체 기재의 존재 하에서 수행되지 않는다. 일부 구체예에서, 단계 (a)-(e) 각각은 용액 내에서 수행되고 및/또는 고체 기재, 임의로 상기 기재가 비드인 고체 기재의 존재 하에서 수행되지 않는다.
임의의 이러한 구체예 중 일부에서, 상기 세포 집단은 적어도 (약) 1x103, 5x103, 1x104, 5x104, 1x105, 5x105, 1x106, 또는 5x106 세포를 함유한다. 일부 구체예에서, 상기 세포 집단은 대상체의 생물학적 샘플로부터 유래한다. 일부 구체예에서, 상기 생물학적 샘플은 전혈 샘플, 버피 코트 샘플, 말초 혈액 단핵 세포 (PBMC) 샘플, 비분획 T 세포 샘플, 림프구 샘플, 백혈구 샘플, 성분 채집물, 또는 백혈구 성분 채집물이거나 이를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 세포 집단은 면역 세포를 함유한다. 일부 구체예에서, 상기 면역 세포는 림프구 또는 항원 제시 세포를 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 면역 세포는 림프구 또는 이의 서브 타입, B 세포 또는 이의 서브 타입, T 세포 또는 이의 서브 타입, 또는 이들의 조합이다. 일부 예시에서, 상기 면역 세포는 CD4+ 및/또는 CD8+ T 세포인 T 세포이다.
임의의 이러한 구체예 중 일부에서, 상기 세포 집단은 중앙 기억 T 세포, 이펙터 기억 T 세포, 나이브 T 세포, 줄기 중앙 기억 T 세포, 이펙터 T 세포 및 조절 T 세포가 풍부하거나 이를 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 세포 집단은 기억 B-세포, 나이브 B-세포 또는 형질모세포 B-세포가 풍부하다.
임의의 이러한 구체예 중 일부에서, 상기 대상체는 인간 대상체이다. 일부 구체예에서, 상기 대상체는 암, 감염 또는 자가 면역 상태를 갖는다. 일부 경우에, 상기 감염은 바이러스성, 세균성 또는 곰팡이 감염이다.
임의의 이러한 구체예 중 일부에서, 상기 방법은 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드를 증폭하여, 그에 의하여 복수 개의 폴리뉴클레오타이드 주형을 생성하는 단계를 더 포함한다. 임의의 이러한 구체예 중 일부에서, 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드의 증폭은 상기 제1 어댑터 서열에 상보적인 제1 프라이머 및 상기 제2 어댑터 서열에 상보적인 제2 프라이머를 포함하는 제1 프라이머 세트의 존재 하에서 수행된다. 일부 측벼ㅁ에서, 상기 제1 및/또는 제2 프라이머는 범용 프라이머이다. 일부 경우에, 상기 제1 및/또는 제2 프라이머는 상기 P7 프라이밍 부위 (C7) 또는 이의 인접 부분 또는 상기 P5 프라이밍 부위 (C5) 또는 이의 인접 부분에 상보적이다. 일부 경우에, 상기 제1 프라이머는 상기 P7 프라이밍 부위 (C7) 또는 이의 인접 부분에 상보적이고, 상기 제2 프라이머는 상기 P5 프라이밍 부위 (C5) 또는 이의 인접 부분에 상보적이다. 일부 구체예에서, 상기 P7 프라이밍 부위 (C7) 또는 이의 인접 부분에 상보적인 상기 프라이머는 서열 CAAGCAGAAGACGGCATACGAGAT (SEQ ID NO:39)를 갖거나 함유하고; 및/또는 상기 P5 프라이밍 부위 (C5) 또는 이의 인접 부분에 상보적인 상기 프라이머는 서열 ACACGACGCTCTTCCGATCT (SEQ ID NO:27)을 함유한다. 임의의 이러한 구체예 중 일부에서, 상기 제1 및/또는 제2 프라이머는 시퀀싱 어댑터를 더 함유한다. 일부 구체예에서, 상기 P7 프라이밍 부위 (C7) 또는 이의 인접 부분에 상보적인 상기 프라이머는 서열 CAAGCAGAAGACGGCATACGAGAT[NNNNNN]GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (SEQ ID NO:28)을 더 함유하고; 및/또는 상기 P5 프라이밍 부위 (C5) 또는 이의 인접 부분에 상보적인 상기 프라이머는 서열 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCC (SEQ ID NO:76)을 함유한다.
일부 구체예에서, 상기 방법은 상기 복수 개의 단일-가닥 바코딩된 폴리뉴클레오타이드, 임의로 단일-가닥 이중 바코딩된 폴리뉴클레오타이드 각각을 정제하는 단계를 더 포함한다.
제공되는 것은, 전술한 임의의 구체예의 방법에 의하여 생성되는 복수 개의 바코딩된 폴리뉴클레오타이드를 함유하는 폴리뉴클레오타이드 라이브러리이다. 또한, 제공되는 것은, 복수 개의 바코딩된 폴리뉴클레오타이드를 함유하는 폴리뉴클레오타이드 라이브러리로서, 여기서 상기 복수 개의 바코딩된 폴리뉴클레오타이드는 (i) 세포 집단의 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드(들)의 앰플리콘을 함유하는 하나 이상의 표적 폴리뉴클레오타이드(들); 및 (ii) 각각이 상기 세포의 폴리뉴클레오타이드의 앰플리콘을 함유하는 폴리뉴클레오타이드의 집합체를 함유하고, 여기서 각각의 바코딩된 폴리뉴클레오타이드는 제1 범용 프라이머에 상보적인 제1 범용 프라이밍 부위를 포함하는 제1 어댑터; 용기 바코드를 포함하는 용기 바코딩된 올리고뉴클레오타이드로서, 여기서 상기 용기 바코드는 상기 세포 집단의 동일한 세포로부터의 (i) 및 (ii)로부터의 모든 바코딩된 폴리뉴클레오타이드에 대하여 동일한 것인 올리고뉴클레오타이드; 및 제2 범용 프라이머에 상보적인 제2 범용 프라이밍 부위를 함유하는 제2 어댑터 서열을 함유한다.
일부 구체예에서, 상기 복수 개의 바코딩된 폴리뉴클레오타이드 각각은 각각의 폴리뉴클레오타이드 또는 폴리뉴클레오타이드 주형에 고유한 분자 바코드를 함유한다. 일부 측면에서, 상기 세포 집단의 각각의 세포로부터의 바코딩된 폴리뉴클레오타이드 주형의 집합체는, 집합적으로, 전사체 또는 부분적 전사체 또는 이의 상보체의 상보적 DNA (cDNA) 가닥을 함유한다. 일부 구체예에서, 상기 전사체 또는 부분적 전사체는, 집합적으로, 상기 세포의 게놈에 존재하는 전사물의 적어도 least 60%, 70%, 75%, 80%, 85% 90% 95%, 96%, 97%, 98%, 99% 또는 100%를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 바코딩된 폴리뉴클레오타이드 각각은 (약) 50 개 염기쌍보다 큰, 100 개 염기쌍보다 큰, 또는 200 개 염기쌍보다 큰 크기를 갖는다. 일부 구체예에서, 상기 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 (약) 50 개 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp의 크기를 갖는다.
임의의 이러한 구체예 중 일부에서, 상기 제1 어댑터는 상기 용기 바코드를 함유한다. 일부 구체예에서, 상기 바코딩된 폴리뉴클레오타이드는 단일-가닥이다. 일부 구체예에서, 상기 바코딩된 폴리뉴클레오타이드는 이중-가닥이다. 일부 구체예에서, 상기 제1 어댑터 및 제2 어댑터는 상이하다.
임의의 이러한 구체예 중 일부에서, 상기 제1 범용 프라이밍 부위 및/또는 제2 범용 프라이밍 부위는 P7 프라이밍 부위 (C7) 또는 이의 인접 부분 또는 P5 프라이밍 부위 (C5) 또는 이의 인접 부분이거나 이를 함유하고, 임의로 여기서 상기 이의 인접 부분은 상보적 서열에 어닐링하기에 충분하다. 일부 구체예에서, 상기 제1 범용 프라이밍 부위는 상기 P7 프라이밍 부위 (C7) 또는 이의 인접 부분이거나 이를 함유하고, 상기 제2 범용 프라이밍 부위는 상기 P5 프라이밍 부위 (C5) 또는 이의 인접 부분이거나 이를 함유한다. 일부 측면에서 상기 P7 프라이밍 부위 (C7)는 서열 AGATCGGAAGAGCACACGTCTGAACTCCA (SEQ ID NO:77)을 함유하거나, 이의 인접 부분이다. 일부 예시에서, 상기 P5 프라이밍 부위는 서열 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT (SEQ ID NO:78)을 함유하거나, 이의 인접 부분이다.
임의의 이러한 구체예 중 일부에서, 상기 인접 부분은 적어도 (약) 15, 20, 25 또는 30 개 뉴클레오타이드 길이를 함유한다. 일부 구체예에서, 상기 P5 프라이밍 부위는 SEQ ID NO:25 (AGATCGGAAGAGCGTCGTGT)에 기재된 인접 부분이다.
임의의 이러한 구체예 중 일부에서, 상기 용기 바코딩된 올리고뉴클레오타이드는 적어도 (약) 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40 또는 50 개 뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 용기 바코딩된 올리고뉴클레오타이드는 (약) 10 내지 30 개 뉴클레오타이드를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 면역 분자 또는 이의 사슬의 폴리뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 적어도 2 개의 표적 폴리뉴클레오타이드를 함유하고, 각각은 면역 분자 사슬의 폴리뉴클레오타이드를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 하나 이상의, TCR 또는 이의 사슬의 폴리뉴클레오타이드(들)을 함유한다. 일부 구체예에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 T-세포 수용체 알파 (TCRα)의 제1 폴리뉴클레오타이드 및 T-세포 수용체 (TCRβ)의 제2 폴리뉴클레오타이드를 함유한다. 일부 구체예에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 T-세포 수용체 감마 (TCRγ)의 제1 폴리뉴클레오타이드 및 T-세포 수용체 델타 (TCR델타)의 제2 폴리뉴클레오타이드를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 하나 이상의, 항체 또는 이의 사슬의 폴리뉴클레오타이드(들)을 함유한다. 일부 구체예에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 중쇄 면역글로불린 (IgH) 폴리뉴클레오타이드의 제1 폴리뉴클레오타이드 및 경쇄 면역글로불린 (IgL) 폴리뉴클레오타이드의 제2 폴리뉴클레오타이드를 함유한다.
임의의 이러한 구체예 중 일부에서, 상기 바코딩된 폴리뉴클레오타이드는 순서대로 (5'에서 3'으로): 제1 어댑터, 용기 바코드, 분자 바코드 및 제2 어댑터를 함유한다. 일부 구체예에서, 상기 제1 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드의 5' 영역에 또는 그 근처에 위치한다. 일부 구체예에서, 상기 제2 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드의 3' 영역에 또는 그 근처에 위치한다.
제공되는 것은, 전술된 임의의 구체예에 의하여 생성되거나, 또는 전술한 임의의 폴리뉴클레오타이드 라이브러리의 구체예로부터의, 하나 이상의 상기 복수 개의 폴리뉴클레오타이드, 예컨대 바코딩된 폴리뉴클레오타이드 (예컨대, 이중-바코딩된 폴리뉴클레오타이드)를 시퀀싱하는 단계를 포함하는 시퀀싱 방법이다. 일부 예시에서, 상기 복수 개의 폴리뉴클레오타이드로부터의 전사체, 예컨대 폴리뉴클레오타이드 주형이 시퀀싱된다. 일부 경우에, 상기 방법은 상기 시퀀싱 전에 상기 전체 전사체 또는 이의 부분을 증폭시키는 단계를 더 포함한다. 일부 측면에서, 증폭은 각각 상기 제1 및 제2 어댑터에 특이적인 제1 프라이머 및 제2 프라이머를 함유하는 제1 프라이머 세트를 이용하여 수행된다.
일부 구체예에서, 상기 복수 개의 폴리뉴클레오타이드 주형으로부터의 하나 이상의 표적 폴리뉴클레오타이드(들)이 시퀀싱된다. 일부 경우에, 상기 방법은 상기 시퀀싱 전에 상기 복수 개의 폴리뉴클레오타이드 주형으로부터의 하나 이상의 표적 폴리뉴클레오타이드(들)을 증폭시키는 단계를 더 포함한다. 일부 예시에서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)의 전장 서열(들)이 증폭된다.
일부 구체예에서, 증폭은 하나 이상의 표적 폴리뉴클레오타이드에 상보적인 하나 이상의 제1 프라이머 및 상기 제1 어댑터 서열에 상보적인 제2 프라이머를 함유하는 제2 프라이머 세트의 존재 하에서 수행된다. 일부 경우에, 상기 제2 프라이머 세트의 상기 제2 프라이머는 P7 프라이밍 부위 (C7) 또는 이의 인접 부분 또는 P5 프라이밍 부위 (C5) 또는 이의 인접 부분에 상보적이다. 일부 측면에서, 상기 제2 프라이머 세트의 상기 제2 프라이머는 P7 프라이밍 부위 (C7) 또는 이의 인접 부분에 상보적이다. 일부 구체예에서, 상기 제2 프라이머 세트의 상기 제2 프라이머는 서열 CAAGCAGAAGACGGCATACGAGAT (SEQ ID NO:39) 또는 CAAGCAGAAGACGGCATACGAGAT[NNNNNN]GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (SEQ ID NO:28)을 갖거나 함유한다.
일부 구체예에서, 상기 하나 이상의 표적 폴리뉴클레오타이드에 상보적인 상기 하나 이상의 제1 프라이머는 면역 분자 또는 이의 사슬의 표적 서열에 특이적이다. 일부 경우에, 상기 면역 분자는 T 세포 수용체 또는 항체이다. 일부 측면에서, 상기 하나 이상의 제1 프라이머(들)은 상기 면역 분자의 불변 영역의 표적 서열에 특이적이다.
일부 구체예에서, 상기 면역 분자는 TCR이고, 상기 하나 이상의 제1 프라이머는 AGTCTCTCAGCTGGTACACGG (SEQ ID NO:37), ATGGCTCAAACACAGCGACCTC (SEQ ID NO:38) 또는 이들의 조합을 포함한다. 일부 구체예에서, 상기 면역 분자는 항체이고, 상기 하나 이상의 제1 프라이머는 SEQ ID NOS:29-36 중 하나 또는 이들의 조합을 포함한다.
임의의 이러한 구체예 중 일부에서, 상기 방법은 상기 하나 이상의 바코딩된 폴리뉴클레오타이드(들), 임의로 이중 바코딩된 폴리뉴클레오타이드의 세포 기원을 결정하는 단계를 포함한다. 일부 경우에, 상기 세포 기원을 결정하는 것은 동일한 세포로부터 유래한 것과 같은 동일한 용기 바코드를 갖는, 이중 바코딩된 폴리뉴클레오타이드의 서열 정보, 또는 서열을 동정하는 것을 포함한다.
임의의 이러한 구체예 중 일부에서, 상기 표적 폴리뉴클레오타이드는 제1 폴리뉴클레오타이드 사슬 및 제2 폴리뉴클레오타이드 사슬을 함유하는 면역 분자이고, 상기 방법은 상기 시퀀싱된 이중 바코딩된 폴리뉴클레오타이드에서 상기 제1 폴리뉴클레오타이드 사슬 및 상기 제2 폴리뉴클레오타이드 사슬을 상기 동일한 용기 바코드의 존재를 이용하여 상기 동일한 세포와 매칭시키는 단계를 포함한다. 일부 구체예에서, 상기 방법은 상기 동일한 바코드, 임의로 상기 동일한 분자 바코드 및/또는 용기 바코드를 갖는 폴리뉴클레오타이드의 수를 정량 또는 결정하는 단계를 더 포함한다.
임의의 이러한 구체예 중 일부에서, 상기 복수 개의 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중 바코딩된 폴리뉴클레오타이드이고, 상기 방법은 동일한 용기 바코드를 갖는 전자체 서열 및 표적 폴리뉴클레오타이드 서열을 동정하고, 이에 의하여 상기 표적 폴리뉴클레오타이드(들)을 보유하는 상기 세포의 전사체 정보를 동정하는 단계를 더 포함한다.
제공되는 것은, (a) 전술한 임의의 방법에 의하여 생성되는 상기 복수 개의 바코딩된 폴리뉴클레오타이드부터의 또는 전술한 임의의 폴리뉴클레오타이드 라이브러리의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 하나 이상의 표적 폴리뉴클레오타이드(들)을 시퀀싱하여, 그에 의하여 상기 복수 개의 세포로부터 상기 표적 폴리뉴클레오타이드에 대한 서열 정보를 생성하는 단계로서, 여기서 상기 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중-바코딩된 폴리뉴클레오타이드인 것인 단계; (b) 전술한 임의의 방법에 의하여 생성되는 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터 또는 전술한 임의의 폴리뉴클레오타이드 라이브러리의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터 전체 전사체 또는 이의 부분을 시퀀싱하고, 그에 의하여 상기 복수 개의 세포로부터 전사체 데이터를 생성하는 단계로서, 여기서 상기 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중-바코딩된 폴리뉴클레오타이드인 것인 단계; 및 (c) 동일한 세포로부터의 것과 동일한 용기 바코드를 갖는 (a)로부터의 및 (b)로부터의 서열 정보를 동정하는 단계를 포함하는, 전사체 분석 방법이다.
제공되는 것은, 선택된 단일 세포의 전사체를 분석하는 방법으로서, 상기 방법은 (a) 전술한 임의의 방법에 의하여 생성되는 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 또는 전술한 임의의 폴리뉴클레오타이드 라이브러리의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 하나 이상의 표적 폴리뉴클레오타이드(들)을 증폭하고 시퀀싱하여, 그에 의하여 상기 복수 개의 세포 중 적어도 하나에서 상기 표적 폴리뉴클레오타이드 각각에 대한 서열 정보를 생성하는 단계로서, 여기서 상기 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중-바코딩된 폴리뉴클레오타이드인 것인 단계; (b) (a)에서 시퀀싱된 상기 표적 폴리뉴클레오타이드 중 하나와 관련된 상기 용기 바코드(들)를 동정하고, 그에 의하여 상기 표적 폴리뉴클레오타이드를 보유하는 선택된 단일 세포를 동정하는 단계; (c) (b)에서 동정된 상기 용기 바코드를 보유하는 세포의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터 전사체 또는 이의 부분을 증폭하고 시퀀싱하고, 그에 의하여 상기 선택된 표적 폴리펩타이드-발현 세포로부터의 전사체 데이터를 생성하는 단계를 포함한다. 일부 구체예에서, 상기 전사체 또는 이의 부분은 (b)에서 동정된 상기 용기 바코드에 특이적인 프라이머 및 상기 바코딩된 폴리뉴클레오타이드의 상기 제2 어댑터 서열에 특이적인 프라이머를 이용하여 상기 선택된 세포로부터 증폭되거나 시퀀싱된다.
일부 구체예에서, 상기 방법은 상기 전사체 또는 이의 부분에 대한 서열 정보와 상기 동일한 세포로부터의 상기 표적 폴리뉴클레오타이드(들) 중 적어도 하나를 매칭시키는 단계를 포함하고, 여기서 상기 서열 정보는 전술한 임의의 방법에 의하여 생성되는 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터 또는 전술한 임의의 폴리뉴클레오타이드 라이브러리의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터 결정되거나, 전술한 임의의 방법으로부터 결정되는데, 여기서 상기 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중-바코딩된 폴리뉴클레오타이드이다. 일부 경우에, 동일한 용기 바코드를 갖는 서열은 동일한 세포로부터의 것과 매칭된다. 일부 구체예에서, 상기 전사체 데이터는 상기 세포의 기능 또는 활성과 관련된 파라미터, 특성, 특징 또는 표현형을 포함한다. 일부 경우에, 상기 전사체 데이터는 상기 세포의 활성화, 고갈 또는 증식 활성과 관련된다.
도 1a는 바코딩 단계의 개략도: 본 명세서에 기술되는 예시적 방법을 도시한다. 상기 스케치는, 라이브러리 제조 및 면역 시퀀싱을 위하여, 2 이상의 폴리뉴클레오타이드, 예컨대 표적 폴리뉴클레오타이드 및 하나 이상의 게놈 또는 전사체 폴리뉴클레오타이드, 또는 페어링된 서열, 예컨대 페어링된 가변 Ig (예컨대, VH 및 VL mRNA) 또는 TCR 서열 (예컨대, Vα/Vβ 및 Vγ/Vδ mRNA)를 증폭하고 바코딩하는 방법을 나타낸다. 용기 바코드 (Vessel Barcode, VB); 분자 바코드 (Molecular Barcode, MB). (상단) 예시적 용기로서, 단일 세포 및 다른 반응 요소 (예컨대, 효소, 완충제, 올리고뉴클레오타이드)를 함유하는 에멀젼의 (복수 개의 액적 중의) 단일 액적. (중단) 표적-특이적, 무작위적, 및/또는 올리고-dT 역전사 프라이머를 이용하는, 용해된 세포 RNA의 세포 용해 및 역전사의 예시적 방법. (하단) 주형 스위치 단계 및 역전사 단계 중에 단일 분자의 분자 바코드 (MB) 태깅.
도 1b는 본 명세서에 기술되는 예시적 방법의 증폭 단계의 개략도를 도시한다. 상기 스케치는 라이브러리 제조 및 면역 시퀀싱을 위하여, 2 이상의 폴리뉴클레오타이드, 예컨대 표적 폴리뉴클레오타이드 및 하나 이상의 게놈 또는 전사체 폴리뉴클레오타이드, 또는 페어링된 서열, 예컨대 페어링된 가변 Ig (예컨대, VH 및 VL mRNA) 또는 TCR 서열 (예컨대, Vα/Vβ 및 Vγ/Vδ mRNA)를 증폭하고 바코딩하는 방법을 나타낸다. (상단) 용기 바코드 (VB)의 독립적인 증폭은 각 액적 내에 복수 개의 동일한 VB 카피를 생성한다. 분자 바코딩된 (MB) cDNA 분자는, 증폭의 어닐링 및 연장 단계 중에 VB로 동시에 태깅된다. (중단)증폭 사이클 중에 이중 바코딩된 cDAN 분자의 동시 증폭. (하단) 추가 처리 (예컨대, 정제, 크기 선별, 어댑터 연결 (ligation), 증폭, 및 시퀀싱)을 위하여 준비된 예시적인 이중 바코딩된 cDNA 분자.
도 2는 본 명세서에서 기술되는 예시적 방법, 이중 바코딩된 전사물의 증폭 및 시퀀싱을 도시한다. (상단) 각각의 프라이머는 시퀀싱을 위하여 시퀀싱 어댑터에 연결된, 상기 제1 어댑터의 상기 범용 프라이밍 서열에 특이적인 프라이머 및 표적-특이적 프라이머를 이용하는, 대상 표적 유전자를 인코딩하는 전사물의 증폭 및 시퀀싱. (중단) 상기 제1 어댑터의 상기 범용 프라이밍 서열 및 상기 제2 어댑터의 상기 범용 프라이밍 서열에 특이적인 프라이머들을 이용하는, 하나 이상의 세포의 라이브러리 중의 모든 전사물, 예컨대 전사체 또는 그의 부분의 증폭 및 시퀀싱. (하단) 상기 동일한 세포로부터의 폴리뉴클레오타이드에 공통인 상기 결정된 용기 바코드 (VB)에 대하여 특이적인 프라이머 및 상기 제2 어댑터의 상기 범용 프라이밍 서열에 특이적인 프라이머를 이용하는, 대상 선택된 세포, 예컨대 표적 유전자의 mRNA 전사물을 함유하는 것으로 결정된 세포에 대한 전사체의 증폭 및 시퀀싱.
도 3은 Seurat 소프트웨어 툴에 따라 유추된 클러스터 동일성에 의하여 색 입혀지거나 (a; 점선은 주로 동일한 색을 나타내는 사건의 클러스터를 나타낸다), 또는 시퀀싱된 전장 면역 수용체의 유형, B 세포 수용체 (BCR) 또는 T 세포 수용체 (TCR)에 의하여 색 입혀진 (b; 점선은 주로 동일한 색을 나타내는 사건의 클러스터를 나타낸다) 단일-세포 전사체 데이터의 t-SNE 플롯을 도시한다.
도 4는 동정된 서열: 톨-유사 수용체 7 (TLR7; a), T-세포 표면 당단백질 CD3 엡실론 사슬 (CD3E; b), 자연 살해 세포 과립 단백질 7 (NKG7; c), 만노오스 수용체 C-타입 1 (MRC1; d)을 발현하는 세포를 확인하기 위하여 색 입혀진, 도 3의 단일-세포 전사체 데이터의 t-SNE 플롯을 도시한다.
상세한 설명
본 명세서에서 제공되는 것은, 단일 세포 또는 복수 개의 단일 세포에서 유전자 발현 분석을 위한 방법 및 조성물이다. 상기 제공되는 방법은 상기 전체 전사체, 또는 이의 부분으로부터의 폴리뉴클레오타이드 및 대상 표적 유전자의 하나 이상의 전장 폴리뉴클레오타이드 서열을 함유하는 복수 개의 단일 세포 고품질 폴리뉴클레오타이드 (예컨대, DNA) 서열 라이브러리의 효율적인 생성을 가능하게 하고, 이에 의하여 상기 동일한 세포로부터 유래한 표적 폴리뉴클레오타이드(들) 및 전체 또는 부분적 전사체로부터의 폴리뉴클레오타이드이 동정될 수 있다. 일부 구체예에서, 상기 라이브러리 내 상기 복수 개의 폴리뉴클레오타이드 각각은, 상기 실험 수행시 결정되는 것이 틀림없는 특정 유전자에 반대인, 상기 총 회수된 생성물의 차세대 시퀀싱을 가능하게 하는 어댑터 서열 (예컨대, 제1 어댑터 및 제2 어댑터)를 함유한다. 따라서, 상기 제공되는 방법의 일부 측면에서, 후속 PCR 증폭은 이들 어댑터 서열에 특이적인 프라이머 및/또는 상기 대상 표적 폴리뉴클레오타이드에 특이적인 프라이머 및/도는 세포-특이적 프라이머를 이용하여 수행될 수 있다. 일부 구체예에서, 상기 제공되는 방법은 단일 실험에서 1만 또는 10만 개 세포의 처리를 가능케 하고, 그에 의하여 효율적이고 고처리량의 방식으로 전장 면역 분자 서열, 예컨대 항체 또는 TCR과 조합된, 단일-세포 시퀀싱 데이터, 예컨대 RNA-seq 데이터, 예컨대 mRNA 수를 얻는다.
일부 경우에, 조직의 게놈 및 mRNA 컨텐츠의 전부 또는 부분에 대한 직접적 시퀀싱은, 이전에 알려진 유전자를 사전 선택할 필요 없이, 대안적 스플라이싱, 조절/프로모터 영역, 및 폴리아데닐화 신호의 분석을 가능케 하는데 사용이 증가하고 있다 (Cloonan et al., Nat Methods 5(7):613-9 (2008)). 그러나, 세포의 상기 mRNA 컨텐츠를 직접적인 시퀀싱으로 분석하는 현재의 방법은 통상 백만 개 세포를 함유하는 조직 샘플로부터 얻어지는 벌크 mRNA를 분석하는 것에 의존한다. 이것은, 유전자 발현이 벌크 mRNA로 분석되는 경우, 단일 세포에 존재하는 다수의 기능적 정보가 손실되거나 흐릿해진다는 것을 의미한다. 또한, 세포 주기와 같은 동적인 과정 중의 유전자 발현은 집단 평균으로 관찰하는 것이 어렵다. 그러므로, 일부 응용법에서는, 직접적 시퀀싱의 단일-세포 기반 접근법이 벌크 샘플보다 양호하다.
일부 경우에, 선택된 세포, 예컨대 특정 대상 유전자 또는 유전자들, 예컨대 표적 유전자를 발현하는 세포의 게놈 또는 mRNA 컨텐츠를 분석하는 것이 양호하다. 일부 경우에, 표적 유전자, 예컨대 면역 수용체의 전장 서열 또한 얻음과 동시에, 선택된 세포의 게놈 또는 전사체 컨텐츠를 얻는 것이 양호하다. 단일-세포 전사체 시퀀싱을 위한 기존의 툴은 마이크로어레이, 96-웰 기반 방법, 예컨대 웰 내로의 전통적인 FACS 분류, 및 마이크로플루이드 기기, 예컨대 Fluidigm C1을 들 수 있다. 이들 툴은 전체 전사체 및 표적 라이브러리를 제조하는데 사용될 수 있지만 그 처리량이 제한적인데, 이는 이들이 분석될 수 있는 세포의 수에 있어서 제한적이기 때문이다 (예컨대 수백 내지 수천 개의 세포).
일부 경우에, 선택된 세포, 예컨대 특정 대상 유전자 또는 유전자들, 예컨대 표적 유전자 (예컨대, 면역 수용체)를 발현하는 세포의 게놈 또는 mRNA 컨텐츠를 분석하는 것이 양호하다. 마이크로웰 어레이 또는 에멀젼을 사용하는 초 고처리량 방법은 전체 단일-세포 전사체 시퀀싱을 가능케 하는 것으로 기술되었으나 (예컨대, Klein et al., Cell(2015) 161(5):1187-1201; Macosko et al., Cell(2015) 161(5): 1202-1214; WO/2015/164212; WO/2016/040476 참조), 전장 표적 서열, 예커대 전장 면역 수용체 서열의 효율적인 포착은 기존의 기술로는 가능하지 않다. 이들 방법 역시, 세포당 더 큰 액적 및 더 큰 반응 부피를 요하는 비드-기반 접근법에 의한다는 한계로 인하여, 통상 수천 개의 더 적은 수의 세포에 제한된다.
상기 제공되는 방법의 구체예에서, 복수 개 세포의 표적 서열, 예컨대 표적 면역 분자 (예컨대, 항체 또는 TCR) 및 게놈 또는 전사체 서열은 하나의 동시 반응에서 생성되고, 상기 동일한 세포로부터 유래되는 서열들의 서열 정보를 연결하는 메커니즘을 제공한다. 일부 측면에서, 상기 본 명세서에서 개시되는 방법은, 고-처리량 시퀀싱 기술과 커플링될 경우, 많은 수의 단일 세포를 분석하고 하나의 단일 반응 분석으로 상기 분석을 달성하는 것을 가능케 한다. 원칙적으로, 임의 숫자의 세포 및 세포당 임의 숫자의 표적 영역을 시퀀싱할 수 있다. 일부 측면에서, 처리될 수 있는 단일 세포의 수는 실시적 제약, 예컨대 고처리량 시퀀싱 속도에 의하여만 제한된다. 일부 구체예에서, 본 명세서에서 개시되는 상기 방법은 비드와 함께 사용하기 위해 변경 가능하다. 다른 구체예에 있어서, 본 명세서에서 개시되는 상기 방법은 비드-기반 시퀀싱 또는 증폭 단계를 포함하지 않는다.
일부 측면에서, 상기 제공되는 방법은 복수 개의 단일 세포에서 유전자 발현을 분석하는데 사용될 수 있는 cDNA 라이브러리를 제조하는 방법을 제공함으로써 기존 방법들의 문제점을 극복하거나 감소시킨다. 일부 구체예에서, 상기 제공되는 방법은, 초-고 처리량 시퀀싱을 위하여, 합성-준비된, 전장 표적 서열들, 예컨대 페어링된 헤테로이량체 또는 다량체 표적의 서열의 회수를 가능하게 하는 폴리뉴클레오타이드 라이브러리의 생성이라는 결과를 낳는 동시에, 상기 표적 서열(들)을 발현하는 것으로 동정된 세포의 상보적 정량적 게놈 또는 전사체 정보를 포착한다.
특히, 상기 제공되는 방법은 복수 개의 단일 세포로부터, 폴리뉴클레오타이드 라이브러리, 예컨대 cDNA 라이브러리를 제조하기 위한 것이다. 상기 방법은 개별적인 세포로 이루어지는 집단으로부터의 유전자 발현 수준을 결정하는 것에 기초하는데, 이는 세포 대 세포 수준의 유전자 발현의 자연적인 변이량을 확인하는데 사용할 수 있다. 상기 방법은 또한 세포 집단의 세포 조성을 동정하고 특징화하는데 사용될 수 있는데, 예컨대 적절한 세포-표면 마커의 부재하에서도 그러하다. 본 명세서에서 기술되는 상기 방법은 또한 단일 세포를 사용하여 세포 집단에서 RNA 컨텐츠를 나타내는 cDNA 라이브러리를 생성하는 이점을 제공하는 반면, 고전적 방법에 의하여 제조된 cDNA 라이브러리는 통상 큰 집단으로부터 분리된 총RNA를 요구한다. 따라서, 일부 측면에서, 상기 제공되는 방법을 이용하여 생성되는 cDNA 라이브러리는, 본 명세서에서 기술되는 추가적인 이점들과 함께, 개별 세포로 이루어지는 더 작은 하위집단을 이용하여 세포 집단에서 RNA 컨텐츠에 대한 적어도 균등한 제시를 가능하게 한다.
상기 제공되는 구체예는 단일-세포 표적 시퀀싱, 예컨대 면역 표적 시퀀싱, 및 전사체 분석을 위한 에멀젼-기반 방법에 기초한다. 일부 측면에서, 세포 집단을 함유하는 샘플로부터의 세포들은 단일의 세포 용기 (예컨대, 액적) 내에 캡슐화되는데, 예컨대 마이크로플루이드 에멀젼-기반 방법을 사용한다. 그 후, 용기 (예컨대, 액적)-특이적 바코드를 에멀젼 액적 내의 표적 폴리뉴클레오타이드 (예컨대, 표적 mRNA 전사물의 앰플리콘) 및/또는 복수 개의 폴리뉴클레오타이드 (예컨대, 전체 또는 부분적 전사체의 mRNA 전사물의 앰플리콘)에 부착하는 방법이 수행되고, 그에 의하여 상기 액적 내 함유된 단일 세포의 고-처리량 유전자적 및/또는 발현 분석이 가능하게 된다. 일부 측면에서, 상기 용기 바코드는 공지의 프라이머 부위 측면에 위치한 무작위화된 중앙 서열 부분을 갖는 단일 분자 DNA 주형으로 처음부터 존재한다. 상기 주형은 상기 용기, 예컨대 액적 내에서 역전사되어 앰플리콘을 형성하고 및/또는 PCR 증폭되어 하나 이상의 앰플리콘을 생산할 수 있고, 서열 중첩에 의하여 세포-유래 핵산에 부착될 수 있다. 상기 방법의 일부 측면에서, 세포-유래 핵산은 유전자-특이적 PCR 프라이머를 이용하여 증폭되어 대상, 표적 유전자 또는 표적 유전자들, 예컨대 면역 분자, 예컨대 항체 또는 T 세포 수용체 (TCR)을 증폭한다. 일부 경우에, 몇 가지 표적 유전자를 증폭하는 상기 능력은 세포의 다양한 특징, 예컨대 표현형, 활성 또는 상기 세포의 기타 특성에 대하여 정보를 제공할 수 있다.
일부 경우에, 추가적인 표적 유전자를 부가하는 것이 특정 면역 분자, 예컨대 TCR에 대한 정보를, 그 세포에 대한 세포 표현형 정보에 연결할 수 있다. 상기 방법의 추가적인 측면에서, 바코딩된 전체 전사체 세포-유래 핵산은 세포의 전체 전사체 또는 그의 부분이 시퀀싱되도록 허하는 프라이머 및 상기 매치되는 동일한 세포로부터 유래한 전사물을 이용하여 증폭될 수 있다. 일부 측면에서, 무작위 역전사 프라이머가 사용되어 전사체의 전사물에 해당하는 앰플리콘을 생성한다. 특정 구체예에서, 범용 프라이밍 부위가, 예컨대 부가되는 제1 및 제2 어댑터에 의하여 상기 바코딩된 폴리뉴클레오타이드의 말단에 첨가될 수 있고, 그렇게 전체 라이브러리가 벌크로 증폭되고 고 처리량 샷건 방식으로 시퀀싱될 수 있다.
일부 구체예에서, 세포-유래 핵산을 증폭하는 반응은 a) 세포 용해; b) 표적 mRNA 역전사; c) 각각의 cDNA의 분자 바코딩; d) 용기-특이적 DNA 바코드의 PCR 증폭; 및 e) 각각의 cDNA에 상기 용기 바코드 카피의 부착을 수행할 수 있는 원-팟 (one-pot) 반응으로 수행될 수 있다. 일부 구체예에서, 생성물은, 예컨대 임의의 다양한 시퀀싱 플랫폼을 사용하여 회수되고 시퀀싱될 수 있다. 예를 들어, 각 생성물의 전체 길이를 시퀀싱하기 위하여 325 x 300 bp를 이용하는 Illumina MiSeq 플랫폼이 사용될 수 있다. 일부 측면에서, 액적 바코드는 각각의 단일 세포로부터의 모든 생성물의 동정을 가능하게 한다. 특정 측면에서, 분자 바코드는 각각의 세포에 대한 발현 정량을 가능하게 하고, 일부 경우에, 시퀀싱 및 RT-PCR 오류의 제거를 가능하게 한다.
상기 제공되는 구체예에서, 전사체 시퀀싱 과정은 몇몇 선택된 전사물, 예컨대 TCR의 표적화된 시퀀싱과 별개로 수행될 수 있는데, 이는 증폭된 라이브러리가 별개로 처리될 수 있기 때문이다. 이는, 상기 방법이 동일한 증폭된 바코딩된 라이브러리에 대하여 개별 앨리쿼트로 수 회 수행될 수 있게 한다. 동일한 증폭된 바코딩된 라이브러리에 대하여 상이한 시점에 상이한 실험을 수행하는 능력에 기하여, 다양한 유용한 접근은 상기 제공되는 방법에 의하여 구현될 수 있다. 한 예에서, 상기 방법은 샘플 내에서 대상 표적 분자, 예컨대 TCR의 표적화된 시퀀싱을 먼저 수행하는데 사용될 수 있는데, 이는 몇몇 특정 대상 세포의 동정을 이끌어낼 수 있다. 일부 측면에서, PCR 또는 포착 올리고뉴클레오타이드는 그 후 대상 세포들을 나타내는 용기 바코드를 표적하도록 설계될 수 있고, 이는 그 세포들만의 모든 바코딩된 전사물의 포착 및 시퀀싱을 가능하게 한다. 일부 측면에서, 이는 전체 라이브러리를 시퀀싱하는 시퀀싱 비용을 크게 저감시킨다.
특정 측면에서, 본 명세서에서 기술되는 상기 방법 및 조성물은, 예컨대 복잡한 세포 샘플의 게놈, 전사체, 단백체 (proteomes), 대사 경로 등등과 같은 단일 세포 분석에 유용하다. 이종 세포 집단에서 다중 세포의 분석은 특히 복잡한 샘플 또는 혼합물을 연구하는 경우 유용하다. 복잡한 샘플 또는 세포 혼합물은, 예컨대 말초 혈액 단핵 세포 (PBMC) 샘플, 범유전체 (metagenomic) 샘플, 정상 및 암성 조직 절편, 배아 및 줄기 세포 콜로니를 포함한다. 게놈 및 전사체 시퀀싱은 분화 세포 유형을 식별하는데, 또는 특정 단계, 예컨대 활성화, 소진 또는 증식의 여러 가지 단계의 세포에서 바람직하다. 특정한 응용으로는 분자 T 세포 및 B 세포 수용체 프로파일링, 하플로타이핑 (haplotying) 및 HLA 타이핑을 들 수 있다.
"범유전체 샘플"은 다중의 기원, 예컨대 종 (species)으로부터의 게놈을 함유하는 샘플을 말한다. 예컨대, 본 발명의 접근법은 박테리아 종의 혼합물에 적용되어 하나의 분석에서 다중의 박테리아로부터의 핵산을 시퀀싱한 후 상기 동일한 박테리아 세포와 서열을 상관시키는 것을 가능하게 한다. 유사하게, 다른 세포 유형의 세포들 중에서 하나의 세포 타입, 예컨대 종양에 침투한 면역 세포의 핵산이 그러하다. 이러한 예에서, 종양 침투 면역 세포의 핵산은 본 명세서에서 제공되는 상기 방법을 이용하여 면역 수용체 또는 이의 결합 단편의 전장 서열(들)과 상관될 수 있다.
상기 제공된 방법의 구체예는 또한 다수의 단일 세포로 이루어진 샘플링을 가능하게 한다. 발현 패턴의 유사성을 이용하여, 세포들이 어떻게 연관되는지 보여주는 세포 맵이 구축될 수 있다. 이러한 맵은 밀접하게 연관된 세포들의 클러스터를 검출함으로써, 인 실리코 (in silico) 세포 유형 구별에 사용될 수 있다. 단지 몇 개가 아니라 다수의 단일 세포를 샘플링함으로써, 발현 패턴의 유사성은 세포 맵 및 그들이 어더ㅎ게 연관되는지를 구축하는데 시용될 수 있다. 이 방법은, 세포 유형의 사전 정제에 대한 요구 없이, 집단에 존재하는 모든 고유한 세포 유형으로부터의 희석되지 않은 발현 데이터에 대한 접근을 허용한다. 또한, 공지의 마커가 이용 가능한 경우, 이들은 대상 세포를 상세히 설명하기 위하여 인 실리코로 사용될 수 있다.
상기 제공되는 구체예 중에,
각 단일 세포로부터 mRNA를 방출시켜 복수 개의 개별 샘플을 제공하는 단계로서, 각 개별 mRNA 샘플의 mRNA는 단일 세포로부터 유래한 것인 단계,
각 개별 mRNA 샘플의 mRNA로부터 cDNA (즉, 앰플리콘)의 제1 가닥을 합성하고 상기 cDNA 앰플리콘 내로 뉴클레오타이드 바코드 (예컨대, 분자 바코드 및/또는 용기 바코드)를 혼입시켜 복수 개의 바코딩된 (예컨대, 이중 바코딩된) cDNA 샘플을 제공하는 단계 (즉, 여기서 각 바코딩된 cDNA 샘플의 cDNA는 상기 바코딩된 cDNA 샘플을 풀링하는 단일 세포로부터의 mRNA에 상보적이고, 및 상기 풀링된 cDNA를 증폭하여 바코딩된 이중-가닥 cDNA를 포함하는 cDNA 라이브러리를 생성하는 단계)
에 의한, 복수 개의 단일 세포로부터 폴리뉴클레오타이드 라이브러리, 예컨대 cDNA 라이브러리를 제조하는 방법이 있다. 일부 구체예에서, 상기 결과물 앰플리콘은 이중 바코딩된 단일-가닥 cDNA, 예컨대 하나 이상의 mRNA 주형(들)에 대응하는 이중 바코딩된 단일-가닥 cDNA이다. 일부 구체예에서, 상기 바코딩된 이중-가닥 cDNA는 바코딩된 단일-가닥 cDNA를 생성하기 위하여 변성되어, 어댑터, 예컨대 시퀀싱을 용이하게 하는 어댑터의 부가를 촉진한다. 상기 방법을 이용하면, 수백 개 단일 세포로부터의 시퀀싱 샘플을 단 시간에 제조하는 것이 가능하다. 시퀀싱을 위하여 RNA로부터 단편 라이브러리를 제조하는 전통적인 방법은 힘든 겔 절제 단계를 포함한다. 본 명세서에서 개시되는 방법의 일부 측면에서, 복수 개의 세포는 단일 샘플로서 준비되는데 (cDNA 합성 후에), 이는 시퀀싱용으로 복수 개, 예컨대 수백 개의 세포의 준비를 가능하게 한다. 또한, 상기 복수 개 세포의 각 세트는 함께 준비되기 때문에 (단일 튜브에서), 기술적 변이량이 최소화될 수 있다.
본 발명의 일부 측면에서, 단일 세포로부터 얻어진 각 cDNA 샘플은 바코드로 태깅되는데, 이는 단일 세포 수준에서 유전자 발현 분석을 가능하게 한다. 이는, 동적 과정, 예컨대 세포 주기 중의 발현 연구를 가능하게 하고, 복잡한 조직 (예컨대 뇌)에서의 고유한 세포 유형 분석을 가능하게 한다. 일부 측면에서, cDNA 샘플은 분석 전에 풀링될 수 있다. 샘플을 풀링하는 것은 각 단일 세포로부터의 샘플 취급을 간이하게 하고, 상기 단일 세포에서의 유전자 발현 분석에 요구되는 시간을 줄여주는데, 이는 유전자 발현의 고 처리량 분석을 가능하게 한다. 증폭 전에 cDNA 샘플을 풀링하는 것은 또한 샘플들 간 기술적 변이량이 사실상 제고되는 이점을 제공한다. 또한, cDNA 샘플이 증폭 전에 풀링되기 때문에, 각 단일 세포로부터의 cDNA 샘플을 개별적으로 증폭하고 처리하는 것에 비하여, 후속 분석을 위한 충분한 양의 cDNA를 생성하는데 더 적은 증폭만 필요하다. 이것은 증폭 편향 (bias)를 감소시키고, 또한 풀링된 cDNA 샘플을 제공하는데 이용된 모든 세포들에 걸쳐 어떠한 편향은 유사할 것임을 의미한다. RNA 정제, 보관 및 처리 역시 필요하지 않은데, 이는 RNA의 불안정한 성질에 의해 야기되는 문제들을 제거하는데 도움이 된다.
T 세포 수용체 사슬 쌍 및 항체 면역글로불린 사슬 쌍 양자 모두가 본 발명에서 개시되는 방법을 이용하여 시퀀싱될 고려 대상인 면역 수용체 유형이다. 일부 구체예에서, 상기 제공되는 방법은, 고-처리량 시퀀싱 및 유전자 발현 분석을 위하여, 하나 이상의 표적 서열, 예컨대 하나 이상의 면역 수용체 서열, 및 게놈 및/또는 전사체 시퀀싱 정보를 제공하기 위하여 결합될 수 있는 서열을 포함하는 폴리뉴클레오타이드 라이브러리의 생성을 가능하게 한다. 일부 구체예에서, 특정 공통 속성을 갖는 환자 또는 코호트로부터 항체 및/또는 TCR 발굴을 위한 인간 유래 라이브러리 패널인 폴리뉴클레오타이드 라이브러리가 개발될 수 있다. 상기 제공되는 방법의 일부 구체예에서, 출발 물질은 대상 표적 폴리뉴클레오타이드, 예컨대 면역 분자 또는 수용체, 예컨대 항체 또는 TCR을 함유하거나 함유할 가능성이 있는 대상 세포 집단을 함유하는 임의의 원일 수 있다. 일부 구체예에서, 출발 물질은, 말초 혈액이거나, 그로부터 면역 세포가 전적으로 단리되거나 원한다면 나이브, 메모리 및/또는 항체 분비 세포 (ASC)에 대하여 하위-분류된, 조직 생검으로부터 유래한 것일 수 있다. 일부 구체예에서, 상기 제공되는 방법은 다중의 여러 유형의 단일 또는 페어링된 가변 서열, 예컨대 T-세포 사슬 쌍 및 항체 면역글로불린 사슬 쌍에 적용될 수 있다.
일부 측면에서, 상기 제공되는 방법에 의하여 생성된 cDNA 라이브러리는 직접적 시퀀싱에 의한 단일 세포의 유전자 발현 프로파일 분석에 적합하고, 이들 라이브러리를 이용하여 유전자의 발현, 예컨대 특정한 대상 표적 폴리뉴클레오타이드, 예컨대 면역 분자 또는 수용체, 예컨대 항원, 항체 또는 TCR과 결합된 유전자의 발현, 또는 이들을 보유하는 세포를 연구하는 것이 가능하다. 일부 구체예에서, 이전에 알려지지 않았던 유전자 발현 프로파일이 분석될 수 있다. 일부 구체예에서, 상기 제공되는 방법은 샘플로부터의 복수 개 세포 각각을 그들의 전사적 (transcriptional) 세포 상태, 예컨대, 세포의 활성화, 고갈, 증식 또는 기타 원하는 파라미터 또는 속성에 대하여 특징화 또는 비교하는데 사용될 수 있다. 일부 구체예에서, 상기 제공되는 방법은 치료적 후보자, 예컨대 TCR의 발굴을 촉진하는데 사용될 수 있는데, 대상 항원에 특이적인 특정 TCR을 보유하는 특정 세포의 반응을 관찰하는 것에 의하여 그러할 수 있다. 상기 제공되는 방법의 일부 구체예에서, 원하는 반응, 예컨대 T 세포 활성화의 성질 또는 정도와 관련된 TCR을 발현하는 세포를 동정하는 것이 가능하다. 일부 구체예에서, 후보자 유전자의 더 작은 패널에 대한 사전 지식 및/또는 선별을 요하는 기존의 방법들과는 반대로, 상기 제공되는 방법은 전체 전사체의 분석에 의해 더 풍부한 데이터를 포착하는 것을 가능하게 한다.
I. 표적 및 전사체 분석을 위한 폴리뉴클레오타이드 라이브러리
일부 구체예에서, 본 명세서에서 제공되는 방법은 하나 이상의 표적 폴리뉴클레오타이드 분자의 증폭 및 시퀀싱 및 폴리뉴클레오타이드, 예컨대 하나 이상의 표적 분자의 집합체 및 단일 세포 또는 세포 집단으로부터의 폴리뉴클레오타이드의 집합체의 증폭 및 시퀀싱에 관한 것이다. 일부 구체예에서, 본 명세서에서 기술되는 상기 방법 및 조성물은, 예컨대 복잡한 세포 샘플의 게놈, 전사체, 단백체, 대사 경로 등등의 연구를 위하여 단일 세포 분석용으로 유용하다. 다른 측면에서, 본 명세서에 기술되는 상기 방법 및 조성물은 예컨대 단일 B 및 T 세포에서 중쇄 및 경쇄 면역글로불린 또는 T-세포 수용체 사슬 페어링에 의한 면역수용체 발굴 뿐만 아니라 HLA 타이핑에 사용될 수 있다. 다른 구체예에서, 항체 페어링 정보 및 단일-세포 분석은 조합되어 세포 기능 또는 세포 상태 정보와 상기 동정된 면역 수용체 서열의 발현을 결합할 수 있다. 또 다른 측면에서, 본 명세서에 기술되는 상기 방법 및 조성물은 진단 또는 새로운 약물 또는 치료 요법의 발굴에 대한 복잡한 정상 또는 암성 샘플에서의 소분자 및 약물 또는 면역용법의 영향 및 그들의 효과(들)을 모니터링하는데 사용될 수 있다. 또 다른 구체예에서, 상기 방법 및 조성물은 생물학적 샘플 내 박테리아 또는 바이러스와 같은 표적 병원체를 검출하고 분석하는데 사용될 수 있다.
일부 구체예에서, 상기 제공되는 방법은, 각각이 전체로 참조로서 포함되는, 국제 공개공보 WO2012/048341, WO2014/144495, WO2016/044227, WO2016/176322, 또는 WO2017/053902에 기술된 방법의 다양한 특징을 포함할 수 있다.
본 발명은, 시퀀싱을 위한 폴리뉴클레오타이드의 라이브러리를 생성하기 위하여 핵산이 조작되는 단계를 이용한다. 일부 구체예에서, 본 발명은, 표적 폴리뉴클레오타이드 분자를 생성하기 위하여 핵산이 조작되고 면역 수용체, 예컨대 면역 세포에 의하여 생산된 항체 또는 TCR의 가변 영역을 포함하는 서열을 포함하는, 단계를 이용한다. 일부 경우에, 표적 폴리뉴클레오타이드 분자는 재조합 모노클로날 항체를 포함한다. 일부 구체예에서, 본 발명은 하나 이상의 세포의 전사체 또는 게놈을 나타내는 폴리뉴클레오타이드를 생성하기 위하여 핵산이 조작된, 단계를 이용한다. 상식상, 본 발명의 일부 구체예에서, 세포의, 예컨대 면역 세포의 및/또는 T 세포의 유전 물질의 증폭, 예컨대 역전사 중합효소 체인 반응 (역전사-PCR)이 사용되어 면역 세포 유전 물질의 cDNA 증폭을 생성한다.
일부 구체예에서, 상기 방법은 세포 내 대상 표적 폴리뉴클레오타이드, 예컨대 TCR 또는 항체에 관한 서열 정보를 얻는데 사용될 수 있다. 표적 유전자는 세포 샘플 또는 집단으로부터의 세포의 게놈 DNA 또는 mRNA로부터 얻을 수 있다. 세포의 샘플 또는 집단은 면역 세포를 포함할 수 있다. 예컨대, 표적 항체 분자에 대해, 면역글로불린 유전자는 면역 세포 또는 T 세포의 게놈 DNA 또는 mRNA로부터 어들 수 있다. RNA는 중쇄 (V,D,J 분절) 또는 경쇄 (V,J 분절)일 수 있다. 일부 구체예에서, 출발 물질은 항체를 인코딩하고 불변 영역을 함유하는 V,D,J 유전자 분절로 구성되는 면역 세포로부터의 RNA이다.
일부 구체예에서, 대상 표적 폴리뉴클레오타이드, 예컨대 면역 분자, 예컨대 항체 또는 TCR의 전장 서열 데이터를 얻는 것 외에, 상기 제공되는 방법은 또한 전체 전사체 생성물 및 전장 표적, 예컨대 다중-서브유닛 표적, 폴리뉴클레오타이드(들), 예컨대 항체 또는 TCR, 예컨대 전장 페어링된 면역 수용체 생성물 양자 모두로부터의 고품질 DNA 시퀀싱 라이브러리의 효율적 생성을 허용한다.
일부 구체예에서, 이러한 방법은 단일-가닥 폴리뉴클레오타이드 생성물에 어댑터 DNA 서열의 부가 (예컨대, 연결)을 포함하고, 이는 단일 세포 또는 복수 개의 단일 세포의 전사체의 증폭 및 차세대 시퀀싱을 허용할 수 있다.
A. 폴리뉴클레오타이드 라이브러리
본 명세서에서 기술되는 방법에 따라 생성된 라이브러리는, 적절한 바코드, 예컨대 용기 바코드 및 분자 바코드를 갖는, 대형의 또는 전장의 표적 서열, 예컨대 항체 또는 TCR 서열을 포함하는 라이브러리일 수 있다. 일부 구체예에서, 상기 라이브러리는 대형의 또는 전장의 표적 서열, 예컨대 항체 또는 TCR 서열, 예컨대 상기 항체 또는 TCR의 양 사슬 모두, 및 그로부터 상기 표적 서열, 예컨대 항체 또는 TCR이 기원하는 세포의 부분적 또는 완전한 전사체의 하나 이상의 전사물에 대응하는 서열을 함유하고, 각각은 용기 바코드 및 분자 바코드를 갖는다. 그러한 구체예에서, 상기 대형의 또는 전장의 표적 서열, 예컨대 항체 또는 TCR 서열, 및 그로부터 상기 표적 서열, 예컨대 항체 또는 TCR이 기원하는 세포의 부분적 또는 완전한 전사체의 하나 이상의 전사물에 대응하는 서열(들)은 동일한 용기 바코드를 함유하고, 상기 전사체의 각각의 원래 전사물에 고유한 분자 바코드를 함유한다. 일부 측면에서, 상기 용기 바코드는 각각의 표적 폴리뉴클레오타이드 및 상기 전사체의 전사물을 나타내는 폴리뉴클레오타이드의 집합체의 각각의 폴리뉴클레오타이드에 부착되는 제1 어댑터에 포함된다.
일부 구체예에서, 폴리뉴클레오타이드 라이브러리를 제조하기 위한 방법이 제공되는데, 이에 의하여 어댑터 (이하, 제2 어댑터라고도 불림)가 복수 개의 이전에 또는 제1 어댑터-태깅된, 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 부가되고, 이렇게 상기 어댑터들은 상기 폴리뉴클레오타이드의 대향 말단에 존재하는데, 여기서 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드는 (i) 세포 집단의 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드(들)에 상보적인 하나 이상의 표적 단일-가닥 폴리뉴클레오타이드, 및 (ii) 각각이 상기 세포의 폴리뉴클레오타이드에 상보적인 단일-가닥 폴리뉴클레오타이드의 집합체로서, 여기서 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 세포 집단의 동일한 세포로부터의 모든 상보적인 폴리뉴클레오타이드에 대하여 동일한 용기 바코드를 함유하는 것인 집합체를 포함한다. 상기 어댑터, 예컨대 상기 제1 및 제2 어댑터 각각은 범용 프라이밍 서열을 함유하는데, 이는 상기 어댑터-태깅된 이중 바코딩된 폴리뉴클레오타이드의 증폭 또는 시퀀싱에 사용될 수 있다.
일부 구체예에서, 상기 폴리뉴클레오타이드의 라이브러리는 시퀀싱될 수 있다. 일부 구체예에서, 본 명세서에 기술되는 방법에 따라 제조된 라이브러리는 시퀀싱을 위하여 적절한 클러스터링 분절들을 함유할 수 있다. 일부 구체예에서, 동일한 분자 바코드 다수 카피가 생성될 수 있다. 일부 구체예에서, 동일한 분자 바코드를 함유하는 다수 카피의 폴리뉴클레오타이드는 각각의 고유한 출발 표적 폴리뉴클레오타이드 분자에 대하여 생성될 수 있다. 일부 구체예에서, 동일한 분자 바코드를 함유하는 다수 카피의 폴리뉴클레오타이드는 용기 바코드로 태깅된 각각의 고유한 출발 표적 폴리뉴클레오타이드 분자에 대하여 생성될 수 있다. 상기 서열 중 어느 하나 또는 모두는 시퀀싱되고 페어링되어 예컨대, 상기 표적 서열(들)을 발현하는 세포의 전체 또는 부분적 전사체를 결정할 수 있다.
출발 물질은, 세포로부터의, 예컨대 면역 세포 또는 T-세포로부터의 RNA 또는 DNA일 수 있다. 일부 경우에, 상기 세포는 원하는 표적 폴리뉴클레오타이드, 예컨대 면역 수용체, 예컨대 TCR 또는 항체를 함유하는 것으로 알려져 있거나 또는 그렇게 추정되는 것일 수 있다. 예컨대, 항체의 경우, 표적 세포는 항체를 인코딩하는 V, D, J 유전자 분절을 포함하고, 불변 영역을 함유하는 것이다. 일부 구체예에서, 상기 표적 폴리뉴클레오타이드는 중쇄 분절 (V, D, J 분절) 또는 경쇄 분절 (V, J 분절)을 포함한다.
상기 폴리뉴클레오타이드 출발 물질, 예컨대 RNA는 하나 이상의 폴리뉴클레오타이드 풀을 이용하여 cDNA로 역전사될 수 있다. 표적 폴리뉴클레오타이드를 역전사하기 위한 폴리뉴클레오타이드의 풀에서 프라이머의 예시는 상기 표적 폴리뉴클레오타이드의 영역에 상보적인 부분을 포함할 수 있고 및/또는 전체 전사체 또는 이의 부분의 역전사를 위한 서열을 포함할 수 있다. 일부 경우에, 상기 폴리뉴클레오타이드는 예컨대 상기 표적의 불변 영역 내의 표적 RNA의 영역, 또는 mRNA의 폴리-A 테일에 상보적인 부분을 포함할 수 있다. 일부 경우에, 다중의 올리고뉴클레오타이드, 예컨대 프라이머는 하나 이상의 표적 서열, 예커대 불변 영역을 어닐링하는데 사용될 수 있다. 일부 측면에서, 상기 하나 이상의 폴리뉴클레오타이드는 서열 특이적, 폴리dT, 및/또는 무작위 6량체 프라이머를 포함한다.
역전사 반응을 수행하기 위하여 역전사 효소가 사용될 수 있다. 특정 구체예에서, 역전사 효소는 비-주형 말단 트랜스퍼라이제 활성을 포함할 수 있다. 비-주형 말단 트랜스퍼라이제 활성을 포함하는 역전사 효소가 주형의 말단에 도달하는 경우, 이는 3 개 이상의 비-주형 잔기, 예컨대 3 개 이상의 비-주형 시토신 잔기를 부가한다. 일부 구체예에서, Superscript IITM 역전사 효소가 이러한 목적을 위하여 사용된다. 일부 구체예에서, MaximaTM 역전사 효소가 이러한 목적을 위하여 사용된다. 일부 구체예에서, Protoscript IITM 역전사 효소가 이러한 목적을 위하여 사용된다. 일부 구체예에서, 말로니 뮤린 백혈병 바이러스 역전사 효소 (MMLV-RT)가 이러한 목적을 위하여 사용된다. 일부 구체예에서, HighScriberTM 역전사 효소가 이러한 목적을 위하여 사용된다. 일부 구체예에서, 말단 데옥시뉴클레오티딜 전이 효소가 이러한 목적을 위하여 사용된다. 일부 구체예에서, 조류 골수아세포증 바이러스 (AMV) 역전사 효소가 이러한 목적을 위하여 사용된다. 비-주형 말단 트랜스퍼라아제 활성을 갖는 RNA를 전사할 수 있는 임의의 역전사 효소가 사용될 수 있다. 역전사로부터 결과하는 cDNA가 하나 이상의 바코드와 함께 태깅될 수 있다. 일부 예시에서, 역전사로부터 결과하는 상기 cDNA는 용기 바코드 및 분자 바코드와 함께 태깅될 수 있다. 특정 설계의 다양한 올리고뉴클레오타이드가 바코드 태깅을 위하여 사용될 수 있다.
일부 구체예에서, 예컨대 면역 레퍼토리 시퀀싱 및/또는 전사체 분석을 위한 라이브러리를 생성하기 위하여 주형 스위칭이 사용될 수 있다. 예컨대, 주형 스위칭은 역전사 중에 사용되어 상기 역전사 생성물에 바코드를 품은 (harboring) 폴리뉴클레오타이드, 예컨대 용기 바코딩된 폴리뉴클레오타이드 또는 분자 바코딩된 폴리뉴클레오타이드에 상보적인 영역을 생성할 수 있다. 주형 스위칭은 역전사 중에 이용되어 PCR 편향 이슈를 제거할 수 있다. 이들 방법은, 예컨대 고-처리량 시퀀싱 플랫폼의 이용을 통하여 항체 시퀀싱에 사용될 수 있다.
일부 구체예에서, 용기 바코드는 알려진 프라이머 부위 측면에 무작위 서열 부분을 포함한다. 예컨대, 상기 cDNA는 용기 바코드로 태깅될 수 있는데, 이는 하나 이상의 끼어들기 (intercalating) 염기 위치(들)을 갖거나 갖지 않는 알려진 ~20 개 길이의 (stretch of) 축퇴 뉴클레오타이드를 포함할 수 있는데, 예컨대 NNNNWNNNNWNNNNWNNNNW (SEQ ID NO: 99; 여기서, N은 임의의 뉴클레오타이드이고 W는 A 또는 T인 알려진 끼어들기 염기이다) 또는 NNNNWISCNNNWISCNNN (SEQ ID NO: 100; 여기서 N은 임의의 뉴클레오타이드; W는 A 또는 T인 끼어들기 염기; I는 A, T, G 또는 C (즉, N)인 끼어들기 염기; S는 G 또는 C인 끼어들기 염기; 및 C는 알려진 끼어들기 시토신이다)이다. 용기 바코딩된 올리고뉴클레오타이드에 포함되는 다른 예시적 서열로는 NNNNWNNNNWNNNN (SEQ ID NO:80), WNNNNWNNNNWNNNN (SEQ ID NO:81), NWNNNWNNNNWNNNN (SEQ ID NO:82) 또는 NNWNNNNWNNNNWNNNN (SEQ ID NO:83)을 들 수 있는데, 여기서 N은 임의의 뉴클레오타이드이고, W는 아데닌 또는 티민이다. 상기 용기 바코드는 또한 반응 혼합물에서, 예컨대 어닐링에 의하여 그들이 전사물에 부착 또는 태깅하기 전에 용기 바코드의 증폭을 위한 포워드 및 리버스 프라이머에 의하여 인식될 수 있는 알려진 프라이머 부위를 포함할 수 있다. 예시적인 용기 바코드 프라이머는 SEQ ID NO: 4 및 SEQ ID NO:5 또는 SEQ ID NO:10 및 SEQ ID NO:11에 제시된다. 일부 경우, 동일한 프라이머 부위를 함유하지만 상기 축퇴 부분에 염기-시프트된 용기 바코드, 예컨대 SEQ ID NOS: 80, 81, 83, 99 또는 100 중 어느 하나로 제시되는 2 개 이상의 용기 바코드의 풀이 용기에 제공되어 염기-시프트된 태깅된 폴리뉴클레오타이드라는 결과를 낳고, 시퀀싱 중의 다양성을 증가시킨다. 일부 구체예에서, 용기 바코드를 함유하는 올리고뉴클레오타이드는, 범용 프라이머 부위 (예컨대, P7)을 함유하는 어댑터, 예컨대 제1 어댑터의 일부분이다. 본 명세서에서 기술되는 제1 어댑터는 범용 프라이밍 부위 및 용기 바코드를 포함할 수 있다. 용기 바코드, 예컨대 범용 프라이머 부위, 축퇴 부분 및 프라이머를 함유하는 이러한 올리고뉴클레오타이드의 예시는 SEQ ID NOS: 2, 6, 7, 8 또는 9로 제시되거나, 또는 SEQ ID NOS: 6, 7, 8 또는 9 중 임의의 2 개 이상으로 이루어진 풀이다. 일부 경우에, 상기 용기 바코드 또는 용기 바코드의 풀은 동일한 용기 내에서 처리되는 cDNA 분자를 태깅하는데 이용될 수 있다. 특정 예시에서, 상기 동일한 용기 내에서 처리되는 cDNA 분자는 동일한 세포로부터의 RNA 분자에 상보적이다.
일부 구체예에서, 분자 바코드는 역전사 반응으로부터의 폴리뉴클레오타이드 전사물을 고유하게 태깅하는 축퇴 서열을 포함한다. 일부 측면에서, 상기 분자 바코드는 주형 스위치 올리고뉴클레오타이드의 일부분인데, 이에 의하여 상기 주형 스위치 올리고뉴클레오타이드는 역전사 효소을 위한 주형 서열을 포함함으로써 상기 분자 바코드가 각각의 상보적 폴리뉴클레오타이드 내로 혼입된다. 일부 구체예에서, 주형 스위치 올리고뉴클레오타이드는 (1) 상기 용기 바코드를 함유하는 상기 제1 어댑터의 3' 태깅 폴리뉴클레오타이드에 상보적인 5' 말단 영역, (2) 상기 분자 바코드 및 (3) 3' 오버행에 상보적인 3' 부분을 함유할 수 있다. 일부 구체예에서, 주형 스위칭 분자, 예컨대 바코드 (예컨대, 분자 바코드)를 함유하는 주형 스위치 올리고뉴클레오타이드는 인공물 형성을 최소화하기 위하여 변형된 염기를 포함할 수 있다. 예시적 분자 바코드를 함유하는 예시적인 주형 스위치 올리고뉴클레오타이드는 SEQ ID NO:3으로 제시된다.
전술한 것과 같은 역전사 반응은 3' 태깅 폴리뉴클레오타이드의 존재 하에서 수행될 수 있다. 3' 태깅 폴리뉴클레오타이드는 선택된 폴리뉴클레오타이드, 예컨대 표적 cDNA의 3' 말단에, 또는 세포 내 전사체의 전사물에 상보적인 폴리뉴클레오타이드 (예컨대, cDNA)에 핵산을 부가하는데 사용되는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드, 예컨대 cDNA의 3' 말단에 핵산을 부가하는 주형으로서 사용되는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드, 예컨대 cDNA의 3' 말단에 혼성화하는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드, 예컨대 cDNA의 3' 말단에 혼성화하는, 3' 영역, 예컨대 3' 말단 영역을 함유하는 폴리뉴클레오타이드일 수 있다. 예컨대, 3' 태깅 폴리뉴클레오타이드는 분절, 예컫내 3 개 이상의 비-주형 잔기에 어닐링하는 분절을 포함할 수 있다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 분자 바코드 폴리뉴클레오타이드이다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 분자 바코드를 포함할 수 있다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 3' 말단에 상기 역전사 효소에 의하여 생성된 가닥 (예컨대, 서열 CCC)에 상보적이고 그에 어닐링하는 3' 리보구아노신 잔기 또는 이의 유사체 (rGrGrG)(RNA 염기)를 포함할 수 있다. 일부 구체예에서, 3 개 이상의 구아닌 잔기가 리보구아노신 잔기 대신 사용될 수 있다 (RNA 뉴클레오타이드 대신 DNA 뉴클레오타이드). 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 3' 말단에 1 개 또는 2 개의 리보구아노신 잔기 및 3' 말단에 상기 역전사 효소에 의하여 생성되는 가닥 (예컨대, CCC)에 상보적이고 그에 어닐링하는 리보구아노신 잔기 (rGrGG) 또는 이의 유사체를 포함할 수 있다.
3' 태깅 폴리뉴클레오타이드가 cDNA 가닥의 CCC에 어닐링하면, 역전사 효소는 계속하여 상기 cDNA를 상기 태깅 폴리뉴클레오타이드로 신장시킬 수 있고, 그에 의하여 상기 반응에서 분자 바코드 또는 이의 상보체는 cDNA와 같은 표적 폴리뉴클레오타이드 집단에 부착된다. 예컨대, 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 5' 내지 3' 영역을 함유하는 폴리뉴클레오타이드일 수 있다. 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 상기 5' 내지 3' 영역은 상기 표적 폴리뉴클레오타이드, 예컨대 cDNA에 상보적이지 않은 영역을 포함할 수 있다. 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 상기 5' 내지 3' 영역은 분자 바코드를 포함할 수 있다. 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 상기 5' 내지 3' 영역은 용기 바코딩된 폴리뉴클레오타이드 또는 이의 상보체에 상보적인 영역을 포함할 수 있다. 다른 실험에서, 주형 스위칭은 별개의 반응으로 수행될 수 있다. 예컨대, 3' 태깅 폴리뉴클레오타이드는 상기 역전사 반응 후에 첨가될 수 있고, 역전사 효소 또는 중합효소와 같은 효소는 상기 태깅 폴리뉴클레오타이드로의 신장을 위하여 사용될 수 있다. 태깅 폴리뉴클레오타이드가 용기 내의 각각의 분자상에 고유한 축퇴 분자 바코드를 품고 (harbor) 있을 수 있기 때문에, 용기 내 각각의 cDNA는 분자 바코드로 고유하게 태깅될 수 있다. 일부 구체예에서, 주형 스위칭은 역전사 반응이 수행되는 동시에 수행될 수 있다.
일부 구체예에서, 3' 태깅 폴리뉴클레오타이드, 예컨대 분자 바코딩된 폴리뉴클레오타이드는, 또 다른 바코드, 예컨대 용기 바코드를 함유하는 3' 태깅 폴리뉴클레오타이드 또는 이의 상보체에 상보적인 5' 영역, 예컨대 5' 말단 영역을 더 포함할 수 있다. 일부 구체예에서, 분자 바코드 또는 이의 상보체를 함유하는 표적 폴리뉴클레오타이드, 예컨대 태깅된 cDNA 분자는, 또 다른 바코드, 예컨대 용기 바코드를 함유하는 3' 태깅 폴리뉴클레오타이드 또는 이의 상보체에 상보적인 3' 영역, 예컨대 3' 말단 영역을 포함할 수 있다.
일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 용기 바코딩된 폴리뉴클레오타이드이다. 표적 폴리뉴클레오타이드로부터 분자 바코드 또는 이의 상보체를 함유하는 폴리뉴클레오타이드가 생성되면, 용기 바코드가 상기 분자 바코딩된 표적 폴리뉴클레오타이드에 부가될 수 있다. 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드, 예컨대 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 핵산을 부가하는데 사용되는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드, 예컨대 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 핵산을 부가하는 주형으로서 사용되는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드, 예컨대 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드, 예컨대 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 3' 영역, 예컨대 3' 말단 영역을 함유하는 폴리뉴클레오타이드일 수 있다. 용기 바코딩된 폴리뉴클레오타이드는 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 3' 영역, 예컨대 3' 말단 영역을 포함할 수 있다.
3' 태깅 폴리뉴클레오타이드가 분자 바코딩된 표적 폴리뉴클레오타이드에 어닐링되면, 역전사 효소는 계속하여 상기 3' 태깅 폴리뉴클레오타이드, 예컨대 용기 바코딩된 폴리뉴클레오타이드로 상기 cDNA를 신장시킬 수 있고, 그에 의하여 용기 바코드 또는 이의 상보체는 상기 반응에서 표적 폴리뉴클레오타이드 집단, 예컨대 분자 바코딩된 표적 폴리뉴클레오타이드에 부착된다. 예컨대, 3' 태깅 폴리뉴클레오타이드는 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 5' 내지 3' 영역을 함유하는 폴리뉴클레오타이드일 수 있다. 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 상기 5' 내지 3' 영역은 상기 표적 폴리뉴클레오타이드 또는 상기 분자 바코딩된 표적 폴리뉴클레오타이드에 상보적이지 않은 영역을 포함할 수 있다. 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 5' 내지 3' 영역은 용기 바코드를 포함할 수 있다.
일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 증폭된 생성물이다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 단일 분자로부터 기원하는 증폭된 생성물이다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 용기 바코딩된 폴리뉴클레오타이드의 증폭된 생성물이다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 단일 용기 바코딩된 폴리뉴클레오타이드로부터 기원하는 증폭된 생성물이다. 분자 바코딩된 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 상기 5' 내지 3' 영역은 프라이머 또는 이의 상보체에 상보적인 영역을 포함할 수 있다. 분자 바코딩된 표적 폴리뉴클레오타이드는 상기 용기 바코딩된 폴리뉴클레오타이드를 증폭시키는데 사용되었던 프라이머 또는 이의 상보체에 상보적인 영역을 포함할 수 있다.
일부 구체예에서, 상기 3' 태깅 폴리뉴클레오타이드는 상기 분자 바코딩된 cDNA의 증폭을 위한 프라이머, 예컨대 포워드 프라이머로서 작용할 수 있고, DNA 중합효소는 상기 서열을 신장시켜 상기 cDNA에 상보적이고 상기 용기 바코드, 분자 바코드 및 상기 표적 유전자 또는 전사물에 대한 코딩 서열을 함유하는 이중 바코딩된 단일 가닥 폴리뉴클레오타이드 분자를 생성할 수 있다. 일부 구체예에서, 상기 이중 바코딩된 단일 가닥 폴리뉴클레오타이드 분자는 5'부터 3'으로: 용기 바코드, 분자 바코드, 상기 표적 유전자 또는 전사체에 대한 코딩 서열, 및 제1 어댑터를 함유한다. 일부 구체예에서, 상기 용기 바코드를 함유하는 상기 올리고뉴클레오타이드는 제2 어댑터를 함유하고, 상기 이중 바코딩된 단일 가닥 폴리뉴클레오타이드 분자는 5'부터 3'으로: 제2 어댑터, 용기 바코드, 분자 바코드, 상기 표적 유전자 또는 전사체에 대한 코딩 서열, 및 상기 제1 어댑터를 함유한다.
역전사로부터의 결과물인 태깅된 cDNA는, 예컨대 PCR 증촉에 의하여 1 회 이상 증폭될 수 있다. 상기 증폭에 특정 설계된 다양한 프라이머가 사용될 수 있다. 제1 증폭 반응, 예컨대 PCR의 생성물은 제2 증폭 반응, 예컨대 제1 또는 제2 PCR 단계를 이용하여 증폭될 수 있다. 상기 증폭 단계를 위하여 다양한 프라이머가 사용될 수 있다. 증폭된 폴리뉴클레오타이드의 라이브러리는 본 명세서에 기술되는 방법을 이용하여 생성될 수 있다. 일부 예시에서, 결과물 라이브러리는 적절한 분자 및 용기 바코드를 갖는 전체 또는 부분적 항체 또는 TCR 서열을 포함할 수 있다. 상기 라이브러리는 또한 적절한 분자 및 용기 바코드를 갖는 부분적 또는 전체 전사체 중 하나 이상의 전사물에 대응하는 서열을 함유할 수 있다.
이중 바코딩된 표적 폴리뉴클레오타이드, 예컨대 분자 바코드 및 용기 바코드를 함유하는 cDNA는 그 후, 예컨대 PCR에 의하여 증폭될 수 있다. 그 후, 상기 PCR은 예컨대 프라이머 세트를 이용하여 수행될 수 있다. 그 후, 전술한 PCR 반응의 생성물은 예컨대 1 라운드 이상의 PCR에 의하여 1 회 이상 증폭되거나, 직접 시퀀싱될 수 있다. 일부 구체예에서, 상기 프라이머 세트는 상기 제1 및/또는 제2 어댑터(들)에 특이적인 포워드 및/또는 리버스 프라이머(들)을 포함할 수 있다. 일부 구체예에서, 상기 프라이머 세트는 상기 제1 어댑터에 특이적인 포워드 프라이머 및 리버스 프라이머로서 상기 용기 바코드-함유 올리고뉴클레오타이드를 포함할 수 있다. 일부 구체예에서, 상기 프라이머 세트는 상기 제2 및 제1 어댑터에 결합하는 포워드 및 리버스 프라이머 및 추가적인 프라이머, 예컨대 추가적인 포워드 프라이머로서 상기 용기 바코드-함유 올리고뉴클레오타이드를 포함하는 프라이머 세트를 포함할 수 있다. 예시적 프라이머는 본 명세서 실시예에 기술된다.
시퀀싱에 따라, 동일한 분자 바코드를 갖는 서열들은 매칭되거나 페어링될 수 있다. 시퀀싱에 따라, 동일한 용기 바코드를 갖는 서열들은 매칭되거나 페어링될 수 있다. 시퀀싱에 따라, 동일한 표적 서열을 갖는 서열들은 매칭되거나 페어링될 수 있다. 일부 구체예에서, 시퀀싱 판독은 보존 서열 내로 붕괴될 (collapsed) 수 있다. 매칭되거나 페어링된 시퀀싱 판독을 보존 서열 내로 붕괴시키는 것은 그러므로 시퀀싱 및 PCR 오류를 줄이거나 제거할 수 있다. 시퀀싱은 제1 판독을 위하여 제1 프라이머 부위를 이용하여 수행될 수 있다. 시퀀싱은 제2 판독을 위하여 상기 제1 프라이머 부위를 이용하여 수행될 수 있다. 시퀀싱은 제2 판독을 위하여 제2 프라이머 부위를 이용하여 수행될 수 있다.
일부 구체예에서, 동일한 용기 바코드를 함유하는 면역 수용체의 사슬들, 예컨대 TCR 또는 항체의 사슬들이 페어링될 수 있다. 일부 경우에, 동일한 용기 바코드를 함유하는 항체 중쇄 및 경쇄가 페어링될 수 있다. 일부 구체예에서, 페어링된 사슬들은 포유류 벡터 시스템에서 클로닝될 수 있다. 상기 면역 수용체, 예컨대 항체 컨스트럭트는 다른 인간 또는 포유류 숙주 세포주에서 발현될 수 있다. 그 후, 상기 컨스트럭트는 일시적 트랜스펙션 분석 (transient transfection assay) 및 발현된 대상 항체 또는 TCR에 대한 웨스턴 블롯 분석으로 검증될 수 있다.
특정 측면에서, 본 발명은 각 컨스트럭트가 고유한 N-량체 (N-mer)및 기능적 N-량체를 포함하는 복수 개의 핵산 컨스트럭트를 얻는 단계를 포함하는, 고유하게 바코딩된 중쇄 및 경쇄 항체 서열 및/또는 알파 및 베타 사슬 TCR 서열 및/또는 감마 및 델타 사슬 TCR 서열의 라이브러리를 제조하는 방법을 제공한다. 상기 기능적 N-량체는 무작위 N-량체 PCR 프라이머, 범용 프라이머, 항체, 접착성 말단 (sticky end), 또는 임의의 다른 서열일 수 있다. 상기 방법은 각각 고유한 컨스트럭트 카피를 하나 이상 함유하는 N 개의 유체 구획의 M 개 세트를 만드는 단계를 포함할 수 있다. 상기 방법은 세트 내 각각의 구획에 추가적인 컨스트럭트를 부가하고, 각 세트에 대하여 이를 반복하여 각각 고유한 컨스트럭트 쌍을 함유하는 M 개의 구획을 생성하는 것에 의하여 복잡도가 더 높은 바코드 라이브러리를 생성할 수 있다. 상기 쌍은 혼성화 또는 연결되어 (ligated) 새로운 컨스트럭트를 생성한다. 바코드 라이브러리 내 각각의 컨스트럭트에서, 각각의 고유한 N-량체는 시퀀싱, 프로브 혼성화, 기타 방법, 또는 조합된 방법에 의하여 동정되도록 맞춰질 수 있다.
RNA 또는 DNA 증폭 방법은 잘 알려져 있고, 본 명세서에 제시되는 교시 및 가이드에 기초하여 과도한 실험 없이도 본 발명에 따라 이용될 수 있다. DNA 또는 RNA 증폭의 공지된 방법으로는, 중합효소 사슬 반응 (PCR) 및 관련된 증폭 공정 (예컨대, U.S. Pat. Nos. 4,683,195, 4,683,202, 4,800,159, 4,965,188, 여기까지 Mullis, et al.; 4,795,699 및 4,921,794, 여기까지 Tabor, et al; 5,142,033, 여기까지 Innis; 5,122,464, 여기까지 Wilson, et al.; 5,091,310, 여기까지 Innis; 5,066,584, 여기까지 Gyllensten, et al; 4,889,818, 여기까지 Gelfand, et al.; 4,994,370, 여기까지 Silver, et al.; 4,766,067, 여기까지 Biswas; 4,656,134, 여기까지 Ringold, 참조) 및 표적 서열에 대한 안티-센스 RNA를 이중-가닥 DNA 합성의 주형으로서 사용하는 RNA 매개증폭 (U.S. Pat. No. 5,130,238, 여기까지 Malek, et al, 상호 NASBA), 그 참고문헌이 본 명세서에 참조로서 포함되는 전체 내용 (예컨대, [Current Protocols in MolecularBiology (CPMB) (Fred M.Ausubel, et al. ed., John Wiley and Sons, Inc.)]; 또는 [J. Sambrook et al., "Molecular Cloning: A Laboratory Manual," 1989, 2nd Ed., Cold Spring Harbour Laboratory Press: New York, N.Y.] 참조)를 들 수 있으나 이에 국한되는 것은 아니다.
편리하게는, 본 명세서에 기술되는 방법의 단계들, 예컨대 증폭, 시퀀싱 등등은, 그 위에서 복수 개의 기질, 예컨대 항원 등등이 고정화된 고체상을 이용하는 다중체 분석 포맷, 예컨대 어레이로 수행될 수도 아닐 수도 있다. 일부 구체예에서, 상기 어레이는 단백질 바이오칩이다. 단백질 바이오칩을 사용하면, 수백 내지 심지어 수천 개의 항원이 스크리닝 될 수 있다. 본 명세서에서 사용되는 바, "어레이", "마이크로어레이", 또는 "바이오칩"은 흡착제가 부착된 일반적으로 평면성인 표면을 갖는 고체 기재를 말한다. 자주, 상기 바이오칩의 표면은 주소 매김이 가능한 위치를 복수 개 포함하는데, 이 위치들 각각은 그에 흡착제가 결합되어 있다. 바이오칩은 프로브 인터페이스에 맞게끔 조정될 수 있으므로, 프로부로 기능한다. "단백질 바이오칩"은 폴리펩타이드의 포착을 위하여 조정된 바이오칩을 말한다. 다수의 단백질 바이오칩이 이 기술 분야에 알려져 있다. 폴리펩타이드 어레이를 제조하는 방법은, 예컨대 De Wildt et al, 2000, Nat. Biotechnol. 18:989-994; Lueking et al., 1999, Anal. Biochem. 270: 103-1 11; Ge, 2000, Nucleic Acids Res. 28, e3, 1-VH; MacBeath 및 Schreiber, 2000, Science 289: 1760-1763; WO 01/40803 및 WO 99/51773A1에 기술되어 있다. 어레이를 사용하면 스크리닝과 같은 수행될 다수의 단계들이 로봇화되어 및/또는 고-처리량 방식으로 가능하다. 상기 어레이용 폴리펩타이드는, 예컨대 Genetic MicroSystems 또는 BioRobotics의, 예컨대 시판 로봇 장치를 사용하여 고속으로 스폿팅될 수 있다. 상기 어레이 기재는, 예컨대 니트로셀룰로오스, 플라스틱, 유리, 예컨대 표면-개질된 유리일 수 있다. 상기 어레이는 또한 다공성 매트릭스, 예컨대 아크릴아마이드, 아가로오스 또는 다른 고분자를 포함할 수도 있다.
바이오칩 상에 포착시, 분석물은 예를 들어 기상 이온 분광법, 광학적 방법, 전기 화학적 방법, 원자력 현미경 및 무선 주파수 방법으로부터 선택된 다양한 검출 방법에 의해 검출될 수 있다. 질량 분석법, 특히 SELDI의 사용이 특히 중요하다. 광학적 방법은, 예를 들어, 형광율, 발광율, 화학 발광율, 흡광율, 반사율, 투과율, 복굴절률 또는 굴절률의 검출 (예를 들어, 표면 플라즈몬 공명, 타원 편광법, 공명 거울법, 격자 결합 도파관법 및 간섭 측정법)을 포함한다. 광학적 방법에는 현미경 (공초점 및 비-공초점), 이미징 방법 및 비-이미징 방법이 포함된다. 다양한 형식의 면역 분석법 (예컨대, ELISA)는 고체상에 포획된 분석물의 검출을 위한 대중적인 방법이다. 전기 화학적 방법은 전압법 및 전류법을 포함한다. 무선 주파수 방법에는 다극 공명 분광법이 포함된다.
본 발명의 일부 구체예에서, 단일 세포로 작업하거나 특정 세포 집단을 선택하기 위해 확립된 기술이 사용된다. 하나의 예시적인 기술은 FACS에서 사용될 수 있는 특수 액세서리를 포함하여, 단일 세포를 각각의 용기로 편향시킨다. 이러한 액세서리는 시판이고 당업계에 잘 알려져 있다. 이러한 액세서리는 단일 세포를 예를 들어 표준 96 웰 마이크로 타이터 배양 플레이트의 선택된 구획으로 분배하는데 유용하다. 대안으로, 세포는 단일 세포 증착을 보장하기 위해 제한 희석으로 마이크로 타이터 플레이트에 도포될 수 있다.
제2의 기술은 단일 면역 세포의 전사체의 임의적 추가 증폭에서 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 분절을 증폭하기 위하여 상기 단일 면역 세포 상에서 수행되는 PCR이다. 일부 구체예에서, 단일 세포 PCR은 단일 세포에서 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ의 본래 페어링을 보유하는데 사용된다. 항체 또는 TCR의 특이도는 각각 상기 VL 영역 VH 영역, 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 영역 내의 상보성 결정 영역 (CDR)에 의하여 결정된다.
단일-세포 PCR을 수행하는 방법은 잘 알려져 있다 (예컨대, Larrick, J.W. et al., Bio/Technology 7:934 (1989)). 예컨대, B 세포 라이브러리로부터의 항체-생성 B-세포 또는 T-세포 라이브러리로부터의 TCR-생성 T-세포는 고정 용액 또는 포름알데히드, 글루타르알데히드 등등과 같은 화학 물질을 함유하는 용액으로 고정될 수 있다. 이어서, 세포를 예를 들어 변성제를 포함하는 투과 용액으로 투과시킨다. 상기 고정 및 투과화 공정은 세포 내 구획 또는 그 안의 핵산의 과도한 파괴없이, 효소, 뉴클레오타이드 및 다른 시약이 세포 내로 유입될 수 있도록 충분한 다공성을 제공해야 한다. 효소 및 뉴클레오타이드의 첨가는 그 후, 세포로 진입하여 세포 mRNA, 예컨대 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ mRNA를, 예컨대 상응하는 cDNA 서열로 역전사시킬 수 있다. 다른 예에서, 단일 세포 PCR은 본 명세서에 기술된 바와 같이 용해된, 비-고정 세포의 용액에서 수행될 수 있다.
역전사는, 역전사 효소, 충분한 양의 4 가지 dNTP, 및 역전사 효소가 중합을 개시하도록 3' 하이드록실기를 제공하는 mRNA에 결합하는 프라이머를 사용하여, 단일 단계로 또는 임의로 PCR 과정과 함께 수행될 수 있다. 표적-특이적 프라이머 및/또는 무작위 6량체 올리고뉴클레오타이드 프라이머가 사용되어 역전사 반응을 개시하고 고품질 시퀀싱 라이브러리를 생성할 수 있다.
표적 서열의 경우, 표적 mRNA에 상보적인 임의의 프라이머가 사용될 수 있지만, 가변 영역 mRNA의 선택을 용이하게 하기 위하여 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 분자의 3'-말단에 상보적인 프라이머를 사용하는 것이 양호하다. 다수의 연구에 따르면, 축퇴 폴리뉴클레오타이드가 제조되어 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ에 대한 5'-말단 프라이머로서 기능할 수 있는 것으로 밝혀졌다. 표적화 분자를 만드는 조합 라이브러리 방법은 이러한 프라이머에 의존한다. 또한, 다수의 실험에서, PCR이, 단일 세포로부터 대상 유전자 분절, 예컨대 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ를 증폭시킬 수 있는 것으로 밝혀졌다. 단일 세포로도 작업할 수 있는 능력으로 인해, 이러한 PCR 접근법은 대상 면역 세포가 낮은 빈도로 존재하는 경우에 조차 항체를 생성할 수 있다.
일부 구체예에서, FACS 분류 후, 면역 세포 라이브러리의 세포를 풀링하고 역전사-PCR을 전체 세포 풀에서 수행한다. 항체 또는 TCR 클로닝 목적을 위한 mRNA의 생성은 항체 또는 TCR의 제조 및 특징화를 위하여 잘 알려진 과정에 의해 용이하게 달성된다 (예를 들어, 본 명세서에 참조로서 포함되는 [Antibodies: A Laboratory Manual, 1988] 참고). 예를 들어, B-세포 라이브러리로부터의 총 RNA는 당업계에서 표준적이고 통상적인 적절한 방법에 의해 추출된다. 이어서, cDNA는, 적절한 방법, 예를 들어 무작위 6량체 폴리뉴클레오타이드, 또는 C-유전자 또는 C-유전자 패밀리-특이적 프라이머, 또는 V-유전자 또는 V-유전자 패밀리-특이적 프라이머를 사용하여, RNA로부터 합성된다. 다시금, 이들은 전술한 바와 같이 당업자에게 알려진 방법이다. B-세포 또는 T-세포 라이브러리로부터 유래된 핵산 분자의 라이브러리, 예를 들어, 그러한 B 또는 T 림프구로부터 유래된 RNA 또는 cDNA 분자의 라이브러리는, 발현 벡터로 클로닝되어 발현 라이브러리를 형성할 수 있다. 일부 구체예에서, 면역 세포 라이브러리로부터 유래된 VH 또는 Vα 또는 Vγ 도메인 만이 VH 또는 Vα 또는 Vγ 도메인의 라이브러리를 생성하도록 증폭된다. 다른 원으로부터의 VL 또는 Vβ 또는 Vδ 라이브러리는 상기 VH 또는 Vα 또는 Vγ 라이브러리와 함께 사용되어 본 명세서에 기재된 방법을 사용하여 항체 또는 TCR을 생성한다. 항체 또는 TCR 단편의 라이브러리는 VH 및 VL 또는 Vα 또는 Vβ 또는 Vγ 및 Vδ 라이브러리를 당업자에게 공지된 임의의 다수의 방식으로 함께 조합함으로써 구축될 수 있다. 예를 들어, 각각의 라이브러리는 서로 다른 벡터에서 생성될 수 있고, 상기 벡터는 시험관 내 또는 생체 내에서 재조합된다. 대안으로, 상기 라이브러리는 동일한 벡터 내로 순차적으로 클로닝되거나, PCR에 의해 함께 조립된 후 클로닝될 수 있다. 또한, PCR 조립을 사용하여 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ DNA를 가요성 펩타이드 스페이서를 인코딩하는 DNA와 결합시켜 본 명세서에 기재되는 바와 같은 단일 사슬 Fv (scFv) 라이브러리를 형성할 수도 있다. 또 다른 기술에서, 세포-내 PCR 조립은 PCR에 의해 림프구 내에서 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 유전자를 조합한 다음 연관 유전자의 레퍼토리를 클로닝하는데 사용된다.
1. 표적 폴리뉴클레오타이드
구체예에서, 본 명세서에서 제공되는 방법은 표적 폴리뉴클레오타이드 분자, 예컨대 세포의 폴리뉴클레오타이드 분자의 증폭 및 시퀀싱에 관한 것이다. 일부 경우에, 본 명세서에서 제공되는 방법은 표적 폴리뉴클레오타이드 분자의 2 이상의 영역에 대한 증폭 및 시퀀싱에 관한 것이다. 일부 경우에, 본 명세서에서 제공되는 방법은 2 이상의 표적 폴리뉴클레오타이드 분자, 예컨대 2 이상의 자연적으로 페어링되는 분자의 증폭 및 시퀀싱에 관한 것이다. 한 측면에서, 표적 폴리뉴클레오타이드는 RNA이다. 한 측면에서, 표적 폴리뉴클레오타이드는 게놈 핵산이다. 특정 유기체의 염색체 내 유전 물질로부터 유래한 DNA는 게놈 DNA일 수 있다.
일부 구체예에서, "표적 핵산 분자", "표적 폴리뉴클레오타이드", "표적 폴리뉴클레오타이드 분자"라는 언급은 임의의 대상 핵산을 말한다.
일부 구체예에서, 표적 폴리뉴클레오타이드는 면역 수용체, 예컨대 면역 세포에 의하여 생성된 항체 또는 TCR의 가변 영역을 포함하는 서열을 포함한다.
일부 구체예에서, 표적 폴리뉴클레오타이드는 자연적으로 페어링되어 면역 수용체 또는 그의 결합 단편을 생성하는 면역 수용체의 2 이상의 사슬을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 면역 세포에 의하여 생성되는 항체의 중쇄의 가변 영역을 포함하는 서열을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 면역 세포에 의하여 생성되는 항체의 경쇄의 가변 영역을 포함하는 서열을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 상기 동일한 면역 세포에 의하여 생성되는 항체의 중쇄의 가변 영역을 포함하는 서열 및 경쇄의 가변 영역을 포함하는 서열을 포함한다.
본 명세서에서 용어 "항체"는 그러므로, 최광의로 사용되고 폴리클로날 및 모노클로날 항체를 포함하는데, 예컨대 온전한 항체 및 그의 기능적 (항원-결합) 항체 단편, 예컨대 항원 결합 (Fab) 단편, F(ab')2 단편, Fab' 단편, Fv 단편, 재조합 IgG (rIgG) 단편, 단일 사슬 항체 단편, 예컨대 단일 사슬 가변 단편 (scFv), 및 단일 도메인 항체 (예컨대, sdAb, sdFv, 나노바디) 단편을 들 수 있다. 상기 용어는 면역글로불린의 유전적으로 조작된 및/또는 달리 변형된 형태를 포괄하며, 예컨대 인트라바디, 펜티바디, 키메라 항체, 완전 인간 항체, 인간화 항체, 및 헤테로컨쥬게이트 항체, 다중특이적, 예컨대 2-특이적, 항체, 디아바디, 트리아바디, 및 테트라바디, 탠덤 디-scFv, 탠덤 트리-scFv등이다. 달리 설명되지 않으면, 용어 "항체"는 그의 기능적 항체 단편을 포괄하는 것으로 이해되어야 한다. 상기 용어는 또한, 온전한 또는 전장 항체, 예컨대 임의 부류의 또는 하위-부류의 항체, 예컨대 IgG 및 그의 하위-부류, IgM, IgE, IgA 및 IgD를 포괄한다.
"초가변 영역" 또는 "HVR"와 동의어인, 용어 "상보성 결정 영역", 및 "CDR"은 항원 특이성 및/또는 결합 친화도를 부여하는 항체 가변 영역 내 비-연속적 아미노산 서열을 지칭하는 것으로 당업계에 알려져 있다. 일반적으로, 각 중쇄 가변 영역에 3 개의 CDR (CDR-H1, CDR-H2, 및 CDR-H3) 및 각 경쇄 가변 영역에 3 개의 CDR (CDR-L1, CDR-L2, 및 CDR-L3)이 존재한다. "구조 영역" 및 "FR"은 상기 중쇄 및 경쇄의 가변 영역의 비-CDR 부분을 지칭하는 것으로 당업계에 알려져 있다. 일반적으로, 각 전장 중쇄 가변 영역에 4 개의 FR (FR-H1, FR-H2, FR-H3, 및 FR-H4), 및 각 전장 경쇄 가변 영역에 4 개의 FR (FR-L1, FR-L2, FR-L3, 및 FR-L4)이 존재한다.
주어진 CDR 또는 FR의 정확한 아미노산 서열 경계는 다수의 임의의 공지된 방법을 이용하여 쉽게 결정될 수 있는데, 예컨대 [Kabat et al. (1991), "Sequences of Proteins of Immunological Interest," 5th Ed. Public Health Service, National Institutes of Health, Bethesda, MD]("Kabat" 번호매김 방식), [Al-Lazikani et al., (1997) JMB 273,927-948]("Chothia" 번호매김 방식), [MacCallum et al., J. Mol. Biol. 262:732-745 (1996)], ["Antibody-antigen interactions: Contact analysis and binding site topography," J. Mol. Biol. 262, 732-745]("Contact" 번호매김 방식), [Lefranc MP et al., "IMGT unique numbering for immunoglobulin and T cell receptor variable domains and Ig superfamily V-like domains," Dev Comp Immunol, 2003 Jan;27(1):55-77]("IMGT" 번호매김 방식), 및 [Honegger A and Pluckthun A, "Yet another numbering scheme for immunoglobulin variable domains: an automatic modeling and analysis tool," J MolBiol, 2001 Jun 8;309(3):657-70]("Aho" 번호매김 방식)에 설명된 것들이다.
따라서, 달리 명시되지 않는 한, 주어진 항체 또는 그의 영역의, 예컨대 그의 가변 영역의, "CDR" 또는 "상보성 결정 영역" 또는 구체화된 개별적인 CDR (예를 들어, "CDR-H1, CDR-H2)"는 전술한 방식 중 임의의 것에 의해 정의되는 바와 같은 어떠한 (또는 특정) 상보성 결정 영역을 포괄하는 것으로 이해되어야 한다. 예를 들어, 특정 CDR (예를 들어, CDR-H3)이 주어진 VH 또는 VL 아미노산 서열에서 상응하는 CDR의 아미노산 서열을 함유하는 것으로 언급된 경우, 이러한 CDR은 전술한 방식 중 임의의 것에 의하여 정의되는, 가변 영역 내에서 상응하는 CDR (예컨대, CDR-H3)의 서열을 갖는 것으로 이해된다. 일부 구체예에서, 특정 CDR 서열들이 특정된다.
마찬가지로, 달리 명시되지 않는 한, 주어진 항체 또는 그의 영역의, 예컨대 그의 가변 영역의 FR 또는 구체화된 개별적인 FR(들)(예를 들어, FR-H1, FR-H2)은 상기 공지된 방식 중 임의의 것에 의해 정의되는 바와 같은 어떠한 (또는 특정) 구조 영역을 포괄하는 것으로 이해되어야 한다. 일부 경우에, 특정 CDR, FR, 또는 FR(들) 또는 CDR(들)의 식별 방식이 특정되는데, 예컨대 Kabat, Chothia, 또는 Contact 방법에 의해 정의되는 CDR이다. 다른 경우에, CDR 또는 FR의 특정 아미노산 서열이 주어진다.
용어 "가변 영역" 또는 "가변 도메인"은 항체를 항원에 결합시키는데 관여하는 항체 중쇄 또는 경쇄의 도메인을 지칭한다. 천연 항체의 중쇄 및 경쇄 (각각, VH 및 VL)의 가변 도메인은 일반적으로 유사한 구조를 가지며, 각각의 도메인은 4 개의 보존된 구조 영역 (FR) 및 3 개의 CDR을 포함한다 (예를 들어, Kindt et al. Kuby Immunology, 6th ed., W.H. Freeman and Co., page 91 (2007) 참조). 단일 VH 또는 VL 도메인이 항원 결합 특이성을 부여하기에 충분할 수 있다. 또한, 특정 항원에 결합하는 항체는 상기 항원에 결합하는 항체로부터 VH 또는 VL 도메인을 사용하여 단리되어 각각 상보적 VL 또는 VH 도메인의 라이브러리를 스크리닝할 수 있다 (예를 들어, Portolano et al., J. Immunol. 150:880-887 (1993); Clarkson et al., Nature 352:624-628 (1991) 참조).
상기 제공되는 항체 중에는 항체 단편이 있다. "항체 단편"은 온전한 항체가 결합하는 항원에 결합하는 온전한 항체의 부분을 포함하는 온전한 항체 이외의 분자를 지칭한다. 항체 단편의 예는 Fv, Fab, Fab', Fab'-SH, F(ab')2; 디아 바디; 선형 항체; 단일-사슬 항체 분자 (예를 들어, scFv); 및 항체 단편으로부터 형성되는 다중 특이적 항체를 들 수 있으나, 이에 국한되는 것은 아니다. 특정 구체예에 있어서, 항체는 가변 중쇄 영역 및/또는 가변 경쇄 영역을 포함하는 단일-사슬 항체 단편, 예컨대 scFv이다.
B-세포에 의해 발현되는 면역글로불린 (Ig)은, 일부 측면에서, 4 개의 폴리펩타이드 사슬, 2 개의 중쇄 (IgH) 및 2 개의 경쇄 (IgL)로 구성되어 H2L2 구조를 형성하는 단백질이다. IgH 및 IgL 사슬로 이루어지는 각 쌍은 VL 및 VH 영역으로 구성된 초가변 도메인과 불변 도메인을 함유한다. Ig의 IgH 사슬은 여러 유형, μ, δ, γ, α 및 β이다. 개체 내 Ig의 다양성은 주로 상기 초가변 도메인에 의해 결정된다. TCR과 유사하게, IgH 사슬의 V 도메인은 VH, DH 및 JH 유전자 분절의 조합적 결합에 의해 생성된다. Ig 유전자 재배열 과정 중 VH-DH, DH-JH 및 VH-JH 접합에서의 뉴클레오타이드의 독립적인 부가 및 결실은 초가변 도메인 서열 다양성을 더 증가시킨다. 여기서 면역능은 Ig의 다양성에 반영된다.
용어 "가변 영역" 또는 "가변 도메인"은 항체를 항원에 결합시키는데 관여하는 항체 중쇄 또는 경쇄의 도메인을 지칭한다. 천연 항체의 중쇄 및 경쇄 (각각, VH 및 VL)의 가변 도메인은 일반적으로 유사한 구조를 가지며, 각각의 도메인은 4 개의 보존된 구조 영역 (FR) 및 3 개의 CDR을 포함한다 (예를 들어, Kindt et al. Kuby Immunology, 6th ed., W.H. Freeman and Co., page 91 (2007) 참조). 단일 VH 또는 VL 도메인이 항원 결합 특이성을 부여하기에 충분할 수 있다. 또한, 특정 항원에 결합하는 항체는 상기 항원에 결합하는 항체로부터 VH 또는 VL 도메인을 사용하여 단리되어 각각 상보적 VL 또는 VH 도메인의 라이브러리를 스크리닝할 수 있다 (예를 들어, Portolano et al., J. Immunol. 150:880-887 (1993); Clarkson et al., Nature 352:624-628 (1991) 참조).
"초가변 영역"은 항원-결합을 담당하는 항체 또는 TCR의 아미노산 잔기를 지칭한다. 초가변 영역은 상보성 결정 영역 또는 CDR로부터의 아미노산 잔기를 포함한다. 프레임워크 또는 FR 잔기는, 본 명세서에서 정의되는 초가변 영역 잔기 이외의 가변 도메인 잔기이다.
상기 제공되는 항체 중에는 항체 단편이 있다. "항체 단편"은 온전한 항체가 결합하는 항원에 결합하는 온전한 항체의 부분을 포함하는 온전한 항체 이외의 분자를 지칭한다. 항체 단편의 예는 Fv, Fab, Fab', Fab'-SH, F(ab')2; 디아 바디; 선형 항체; 단일-사슬 항체 분자 (예를 들어, scFv); 및 항체 단편으로부터 형성되는 다중 특이적 항체를 들 수 있으나, 이에 국한되는 것은 아니다. 특정 구체예에 있어서, 항체는 가변 중쇄 영역 및/또는 가변 경쇄 영역을 포함하는 단일-사슬 항체 단편, 예컨대 scFv이다.
단일-도메인 항체는, 항체의 중쇄 가변 도메인의 전부 또는 일부 또는 경쇄 가변 도메인의 일부 또는 전부를 포함하는 항체 단편이다. 특정 구체예에서, 단일-도메인 항체는 인간 단일-도메인 항체이다.
항체 단편은 다양한 기술에 의하여 제조될 수 있는데, 예컨대 온전한 항체의 단백질 분해 소화 및 재조합 숙주 세포에 의한 생산을 들 수 있으나 이에 국한되는 것은 아니다. 일부 구체예에서, 항체는 재조합적으로-생성된 단편, 예컨대 자연적으로 존재하지 않는 배열을 포함하는 단편, 예컨대 합성 링커, 예컨대 펩타이드 링커에 의해 결합된 2 개 이상의 항체 영역 또는 사슬을 갖는 것들, 및/또는 자연 발생적인 온전한 항체의 효소 소화에 의해 생성될 수 없는 배열을 포함하는 단편이다. 일부 측면에서, 항체 단편은 scFv이다.
항원-결합 폴리펩타이드는 또한 예를 들어 낙타과 및 상어로부터의 항체와 같은 중쇄 이량체를 포함한다. 낙타과 및 상어 항체는 V-유사 및 C-유사 도메인으로 이루어지는 2 개 사슬의 동종이량체 쌍을 포함한다 (어느 것도 경쇄를 갖지 않음). 낙타과에서의 중쇄 이량체 IgG의 VH 영역은 경쇄와 소수성 상호 작용을 할 필요가 없기 때문에, 보통 경쇄와 접촉하는 중쇄의 영역이 낙타과에서는 친수성 아미노산 잔기로 변경된다. 중쇄 이량체 IgG의 VH 도메인을 VHH 도메인이라고 한다. 상어 Ig-NAR은 하나의 가변 도메인 (V-NAR 도메인으로 지칭됨) 및 5 개의 C-유사 불변 도메인 (C-NAR 도메인)으로 이루어지는 동종이량체를 포함한다. 낙타과에서, 항체 레퍼토리의 다양성은 VH 또는 VHH 영역의 CDR 1, 2 및 3에 의해 결정된다. 낙타 VHH 영역의 CDR3은, 평균 16 개 아미노산 길이인 비교적 긴 길이를 특징으로 한다 (Muyldermans et al., 1994, Protein Engineering 7 (9): 1129).
"인간화" 항체는 모든 또는 실질적으로 모든 CDR 아미노산 잔기가 비-인간 CDR로부터 유래되고, 모든 또는 실질적으로 모든 FR 아미노산 잔기가 인간 FR로부터 유래되는 항체이다. 인간화 항체는 임의로 인간 항체로부터 유래된 항체 불변 영역의 적어도 일부를 포함할 수 있다. 비-인간 항체의 "인간화 형태"는 모체 비-인간 항체의 특이성 및 친화도를 보유하면서 인간화, 전형적으로 인간에 대한 면역원성을 감소시키는 인간화를 거친 비-인간 항체의 변이체를 지칭한다. 일부 구체예에서, 인간화 항체의 일부 FR 잔기는 예를 들어 항체 특이성 또는 친화도를 회복 또는 개선시키기 위하여 비-인간 항체 (예를 들어, 그 CDR 잔기가 유래된 항체)로부터의 상응하는 잔기로 치환된다.
제공되는 항체 중에는 인간 항체가 있다. "인간 항체"는 인간 또는 인간 세포, 또는 인간 항체 레퍼토리 또는 다른 인간 항체-인코딩 서열, 예커대 인간 항체 라이브러리를 이용하는 비-인간 공급원에 의해 생성된 항체의 그것에 대응하는 아미노산 서열을 갖는 항체이다. 상기 용어는, 비-인간 항원-결합 영역, 예를 들어 모든 또는 실질적으로 모든 CDR이 비-인간인 것들을 포함하는 비-인간 항체의 인간화 형태를 배제한다.
인간 항체는, 항원의 도전에 반응하여 온전한 인간 항체 또는 인간 가변 영역을 갖는 온전한 항체를 생성하도록 변형된 트랜스제닉 동물에 면역원을 투여함으로써 제조될 수 있다. 이러한 동물은 통상 내인성 면역글로불린 유전자좌를 대체하거나, 또는 염색체 외에 존재하거나 동물의 염색체 내로 무작위 혼입된 인간 면역글로불린 유전자좌의 전부 또는 일부를 함유한다. 이러한 트랜스제닉 동물에서, 내인성 면역글로불린 유전자좌는 일반적으로 불활성화되어있다. 인간 항체는 또한 인간 레퍼토리로부터 유래된 항체-인코딩 서열을 함유하는, 인간 항체 라이브러리, 예컨대 파지 디스플레이 및 무-세포 라이브러리로부터 유래될 수 있다.
제공되는 항체 중에는 단일 클론 항체, 예컨대 단일 클론 항체 단편이 있다. 본 명세서에서 사용되는 용어 "단일 클론 항체"는 실질적으로 균질한 항체 집단으로부터 또는 그 안에서 수득된 항체를 말하며, 즉 상기 집단인 개별 항체들은 자연 발생적 돌연변이를 함유하거나 단일 클론 항체의 생산 중 발생하는 가능한 변이체를 제외하고는 동일한데, 이러한 변이체는 일반적으로 소량 존재한다. 통상 여러 에피토프에 대한 것인 서로 다른 항체들을 포함하는 다클론 항체 제제와는 달리, 단일 클론 항체 제제의 각각의 단일 클론 항체는 항원상의 단일 에피토프에 대한 것이다. 상기 용어는 어떠한 특정 방법에 의한 항체의 생산을 요구하는 것으로 해석되어서는 아니된다. 단일 클론 항체는 다양한 기술에 의하여 제조될 수 있고, 예컨대 하이브리도마로부터의 생성, 재조합 DNA 방법, 파지-디스플레이 및 다른 항체 디스플레이 방법을 포함하지만 이에 국한되는 것은 아니다.
일부 구체예에서, 표적 폴리뉴클레오타이드는 면역 세포에 의해 생성 된 TCR의 알파 사슬의 가변 영역을 포함하는 서열을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 면역 세포에 의해 생성된 TCR의 베타 사슬의 가변 영역을 포함하는 서열을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 동일한 면역 세포에 의해 생성된 TCR의 알파 사슬의 가변 영역을 포함하는 서열 및 그러한 TCR의 베타 사슬의 가변 영역을 포함하는 서열을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 면역 세포에 의해 생성된 TCR의 감마 사슬의 가변 영역을 포함하는 서열을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 면역 세포에 의해 생성된 TCR의 델타 사슬의 가변 영역을 포함하는 서열을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 동일한 면역 세포에 의해 생성된 TCR의 감마 사슬의 가변 영역을 포함하는 서열 및 그러한 TCR의 델타 사슬의 가변 영역을 포함하는 서열을 포함한다.
일부 구체예에서, TCR은 전장 TCR 뿐만 아니라 이의 항원-결합 부분 또는 항원-결합 단편 (MHC-펩타이드 결합 단편으로도 불림)을 포함한다. 일부 구체예에서, TCR은 온전한 또는 전장 TCR이다. 일부 구체예에서, TCR은 전장 TCR보다 작지만 MHC 분자, 즉 MHC-펩타이드 복합체에 결합된 (즉, 그러한 맥락의) 특정 항원 펩타이드에 결합하는 항원-결합 부분이다. 일부 경우에, TCR의 항원-결합 부분 또는 단편은 전장 또는 온전한 TCR의 구조적 도메인의 일부만을 함유할 수 있지만, 여전히 상기 전장 TCR이 결합하는 에피토프 (예를 들어, MHC-펩타이드 복합체)에 결합할 수 있다. 일부 경우에, TCR의 항원-결합 부분 또는 단편은, 예를 들어, 각각의 사슬이 3 개의 상보성 결정 영역을 함유하는 경우인, 특정 MHC-펩타이드 복합체에 결합하기 위한 결합 부위를 형성하기에 충분한, TCR의 가변 도메인, 예컨대 가변 α 사슬 및 가변 β 사슬을 함유한다. 항원-결합 도메인인 또는 항원-결합 도메인과 동종인 결합 도메인을 갖는 폴리펩타이드 또는 단백질이 포함된다. 상보성 결정 영역 (CDR) 이식된 항체 및 TCR 및 기타 인간화 항체 및 TCR (CDR 변형 및 구조 영역 변형 포함)도 이 용어에 의해 고려된다. 면역글로불린 사슬 (예를 들어, 중쇄 및 경쇄)에 대해서만 상기 언급이 이루어질 수 있지만, 상기 기술되는 발명은 다수의 기타 여러 유형의 한 쌍의 서열, 예를 들어 T-세포 수용체 사슬 쌍 (TCRα 및 TCRβ 사슬 및 TCRγ 및 TCRδ 사슬)에 적용될 수 있고, 면역글로불린에 국한되지 않는다.
다양한 암 또는 감염성 유기체와 관련된 항원을 인식하는 T-세포의 능력은, 알파 (α) 사슬 및 베타 (β) 사슬 또는 감마 (γ) 및 델타 (δ) 사슬로 구성된 그 TCR에 의해 부여된다. 이들 사슬을 구성하는 단백질은 DNA에 의하여 인코딩되는데, 이는 TCR의 엄청난 다양성을 생성하기 위해 독특한 메커니즘을 채용한다. 이러한 다중-서브유닛 면역 인식 수용체는 CD3 복합체와 결합하고 항원-제시 세포 (APC)의 표면 상의 MHC 클래스 I 및 II 단백질에 의해 제시되는 펩타이드에 결합한다. APC 상의 항원성 펩타이드로의 TCR 결합은 T-세포 활성화의 중심 사건이며, 이는 T-세포와 APC 사이의 접촉점의 면역학적 시냅스에서 일어난다.
각 TCR은 구조 영역 (FR) 뿐만 아니라 가변적인 상보성 결정 영역 (CDR)을 포함한다. α 및 β 사슬 가변 도메인의 제3 상보성 결정 영역 (CDR3) 루프의 아미노산 서열은 각각 β 사슬 유전자좌 내의 가변 (Vβ), 다양성 (Dβ) 및 결합 (Jβ) 유전자 분절 사이의, 및 α 사슬 유전자좌 내 유사 Vα 및 Jα 유전자 분절 사이의 재조합으로부터 발생하는 αβ T-세포의 서열 다양성을 크게 결정한다. TCR α 및 β 사슬 유전자좌에 다수의 이러한 유전자 분절의 존재는 다수의 다른 CDR3 서열이 인코딩될 수 있게 한다. TCR 유전자 재배열 과정 중의 Vβ-Dβ, Dβ-Jβ 및 Vα-Jα 접합에서의 뉴클레오타이드의 독립적인 부가 및 결실은 CDR3 서열 다양성을 더 증가시킨다. 이와 관련하여 면역능은 TCR의 다양성에 반영된다.
항원-결합 단편을 포함하는 TCR 단편이 또한 제공된다. 일부 구체예에서, TCR은 그의 항원-결합 부분, 예컨대 그의 막 횡단 및/또는 이의 세포질 영역(들)을 함유하지 않는 전장 TCR의 변이체이며, 이는 완전 가용성 TCR로 지칭될 수 있다. 일부 구체예에서, TCR은 이량체 TCR (dTCR)이다. 일부 구체예에서, TCR은 단일-사슬 TCR (scTCR), 예컨대 PCT 특허 공개 번호 WO 03/020763, WO 04/033685, 또는 WO 2011/044186에 기재된 바와 같은 구조를 갖는 scTCR이다. 특정 구체예에서, TCR은 베타 사슬 가변 영역에 연결된 알파 사슬 가변 영역을 포함하는 단일-사슬 TCR 단편, 예컫내 scTv이다. 일부 구체예에서, scTv는 또한 scFv로 지칭된다.
단일-사슬 Fv 또는 scFv는 일부 측면에서 항체의 가변 중쇄 (VH) 및 가변 경쇄 (VL) 도메인 또는 TCR의 가변 알파 또는 감마 사슬 (Vα 또는 Vγ) 및 가변 베타 또는 델타 사슬 (Vβ 또는 Vδ) 도메인을 포함하는 항체 또는 TCR 단편을 지칭하는데, 여기서 이들 도메인은 단일 폴리펩타이드 사슬에 존재한다. 일반적으로, Fv 폴리펩타이드는 scFv가 항원 결합을 위해 원하는 구조를 형성할 수 있게 하는 VH 및 VL 도메인 또는 Vα 및 Vβ 도메인 또는 Vγ 및 Vδ 도메인 사이의 폴리펩타이드 링커를 더 포함한다.
디아바디는 일부 측면에서 2 개의 항원-결합 부위를 갖는 작은 항체 및/또는 TCR 단편을 지칭하며, 이들 단편은 동일한 폴리펩타이드 사슬에서 VL에 연결된 VH (VH-VL) 또는 동일한 폴리펩타이드 사슬에서 Vβ에 연결된 Vα (Vα-Vβ) 또는 동일한 폴리펩타이드 사슬에서 Vδ에 연결된 Vγ (Vγ-Vδ)를 포함한다. 동일한 사슬 상 두 도메인 사이의 페어링을 허용하기에는 너무 짧은 링커를 사용함으로써, 상기 도메인들은 다른 사슬의 상보적 도메인과 페어링되어 2 개의 항원-결합 부위를 생성해야 한다. 예시적인 디아바디는 예를 들어 EP404097 및 WO93111161에보다 상세히 기재되어 있다.
이중 특이적 항체 또는 이중 특이적 TCR은 일부 측면에서 2 가지 상이한 유형의 항원에 대한 특이성을 나타내는 항체 또는 TCR을 지칭한다. 본 명세서에서 사용되는 용어는 구체적으로, 제한 없이, 표적 항원 및 특정 조직으로의 전달을 용이하게 하는 기타 표적에 대한 결합 특이성을 나타내는 항체 및 TCR을 포함한다. 유사하게, 다중-특이적 항체 및 TCR은 2 이상의 결합 특이성을 갖는다.
선형 항체 또는 선형 TCR은 일부 측면에서 한 쌍의 항원 결합 영역을 형성하는 한 쌍의 탠덤 Fd 분절 (예를 들어, VH-CH1-VH-CH1 또는 Vα-Cα1-Vα-Cα1)을 지칭한다. 선형 항체 및 TCR은 예를 들어 [Zapata et al., Protein Eng. 8 (10):1057-1062 (1995)]에 기재된 것과 같이 이중 특이정 또는 단일 특이적일 수 있다.
항원-결합 도메인은 일부 측면에서 항원에 특이적으로 결합하는 능력을 보유하는 항체 또는 TCR의 하나 이상의 단편을 지칭한다. 이러한 용어에 포함되는 항체 단편의 비-제한적 예는 (i) VL, VH, CL 및 CH1 도메인으로 구성된 1가 단편인, Fab 단편; (ii) 힌지 영역에서 이황화 브릿지에 의해 연결된 2 개의 Fab 단편을 함유하는 2가 단편인, F(ab')2 단편; (iii) VH 및 CH1 도메인으로 구성된 Fd 단편; (iv) 항체의 단일 필 (arm)의 VL 및 VH 도메인을 함유하는 Fv 단편, 예컨대 scFv (v) VH 도메인을 함유하는, dAb 단편 (Ward et al., (1989) Nature 341:544 546); 및 (vi) 단리된 CDR을 들 수 있으나, 이에 국한되는 것은 아니다. 이러한 정의에는 단일 중쇄 및 단일 경쇄를 포함하는 항체 또는 단일 알파 사슬 또는 단일 베타 사슬을 갖는 TCR이 추가로 포함된다.
"F(ab')2" 및 "Fab'" 모이어티는 Ig를 펩신 및 파파인과 같은 프로테아제로 처리함으로써 생성될 수 있으며, 두 중쇄 각각의 힌지 영역들 사이에 존재하는 이황화 결합 근처에서 면역글로불린을 분해함으로써 생성되는 항체 단편을 포함한다. 예를 들어, 파파인은 두 중쇄 각각의 힌지 영역들 사이에 존재하는 이황화 결합의 IgG 상류를 절단하여, VL 및 CL로 구성된 경쇄와 VH 및 CHγ1 (중쇄의 불변 영역의 γ1 영역)으로 구성된 중쇄 단편이 이황화 결합을 통해 그들의 C 말단 영역에서 연결된, 2 개의 상동성 항체 단편을 생성한다. 이러한 2 개의 상동성 항체 단편 각각을 'Fab'이라고 부른다. 펩신은 또한 두 중쇄 각각의 힌지 영역들 사이에 존재하는 이황화 결합의 IgG 하류를 절단하여 상기 언급된 2 개의 'Fab'가 힌지 영역에서 연결된 상기 단편보다 약간 더 큰 항체 단편을 생성한다. 이 항체 단편을 F('ab')2라고 부른다. Fab 단편은 또한 경쇄의 불변 도메인 및 중쇄의 제1 불변 도메인 (CH1)을 함유한다. 'Fab' 단편은, 중쇄 CH1 도메인의 카르복실 말단에 항체 힌지 영역으로부터의 하나 이상의 시스테인(들)을 포함하는 몇 개의 잔기를 부가함으로써 Fab 단편과 상이하다. Fab'-SH는 본 명세서에서 불변 도메인의 시스테인 잔기(들)이 자유 티올기를 함유하는 Fab'에 대한 명칭이다. F(ab')2 항체 단편은 그들 사이에 힌지 시스테인을 갖는 Fab' 단편의 쌍으로서 처음에 생성된다.
Fv는 일부 측면에서 완전한 항원-인식 및 항원-결합 부위를 함유하는 항체 또는 TCR 단편을 지칭한다. 이 영역은, 단단한 비-공유 결합으로, 하나의 중쇄 및 하나의 경쇄 가변 도메인 또는 하나의 TCRα 사슬 및 하나의 TCRβ 사슬 또는 하나의 TCRγ 사슬 및 하나의 TCRδ 사슬로 이루어지는 이량체로 구성된다. 이러한 구성에서, 각각의 가변 도메인의 3 개의 CDR은 상호 작용하여 VH-VL 이량체 또는 Vα-Vβ 이량체 또는 Vγ-Vδ 이량체의 표면 상에 항원-결합 부위를 정의한다. 종합적으로, VH 및 VL 사슬 또는 Vα 및 Vβ 사슬 또는 Vγ 및 Vδ 사슬 각각으로부터의 하나 이상의 CDR의 조합이 항체 또는 TCR에 항원-결합 특이성을 부여한다. 예를 들어, CDRH3 및 CDRL3은, 수용자 선택된 항체, TCR 또는 그의 항원-결합 단편의 VH 및 VL 사슬 또는 Vα 및 Vβ 사슬 또는 Vγ 및 Vδ 사슬로 전달될 때, 항체 또는 TCR에 항원-결합 특이성을 부여하기에 충분할 수 있고, 이러한 CDR의 조합이 결합, 친화도 등에 대하여 시험될 수 있음이 이해될 것이다. 단일한 가변 도메인 (또는 항원에 특이적인 3 개의 CDR만을 포함하는 Fv의 절반) 조차도, 비록 제2 가변 도메인과 조합될 때보다 낮은 친화도로 그러할 것 같다 하더라도, 항원을 인식하고 결합시킨다. 또한, Fv 단편의 2 개의 도메인 (VL 및 VH 또는 Vα 및 Vβ 또는 Vγ 및 Vδ)이 별도의 유전자에 의해 코딩되지만, 이들은, 그들을 VL 및 VH 또는 Vβ 및 Vβ 또는 Vγ 및 Vδ 사슬 영역들이 페어링하여 1가 분자를 형성하는 하나의 단일한 단백질 사슬 (단일 사슬 Fv (scFv)로 알려짐; Bird et al. (1988) Science 242:423-426; Huston et al. (1988) Proc. Natl. Acad. Sci. USA 85:5879-5883; 및 Osbourn et al. (1998) Nat. Biotechnol. 16:778)로서 생성되게끔 할 수 있는 합성 링커에 의한 재조합 방법을 사용하여 결합된다. 이러한 scFv는 또한 항체의 "항원-결합 부분"이라는 용어 내에 포괄되는 것으로 의도된다. 완전 Ig (예를 들어, IgG) 분자 또는 다른 이소형을 인코딩하는 발현 벡터를 생성하기 위해, 특정 scFv의 임의의 VH 및 VL 서열은 Fc 영역 cDNA 또는 게놈 서열에 연결될 수 있다. VH 및 VL은 또한 단백질 화학 또는 재조합 DNA 기술을 사용하여 Fab, Fv 또는 다른 Ig 단편의 생성에 사용될 수 있다.
"생식선 (germline) 서열"은 생식선 (일배체 생식체 및 그로부터 이들이 형성되는 이배체 세포)로부터의 유전자 서열을 지칭한다. 생식선 DNA는 단일 Ig 중쇄 또는 경쇄, 또는 단일 TCRα 또는 TCRβ 사슬, 또는 단일 TCRγ 또는 TCRδ 사슬을 인코딩하는 다수의 유전자 분절을 함유한다. 이들 유전자 분절은 생식 세포 내에 보유되지만 기능성 유전자로 배열될 때까지는 전사 및 번역될 수 없다. 골수에서의 B-세포 및 T-세포 분화 동안, 이들 유전자 분절은 108 개 이상의 특이성을 생성할 수 있는 역동적인 유전자 시스템에 의해 무작위로 셔플링된다. 이들 유전자 분절의 대부분은 생식선 데이터베이스에 의해 공개되고 수집된다.
일부 구체예에서, 면역 분자는 중화 항체 또는 중화 TCR이거나 그들일 가능성이 있다. 일부 측면에서, 중화 항체 또는 TCR은, 그 중화가 달성되는 메커니즘에 관계없이 바이러스 또는 박테리아와 같은 병원체의 복제를 억제하는 항체 또는 TCR이다.
일부 구체예에서, 샘플, 예컨대 세포 집단 또는 단일 세포는 면역 레퍼토리, 예를 들어 항체 레퍼토리 또는 TCR 레퍼토리를 함유할 수 있으며, 이는 상기 제공되는 방법에 의해 설명될 수 있다. 일부 구체예에서, 항체 레퍼토리 또는 TCR 레퍼토리는, 항체, TCR 또는 이의 단편의 집합체를 지칭한다. 일부 구체예에서, 항체 레퍼토리는 예를 들어 특정 항체를 선별하거나 결합 능력, 결합 특이성, 위장 수송 능력, 안정성, 친화도 등과 같은 특정 성질에 대하여 스크리닝하는데 사용될 수 있다. 상기 용어는 구체적으로 항체 및 TCR 라이브러리, 예컨대 모든 형태의 조합적 라이브러리, 예컨대, 항체 파지 디스플레이 라이브러리, 예컨대, 제한없이, 임의 기원의 단일-사슬 Fv (scFv) 및 Fab 항체 파지 디스플레이 라이브러리, 예컨대 나이브, 합성 및 반-합성 라이브러리를 포함한다.
표적 폴리뉴클레오타이드는 사실상 임의의 공급원으로부터 얻어질 수 있고 당업계에 공지된 방법을 사용하여 제조될 수 있다. 예를 들어, 표적 폴리뉴클레오타이드는, 제한없이, 유기체 또는 세포 (예를 들어, 면역 세포)로부터 게놈 DNA 또는 mRNA의 단편을 추출하여 표적 폴리뉴클레오타이드를 수득하는 것을 포함하는, 당업계에 공지된 방법을 사용하여 증폭없이 직접적으로 단리될 수 있다. 표적 폴리뉴클레오타이드는 또한 역전사-PCR을 통해 RNA (예컨대 mRNA)로부터 생성된 cDNA를 포괄할 수 있다. 일부 경우에, 표적 폴리뉴클레오타이드는 RNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 mRNA 분자, 또는 mRNA 분자로부터 생성된 cDNA이다. 일부 경우에, 표적 폴리뉴클레오타이드는 단일 면역 세포로부터의 mRNA 분자, 또는 상기 mRNA 분자로부터 생성된 cDNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 개별적인 면역 세포들로부터의 mRNA 분자, 또는 상기 mRNA 분자로부터 생성된 cDNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 단일 면역 세포로부터의 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 개별적인 면역 세포들로부터의 중쇄 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 단일 면역 세포로부터의 중쇄 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 개별 면역 세포들로부터의 경쇄 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 단일 면역 세포로부터의 경쇄 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 개별 면역 세포들로부터의 항체 가변 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 단일 면역 세포로부터의 가변 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 개별 면역 세포들로부터의 가변 경쇄 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 단일 면역 세포로부터의 가변 경쇄 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 개별 면역 세포들로부터의 가변 중쇄 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 단일 면역 세포로부터 가변 중쇄 항체 서열을 인코딩하는 mRNA 분자이다. 일부 경우에, 표적 폴리뉴클레오타이드는 무-세포 핵산, 예를 들어 DNA 또는 RNA일 수 있다. 일부 경우에, 표적 폴리뉴클레오타이드는 개별 면역 세포들로부터의 가변 알파, 베타, 감마 및/또는 델타 사슬 TCR 서열을 인코딩하는 mRNA 분자이다.
본 명세서에 기재된 방법은 시퀀싱을 위해 하나 이상의 표적 폴리뉴클레오타이드로부터 폴리뉴클레오타이드의 라이브러리를 생성하는데 사용될 수 있다. 표적 폴리뉴클레오타이드는 증폭 반응의 생성물이 아닌 임의의 대상 폴리뉴클레오타이드를 포함한다. 예를 들어, 표적 폴리뉴클레오타이드는 생물학적 샘플 내 폴리뉴클레오타이드를 포함할 수 있다. 예를 들어, 표적 폴리뉴클레오타이드는 PCR 반응의 생성물을 포함하지 않는다. 예를 들어, 표적 폴리뉴클레오타이드는 증폭 반응의 생성물을 생성하는데 사용된 폴리뉴클레오타이드 주형을 포함할 수 있지만, 증폭 생성물 자체는 포함하지 않는다. 예를 들어, 표적 폴리뉴클레오타이드는 역전사 반응 또는 프라이머 연장 반응의 생성물을 생성하는데 사용되는 폴리뉴클레오타이드 주형을 포함할 수 있고, 역전사 반응 또는 프라이머 연장 반응 생성물 자체도 포함할 수 있다. 예를 들어, 표적 폴리뉴클레오타이드는 역전사 반응 또는 프라이머 연장 반응 대상일 수 있는 대상 폴리뉴클레오타이드를 포함한다. 예를 들어, 표적 폴리뉴클레오타이드는 RNA 또는 DNA를 포함한다. 예를 들어, 표적 폴리뉴클레오타이드는 cDNA를 포함한다. 일부 구체예에서, 표적 RNA 폴리뉴클레오타이드는 mRNA이다. 일부 구체예에서, 표적 RNA 폴리뉴클레오타이드는 폴리아데닐화된다. 일부 구체예에서, RNA 폴리뉴클레오타이드는 폴리아데닐화되지 않는다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 DNA 폴리뉴클레오타이드이다. DNA 폴리뉴클레오타이드는 게놈 DNA일 수 있다. DNA 폴리뉴클레오타이드는 엑손, 인트론, 비번역 영역, 또는 그의 임의의 조합을 포함할 수 있다.
일부 구체예에서, 라이브러리는 표적 폴리뉴클레오타이드의 2 개 이상의 영역으로부터 생성될 수 있다. 일부 구체예에서, 방법 라이브러리는 2 개 이상의 표적 폴리뉴클레오타이드로부터 생성될 수 있다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 염색체로부터 유래된 게놈 핵산 또는 DNA이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 다형성 (polymorphism) 또는 돌연변이와 같은 변이체를 포함하는 서열을 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 RNA가 아닌, DNA를 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 DNA가 아닌, RNA를 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 DNA 및 RNA를 포함한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 mRNA 분자이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 DNA 분자이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 단일 가닥 폴리뉴클레오타이드이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 이중 가닥 폴리뉴클레오타이드이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 이중 가닥 폴리뉴클레오타이드의 단일 가닥이다.
표적 폴리뉴클레오타이드는 임의의 생물학적 샘플로부터 수득될 수 있고 당업계에 공지된 방법을 사용하여 제조될 수 있다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 증폭없이 직접 단리된다. 직접 단리 방법은 당업계에 공지되어있다. 비-제한적인 예는 생물학적 샘플, 유기체 또는 세포로부터의 게놈 DNA 또는 mRNA를 추출하는 것을 포함한다.
일부 구체예에서, 하나 이상의 표적 폴리뉴클레오타이드가 생물학적 샘플로부터 정제된다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 그가 함유된 생물학적 샘플로부터 정제되지 않는다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 생물학적 샘플로부터 단리된다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 그가 함유된 생물학적 샘플로부터 단리되지 않는다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 무-세포 핵산일 수 있다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 단편화된 핵산일 수 있다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 전사 된 핵산일 수 있다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 변형된 폴리뉴클레오타이드이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 비-변형 폴리뉴클레오타이드이다.
일부 구체예에서, 표적 폴리뉴클레오타이드는 단일 세포로부터의 폴리뉴클레오타이드이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 개별적인 세포들로부터 유래된다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 복수의 세포를 함유하는 샘플로부터의 폴리뉴클레오타이드이다.
일부 구체예에서, 표적 폴리뉴클레오타이드는 바이오마커 서열을 인코딩한다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 2 개 이상의 바이오마커 서열을 인코딩한다. 일부 구체예에서, 복수 개의 표적 폴리뉴클레오타이드가 바이오마커 서열을 인코딩한다. 일부 구체예에서, 복수 개의 표적 폴리뉴클레오타이드는 2 개 이상의 바이오마커 서열을 인코딩한다. 일부 구체예에서, 복수 개의 표적 폴리뉴클레오타이드는 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 개 이상의 바이오마커 서열을 인코딩한다.
일부 구체예에서, 복수 개의 표적 폴리뉴클레오타이드는 면역글로불린 서열 패널을 포함한다. 일부 구체예에서, 복수 개의 표적 폴리뉴클레오타이드는 TCR 서열 패널을 포함한다. 예를 들어, 면역글로불린 서열의 패널은 VH 및/또는 VL 서열일 수 있다. 일부 구체예에서, 면역글로불린 또는 TCR 서열의 패널은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 면역글로불린 또는 TCR 서열을 함유한다. 일부 구체예에서, 면역글로불린 또는 TCR 서열의 패널은 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 3000, 4000, 5000, 6000, 7000, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 20,000, 25,000, 30,000, 35,000, 40,000, 45,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, lxl06, 2xl06, 3xl06, 4xl06, 5l06, 6xl06, 7xl06, 8xl06, 9xl06, lxl07, 2xl07, 3xl07, 4xl07, 5xl07, 6xl07, 7xl07, 8xl07, 9xl07, lxl08, 2xl08, 3xl08, 4xl08, 5xl08, 6xl08, 7xl08, 8xl08, 9xl08, lxl09, 2xl09, 3xl09, 4xl09, 5xl09, 6xl09, 7xl09, 8xl09, 9xl09, lxl010, 2xl010, 3xl010, 4xl010, 5xl010, 6xl010, 7xl010, 8xl010, 9xl010, lxl011, 2xl011, 3xl011, 4xl011, 5xl011,6xl011, 7xl011, 8xl011, 9xl011, lxl012, 2xl012, 3xl012, 4xl012, 5xl012, 6xl012, 7xl012, 8xl012, 또는 9xl012 개의 면역글로불린 또는 TCR 서열을 함유한다. 일부 구체예에서, 면역글로불린 또는 TCR 서열의 패널은 최대 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 20,000, 25,000, 30,000, 35,000, 40,000, 45,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, lxl06, 2xl06, 3xl06, 4xl06, 5l06, 6xl06, 7xl06, 8xl06, 9xl06, lxl07, 2xl07, 3xl07, 4xl07, 5xl07, 6xl07, 7xl07, 8xl07, 9xl07, lxl08, 2xl08, 3xl08, 4xl08, 5xl08, 6xl08, 7xl08, 8xl08, 9xl08, lxl09, 2xl09, 3xl09, 4xl09, 5xl09, 6xl09, 7xl09, 8xl09, 9xl09, lxl010, 2xl010, 3xl010, 4xl010, 5xl010, 6xl010, 7xl010, 8xl010, 9xl010, lxl011, 2xl011, 3xl011, 4xl011, 5xl011,6xl011, 7xl011, 8xl011, 9xl011, lxl012, 2xl012, 3xl012, 4xl012, 5xl012, 6xl012, 7xl012, 8xl012, 또는 9xl012 개의 면역글로불린 또는 TCR 서열을 함유한다. 일부 구체예에서, 면역글로불린 또는 TCR 서열의 패널은 약 about 10-20, 10-30, 10-40, 10-30, 10-40, 10-50, 10-60, 10-70, 10-80, 10-90, 10-100, 50-60, 50-70, 50-80, 50-90, 50-100, 100-200, 100-300, 100-400, 100-300, 100-400, 100-500, 100-600, 100-700, 100-800, 100-900, 100-1000, 500-600, 500-700, 500-800, 500-900, 500-1000, 1000-2000, 1000-3000, 1000-4000, 1000-3000, 1000-4000, 1000- 5000, 1000-6000, 1000-7000, 1000-8000, 1000-9000, 1000-10000, 5000-6000, 5000-7000, 5000- 8000, 5000-9000, 5000-10000, 1-1x105, 1-2x 105, 1-3x105, 1-4x 105, 1-5x 105, 1-6x 105, 1-7x105, 1- 8x105, 9x105, 1-1x106, 1-2x106, 1-3x106, 1-4x106, 1-5x106, 1-6x106, 1-7x106, 1-8x106, 9x106,1- lx107, 1-2x107, 1-3x107, 1-4x107, 1-5x107, 1-6x107, 1-7x107, 1-8x107, 1-9x107, 1-1x108, 1-2x108, 1-3x108, 1-4x108, 1-5x108, 1-6x108, 1-7x108, 1-8x108, 1-9x108, 1-1x109, 1-2x109, 1-3x109, 1-4x109, 1-5x109, 1-6x109,1-7x109, 1-8x109, 1-9x109,1-1x1010, 1-2x1010, 1-3x1010, 1-4x1010, 1-5x1010, 1-6x1010, 1-7x1010, 1-81010, 1-9x1010, 1-1x1011, 1-2x1011, 1-3x1011, 1-4x1011, 1-5x1011, 1-6x1011, 1-7x1011, 1- 8x1011, 1-9x1011, 1-1x1012, 1-2x1012, 1-3x1012, 1-4x1012, 1-5x1012, 1-6x1012, 1-7x1012, 1-8x1012, 또는 1-9x1012 개의 면역글로불린 또는 TCR 서열을 함유한다.
일부 구체예에서, 표적 폴리뉴클레오타이드는 약 about 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 또는 20,000 개 염기 또는 염기-쌍 길이이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 또는 20,000 개 염기 또는 염기-쌍 길이이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 최대 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 또는 20,000 개 염기 또는 염기-쌍 길이이다. 일부 구체예에서, 표적 폴리뉴클레오타이드는 약 10-20, 10-30, 10-40, 10- 30, 10-40, 10-50, 10-60, 10-70, 10-80, 10-90, 10-100, 50-60, 50-70, 50-80, 50-90, 50-100, 100-200, 100-300, 100-400, 100-300, 100-400, 100-500, 100-600, 100-700, 100-800, 100-900, 100-1000, 500-600, 500-700, 500-800, 500-900, 500-1000, 1000-2000, 1000-3000, 1000-4000, 1000-3000, 1000-4000, 1000-5000, 1000-6000, 1000-7000, 1000-8000, 1000-9000, 1000-10000, 5000-6000, 5000-7000, 5000-8000, 5000-9000, 또는 5000-10000 개 염기 또는 염기-쌍 길이이다. 일부 구체예에서, 상기 표적 폴리뉴클레오타이드 또는 그의 단편의 평균 길이는 약 100, 200, 300, 400, 500, 또는 800 개 염기 쌍 미만, 또는 약 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200 개 뉴클레오타이드 미만, 또는 약 1, 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 킬로베이스 미만이다. 일부 구체예에서, 비교적 짧은 주형으로부터의 표적 서열, 예컨대 표적 폴리뉴클레오타이드를 함유하는 샘플은 약 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100 개 염기이다. 특정 구체예에서, 시퀀싱 데이터는 질병 또는 질환 상태와 관련된 서열 또는 면역글로불린 또는 TCR 서열을 함유하는 데이터베이스를 이용하여 공지의 또는 기대되는 서열에 대하여 정렬된다.
2. 폴리뉴클레오타이드의 집합체, 예컨대, 전사체
게놈 또는 전사체 폴리뉴클레오타이드에 상응하는 폴리뉴클레오타이드 집합체는 하나의 세포 또는 복수 개의 세포와 같은 사실상 임의의 공급원으로부터 얻을 수 있으며, 당업계에 공지된 방법을 사용하여 제조될 수 있다. 예를 들어, 폴리뉴클레오타이드의 집합체는, 유기체 또는 세포 (예컨대, 면역 세포)로부터 게놈 DNA 또는 mRNA의 단편을 추출하여 상기 폴리뉴클레오타이드의 집합체를 얻는 것을 제한 없이 포함하는 당업계에 공지된 방법을 사용하여 증폭없이 단일 세포 또는 복수 개의 세포로부터 직접 단리될 수 있다. 게놈 또는 전사체 폴리뉴클레오타이드의 집합체는 또한 역전사-PCR을 통해 RNA (예컨대 mRNA)로부터 생성된 cDNA를 포괄 할 수 있다. 일부 경우에, 폴리뉴클레오타이드의 집합체는 RNA 분자의 집합체이다. 일부 경우에, 폴리뉴클레오타이드의 집합체는 mRNA 분자의 집합체, 또는 mRNA 분자로부터 생성된 cDNA 분자의 집합체이다. 일부 경우에, 폴리뉴클레오타이드의 집합체는 단일 면역 세포로부터의 mRNA 분자, 또는 mRNA 분자로부터 생성된 cDNA 분자의 집합체이다. 일부 경우에, 폴리뉴클레오타이드의 집합체는 개별적인 면역 세포들로부터의 mRNA 분자, 또는 mRNA 분자로부터 생성된 cDNA 분자의 집합체이다.
본 명세서에 기재된 방법은 시퀀싱을 위해 하나 이상의 세포로부터의 폴리뉴클레오타이드의 집합체를 함유하는 라이브러리를 생성하는데 사용될 수 있다. 폴리뉴클레오타이드의 집합체는 생물학적 샘플로부터 하나 또는 복수 개의 세포의 mRNA 전사체와 같은 게놈 DNA 또는 RNA로부터 유래될 수 있다. 예를 들어, mRNA와 같은 게놈 DNA 또는 세포 RNA는 역전사 반응 또는 프라이머 연장 반응과 같은 증폭 반응의 생성물을 생성하기 위한 주형으로서 사용될 수 있다. 일부 예에서, 폴리펩타이드의 집합체는 cDNA로부터 생성될 수 있다. 일부 구체예에서, 폴리뉴클레오타이드의 집합체는 mRNA인 RNA 폴리뉴클레오타이드로부터 생성되고, 상기 집합체는 실질적으로 생물학적 샘플로부터 하나 이상의 세포의 전사체를 나타낸다. 일부 구체예에서, 폴리뉴클레오타이드의 전사체는 폴리아데닐화된 RNA 폴리뉴클레오타이드로부터 생성된다. 일부 구체예에서, RNA 폴리뉴클레오타이드는 폴리아데닐화되지 않는다. 일부 구체예에서, 폴리뉴클레오타이드의 집합체는 DNA 폴리뉴클레오타이드로부터 생성된다. DNA 폴리뉴클레오타이드는 게놈 DNA일 수 있다. DNA 폴리뉴클레오타이드는 엑손, 인트론, 비번역 영역, 또는 이의 임의의 조합을 포함할 수있다. 예를 들어, 본 발명의 폴리뉴클레오타이드의 집합체는 적어도 5, 10, 100, 250, 500, 750, 1,000, 2,500, 5,000, 10,000, 25,000, 50,000, 75,000, 10,000, 250,000, 500,000, 750,000, 1,000,000, 2,500,000, 5,000,000, 7,500,000, 또는 10,000,000 개의 서브 세트 또는 개별 세포, 예컨대 상이한 항체 또는 TCR을 발현하는 개별 면역 세포 또는 그의 서브 세트에 대한 게놈 또는 전사체 정보를 함유할 수 있다.
일부 구체예에서, 폴리뉴클레오타이드의 집합체는 무작위적 6량체 프라이머를 사용하는 역전사 효소 또는 프라이머 연장 반응에 의해 생성될 수 있다. 일부 구체예에서, 폴리뉴클레오타이드의 집합체는 폴리 A 뉴클레오타이드 서열에 대한 프라이머를 사용하여 역전사 효소 또는 프라이머 연장 반응에 의해 생성 될 수 있다. 일부 예에서, 폴리뉴클레오타이드의 집합체는 올리고-dT를 사용하는 역전사 효소 또는 프라이머 연장 반응에 의해 생성될 수 있다. 일부 예에서, 프라이머는 비오티닐화될 수 있다. 폴리뉴클레오타이드의 집합체는, 선택적으로, 역전사 또는 프라이머 연장 반응 후 정제될 수 있다. 예를 들어, 비오티닐화된 프라이머를 사용하여 생성된 폴리뉴클레오타이드의 집합체는 스트렙타비딘 정제 기술을 사용하여 임의로 정제될 수 있다. 다른 구체예에서, 폴리뉴클레오타이드는 하나 이상의 친화성 정제, 아가로오스 겔 전기영동에 의해 정제될 수 있다.
3. 액적 라이브러리
일반적으로, 액적 라이브러리는 단일 집합체에 함께 풀링되는 다수의 라이브러리 요소로 구성된다. 라이브러리는 복잡성에 있어서 단일 라이브러리 요소부터 lxl015 라이브러리 요소 또는 그 이상까지 다양할 수 있다. 각 라이브러리 요소는 고정 농도에서 하나 이상의 주어진 요소이다. 상기 요소는 세포, 비드, 아미노산, 단백질, 폴리펩타이드, 핵산, 폴리뉴클레오타이드 또는 소분자 화학 화합물 일 수 있으나, 이에 국한되지는 않는다. 상기 요소는 분자 바코드, 용기 바코드 또는 양자 모두와 같은 식별자를 포함할 수 있다.
세포 라이브러리 요소는 하이브리도마, B-세포, T-세포, 1 차 세포, 배양된 세포주, 암 세포, 줄기 세포, 또는 임의의 다른 세포 유형을 포함할 수 있지만, 이에 국한되지는 않는다. 세포 라이브러리 요소는 개별 액적에 1 천 내지 수 만개의 다수의 세포를 캡슐화함으로써 제조된다. 캡슐화된 세포의 수는 보통 세포의 수 밀도 및 액적의 부피로부터 푸아송 통계에 의해 주어진다. 그러나, 몇몇 경우에 [Edd et al., "Controlled encapsulation of single-cells intomonodisperse picoliter drops." Lab Chip, 8(8): 1262-1264, 2008]에 설명된 것처럼 그 수는 푸아송 통계에서 벗어난다. 세포의 개별적 (discreet) 특성은 라이브러리를 복수 개의 세포, 예컨대 하나의 항체 또는 TCR 각각을 생성하는 면역 세포의 변이체를 이용하여 대량으로 제조되도록 하는데, 모두 단일 출발 배지에 존재하고 그 후 배지는 최대 하나의 세포를 함유하는 개별 용기로, 예컨대 액적 또는 캡슐로 나뉘어진다. 개별 용기 내의 세포, 예를 들어 소적 또는 캡슐은 그 후 용해되고, 상기 용해된 세포로부터 용기 내 방출된 폴리뉴클레오타이드, 예컨대 표적 mRNA 또는 DNA를 포함하는 세포 mRNA 및 게놈 DNA (예를 들어, 중쇄 및 경쇄 폴리뉴클레오타이드 및/도는 알파 및 베타 사슬 폴리뉴클레오타이드 및/또는 감마 및 델타 사슬 폴리뉴클레오타이드)는 분자 바코드 및 용기 바코드로 바코딩되고 증폭된다. 이중 바코딩된 폴리뉴클레오타이드 생성물은 그 후 조합되거나 풀링되어 전사체 또는 게놈 및 표적 (예를 들어, 중쇄 및 경쇄 및/또는 알파 및 베타 사슬 및/또는 감마 및 델타 사슬) 라이브러리 요소로 구성된 라이브러리를 형성한다. 특히, 전사체 및 표적 라이브러리가 풀링된다.
비드 기반 라이브러리 요소는 하나 이상의 비드를 함유하고, 항체, 효소 또는 다른 단백질과 같은 다른 시약을 함유할 수도 있다. 모든 라이브러리 요소가 상이한 유형의 비드를 함유하지만 동일한 주변 배지를 함유하는 경우, 라이브러리 요소는 모두 단일 출발 유체로부터 제조될 수 있거나 다양한 출발 유체를 가질 수 있다. 변이체의 집합체로부터 대량으로 제조된 세포 라이브러리의 경우, 라이브러리 요소는 다양한 출발 유체로부터 제조될 것이다. 복수 개의 세포로 시작할 때, 하나 이상의 세포를 함유하는 단 몇 개의 액적과 함께 액적당 정확히 하나의 세포를 갖는 것이 바람직하다. 일부 경우에, 푸아송 통계로부터의 변이는 액적의 로딩 개선을 제공하기 위하여 달성될 수 있는데, 그로써 액적당 정확히 하나의 세포를 갖는 액적들은 더 많고, 빈 액적 또는 하나 이상의 세포를 함유하는 액적의 예외는 적다.
일부 구체예에서, 복수 개의 용기 바코딩된 폴리뉴클레오타이드로 시작할 때, 하나 이상의 용기 바코딩된 폴리뉴클레오타이드를 함유하는 단 몇 개의 액적과 함께 액적당 정확히 하나의 용기 바코딩된 폴리뉴클레오타이드를 갖는 것이 바람직하다. 일부 경우에, 푸아송 통계로부터의 변이는 액적의 로딩 개선을 제공하기 위하여 달성될 수 있는데, 그로써 액적당 정확히 하나의 용기 바코딩된 폴리뉴클레오타이드를 갖는 액적들은 더 많고, 빈 액적 또는 하나 이상의 용기 바코딩된 폴리뉴클레오타이드를 함유하는 액적의 예외는 적다.
액적 라이브러리의 예는 비드, 세포, 소분자, DNA, 프라이머, 항체 및 바코딩된 폴리뉴클레오타이드 범위의, 여러 컨텐츠을 갖는 액적의 집합체이다. 액적의 크기는 대략 직경 0.5 미크론 내지 500 미크론 범위이고, 이는 약 1 피코리터 내지 1 나노리터에 해당한다. 그러나, 액적은 5 미크론만큼 작고 500 미크론만큼 클 수 있다. 좋기로는, 액적은 직경 100 미크론 미만, 약 1 미크론 내지 약 100 미크론이다. 가장 양호한 크기는 직경 약 20 내지 40 미크론 (10 내지 100 피코리터)이다. 시험되는 액적 라이브러리의 바람직한 특성은 삼투압 균형, 균일한 크기 및 크기 범위를 포함한다.
본 발명에 의해 제공되는 액적 라이브러리 내에 포함되는 액적은 크기가 균일한 것이 양호하다. 즉, 라이브러리 내의 임의의 액적의 직경은, 동일한 라이브러리 내의 다른 액적의 직경과 비교할 때 5%, 4%, 3%, 2%, 1% 또는 0.5% 미만으로 변할 것이다. 라이브러리 내의 액적의 균일한 크기는 액적의 안정성 및 무결성을 유지하는데 중요할 수 있으며, 또한, 본 명세서에 기술된 다양한 생물학적 및 화학적 분석을 위해 라이브러리 내에서의 액적의 후속 사용에 필수적일 수 있다.
본 발명은 비혼화성 유체 내 복수 개의 수성 액적을 포함하는 액적 라이브러리를 제공하며, 여기서 각 액적은 좋기로는 실질적으로 크기가 균일하고 다른 라이브러리 요소를 포함한다. 본 발명은, 상이한 라이브러리 요소를 포함하는 단일 수성 유체를 제공하는 것, 각각의 라이브러리 요소를 비혼화성 유체 내의 수성 액적 내로 캡슐화하는 것을 포함하는 액적 라이브러리를 형성하는 방법을 제공한다.
특정 구체예에서, 상이한 유형의 요소 (예를 들어, 세포 또는 비드)는 동일한 배지에 함유된 단일 공급원에 풀링된다. 초기 풀링 후, 요소들은 액적 내에 캡슐화되어 상이한 유형의 비드 또는 셀을 갖는 각각의 액적은 상이한 라이브러리 요소인 액적 라이브러리를 생성한다. 초기 용액의 희석은 캡슐화 공정을 가능하게 한다. 일부 구체예에서, 형성된 액적은 단일 요소를 함유하거나 또는 아무것도 함유하지 않을 것이다, 즉 비어있을 것이다. 다른 구체예에서, 형성된 액적은 라이브러리 요소의 다중 카피를 함유할 것이다. 캡슐화되는 요소는 일반적으로 유형의 변이형이다. 하나의 예에서, 요소는 혈액 샘플의 면역 세포이고, 각 면역 세포는 그 면역 세포에서 뉴클레오타이드의 항체 서열을 증폭시키고 바코딩하기 위해 캡슐화된다.
예를 들어, 일 유형의 에멀젼 라이브러리에는, 상이한 배지에서 다른 입자, 즉 세포 또는 바코딩된 폴리뉴클레오타이드를 갖고, 풀링 전에 캡슐화되는 라이브러리 요소가 있다. 일 예에서, 특정 수의 라이브러리 요소, 즉 n 개의 상이한 세포, 또는 바코딩된 폴리뉴클레오타이드는 상이한 배지 내에 함유된다. 라이브러리 요소 각각은 별도로 유화되고 풀링되며, 이 시점에서 n 개의 서로 다른 풀링된 라이브러리 요소 각각은 조합되고 단일 풀로 풀링된다. 결과적인 풀은 각각이 상이한 유형의 입자를 함유하는 복수 개의 유-중-수 (water-in-oil) 에멀젼 액적을 함유한다.
일부 구체예에서, 형성된 액적은 단일 라이브러리 요소를 함유하거나 아무것도 함유하지 않을 것, 즉 비어있을 것이다. 다른 구체예에서, 형성된 액적은 라이브러리 요소의 다중 카피를 함유할 것이다. 비드의 컨텐츠는 푸아송 분포를 따르며, 여기서는 사건이 마지막 사건 이래 시간과 독립적으로 그리고 공지의 평균 속도로 발생하면, 일정 기간 내 발생하는 이들 사건의 수의 확률을 표현하는 이산 확률 분포가 있다. 라이브러리를 생성하기 위해 사용된 오일 및 계면 활성제는 액적들 간 라이브러리의 컨텐츠 교환을 방지한다.
B. 단일-세포 이중 바코딩된 폴리뉴클레오타이드 라이브러리를 제조하는 방법
일부 구체예에서,
(a) 복수 개 용기 각각 내에서 세포를 용해하는 단계로서, 여기서 상기 용기 각각은 세포 집단을 포함하는 샘플로부터의 세포, 복수 개의 분자 바코딩된 올리고뉴클레오타이드 및 용기 바코딩된 올리고뉴클레오타이드를 포함하는 제1 어댑터를 포함하는 것인 단계; (b) 각각의 용기에서 (i) 상기 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드(들)에 상보적인 하나 이상의 표적 단일-가닥 폴리뉴클레오타이드(들); 및 (ii) 각각이 세포 내 폴리뉴클레오타이드에 상보적인 단일-가닥 폴리뉴클레오타이드의 집합체를 포함하는 복수 개의 단일-가닥 폴리뉴클레오타이드를 생성하는 단계; (c) 각각의 단일-가닥 폴리뉴클레오타이드에 상기 복수 개의 분자 바코딩된 올리고뉴클레오타이드 중 하나를 부착시켜, 그에 의하여 각각이 고유한 분자 바코드를 포함하는 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드를 생성시키는 단계; (d) 상기 용기 바코딩된 올리고뉴클레오타이드 또는 이의 증폭된 생성물을 포함하는 상기 제1 어댑터를 상긱 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 부착시켜, 그에 의하여 복수 개의 이중-바코딩된 단일-가닥 폴리뉴클레오타이드를 생성시키는 단계로서, 여기서 동일 용기 내 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 동일한 용기 바코드를 포함하는 것인 단계; 및 (e) 제 어댑터를 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드에 부가하는 단계로서, 여기서 상기 제1 어댑터 및 제2 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드 각각의 반대 말단에 또는 그 근처에 존재하는 것인 단계
를 포함하는, 폴리뉴클레오타이드를 제조하는 방법이 제공된다. 상기 폴리뉴클레오타이드 라이브러리가 제조되는 예시적인 용기는 웰, 에멀젼, 액적 또는 마이크로캡슐을 포함한다.
1. 샘플 제조
폴리뉴클레오타이드를 함유하는 세포 집단을 함유하는 샘플을 포함하는 임의의 생물학적 샘플이 본 명세서에 기재된 방법에 사용될 수 있다. 세포를 함유하는 임의의 샘플은 일반적으로 본 명세서에 기술된 방법에 사용될 수 있다. 예를 들어, 샘플은 대상체로부터의 생물학적 샘플이거나 또는 RNA 또는 DNA를 함유하는 그로부터 유래된 샘플로부터의 생물학적 샘플일 수 있다. 폴리뉴클레오타이드는 상기 생물학적 샘플로부터 추출될 수 있거나, 또는 상기 샘플은 폴리뉴클레오타이드의 추출 또는 정제없이 상기 방법에 직접 적용될 수 있다. 시료는 추출된 또는 단리된 DNA 또는 RNA일 수 있다. 샘플은 또한 생물학적 표본, cDNA 라이브러리, 바이러스 또는 게놈 DNA로부터 추출된 총 RNA 또는 DNA일 수 있다. 일 구체예에서, 폴리뉴클레오타이드는 단백질, 지질 및 비-주형 핵산과 같은 다양한 다른 성분을 함유하는 생물학적 샘플로부터 단리된다. 핵산 주형 분자는 동물, 식물, 박테리아, 진균 또는 임의의 다른 세포 유기체로부터 수득된 임의의 세포 물질로부터 얻어질 수 있다.
특정 구체예에서, 폴리뉴클레오타이드는 단일 세포, 예컨대 세포 집단에 존재하는 세포로부터 수득된다. 폴리뉴클레오타이드는 유기체로부터 또는 유기체로부터 얻은 생물학적 샘플로부터 직접 얻을 수 있다. 임의의 조직 또는 체액 표본이 본 발명에서 사용하기 위한 핵산 공급원으로서 사용될 수 있다. 폴리뉴클레오타이드는 또한 1 차 세포 배양 또는 세포주와 같은 배양된 세포로부터 단리될 수 있다. 일부 구체예에서, 세포는 혈액 세포, 면역 세포, 조직 세포, 또는 종양 세포 일 수 있다. 일부 구체예에서, 세포는 면역 세포, 예컨대 B 세포 또는 T 세포이다. B 세포는 혈장 모세포, 기억 B 세포 또는 혈장 세포일 수 있다. 주형 핵산이 수득되는 세포 또는 조직은, 바이러스 또는 다른 세포 내 병원체로 감염될 수 있다.
일부 구체예에서, 면역 세포를 함유하는 집단과 같은 세포 집단은 대상체 또는 숙주의, 예컨대 인간 또는 기타 동물, 예컨대 면역화되었거나 감염, 암, 자가면역 질환 또는 임의의 다른 질병을 앓고 있는 인간 또는 기타 동물의 혈액 또는 기타 생물학적 샘플로부터 단리될 수 있다. 일부 구체예에서, 인간은 질병으로 진단되거나, 질병의 증상을 나타내거나, 질병으로 진단되지 않거나, 또는 질병의 증상을 나타내지 않을 수 있다. 일부 구체예에서, 대상체 또는 숙주, 예를 들어 인간 대상체는 감염 제제 (예를 들어, 바이러스, 박테리아, 기생충, 프리온 등), 항원, 질병 또는 질병이나 질환 상태와 관련된 항원, 예를 들어 종양-관련 항원에 노출되 및/또는 그에 대한 TCR을 생성할 수 있는 대상체일 수 있다. 일부 구체예에서, 면역 세포는 T 세포를 함유하는 임의의 생물학적 샘플, 예컨대 PBMC, 비장 또는 다른 림프 기관에 존재하는 세포로부터 유래될 수 있다. 일부 구체예에서, 면역 세포는 건강한 대상체의 정상적인 T 세포 공급원으로부터 유래된다. 일부 구체예에서, 면역 세포는 병에 걸린 대상체의 T 세포 공급원으로부터 유래된다. 일부 구체예에서, CD4+ 또는 CD8+ 세포가 단리되거나 수득될 수 있다. 어떤 경우에는 말초 혈액 단핵 세포 (PBMC)를 단리하거나 얻을 수 있다. 일부 경우에, 종양-침윤 림프구 (TIL)는 단리되거나 수득될 수 있다.
특정 구체예에서, 항체 또는 TCR-생성 면역 세포는 잠재적 임상적 중요성의 병원체-, 암-, 및/또는 질병-특이적 항체 또는 TCR을 확인하기 위해 대상체 또는 숙주의, 예컨대 인간 또는 기타 동물, 예컨대 면역화되었거나 감염, 암, 자가면역 질환 또는 임의의 다른 질병을 앓고 있는 인간 또는 기타 동물의 혈액 또는 기타 생물학적 샘플로부터 단리될 수 있다. 예컨대, 상기 인간은 질병으로 진단되거나, 질병의 증상을 나타내거나, 질병으로 진단되지 않거나, 또는 질병의 증상을 나타내지 않을 수 있다. 예컨대, 상기 인간은 감염 제제 (예를 들어, 바이러스, 박테리아, 기생충, 프리온 등), 항원, 질병에 노출 및/또는 감염 제제 (예를 들어, 바이러스, 박테리아, 기생충, 프리온 등), 항원, 또는 질병에 대한 유용한 항체 또는 TCR을 생성할 수 있는 인간일 수 있다. 일부 예에서, 인간과 같은 동물은 더 이상 질병 또는 질환 상태의 증상을 나타내지 않는다. 면역화된 숙주로부터의 특정 면역 세포는 하나 이상의 표적 항원 및/또는 하나 이상의 미지의 항원에 대한 항체 또는 TCR을 생성한다. 본 발명에서, 림프구 풀은 형광-활성화 세포 분류 (FACS), 자기적 활성화 세포 분류 (MACS), 패닝 또는 다른 스크리닝 방법을 사용하여 세포를 스크리닝 및 분류하는 것과 같은 임의의 적합한 방법에 의해 원하는 면역 세포를 농축시켜 (enriched), 항체 사슬이 시퀀싱되기 전, 항체가 만들어지기 전, 또는 발현 라이브러리 또는 라이브러리들이 만들어지기 전에, 샘플로부터 복수 개의 면역 세포, 예컨대 면역 세포 라이브러리를 생성할 수 있다. 상이한 항체를 발현하는 단지 몇 가지 서브세트의 면역 세포를 제공, 따라서 단지 몇 가지의 자연 발생적 가변 도메인의 조합만을 제공하는 종래 기술의 농축 방법과 달리, 본 발명의 면역 세포 라이브러리는 적어도 2 개의 서브세트의, 또는 개별적인, 여러 가지 항체 또는 TCR을 발현하는 면역 세포를 함유한다. 예컨대, 본 발명의 면역 세포 라이브러리는 적어도 5, 10, 100, 250, 500, 750, 1,000, 2,500, 5,000, 10,000, 25,000, 50,000, 75,000, 10,000, 250,000, 500,000, 750,000, 1,000,000, 2,500,000, 5,000,000, 7,500,000, 또는 10,000,000 개 서브세트의 또는 개별적인, 여러 가지 항체 또는 TCR을 발현하는 면역 세포를 함유한다. 본 발명의 방법은 면역 세포 회수를 극대화하고, 매우 높은 다양성을 제공한다.
T 세포는 말초 혈액 단핵 세포, 골수, 흉선, 조직 생검, 종양, 림프절 조직, 장 관련 림프 조직, 점막 관련 림프 조직, 비장 조직, 또는 임의의 다른 림프 조직 및 종양을 포함하는 다수의 공급원으로부터 얻을 수 있다. T 세포는 T 세포주 및 자가 또는 동종이계 공급원으로부터 얻을 수 있다. T 세포는 단일 개체 또는 개체 집단, 예를 들어 암 또는 감염성 질병과 같은 동일한 질병을 앓고 있는 개체 집단으로부터 수득될 수 있다. 일부 구체예에서, 개체의 순환 혈액으로부터의 세포는 성분 채집술 또는 백혈구 채집술에 의해 수득된다. 성분 채집물은 통상 림프구, 예컨대 T 세포, 단핵구, 과립구, B 세포, 기타 유핵 백혈구, 적혈구 및 혈소판을 함유한다. 한 구체예에서, 성분 채집술 또는 백혈구 채집술에 의해 수집된 세포는 세척되어 혈장 분획을 제거하고 세포를 후속 처리 단계에 적합한 완충제 또는 배지에 넣을 수 있다. 본 발명의 한 구체예에서, 세포는 인산염 완충 식염수 (PBS)로 세척된다. 대안의 구체예에서, 세척액은 칼슘을 결여하고 마그네슘을 결여할 수 있거나 또는 모든 2가 양이온이 아니라면 다수를 결여할 수 있다. 당업자라면 쉽게 이해할 수 있을 바와 같이, 세척 단계는 반자동 "플로우-쓰루" 원심 분리기를 사용하는 것과 같은, 당업자에게 공지된 방법에 의해 달성될 수 있다.
세척 후, 세포는 다양한 생체 적합성 완충액에 재현탁될 수 있는데, 예컨대 Ca++/Mg++ 무함유 PBS이다. 대안으로, 성분 채집 샘플 중 원치 않는 요소는 제거될 수 있고 세포는 배양 배지에 직접 재현탁될 수 있다. 다른 구체예에서, T 세포는 적혈구 용해 및 PERCOLL™ 구배를 통한 원심 분리에 의해 말초 혈액 림프구로부터 단리된다. T 세포 중 특정 아집단, 예컨대 CD28+, CD4+, CD8+, CD45RA+ 및 CD45RO+T 세포가 양성 또는 음성 선별 기술에 의해 추가로 분리될 수 있다. 예를 들어, CD3+, CD28+ T 세포는, CD3/CD28 결합 자기 비드 (예를 들어, DYNABEADS® M-450 CD3/CD28 T Cell Expander)를 사용하여 양성 선별될 수 있다.
일부 구체예에서, 음성 선별에 의한 T 세포 집단의 농축은 음성적으로 선별되는 세포에 고유한 표면 마커에 대한 항체들의 조합에 의해 달성될 수 있다. 이러한 방법 중 하나는 음성으로 선별되는 세포 상에 존재하는 세포 표면 마커에 대한 단일 클론 항체 칵테일을 사용하는 음성 자기적 면역흡착 또는 유세포 분석을 통한 세포 분류 및/또는 선별이다. 예를 들어, 음성 선별에 의해 CD4+ 세포를 농축하기 위하여, 단일 클론 항체 칵테일은 통상 CD14, CD20, CD11b, CD16, HLA-DR 및 CD8에 대한 항체를 포함한다. 자극을 위한 T 세포를 제조하는 다른 방법은 세척 단계 후에 세포를 동결시키는 것이며, 이는 단핵구 제거 단계를 필요로 하지 않는다. 동결 및 후속하는 해동 단계는, 세포 집단에서 과립구를, 그리고 어느 정도로 단핵구를 제거함으로써 보다 균일한 생성물을 제공할 수 있다. 혈장 및 혈소판을 제거하는 세척 단계 후, 세포는 동결 용액에 현탁될 수 있다. 많은 동결 용액 및 파라미터가 당업계에 공지되어 있고 이러한 맥락에서 유용할 것이지만, 하나의 방법은 20% DMSO 및 8% 인간 혈청 알부민 (HSA)을 함유하는 PBS 또는 다른 적합한 세포 동결 배지를 사용하는 것을 포함한다. 이어서, 이를 DMSO 및 HSA의 최종 농도가 각각 10% 및 4%가 되도록, 배지로 1:1로 희석시킨다. 이어서, 세포를 분당 1℃의 속도로 -80℃까지 동결시키고 액체 질소 저장 탱크의 기상에 저장한다.
일부 구체예에서, 세포 집단은 샘플로부터 농축된다. 일부 구체예에서, 세포는 세포의 특정 서브세트 또는 아형에 대해 농축된다. 일부 구체예에서, 세포 집단은 T 세포 또는 B 세포에 대해 농축되거나 이를 함유한다. 일부 구체예에서, 세포 집단은 CD4+ 또는 CD8+ 세포에 대해 농축되거나 이를 함유한다. 일부 구체예에서, 세포 집단은 중앙 기억 T 세포, 이펙터 기억 T 세포, 나이브 T 세포, 줄기 중앙 기억 T 세포, 이펙터 T 세포 및 조절 T 세포에 대하여 농축되거나 이를 함유한다. 일부 구체예에서, 세포 집단은 기억 B-세포, 나이브 B-세포 또는 형질아세포 B-세포에 대하여 농축되거나 이를 함유한다.
일부 구체예에서, 면역 세포는 선택된 표적 항원 또는 복합체에 대한 세포로부터의 면역 수용체의 친화도에 기초하여 선별될 수 있다. 일부 측면에서, 친화도는 2 개 작용제의 가역적 결합에 대한 평형 상수를 지칭하고 KD로 표현된다. 리간드에 대한 결합 단백질의 친화도, 예컨대 에피토프에 대한 항체의 친화도 또는 예컨대 MHC-펩타이드 복합체에 대한 TCR의 친화도는, 예를 들어 약 100 나노몰 (nM) 내지 약 0.1 nM, 약 100 nM 내지 약 1 피코몰 (pM), 또는 약 100 nM 내지 약 1 펨토몰 (fM)일 수 있다. 용어 "결합성 (avidity)"은 희석 후 해리에 대한 2 이상의 제제로 이루어지는 복합체의 내성을 지칭한다.
일부 구체예에서, 에피토프는, 일부 측면에서, 항체 또는 TCR의 가변 영역 결합 포켓과 결합 상호 작용을 형성할 수 있는 항원 또는 다른 거대 분자의 일부를 지칭한다. 이러한 결합 상호 작용은 하나 이상의 CDR의 하나 이상의 아미노산 잔기와의 분자간 접촉으로서 나타날 수 있다. 항원 결합은, 예를 들어, VH 및 VL 사슬의 CDR3, CDR3 쌍 또는 일부 경우에 최대 6 개의 모든 CDR의 상호 작용을 포함할 수 있다. 에피토프는 선형의 펩타이드 서열일 수 있거나 (즉, "연속적") 비연속 아미노산 서열로 구성될 수 있다 (즉, "구조적" 또는 "불연속적"). 항체 또는 TCR은 하나 이상의 아미노산 서열을 인식할 수 있으며; 따라서 에피토프는 하나 이상의 별개의 아미노산 서열을 정의할 수 있다. 일부 측면에서, TCR은 MHC의 맥락에서 하나 이상의 아미노산 서열 또는 에피토프를 인식할 수 있다. 항체 및 TCR에 의해 인식되는 에피토프는 당업자에게 공지된 펩타이드 맵핑 및 서열 분석 기술에 의해 결정될 수 있다. 결합 상호 작용은 CDR의 하나 이상의 아미노산 잔기와의 분자간 접촉으로 나타난다.
일부 구체예에서, 예컨대 면역 세포, 예를 들어 항체 또는 TCR 상에 발현되는 특이적 결합을 하는 면역 수용체에 대한 언급은, 항체 또는 TCR이 그 항체 또는 TCR에 의하여 인식되는 에피토프를 함유하는 항원 이외의 분자에 대해 어떠한 유의한 결합도 나타내지 않을 상황을 지칭한다. 이 용어는 또한 예를 들어, 항원 결합 도메인이 다수의 항원에 의해 보유되는 특정 에피토프에 대하여 특이적인 경우에도 적용 가능하며, 이 경우, 상기 항원 결합 도메인을 보유하는 선별된 항체, TCR 또는 이의 항원 결합 단편은 상기 에피토프를 보유하는 다양한 항원에 결합할 수 있을 것이다.
용어 "우세하게 결합하는" 또는 "특이적으로 결합하는"은 항체, TCR, 또는 이의 단편이, 그가 미관련 아미노산 서열에 결합하는 것보다 더 큰 친화도로 하나의 에피토프에 결합하고, 그 에피토프를 함유하는 다른 폴리펩타이드에 대한 교차-반응성이라면, 그들이 인간에 사용 투여용으로 제형화된 수준에서 독성이 없다는 것을 의미한다. 일 측면에서, 이러한 친화도는, 미관련 아미노산 서열에 대한 상기 항체, TCR 또는 그의 단편의 친화도보다, 적어도 1 배 이상, 적어도 2 배 이상, 적어도 3 배 이상, 적어도 4 배 이상, 적어도 5 배 이상, 적어도 6 배 이상, 적어도 7 배 이상, 적어도 8 배 이상, 적어도 9 배 이상, 적어도 10 배 이상, 적어도 20 배 이상, 적어도 30 배 이상, 적어도 40 배 이상, 적어도 50 배 이상, 적어도 60 배 이상, 적어도 70 배 이상, 적어도 80 배 이상, 적어도 90 배 이상, 적어도 100 배 이상, 또는 적어도 1000 배 이상이다. 용어 "결합"은 예를 들어 생리학적 조건하에서 공유 결합, 정전기적 결합, 소수성 결합 및 이온성 및/또는 수소-결합 상호 작용으로 인한, 두 분자 사이의 직접적인 회합을 말하며, 염 가교 및 물 가교와 같은 상호 작용 뿐 아니라 임의의 다른 전통적인 결합 수단을 포함한다.
일부 구체예에서, 용어 "결합"은 예를 들어 생리학적 조건하에서 공유 결합, 정전기적 결합, 소수성 결합 및 이온성 및/또는 수소-결합 상호 작용으로 인한, 두 분자 사이의 직접적인 회합을 말하며, 염 가교 및 물 가교와 같은 상호 작용 뿐 아니라 임의의 다른 전통적인 결합 수단을 포함한다.
일부 구체예에서, 면역 세포는 4량체 또는 다른 MHC-펩타이드 다량체에 대한 세포로부터 면역 수용체, 예를 들어 TCR의 친화도에 기초하여 선별될 수 있다. 일부 구체예에서, 용어 "4량체"는 스트렙타비딘의 단일 분자에 결합된 4 개의 서브유닛을 포함하는 복합체를 지칭할 수 있으며, 이는 세포 집단에 결합하여 이를 식별할 수 있다. 서브유닛은 MHC-펩타이드 복합체일 수 있다. 서브유닛은 결합된 펩타이드가 없는 MHC일 수 있다. 서브유닛은 B-세포 수용체 항원일 수 있다. 4량체에 의해 확인된 세포 집단은 상기 4량체의 서브유닛에 결합하는 수용체, 예컨대 TCR 또는 BCR을 발현하는 집단일 수 있다. 세포 집단은 항원 특이적 T 세포일 수 있다. 세포 집단은 항원 특이적 B 세포일 수 있다. 4량체는 형광 표지될 수 있다. 본 명세서에서 사용되는 MHC-펩타이드 4량체는 pMHC와 상호 교환적으로 사용될 수 있다.
일부 예에서, 면역 세포는 친화성 올리고뉴클레오타이드 컨쥬게이트에 대한 친화도에 기초하여 선별될 수 있다 (예를 들어, WO 2017/053905 참조). 친 화성 올리고뉴클레오타이드 컨쥬게이트와 같은 선택된 표적 항원 또는 복합체로의 결합 또는 이의 인식에 기초하여 선별된 세포는 본 명세서에 기재되는 양성 또는 음성 선별 기술에 의해 추가로 단리될 수 있다.
일부 구체예에서, 비-면역화 인간 또는 비-인간 공여자로부터의 면역 세포가 이용된다. 동물의 나이브 레퍼토리 (항원 챌린지 전의 레퍼토리)는 그 동물에게 본질적으로, 임의의 비-자기 (non-self) 분자에 대해 중간 정도의 친화도 (약 1x10-6 내지 1x10-7 M의 KA)로 결합할 수 있는 항체 또는 TCR을 제공한다. 항체 또는 TCR 결합 부위의 서열 다양성은 생식선에서 직접 인코딩되지는 않지만 V 유전자 분절로부터 조합적 방식으로 조립된다. 면역화는 면역원에 결합하여 증식 (클론 증폭)하고 상기 언급된 바와 같이 상응하는 항체를 분비하는 VH-VL 또는 Vα-Vβ 또는 Vγ-Vδ 조합을 만드는 임의의 면역 세포를 촉발시킨다. 그러나, 비면역화 대상체로부터의 비장 세포 및/또는 면역 세포 또는 다른 말초 혈액 림프구 (PBL)의 사용은 더 좋은 가능한 항체 또는 TCR 레퍼토리 제시를 제공할 수 있고, 또한 임의의 동물 종을 사용하는 후속하는 B-세포 또는 T-세포 항체 또는 TCR 라이브러리의 구축을 허용한다.
일부 구체예에서, 샘플은 타액이다. 일부 구체예에서, 샘플은 전혈이다. 일부 구체예에서, 시험용 충분량의 폴리뉴클레오타이드를 얻기 위하여, 적어도 약 0.001, 0.005, 0.01, 0.05, 0.1, 0.5, 1, 2, 3, 4, 5, 10, 20, 25, 30, 35, 40, 45, 또는 50 mL 부피의 혈액이 취해진다. 일부 경우, 시험용 충분량의 핵산을 얻기 위하여 적어도 0.001, 0.005, 0.01, 0.05, 0.1, 0.5, 1, 2, 3, 4, 5, 10, 20, 25, 30, 35, 40, 45, 또는 50 mL의 혈액 부피가 취해진다.
일부 경우, 출발 물질은 말초 혈액이다. 말초 혈액 세포는 특정 세포 유형 (예컨대, 단핵 세포적혈구; CD4+ 세포; CD8+ 세포; 면역 세포; T 세포, NK 세포 등등)에 대해 농축될 수 있다. 말초 혈액 세포는 또한 특정 세포 유형 (예를 들어, 단핵 세포; 적혈구; CD4+ 세포; CD8+ 세포; 면역 세포; T 세포, NK 세포 등등)이 선택적으로 감소된 것일 수 있다.
일부 경우에, 출발 물질은 피부, 뇌, 간, 폐, 신장, 전립선, 난소, 비장, 림프절 (편도 포함), 갑상선, 췌장, 심장, 골격근, 장, 후두, 식도 및 위를 포함하는 비-제한적 예를 들 수 있는 고형 조직을 포함하는 조직 샘플일 수 있다. 다른 경우에, 출발 물질은 핵산, 면역 세포, 특히 B-세포 또는 T-세포를 함유하는 세포일 수 있다. 일부 경우에, 출발 물질은 유전자 물질을 수득할 수 있는, 임의의 유기체로부터의 핵산을 함유하는 샘플일 수 있다. 일부 경우에 샘플은, 예컨대 혈액, 타액, 림프 또는 소변과 같은 유액이다.
질병 상태에 있는 대상체로부터 샘플을 채취할 수 있다. 일부 경우에, 샘플을 채취한 대상체는 환자, 예를 들어 암 환자 또는 암이 의심되는 환자일 수 있다. 대상체는 포유 동물, 예를 들어 인간일 수 있으며, 수컷 또는 암컷일 수 있다. 일부 경우, 암컷은 임신 중이다. 샘플은 종양 생검일 수 있다. 생검은 예를 들어 의사, 의사 보조, 간호사, 수의사, 치과 의사, 척추 지압사, 구급대원, 피부과 의사, 종양 전문의, 위장 전문의, 또는 외과 의사를 포함하는 건강 관리 제공자에 의해 수행될 수 있다.
일부 경우에, 비-핵산 물질은 효소적 처리 (단백질 분해 효소 분해와 같은)를 사용하여 출발 물질로부터 제거될 수 있다.
일부 경우에, 혈액은, EDTA를 포함하지만 이에 국한되지는 않는 마그네슘 킬레이터를 함유하는 장치 내로 수집될 수 있으며, 4℃에서 저장된다. 선택적으로, EGTA를 포함하지만 이에 국한되지는 않는 칼슘 킬레이터가 첨가될 수 있다. 다른 경우에, 포름알데히드, 포름알데히드 유도체, 포르말린, 글루타르알데히드, 글루타르알데히드 유도체, 단백질 가교제, 핵산 가교제, 단백질 및 핵산 가교제, 1 차 아민 반응성 가교제, 술프히드릴 반응성 가교제, 술프히드릴 첨가 또는 이황화 환원, 탄수화물 반응성 가교제, 카르복실 반응성 가교제, 광반응성 가교제 또는 분해성 가교제 를 포함 하나 이에 국한되지 않는 세포 용해 억제제가 혈액에 첨가된다.
추출된 물질이 단일-가닥 RNA, 이중-가닥 RNA 또는 DNA-RNA 하이브리드를 포함하는 일부 경우에, 이들 분자는 당업계에 공지된 기술을 사용하여 이중-가닥 DNA로 전환될 수 있다. 예를 들어, 역전사 효소가 RNA 분자로부터 DNA를 합성하기 위해 사용될 수 있다. 일부 경우에, RNA의 DNA로의 전환은, RNA에 링커 단편을 연결시키기 위해, 사전의 라이게이션 (ligation) 단계를 필요로 할 수 있으며, 이에 의해 범용 프라이머를 사용하여 역전사를 개시할 수 있다. 다른 경우에, 예를 들어 mRNA 분자의 폴리-A 테일이 역전사를 개시하는데 사용될 수 있다. DNA로의 전환 후, 본 명세서에 상세히 설명된 방법은, 경우에 따라, 원하는 서열을 추가로 포획, 선택, 태그 또는 분리하기 위해 사용될 수 있다.
핵산 분자는 데옥시리보 핵산 (DNA) 및/또는 리보 핵산 (RNA)을 포함한다. 핵산 분자는 합성되거나 자연 발생원으로부터 유래될 수 있다. 한 구체예에서, 핵산 분자는 단백질, 지질 및 비-주형 핵산과 같은 다양한 다른 성분을 함유하는 생물학적 샘플로부터 단리된다. 핵산 주형 분자는 동물, 식물, 박테리아, 진균 또는 임의의 다른 세포 유기체로부터 수득된 임의의 세포 물질로부터 수득될 수 있다. 특정 구체예에서, 핵산 분자는 단일 세포로부터 수득된다. 본 발명에 사용하기 위한 생물학적 샘플은 바이러스 입자 또는 제제를 포함한다. 핵산 분자는 유기체로부터 직접 수득되거나 또는 유기체로부터, 예를 들어 혈액, 소변, 뇌척수액, 정액, 타액, 가래, 대변 및 조직으로부터 수득된 생물학적 샘플로부터 수득될 수 있다. 임의의 조직 또는 체액 표본이 본 발명에서 사용하기 위한 핵산 공급원으로서 사용될 수 있다. 핵산 분자는 또한 1 차 세포 배양 또는 세포주와 같은 배양된 세포로부터 단리될 수 있다. 주형 핵산이 수득되는 세포 또는 조직은, 바이러스 또는 다른 세포 내 병원체로 감염될 수 있다.
샘플은 또한 생물학적 표본, cDNA 라이브러리, 바이러스성 또는 게놈 DNA로부터 추출된 총 RNA일 수 있다. 특정 구체예에서, 핵산 분자는 단백질, 효소, 기질, 항체, 결합제, 비드, 소분자, 펩타이드 또는 임의의 다른 분자와 같은 다른 표적 분자에 결합된다. 일반적으로, 핵산은 [Sambrook and Russell, Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor, NY (2001)]에 의해 기술된 것과 같은 다양한 기술에 의해 생물학적 샘플로부터 추출될 수 있다. 핵산 분자는 단일-가닥, 이중-가닥, 또는 단일-가닥 영역을 갖는 이중-가닥 (예를 들어, 스템- 및 루프-구조)일 수 있다.
DNA 추출 방법은 당업계에 잘 알려져 있다. 고전적인 DNA 단리 프로토콜은 페놀과 클로로포름의 혼합물과 같은 유기 용매를 사용한 추출 후, 에탄올로의 침전에 기초한다 (J. Sambrook et al., "Molecular Cloning: A Laboratory Manual," 1989, 2nd Ed., Cold Spring Harbour Laboratory Press: New York, N.Y.). 다른 방법으로는: DNA 추출물의 염 추출 (P. Sunnucks et al., Genetics, 1996, 144: 747-756; S. M. Aljanabi et al., Nucl. Acids Res. 1997, 25: 4692-4693), 트리메틸암모늄 브로마이드 염 DNA 추출 (S. Gustincich et al., BioTechniques, 1991, 11: 298-302) 및 구아니디늄 티오시아네이트 DNA 추출 (J. B. W. Hammond et al., Biochemistry, 1996, 240: 298-300)을 들 수 있다. 생물학적 샘플로부터 DNA를 추출하기 위한 다양한 키트가 시판 중이다 (예컨대, BD Biosciences Clontech (Palo Alto, CA): Epicentre Technologies (Madison, WI); Gentra Systems, Inc. (Minneapolis, MN); MicroProbe Corp. (Bothell, WA); OrganonTeknika (Durham, NC); 및 Qiagen Inc. (Valencia, CA)).
RNA 추출 방법 역시 당업계에 잘 알려져 있고 (예컨대, J. Sambrook et al., "Molecular Cloning: A Laboratory Manual" 1989, 211d Ed., Cold Spring Harbour Laboratory Press: New York) 체액으로부터 RNA 추출을 위한 키트가 시판중이다 (예컨대, Ambion, Inc. (Austin, TX); Amersham Biosciences (Piscataway, NJ); BD Biosciences Clontech (Palo Alto, CA); BioRad Laboratories (Hercules, CA); Dynal Biotech Inc. (Lake Success, NY); Epicentre Technologies (Madison, WI); Gentra Systems, Inc. (Minneapolis, MN); GIBCO BRL (Gaithersburg, MD); Invitrogen Life Technologies (Carlsbad, CA); MicroProbe Corp. (Bothell, WA); OrganonTeknika (Durham, NC); Promega, Inc. (Madison, WI); and Qiagen Inc. (Valencia, CA)).
하나 이상의 샘플은 하나 이상의 공급원으로부터 유래될 수 있다. 하나 이상의 샘플은 두 개 이상의 공급원으로부터 유래될 수 있다. 하나 이상의 샘플은 하나 이상의 대상체로부터 유래될 수 있다. 하나 이상의 샘플은 2 이상의 대상체로부터 유래될 수 있다. 하나 이상의 샘플은 동일한 대상체로부터 유래될 수 있다. 하나 이상의 대상체는 동일한 종으로부터 유래될 수 있다. 하나 이상의 대상체는 다른 종에서 유래될 수 있다. 하나 이상의 대상체는 건강한 대상체일 수 있다. 하나 이상의 대상체는 질환, 장애 또는 질병 상태에 의해 영향받을 수 있다.
일부 구체예에서, 샘플은 혈액, 타액, 림프, 소변, 뇌척수액, 정액, 가래, 대변 또는 조직 균질물과 같은 유체이다.
질병 상태에 있는 대상체로부터 샘플을 채취할 수 있다. 일부 구체예에서, 샘플을 채취한 대상체는 환자, 예를 들어 암 환자 또는 암이 의심되는 환자일 수 있다. 대상체는 포유 동물, 예를 들어 인간일 수 있으며, 수컷 또는 암컷일 수 있다. 일부 구체예에서, 암컷은 임신 중이다. 샘플은 종양 생검물일 수 있다. 생검은 예를 들어 의사, 의사 보조, 간호사, 수의사, 치과 의사, 척추 지압사, 구급대원, 피부과 의사, 종양 전문의, 위장 전문의, 또는 외과 의사를 포함하는 건강 관리 제공자에 의해 수행될 수 있다.
일부 구체예에서, 폴리뉴클레오타이드는 단백질, 효소, 기질, 항체, 결합제, 비드, 소분자, 펩타이드, 또는 임의의 다른 분자와 같은 다른 표적 분자에 결합된다. 일부 구체예에서, 폴리뉴클레오타이드는 고체 지지체에 결합되지 않는다. 핵산은 다양한 기술에 의해 생물학적 샘플로부터 추출될 수 있다 (Sambrook et al., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor, N.Y. (2001)).
일부 구체예에서, 세포 현탁액은 분석 전에 예열될 수 있다. 일부 구체예에서, 세포 현탁액은 에멀젼 생성 직전에 (하기 섹션 B.2에 기재됨), 세포 내부에서 DNA 중합 효소의 활성을 증가시키고 원치 않는 효과, 예컨대 RNA 분해를 최소화 하기 위한 온도로, 그리고 그러한 충분한 시간 동안 가열된다. 따라서, 세포는 본 명세서에서 제공되는 방법의 수율을 최적화하기 위해 가열된다. 일부 예에서, 세포는 대략 30℃ 내지 70℃, 예컨대 30 내지 60℃, 25 내지 60℃, 30 내지 60℃, 40 내지 60℃, 45 내지 55℃로, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 분 시간 동안 가열된다. 세포를 가열한 후, 세포 현탁액은, 에멀젼 형성 전 30 초 내지 최대 4 시간 동안, 예를 들어 30 초, 45 초, 1 분, 2 분, 3 분, 4 분, 5 분, 6 분, 7 분, 8 분, 9 분, 10 분, 15 분, 20 분, 25 분, 30 분, 35 분, 40 분, 45 분, 1 시간, 1.5 시간, 2 시간, 2.5 시간, 3 시간, 3.5 시간 또는 4 시간 동안 실온에서 유지되거나, 얼음 위에 위치할 수 있다.
복수 개의 샘플은 적어도 2, 3, 4, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90 개 또는 100 개 또는 그 이상의 샘플을 포함할 수 있다. 복수 개의 샘플은 적어도 약 100, 200, 300, 400, 500, 600, 700, 800, 900 개 또는 1000 개 또는 그 이상의 샘플을 포함할 수 있다. 복수 개의 샘플은 적어도 약 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000 개 샘플, 9000, 또는 10,000 개 샘플, 또는 100,000 개 샘플, 또는 1,000,000 개 또는 그 이상의 샘플을 포함할 수 있다. 복수 개의 샘플은 적어도 약 10,000 개 샘플을 포함할 수 있다.
제1 샘플 내 하나 이상의 폴리뉴클레오타이드는 제2 샘플 내 하나 이상의 폴리뉴클레오타이드와 상이할 수 있다. 제1 샘플 내 하나 이상의 폴리뉴클레오타이드는 복수 개의 샘플 내 하나 이상의 폴리뉴클레오타이드와 상이할 수 있다. 샘플 내 하나 이상의 폴리뉴클레오타이드는 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 서열 동일성을 포함할 수 있다. 일부 구체예에서, 샘플 내 하나 이상의 폴리뉴클레오타이드 약 100, 90, 80, 70, 60, 50, 40, 30, 25, 20, 25, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1 개 뉴클레오타이드 또는 염기쌍 미만으로 상이할 수 있다. 복수 개 샘플 중 하나 이상의 샘플 내 복수 개의 폴리뉴클레오타이드는 2 개 이상의 동일한 서열을 포함할 수 있다. 복수 개의 샘플 중 하나 이상에서 총 폴리뉴클레오타이드의 적어도 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% 또는 100%가 동일한 서열을 포함할 수 있다. 복수 개 샘플 중 하나 이상의 샘플 내 복수 개의 폴리뉴클레오타이드는 적어도 2 개의 상이한 서열을 포함할 수 있다. 복수 개 샘플 중 하나 이상에서 총 폴리뉴클레오타이드의 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%는 적어도 2 개의 상이한 서열을 포함할 수 있다. 일부 구체예에서, 하나 이상의 폴리뉴클레오타이드는 서로의 변이체이다. 예컨대, 하나 이상의 폴리뉴클레오타이드는 단일 뉴클레오타이드 다형성 또는 기타 유형의 돌연변이를 함유할 수 있다. 다른 예시에서, 하나 이상의 폴리뉴클레오타이드는 스플라이스 변이체이다.
제1 샘플은 하나 이상의 세포를 포함할 수 있고, 제2 샘플은 하나 이상의 세포를 포함할 수 있다. 제1 샘플의 하나 이상의 세포는 제2 샘플의 하나 이상의 세포와 동일한 세포 유형의 것일 수 있다. 제1 샘플의 하나 이상의 세포는 복수 개 샘플의 하나 이상의 상이한 세포와 상이한 세포 유형의 것일 수 있다.
복수 개의 샘플은 함께 (concurrently) 얻어질 수 있다. 복수 개의 샘플은 동시에 얻어질 수 있다. 복수 개의 샘플은 순차적으로 얻어질 수 있다. 복수 개의 샘플은 수년의 과정, 예컨대 100 년, 10 년, 5 년, 4 년, 3 년, 2 년 또는 1 년의 하나 이상의 상이한 샘플을 얻는 과정에 걸쳐 얻어질 수 있다. 하나 이상의 샘플은 하나 이상의 상이한 샘플을 얻는 약 1 년 내에 얻어질 수 있다. 하나 이상의 샘플은 하나 이상의 상이한 샘플을 얻는 12 개월, 11 개월, 10 개월, 9 개월, 8 개월, 7 개월, 6 개월, 5 개월, 4 개월, 3 개월, 2 개월 또는 1 개월 내에 얻어질 수 있다. 하나 이상의 샘플은 하나 이상의 상이한 샘플을 얻는 30 일, 28 일, 26 일, 24 일, 21 일, 20 일, 18 일, 17 일, 16 일, 15 일, 14 일, 13 일, 12 일, 11 일, 10 일, 9 일, 8 일, 7 일, 6 일, 5 일, 4 일, 3 일, 2 일 또는 1 일 내에 얻어질 수 있다. 하나 이상의 샘플은 하나 이상의 상이한 샘플을 얻는 약 24 시간, 22 시간, 20 시간, 18 시간, 16 시간, 14 시간, 12 시간, 10 시간, 8 시간, 6 시간, 4 시간, 2 시간 또는 1 시간 내에 얻어질 수 있다. 하나 이상의 샘플은 하나 이상의 상이한 샘플을 얻는 약 60 초, 45 초, 30 초, 20 초, 10 초, 5 초, 2 초 또는 1 초 내에 얻어질 수 있다. 하나 이상의 샘플은 하나 이상의 상이한 샘플을 얻는 1 초 미만에 얻어질 수 있다.
샘플 중 상이한 폴리뉴클레오타이드들은 샘플 내에서 서로 다른 농도 및 양으로 존재할 수 있다 (예컨대, 상이한 분자 수). 예컨대, 샘플 내에서 하나의 폴리뉴클레오타이드의 농도 또는 양은 다른 폴리뉴클레오타이드의 농도 또는 양보다 클 수 있다. 일부 구체예에서, 샘플 내 적어도 하나의 폴리뉴클레오타이드의 농도 또는 양은 샘플 내 적어도 하나의 다른 폴리뉴클레오타이드의 농도 또는 양보다 적어도 약 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 배, 또는 그 이상 크다. 다른 예시에서, 샘플 내에서 한 폴리뉴클레오타이드의 농도 또는 양은 다른 폴리뉴클레오타이드의 농도 또는 양보다 작다. 샘플 내 적어도 하나의 폴리뉴클레오타이드의 농도 또는 양은 샘플 내 적어도 하나의 다른 폴리뉴클레오타이드의 농도 또는 양보다 적어도 약 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 배, 또는 그 이상 작을 수 있다.
일부 구체예에서, 2 개 이상의 샘플은 서로 다른 양 또는 농도의 폴리뉴클레오타이드를 함유할 수 있다. 일부 구체예에서, 한 샘플 내 하나의 폴리뉴클레오타이드의 농도 또는 양은 다른 샘플 내 동일한 폴리뉴클레오타이드의 농도 또는 양보다 클 수 있다. 예컨대, 혈액 샘플은 소변 샘플보다 특정 폴리뉴클레오타이드를 더 많은 양으로 함유할 수 있다. 또는, 단일 샘플은 2 개 이상의 서브샘플로 나뉠 수 있다. 서브샘플은 동일한 폴리뉴클레오타이드의 서로 다른 양 또는 농도를 함유할 수 있다. 한 샘플 내 적어도 하나의 폴리뉴클레오타이드의 농도 또는 양은 다른 샘플 내 동일한 폴리뉴클레오타이드의 농도 또는 양보다 적어도 약 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 배, 또는 그 이상 클 수 있다. 또는, 한 샘플 내 하나의 폴리뉴클레오타이드의 농도 또는 양은 상이한 샘플 내 동일한 폴리뉴클레오타이드의 농도 또는 양보다 작을 수 있다. 예컨대, 한 샘플 내 적어도 하나의 폴리뉴클레오타이드의 농도 또는 양은 다른 샘플 내 동일한 폴리뉴클레오타이드의 농도 또는 양보다 적어도 약 1.5, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000 배, 또는 그 이상 작을 수 있다.
2. 액적 생성 및 단일 세포 바코딩
용기 바코드 및 분자 바코드를 이용하는 단일 세포 바코딩을 위하여, 용기, 예컨대 유중수 에멀젼은 결과하는 용기가 용기당 1 개 세포 또는 그 미만을 함유하는 방식으로 생성될 수 있다. 용기는 결과하는 용기가 또한 용기당 1 개의 용기 바코드를 함유하는 방식으로 생성될 수 있다. 용기는, 결과하는 용기가 또한 용기당 1 개의 분자 바코딩된 폴리뉴클레오타이드를 함유하는 방식으로 생성될 수 있다. 용기는, 결과하는 용기가 또한 용기당 2 개 이상, 또는 복수 개의 분자 바코딩된 폴리뉴클레오타이드를 함유하는 방식으로 생성될 수 있다. 세포/용기는 본 명세서에 기술되는 바와 같이 RNA 또는 DNA 단일 바코딩 프로토콜의 대상이 될 수 있고, 각 용기의 용기 바코드 및 하나 이상의 분자 바코드는 대상 표적, 예컨대 세포 폴리뉴클레오타이드와 융합될 수 있다. 일부 구체예에서, 매칭하는 용기 바코딩된 폴리뉴클레오타이드는 하나 이상의 분자 바코딩된 폴리뉴클레오타이드와 동일한 용기에 존재하는 세포 성분과 융합될 수 있다. 시퀀싱 후, 용기 바코드 및 분자 바코드 디컨볼루션을 사용하여 어느 RNA (또는 DNA)가 어느 세포에서 유래했는지 식별할 수 있다. 일부 구체예에서, 용기, 예컨대 유중수 에멀젼은 결과하는 에멀젼이 에멀젼당 1 개의 세포 또는 그 이상을 함유하는 방식으로 생성될 수 있다. 일부 구체예에서, 유중수 에멀젼은 결과하는 에멀젼이 용기당 1 개의 용기 바코딩된 폴리뉴클레오타이드 및 2 개 이상의 분자 바코딩된 폴리뉴클레오타이드를 함유하는 방식으로 생성될 수 있다. 일부 구체예에서, 용기는 결과하는 용기가 용기당 1 개 이상의 용기 바코딩된 폴리뉴클레오타이드 및 2 개 이상의 분자 바코딩된 폴리뉴클레오타이드를 함유하는 방식으로 생성될 수 있다. 일부 구체예에서, 용기 바코드 및 분자 바코드는 용액 내일 때 용기 내로 도입될 수 있다. 일부 구체예에서, 용기 바코디 및 분자 바코드는 고체 지지체, 예컨대 비드에 부착되지 않을 때 용기 내로 도입될 수 있다. 예시적 용기는 웰, 에멀젼, 액적 및 마이크로캡슐을 포함한다.
일부 측면에서, 단일 세포는 에멀젼 내부에서 분리될 수 있으며, 이는 구획 (예를 들어, 용기)으로서 작용할 수 있다. 세포는 용해될 수 있고 세포로부터의 전사물은 바코딩될 수 있다. 각각의 전사물은 분자 바코드 또는 용기 바코드와 융합될 수 있는데, 그러한 방식으로 2 개 이상의 RNA 전사물이 동일한 용기 바코드로 검출될 때 이들이 동일한 출발 세포로부터 유래된 것으로 결정될 수 있다. 이것은 많은 다른 유형의 서열에 적용될 수 있다. 하나의 특정적인 적용은 항체 및 TCR 서열의 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 사슬을 연결시키는 것일 수 있다.
하나 이상의 단일 세포는, 용기 바코드 및 분자 바코드의 존재 하에서 하나 이상의 에멀젼 내에서 분리될 수 있으므로, 하나 이상의 에멀젼 중의 하나의 용기, 예컨대 액적은 최대 1 개의 세포 또는 그 미만을 함유할 수 있다. 세포는 에멀젼에 포함된 완충액에 의하여 화학적으로 또는 동결 해동에 의하여 용해되고, 그에 의하여 에멀젼에 세포 컨텐츠를 방출할 수 있다.
단일 세포의 RNA는 cDNA로 역전사될 수 있다. 역전사 반응은 전술한 바와 같이 약 3 개의 시토신 잔기를 첨가하는 비-주형 말단 트랜스퍼라아제 활성을 갖는 역전사 효소로 수행될 수 있다. 에멀젼을 형성할 때 모든 역전사 완충액, 효소 및 뉴클레오타이드가 존재할 수 있다. 일부 구체예에서, 프라이머는 모든 mRNA를 표적화하기 위해 일반화될 수 있다 (예컨대 폴리 dT 서열을 포함하는 폴리뉴클레오타이드). 일부 구체예에서, DNA가 사용될 수 있다. 일부 구체예에서, 2 개 이상의 RNA가 표적화될 수 있다.
일부 구체예에서, 용기 바코드는 역전사 동안 RNA에 연결될 수 있다. 일부 구체예에서, 분자 바코드는 역전사 동안 RNA에 연결될 수 있다. 일부 구체예에서, 용기 바코드 및 분자 바코드는 역전사 동안 RNA에 연결될 수 있다. 복수 개 세포의 샘플을, 복수 개의 세포로부터의 개별 세포로부터 또는 그로부터 유래한 폴리뉴클레오타이드의 분자 및 용기 바코딩과 커플링된 작은 반응 부피로 분할하는 것은, 서열 레퍼토리, 예컨대 바이오마커 서열의 고 처리량 시퀀싱을 가능하게 할 수 있다.
복수 개 세포의 샘플을, 복수 개의 세포로부터의 개별 세포로부터 또는 그로부터 유래한 폴리뉴클레오타이드의 분자 및 용기 바코딩과 커플링된 하나 이상의 세포를 함유하는 작은 반응 부피 또는 용기로 분할하는 것은, 서열 레퍼토리, 예컨대 개체의 전사체의 백분율을 대표하는 서열의 고 처리량 시퀀싱을 가능하게 할 수 있다. 예컨대, 서열 레퍼토리는 적어도 약 0.00001%, 0.00005%, 0.00010%, 0.00050%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 30%, 35%, 40%, 45, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100%의 개체의 전사체를 대표하는 복수 개의 서열을 포함할 수 있다.
면역 세포의 샘플을, 복수 개의 면역 세포로부터의 개별적인 면역 세포로부터 또는 그로부터 유래한 폴리뉴클레오타이드의 분자 및 용기 바코딩과 커플링된 하나 이상의 면역 세포를 함유하는 작은 반응 부피 또는 용기로 분할하는 것은, 중쇄 및 경쇄 서열로 이루어지는 레퍼토리의 고 처리량 시퀀싱을 가능하게 할 수 있다. 이들 방법은 또한 바코딩된 서열에 기초한 시퀀싱 후에 중쇄 및 경쇄의 페어링을 허용할 수 있다. 샘플을 본 명세서에서 기술하는 바와 같이 작은 반응 부피로 분할하는 것은 또한 저감된 양의 시약 사용을 가능하게 하고, 이에 의하여 분석의 재료 비용을 낮출 수 있다.
일부 경우에, 역전사 반응 및/또는 증폭 반응 (예를 들어, PCR)은 액적에서, 예컨대 액적 디지털 PCR (droplet digital PCR)로 수행된다. 특정 측면에서, 본 발명은 표적 물질의 전부 또는 일부를 함유하는 유체 구획 또는 용기를 제공한다. 일부 구체예에서, 구획 또는 용기는 액적이다. 명세서 전체에 걸쳐 "액적"이 언급되는 동안, 그 용어는 달리 지시되지 않는 한 유체 구획 및 유체 파티션과 상호 교환적으로 사용된다. 용기는 이러한 유체 구획 또는 유체 파티션을 포함하거나 이것으로 구성될 수 있다. 달리 지시된 경우를 제외하고, "액적"은 편의상 사용되며 임의의 유체 파티션 또는 구획이 사용될 수 있다. 본 명세서에서 사용되는 액적은, 미국 특허 제7,622,280 호에 기술된 바와 같은 에멀젼 조성물 (또는 2 이상의 비혼화성 유체의 혼합물)을 포함할 수 있다. 액적은 WO/2010/036352에 기술된 장치에 의해 생성될 수 있다. 본 명세서에서 사용되는 용어 에멀젼은 비혼화성 액체 (예컨대, 오일 및 물)의 혼합물을 지칭할 수 있다. 오일-상 및/또는 유-중-수 에멀젼은 수성 액적 내에서 반응 혼합물의 구획화를 가능하게 한다. 에멀젼은 연속적 오일 상 내에서 수성 액적을 포함할 수 있다. 본 명세서에서 제공되는 에멀젼은 수-중-유 에멀젼일 수 있으며, 여기서 액적은 연속적인 수성 상 내의 오일 액적이다. 본 명세서에서 기술되는 액적은 구획들 사이의 혼합을 방지하도록 설계되며, 각 구획은 그 컨텐츠가 증발 및/또는 다른 구획의 컨텐츠와 합체되는 것을 방지한다.
본 명세서에 기재된 혼합물 또는 에멀젼은 안정하거나 불안정할 수 있다. 에멀젼은 비교적 안정적일 수 있고 최소 유착 (coalescence)을 갖는다. 작은 액적 결합하여 점진적으로 큰 액적을 형성할 때 유착이 발생한다. 일부 경우, ㅇ애액적 생성기로부터 생성된 액적의 0.00001%, 0.00005%, 0.00010%, 0.00050%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%, 0.5%, 1%, 2%, 2.5%, 3%, 3.5%, 4%, 4.5%, 5%, 6%, 7%, 8%, 9%, 또는 10% 미만이 다른 액적과 합체한다. 에멀젼은 또한 제한된 응집 (flocculation)을 가질 수 있는데, 이 과정에서 분산된 상은 현탁액으로부터 플레이크로 나온다.
액적은 약 0.001, 0.01, 0.05, 0.1, 1, 5, 10, 20, 30, 40, 50, 60, 70, 80, 100, 120, 130,140, 150, 160, 180, 200, 300, 400, 또는 500 미크론의, 약 그 미만, 또는 약 그 초과, 또는 약 그 이상의 평균 직경을 갖도록 생성될 수 있다. 액적은 약 0.001 내지 약 500, 약 0.01 내지 약 500, 약 0.1 내지 약 500, 약 0.1 내지 약 100, 약 0.01 내지 약 100, 또는 약 1 내지 약 100 미크론의 평균 직경을 가질 수 있다. 마이크로채널 크로스-플로우 포커싱 또는 물리적 교반을 사용하여 에멀젼 액적을 제조하는 미세유체 방법은 단분산 또는 다분산 에멀젼을 생성하는 것으로 알려져 있다. 액적은 단분산 액적 또는 용기일 수 있다. 액적은, 액적의 크기가 액적의 평균 크기의 플러스 또는 마이너스 5% 이상 변하지 않도록 생성될 수 있다. 일부 경우에, 액적은, 액적의 크기가 액적의 평균 크기의 플러스 또는 마이너스 2% 이상 변하지 않도록 생성된다. 액적 생성기는 단일 샘플로부터 액적 집단을 생성할 수 있으며, 여기서 액적 중 어느 것도 액적 총 집단의 평균 크기의 플러스 또는 마이너스 약 0.1%, 0.5%, 1%, 1.5%, 2%, 2.5%, 3%, 3.5%, 4%,4.5%, 5%, 5.5%, 6%, 6.5%, 7%, 7.5%, 8%, 8.5%, 9%, 9.5%, 또는 10% 이상 변하지 않는다.
액적 또는 용기는 오일 상을 수성 샘플을 통해 유동시킴으로써 형성될 수 있다. 수성 상은 완충액 및 증폭 반응을 수행하기 위한 시약들, 예컨대 세포, 뉴클레오타이드, 뉴클레오타이드 유사체, 분자 바코딩된 폴리뉴클레오타이드, 용기 바코딩된 폴리뉴클레오타이드 프라이머, 주형 핵산, 및 효소, 예컨대 DNA 중합 효소, RNA 중합 효소 및/또는 역전사 효소를 포함할 수 있다. 일부 구체예에서, 수성 상은 세포 용해 시약, 예컨대 화학적 세포 용해 시약을 함유할 수 있다.
수성 상은 완충액 및 고체 표면이 있거나 없거나 증폭 반응을 수행하기 위한 시약, 예컨대 비드를 포함할 수 있다. 완충액은 약 1, 5, 10, 15, 20, 30, 50, 100, 또는 200 mM, 약 그 초과, 도는 약 그 미만의 Tris를 포함할 수 있다. 일부 경우에, 염화칼륨의 농도는 약 10, 20, 30, 40, 50, 60, 80, 100, 200 mM, 약 그 초과, 또는 약 그 미만일 수 있다. 완충액은 약 15 mM 트리스 및 50 mM KCl을 포함할 수 있다. 뉴클레오타이드는 각각 약 50, 100, 200, 300, 400, 500, 600, 또는 700 μM, 약 그 초과, 또는 약 그 미만의 농도로, dATP, dCTP, dGTP 및 dTTP를 포함하는 데옥시리보 뉴클레오타이드 트리포스페이트 분자를 포함할 수 있다. 일부 경우에, dUTP는 수성 상 내에서 약 50, 100, 200, 300, 400, 500, 600, 또는 700, 800, 900, 또는 1000 μM, 약 그 초과, 또는 약 그 미만의 농도로 첨가된다. 일부 경우에, 마그네슘 클로라이드 또는 마그네슘 아세테이트 (MgCl은 약 1.0, 2.0, 3.0, 4.0, 또는 5.0 mM, 약 그 초과, 또는 약 그 미만의 농도로 수성 상에 첨가됨). MgCl의 농도는 약 3.2 mM일 수 있다. 일부 경우에, 마그네슘 아세테이트 또는 마그네슘이 사용된다. 일부 경우에 마그네슘 술페이트가 사용된다.
비-특이적 차단 제제, 예컨대 BSA 또는 소 피부로부터의 젤라틴이 사용될 수 있는데, 여기서 젤라틴 또는 BSA는 대략 0.1-0.9 %w/v의 농도 범위로 존재한다. 다른 가능한 차단 제제는 베타락토글로불린, 카제인, 분유 또는 다른 일반적인 차단 제제를 포함할 수 있다. 일부 경우에, BSA 및 젤라틴의 바람직한 농도는 약 0.1 %w/v이다.
수성 상 내에서 증폭을 위한 프라이머는 약 0.05, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1.0, 1.2, 1.5, 1.7 또는 2.0μM, 약 그 초과, 또는 약 그 미만의 농도를 가질 수 있다. 수성 상 내에서 프라이머 농도는 약 0.05 내지 약 2, 약 0.1 내지 약 1.0, 약 0.2 내지 약 1.0, 약 0.3 내지 약 1.0, 약 0.4 내지 약 1.0, 또는 약 0.5 내지 약 1.0 μM일 수 있다. 프라이머의 농도는 약 0.5 μM일 수 있다. PCR에서 표적 핵산 농도에 대한 적절한 범위는 약 1 pg 내지 약 500 ng를 포함하지만 이에 국한되지는 않는다.
일부 경우에, 수성 상은 또한 비-특이적 백그라운드/차단 핵산 (예를 들어, 연어 정자 DNA), 생물학적 방부제 (예를 들어, 소듐 아자이드), PCR 증강제 (예를 들어, 베타인, 트레할로스 등) 및 억제제 (예를 들어, RNAse 억제제)를 포함하는 첨가제를 포함할 수 있으나 이에 국한되는 것은 아니다. 다른 첨가제로는 예컨대, 디메틸 술폭사이드 (DMSO), 글리세롤, 베타인 (모노)하이드레이트 (N,N,N- 트리메틸글리신 = [카르복시메틸] 트리메틸암모늄), 트레할로스, 7-데아자-2'-데 옥시구아노신 트리포스페이트 (dC7GTP 또는 7-데아자-2'-dGTP), BSA (소 혈청 알부민), 포름아미드 (메탄아미드), 테트라메틸암모늄 클로라이드 (TMAC), 기타 테트라알킬암모늄 유도체 (예를 들어, 테트라에티암모늄 클로라이드 (TEA-C1) 및 테트라프로필암모늄 클로라이드 (TPrA-Cl), 비-이온성 변성제 (예를 들어, Triton X-100, TWEEN® 20, Nonidet P-40 (NP-40)) 또는 PREXCEL-Q를 들 수 있다. 일부 경우, 수성 상은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 상이한 첨가제를 포함할 수 있다. 다른 경우에, 수성 상은 적어도 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 개의 상이한 첨가제를 포함할 수 있다.
일부 경우에, 비-이온성 에틸렌 옥사이드/프로필렌 옥사이드 블록 공중합체가 약 0.1%, 0.2%, 0.3%, 0.4%, 0.5%, 0.6%, 0.7%, 0.8%, 0.9%, 또는 1.0%의 농도로 수성 상에 첨가될 수 있다. 일반적인 생물 계면활성제는 비-이온성 계면활성제, 예컨대 Pluronic F-68, Tetronics, 및 Zonyl FSN을 포함한다. Pluronic F-68은 약 0.5 %w/v의 농도로 존재할 수 있다.
일부 경우에, 마그네슘 술페이트는 유사한 농도로 마그네슘 클로라이드를 대체할 수 있다. 다양한 공급업체의 광범위한 일반적인 상용 PCR 완충제가 완충 용액을 대체할 수 있다.
주변 상과 액체-유사 또는 고체-유사 계면을 나타내는 용기가 고려된다. 예를 들어, 일부 구체예에서, 에멀젼은, 용기로 작용하는, 가열에 의하여 고체-유사 계면 필름을 갖는 마이크로캡슐로 전환될 수 있는 액체-유사 계면 필름을 갖는 고도의 단분산 액적을 생성하도록 제형화될 수 있는데; 이러한 마이크로캡슐은 PCR 증폭과 같은 반응 과정을 통해 그들의 컨텐츠를 보유할 수 있는 생물 반응기로서 거동할 수 있다. 용기의 마이크로캡슐 형태로의 전환은 가열시에 일어날 수 있다. 예를 들어, 이러한 전환은 약 50℃, 60℃, 70℃, 80℃, 90℃, 또는 95℃ 이상의 온도에서 일어날 수 있다. 일부 경우, 이 가열은 써모사이클러를 사용하여 일어난다. 가열 과정에서, 유체 또는 미네랄 오일 오버레이를 사용하여 증발을 방지할 수 있다. 가열하기 전, 과량의 연속적 상 오일은 제거되거나 제거될 수 없다. 생체 적합성 캡슐은 광범위한 열적 및 기계적 가공에 걸쳐 유착 및/또는 응집에 내성일 수 있다. 전환 후, 캡슐은 약 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃, 10℃, 15℃, 20℃, 25℃, 30℃, 35℃, 또는 40℃, 약 그 초과, 또는 약 그 미만에서 저장될 수 있다. 캡슐 형태의 이들 용기는 생물의학적 응용시 유용할 수 있는데, 예컨대 거대분자, 특히 핵산 또는 단백질 또는 양자 모두의 혼합물을 함유하는 수성 생물학적 유체의 안정한, 디지털화된 캡슐화; 약물 및 백신 전달; 생체분자 라이브러리; 임상 이미징 응용 및 기타 등이다.
마이크로캡슐은 하나 이상의 폴리뉴클레오타이드를 함유할 수 있고, 특히 고온에서 유착에 내성일 수 있다. 따라서, PCR 증폭 반응이 매우 높은 밀도 (예를 들어, 단위 부피당 반응 수)로 일어날 수 있다. 일부 경우 ml당 100,000, 500,000, 1,000,000, 1,500,000, 2,000,000, 2,500,000, 5,000,000 또는 10,000,000 번 이상의 개별 반응이 일어날 수 있다. 일부 경우에, 반응은, 반응 부피 사이에 상호-혼합없이 단일 웰, 예를 들어 마이크로타이터 플레이트의 웰에서 일어난다. 마이크로캡슐은 또한 역전사, 프라이머 연장 및/또는 PCR 반응이 일어날 수 있는데 필요한 다른 성분들을 함유할 수 있는데, 예를 들어 프라이머, 프로브, dNTP, DNA 또는 RNA 중합 효소 등이다. 캡슐 형태의 이러한 용기는 광범위한 열 및 기계 가공에 걸쳐 유착 및 응집에 대한 저항성을 나타낸다.
일부 경우에, 증폭 단계는 디지털 PCR, 예컨대 미세유체-기반 디지털 PCR 또는 액적 디지털 PCR을 수행함으로써 이루어진다.
일부 구체예에서, 용기는 액적일 수 있다. 액적은 미세 유체 시스템 또는 장치를 사용하여 생성될 수 있다. 본 명세서에서 사용되는 "미세 (마이크로)-" 접두사 (예를 들어, "마이크로채널" 또는 "미세유체")는 일반적으로 약 1 mm 미만의 폭 또는 직경을 갖는 요소 또는 물품, 및 일부 경우 약 100 미크론 (마이크로미터) 미만의 폭 또는 직경을 갖는 요소 또는 물품을 지칭한다. 일부 경우, 요소 또는 물품은 유체가 흐를 수 있는 채널을 포함한다. 또한, 본 명세서에서 사용되는 "미세유체"는 적어도 하나의 마이크로규모 채널을 포함하는 장치, 기구 또는 시스템을 지칭한다.
미세 유체 시스템 및 장치는, 통상 소형화 실험실 (예를 들어, 임상) 분석의 맥락에서, 다양한 문맥으로 설명되었다. 다른 용도도 역시 설명되어 있다. 예를 들어, 국제 특허 출원 공개 번호 WO 01/89788; WO2006/040551; WO 2006/040554; WO 2004/002627; WO 2008/063227; WO 2004/091763; WO2005/021 151; WO 2006/096571; WO 2007/089541; WO 2007/081385 및 WO 2008/063227.
액적은 일반적으로 제2 캐리어 유체에 일정량의 제1 샘플 유체를 포함한다. 액적을 형성하기 위하여 당업계에 공지된 임의의 기술이 본 발명의 방법과 함께 사용될 수 있다. 예시적인 방법은 표적 물질 (예를 들어, 면역 세포)을 함유하는 샘플 유체의 스트림을 유동시키는 것을 포함하는데, 이로써 이는 흐르는 캐리어 유체의 대향적 2 개의 스트림과 교차한다. 캐리어 유체는 샘플 유체와 비혼화성이다. 흐르는 캐리어 유체의 대향하는 2 개 스트림과 샘플 유체의 교차점은 샘플 유체를 개별 샘플 액적으로 나누는 (partitioning) 결과를 낳는데, 이는 표적 물질을 함유하는 용기로서 작용할 수 있다.
캐리어 유체는 샘플 유체와 비혼화성인 임의의 유체일 수 있다. 예시적인 캐리어 유체는 오일이다. 특정 구체예에서, 캐리어 유체는 계면활성제를 포함한다.
동일한 방법을 사용하여, 예를 들어 중합 효소 연쇄 반응 (PCR)과 같은 증폭 반응, 또는 다중-가닥 변위 증폭과 같은 비-PCR 기반 증폭 반응, 또는 당업계의 당업자에게 알려진 다른 방법을 위한 시약과 같은 다른 시약을 함유하는 개별적인 액적 또는 용기를 생성할 수 있다. PCR-기반 증폭 반응을 수행하기 위한 적합한 시약은 당업자에게 공지되어 있으며, DNA 중합 효소, 포워드 및 리버스 프라이머, 데옥시뉴클레오타이드 트리포스페이트 (dNTP) 및 하나 이상의 완충제를 포함하지만 이에 국한되지는 않는다.
특정 구체예에서, 유체 구획은 표적 물질 (예를 들어, 면역 세포 및/또는 비드와 같은 고체 지지체)을 포함하는 제1 유체 파티션 (예를 들어, 액적) 및 제2 유체 (예를 들어, 유체 스트림으로서 또는 액적 내)를 제공함으로써 형성된다. 제1 및 제2 유체는 합쳐져 액적을 형성하며, 이는 제공되는 방법을 위한 용기로서 작용할 수 있다. 두 유체에 전기장을 적용하여 병합이 달성될 수 있다. 특정 구체예에서, 제2 유체는 증폭 반응, 예컨대 중합 효소 연쇄 반응 또는 증폭 반응을 수행하기 위한 시약을 함유한다.
기계적 안정성이 높을수록 미세 유체 조작 및 보다 높은 전단 유체 처리 (예를 들어, 미세 유체 모세관 또는 유체 경로에서 밸브와 같은 90도 회전을 통하여)에 유용할 수 있다. 사전- 및 사후-열처리된 액적 용기 또는 캡슐 용기는 표준 피펫 조작 및 원심 분리에 대해 기계적으로 안정할 수 있다.
3. 역전사
일부 경우에, 표적 폴리뉴클레오타이드는 역전사에 의해 mRNA와 같은 RNA로부터 제조된다. 일부 경우에, 표적 폴리뉴클레오타이드는 예컨대 중합 효소를 사용하여 프라이머 신장에 의해 DNA로부터 제조된다. 역전사 반응 동안, mRNA와 같은 세포 RNA는 역전사되어 상보적 DNA (cDNA)를 생성하고, 고유한 분자 바코드가 각각의 cDNA에 부가되어 세포 전사체에 상보적인 바코딩된 단일-가닥 폴리뉴클레오타이드를 생성한다. 이러한 바코딩된 단일-가닥 폴리뉴클레오타이드는 전사체 내 각 전사물에 대해 생성될 수 있다.
본 명세서에 기재된 방법은 커플링된 역전사-PCR (역전사-PCR)에서 사용될 수 있다. 예를 들어, 역전사 및 PCR은 2 개의 별개의 단계로 수행될 수 있다. 먼저, 샘플 mRNA의 cDNA 카피는 폴리뉴클레오타이드 dT 프라이머, 서열 특이 적 프라이머, 범용 프라이머, 무작위 6량체 올리고뉴클레오타이드 프라이머의 혼합물, 또는 본 명세서에 기재된 임의의 프라이머 중 하나를 사용하여 합성될 수 있다. 일부 예에서, RNA의 cDNA 카피는, 프라이머, 예컨대 서열 특이적 프라이머의 혼합물 및 무작위 6량체 올리고뉴클레오타이드 프라이머의 혼합물을 사용하여, 동일한 세포의 전사체에 실질적으로 대응하는 폴리뉴클레오타이드의 집합체에 더하여, 예컨대 세포의 특이적 표적 RNA 분자를 포착하기 위하여 생성될 수 있다.
역전사 및 PCR은 단일 폐쇄 용기 반응으로 수행될 수 있다. 예를 들어, 동일한 폐쇄 용기에서 다수의 프라이머, 즉 역전사를 위한 하나 이상의 프라이머 및 PCR을 위한 2 개 이상의 프라이머가 사용될 수 있다. 역전사를 위한 프라이머(들)은 mRNA 3'에 제1 PCR 앰플리콘의 위치에 결합할 수 있다. 일부 구체예에서, PCR 조건은, 그에 특이적인 프라이머를 사용하여, 제1 어댑터, 또는 제1 어댑터 풀에 대한 증폭을 실질적으로 제한하고 더 큰 분자-바코딩된 cDNA의 증폭을 제한하도록 변형될 수 있다. 필수적이지 않음에도 불구하고, 역전사 프라이머(들)은 RNA 잔기 또는 2'-O-메틸 RNA 염기와 같은 변형된 유사체를 포함할 수 있으며, 이는 mRNA에 혼성화될 때 RNase H에 대한 기질을 형성하지 않을 것이다.
역전사 반응을 수행하는 온도는 사용되는 역전사 효소에 의존한다. 일부 경우에, 열안정한 역전사 효소가 사용되고 역전사 반응은 약 37℃ 내지 약 75℃, 약 37℃ 내지 약 50℃, 약 37℃ 내지 약 55℃, 약 37℃ 내지 약 60℃, 약 55℃ 내지 약 75℃, 약 55℃ 내지 약 60℃, 약 37℃, 또는 약 60℃에서 수행된다. 일부 경우에, 3 개 이상의 비-주형 말단 뉴클레오타이드를 전사된 생성물의 말단으로 전달하는 역전사 효소가 사용된다.
본 명세서에 기술된 역전사 반응 및 PCR 반응은 당업계에 공지된 다양한 형식으로 수행될 수 있는데, 예컨대 튜브, 마이크로타이터 플레이트, 미세 유체 장치, 또는 바람직하게는 액적에서 수행될 수 있다.
역전사 반응은 5 μL 내지 100 μL 범위의 부피로, 또는 10 μL 내지 20 μL 반응 부피로 수행될 수 있다. 액적에서, 반응 부피는 1 pL 내지 100 nL, 또는 10 pL 내지 1 nL의 범위일 수 있다. 일부 경우에, 역전사 반응은 약 1nL 또는 그 미만의 부피를 갖는 액적에서 수행된다.
RNA와 같은 표적 폴리뉴클레오타이드는 하나 이상의 역전사 프라이머를 사용하여 cDNA로 역전사될 수 있다. 하나 이상의 역전사 프라이머는, RNA의 한 영역, 예컨대 불변 영역 (예를 들어, 중쇄 또는 경쇄 불변 영역 또는 mRNA의 폴리-A 테일)에 상보적인 영역을 포함할 수 있다. 일부 구체예에서, 역전사 프라이머는 제1 RNA의 불변 영역에 상보적인 영역을 갖는 제1 역전사 프라이머, 및 제2 RNA의 불변 영역에 상보적인 영역을 갖는 제2 역전사 프라이머를 포함할 수 있다. 일부 구체예에서, 역전사 프라이머는 제1 RNA의 불변 영역에 상보적인 영역을 갖는 제1 역전사 프라이머, 및 각각 하나 이상의 RNA의 불변 영역에 상보적인 영역을 갖는 하나 이상의 역전사 프라이머를 포함할 수 있다.
일부 구체예에서, 역전사 프라이머는, 반응에서 프라이머-이량체 또는 프라이머-주형 스위치 생성물의 지수적 증폭에 의한 인공산물 (artifact) 형성을 최소화하도록 변형될 수 있다. 일부 구체예에서, 역전사 프라이머는 프라이머 중 하나 이상의 염기의 2'-O-메틸화의 첨가에 의해 변형된다. 일부 구체예에서, 하나 이상의 2'-O-메틸화된 염기는 프라이머 서열의 중심 근처에 위치하게 된다. 이러한 변형된 프라이머는 전형적으로 2'O-메틸-변형된 잔기에 반대성 염기를 혼입시킬 수 없는 DNA 중합 효소를 함유하는 반응에 사용된다. 예시적인 2'O-메틸-변형된 프라이머는 SEQ ID NOs: 12-22에 제시되어 있다.
일부 구체예에서, 역전사 프라이머는 무작위 6량체 올리고뉴클레오타이드의 혼합물이다. 이러한 프라이머는 무작위 위치에서 RNA에 결합하고, 그에 의하여 미지의 서열의 역전사 반응을 개시할 수 있다. 이러한 예에서, 본질적으로 세포의 전사체의 역전사를 결과하기 위해 6량체 프라이머의 충분한 공급이 이용된다. 따라서, 이러한 구체예에서, 세포의 전사체에 상응하는 cDNA 폴리뉴클레오타이드의 집합체와 같은 폴리뉴클레오타이드의 집합체가 생성된다.
일부 구체예에서, 역전사 프라이머는 바코드를 포함하지 않는다.
역전사 프라이머는 RNA의 영역에 상보적이지 않은 영역을 추가로 포함할 수 있다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은, RNA에 상보적인 프라이머의 영역에 대해 5'이다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 RNA에 상보적인 프라이머의 영역에 대해 3'이다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 5' 오버행 영역이다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 증폭 및/또는 시퀀싱 반응을 위한 프라이밍 부위, 예컨대 어댑터를 포함한다. 본 명세서에 기재된 하나 이상의 프라이머를 사용하여, RNA 분자는 당업계에 공지된 적합한 시약을 사용하여 역전사된다.
특정 구체예에서, 역전사 효소는 비-주형 말단 트랜스퍼라아제 활성을 포함할 수있다. 비-주형 말단 트랜스퍼라아제 활성을 포함하는 역전사 효소가 주형의 끝에 도달하면, 3 개 또는 그 이상의 비-주형 잔기, 예컨대 3 개 이상의 비-주형 시토신 잔기를 부가할 수 있다. 일부 구체예에서, Superscript II™ 역전사 효소가 이러한 목적으로 사용된다. 일부 구체예에서, Maxima™ 역전사 효소가 이러한 목적으로 사용된다. 일부 구체예에서, Protoscript II ™ 역전사 효소가 이러한 목적으로 사용된다. 일부 구체예에서, 말로니 뮤린 백혈병 바이러스 역전사 효소 (MMLV-RT)가 이러한 목적으로 사용된다. 일부 구체예에서, HighScriber™ 역전사 효소가 이러한 목적으로 사용된다. 일부 구체예에서, 말단 데옥시뉴클레오티딜 트랜스퍼라아제가 이러한 목적으로 사용된다. 일부 구체예에서, 조류 골수 아세포증 바이러스 (AMV) 역전사 효소가 이러한 목적으로 사용된다. 비-주형 말단 트랜스퍼 라아제 활성을 갖는, RNA를 전사할 수 있는 임의의 역전사 효소가 사용될 수 있다. 비-주형 말단 트랜스퍼라아제 활성을 갖는, RNA를 전사할 수있는 임의의 역중합 효소가 사용될 수 있다. 비-주형 말단 트랜스퍼라아제 활성을 갖는, DNA를 전사할 수있는 임의의 역중합 효소가 사용될 수 있다.
전술한 것과 같은 역전사 반응은 3' 태깅 폴리뉴클레오타이드의 존재하에 수행될 수 있다. 3' 태깅 폴리뉴클레오타이드는 cDNA와 같은 표적 폴리뉴클레오타이드의 3' 말단에 핵산을 첨가하는데 사용되는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 cDNA와 같은 표적 폴리뉴클레오타이드의 3' 말단에 핵산을 첨가하기 위한 주형으로 사용되는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 cDNA와 같은 표적 폴리 뉴클레오타이드의 3' 말단에 혼성화하는 폴리뉴클레오타이드일 수 있다. 3' 태깅 폴리뉴클레오타이드는 cDNA와 같은 표적 폴리뉴클레오타이드의 3' 말단 영역에 혼성화하는 3' 영역, 예컨대 3' 말단 영역을 함유하는 폴리뉴클레오타이드일 수 있다. 예를 들어, 3' 태깅 폴리뉴클레오타이드는 3 개 이상의 비-주형 잔기에 어닐링하는 분절과 같은 분절을 포함할 수 있다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 분자 바코드 폴리뉴클레오타이드이다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 분자 바코드를 포함할 수 있다. 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 3' 말단에 역전사 효소에 의해 생성된 가닥에 상보적이고 어닐링되는 3' 리보구아노신 잔기 또는 그의 유사체 (rGrGrG)(RNA 염기)를 포함할 수 있다. 일부 구체예에서, 리보구아노신 대신에 3 개 이상의 구아닌 잔기가 사용될 수 있다 (RNA 뉴클레오타이드 대신 DNA 뉴클레오타이드). 일부 구체예에서, 3' 태깅 폴리뉴클레오타이드는 3' 말단에 역전사 효소에 의해 생성된 가닥에 상보적이고 어닐링되는 1 개 또는 2 개의 리보구아노신 잔기 및 3' 말단에 하나의 리보구아노신 잔기 또는 그의 유사체를 포함할 수 있다 (rGrGG).
3' 태깅 폴리뉴클레오타이드가 cDNA 가닥의 CCC에 어닐링시, 역전사 효소는 cDNA를 태깅 폴리뉴클레오타이드 내로 계속 연장시키고, 그에 의하여 반응에서 분자 바코드 또는 그의 상보체를 표적 폴리뉴클레오타이드 집단, 예컨대 cDNA에 부착시킬 수 있다. 예를 들어, 3' 태깅 폴리뉴클레오타이드는 표적 폴리뉴클레오타이드의 3' 말단에 혼성화되는 5' 내지 3' 영역을 함유하는 폴리뉴클레오타이드일 수 있다. 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 5' 내지 3' 영역은 cDNA와 같은 표적 폴리뉴클레오타이드에 상보적이지 않은 영역을 포함할 수 있다. 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 5' 내지 3' 영역은 분자 바코드를 포함할 수 있다. 표적 폴리뉴클레오타이드의 3' 말단에 혼성화하는 5' 내지 3' 영역은 용기 바코딩된 폴리뉴클레오타이드 또는 그의 상보체에 상보적인 영역을 포함할 수 있다. 다른 실험에서, 주형 스위칭은 별도의 반응으로 수행될 수 있다. 예를 들어, 역전사 반응 후에 3' 태깅 폴리뉴클레오타이드를 첨가할 수 있고, 역전사 효소 또는 중합 효소와 같은 효소를 사용하여 태깅 폴리뉴클레오타이드 내로 확장할 수 있다. 태깅 폴리뉴클레오타이드는 용기 내 각 분자에 고유한 축퇴 분자 바코드를 품을 수 있기 때문에, 용기의 각 cDNA는 분자 바코드로 고유하게 태그될 수 있다. 일부 구체예에서, 역전사 반응이 수행되는 것과 동시에 주형 스위칭이 수행될 수 있다.
역전사 반응은 3' 태깅 폴리뉴클레오타이드의 존재하에 수행될 수 있다. 3' 태깅 폴리뉴클레오타이드는 시퀀싱 프라이머를 어닐링하는데 사용될 수 있는 P7 분절을 포함할 수 있다. 3' 태깅 폴리뉴클레오타이드는 용기 바코드 또는 분자 바코드를 포함할 수 있다. 3' 태깅 폴리뉴클레오타이드는 3' 말단에 역전사 효소에 의해 생성된 가닥에 상보적이고 어닐링될 수 있는 3' 리보구아노신 잔기를 포함할 수 있다 (rGrGrG)(RNA 염기). 따라서, 역전사 효소에 의해, 이러한 동일한 에멀젼에서 cDNA의 말단에 용기 바코드 및 분자 바코드가 부가될 수 있다. 일부 구체예에서, 리보구아노신 대신 구아닌 잔기가 사용될 수 있다 (RNA 뉴클레오타이드 대신 DNA 뉴클레오타이드). 3' 태깅 폴리뉴클레오타이드가 cDNA 가닥의 CCC에 어닐링시, 역전사 효소는 계속하여 cDNA를 3' 태깅 폴리뉴클레오타이드 내로 연장하고, 그에 의하여 반응에서 모든 cDNA에 분자 바코딩된 태그를 생성한다. 3' 태깅 폴리뉴클레오타이드가 분자 바코딩된 cDNA의 영역에 어닐링시, 역전사 효소 또는 중합 효소는 계속하여 분자 바코딩된 cDNA를 다른 3' 태깅 폴리뉴클레오타이드 내로 연장하고, 그에 의하여 반응에서 모든 cDNA에 용기 바코딩된 태그를 생성한다.
일부 구체예에서, 역전사 반응 수행될 수 있는 시간에 동시에 이루어지는 것을 대신하여, 주형 스위칭을 별도의 반응으로 수행할 수 있다. 일부 구체예에서, 역전사 반응 후 3' 태깅 폴리뉴클레오타이드를 부가할 수 있고, 역전사 효소 또는 중합 효소와 같은 효소를 사용하여 유사한 방식으로 태깅 폴리뉴클레오타이드 내로 연장할 수 있다. 3' 태깅 폴리뉴클레오타이드는 각각의 단일 분자 상에 고유한 축퇴 분자 바코드를 품을 수 있기 때문에, 각각의 cDNA는 분자 바코드로 고유하게 태그될 수 있다. 3' 태깅 폴리뉴클레오타이드는 단일 용기로부터의 각각의 단일 분자 상에 동일한 축퇴 용기 바코드를 품을 수 있기 때문에, 각 cDNA는 용기에 고유한 용기 바코드로 태그될 수 있다.
일부 구체예에서, 주형 스위칭 분자, 예컨대 바코드 (예를 들어, 분자 바코드)를 함유하는 주형 스위치 올리고뉴클레오타이드는 인공산물 형성을 최소화하기 위해 변형된 염기를 포함할 수 있다. 일부 예에서, 주형-스위치 올리고뉴클레오타이드는 2'데옥시 유리딘을 함유할 수 있는데, 이는 역전사될 수 있지만 DNA 중합 효소에 의해 복제될 수는 없다. 일부 구체예에서, 리보구아노신은 주형-스위치 올리고뉴클레오타이드에 혼입될 수 있다. 일부 구체예에서, 주형-스위치 올리고뉴클레오타이드는 3' 말단에서 변형되어 역전사 효소 또는 DNA 중합 효소에 의한 연장을 방지할 수 있다. 이러한 변형은 프라이머 연장의 차단을 결과하는 3'데옥시, 3'포스페이트, 3'아미노 및 3'알킬 변형을 포함한다.
4. 중합 효소 연쇄 반응 ( PCR )
RNA 분자의 역전사 반응을 수행한 후, 결과물인 단일 바코딩된 cDNA 분자는 동시에 용기 바코드로 바코딩되고 하나 이상의 PCR 반응(들)에 의해 증폭되어 하나 이상의 앰플리콘을 생성할 수 있다. 일부 예에서, PCR은 mRNA 전사체 서열에 상응하는 코딩 서열을 함유하고 역전사 효소 반응 중에 생성된 cDNA 가닥에 상보적인 이중 바코딩된 cDNA 가닥을 생성하는데 사용된다. PCR을 위한 효소 및 프라이머 설계는 공지되어 있으며, 이러한 시약의 비-제한적인 예가 본 명세서에 기재되어 있다. 이러한 시약 중 임의의 것이 제공되는 방법에서 PCR 용으로 선택되고 사용될 수 있다.
일부 경우에, PCR 반응은, 반응 부피가 1 pL 내지 100 nL, 바람직하게는 10 pL 내지 1 nL 범위에 이르는 액적에서 일어난다. 일부 경우에, PCR 반응은 약 1 nL 또는 그 미만의 부피를 갖는 액적에서 수행된다. 일부 경우에, 역전사 반응 및 PCR 반응은, 반응 부피가 1 pL 내지 100 nL 또는 10 pL 내지 1 nL 범위에 이르는 동일한 액적에서 수행된다. 일부 경우에, 역전사 반응 및 PCR 반응은 약 1nL 또는 그 미만의 부피 또는 약 1 pL 또는 그 미만의 부피를 갖는 액적에서 수행된다. 일부 경우에, 역전사 반응 및 PCR 반응은 서로 다른 액적에서 수행된다. 일부 경우에, 역전사 반응 및 PCR 반응은 각각 반응 부피가 1 pL 내지 100 nL 또는 10 pL 내지 1 nL 범위인 복수 개의 액적에서 수행된다. 일부 경우에, 역전사 반응 및 PCR 반응은 각각 약 1 nL 또는 그 미만의 부피를 갖는 복수 개의 액적에서 수행된다.
일부 경우에, 제1 PCR 반응은 반응 부피가 1 pL 내지 100 nL, 바람직하게는 10 pL 내지 1 nL 범위인 제1 액적에서 이루어지고, 제2 PCR 반응은 반응 부피가 1 pL 내지 100 nL, 바람직하게는 10 pL 내지 1 nL 범위인 제 액적에서 이루어진다. 일부 경우에, 제1 PCR 반응은 약 1 nL 또는 그 미만의 부피를 갖는 제1 액 적에서 이루어지고, 제2 PCR 반응은 약 1 nL 또는 그 미만의 부피를 갖는 제2 액 적에서 이루어진다.
일부 경우에, 제1 PCR 반응 및 제2 PCR 반응은 각각 1 pL 내지 100 nL 또는 10 pL 내지 1 nL의 반응 부피 범위를 갖는 복수 개의 액적에서 수행된다. 일부 경우에, 제1 PCR 반응 및 제2 PCR 반응은 각각 약 1 nL 또는 그 미만의 부피를 갖는 복수 개의 액적에서 수행된다.
본 명세서에서 제공되는 방법의 일부 구체예에서, 반응의 조건은 선택된 서열의 증폭을 수행하고 다른 서열의 증폭을 최소화하도록 변형될 수 있다. 이러한 변형은 PCR 열순환 동안의 용융 온도와 같은 온도를 변경하는 것을 포함할 수 있다. 예를 들어, PCR의 "차가운 (cold)" 사이클을 사용하여 더 짧은 올리고뉴클레오타이드를 선택적으로 증폭시킬 수 있다. "차가운" PCR 사이클은, 변성 온도에 있어서 "뜨거운 (hot)" PCR 사이클과 다르다. "차가운" PCR 사이클은 보다 낮은 온도에서 변성을 결과하여, 더 긴, 이중-가닥 서열보다 보다 쉽게 변성되는 더 짧은 서열을 양호하게 증폭시킨다. 따라서, "차가운" PCR 사이클은 더 긴 서열의 증폭을 제한하면서, 더 짧은 서열을 증폭시키는데 사용된다. 일부 예에서, 원하는 앰플리콘을 생성하기 위하여 "차가운" 사이클 및 "뜨거운 사이클"의 조합이 사용된다.
일부 구체예에서, PCR의 변성, 프라이밍 및/또는 신장 단계의 지속 시간은 반응 부피에서 특정 서열을 선택적으로 또는 양호하게 증폭시키기 위해 변형될 수 있다. 일부 예에서, PCR 증폭에 사용되는 프라이머는 특정 조건하에서 PCR 증폭을 감소시키거나 증가시키기 위해 선택되거나 변형될 수 있다. 일부 예에서, 열에 불안정한 액세서리 그룹은 포스포트리에스테르 결합을 통해 대부분의 염기의 3' 말단에 첨가되어, 올리고뉴클레오타이드 프라이머로 하여금 낮은 온도에서 불활성이다가 일단 따뜻한 온도에 노출되면 활성화될 수 있게 한다. 일부 예에서, 3' 말단에서 열-불안정성 액세서리 그룹에 연결된 올리고뉴클레오타이드가 제공되는 방법에서 사용되며, 그로써 올리고뉴클레오타이드는 낮은 온도, 예컨대 역전사 효소 반응이 일어나는 온도에서 프라이머 연장이 불가능하지만 예컨대 PCR 전 또는 PCR 동안 더 높은 온도에 노출되면 활성화되게 된다.
RNA 분자의 역전사 반응 또는 게놈 분자의 프라이머 연장을 수행한 후, 용기 바코드를 함유하는 올리고뉴클레오타이드는 중합 효소 연쇄 반응에 의해 증폭되어 분자 바코딩된 폴리뉴클레오타이드에 부착될 다수의 카피를 생성한다. 일부 예에서, 용기 바코드를 함유하는 올리고뉴클레오타이드는, 3' 말단에 열-불안정성 액세서리 그룹의 부가로 변형되어 역전사 효소 반응 동안 프라이머 연장을 방지하지만 PCR 중에 프라이머 연장 및 후속하는 증폭을 가능하게 하는 프라이머를 사용하여 증폭된다. 일부 구체예에서, 용기 바코드를 함유하는 올리고뉴클레오타이드의 증폭은 본 명세서에 기재된 "차가운" 열순환을 사용하여 수행되었다.
RNA 분자의 역전사 반응을 수행한 후, 결과물인 cDNA 분자는 분자 바코드 및 용기 바코드로 바코딩되고 하나 이상의 PCR 반응, 예를 들어 제1 및/또는 제2 PCR 반응에 의해 증폭될 수 있다. 제1 및/또는 제2 PCR 반응은 한 쌍의 프라이머 또는 복수 개의 프라이머 쌍을 이용할 수 있다. 제1 및/또는 제2 PCR 반응은 복수 개의 포워드/리버스 프라이머 및 리버스 프라이머를 이용할 수 있다. 제1 및/또는 제2 PCR 반응은 복수 개의 포워드/리버스 프라이머 및 포워드 프라이머를 이용할 수 있다. 복수 개의 포워드/리버스 프라이머 중 제1 및/또는 제2 프라이머는 cDNA 분자 또는 바코딩된 cDNA 분자에 상보적인 영역을 함유하는 포워드/리버스 프라이머일 수 있다. 복수 개의 포워드/리버스 프라이머 중 제1 및/또는 제2 프라이머는 바코딩된 cDNA 분자에 상보적인 영역을 함유하는 포워드/리버스 프라이머일 수 있다.
일부 구체예에서, 복수 개의 포워드/리버스 프라이머는 하나 이상의 포워드/리버스 프라이머를 포함하고, 여기서 복수 개의 포워드/리버스 프라이머에서 각각의 포워드/리버스 프라이머는 cDNA 또는 바코딩된 cDNA의 V 분절에 대한 하나 이상의 상류 또는 하류 영역에 상보적인 영역을 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, cDNA 또는 바코딩된 cDNA의 V 분절에 대한 하나 이상의 상류 또는 하류 영역에 상보적인 영역을 포함하는 포워드/리버스 프라이머, 및 cDNA 또는 바코딩된 cDNA의 V 분절에 대한 하나 이상의 다른 상류 또는 하류 영역에 상보적인 영역을 포함하는 하나 이상의 다른 포워드/리버스 프라이머들을 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, cDNA 또는 바코딩된 cDNA의 V 분절에 대한 제1 및/또는 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제1 및/또는 제2 포워드/리버스 프라이머, 및 cDNA 또는 바코딩된 cDNA의 V 분절에 대한 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제2 포워드/리버스 프라이머를 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, cDNA 또는 바코딩된 cDNA의 V 분절에 대한 제1 및/또는 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제1 및/또는 제2 포워드/리버스 프라이머, cDNA 또는 바코딩된 cDNA의 V 분절에 대한 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제2 포워드/리버스 프라이머, 및 cDNA 또는 바코딩된 cDNA의 V 분절에 대한 제3 상류 또는 하류 영역에 상보적인 영역을 포함하는 제3 포워드/리버스 프라이머 등을 포함한다. 복수 개의 포워드/리버스 프라이머에서 프라이머는 샘플의 세포, 예를 들어 면역 B-세포 또는 T-세포에 의해 발현된 모든 V 분절의 모든 가능한 상류 또는 하류 영역에 어닐링하기 위해 사용될 수 있다.
일부 구체예에서, 복수 개의 포워드/리버스 프라이머는 하나 이상의 포워드/리버스 프라이머를 포함하고, 여기서 복수 개의 포워드/리버스 프라이머에서의 각각의 포워드/리버스 cDNA 또는 바코딩된 cDNA의 C 분절에 대한 하나 이상의 상류 또는 하류 영역에 상보적인 영역을 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, cDNA 또는 바코딩된 cDNA의 C 분절에 대한 하나 이상의 상류 또는 하류 영역에 상보적인 영역을 포함하는 포워드/리버스 프라이머, 및 cDNA 또는 바코딩된 cDNA의 C 분절에 대한 하나 이상의 다른 상류 또는 하류 영역에 상보적인 영역을 포함하는 하나 이상의 다른 포워드/리버스 프라이머들을 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, cDNA 또는 바코딩된 cDNA의 C 분절에 대한 제1 및/또는 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제1 및/또는 제2 포워드/리버스 프라이머, 및 cDNA 또는 바코딩된 cDNA의 C 분절에 대한 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제2 포워드/리버스 프라이머를 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, cDNA 또는 바코딩된 cDNA의 C 분절에 대한 제1 및/또는 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제1 및/또는 제2 포워드/리버스 프라이머, cDNA 또는 바코딩된 cDNA의 C 분절에 대한 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제2 포워드/리버스 프라이머, 및 cDNA 또는 바코딩된 cDNA의 C 분절에 대한 제3 상류 또는 하류 영역에 상보적인 영역을 포함하는 제3 포워드/리버스 프라이머 등을 포함한다. 복수 개의 포워드/리버스 프라이머에서 프라이머는 샘플의 세포, 예를 들어 면역 B-세포 또는 T-세포에 의해 발현된 모든 C 분절의 모든 가능한 상류 또는 하류 영역에 어닐링하기 위해 사용될 수 있다.
일부 구체예에서, 복수 개의 포워드/리버스 프라이머는 하나 이상의 포워드/리버스 프라이머를 포함하고, 여기서 복수 개의 포워드/리버스 프라이머에서 각각의 포워드/리버스 프라이머는 바코딩된 cDNA의 분자 바코드에 대한 하나 이상의 상류 또는 하류 영역에 상보적인 영역을 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, 바코딩된 cDNA의 분자 바코드에 대한 하나 이상의 상류 또는 하류 영역에 상보적인 영역을 포함하는 포워드/리버스 프라이머, 및 바코딩된 cDNA의 분자 바코드에 대한 하나 이상의 다른 상류 또는 하류 영역에 상보적인 영역을 포함하는 하나 이상의 다른 포워드/리버스 프라이머들을 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, 바코딩된 cDNA의 분자 바코드에 대한 제1 및/또는 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제1 및/또는 제2 포워드/리버스 프라이머, 및 바코딩된 cDNA의 분자 바코드에 대한 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제2 포워드/리버스 프라이머를 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, 바코딩된 cDNA의 분자 바코드에 대한 제1 및/또는 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제1 및/또는 제2 포워드/리버스 프라이머, 바코딩된 cDNA의 분자 바코드에 대한 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제2 포워드/리버스 프라이머, 및 바코딩된 cDNA의 분자 바코드에 대한 제3 상류 또는 하류 영역에 상보적인 영역을 포함하는 제3 포워드/리버스 프라이머 등을 포함한다. 복수 개의 포워드/리버스 프라이머는 샘플의 세포, 예를 들어 면역 B-세포 또는 T-세포에 의해 발현된 모든 분자 바코드의 모든 가능한 상류 또는 하류 영역에 어닐링하기 위해 사용될 수 있다.
일부 구체예에서, 복수 개의 포워드/리버스 프라이머는 하나 이상의 포워드/리버스 프라이머를 포함하고, 여기서 복수 개의 포워드/리버스 프라이머에서 각각의 포워드/리버스 프라이머는 바코딩된 cDNA의 용기 바코드에 대한 하나 이상의 상류 또는 하류 영역에 상보적인 영역을 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, 바코딩된 cDNA의 용기 바코드에 대한 하나 이상의 상류 또는 하류 영역에 상보적인 영역을 포함하는 포워드/리버스 프라이머, 및 바코딩된 cDNA의 용기 바코드에 대한 하나 이상의 다른 상류 또는 하류 영역에 상보적인 영역을 포함하는 하나 이상의 다른 포워드/리버스 프라이머들을 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, 바코딩된 cDNA의 용기 바코드에 대한 제1 및/또는 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제1 및/또는 제2 포워드/리버스 프라이머, 및 바코딩된 cDNA의 용기 바코드에 대한 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제2 포워드/리버스 프라이머를 포함한다. 예를 들어, 복수 개의 포워드/리버스 프라이머는, 바코딩된 cDNA의 용기 바코드에 대한 제1 및/또는 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제1 및/또는 제2 포워드/리버스 프라이머, 바코딩된 cDNA의 용기 바코드에 대한 제2 상류 또는 하류 영역에 상보적인 영역을 포함하는 제2 포워드/리버스 프라이머, 및 바코딩된 cDNA의 용기 바코드에 대한 제3 상류 또는 하류 영역에 상보적인 영역을 포함하는 제3 포워드/리버스 프라이머 등을 포함한다. 복수 개의 포워드/리버스 프라이머에서 프라이머는 샘플의 세포, 예를 들어 면역 B-세포 또는 T-세포에 의해 발현된 모든 용기 바코드의 모든 가능한 상류 또는 하류 영역에 어닐링하기 위해 사용될 수 있다.
복수 개의 포워드/리버스 프라이머에서 포워드/리버스 프라이머는 RNA의 영역에 상보적이지 않은 영역을 추가로 포함한다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 RNA에 상보적인 포워드/리버스 프라이머의 영역에 대하여 5'이다 (즉, V 분절의 상류 또는 하류 영역). 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 RNA에 상보적인 포워드/리버스 프라이머의 영역에 대하여 3'이다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 5' 오버행 영역이다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 증폭 및/또는 제2 시퀀싱 반응을 위한 프라이밍 부위를 포함한다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 증폭 및/또는 제3 시퀀싱 반응을 위한 프라이민 부위를 포함한다. 일부 구체예에서, RNA의 영역에 상보적이지 않은 영역은 제2 및 제3 시퀀싱 반응을 위한 프라이밍 부위를 포함한다. 일부 구체예에서, 제2 및 제3 시퀀싱 반응을 위한 프라이밍 부위의 서열은 동일하다. 본 명세서에 기재된 바와 같은 하나 이상의 포워드/리버스 프라이머 및 리버스 프라이머를 사용하여, cDNA 분자는 당업계에 공지된 적합한 시약을 사용하여 증폭된다. 일부 구체예에서, 영역은 RNA의 영역, 예를 들어 mRNA의 불변 영역 또는 폴리-A 테일에 상보적이다.
5. 바코드
바코드는 분자 바코드 또는 용기 바코드일 수 있다. 일부 구체예에서, 바코드, 예컨대 분자 바코드 또는 용기 바코드는 각각 2 내지 36 개 뉴클레오타이드, 4 내지 36 개 뉴클레오타이드, 또는 6 내지 30 개 뉴클레오타이드, 또는 8 내지 20 개 뉴클레오타이드, 2 내지 20 개 뉴클레오타이드, 4 내지 20 개 뉴클레오타이드, 또는 6 내지 20 개의 뉴클레오타이드 범위 내 길이를 가질 수 있다. 특정 측면에서, 한 세트 내 바코드의 용융 온도는 서로의 10℃ 이내, 서로의 5℃ 이내, 또는 서로의 2℃ 이내이다. 특정 측면에서, 한 세트 내 바코드의 용융 온도는 서로의 10℃ 이내, 서로의 5℃ 이내, 또는 서로의 2℃ 이내가 아니다. 다른 측면에서, 바코드는 최소한으로 교차-혼성화하는 세트의 구성원이다. 예를 들어, 이러한 세트의 각 구성원의 뉴클레오타이드 서열은, 엄격한 혼성화 조건하에서 어떠한 구성원도 임의의 다른 구성원의 상보체와 안정한 이중체를 형성할 수 없는, 세트의 모든 다른 구성원의 그것과 충분히 상이할 수 있다. 일부 구체예에서, 최소한으로 교차-혼성화하는 세트의 각 구성원의 뉴클레오타이드 서열은 적어도 2 개의 뉴클레오타이드로 다른 모든 구성원의 것과 다르다. 바코드 기술은 Winzeler et al. (1999) Science 285:901; Brenner (2000) Genome Biol. 1:1 Kumar et al. (2001) Nature Rev. 2:302; Giaever et al. (2004) Proc.Natl. Acad. Sci. USA 101:793; Eason et al. (2004) Proc. Natl. Acad. Sci. USA 101:1 1046; 및 Brenner (2004) Genome Biol. 5:240에 기술되어 있다.
본 명세서에서 사용되는 바와 같이, 분자 바코드는 단일 세포로부터 또는 단일 용기로부터의 단일 분자, 또는 2 개 이상의 단일 세포로부터 또는 2 개 이상의 단일 용기로부터의 복수 개의 분자 라이브러리의 2 개 이상의 분자에 고유한 정보를 포함한다. 본 명세서에서 사용되는 바와 같이, 용기 바코드는 서로 다른 단일 세포로부터 또는 서로 다른 단일 용기로부터의 폴리뉴클레오타이드와 비교하여, 단일 세포로부터 또는 단일 용기로부터의 폴리뉴클레오타이드에 고유한 정보를 포함한다. 일부 구체예에서, 고유 정보는 고유한 뉴클레오타이드 서열을 포함한다. 예를 들어, 분자 바코드 또는 용기 바코드의 서열은 상기 분자 바코드 또는 용기 바코드를 포함하는 고유하거나 또는 무작위적인 뉴클레오타이드 서열의 동일성 및 순서를 결정함으로써 결정될 수 있다. 일부 구체예에서, 제1 어댑터는 용기 바코드 서열을 포함한다.
일부 구체예에서, 고유한 정보는 표적 폴리뉴클레오타이드의 서열을 식별하는데 사용될 수 없다. 예를 들어, 분자 바코드는 하나의 표적 폴리뉴클레오타이드에 부착될 수 있지만, 그 분자 바코드는 그것이 부착된 표적 폴리뉴클레오타이드를 결정하는데 사용될 수는 없다. 일부 구체예에서, 고유한 정보는 표적 폴리뉴클레오타이드의 서열의 동일성과 관련된 공지된 서열이 아니다. 예를 들어, 용기 바코드는 하나 이상의 표적 폴리뉴클레오타이드에 부착될 수 있지만, 용기 바코드는 그것이 부착된 하나 이상의 표적 폴리뉴클레오타이드 중 어느 것인지를 결정하는데 사용될 수 없다. 일부 구체예에서, 고유한 정보는 무작위적 뉴클레오타이드 서열을 포함한다. 일부 구체예에서, 고유한 정보는 폴리뉴클레오타이드에 대한 하나 이상의 고유한 뉴클레오타이드 서열을 포함한다. 일부 구체예에서, 고유한 정보는 축퇴 뉴클레오타이드 서열 또는 축퇴 바코드를 포함한다. 축퇴 바코드는 가변적 뉴클레오타이드 염기 조성 또는 서열을 포함할 수 있다. 예를 들어, 축퇴 바코드는 무작위 서열일 수 있다. 일부 구체예에서, 분자 바코드 또는 용기 바코드의 상보적 서열은 또한 분자 바코드 또는 용기 바코드 서열이다.
분자 바코드 또는 용기 바코드는 임의 길이의 뉴클레오타이드를 포함할 수 있다. 예컨대, 분자 바코드 또는 용기 바코드는 적어도 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37,38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500, 또는 1000 개 뉴클레오타이드를 포함할 수 있다. 예컨대, 분자 바코드 또는 용기 바코드는 최대 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500, 또는 1000 개 뉴클레오타이드를 포함할 수 있다. 일부 구체예에서, 분자 바코드 또는 용기 바코드는 특정 길이의 뉴클레오타이드를 갖는다. 예컨대, 분자 바코드 또는 요기 바코드는 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27,28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500, 또는 1000 개 뉴클레오타이드 길이일 수 있다.
일부 구체예에서, 복수 개의 분자 바코드 또는 용기 바코들에서 각각의 분자 바코드 또는 용기 바코드는 적어도 약 2 개의 뉴클레오타이드를 갖는다. 예컨대, 복수 개의 분자 바코드 또는 용기 바코드에서 각각의 분자 바코드 또는 용기 바코드는 적어도 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500, 또는 1000 개 뉴클레오타이드 길이일 수 있다. 일부 구체예에서, 복수 개의 분자 바코드 또는 용기 바코드에서 각각의 분자 바코드 또는 용기 바코드는 최대 약 1000 개 뉴클레오타이드를 갖는다. 예컨대 복수 개의 분자 바코드 또는 용기 바코드에서 각각의 분자 바코드 또는 용기 바코드는 최대 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49,50, 60, 70, 80, 90, 100, 200, 500, 또는 1000 개 뉴클레오타이드 길이일 수 있다. 일부 구체예에서, 복수 개의 분자 바코드 또는 용기 바코드에서 각각의 분자 바코드 또는 용기 바코드는 동일한 길이의 뉴클레오타이드를 갖는다. 예컨대, 복수 개의 분자 바코드 또는 용기 바코드에서 각각의 분자 바코드 또는 용기 바코드는 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18,19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45,46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500, 또는 1000 개 뉴클레오타이드 길이일 수 있다. 일부 구체예에서, 복수 개의 분자 바코드 또는 용기 바코드에서 하나 이상의 분자 바코드 또는 용기 바코드는 서로 다른 길이의 뉴클레오타이드를 갖는다. 예컨대, 복수 개의 분자 바코드 또는 용기 바코드에서 하나 이상의 제1 분자 바코드 또는 용기 바코드는 약, 또는 적어도 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,60, 70, 80, 90, 100, 200, 500, 또는 1000 개 뉴클레오타이드를 가질 수 있고, 복수 개의 분자 바코드 또는 용기 바코드에서 하나 이상의 제2 분자 바코드 또는 용기 바코드는 약 2, 3, 4, 5, 6, 7,8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34,35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 60, 70, 80, 90, 100, 200, 500, 또는 1000 개 뉴클레오타이드를 가질 수 있는데, 여기서 하나 이상의 제1 분자 바코드 또는 용기 바코드의 뉴클레오타이드 수는 하나 이상의 제2 분자 바코드 또는 용기 바코드와는 다르다.
분자 바코드의 수는 복수 개의 용기에서 표지되는 분자의 총 수를 초과할 수 있다. 용기 바코드의 수는 복수 개의 용기에서 표지되는 분자의 총 수를 초과할 수 있다. 예컨대, 분자 바코드 또는 용기 바코드의 수는 복수 개의 용기에서 표지되는 분자의 총 수보다 적어도 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 배 클 수 있다.
여러 가지 분자 바코드의 수는 복수 개의 용기에서 표지되는 분자의 총 수를 초과할 수 있다. 일부 구체예에서, 여러 가지 분자 바코드의 수는 복수 개의 용기에서 표지되는 분자의 총 수보다 적어도 약 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50,60, 70, 80, 90, 또는 100 배 크다.
단일 용기 내 여러 가지 분자 바코드의 수는 단일 용기에서 표지되는 여러 가지 분자들의 수를 초과할 수 있다. 일부 구체예에서, 단일 용기에서 여러 가지 분자 바코드의 수는 단일 용기에서 표지되는 여러 가지 분자의 수보다 적어도 약 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7,8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 배 크다.
여러 가지 용기 바코드의 수는 복수 개의 용기에서 표지되는 분자의 총 수 미만일 수 있다. 일부 구체예에서, 여러 가지 용기 바코드의 수는 복수 개의 용기에서 표지되는 분자의 총 수보다 적어도 약 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 배 적다.
단일 용기에서 용기 바코딩된 폴리뉴클레오타이드 분자로부터 증폭된 생성물 분자의 수는 단일 용기에서 표지되는 여러 가지 분자의 수를 초과할 수 있다. 일부 구체예에서, 단일 용기에서 용기 바코딩된 폴리뉴클레오타이드 분자로부터 증폭된 생성물 분자의 수는 단일 용기에서 표지되는 여러 가지 분자의 수보다 적어도 약 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6,7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 배 크다.
단일 용기에서 용기 바코딩된 폴리뉴클레오타이드 분자의 수는 단일 용기에서 표지되는 여러 가지 분자의 수 미만일 수 있다. 일부 구체예에서, 단일 용기에서 용기 바코딩된 폴리뉴클레오타이드 분자의 수는 단일 용기에서 표지되는 여러 가지 분자의 수보다 적어도 약 1, 1.5, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 배 적다.
단일 용기에서 용기 바코딩된 폴리뉴클레오타이드 분자의 수는 하나의 분자일 수 있다. 단일 용기에서 미증폭된 용기 바코딩된 폴리뉴클레오타이드 분자의 수는 하나의 분자일 수 있다.
일부 구체예에서, 적어도 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 또는 100%의 서로 다른 분자 바코드가 동일한 농도를 갖는다. 일부 구체예에서, 적어도 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%,50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 또는 100%의 서로 다른 용기 바코드가 동일한 농도를 갖는다.
일부 구체예에서, 적어도 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 또는 100%의 서로 다른 분자 바코드가 서로 다른 농도를 갖는다. 일부 구체예에서, 적어도 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%,50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 또는 100%의 서로 다른 용기 바코드가 서로 다른 농도를 갖는다.
분자 바코드 또는 용기 바코드의 집단에서의 분자 바코드 또는 용기 바코드는 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500,600, 700, 800, 900, 1000 개 또는 그 이상의 서로 다른 서열을 가질 수 있다. 예컨대, 집단에서 분자 바코드 또는 용기 바코드는 적어도 2,000, 3,000, 4,000, 5,000, 6,000, 7,000, 8,000, 9,000, 10,000, 15,000, 20,000, 25,000, 30,000, 35,000, 40,000, 45,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, 1,000,000 개 또는 그 이상의 서로 다른 서열을 가질 수 있다. 따라서, 복수 개의 분자 바코드 또는 용기 바코드는, 하나 이상의 폴리뉴클레오타이드, 예컨대 표적 폴리뉴클레오타이드로부터 적어도 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400,500, 600, 700, 800, 900, 1000 개 또는 그 이상의 서로 다른 서열을 생성하는데 사용될 수 있다. 예컨대, 복수 개의 분자 바코드 또는 용기 바코드는, 하나 이상의 폴리뉴클레오타이드, 예컨대 표적 폴리뉴클레오타이드로부터 적어도 2,000, 3,000, 4,000, 5,000, 6,000, 7,000, 8,000, 9,000, 10,000, 15,000, 20,000, 25,000, 30,000, 35,000, 40,000, 45,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, lxl06, 2xl06, 3xl06,4xl06, 5xl06, 6xl06, 7xl06, 8xl06, 9xl06, lxl07, 2xl07, 3xl07, 4xl07, 5xl07, 6xl07, 7xl07, 8xl07,9xl07, lxl08, 2xl08, 3xl08, 4xl08, 5xl08, 6xl08, 7xl08, 8xl08, 9xl08, lxl09, 2xl09, 3xl09, 4xl09,5xl09, 6xl09, 7xl09, 8xl09, 9xl09, lxl010, 2xl010, 3xl010, 4xl010, 5xl010, 6xl010, 7xl010, 8xl010,9xl010, lxl011, 2xl011, 3xl011, 4xl011, 5xl011, 6xl011, 7xl011, 8xl011, 9xl011, lxl012, 2xl012,3xl012 , 4xl012, 5xl012, 6xl012, 7xl012, 8xl012, 9x1012 개 또는 그 이상의 서로 다른 서열을 생성하는데 사용될 수 있다. 예컨대, 복수 개의 분자 바코드 또는 용기 바코드는, 적어도 약 about 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 15,000, 20,000, 25,000, 30,000, 35,000, 40,000, 45,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, lxl06, 2xl06, 3xl06,4xl06, 5xl06, 6xl06, 7xl06, 8xl06, 9xl06, lxl07, 2xl07, 3xl07, 4xl07, 5xl07, 6xl07, 7xl07, 8xl07,9xl07, lxl08, 2xl08, 3xl08, 4xl08, 5xl08, 6xl08, 7xl08, 8xl08, 9xl08, lxl09, 2xl09, 3xl09, 4xl09,5xl09, 6xl09, 7xl09, 8xl09, 9xl09, lxl010, 2xl010, 3xl010, 4xl010, 5xl010, 6xl010, 7xl010, 8xl010,9xl010, lxl011, 2xl011, 3xl011, 4xl011, 5xl011, 6xl011, 7xl011, 8xl011, 9xl011, lxl012, 2xl012,3xl012 , 4xl012, 5xl012, 6xl012, 7xl012, 8xl012, 9x1012 개 또는 그 이상의 표적 폴리뉴클레오타이드로부터, 적어도 약 10, 15, 20, 25, 30, 35, 40,45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 15,000, 20,000, 25,000, 30,000, 35,000, 40,000, 45,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000,lxl06, 2xl06, 3xl06,4xl06, 5xl06, 6xl06, 7xl06, 8xl06, 9xl06, lxl07, 2xl07, 3xl07, 4xl07, 5xl07, 6xl07, 7xl07, 8xl07,9xl07, lxl08, 2xl08, 3xl08, 4xl08, 5xl08, 6xl08, 7xl08, 8xl08, 9xl08, lxl09, 2xl09, 3xl09, 4xl09,5xl09, 6xl09, 7xl09, 8xl09, 9xl09, lxl010, 2xl010, 3xl010, 4xl010, 5xl010, 6xl010, 7xl010, 8xl010,9xl010, lxl011, 2xl011, 3xl011, 4xl011, 5xl011, 6xl011, 7xl011, 8xl011, 9xl011, lxl012, 2xl012,3xl012 , 4xl012, 5xl012, 6xl012, 7xl012, 8xl012, 9x1012 개 또는 그 이상의 서로 다른 서열을 생성하는데 사용될 수 있다.
일부 구체예에서, 하나 이상의 분자 바코드는 서열을 그룹화 또는 비닝 (bin)하는데 사용된다. 일부 구체예에서, 하나 이상의 분자 바코드는 서열을 그룹화 또는 비닝하는데 사용되는데, 여기서 각 빈 (bin)의 서열은 동일한 분자 바코드를 함유한다. 일부 구체예에서, 하나 이상의 분자 바코드 또는 용기 바코드는 서열을 그룹화 또는 비닝하는데 사용되는데, 여기서 각 빈의 서열은 앰플리콘 세트를 포함한다. 일부 구체예에서, 하나 이상의 분자 바코드는 서열을 그룹화 또는 비닝하는데 사용되는데, 여기서 각 빈의 서열은 복수 개의 서열을 포함하고, 여기서 상기 복수 개의 서열이 생성되었던 폴리뉴클레오타이드는 증폭 반응에서 동일한 폴리뉴클레오타이드 분자로부터 유래하였던 것이다.
일부 구체예에서, 하나 이상의 용기 바코드는 서열을 그룹화 또는 비닝하는데 사용된다. 일부 구체예에서, 하나 이상의 용기 바코드는 서열을 그룹화 또는 비닝하는데 사용되고, 여기서 각 빈의 서열은 동일한 용기 바코드를 함유한다. 일부 구체예에서, 하나 이상의 용기 바코드는 서열을 그룹화 또는 비닝하는데 사용되고, 여기서 각 빈의 서열은 하나 이상의 앰플리콘 세트를 포함한다. 일부 구체예에서, 하나 이상의 용기 바코드는 서열을 그룹화 또는 비닝하는데 사용되고, 여기서 각 빈의 서열은 복수 개의 서열을 포함하고, 여기서 상기 복수 개의 서열이 생성되었던 폴리뉴클레오타이드는 단일 용기 또는 단일 세포로부터의 폴리뉴클레오타이드로부터 유래하였던 것이다.
일부 구체예에서, 하나 이상의 분자 바코드 및 용기 바코드는 서열을 그룹화 또는 비닝하는데 사용된다. 일부 구체예에서, 하나 이상의 분자 바코드 및 용기 바코드는 서열을 그룹화하거나 비닝하는데 사용되고, 여기서 각 빈의 서열은 동일한 분자 바코드 및 동일한 용기 바코드를 함유한다. 일부 구체예에서, 하나 이상의 분자 바코드 및 용기 바코드는 서열을 그룹화 또는 비닝하는데 사용되고, 여기서 각 빈의 서열은 하나 이상의 앰플리콘 세트를 포함한다. 일부 구체예에서, 하나 이상의 분자 바코드 및 용기 바코드는 서열을 그룹화 또는 비닝하는데 사용되고, 여기서 각 빈의 서열은 복수 개의 서열을 포함하고, 여기서 상기 복수 개의 서열이 생성되었던 폴리뉴클레오타이드는 증폭 반응에서 동일한 폴리뉴클레오타이드로부터 그리고 동일한 단일 세포 또는 용기로부터 유래하였던 것이다. 일부 구체예에서, 하나 이상의 분자 바코드 및 용기 바코드는 서열을 정렬하는데 사용되지 않는다.
일부 구체예에서, 하나 이상의 분자 바코드는 서열을 정렬하는데 사용되지 않는다. 일부 구체예에서, 하나 이상의 분자 바코드는 서열을 성렬하는데 사용된다. 일부 구체예에서, 하나 이상의 분자 바코드는 서열을 그룹화하거나 비닝하는데 사용되고, 표적 특이적 영역은 서열을 정렬하는데 사용된다. 일부 구체예에서, 하나 이상의 용기 바코드는 서열을 정렬하는데 사용되지 않는다. 일부 구체예에서, 하나 이상의 용기 바코드는 서열을 정렬하는데 사용된다. 일부 구체예에서, 하나 이상의 용기 바코드는 서열을 그룹화하거나 비닝하는데 사용되고, 표적 특이적 영역은 서열을 정렬하는데 사용된다. 일부 구체예에서, 하나 이상의 분자 바코드 및 용기 바코드는 서열을 정렬하는데 사용된다. 일부 구체예에서, 하나 이상의 분자 바코드 및 용기 바코드는 서열을 그룹화하거나 비닝하는데 사용되고, 표적 특이적 영역은 서열을 정렬하는데 사용된다.
일부 구체예에서, 정렬된 서열은 동일한 분자 바코드를 함유한다. 일부 구체예에서, 정렬된 서열은 동일한 용기 바코드를 항뮤한다. 일부 구체예에서, 정렬된 서열은 동일한 분자 바코드 및 용기 바코드를 함유한다. 일부 구체예에서, 하나 이상의 분자 바코드 또는 용기 바코드는 서열을 정렬하는데 사용되고, 여기서 정렬된 서열은 하나의 앰플리콘 세트로부터의 2 개 이상의 서열을 포함한다. 일부 구체예에서, 하나 이상의 분자 바코드 또는 용기 바코드는 서열을 정렬하는데 사용되고, 여기서 정렬된 서열은 복수 개의 서열을 포함하고, 여기서 상기 복수 개의 서열이 생성되었던 폴리뉴클레오타이드는 증폭 반응에서 동일한 폴리뉴클레오타이드 분자로부터 유래하였던 것이다. 일부 구체예에서, 하나 이상의 분자 바코드 또는 용기 바코드는 서열을 정렬하는데 사용되고, 여기서 정렬된 서열은 복수 개의 서열을 포함하고, 여기서 상기 복수 개의 서열이 생성되었던 폴리뉴클레오타이드는 단일 세포 또는 단일 용기로부터 유래하였던 것이다.
C. 어댑터 연결
어댑터 연결 전에, 이중 바코딩된 폴리뉴클레오타이드 또는 앰플리콘은 크기에 대해 정제 및/또는 선별될 수 있다. 이중-바코드딩된 폴리뉴클레오타이드의 크기는 선택된 시퀀싱 방법을 최적화하기 위해 선택될 수 있다. 바람직한 폴리뉴클레오타이드 크기는 시퀀싱 기기의 한계 및 특정 시퀀싱 적용에 의해 결정된다. 일부 예에서, 원하는 폴리뉴클레오타이드 크기는 0 염기쌍 (bp) 내지 100,000 bp (100 킬로베이스 (kb)), 50 bp 내지 50 kb, 100 bp 내지 25 kb이다. 일부 구체예에서, 짧은-판독 (short-read) 시퀀서가 본 명세서에서 생성되는 폴리뉴클레오타이드를 시퀀싱하는데 사용된다. 일반적으로, 짧은-판독 시퀀서의 최적 폴리뉴클레오타이드 크기는 약 20 개의 염기쌍 (bp) 내지 2000 bp, 50 bp 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp 길이 범위이다.
일부 구체예에서, 긴-판독 (long-read) 시퀀서는 본 명세서에서 생성되는 폴리뉴클레오타이드를 시퀀싱하는데 사용된다. 일반적으로, 짧은-판독 시퀀서용 최적 폴리뉴클레오타이드 크기는 약 1 킬로베이스 (kb) 내지 100 kb, 예컨대 1 kb 내지 50 kb, 5 kb 내지 25 kb, 5 kb 내지 20 kb, 또는 대략 1 kb, 5 kb, 10 kb, 15 kb 또는 20 kb 길이 범위이다.
원하는 크기의 폴리뉴클레오타이드의 집합체를 생성하기 위해, 폴리뉴클레오타이드 집합체는, 역전사 또는 프라이머 연장 반응의 조건을 수정함으로써, 예를 들어 반응의 연장 단계의 시간을 수정함으로써 크기 조정될 수 있다. 일부 구체예에서, 폴리뉴클레오타이드 집합체는 물리적 방법 (즉, 어쿠스틱 쉬어링 및 초음파 처리) 또는 효소적 방법 (즉, 비-특이적 엔도뉴클레아제 칵테일 및 트랜스포자아제 태깅 (tagmentation) 반응)에 의해 원하는 길이로 단편화되거나 크기가 조정될 수 있다. 원하는 크기의 폴리뉴클레오타이드는 아가로오스 겔 전기영동, 예컨대 변성 겔 전기영동, 크기 배제 방법, 자동화된 방법 또는 상용 키트에 의하여 단리될 수 있다 (Quail et al, Electrophoresis (2012) 33 (23): 3521-3528; Duhaime et al., Environ Microbiol (2012) 14 (9): 2526-2537).
일부 구체예에서, 이중 가닥 이중-바코딩된 폴리뉴클레오타이드는 크기 선별 전에 정제되는데, 예를 들어 친화도 정제에 의한다. 일부 구체예에서, 이중 가닥 이중-바코딩된 폴리뉴클레오타이드는 크기 선별 전에 변성된다. 일부 구체예에서, 이중 가닥 이중-바코딩된 폴리뉴클레오타이드는 상보적 DNA 가닥 사이의 수소 결합을 파괴함으로써 변성된다. 일부 구체예에서, 이중 가닥 DNA의 변성은 산 또는 염기, 농축된 무기 세일, 유기 용매, (예를 들어, 알코올 또는 클로로포름), 방사선 또는 열의 적용에 의해 결과된다. 일부 구체예에서, 이중 가닥 DNA의 변성은 포름아마이드, 구아니딘, 소듐 살리실레이트, 디메틸 술폭사이드 (DMS), 프로필렌 글리콜, 우레아, 또는 NaOH와 같은 화학 제제에의 노출로써 결과된다. 일부 구체예에서, 이중 가닥 DNA 분자는 NaOH, 예컨대 0.1 M NaOH로 처리되어 단일 가닥 분자를 생성한다.
크기 선별 및/또는 정제 후, 제2 어댑터는 어댑터-태깅된, 이중 바코딩된 폴리뉴클레오타이드에 부가될 수 있는데, 이는 범용 프라이밍 서열을 갖는 제1 어댑터, 용기 바코드 및 분자 바코드를 함유하는 방법에 의해 생성된 폴리뉴클레오타이드이다. 어댑터는 범용 프라이밍 서열을 함유하는데, 이는 어댑터-태깅된 이중 바코딩된 폴리뉴클레오타이드의 증폭 또는 시퀀싱에 사용될 수 있다. 어댑터는 임의의 공지된 범용 프라이밍 서열 또는 이의 단편을 함유할 수 있다. 예시적인 범용 프라이밍 서열은 P7, C7, P5 또는 C5 프라이밍 서열을 포함한다.
제2 어댑터의 부가는 임의의 공지된 방법을 사용하여 결과될 수 있다. 어댑터는 단일-가닥 폴리뉴클레오타이드 또는 이중-가닥 폴리뉴클레오타이드에 부가될 수 있다. 일부 예에서, 어댑터는 단일-가닥 폴리뉴클레오타이드에 부가된다. 다른 예에서, 어댑터, 예컨대 이중-가닥 어댑터가 이중-가닥 폴리뉴클레오타이드에 부가된다. 일부 구체예에서, 리가아제는 단일-가닥 어댑터를 연결하는데 사용된다. 예를 들어, Thermostable App 리가아제 (NEB) 또는 CircLigase II (Epicentre)가 제2 어댑터를 단일-가닥 어댑터에, 단일-가닥, 어댑터-태깅된, 이중-바코딩된 폴리뉴클레오타이드에 연결하는데 사용할 수 있다.
일부 구체예에서, 축퇴 스플린트 어댑터 (splint adaptor)를 어닐링함으로써 제2 어댑터가 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드에 부가될 수 있다. 예를 들어, 제2 어댑터는, 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드 말단에 스플린트 어댑터 이중체를 부가함으로써 부가될 수 있다. 이러한 스플린트 어댑터 이중체는 분자의 한쪽 말단에 축퇴 오버행을 갖는 페어링된 이중 가닥 올리고뉴클레오타이드를 함유한다. 축퇴 오버행은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개 염기일 수 있다. 분자의 오버행 부분의 축퇴 뉴클레오타이드는 제1 어댑터 서열의 말단에 대향하는, 단일-가닥, 어댑터-태갱된 이중-바코딩된 폴리뉴클레오타이드의 말단에 어닐링된다. 상기 방법의 일부 구체예에서, 3' 오버행을 갖는 스플린트 어댑터 이중체는, 제1 어댑터에 대향하는, 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드의 3' 말단에 어닐링된다. 상기 방법의 일부 구체예에서, 5' 오버행을 갖는 스플린트 어댑터 이중체는, 제1 어댑터에 대향하는, 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드의 5' 말단에 어닐링된다. 리가아제, 예컨대 블런트/TA 리가아제는 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드로 스플린트 어댑터 이중체를 어닐링하는 것을 용이하게 할 수 있다.
본 방법의 일부 구체예에서, 비-주형 뉴클레오타이드의 효소적 첨가가, 어댑터가 어닐링되는 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드의 말단에 부가될 수 있다. 일부 구체예에서, 제2 어댑터는 상보적 염기쌍을 사용하여 비-주형 뉴클레오타이드에 직접 어닐링된다. 일부 구체예에서, 스플린트 어댑터 이중체는 비-주형 뉴클레오타이드에 어닐링되어 분자의 말단에 어댑터의 부가를 결과할 수 있다. 일부 구체예에서, 어댑터는 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드의 3' 말단에 부가된다. 일부 구체예에서, 어댑터는 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드의 5' 말단에 부가된다. 리가아제, 예컨대 블런트/TA 리가아제는 단일-가닥, 어댑터-태깅된 이중-바코딩된 폴리뉴클레오타이드로 제2 어댑터 또는 스플린트 어댑터 이중체를 어닐링하는 것을 용이하게 할 수 있다.
제2 어댑터는 범용 프라이밍 서열 또는 범용 프라이밍 부위 또는 상보적 서열에 어닐링하기에 충분한 범용 프라이밍 서열 또는 범용 프라이밍 부위의 인접 부분을 포함한다. 범용 프라이밍 서열 또는 범용 프라이밍 부위는 범용 프라이머에 상보적인 올리고뉴클레오타이드 서열 또는 이의 인접 부분을 함유한다. 예시적인 범용 프라이머는 하기 섹션 D에 열거되어 있다.
D. 증폭 및 시퀀싱
상기 방법에서 생성되는 바, 하나 이상의 표적 폴리뉴클레오타이드 서열(들) 및/또는 세포의 전사체 전부 또는 일부에 상응하는 이중 바코딩된 폴리뉴클레오타이드를, 상기 이중 바코딩된 폴리뉴클레오타이드의 반대 말단 또는 그 근처의 제1 및 제2 어댑터와 함께 함유하는 샘플은 증폭되어 상기 이중 바코딩된 폴리뉴클레오타이드 라이브러리의 다수 카피를 생성할 수 있다. 증폭은 시퀀싱 전에 수행될 수 있다. 일부 구체예에서, 시퀀싱 어댑터를 갖는 프라이머는 라이브러리에서 하나 이상의 서열을 증폭하는데 사용될 수 있다. 일부 구체예에서, 선택된 전 사물은 증폭되어 시퀀싱을 위해 준비된다.
일부 구체예에서, 시퀀싱 어댑터를 갖는 어댑터 프라이머는 라이브러리의 모든 전사물을 증폭시키고, 시퀀싱을 위해 그를 제조하는데 사용된다. 일부 구체예에서, 시퀀싱 어댑터를 갖는 어댑터 프라이머 및 시퀀싱 어댑터를 갖는 표적-특이적 프라이머는 표적 유전자를 증폭시키고, 시퀀싱을 위하여 표적 유전자를 준비하는데 사용된다. 일부 구체예에서, 세포-특이적 프라이머, 예컨대 시퀀싱 어댑터를 갖는 용기 바코드에 대한 프라이머, 및 시퀀싱 어댑터를 갖는 상기 용기 바코드로부터의 전사물의 반대 말단의 어댑터에 대한 프라이머는 선택된 세포의 전사체를 증폭시키고 시퀀싱을 위해 그를 준비하는데 사용된다. 도 2는 본 명세서에 기재되는 바와 같은 선택된 프라이머의 사용을 통해 생성된 라이브러리에서 폴리뉴클레오타이드의 예시적인 선택된 증폭을 도시한다.
1. 증폭
표적 폴리뉴클레오타이드를 함유하는 샘플은, 증폭될 수 있는, 완전한 mRNA 전사물 또는 그 단편(들)에 상응하는 DNA를 포함할 수 있다. 일부 경우에, 상기 상응하는 mRNA 전사물 또는 그 단편(들)의 평균 길이는 약 100, 200, 300, 400, 500, 또는 800 개 염기쌍 미만, 또는 약 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 또는 200 개 뉴클레오타이드 미만, 또는 약 1, 2, 5, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 킬로베이스 미만일 수 있다. 일부 경우에, 비교적 짧은 주형으로부터의 표적 서열, 예컨대 약 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95 또는 100 개 염기인 주형을 함유하는 샘플이 증폭된다.
증폭 반응은 하나 이상의 첨가제를 포함할 수있다. 일부 경우에, 하나 이상의 첨가제는 디메틸 술폭사이드 (DMSO), 글리세롤, 베타인 (모노)하이드레이트 N,N,N-트리메틸글리신 = [카르복시메틸] 트리메틸 암모늄), 트레할로스, 7-데 아자-2'-데옥시구아노신 트리포스페이트 (dC7GTP 또는 7-데아자-2'-dGTP), BSA (소 혈청 알부민), 포름아마이드 (메탄아마이드), 테트라메틸암모늄 클로라이드 (TMAC), 기타 테트라알킬암모늄 유도체 (예를 들어, 테트라에티암모늄 클로라이드 (TEA-C1) 및 테트라프로필암모늄 클로라이드 (TPrA-Cl)) 비이온성 변성제 (예컨대, Triton X-100, TWEEN® 20, Nonidet P-40 (NP-40)) 또는 PREXCEL-Q이다. 일부 경우 증폭 반응은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 종의 여러 가지 첨가제를 포함한다. 다른 경우에, 증폭 반응은 적어도 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 종의 여러 가지 첨가제를 포함한다.
열순환 반응은 반응 부피 (예를 들어, 액적)에 함유된 샘플에 대해 수행될 수 있다. 액적은 교반, 초음파 또는 T-채널 접합을 통한 미세 유동 또는 기타 당업계에서 친숙한 다른 수단을 통해 생성된 다분산 또는 바람직하게는 단분산물일 수 있다. 밀도는 20,000 적/40 μL (1 nL 액적), 200,000 적/40 μL (100 pL 액적)을 초과할 수 있다. 열순환 동안 액적은 온전히 유지될 수 있다. 열순환 동안 액적은 약 10,000 적/μL, 100,000 적/μL, 200,000 적/μL, 300,000 적/μL, 400,000 적/μL, 500,000 적/μL, 600,000 적/μL, 700,000 적/μL, 800,000 적/μL, 900,000 적/μL 또는 1,000,000 적/μL 이상의 밀도로 온전히 유지될 수 있다. 다른 경우에, 열순환 동안 2 개 이상의 액적이 합쳐지지 않는다. 다른 경우에, 열순환 동안 100 개 이상 또는 1,000 개 이상의 액적은 합쳐지지 않는다.
프라이머 연장을 촉매하는 임의의 DNA 중합 효소가 사용될 수 있는데, 예컨대 대장균 DNA 중합 효소, 대장균 DNA 중합 효소 1의 Klenow 단편, T7 DNA 중합 효소, T4 DNA 중합 효소, Taq 중합 효소, Pfu DNA 중합 효소, Vent DNA 중합 효소, 박테리오파지 29, REDTaq™, Genome DNA 중합 효소 또는 시쿼나아제를 들 수 있으나 이에 국한되는 것은 아니다. 일부 경우 열 안정한 DNA 중합 효소가 사용된다. 중합 효소를 첨가하기 전에 2 분 동안 반응을 95℃로 가열하는 핫 스타트 PCR이 또한 수행될 수 있거나 또는 사이클 1의 제1 가열 단계까지 중합 효소는 불활성으로 유지될 수 있다. 핫 스타트 PCR을 사용하면 비특이적 증폭을 최소화할 수 있다.
DNA 증폭을 위하여 임의 수의 PCR 사이클이 이용될 수 있는데, 예컨대 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23,24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44 또는 45 사이클, 약 그 초과, 또는 약 그 미만의 사이클이다. 증폭 사이클의 수는 약 1-45, 10-45, 20-45, 30-45, 35-45, 10-40, 10-30, 10-25,10-20, 10-15, 20-35, 25-35, 30-35, 또는 35-40일 수 있다.
표적 핵산의 증폭은 임의의 공지된 수단에 의해 수행될 수 있다. 표적 핵산은 중합 효소 연쇄 반응 (PCR) 또는 등온 DNA 증폭에 의해 증폭될 수 있다. 사용될 수 있는 PCR 기술의 예는, 정량적 PCR, 정량적 형광 PCR (QF-PCR), 다중 형광 PCR (MF-PCR), 실시간 PCR (역전사-PCR), 단일 세포 PCR, 제한 단편 길이 다형성 PCR (PCR-RFLP), PCR-RFLP/역전사 PCR-RFLP, 핫 스타트 PCR, 네스티드 PCR (nested PCR), 인 시투 폴로니 PCR, 인 시투 롤링 서클 증폭 (RCA), 디지털 PCR (dPCR), 액적 디지털 PCR (ddPCR), 브릿지 PCR, 피코리터 PCR 및 에멀젼 PCR을 포함하나 이에 국한되는 것은 아니다. 다른 적합한 증폭 방법은 리가아제 연쇄 반응 (LCR), 전사 증폭, 분자 전환 프로브 (MIP) PCR, 자체-유지 서열 복제, 표적 폴리뉴클레오타이드 서열의 선택적 증폭, 컨센서스 서열 프라이밍 중합 효소 연쇄 반응 (CP-PCR), 임의 프라이밍 중합 효소 연쇄 반응 (AP-PCR), 축퇴 폴리뉴클레오타이드-프라이밍 PCR (DOP-PCR) 및 핵산 기반 서열 증폭 (NABSA)을 포함한다. 본 명세서에서 사용될 수 있는 다른 증폭 방법은 미국 특허 5,242,794; 5,494,810; 4,988,617; 및 6,582,938에 기술된 것들을 포함할 뿐만 아니라, Q 베타 레플리카아제 매개 RNA 증폭을 포함한다. 증폭은 등온 증폭, 예를 들어 등온 선형 증폭일 수 있다.
일부 구체예에서, 증폭은 고체 지지체 상에서 일어나지 않는다. 일부 구체예에서, 증폭은 액적 내 고체 지지체 상에서 일어나지 않는다. 일부 구체예에서, 증폭은, 그 증폭이 액적 내인 경우가 아닐 때 고체 지지체 상에서 일어난다.
증폭 반응은 하나 이상의 첨가제를 포함할 수있다. 일부 구체예에서, 하나 이상의 첨가제는 디메틸 술폭사이드 (DMSO), 글리세롤, 베타인 (모노)하이드레이트 N,N,N-트리메틸글리신 = [카르복시메틸] 트리메틸 암모늄), 트레할로스, 7-데 아자-2'-데옥시구아노신 트리포스페이트 (dC7GTP 또는 7-데아자-2'-dGTP), BSA (소 혈청 알부민), 포름아마이드 (메탄아마이드), 테트라메틸암모늄 클로라이드 (TMAC), 기타 테트라알킬암모늄 유도체 (예를 들어, 테트라에티암모늄 클로라이드 (TEA-C1) 및 테트라프로필암모늄 클로라이드 (TPrA-Cl)) 비이온성 변성제 (예컨대, Triton X-100, TWEEN® 20, Nonidet P-40 (NP-40)) 또는 PREXCEL-Q이다. 일부 구체예에서, 증폭 반응은 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 종의 여러 가지 첨가제를 포함할 수 있다. 다른 경우에, 증폭 반응은 적어도 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 종의 여러 가지 첨가제를 포함할 수 있다.
일반적으로, 하나 이상의 프라이머 쌍이 증폭 반응에 사용될 수 있으며; 프라이머 쌍 중 하나의 프라이머는 포워드 프라이머일 수 있고 프라이머 쌍 중 하나의 프라이머는 리버스 프라이머일 수 있다.
일부 경우에, 제1 프라이머 쌍이 증폭 반응에 사용될 수 있으며; 제1 쌍 중 하나의 프라이머는 제1 표적 폴리뉴클레오타이드 분자 서열에 상보적인 포워드 프라이머일 수 있고, 제1 쌍 중 하나의 프라이머는 제1 표적 폴리뉴클레오타이드 분자의 제2 서열에 상보적인 리버스 프라이머일 수 있고, 제1 표적 유전자좌는 제1 서열과 제2 서열 사이에 존재할 수 있다. 일부 구체예에서, 제1 표적 유전자좌는 VH 또는 Vα 또는 Vγ 서열을 포함한다.
일부 경우에, 제2 프라이머 쌍이 증폭 반응에 사용될 수 있으며; 제2 쌍 중 하나의 프라이머는 제2 표적 폴리뉴클레오타이드 분자의 제1 서열에 상보적인 포워드 프라이머일 수 있고, 제2 쌍 중 하나의 프라이머는 제2 표적 폴리뉴클레오타이드 분자의 제2 서열에 상보적인 리버스 프라이머일 수 있고, 제2 표적 유전자좌는 제1 서열 및 제2 서열 사이에 존재할 수 있다. 일부 구체예에서, 제2 표적 유전자좌는 VL 또는Vβ 또는 Vδ 서열을 포함한다.
일부 경우에, 제3 프라이머 쌍이 증폭 반응에 사용될 수 있으며; 제 3 쌍 중 하나의 프라이머는 제3 표적 폴리뉴클레오타이드 분자의 제1 서열에 상보적인 포워드 프라이머일 수 있고, 제3 쌍 중 하나의 프라이머는 제3 표적 폴리뉴클레오타이드 분자의 제2 서열에 상보적인 리버스 프라이머일 수 있고, 제3 표적 유전자좌는 제1 서열과 제2 서열 사이에 존재할 수 있다. 일부 구체예에서, 제3 표적 유전자좌는 바코드, 예컨대 분자 바코드 또는 용기 바코드를 포함한다.
일부 경우에, 증폭 반응에 다수 쌍의 프라이머가 사용될 수 있다. 일부 예에서, 프라이머 쌍 중 하나의 프라이머는 제1 어댑터 서열에 상보적인 포워드 프라이머일 수 있고, 프라이머 쌍 중 하나의 프라이머는 제 2 어댑터 서열에 대한 리버스 프라이머일 수 있다. 일부 예에서, 프라이머 쌍 중 하나의 프라이머는 제2 어댑터 서열에 상보적인 포워드 프라이머일 수 있고, 프라이머 쌍 중 하나의 프라이머는 제1 어댑터 서열에 대한 리버스 프라이머일 수 있다.
포워드 프라이머 및 리버스 프라이머의 길이는 표적 폴리뉴클레오타이드 및 표적 유전자좌의 서열에 의존적일 수 있다. 예컨대, 포워드 프라이머 및 리버스 프라이머의 길이 및/또는 T는 최적화될 수 있다. 일부 경우, 프라이머는 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 또는 60 개 뉴클레오타이드 길이, 약 그 초과, 또는 약 그 미만일 수 있다. 일부 경우, 프라이머는 약 15 내지 약 20, 약 15 내지 약 25, 약 15 내지 약 30, 약 15 내지 약 40, 약 15 내지 약 45, 약 15 내지 약 50, 약 15 내지 약 55, 약 15 내지 약 60, 약 20 내지 약 25, 약 20 내지 약 30, 약 20 내지 약 35, 약 20 내지 약 40, 약 20 내지 약 45, 약 20 내지 약 50, 약 20 내지 약 55, 또는 약 20 내지 약 60 개 뉴클레오타이드 길이이다.
프라이머는 주형 폴리뉴클레오타이드에 결합하기 전에 단일-가닥 DNA일 수 있다. 일부 경우에, 프라이머는 처음에 이중-가닥 서열을 포함한다. 프라이머의 적절한 길이는 프라이머의 의도된 용도에 따르지만 약 6 내지 약 50 개 뉴클레오타이드, 또는 약 15 내지 약 3 개 뉴클레오타이드 범위일 수 있다. 짧은 프라이머 분자는 일반적으로 주형과 충분히 안정한 하이브리드 복합체를 형성하는데 더 찬 온도가 필요할 수 있다. 일부 구체예에서, 프라이머는 주형 핵산의 정확한 서열을 반영할 필요는 없지만 주형과 혼성화하기 위해 충분히 상보적일 수 있다. 일부 경우, 주형 폴리뉴클레오타이드에 결합하기 전에 프라이머는 부분적으로 이중-가닥일 수 있다. 이중-가닥 서열을 갖는 프라이머는 약 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20 개 염기, 약 그 초과 또는 약 그 미만의 염기로 이루어지는 헤어핀 루프를 가질 수 있다. 프라이머의 이중 가닥 부분은 약3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 개 염기쌍, 약 그 초과, 약 그 미만, 또는 약 그 이상일 수 있다. 주어진 표적 서열의 증폭에 적합한 프라이머의 설계는 당업계에 잘 알려져 있다.
프라이머는 프라이머의 검출 또는 고정화를 허용하되 프라이머의 기본 특성 (예를 들어, DNA 합성의 개시점으로서 작용함)을 변경시키지 않는 추가 특징을 포함할 수 있다. 예를 들어, 프라이머는 5' 말단에 표적 핵산에 혼성화되지 않지만 증폭된 생성물의 클로닝 또는 추가 증폭, 또는 시퀀싱을 용이하게 하는 추가적인 핵산 서열을 함유할 수 있다. 예를 들어, 추가 서열은 프라이머 결합 부위, 예컨대 어댑터일 수 있는 범용 프라이머 결합 부위를 포함할 수 있다. 혼성화하기에 주형에 충분히 상보적인 프라이머의 영역은 본 명세서에서 혼성화 영역으로 지칭될 수 있다.
다른 경우에, 본 명세서에 기재된 방법 및 조성물서 이용되는 프라이머는 하나 이상의 범용 뉴클레오사이드를 포함할 수있다. 범용 뉴클레오사이드의 비-제한적인 예는 미국 특허 출원 공개 2009/0325169 및 2010/0167353에 기재되는 바와 같은 5-니트로인돌 및 이노신이다.
프라이머는 이차 구조 및 자가 혼성화를 피하기 위해 공지된 파라미터에 따라 설계될 수 있다. 여러 프라이머 쌍은 대략 동일한 온도, 예를 들어 다른 프라이머 쌍의 1℃, 2℃, 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃ 또는 10℃ 내에서 어닐링 및 용융될 수 있다. 일부 경우 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 100, 200, 500, 1000, 5000, 10,000 개 보다 많은 또는 더 많은 프라이머가 처음에 사용된다. 이러한 프라이머는 본 명세서에 기재된 폴리뉴클레오타이드를 표적화하기 위해 혼성화될 수 있다.
프라이머는 적절한 서열의 클로닝 및 당업계에 널리 공지된 방법을 사용한 직접적 화학 합성을 포함하나 이에 제한되지 않는 다양한 방법에 의해 제조될 수 있다 (Narang etal, Methods Enzymol. 68:90 (1979); Brown et al, Methods Enzymol. 68:109 (1979)). 프라이머는 또한 시판 공급원으로부터 얻을 수 있다. 프라이머는 동일한 용융 온도를 가질 수 있다. 프라이머는 비-동일 용융 온도를 가질 수 있다. 프라이머의 길이는 5' 말단 또는 3' 말단에서 연장되거나 단축되어 원하는 용융 온도를 갖는 프라이머를 생성할 수 있다. 프라이머 쌍 내 프라이머 중 하나는 다른 프라이머보다 길 수 있다. 프라이머 쌍 내에서 프라이머들의 3' 어닐링 길이는 다를 수 있다. 또한, 각 프라이머 쌍의 어닐링 위치는 프라이머 쌍의 서열 및 길이가 원하는 용융 온도를 형성하도록 설계될 수 있다. 25 염기쌍보다 작은 프라이머의 용융 온도를 결정하기 위한 식은 Wallace Rule이다 (T =2(A+T)+4(G+C)). 컴퓨터 프로그램을 사용하여 프라이머를 설계할 수도 있다. 각 프라이머의 TM (용융 또는 어닐링 온도)은 소프트웨어 프로그램을 사용하여 계산할 수 있다. 사이클 1, 2, 3, 4, 5, 사이클 6-10, 사이클 10-15, 사이클 15-20, 사이클 20-25, 사이클 25-30, 사이클 30-35 또는 사이클 35-40을 포함하지만 이에 국한되지 않는 임의의 증폭 사이클 후에, 프라이머의 어닐링 온도는 재계산 및 증가될 수 있다. 최초 증폭 사이클 후, 프라이머의 5' 절반은 각각의 관심 부위로부터의 생성물 내로 혼입될 수 있으며; 따라서 TM은 각 프라이머의 5' 절반 및 3' 절반의 서열 양자 모두에 기초하여 재계산될 수 있다.
본 명세서에 개시된 방법의 하나 이상의 반응을 수행하는 것은 하나 이상의 프라이머의 사용을 포함할 수 있다. 본 명세서에서 사용되는 바, 프라이머는 주형 폴리뉴클레오타이드에 혼성화하기에 충분히 상보적인 이중-가닥, 단일-가닥 또는 부분적으로 단일-가닥인 폴리뉴클레오타이드를 포함한다. 프라이머는 주형 폴리뉴클레오타이드에 결합하기 전에 단일-가닥 DNA일 수 있다. 일부 구체예에서, 프라이머는 처음에 이중-가닥 서열을 포함한다. 프라이머 부위는 프라이머가 혼성화하는 주형 영역을 포함한다. 일부 구체예에서, 프라이머는 주형-지시되는 핵산 합성을 위한 개시점으로서 작용할 수 있다. 예를 들어, 프라이머는, 4 개의 상이한 뉴클레오타이드 및 중합 제제 또는 효소, 예컨대 DNA 또는 RNA 중합 효소 또는 역전사 효소의 존재시 주형-지시되는 핵산 합성을 개시할 수 있다.
프라이머 쌍은 2 개의 프라이머를 포함한다: 주형 서열의 5' 말단과 혼성화하는 5' 상류 영역을 갖는 제1 프라이머, 및 주형 서열의 3' 말단의 상보체와 혼성화하는 3' 하류 영역을 갖는 제2 프라이머. 프라이머 세트는 2 개 이상의 프라이머를 포함한다: 주형 서열 또는 복수 개의 주형 서열의 5' 말단과 혼성화하는 5' 상류 영역을 갖는 제1 프라이머 또는 복수 개의 제1 프라이머, 및 주형 서열 또는 복수 개의 주형 서열의 3'의 상보체와 혼성화하는 3' 하류 영역을 갖는 제2 프라이머 또는 복수 개의 제2 프라이머.
일부 구체예에서, 프라이머는 표적 특이적 서열을 포함한다. 일부 구체예에서, 프라이머는 샘플 바코드 서열을 포함한다. 일부 구체예에서, 프라이머는 범용 프라이밍 서열을 포함한다. 일부 구체예에서, 프라이머는 PCR 프라이밍 서열을 포함한다. 일부 구체예에서, 프라이머는 폴리뉴클레오타이드의 증폭을 개시하기 위해 사용되는 PCR 프라이밍 서열을 포함한다. (Dieffenbach, PCR Primer: ALaboratory Manual, 2nd Edition (Cold Spring Harbor Press, New York (2003)). 범용 프라이머 결합 부위 또는 서열은 범용 프라이머를 폴리뉴클레오타이드 및/또는 앰플리콘에 부착되도록 한다. 범용 프라이머는 당업계에 잘 알려져 있고, -47F(M13F), alfaMF, AOX3', AOX5', BGHr, CMV-30, CMV-50, CVMf, LACrmt, 람다 gt l0F, 람다 gt 10R, 람다 gt 11F, 람다 gt 11R, M13 rev, M13Forward(-20), M13Reverse, 메일, pQEproseq, pQE, pA-120, pet4, pGAP Forward, pGLRVpr3, pGLpr2R, pKLAC14, pQEFS, pQERS, pucUl, pucU2, reversA, seqIREStam, seqIRESzpet, seqori, seqPCR, seqpIRES-, seqpIRES+, seqpSecTag, seqpSecTag+, seqretro+PSI, SP6, T3-prom, T7-prom, 및 T7-termInv를 포함하지만 이에 국한되는 것은 아니다.
본 명세서에서 사용되는 바, 부착은 공유적 상호 작용 및 비공유적 상호 작용 양자 모두 또는 둘 중 하나를 지칭할 수 있다. 범용 프라이머의 범용 프라이머 결합 부위로의 부착은 폴리뉴클레오타이드 및/또는 앰플리콘의 증폭, 검출, 및/또는 시퀀싱에 대하여 사용될 수 있다. 범용 프라이머 결합 부위는 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000 개 뉴클레오타이드 또는 염기쌍을 포함할 수 있다. 다른 예에서, 범용 프라이머 결합 부위는 적어도 약 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500, 또는 10000 개 뉴클레오타이드 또는 염기쌍을 포함한다. 일부 구체예에서, 범용 프라이머 결합 부위는 1-10,10-20, 10-30 또는 10-100 개 뉴클레오타이드 또는 염기쌍을 포함한다. 일부 구체예에서, 범용 프라이머 결합 부위는 약 1-90, 1-80, 1-70, 1-60, 1-50, 1-40, 1-30, 1-20, 1-10, 2-90, 2-80, 2- 70, 2-60, 2-50, 2-40, 2-30, 2-20, 2-10, 1-900, 1-800, 1-700, 1-600, 1-500, 1-400, 1-300, 1-200, 1-100, 2-900, 2-800, 2-700, 2-600, 2-500, 2-400, 2-300, 2-200, 2-100, 5-90, 5-80, 5-70, 5-60, 5-50, 5- 40, 5-30, 5-20, 5-10, 10-90, 10-80, 10-70, 10-60, 10-50, 10-40, 10-30, 10-20, 10-10, 5-900, 5-800, 5- 700, 5-600, 5-500, 5-400, 5-300, 5-200, 5-100, 10-900, 10-800, 10-700, 10-600, 10-500, 10-400, 10- 300, 10-200, 10-100, 25-900, 25-800, 25-700, 25-600, 25-500, 25-400, 25-300, 25-200, 25-100, 100- 1000, 100-900, 100-800, 100-700, 100-600, 100-500, 100-400, 100-300, 100-200, 200-1000, 200- 900, 200-800, 200-700, 200-600, 200-500, 200-400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400-700, 400-600, 400-500, 500-1000,500-900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600-700, 700-1000, 700-900,700-800, 800-1000, 800-900, 또는 900-1000 개 뉴클레오타이드 또는 염기쌍을 포함한다.
프라이머는 프라이머 연장 생성물의 합성에 있어서 그 용도와 적합한 길이를 가질 수 있다. 프라이머는 8 내지 200 개 뉴클레오타이드 길이인 폴리뉴클레오타이드일 수 있다. 프라이머의 길이는 주형 폴리뉴클레오타이드 및 주형 유전자좌의 서열에 의존적일 수 있다. 예컨대, 프라이머 또는 프라이머 세트의 길이 및/또는 용융 온도 (TM)은 최적화될 수 있다. 일부 경우, 프라이머는 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 또는 60 개 뉴클레오타이드 길이, 약 그 초과, 또는 약 그 미만일 수 있다. 일부 구체예에서, 프라이머는 약 8-100 개 뉴클레오타이드 길이인데, 예컨대 10-75, 15-60, 15-40, 18-30, 20-40, 21-50, 22-45,25-40, 7-9, 12-15, 15-20, 15-25, 15-30, 15-45, 15-50, 15-55, 15-60, 20-25, 20-30, 20-35, 20-45, 20-50,20-55, 또는 20-60 개 뉴클레오타이드 길이 및 그들 사이 임의의 길이이다. 일부 구체예에서, 프라이머는 최대 약 10, 12, 15, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60,65, 70, 75, 80, 85, 90, 95 또는 100 개 뉴클레오타이드 길이이다.
일반적으로, 하나 이상의 프라이머 쌍이 지수적 증폭 반응에 사용될 수 있으며; 프라이머 쌍 중 하나의 프라이머는 포워드 프라이머일 수 있고, 프라이머 쌍 중 하나의 프라이머는 리버스 프라이머일 수 있다. 일부 구체예에서, 제1 프라이머 쌍이 지수적 증폭 반응에 사용될 수 있고; 제1 쌍 중 하나의 프라이머는 제1 주형 폴리뉴클레오타이드 분자 서열에 상보적인 포워드 프라이머일 수 있고, 제1 쌍 중 하나의 프라이머는 제1 주형 폴리뉴클레오타이드 분자의 제2 서열에 상보적인 리버스 프라이머일 수 있고, 제1 주형 유전자좌는 제1 서열 및 제2 서열 사이에 존재할 수 있다. 일부 구체예에서, 제2 프라이머 쌍이 증폭 반응에 사용될 수 있으며; 제2 쌍 중 하나의 프라이머는 제 2 표적 폴리뉴클레오타이드 분자의 제1 서열에 상보적인 포워드 프라이머일 수 있고, 제2 쌍 중 하나의 프라이머는 제2 표적 폴리뉴클레오타이드 분자의 제2 서열에 상보적인 리버스 프라이머일 수 있고, 제2 표적 유전자좌는 제1 서열과 제2 서열 사이에 존재할 수 있다. 일부 구체예에서, 제2 표적 유전자좌는 가변 경쇄 항체 서열을 포함한다. 일부 구체예에서, 제3 프라이머 쌍이 증폭 반응에 사용될 수 있으며; 제3 쌍 중 하나의 프라이머는 제3 주형 폴리뉴클레오타이드 분자의 제1 서열에 상보적인 포워드 프라이머일 수 있고, 제3 쌍 중 하나의 프라이머는 제3 주형 폴리뉴클레오타이드 분자의 제2 서열에 상보적인 리버스 프라이머일 수 있고, 제3 주형 유전자좌는 제1 서열과 제2 서열 사이에 존재할 수 있다.
하나 이상의 프라이머는 복수 개의 주형 폴리뉴클레오타이드의 적어도 일부에 어닐링될 수 있다. 하나 이상의 프라이머는 복수 개의 주형 폴리뉴클레오타이드의 3' 말단 및/또는 5' 말단에 어닐링될 수 있다. 하나 이상의 프라이머는 복수 개의 주형 폴리뉴클레오타이드의 내부 영역에 어닐링될 수 있다. 내부 영역은 복수 개의 주형 폴리뉴클레오타이드의 3' 말단 또는 5' 말단으로부터의 적어도 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 100, 150, 200, 210, 220, 230, 240,250, 260, 270,280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500, 510, 520, 530, 540,550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 또는 1000 개 뉴클레오타이드일 수 있다. 하나 이상의 프라이머는 고정된 프라이머 패널을 포함할 수 있다. 하나 이상의 프라이머는 적어도 하나 이상의 맞춤형 프라이머를 포함할 수 있다. 하나 이상의 프라이머는 적어도 하나 이상의 대조군 프라이머를 포함할 수 있다. 하나 이상의 프라이머는 적어도 하나 이상의 하우스 키핑 유전자 프라이머를 포함할 수 있다. 하나 이상의 프라이머는 범용 프라이머를 포함할 수 있다. 범용 프라이머는 범용 프라이머 결합 부위에 어닐링될 수 있다. 일부 구체예에서, 하나 이상의 맞춤형 프라이머는 SBC, 표적 특이적 영역, 이의 상보체, 또는 이들의 임의의 조합에 어닐링된다. 하나 이상의 프라이머는 범용 프라이머를 포함할 수 있다. 하나 이상의 프라이머는 프라이머 연장, 역전사, 선형 연장, 비-지수적 증폭, 지수적 증폭, PCR 또는 하나 이상의 표적 또는 주형 폴리뉴클레오타이드의 기타 임의의 증폭 방법을 수행하도록 설계될 수 있다.
표적 특이적 영역은 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39,40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 100, 150, 200, 220, 230, 240, 250, 260, 270,280, 290, 300, 310, 320, 330, 340, 350, 360, 370, 380, 390, 400, 410, 420, 430, 440, 450, 460, 470, 480, 490, 500,510, 520, 530, 540, 550, 560, 570, 580, 590, 600, 650, 700, 750, 800, 850, 900 또는 1000 개 뉴클레오타이드 또는 염기쌍을 포함할 수 있다. 다른 예에서, 표적 특이적 영역은 적어도 약 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 6500, 7000, 7500, 8000, 8500, 9000, 9500, 또는 10000 개 뉴클레오타이드 또는 염기쌍을 포함한다. 일부 구체예에서, 표적 특이적 영역은 약 5-10, 10-15, 10-20, 10-30, 15-30, 10-75, 15-60, 15-40, 18-30, 20-40, 21-50, 22-45, 25-40, 7-9, 12-15, 15-20, 15-25, 15-30, 15-45, 15-50, 15-55, 15-60, 20-25, 20-30, 20-35, 20-45, 20-50, 20-55, 20-60, 2-900, 2-800, 2-700, 2-600, 2-500, 2-400, 2-300, 2-200, 2-100, 25-900, 25-800, 25-700, 25- 600, 25-500, 25-400, 25-300, 25-200, 25-100, 100-1000, 100-900, 100-800, 100-700, 100-600, 100- 500, 100-400, 100-300, 100-200, 200-1000, 200-900, 200-800, 200-700, 200-600, 200-500, 200-400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400-700, 400-600, 400-500, 500-1000, 500-900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600-700, 700-1000, 700-900, 700-800, 800-1000, 800-900, 또는 900-1000 개 뉴클레오타이드 또는 염기쌍을 포함한다.
프라이머는 2차 구조 및 자가-혼성화를 피하기 위하여 공지의 파라미터에 따라 설계될 수 있다. 일부 구체예에서, 서로 다른 프라이머 쌍은 대략 동일한 온도에서 어닐링되고 용융될 수 있는데, 예컨대 다른 프라이머 쌍의 1℃, 2℃, 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃ 또는 10℃ 이내이다. 일부 구체예에서, 복수 개의 프라이머 중 하나 이상의 프라이머는 대략 동일한 온도에서 어닐링되고 용융될 수 있는데, 예컨대 복수 개의 프라이머 중 다른 프라이머의 1℃, 2℃, 3℃, 4℃, 5℃, 6℃, 7℃, 8℃, 9℃ 또는 10℃ 이내이다. 일부 구체예에서, 복수 개 중 하나 이상의 프라이머는 복수 개의 프라이머 중 다른 프라이머와 상이한 온도에서 어닐링되고 용융될 수 있다.
본 명세서에서 기술되는 방법의 하나 이상의 단계를 위한 복수 개의 프라이머는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000,1,000,000, 50,000,000, 100,000,000 개의 서로 다른 프라이머, 약 그 이하, 또는 약 그 이상을 포함하는 복수 개의 프라이머를 포함할 수 있다. 예컨대, 복수 개의 프라이머 중 각각의 프라이머는 서로 다른 표적 또는 주형 특이적 영역 또는 서열을 포함할 수 있다.
도 2는, 본 명세서에서 제공되는 방법에 의해 생성되는, 본 명세서에서 제공되는 폴리뉴클레오타이드 라이브러리의 증폭을 위한, 예시적인 증폭 반응을 도시한다. 본 명세서에 제공되는 예시적인 방법에서, 시퀀싱 목적을 위한 라이브러리의 증폭은 시퀀싱 어댑터에 연결된 프라이머를 사용하여 시퀀싱, 예를 들어 차-세대 시퀀싱에 사용된다. 이러한 프라이머는 공지되어 있고 본 명세서에 기재되어 있다. 시퀀싱 어댑터-태깅된 프라이머는 아래에 제공되는 예시적인 적용에서 사용된다.
일부 구체예에서, 표적 유전자는 시퀀싱을 위해 증폭된다. 일부 구체예에서, 표적 유전자는, 폴리뉴클레오타이드의 한쪽 말단의 어댑터 서열에 대한 것인 프라이머 및 전장 표적 폴리펩타이드 또는 그의 선택된 부분을 시퀀싱하도록 위치된 표적 특이적 프라이머를 사용하여 증폭된다. 일부 예에서, 표적 서열은 단일 세포 또는 복수 개의 세포로부터의 라이브러리에 존재할 수 있다. 일부 구체예에서, 하나 이상의 표적 서열은 폴리뉴클레오타이드의 범용 프라이밍 서열에 특이적인 프라이머 및 하나 이상의 표적-특이적 프라이머를 사용하여 증폭된다. 일부 구체예에서, 2 개 이상의 표적 서열이 증폭되며, 이들 각각은 기술된 바와 같이 범용 서열 및 표적-특이적 프라이머를 이용하여 증폭된다. 일부 구체예에서, 2 개 이상의 표적 서열, 예컨대 세포에서 공동 발현되는 2 개의 표적 서열, 예를 들어 이량 체 (예를 들어, 헤테로이량체)로 발현되는 표적 서열이 연결된다. 따라서, 제공된 구체예를 사용하여, 페어링된 서열 정보, 예컨대 전장 페어링된 서열 정보가 제공되는 방법을 이용하여 얻어질 수 있다.
일부 구체예에서, 폴리뉴클레오타이드의 전체 제조된 라이브러리는 제1 어댑터의 범용 프라이밍 서열 및 제2 어댑터의 범용 프라이밍 서열에 특이적인 프라이머를 사용하여 시퀀싱용으로 증폭될 수 있다. 라이브러리의 폴리뉴클레오타이드의 두 말단의 범용 프라이밍 서열에 특이적인 프라이머를 이용하는 본 명세서에서 제공되는 폴리뉴클레오타이드 라이브러리의 증폭은 상기 라이브러리를 제조하는데 사용된 모든 세포의 전사체 또는 게놈 또는 그 일부분을 제공할 수 있다. 이러한 전사체 정보는 이후 시점에서의 마이닝 (mining) 및/또는 샘플이 제조된 세포 집단 내에서 몇몇 유전자의 발현을 평가 (전사물 수준에서)하는데 사용될 수 있다. 일부 구체예에서, 모든 세포의 전사체 정보는 분석되어 라이브러리가 생성되었던 세포의 총 집단으로부터 유사한 전사물 발현 프로파일을 갖는 세포 클러스터를 생성하는데 사용될 수 있다.
일부 구체예에서, 단일 세포로부터의 폴리뉴클레오타이드는 용기 바코드 서열에 특이적인 프라이머 및 제2 어댑터에 존재하는 범용 프라이밍 부위에 특이적인 프라이머를 사용하여 특이적으로 증폭 및 시퀀싱될 수 있다. 이러한 구체예에서, 하나 이상의 표적 서열(들)은 상기 기재된 바와 같이 증폭되고, 용기 바코드(들)은 대상인 것으로 식별된 표적 서열(들)에서 확인된다. 동일한 세포로부터의 모든 폴리뉴클레오타이드는 동일한 용기 바코드로 바코딩되므로, 이 방법의 적용은 선택된 세포 또는 세포들로부터의 모든 폴리뉴클레오타이드의 서열 정보를 산출한다. 선택된 세포 또는 세포들로부터의 라이브러리 내 모든 폴리뉴클레오타이드의 증폭은 그 후 하나 이상의 특정 표적 서열을 발현하는 세포 또는 세포들의 발현 프로파일 또는 유전자 프로파일을 제공할 수 있다.
2. 시퀀싱
본 명세서에 기재된 하나 이상의 방법 또는 방법 단계를 수행한 후, 생성된 폴리뉴클레오타이드 라이브러리는 시퀀싱될 수 있다.
시퀀싱은 당업계에 공지된 임의의 시퀀싱 방법에 의해 수행될 수 있다. 일부 구체예에서, 시퀀싱은 고 처리량으로 수행될 수 있다. 적합한 차세대 시퀀싱 기술은 454 Life Sciences 플랫폼 (Roche, Branford, CT)(Margulies et al., Nature,437, 376-380 (2005)); lllumina's Genome Analyzer, GoldenGate Methylation Assay, 또는 Infinium Methylation Assays, 즉, Infinium HumanMethylation 27K BeadArray 또는 VeraCode GoldenGate 메틸화 어레이 (Illumina, San Diego, CA; Bibkova et al, Genome Res. 16, 383-393 (2006); 및 U.S. Patent Nos. 6,306,597, 7,598,035, 7,232,656), 또는 DNA Sequencing by Ligation, SOLiD System (Applied Biosystems/Life Technologies; U.S. Patent Nos. 6,797,470, 7,083,917, 7,166,434,7,320,865, 7,332,285, 7,364,858, 및 7,429,453); 또는 Helicos True Single Molecule DNA 시퀀싱 기술 (Harris et al, Science, 320, 106-109 (2008); 및 U.S. Patent Nos. 7,037,687,7,645,596, 7,169,560, 및 7,769,400), Pacific Biosciences의 단일 분자, 실시간 (SMRTTm) 기술, 및 시퀀싱 (Soni et al,Clin. Chem. 53, 1996-2001 (2007))을 포함한다.
일부 구체예에서, 폴리뉴클레오타이드는 염료-변형된 프로브의 연결에 의한 시퀀싱, 파이로시퀀싱, 또는 단일-분자 시퀀싱에 의하여 시퀀싱된다. 폴리뉴클레오타이드의 서열을 결정하는 것은 시퀀싱 방법, 예컨대 HelioscopeTM 단일 분자 시퀀싱, Nanopore DNA 시퀀싱, Lynx Therapeutics' Massively Parallel Signature Sequencing (MPSS), 454 파이로시퀀싱, Single Molecule 실시간 (RNAP) 시퀀싱, Illumina (Solexa) 시퀀싱, SOLiD 시퀀싱, Ion TorrentTM, Ion 반도체 시퀀싱, Single Molecule SMRT(TM) 시퀀싱, Polony 시퀀싱, DNA 나노볼 시퀀싱, 및 VisiGen Biotechnologies 접근법에 의하여 수행될 수 있다. 또는, 폴리뉴클레오타이드의 서열을 결정하는 것은 Illumina에서 제공하는 Genome Analyzer IIx, HiSeq, 및 MiSeq, Pacific Biosciences (California)에서 제공하는 Single Molecule Real Time (SMRTTM) 기술, 예컨대 PacBio RS 시스템, 및 Helicos Inc.(Cambridge, MA)에서 제공하는 Solexa Sequencer, True Single Molecule Sequencing (tSMSTM) 기술, 예컨대 HeliScopeTM 을 포함하지만 이에 국한되지 않는 시퀀싱 플랫폼을 사용할 수 있다. 시퀀싱은 MiSeq 시퀀싱을 포함할 수 있다. 시퀀싱은 HiSeq 시퀀싱을 포함할 수 있다. 일부 구체예에서, 폴리뉴클레오타이드의 서열을 결정하는 것은 페어링된-말단 시퀀싱, 나노포어 시퀀싱, 고-처리량 시퀀싱, 샷건 시퀀싱, 염료-터미네이터 시퀀싱, 다중-프라이머 DNA 시퀀싱, 프라이머 워킹, Sanger 디데옥시 시퀀싱, Maxim-Gilbert 시퀀싱, 파이로시퀀싱, 진정 단일 분자 시퀀싱 또는 이들의 임의의 조합을 포함한다. 또는, 폴리뉴클레오타이드의 서열은 전자 현미경 또는 화학적-민감성 장 효과 트랜지스터 (chemFET) 어레이에 의해 결정될 수 있다.
방법은 라이브러리에서 하나 이상의 폴리뉴클레오타이드를 시퀀싱하는 단계를 더 포함할 수 있다. 방법은 라이브러리에서 하나 이상의 폴리뉴클레오타이드 서열, 판독 서열, 앰플리콘 서열 또는 앰플리콘 세트 서열을 서로에 대해 정렬시키는 단계를 더 포함할 수 있다.
본 명세서에서 사용되는 바, 정렬은 시험 서열, 예컨대 판독 서열을 하나 이상의 다른 시험 서열, 기준 서열 또는 이들의 조합을 비교하는 것을 포함한다. 일부 구체예에서, 정렬은 복수 개의 서열 또는 정렬된 서열로부터 컨센서스 서열을 결정하기 위해 사용될 수 있다. 일부 구체예에서, 정렬은 각각 동일한 분자 바코드 또는 용기 바코드를 갖는 복수 개의 서열로부터 컨센서스 서열을 결정하는 것을 포함한다. 일부 구체예에서, 비교 목적으로 정렬된 서열의 길이는 기준 서열 길이의 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 적어도 95%이다. 2 개 이상의 서열의 실제 비교는 잘 알려진 방법, 예를 들어 수학적 알고리즘에 의하여 달성될 수 있다. 이러한 수학적 알고리즘의 비-제한적인 예는 [Karlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90- 5873-5877 (1993)]에 기술되어 있다. 이러한 알고리즘은, [Altschul, S. et al., Nucleic Acids Res., 25:3389-3402 (1997)]에 기술되어 있는 대로, NBLAST 및 XBLAST 프로그램 (버전 2.0)에 통합된다. BLAST 및 Gapped BLAST 프로그램을 사용할 때 각 프로그램 (예컨대, NBLAST)의 관련 매개 변수를 사용할 수 있다. 예를 들어, 서열 비교를 위한 파라미터는 score = 100, word length = 12로 설정될 수 있거나, 또는 변경될 수 있다 (예를 들어, W = 5 또는 W = 20). 다른 예는 Myers 및 Miller 알고리즘, CABIOS (1989), ADVANCE, ADAM, BLAT 및 FASTA를 포함한다. 일부 구체예에서, 2 개의 아미노산 서열 사이의 동일성 백분율은 예를 들어 GCG 소프트웨어 패키지 내 GAP 프로그램 (Accelrys, Cambridge, UK)을 이용하여 달성될 수 있다.
시퀀싱은, 폴리뉴클레오타이드 중 적어도 약 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 개 또는 그 이상의 뉴클레오타이드 또는 염기쌍을 시퀀싱하는 것을 포함할 수 있다. 일부 구체예에서, 시퀀싱은 폴리뉴클레오타이드의 적어도 약 200, 300, 400, 500, 600, 700, 800, 900, 1000 개 또는 그 이상의 뉴클레오타이드 또는 염기쌍을 시퀀싱하는 것을 포함한다. 다른 경우에, 시퀀싱은 폴리뉴클레오타이드의 적어도 약 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000 개 또는 그 이상의 뉴클레오타이드 또는 염기쌍을 시퀀싱하는 것을 포함한다.
시퀀싱은 실행당 (per run) 적어도 약 200, 300, 400, 500, 600, 700, 800, 900, 1000 번 또는 그 이상의 시퀀싱 판독을 포함할 수 있다. 본 명세서에 사용되는 바, 서열 판독은 시퀀싱 기술에 의해 생성된 데이터의 서열 또는 스트림으로부터 결정된 뉴클레오타이드의 서열을 포함한다. 일부 구체예에서, 시퀀싱은 실행당 적어도 약 1500, 2000, 3000, 4000, 5000, 6000,7000, 8000, 9000, 10,000 번 또는 그 이상의 시퀀싱 판독을 포함한다. 시퀀싱은 실행당 약 1,000,000,000 번 초과, 그 미만, 또는 그와 균등 수의 시퀀싱 판독을 포함할 수 있다. 시퀀싱은 실행당 약 200,000,000 번 초과, 그 미만, 또는 그와 균등 수의 판독을 포함할 수 있다.
일부 구체예에서, 컨센서스 서열을 결정하는데 이용되는 서열 판독의 수는 약 2-1000 번 서열 판독이다. 예컨대, 컨센서스 서열을 결정하는데 사용되는 서열 판독의 수는 약 2-900, 2-800, 2-700, 2-600, 2-500, 2-400, 2-300, 2-200, 2-100, 25-900, 25-800, 25-700, 25-600, 25-500, 25-400, 25-300, 25-200, 25-100, 100-1000, 100-900, 100-800, 100-700, 100-600, 100-500, 100-400, 100-300, 100-200, 200-1000, 200-900, 200-800, 200-700, 200-600, 200-500, 200-400, 200-300, 300-1000, 300-900, 300-800, 300-700, 300-600, 300-500, 300-400, 400-1000, 400-900, 400-800, 400-700, 400-600, 400-500, 500-1000, 500-900, 500-800, 500-700, 500-600, 600-1000, 600-900, 600-800, 600-700, 700-1000, 700-900,700-800, 800-1000, 800-900, 또는 900-1000 번 서열 판독일 수 있다. 일부 구체예에서, 컨센서스 서열을 결정하는데 사용되는 서열 판독의 수는 적어도 약 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 20,000, 25,000, 30,000,35,000, 40,000, 45,000, 50,000, 55,000, 60,000, 65,000, 70,000, 75,000, 80,000, 85,000, 90,000, 95000, 100,000, 150,000, 200,000, 250,000, 300,000, 350,000, 400,000, 450,000, 500,000, 550,000, 600,000, 650,000, 700,000, 750,000, 800,000, 850,000, 900,000, 950,000, 1,000,000, 50,000,000, 또는 100,000,000 번 판독이다. 일부 구체예에서, 컨센서스 서열을 결정하는데 사용되는 서열 판독의 수는 최대 약 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 20,000, 25,000, 30,000,35,000, 40,000, 45,000, 50,000, 55,000, 60,000, 65,000, 70,000, 75,000, 80,000, 85,000, 90,000, 95000, 100,000, 150,000, 200,000, 250,000, 300,000, 350,000, 400,000, 450,000, 500,000, 550,000, 600,000, 650,000, 700,000, 750,000, 800,000, 850,000, 900,000, 950,000, 1,000,000, 50,000,000, 또는 100,000,000 번 판독이다.
방법은 시퀀싱 오판독을 포함할 수 있다. 방법은, 예컨대 반응 조건을 결정하거나 프라이머 서열을 설계하기 위하여, 오판독 수를 결정하는 단계를 포함할 수 있다. 하나 이상의 제1 조건 또는 조건 세트 하에서 생성된 오판독 수를 비교하는 것은, 바람직한 조건 또는 조건 세트를 결정하는데 사용될 수 있다. 예를 들어, 제1 방법은 PCR 반응 중 높은 염 농도에서 수행될 수 있고, 제2 방법은 PCR 반응 중 낮은 염 농도에서 수행될 수 있는데, 여기서 제1 및 제2 방법은 염 농도 차이만 빼고 실질적으로 동일하게 수행된다. 제1 방법이 더 많은 수의 오판독, 예컨대 특정 표적 폴리뉴클레오타이드 서열 또는 프라이머에 대해 더 많은 수의 오 판독을 초래한다면, 그 특정 표적 폴리뉴클레오타이드 서열 또는 프라이머에 대해서는 더 낮은 염 반응 조건이 바람직하다고 결정될 수 있다.
II. 표적 유전자의 클로닝 및 발현
일부 구체예에서, 제공되는 방법에 따라 확인되고 시퀀싱된 표적 유전자는 세포에서 또는 세포로부터의 발현을 위해 벡터 내로 클로닝될 수 있다. 면역 수용체와 같은 표적 유전자, 예를 들어 항체 또는 TCR의 발현 라이브러리가 생성될 수 있다.
본 명세서에서 사용되는 "항체 발현 라이브러리" 또는 "TCR 발현 라이브러리" 또는 "발현 라이브러리"는, 핵산 또는 단백질 중 어느 하나의 수준에서의 분자들 (즉, 2 개 이상의 분자)의 집합체를 지칭할 수 있다. 따라서, 이 용어는 복수 개의 항체 또는 TCR 분자를 인코딩하는 발현 벡터의 집합체를 지칭하거나 (즉, 핵산 수준에서), 또는 그들이 적절한 발현 시스템에서 발현된 후의 항체 또는 TCR 분자의 집합체를 지칭할 수 있다 (즉, 단백질 수준에서). 또는, 발현 벡터/발현 라이브러리는 이들이 발현될 수 있는 적합한 숙주 세포에 함유될 수 있다. 본 발명의 발현 라이브러리에서 인코딩되거나 발현되는 항체 분자는 임의의 적절한 형태일 수 있으며, 예를 들어, 전 항체 또는 TCR 분자일 수 있거나, 항체 또는 TCR 단편, 예를 들어 단일 사슬 항체 (예를 들어, scFv 항체), Fv 항체, Fab' 항체, (Fab')2 단편, 디아바디 등일 수 있다. 특정 효소를 "코딩하는 'V'를 인코딩하는" 핵산 서열 또는 특정 효소를 "코딩하는 'V'를 인코딩하는" DNA 코딩 서열 또는 뉴클레오타이드 서열에서와 같은, 용어 "인코딩하는" 및 "...을 코딩하는" 및 기타 동의어는 적절한 조절 서열의 제어하에 위치될 때 효소로 전사되고 번역되는 DNA 서열을 지칭한다. "프로모터 서열"은 세포에서 RNA 중합 효소에 결합하고 하류 (3 ' 방향) 코딩 서열의 전사를 개시할 수 있는 DNA 조절 영역이다. 프로모터는 DNA 서열의 일부이다. 이 서열 영역은 3' 말단에 개시 코돈을 갖는다. 프로모터 서열은 백그라운드를 넘어 검출 가능한 수준에서 전사를 개시하는데 필요한 요소를 갖는 최소 개수의 염기를 포함한다. 그러나, RNA 중합 효소가 그 서열에 결합하고 전사가 개시 코돈 (프로모터를 갖는 3' 말단)에서 개시되면, 전사는 3' 방향으로 하류로 진행된다. 프로모터 서열 내에서, 전사 개시 부위 (편리하게는 뉴클레아제 SI을 이용한 맵핑에 의해 정의됨) 및 RNA 중합 효소의 결합을 담당하는 단백질 결합 도메인 (컨센서스 서열)이 발견될 것이다.
본 발명의 항체 또는 TCR 발현 라이브러리에 의해 동정되거나, 이로부터 유래되거나, 이로부터 선택되거나, 이로부터 수득될 수 있는 항체 또는 TCR 분자는 본 발명의 또 다른 측면을 형성한다. 다시, 이들 항체 또는 TCR 분자는 단백질 또는 항체 또는 TCR 분자를 인코딩하는 핵산일 수 있는데, 이 핵산은 결국 적절한 발현 벡터 내로 혼입되고 및/또는 적절한 숙주 세포에 함유될 수 있다.
cDNA 풀은, 항체 유전자의 중쇄의 불변 영역에 혼성화하는 폴리뉴클레오타이드 및 항체 또는 TCR 유전자의 VH 또는 Vα 또는 Vγ 사슬 영역의 5' 말단에 혼성화하는 폴리뉴클레오타이를 이용하여 PCR 반응에 적용될 수 있다. cDNA 풀은, 항체 또는 TCR 유전자의 중쇄 또는 알파 또는 감마 사슬의 불변 영역에 혼성화하는 폴리뉴클레오타이드 및 항체 또는 TCR 서열을 포함하는 바코딩된 폴리뉴클레오타이드의 VH 또는 Vα 또는 Vγ 사슬의 5' 말단에 영역 5'에 혼성화하는 폴리뉴클레오타이드를 이용하여 PCR 반응에 적용될 수 있다. PCR 반응은 또한 예를 들어 카파 및 람다 클래스의 VL 또는 Vβ 또는 Vγ 사슬 풀의 증폭을 위해 설정될 수 있다. cDNA 풀은 항체 유전자의 경쇄의 불변 영역에 혼성화되는 폴리뉴클레오타이드 및 항체 또는 TCR 유전자의 VL 또는 Vβ 또는 Vγ 사슬 영역의 5' 말단에 혼성화되는 폴리뉴클레오타이드를 이용하여 PCR 반응에 적용될 수 있다. cDNA 풀은 항체 유전자의 경쇄의 불변 영역에 혼성화하는 폴리뉴클레오타이드 및 항체 또는 TCR 서열을 포함하는 바코딩된 폴리뉴클레오타이드의 VL 또는 Vβ 또는 Vγ 사슬 영역의 5' 말단에 5' 영역에 혼성화하는 폴리뉴클레오타이드를 이용하여 PCR 반응에 적용될 수 있다. 이러한 올리고뉴클레오타이드 또는 프라이머는 공지되고 공개적으로 이용 가능한 면역글로불린 또는 TCR 유전자 서열 데이터베이스 정보에 기초하여 설계될 수 있다.
일부 구체예에서, VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열은 중쇄 또는 경쇄 유전자에 대하여, 특히 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 폴리뉴클레오타이드의 하나의 말단 영역 또는 양 말단 영역 모두에 대하여 특이적이지 않은 하나 이상의 프라이머를 이용하여 PCR 증폭에 의하여 생성되는 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열의 라이브러리로부터 편리하게 얻어질 수 있다. 일부 구체예에서, VH 및 VL 서열은 용기 바코딩된 폴리뉴클레오타이드의 영역에 특이적인 프라이머를 사용하여 PCR 증폭에 의하여 생성되는 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열의 라이브러리로부터 편리하게 얻어질 수 있다. 일부 구체예에서, VH 및 VL 서열은 C-유전자 패밀리-특이적 프라이머 또는 C-유전자-특이적 프라이머를 사용하여 PCR 증폭에 의해 생성되는 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열의 라이브러리로부터 편리하게 얻어질 수 있다. 일부 구체예에서, VH 및 VL 서열은 용기 바코딩된 폴리뉴클레오타이드의 영역에 특이적인 제1 프라이머 및 C-유전자 패밀리-특이적 프라이머 또는 C-유전자-특이적 프라이머인 제2 프라이머 또는 복수 개의 제2 프라이머를 포함하는 프라이머 세트를 이용하여 PCR 증폭에 의하여 생성되는 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열의 라이브러리로부터 편리하게 얻어질 수 있다. 일부 구체예에서, VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열은 용기 바코딩된 폴리뉴클레오타이드의 영역에 특이적인 제1 프라이머 및 범용 서열에 특이적인 제2 프라이머를 포함하는 프라이머 세트를 이용하여 PCR 증폭에 의하여 생성되는 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열의 라이브러리로부터 편리하게 얻어질 수 있다.
일부 구체예에서, 역전사시, 결과물인 cDNA 서열은 면역글로불린 유전자에 대하여, 특히 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 폴리뉴클레오타이드의 하나의 말단 영역 또는 양 말단 영역 양자 모두에 대하여 특이적인 하나 이상의 프라이머를 이용하여 PCR에 의하여 증폭될 수 있다. 일부 구체예에서, VH 및 VL 서열은 V-유전자 패밀리-특이적 프라이머 또는 V 유전자-특이적 프라이머를 이용하여 PCR 증폭에 의하여 생성되는 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열의 라이브러리로부터 얻어질 수 있거나 (Nicholls et al, J.Immunol. Meth., 1993, 165:81; W093/12227) 또는 이용 가능한 서열 정보에 기초한 표준 기술-공지된 방법에 따라 설계된다. (VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열은, 보통 개입 스페이서 서열 (예컨대, 인-프레임 가요성 펩타이드 스페이서를 인코딩함)을 이용하여 연결되어, 단일-사슬 항체를 인코딩하는 카세트를 형성할 수 있다.) V 영역 서열은 면역 글로불린-발현 세포에 대한 cDNA 또는 PCR 증폭 산물로서 편리하게 클로닝될 수 있다. VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 영역은, 임의로, 본 명세서에 기재되는 방법 및 특히 찾아볼 수 있는 바 특정 단계 후에 (예를 들어, 단일 세포 PCR 후; 포유 동물 또는 다른 세포 표면 디스플레이 후, FACS 스크리닝 후 등등) 시퀀싱된다. 시퀀싱은 무엇보다도 다양성 수준이 수용 가능한 수준인지 확인하기 위해 사용될 수 있다. 시퀀싱은 고-처리량 시퀀싱, 딥 시퀀싱 (여기서, 동일한 유전자는 복수 개의 개별 샘플로부터 시퀀싱되어 서열의 차이를 식별함), 또는이 둘의 조합을 포함할 수 있다.
일부 구체예에서, 본 명세서에 기재된 방법을 사용하면 천연 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 조합을 물리적으로 연결할 필요가 없다. 일부 구체예에서, cDNA, 바코딩된 폴리뉴클레오타이드, 또는 PCR 증폭된 바코딩된 cDNA는 물리적으로 연결되지 않는다. 일부 구체예에서, cDNA, 바코딩된 폴리뉴클레오타이드, 또는 PCR 증폭된 바코딩된 cDNA는 동일한 반응 또는 용기에서 물리적으로 연결되지 않는다.
일부 구체예에서, 천연 VH 및 VL 또는 Vα 및 Vβ 및 Vβ 및 Vδ 조합은, cDNA 프라이머 이외에도, VH 또는 Vα 또는 Vγ 유전자의 5' 말단에 대한 하나의 프라이머 또는 복수 개의 프라이머 및 VL 또는 Vβ 또는 Vδ 유전자의 5' 말단에 대한 프라이머 또는 복수 개의 프라이머를 사용하여 물리적으로 연결된다. 이들 프라이머는 또한 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 유전자의 자가-조립을 허용하기 위해 추가 서열로 이루어지는 상보적 꼬리를 함유한다. PCR 증폭 및 연결 후, 혼합된 생성물, 달리 말해 혼합된 가변 영역을 얻을 가능성은 최소인데, 이는 증폭 및 연결 반응이 각 세포 내에서 수행되었기 때문이다. 디곡시제닌-표지 된 뉴클레오타이드와 같은 벌키한 시약을 사용함으로써 혼합의 위험성은 더욱 감소 될 수 있어 V 영역 cDNA 쌍이 세포 구획을 이탈하지 않고 섞이지만 PCR 증폭 및 연결을 위해 세포 내에 유지된다. 증폭된 서열은 상보적인 말단 서열의 혼성화에 의해 연결된다. 연결 후, 본 명세서에 기재된 추가 방법 단계에서 사용하기 위해 세포로부터 서열을 회수할 수 있다. 예를 들어, 회수된 DNA는 필요한 경우 말단 프라이머를 사용하여 PCR 증폭될 수 있고, 하기 상세히 기재되는 바와 같은 플라스미드, 파지, 코스미드, 파지미드, 바이러스 벡터 또는 이들의 조합 일 수 있는 벡터로 클로닝된다. 클로닝을 용이하게 하기 위해 편리한 제한 효소 부위가 혼성화된 서열에 혼입될 수 있다. 이들 벡터는 또한 나중에 사용하기 위해 연결된 가변 영역의 라이브러리로서 저장될 수 있다.
추가적인 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 조합을 제공하는 것이 바람직한 일부 구체예에서, 이를 용이하게 하기 위해 발현 시스템이 선택된다. 예를 들어, 박테리오파지 발현 시스템은 중쇄 및 경쇄 서열의 무작위 재조합을 허용한다. 다른 적합한 발현 시스템은 당업자에게 공지되어 있다.
비인간으로부터 유래된 VH 및 VL 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 서열의 경우, 일부 구체예에서, 이들 서열을 완전한 인간 Fc로 키메라화하는 것이 바람직할 수 있음에 주목해야 한다. 본 명세서에 사용되는 "키메라화"는 그 중쇄 및 경쇄 가변 영역 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 영역이 인간 기원의 것이 아니며 그 중쇄 및 경쇄의 불변 영역 또는 Vα 및 Vβ 또는 Vγ 및 Vδ 사슬은 인간 기원의 것인 면역 글로불린 또는 TCR을 지칭한다. 이것은 가변 도메인을 인간 Fc 내로 증폭 및 클로닝함으로써 결과한다. 인간 Fc는 벡터의 일부이거나 별도의 분자에 있을 수 있으며, Fc 라이브러리 역시 사용될 수 있다. 바람직한 구체예에서, CHO 세포와 같은 포유 동물 세포에서 성장된 키메라화 분자는 FACS로 2 회 스크리닝되어 세포 집단을 대상 항체를 발현하는 세포에 대하여 농축시킨다. 키메라화 항체 또는 TCR은 시퀀싱 후 기능적 특징화, 또는 직접적인 기능적 특징화 또는 동력학 중 하나에 의해 특징 지워진다. 성장, 스크리닝 및 특성 분석은 하기에 자세히 설명된다.
상기 기재된 PCR 반응이 항체를 IgG 형태로 클로닝하기 위해 기술되어 있음에 주목하는 것이 중요하다. 이들은 일반적으로 보다 성숙한 면역 반응과 관련이 있고 일반적으로 IgM 항체보다 높은 친화성을 나타내어, 그로 인하여 특정 치료 및 진단 적용에 더 바람직하기 때문에 양호하다. 그러나, 명백히, 원하거나 적절하다면, 하나 이상의 다른 형태의 면역글로불린 분자, 예를 들어, IgM, IgA, IgE 및 IgD의 클로닝을 허할 수 있을 폴리뉴클레오타이드가 설계될 수 있다.
일단 항체 또는 TCR이 동정되고 적절한 상기 세포의 집단이 적절한 시간에 단리되고 상기 기재된 바와 같이 임의로 농축되면, 항체 또는 TCR 발현 라이브러리는 즉시 생성될 필요가 없는데, 이는 세포에 함유된 유전자 물질이 온전히 유지됨을 제공하고 그로 인하여 나중에 라이브러리 제조를 가능하게 한다. 따라서, 예를 들어, 세포, 세포 용해물, 또는 핵산, 예를 들어 그로부터 유래된 RNA 또는 DNA는 적절한 방법, 예를 들어 동결에 의해 저장될 수 있고 나중에 필요할 때 발현 라이브러리는 생성될 수 있다.
일단 발현 벡터의 라이브러리가 생성되면, 인코딩된 항체 분자는 그 후 적절한 발현 시스템에서 발현될 수 있고 당업계에 널리 공지되고 설명된 적절한 기술을 사용하여 스크리닝될 수 있다. 따라서, 본 발명의 상기 정의된 방법은 적절한 발현 시스템에서 발현 벡터의 라이브러리를 발현시키고, 하기에 보다 상세히 설명되는 바와 같이 원하는 특성을 갖는 항체에 대해 발현된 라이브러리를 스크리닝하는 추가 단계를 포함할 수 있다.
본 명세서에 나타난 바와 같이, 항체 또는 TCR 서열을 인코딩하는 폴리뉴클레오타이드를 포함하는 본 명세서의 방법에 의해 제조된 폴리뉴클레오타이드는, 항체 또는 TCR 단편의 아미노산 서열을 인코딩하는 것들, 저절로, 전체 항체 또는 TCR 또는 그 부분에 대한 비코딩 서열, 항체 또는 TCR, 단편 또는 부분에 대한 코딩 서열, 및 추가 서열, 예컨대 전술한 추가적인 코딩 서열을 갖거나 갖지 않는 적어도 하나의 시그널 리더 또는 융합 펩타이드의 코딩 서열, 예컨대 추가적인, 예컨대 비-코딩 5' 및 3' 서열을 포함하지만 이에 국한되지는 않는 비-코딩 서열과 함께 적어도 하나의 인트론, 예컨대 전사, mRNA 프로세싱, 예컨대 스플라이싱 및 폴리아데닐화 신호에 중요한 역할을 하는 (예컨대 mRNA의 리보좀 결합 및 안정성)전사된, 비-번역된 서열; 추가적인 기능성을 제공하는 것과 같은 추가적인 아미노산을 코딩하는 추가적인 코딩 서열을 포함할 수 있지만 이에 국한되는 것은 아니다. 따라서, 항체를 인코딩하는 서열은 마커 서열, 예컨대 항체 또는 TCR 단편 또는 부분을 포함하는 융합된 항체 또는 TCR의 정제를 용이하게 하는 펩타이드를 인코딩 서열에 융합 될 수 있다.
1차 PCR 생성물은 그 후 항체 또는 TCR 가변 도메인 VH, VL 카파 및 VL 람다 또는 Vα 및 v 또는 Vγ 및 Vδ의 5' 및 3' 말단에 혼성화되는 새로운 폴리뉴클레오타이드 세트를 사용하여 2차 PCR 반응에 적용될 수 있다 (새로운 폴리뉴클레오타이드 세트가 사용되는 1차 PCR 반응이 중쇄 또는 경쇄 항체 유전자 또는 Vα 또는 Vβ TCR 유전자 또는 Vγ 또는 Vδ TCR 유전자의 일부를 증폭하도록 설계되었는지에 따라 적절하게). 이들 폴리뉴클레오타이드는 유리하게는 후속 클로닝을 위해 특정된 제한 효소 세트에 대해 특이적은 DNA 서열 (즉, 제한 효소 부위)을 포함한다. 선택된 제한 효소는 인간 항체 또는 TCR V-유전자 분절 내에서 절단되지 않도록 선택되어야 한다. 이러한 폴리뉴클레오타이드는 공지되고 공개적으로 이용 가능한 면역글로불린 또는 TCR 유전자 서열 및 제한 효소 데이터베이스 정보에 기초하여 설계될 수 있다. 그러나, 포함되는 바람직한 제한 효소 부위는 Ncol, Hind III, M 및 Notl이다. 이러한 2차 PCR 반응의 생성물은 다양한 V-중쇄, V-경쇄 카파 및 V-경쇄 람다 항체 단편/도메인의 레퍼토리이다. 따라서, 이 유형의 2차 PCR 반응은 일반적으로 대상 발현 라이브러리 포맷이 scFv 또는 Fv 형태일 때 수행되며, 여기서 항체 또는 TCR의 VH 및 VL 또는 Vα 및 V 또는 Vγ 및 Vδ 도메인만이 존재한다.
PCR 생성물은 또한 바코딩된 폴리뉴클레오타이드의 5' 및 3' 말단에 혼성화되는 새로운 프라이머 세트를 이용하여 PCR 반응에 적용될 수 있다. 이들 폴리뉴클레오타이드는 유리하게는 후속 클로닝을 위해 특정된 제한 효소 세트에 특이적인 DNA 서열 (즉, 제한 효소 부위)를 포함할 수 있다. 선택된 제한 효소는 인간 항체 또는 TCR V-유전자 분절 내에서 절단되지 않도록 선택되어야 한다. 이러한 폴리뉴클레오타이드는 공지되고 공개적으로 이용 가능한 면역글로불린 또는 TCR 유전자 서열 및 제한 효소 데이터베이스 정보에 기초하여 설계될 수 있다. 그러나, 포함되는 바람직한 제한 효소 부위는 Ncol, Hind III, Mul 및 Notl이다. 이러한 2차 PCR 반응의 생성물은 다양한 VH, VL 카파 및 VL 람다 항체 단편/도메인 또는 Vα 및 Vβ 또는 Vγ 및 Vδ TCR 단편/도메인의 레퍼토리이다.
당업자는 이 시스템과 함께 중쇄 또는 경쇄 또는 Vα 또는 Vβ 사슬 또는 Vγ 또는 Vδ 사슬 Fv 또는 Fab 단편, 또는 단일-사슬 항체 또는 TCR이 또한 사용될 수 있음을 인식할 것이다. 중쇄 또는 경쇄 또는 Vα 또는 Vβ 사슬 또는 Vγ 또는 Vδ 사슬이 돌연변이화된 후 상보적 사슬이 용액에 첨가될 수 있다. 그 후, 2 개의 사슬은 조합되어 기능성 항체 단편을 형성하도록 허용된다. 무작위적 비-특이적 경쇄 또는 중쇄 또는 Vα 또는 Vβ 사슬 또는 Vγ 또는 Vδ 사슬 서열의 첨가는 다양한 구성원으로 이루어지는 라이브러리를 생성하는 조하벅 시스템의 생산을 허용한다.
본 명세서에서 정의되는 바와 같은 면역-챌린지된 숙주의 B 또는 T 림프구로부터 유래되는 항체 또는 TCR의 가변 중쇄 또는 Vα 사슬 또는 Vγ 사슬 영역, 또는 그의 단편, 및/또는 가변 경쇄 또는 Vβ 사슬 또는 Vδ 사슬 영역, 또는 그의 단편을 포함하는 이러한 클로닝된 단편의 레퍼토리의 라이브러리는 본 발명의 또 다른 측면을 형성한다. 클로닝된 가변 영역을 포함하는 이들 라이브러리는 발현 라이브러리를 형성하기 위해 발현 벡터에 임의로 삽입될 수 있다.
일부 구체예에서, PCR 반응은 단리된 면역 세포 집단에 함유된 다양한 항체 또는 TCR 사슬의 불변 영역의 모두 또는 일부를 보유하도록 설정될 수 있다. 이는, 발현 라이브러리 포맷이 Fab 포맷일 때 바람직하며, 여기서 중쇄 또는 알파 또는 감마 사슬 성분은 VH 또는 Vα 또는 Vγ 및 CH 또는 Cα 또는 Cγ 도메인을 포함하고 경쇄 또는 Vβ 사슬 또는 Vγ 사슬 성분은 VL 또는 Vβ 또는 Vδ 사슬 및 CL 또는 β 또는 δ 도메인을 포함한다. 다시금, 항체 또는 TCR 사슬의 불변 영역의 전부 또는 일부를 포함하는 이러한 클로닝된 단편의 라이브러리는 본 발명의 또 다른 측면을 형성한다.
이들 핵산은 본 발명의 폴리뉴클레오타이드 이외에 서열들을 편리하게 포함할 수 있다. 예를 들어, 하나 이상의 엔도뉴클레아제 제한 부위를 포함하는 다중-클로닝 부위가 핵산에 삽입되어 폴리뉴클레오타이드의 단리를 도울 수 있다. 또한, 번역 가능한 서열은 본 발명의 번역된 폴리뉴클레오타이드의 단리를 돕기 위해 삽입될 수 있다. 예를 들어, 6-히스티딘 마커 서열은 본 발명의 단백질을 정제하는 편리한 수단을 제공한다. 코딩 서열을 제외한 본 발명의 핵산은, 임의로, 본 발명의 폴리뉴클레오타이드의 클로닝 및/또는 발현을 위한 벡터, 어댑터, 또는 링커이다.
폴리뉴클레오타이드의 단리를 돕기 위해, 또는 폴리뉴클레오타이드의 세포로의 도입을 향상시키기 위해, 클로닝 및/또는 발현에서의 그들의 기능을 최적화하는 추가의 서열이 이러한 클로닝 및/또는 발현 서열에 추가될 수 있다. 클로닝 벡터, 발현 벡터, 어댑터 및 링커의 사용은 당업계에 잘 알려져 있다. (예컨대, [Current Protocols in MolecularBiology (CPMB) (Fred M.Ausubel, et al. ed., John Wiley and Sons, Inc.)]; 또는 [J. Sambrook et al., "Molecular Cloning: A Laboratory Manual," 1989, 2nd Ed., Cold Spring Harbour Laboratory Press: New York, N.Y.]참조).
본 명세서에 개시된 라이브러리는 다양한 응용법에 사용될 수 있다. 본 명세서에 사용된 바와 같이, 라이브러리는 복수 개의 분자를 포함한다. 일부 구체예에서, 라이브러리는 복수 개의 폴리뉴클레오타이드를 포함한다. 일부 구체예에서, 라이브러리는 복수 개의 프라이머를 포함한다. 일부 구체예에서, 라이브러리는 하나 이상의 폴리뉴클레오타이드, 앰플리콘 또는 앰플리콘 세트로부터의 복수 개의 서열 판독을 포함한다. 라이브러리는 분석용 샘플을 생성하기 위하여 저장되고 여러 번 사용될 수 있다. 일부 적용법은 예를 들어 다형성 유전자형 분석, RNA 프로세싱 연구 및 본 명세서에 제공된 방법에 따라 시퀀싱을 수행하는 클론 대표를 선택하는 것을 포함한다. 복수 개의 폴리뉴클레오타이드, 예컨대 프라이머를 포함하는 라이브러리 또는 시퀀싱 또는 증폭을 위한 라이브러리가 생성될 수 있으며, 여기서 복수 개의 폴리뉴클레오타이드는 적어도 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 15000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000,14,000,15,000, 16,000, 17,000, 18,000, 19,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, 1,000,000, 50,000,000, 100,000,000 개 또는 그 이상의 분자 바코드 또는 용기 바코드를 포함한다. 일부 구체예에서, 폴리뉴클레오타이드의 라이브러리는 복수 개의 적어도 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1500, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10,000, 11,000, 12,000, 13,000, 14,000, 15,000, 16,000, 17,000, 18,000, 19,000, 20,000, 30,000, 40,000, 50,000, 60,000, 70,000, 80,000, 90,000, 100,000, 200,000, 300,000, 400,000, 500,000, 600,000, 700,000, 800,000, 900,000, 1,000,000, 50,000,000, 100,000,000 개 또는 그 이상의 고유한 폴리뉴클레오타이드를 포함하고, 여기서 각 고유한 폴리뉴클레오타이드는 하나 이상의 분자 바코드 및 용기 바코드를 포함한다.
III. 전사체 분석
일부 구체예에서, 제공된 방법은 세포에 대한 전사체 정보를 설명하는데 사용될 수 있으며, 이는 특정 세포의 표적 폴리뉴클레오타이드 서열, 예를 들어 항체 또는 TCR의 포착과 조합될 수 있다. 일부 구체예에서, 표적 폴리뉴클레오타이드 서열에 의해 식별된 세포 또는 복수 개의 세포는 예컨대 세포의 특정 상태, 특징 또는 속성과 관련하여 그들의 전사적 (transcriptional) 세포 상태에 의하여 특징 지워질 수 있다. 일부 구체예에서, 세포의 개별화된 전사체 프로파일이 결정되고, 세포의 하나 이상의 특징과 관련된 정보를 제공할 수 있다. 이러한 특징의 예는 활성화 상태, 증식 상태, 고갈 상태, 전이 상태, 세포 주기 단계 또는 세포의 기능적 또는 표현형적 상태와 관련된 다른 파라미터를 포함하지만, 이에 국한되지는 않는다.
일부 구체예에서, 전사적 상태 정보는 원하는 또는 흥미로운 반응을 나타내는 특정 표적 유전자, 예를 들어 항체 또는 TCR을 발현하는 세포를 확인하는데 사용될 수 있다. 일부 측면에서, 제공된 방법은, 세포의 전사체 프로파일을 세포로부터 증폭되거나 시퀀싱된 표적 폴리뉴클레오타이드, 예를 들어, 항체 또는 TCR에 매칭시키는 것을 허용한다. 특정 구체예에서, 표적 폴리뉴클레오타이드의 전 사체 정보 및 서열은 동일한 용기 바코드를 갖는 증폭되고 시퀀싱된 전사체 및 표적 폴리뉴클레오타이드의 존재에 기해 매치되는데, 이는 동일한 세포로부터 유래된 전사체 프로파일 및 표적 폴리뉴클레오타이드를 식별한다.
전사체 데이터를 처리하기 위한 다양한 방법이 당업계에 공지되어 있다. 일부 측면에서, 상기 방법들로부터 획득된 데이터는 맵 상에서 시각화될 수 있다. 샘플로부터의 표적의 수 및 위치에 대한 맵은 본 명세서에 기재된 방법을 사용하여 생성된 정보를 사용하여 구축될 수 있다. 맵은 표적의 물리적 위치를 찾는데 사용할 수 있다. 맵은 다수 표적의 위치를 식별하는데 사용될 수 있다.
일부 구체예에서, 시스템은 제공된 방법들로부터 생성된 서열 데이터 세트들에 대한 데이터 분석을 제공하기 위한 코드를 포함하는 컴퓨터-판독가능 매체를 포함한다. 데이터 분석 소프트웨어에 의해 제공될 수 있는 데이터 분석 기능성의 예는 (i) 폴리뉴클레오타이드 라이브러리를 시퀀싱함으로써 제공되는 샘플 용기 바코드, 분자 바코드 및 표적 서열 또는 전사체 데이터에 대한 디코딩/디멀티플렉싱을 위한 알고리즘, (ii) 데이터를 기반으로 세포당 유전자당 판독 수 및 세포당 유전자당 고유한 전사물 분자 수를 결정하고, 요약 표를 생성하기 위한 알고리즘, (iii) 예컨대, 유전자 발현 데이터에 의한 세포의 클러스터링을 위한 또는 세포당 유전자당 전사물 분자의 수 등을 결정하기 위한 신뢰 구간을 예측하기 위한 서열 데이터의 통계적 분석 (iv) 예컨대, 주성분 분석, 계층적 클러스터링, k-평균 클러스터링, 자가-조직화 맵, 신경 네트워크 등을 이용한, 희귀 세포의 서브집단을 식별하기 위한 알고리즘, (v) 공지의 기준 서열 및 돌연변이 검출, 다형성 마커 및 스플라이스 변이체를 이용한 유전자 서열 데이터 정렬을 위한 서열 정렬 능력, 및 (vi) 증폭 또는 시퀀싱 오류를 보상하기 위한 분자 표지의 자동화된 클러스터링을 포함하지만 이에 국한되는 것은 아니다.
일부 구체예에서, 컴퓨터적 프로그램이 사용되어 전사체 어셈블리를 생성할 수 있다. 짧은-판독 어셈블리용 예시적 컴퓨터 프로그램은 [Robertson et al., Nat Methods. 2010;7:909-12]; [Grabherr et al., Nat Biotechnol. 2011;29:644-52]; [Schulz et al., Bioinformatics. 2012;28:1086-92], 및 [Xie et al., Bioinformatics. 2014;30:1660-6]에 기재된 것들을 포함한다. 전사체 어셈블리는, 전사물들 간 발현 수준의 큰 변이, 서열 편향 및 대안적 스플라이싱으로 인하여 어려울 수 있다. 따라서, k-량체 길이에 기초하여 전사체 어셈블리를 병합하는 것 또는 고정된 k-량체 값을 사용하는 것이 상이한 전사물 존재량 수준을 상쇄하고 전사체 어셈블리를 개선시키는데 사용될 수 있다 (예를 들어, [Robertson et al., Nat Methods. 2010;7:909-12], [Grabherr et al., Nat Biotechnol. 2011;29:644-52] 및 [Surget-Groba Genome Res. 2010;20:1432-40] 참조).
일부 구체예에서, 시판 소프트웨어가 데이터 분석의 전부 또는 일부를 수행하는데 사용될 수 있다. 일부 구체예에서, 데이터 분석 소프트웨어는 시퀀싱 결과를 유용한 그래픽 포맷으로 출력하기 위한 옵션, 예를 들어, 세포 집합체의 각 세포에 존재하는 하나 이상의 유전자의 카피 수를 나타내는 히트 맵 (heat map)을 포함할 수 있다. 일부 구체예에서, 데이터 분석 소프트웨어는, 예를 들어 세포 집합체의 각 세포에 존재하는 하나 이상의 유전자의 카피 수를 세포 유형, 희귀 세포의 유형 또는 특정 질환 또는 질병 상태를 갖는 대상체로부터 유래한 세포와 상관시킴으로써 시퀀싱 결과로부터의 생물학적 의미를 추출하기 위한 알고리즘을 더 포함할 수 있다. 일부 구체예에서, 데이터 분석 소프트웨어는 여러 생물학적 샘플에 걸쳐 세포 집단을 비교하기 위한 알고리즘을 더 포함할 수 있다.
일부 구체예에서, 데이터 분석 기능성 전부는 단일 소프트웨어 패키지 내에 패키징될 수 있다. 일부 구체예에서, 데이터 분석 능력에 대한 완전한 세트는 소프트웨어 패키지 모음을 포함할 수 있다. 일부 구체예에서, 데이터 분석 소프트웨어는 분석 기기 시스템과 독립적으로 사용자가 이용할 수 있는 독립형 패키지일 수 있다. 일부 구체예에서, 소프트웨어는 웹-기반일 수 있으며, 사용자가 데이터를 공유할 수 있게 한다.
일부 예에서, 하나 이상의 상이한 세포 집단을 식별하기 위해 클러스터 분석이 수행될 수 있다. 일부 예에서, 세포 집단은 하나 이상의 표적 유전자의 발현에 기초하여 클러스터링된다. 전사적 세포 상태를 나타내는, 공지된 유전자 또는 전사물의 존재, 상향-조절 또는 하향-조절은 복수 개의 세포 내에서 세포를 클러스터링하는데 사용될 수 있다.
일부 구체예에서, 대상 전사체 유전자는 그들의 용기 바코드에 의해 식별되고, 대상인 전장 표적 분자, 예를 들어 항체 또는 TCR의 증폭 및 시퀀싱의 결과와 매칭되거나 결합된다. 따라서, 제공된 방법의 실시에 의해, 각각의 용기 바코드는 매칭되거나 또는 유전자 카운트 (예를 들어, 전사체) 및 표적 분자 (예를 들어, 전장 항체 또는 TCR) 정보를 이용하여 주석이 달릴 수 있다.
일부 구체예에서, 전사체에 존재하는 핵산 서열로 나타나는 발현 프로파일이 생성될 수 있다. 발현 프로파일은 세포의 서브세트, 예컨대 하나 이상의 표적 유전자를 발현하고 용기 바코드를 공유하는 세포에 대하여 생성될 수 있다.
IV. 진단
일부 구체예에서, 방법은 대상체에서 질환, 장애, 증상 및/또는 질병 상태를 진단, 예후, 모니터링, 치료, 개선 및/또는 예방하는 것을 더 포함할 수 있다. 일부 구체예에서, 방법은 표적 폴리뉴클레오타이드의 존재, 부재 또는 수준 및/또는 특정 전사적 세포 상태, 예컨대 상기 본 명세서에서 기술된 세포 상태에 기초하여 대상체에서 질환, 장애, 증상 및/또는 질병 상태를 진단, 예후, 모니터링, 치료, 개선 및/또는 예방하는 것을 더 포함할 수 있다. 일부 구체예에서, 방법은 하나 이상의 표적 폴리뉴클레오타이드의 존재, 부재, 또는 수준 및/또는 하나 이상의 세포의 전사적 상태에 기초하여 대상체에서 질환, 장애, 증상 및/또는 질병 상태를 진단, 예후, 모니터링, 치료, 개선 및/또는 예방하는 것을 더 포함할 수 있다.
일부 구체예에서, 방법은 본 명세서에서 기술되는 방법을 사용하여 얻어지는 하나 이상의 서열의 존재, 부재, 수준 또는 서열에 기초하여 대상체에서 질환, 장애, 증상 및/또는 질병 상태를 진단, 예후, 모니터링, 치료, 개선 및/또는 예방하는 것을 더 포함할 수 있다. 예를 들어, 질환의 진단은 본 명세서에 기재된 방법을 사용하여 수득된 변이체 서열의 존재, 부재, 수준 또는 서열에 기초하여 이루어질 수 있다. 일부 구체예에서, 방법은 본 명세서에서 기술되는 방법을 사용하여 얻어지는 하나 이상의 서열 판독의 존재, 부재, 수준, 또는 서열에 기초하여 대상체에서 질환, 장애, 증상 및/또는 질병 상태를 진단, 예후, 모니터링, 치료, 개선 및/또는 예방하는 것을 더 포함할 수 있다. 일부 구체예에서, 방법은 본 명세서에서 기술되는 방법을 사용하여 얻어지는 하나 이상의 컨센서스 서열의 존재, 부재, 수준 또는 서열에 기초하여 대상체에서 질환, 장애, 증상 및/또는 질병 상태를 진단, 예후, 모니터링, 치료, 개선 및/또는 예방하는 것을 더 포함할 수 있다. 일부 구체예에서, 방법은 샘플에서 표적 폴리뉴클레오타이드의 수준 (예컨대, 양 또는 농도)의 결정에 기초하여 대상체에서 질환, 장애, 증상 및/또는 질병 상태를 진단, 예후, 모니터링, 치료, 개선 및/또는 예방하는 것을 더 포함할 수 있다. 샘플에서 표적 폴리뉴클레오타이드의 수준은 하나 이상의 서열 판독, 서열, 컨센서스 서열 또는 이들의 임의의 조합에 기초하여 결정될 수 있다. 샘플에서 복수 개의 표적 폴리뉴클레오타이드 각각의 수준은 본 명세서에 기재된 방법을 사용하여 결정될 수 있다. 샘플에서 복수 개의 표적 폴리뉴클레오타이드 각각의 수준은 복수 개 내 각각의 표적 폴리뉴클레오타이드의 다수의 서열 판독, 서열, 컨센서스 서열, 또는 이들의 임의의 조합에 기초하여 결정될 수 있다. 예를 들어, 본 명세서에 기재된 방법을 사용하여 제1 표적 폴리뉴클레오타이드의 수준 및 제2 표적 폴리뉴클레오타이드의 수준을 결정할 수 있다.
일부 구체예에서, 복수 개의 표적 폴리뉴클레오타이드 중 제1 및 제2 표적 폴리뉴클레오타이드는 동일하다. 예를 들어, 제1 표적 폴리뉴클레오타이드는 mRNA 분자의 제1 카피를 포함할 수 있고, 제2 표적 폴리뉴클레오타이드는 mRNA 분자의 제2 카피를 포함할 수 있다. 일부 구체예에서, 제1 및 제2 표적 폴리뉴클레오타이드는 상이하다. 예를 들어, 제1 표적 폴리뉴클레오타이드는 제1 mRNA 분자를 포함할 수 있고 제2 표적 폴리뉴클레오타이드는 상기 제1 mRNA 분자와 상이한 유전자로부터 전사된 제2 mRNA 분자를 포함할 수 있다. 예를 들어, 제1 표적 폴리뉴클레오타이드는 제1 대립 유전자를 포함할 수 있고, 제2 표적 폴리뉴클레오타이드는 제2 대립 유전자를 포함할 수 있다. 예를 들어, 제1 표적 폴리뉴클레오타이드는 야생형 서열을 포함할 수 있고, 제2 표적 폴리뉴클레오타이드는 변이체 서열을 포함할 수 있다.
일부 구체예에서, 방법은 적어도 50%의 신뢰도로 질환, 장애, 증상 및/또는 질병 상태를 갖는 대상체를 진단 또는 예후하는 것을 더 포함할 수 있다. 예를 들어, 질환, 장애, 증상 및/또는 질병 상태를 갖는 대상체에 대한 진단 또는 예후는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100% 신뢰도로 결정될 수 있다. 일부 구체예에서, 질환, 장애, 증상 및/또는 질병 상태를 갖는 대상체에 대한 진단 또는 예후는 50% - 100% 신뢰도로 결정될 수 있다. 예를 들어, 질환, 장애, 증상 및/또는 질병 상태를 갖는 대상체에 대한 진단 또는 예후는 60%-100%, 70%-100%, 80%-100%, 90%-100%, 50%-90%, 50%-80%, 50%- 70%, 50%-60%, 60%-90%, 60%-80%, 60%-70%, 70%-90%, 70%-80%, 또는 80%-90% 신뢰도로 결정될 수 있다.
일부 구체예에서, 대상체에서 표적 폴리뉴클레오타이드, 예컨대 바이오마커의 존재, 부재, 수준, 서열 또는 이들의 임의의 조합은 적어도 50%의 신뢰도로 결정될 수 있다. 예를 들어, 대상체에서 표적 폴리뉴클레오타이드의 존재, 부재, 수준, 서열 또는 이들의 임의의 조합은 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100% 신뢰도로 결정될 수 있다. 일부 구체예에서, 대상체에서 표적 폴리뉴클레오타이드의 존재, 부재, 수준, 서열 또는 이들의 임의의 조합은 50%-100% 신뢰도로 결정될 수 있다. 예를 들어, 대상체에서 표적 폴리뉴클레오타이드의 존재, 부재, 수준, 서열 또는 이들의 임의의 조합은 60%- 100%, 70%-100%, 80%-100%, 90%-100%, 50%-90%, 50%-80%, 50%-70%, 50%-60%, 60%-90%,60%-80%, 60%-70%, 70%-90%, 70%-80%, 또는 80%-90% 신뢰도로 결정될 수 있다.
V. 효소
본 명세서에 개시된 방법 및 키트는 하나 이상의 효소를 포함할 수 있다. 효소의 예는 리가아제, 역전사 효소, 중합 효소 및 제한 뉴클레아제를 포함하지만 이에 국한되지는 않는다.
일부 구체예에서, 어댑터의 폴리뉴클레오타이드로의 부착은 하나 이상의 리가아제의 사용을 포함한다. 리가아제의 예는 DNA 리가아제, 예컨대 DNA 리가아제 I, DNA 리가아제 III, DNA 리가아제 IV 및 T4 DNA 리가아제, 및 RNA 리가아제, 예컨대 T4 RNA 리가아제 I 및 T4 RNA 리가아제 II를 포함하지만, 이에 국한되는 것은 아니다.
본 명세서에 개시된 방법 및 키트는 하나 이상의 역전사 효소의 사용을 더 포함할 수 있다. 일부 구체예에서, 역전사 효소는 HIV-1 역전사 효소, MMLV 역전사 효소, AMV 역전사 효소 및 텔로머라아제 역전사 효소이다. 일부 구체예에서, 역전사 효소는 M-MLV 역전사 효소이다.
일부 구체예에서, 본 명세서에 개시된 방법 및 키트는 하나 이상의 프로테아제의 사용을 포함한다.
일부 구체예에서, 본 명세서에 개시된 방법 및 키트는 하나 이상의 중합 효소의 사용을 포함한다. 중합 효소의 예는 DNA 중합 효소 및 RNA 중합 효소를 포함하지만, 이에 국한되지는 않는다. 일부 구체예에서, DNA 중합 효소는 DNA 중합 효소 I, DNA 중합 효소 II, DNA 중합 효소 III 홀로엔자임 및 DNA 중합 효소 IV이다. 시판 DNA 중합 효소는 Bst 2.0 DNA Polymerase, Bst 2.0 WarmStartTM DNA Polymerase, Bst DNA Polymerase, Sulfolobus DNA Polymerase IV, Taq DNA Polymerase, 9°NTMm DNA Polymerase, Deep VentRTM (exo-) DNA Polymerase, Deep VentRTM DNA Polymerase, Hemo KlenTaqTM, LongAmp® Taq DNA Polymerase, OneTaq® DNA Polymerase, Phusion® DNA Polymerase, Q5TM High-Fidelity DNA Polymerase, TherminatorTMγ DNA Polymerase, TherminatorTM DNA Polymerase, TherminatorTM II DNA Polymerase, TherminatorTM III DNA Polymerase, VentR® DNA Polymerase, VentR® (exo-) DNA Polymerase, Bsu DNA Polymerase, phi29 DNA Polymerase, T4 DNA Polymerase, T7 DNA Polymerase, Terminal Transferase, Titanium® Taq Polymerase, KAPA Taq DNA Polymerase 및 KAPA Taq Hot StartDNA Polymerase를 포함하나 이에 국한되지는 않는다.
일부 구체예에서, 중합 효소는 RNA 중합 효소, 예컨대 RNA 중합 효소 I, RNA 중합 효소 II, RNA 중합 효소 III, 대장균 폴리(A) 중합 효소, phi6 RNA 중합 효소 (RdRP), 폴리(U) 중합 효소, SP6 RNA 중합 효소 및 T7 RNA 중합 효소이다.
VI. 키트 및 추가적인 시약
[010] 상기 제공된 방법을 수행하기 위한 하나 이상의 시약을 포함하는 제조품 또는 키트가 본 명세서에서 제공된다. 키트는 하나 이상의 요소, 예컨대 사용 지침서, 장치 및 추가 시약 (예컨대, 시약 또는 성분의 희석 및/또는 재구성을 위한 멸균수 또는 염 용액) 및 상기 방법의 실시를 위한 요소, 예컨대 튜브, 컨테이너 및 주사기를 임의로 포함할 수 있다. 일부 구체예에서, 키트는 샘플 수집 또는 샘플의 제조 및 처리를 위한 시약을 더 함유할 수 있다. 일부 구체예에서, 키트는 키트의 시약 및 성분의 패키징을 위한 패키징 재료를 포함하는 제조 물품으로서 제공될 수 있다. 예를 들어, 키트는 컨테이너, 병, 튜브, 바이알 및 상기 키트의 요소를 분리 또는 조직화하기에 적합한 임의의 패키징 재료를 함유할 수 있다.
본 명세서에 개시된 방법 및 키트는 하나 이상의 시약의 사용을 포함할 수 있다. 시약의 예는 PCR 시약, 연결 시약, 역전사 시약, 효소 시약, 혼성화 시약, 샘플 제조 시약, 친화성 포착 시약, 고체 지지체, 예컨대 비드, 및 핵산 정제 및/또는 단리용 시약을 포함하지만 이에 국한되는 것은 아니다.
고체 지지체는 사실상 임의의 불용성 또는 고체 물질을 포함할 수 있으며, 종종 물에서 불용성인 고체 지지체 조성물이 선택된다. 예를 들어, 고체 지지체는 실리카 겔, 유리 (예를 들어, 제어된-기공 유리 (CPG)), 나일론, Sephadex®, Sepharose®, 셀룰로오스, 금속 표면 (예를 들어, 강철, 금, 은, 알루미늄, 실리콘 및 구리), 자성 물질, 플라스틱 물질 (예를 들어, 폴리에틸렌, 폴리프로필렌, 폴리아마이드, 폴리에스테르, 폴리비닐리덴 디플루오라이드 (PVDF)) 등등을 포함하거나, 본질적으로 이들로 구성될 수 있다. 구체예에 따라 사용하기 위한 비드의 예는 비드가 핵산 분자와 상호 작용할 수 있게 하는 친화성 모이어티를 포함할 수 있다. 고체 상 (예를 들어, 비드)는 결합 쌍의 구성원 (예를 들어, 아비딘, 스트렙타비딘 또는 이의 유도체)를 포함할 수 있다. 예를 들어, 비드는 스트렙타비딘-코팅된 비드일 수 있고 비드 상에 고정을 위한 핵산 분자는 비오틴 모이어티를 포함할 수 있다. 일부 경우에, 각각의 폴리뉴클레오타이드 분자는 폴리뉴클레오타이드를 더 안정화시키기 위해 비오틴과 같은 2 개의 친화성 모이어티를 포함할 수 있다. 비드는, 핵산을 고정하는데 사용하기 위한 또는 하류 스크리닝 또는 선택 과정에 사용될 수 있는 추가적인 특징을 포함할 수 있다. 예를 들어, 비드는 결합 모이어 티, 형광 표지 또는 형광 소광제를 포함할 수 있다. 일부 경우, 비드는 자성일 수 있다. 일부 경우, 고체 지지체는 비드이다. 비드의 예는 스트렙타비딘 비드, 아가 로오스 비드, 자성 비드, Dynabeads®, MACS® 마이크로비드, 항체 접합 비드 (예를 들어, 항-면역글로불린 마이크로비드), 단백질 A 접합 비드, 단백질 G 접합 비드, 단백질 A/G 접합 비드, 단백질 L 접합 비드, 폴리뉴클레오타이드-dT 접합 비드, 실리카 비드, 실리카-유사 비드, 항-비오틴 마이크로비드, 항-플루오로크롬 마이크로비드 및 BcMag™ Carboxy-Terminated Magnetic Bead를 포함하지만 이에 국한되는 것은 아니다. 비드 또는 입자는 팽윤성 (예를 들어, Wang 수지와 같은 중합성 비드) 또는 비-팽윤성 (예를 들어, CPG)일 수 있다. 일부 구체예에서, 고체 상은 실질적으로 친수성이다. 일부 구체예에서, 고체 상 (예를 들어, 비드)는 실질적으로 소수성이다. 일부 구체예에서, 고체 상은 결합 쌍의 구성원 (예를 들어, 아비딘, 스트렙타비딘 또는 그의 유도체)를 포함하고 실질적으로 소수성이거나 실질적으로 친수성이다. 일부 구체예에서, 고체 상은 결합 쌍의 구성원 (예를 들어, 아비딘, 스트렙타비딘 또는 이의 유도체)를 포함하고 고체 지지체 mg당 유리 포획 제제 (예를 들어, 유리 비오틴)의 약 1350 피코몰보다 큰 결합 능력을 갖는다. 일부 구체예에서, 결합 쌍의 구성원을 포함하는 고체 상의 결합능은 고체 지지체 mg당 유리 포획 제제의 800, 900, 1000, 1100, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1600, 1800, 2000 피코몰보다 크다. 본 발명에 적합한 비드의 다른 예는 금 콜로이드 또는 폴리스티렌 비드 또는 실리카 비드와 같은 비드이다. 실질적으로 임의의 비드 반경이 사용될 수 있다. 비드의 예는 150 나노미터 내지 10 미크론 범위의 반경을 갖는 비드를 포함할 수 있다. 다른 크기도 또한 사용될 수 있다.
본 명세서에 개시된 방법 및 키트는 하나 이상의 완충제의 사용을 포함할 수 있다. 완충제의 예는 세척 완충제, 연결 완충제, 혼성화 완충제, 증폭 완충제 및 역전사 완충제를 포함하나, 이에 제한되지는 않는다. 일부 구체예에서, 혼성화 완충제는 시판 완충제, 예컨대 TMAC Hyb 용액, SSPE 혼성화 용액 및 ECONOTM 혼성화 완충제이다. 본 명세서에 개시된 완충제는 하나 이상의 변성제를 포함할 수 있다.
본 명세서에 개시된 방법 및 키트는 하나 이상의 캐리어의 사용을 포함할 수 있다. 캐리어는 본 명세서에 개시된 하나 이상의 반응 (예를 들어, 연결 반응, 역전사, 증폭, 혼성화)의 효율을 증가시키거나 향상시킬 수 있다. 캐리어는 분자 또는 이의 임의의 생성물 (예를 들어, 폴리뉴클레오타이드 및/또는 앰플리콘)의 비-특이적 손실을 감소시키거나 방지할 수 있다. 예를 들어, 캐리어는 표면에 대한 흡수를 통해 폴리뉴클레오타이드의 비-특이적 손실을 감소시킬 수 있다. 캐리어는 폴리뉴클레오타이드의 표면 또는 기판 (예를 들어, 컨테이너, 에펜도르프 튜브, 피펫 팁)에 대한 친화성을 감소시킬 수 있다. 또는, 캐리어는 폴리뉴클레오타이드의 표면 또는 기판 (예를 들어, 비드, 어레이, 유리, 슬라이드, 또는 칩)에 대한 친화성을 증가시킬 수 있다. 캐리어는 폴리뉴클레오타이드를 분해로부터 보호할 수 있다. 예를 들어, 캐리어는 리보뉴클레아제로부터 RNA 분자를 보호할 수 있다. 또는, 캐리어는 DNase로부터 DNA 분자를 보호할 수 있다. 캐리어의 예는 DNA 및/또는 RNA와 같은 폴리뉴클레오타이드, 또는 폴리펩타이드를 포함하나, 이에 제한되지는 않는다. DNA 캐리어의 예는 플라스미드, 벡터, 폴리아데닐화된 DNA 및 DNA 폴리뉴클레오타이드를 포함한다. RNA 캐리어의 예는 폴리아데닐화된 RNA, 파지 RNA, 파지 MS2 RNA, 대장균 RNA, 효모 RNA, 효모 tRNA, 포유 동물 RNA, 포유 동물 tRNA, 짧은 폴리아데닐화된 합성 리보뉴클레오타이드 및 RNA 폴리뉴클레오타이드를 포함한다. RNA 캐리어는 폴리아데닐화된 RNA일 수 있다. 또는 RNA 캐리어는 비-폴리아 데닐화된 RNA일 수 있다. 일부 구체예에서, 캐리어는 박테리아, 효모 또는 바이러스로부터 유래된다. 예를 들어, 캐리어는 박테리아, 효모 또는 바이러스로부터 유래된 폴리뉴클레오타이드 또는 폴리펩타이드일 수 있다. 예를 들어, 캐리어는 바실러스 서브틸리스 (Bacillus subtilis)로부터의 단백질이다. 다른 예에서, 캐리어는 대장균으로부터의 폴리뉴클레오타이드이다. 또는, 캐리어는 포유 동물 (예를 들어, 인간, 마우스, 염소, 랫트, 소, 양, 돼지, 개, 또는 토끼), 조류, 양서류 또는 파충류로부터의 폴리뉴클레오타이드 또는 펩타이드이다.
본 명세서에 개시된 방법 및 키트는 하나 이상의 대조군제 (control agent)의 사용을 포함할 수 있다. 대조군제는 대조군 폴리뉴클레오타이드, 불활성 효소 및/또는 비-특이적 경쟁자를 포함할 수 있다. 또는, 대조군제는 브라이트 혼성화, 브라이트 프로브 대조군, 핵산 주형, 스파이크-인 대조군, PCR 증폭 대조군을 포함한다. PCR 증폭 대조군은 양성 대조군일 수 있다. 다른 경우에, PCR 증폭 대조군은 음성 대조군이다. 핵산 주형 대조군은 공지된 농도일 수 있다. 대조군제는 하나 이상의 표지를 포함할 수 있다.
스파이크-인 대조군은 반응 또는 샘플에 첨가되는 주형일 수 있다. 예를 들어, 스파이크-인 주형은 증폭 반응에 첨가될 수 있다. 스파이크-인 주형은 제1 증폭 사이클 후 언제든지 증폭 반응에 첨가될 수 있다. 일부 구체예에서, 스파이크-인 주형은 사이클 수 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45 또는 50 후에 증폭 반응에 첨가된다. 스파이크-인 주형은 최종 증폭 사이클 전에 언제든지 증폭 반응에 첨가될 수 있다. 스파이크-인 주형은 하나 이상의 뉴클레오타이드 또는 핵산 염기쌍을 포함할 수 있다. 스파이크-인 주형은 DNA, RNA 또는 이들의 임의의 조합을 포함할 수 있다. 스파이크-인 주형은 하나 이상의 표지를 포함할 수 있다.
본 명세서에서 개시되는 것은, 본 명세서에서 개시되는 방법 및 조성물에 대하여 사용될 수 있거나, 그와 함께 사용될 수 있거나, 그의 제조에 사용될 수 있는 분자, 물질, 조성물 및 요소이거나, 그 생성물이다. 이들 물질의 조합, 서브세트, 상호 작용, 그룹 등이 개시되는 경우 그리고 이들 분자와 화합물들에 대한 각각의 다양한 개별적 및 집합적 조합 및 순열에 대한 특정한 언급이 명시적으로 개시될 수 없는 동안, 각각은 본 명세서에서 구체적으로 고려되고 기술된다는 것이 이해된다. 예를 들어, 뉴클레오타이드 또는 핵산이 개시되고 논의되며, 상기 뉴클레오타이드 또는 핵산을 포함하는 다수의 분자에 행하여질 수 있는 다수의 변형이 논의된다면, 구체적으로 달리 표시된 바 없다면 뉴클레오타이드 또는 핵산 및 가능한 변형에 대한 각각의 그리고 모든 조합 및 순열이 구체적으로 고려된다. 이 개념은, 개시된 방법 및 조성물의 제조 및 사용 방법의 단계를 포함하지만 이로 제한되지 않는 본 출원의 모든 측면에 적용된다. 따라서, 수행될 수 있는 다양한 추가 단계들이 있다면, 이들 추가 단계들 각각은 개시된 방법들의 임의의특정 구체예 또는 구체예들의 조합으로 수행될 수 있고, 이러한 각각의 조합은 구체적으로 고려되고 개시된 것으로 간주되어야 한다는 것이 이해된다.
본 명세서에 개시된 일부 구체예가 본 명세서에 도시되고 설명되었지만, 이러한 구체예는 단지 예시 방식으로서 제공된다. 본 명세서에 제공된 개시 내용을 벗어나지 않는 다수의 변형, 변경 및 대체가 당업자에게 떠오를 것이다. 본 명세서에 기술된 방법을 실시하는데 있어서 본 명세서에 기술된 구체예에 대한 다양한 대안이 이용될 수 있음을 이해해야 한다.
달리 설명되지 않는 한, 본 명세서에 사용된 모든 기술적 및 과학적 용어는 본 명세서가 속하는 기술 분야의 통상의 기술자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 하기 참조는 본 명세서에서 사용될 수 있는 방법 및 조성물의 구체예를 포함한다: [The Merck Manual of Diagnosis and Therapy, 18th Edition, published by Merck ResearchLaboratories, 2006 (ISBN 0-91 19102)]; [Benjamin Lewin, Genes IX, published by Jones & Bartlett Publishing, 2007 (ISBN-13: 9780763740634)]; [Kendrew et al. (eds.), The Encyclopedia of Mol.Biology, published by Blackwell Science Ltd., 1994 (ISBN 0-632-02182-9)]; 및 [Robert A. Meyers(ed.), Mol. Biology and Biotechnology: a Comprehensive Desk Reference, published by VCHPublishers, Inc., 1995 (ISBN 1-56081-569-8)].
본 명세서의 표준 방법들은, 예컨대 [Maniatis et al,Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold SpringHarbor, N.Y., USA (1982)]; [Sambrook et al., Molecular Cloning: A Laboratory Manual (2 ed.), ColdSpring Harbor Laboratory Press, Cold Spring Harbor, N.Y., USA (1989)]; [Davis et al, BasicMethods in Molecular Biology, Elsevier Science Publishing, Inc., New York, USA (1986)]; 또는 [Methods in Enzymology: Guide to Molecular Cloning Techniques Vol. 152, S. L. Berger and A. R.Kimmerl (eds.), Academic Press Inc., San Diego, USA (1987)], [Current Protocols in MolecularBiology (CPMB) (Fred M.Ausubel, et al. ed., John Wiley and Sons, Inc.)], [Current Protocols in Protein Science (CPPS) (John E.Coligan, et. al., ed., John Wiley and Sons, Inc.)], [Current Protocols in Immunology (CPI) (John E.Coligan, et. al., ed. John Wiley and Sons, Inc.)], [Current Protocols in Cell Biology (CPCB) (Juan S.Bonifacino et. al. ed., John Wiley and Sons, Inc.)], [Culture of Animal Cells: A Manual of Basic Technique by R. Ian Freshney, Publisher: Wiley-Liss; 5th edition (2005)], 및 [Animal Cell Culture Methods (Methods in Cell Biology, Vol. 57, Jennie P. Mather and David Barnes editors, Academic Press, 1st edition, 1998)]에 개시되어 있다.
VII. 정의
본 명세서에서 사용되는 용어는 단지 특정 경우를 설명하는 목적의 것이며 제한하는 것으로 의도되지 않는다. 달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 용어, 표기법 및 다른 기술적 및 과학적 용어 또는 용어들은 청구되는 대상이 속하는 기술 분야의 당업자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는 것으로 의도된다. 일부 경우에, 일반적으로 이해되는 의미를 갖는 용어는 본 명세서에서 명확성 및/또는 준비된 참조를 위해 정의되며, 본 명세서에서의 이러한 정의의 포함은 반드시 당 기술 분야에서 일반적으로 이해되는 것과 실질적으로 차이가 있는 것으로 해석되어야 하는 것은 아니다.
본 명세서에서 사용되는 바, 단수 형태 "a", "an" 및 "the"는 문맥 상 명백하게 다르게 나타내지 않는 한 복수 형태도 포함하는 것으로 의도된다. 또한, 용어 "포함하는 (including)", "포함하다 (include)", "갖는 (having)", "가지다 (has)", "갖는 (with)" 또는 이들의 변형은 상세한 설명 및/또는 청구 범위 중 어느 하나에서 사용되는 한, 그러한 용어는 용어 "포함하는 (comprising)"과 유사한 방식으로 포함되는 것으로 의도된다.
"약" 또는 "대략"이라는 용어는 당업자에 의해 결정된 특정 값에 대해 허용 가능한 오차 범위 내를 의미할 수 있으며, 이는 부분적으로 어떻게 그 값이 측정 또는 결정되는지, 즉, 측정 시스템의 한계에 의존할 것이다. 예를 들어, "약"은 당업계의 관행에 따라 1 또는 1 초과의 표준 편차를 의미할 수 있다. 또는, "약"은 주어진 값의 최대 20%, 최대 10%, 최대 5%, 또는 최대 1%의 범위를 의미할 수 있다. 또는, 특히 생물학적 시스템 또는 공정과 관련하여, 상기 용어는 배수 (order of magnitude) 내, 5 배 이내, 보다 바람직하게는 2 배 이내의 값을 의미 할 수 있다. 특정 값이 본원 및 청구 범위에 기술되는 경우, 달리 언급되지 않는 한, 특정 값에 대해 허용 가능한 오류 범위 내를 의미하는 "약"이라는 용어가 가정되어야 한다.
용어 "폴리펩타이드" 및 "단백질"은 아미노산 잔기의 중합체를 지칭하기 위해 상호 교환적으로 사용되며, 최소 길이로 제한되지 않는다. 폴리펩타이드, 예컨대 제공되는 항체 및 항체 사슬 및 다른 펩타이드, 예를 들어, 링커 및 결합 펩타이드는 천연 및/또는 비-천연 아미노산 잔기를 포함하는 아미노산 잔기를 포함할 수 있다. 상기 용어는 또한 폴리펩타이드의 발현-후 변형, 예를 들어 글리코실화, 시알릴화, 아세틸화, 인산화 등등을 포함한다. 일부 측면에서, 폴리펩타이드는 단백질이 원하는 활성을 유지하는 한, 본래의 또는 천연 서열에 대한 변형을 함유할 수 있다. 이러한 변형은 부위-지정 돌연변이화를 통해서와 같이 의도적일 수 있거나, 또는 단백질을 생성하는 숙주의 돌연변이 또는 PCR 증폭으로 인한 오류를 통해서와 같이 우발적일 수 있다.
중합 효소 연쇄 반응 (PCR)은 이중 가닥 폴리뉴클레오타이드의 상보 적 가닥의 동시 프라이머 연장에 의한 폴리뉴클레오타이드 서열의 시험관 내 증폭 반응을 지칭한다. PCR 반응은 프라이머 결합 부위 옆에 있는 주형 폴리뉴클레오타이드의 카피를 생성한다. 프라이머가 2 개인 결과는, 각 사이클마다 양쪽 가닥이 복제되기 때문에 각 사이클마다 양쪽 가닥으로 이루어지는 주형 폴리뉴클레오타이드 카피 수의 지수적 증가이다. 폴리뉴클레오타이드 이중체는 사용된 프라이머의 말단에 상응하는 말단을 갖는다. PCR은 주형 폴리뉴클레오타이드를 변성시키는 것, 주형 결합 부위에 프라이머 어닐링시키는 것, 및 뉴클레오타이드의 존재하에 DNA 또는 RNA 중합 효소에 의해 프라이머를 연장시키는 것을 한 번 이상 반복하여 포함할 수 있다. 특정 온도, 각 단계에서의 지속 시간 및 단계 사이의 변화율은 당업자에게 널리 공지된 많은 요인에 의존한다. (McPherson et al., IRL Press, Oxford (1991 and 1995)). 예를 들어, Taq DNA 중합 효소를 사용하는 관행적인 PCR에서, 이중 가닥 주형 폴리뉴클레오타이드는 >90℃의 온도에서 변성될 수 있고, 프라이머는 50-75℃ 범위의 온도에서 어닐링될 수 있으며, 프라이머는 72-78℃의 온도에서 연장될 수 있다. 일부 구체예에서, PCR은 역전사 PCR (RT-PCR), 실시간 PCR, 네스티드 PCR, 정량적 PCR, 다중화된 PCR 등등을 포함한다. 일부 구체예에서, PCR은 RT-PCR을 포함하지 않는다. (U.S. Patent Nos. 5,168,038, 5,210,015, 6,174,670, 6,569,627, 및 5,925,517; Mackay et al., Nucleic Acids Research, 30: 1292-1305 (2002)). RT-PCR은 역전사 반응이 선행되는 PCR 반응을 포함하고, 결과물 cDNA가 증폭된다. 네스티드 PCR은 2-단계 PCR을 포함하며, 여기서 제1 프라이머 세트를 사용하는 제1 PCR 반응의 앰플리콘은, 적어도 그 중 하나는 제1 PCR 반응의 앰플리콘의 내부 위치에 결합하는 제2 프라이머 세트를 사용하는 제2 PCR 반응의 샘플이 된다. 다중화된 PCR은 복수 개의 폴리뉴클레오타이드 서열이 동시에 동일한 반응 혼합물에서 PCR에 적용되는 PCR 반응을 포함한다. PCR 반응 부피는 0.2 pL-1000 μL 내 어느 부피일 수 있다. 정량적 PCR은 샘플의 하나 이상의 서열에 대한 절대적 또는 상대적인 양, 존재도 또는 농도를 측정하도록 설계된 PCR 반응을 포함한다. 정량적 측정은 하나 이상의 참조 서열 또는 표준을 대상 폴리뉴클레오타이드 서열과 비교하는 것을 포함할 수 있다. (Freeman et al., Biotechniques, 26: 112-126 (1999); Becker-Andre et al., Nucleic Acids Research, 17: 9437-9447 (1989); Zimmerman et al., Biotechniques, 21: 268-279 (1996); Diviacco et al., Gene, 122: 3013- 3020 (1992); Becker-Andre et al., Nucleic Acids Research, 17: 9437-9446 (1989)).
본 명세서에 사용되는 바 "뉴클레오타이드", "뉴클레오사이드", "뉴클레오타이드 잔기" 및 "뉴클레오사이드 잔기"는 증폭 반응 (예컨대 PCR 반응)에 사용하기에 적합한 프라이머 요소로서 작용할 수 있는 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 잔기, 또는 다른 유사한 뉴클레오사이드 유사체를 의미할 수 있다. 이러한 뉴클레오사이드 및 이의 유도체는 달리 지시되지 않는 한 본 명세서에 기재된 프라이머의 빌딩 블록으로서 사용될 수 있다. 본원에서, 그 화학적 변형이 중합 효소에 의한 데옥시구아닌, 데옥시시토신, 데옥시티미딘 또는 데옥시아데닌의 적절한 인식을 방해하지 않는다면, 증폭 반응에서의 안정성 또는 유용성을 향상시키기 위해 화학적으로 변형된 뉴클레오사이드 유도체 또는 염기의 이용을 배제하려는 의도는 없다. 일부 구체예에서, 뉴클레오타이드 유사체는 하이브리드 형성을 안정화시킬 수 있다. 일부 구체예에서, 뉴클레오타이드 유사체는 하이브리드 형성을 불안정화시킬 수 있다. 일부 구체예에서, 뉴클레오타이드 유사체는 혼성화 특이성을 향상시킬 수 있다. 일부 구체예에서, 뉴클레오타이드 유사체는 혼성화 특이성을 감소시킬 수 있다.
"핵산" 또는 문법적 등가물은 단일 뉴클레오타이드 또는 공유적으로 함께 연결된 2 개 이상의 뉴클레오타이드를 의미한다.
"폴리뉴클레오타이드" 또는 문법적 등가물은 공유적으로 함께 연결된 2 개 이상의 뉴클레오타이드를 지칭한다. 폴리뉴클레오타이드는 2 개 이상의 뉴클레오타이드를 함유하는 분자를 포함한다. 폴리뉴클레오타이드는 임의 길이의 리보뉴클레오타이드, 데옥시리보뉴클레오타이드 또는 펩타이드 핵산 (PNA) 중 하나의 중합체 형태의 뉴클레오타이드를 포함하며, 이는 퓨린 및 피리미딘 염기, 또는 다른 천연적인, 화학적으로 또는 생화학적으로 변형된, 비천연적인 뉴클레오타이드 염기, 또는 뉴클레오타이드 염기의 유도체를 포함한다. 폴리뉴클레오타이드의 백본은 당 및 포스페이트기, 또는 변형된 또는 치환된 당 또는 포스페이트기를 포함할 수 있다. 폴리뉴클레오타이드는 메틸화된 뉴클레오타이드 및 뉴클레오타이드 유사체와 같은 변형된 뉴클레오타이드를 포함할 수 있다. 뉴클레오타이드의 서열은 비-뉴클레오타이드 성분에 의해 중단될 수 있다. 폴리뉴클레오타이드는 다른 분자, 예컨대 다른 혼성화된 폴리뉴클레오타이드를 포함할 수 있다. 폴리뉴클레오타이드는 데옥시리보핵산 (DNA), 리보핵산 (RNA) 또는 둘 다의 서열을 포함한다. 폴리뉴클레오타이드의 비-제한적 예는 유전자, 유전자 단편, 엑손, 인트론, 유전자 간 DNA (제한없이, 이형염색질성 DNA 포함), 메신저 RNA (mRNA), 전달 RNA, 리보좀 RNA, 리보 자임, 작은 간섭 RNA (siRNA), cDNA, 재조합 폴리뉴클레오타이드, 분지형 폴리뉴클레오타이드, 플라스미드, 벡터, 단리된 서열 DNA, 단리된 서열 RNA, 핵산 프로브 및 프라이머를 포함한다. 폴리뉴클레오타이드는 천연 공급원으로부터 단리되거나, 재조합이거나 인공적으로 합성될 수 있다.
폴리뉴클레오타이드는 비표준 뉴클레오타이드, 예컨대 뉴클레오타이드 유사체 또는 변형된 뉴클레오타이드를 포함할 수 있다. 일부 구체예에서, 비표준 뉴클레오타이드는 하이브리드 형성을 안정화시킬 수 있다. 일부 구체예에서, 비표준 뉴클레오타이드는 하이브리드 형성을 불안정화시킬 수 있다. 일부 구체예에서, 비표준 뉴클레오타이드는 혼성화 특이성을 증가시킬 수 있다. 일부 구체예에서, 비표준 뉴클레오타이드는 혼성화 특이성을 감소시킬 수 있다. 비표준 뉴클레오타이드 변형의 예는 2 'O-Me, 2'O- 알릴, 2'O-프로파질, 2'O-알킬, 2'플루오로, 2'아라비노, 2'자일로, 2'플루오로 아라비노, 포스포로티오에이트, 포스포로디티오에이트, 포스포로아미데이트, 2'아미노, 5-알킬-치환 피리미딘, 3'데옥시구아노신, 5-할로-치환 피리미딘, 알킬-치환 퓨린, 할로-치환 퓨린, 바이사이클릭뉴클레오타이드, 2'MOE, PNA 분자, LNA-분자, LNA-유사 분자, 디아미노퓨린, S2T, 5-플루오로우라실, 5-브로모우라실, 5-클로로우라실, 5-요오도우라실, 하이포크산틴, 크산틴, 4-아세틸시토신, 5-(카르복시하이드록실메틸)우라실, 5-카르복시메틸아미노메틸-2- 티오유리딘, 5-카르복시메틸아미노메틸우라실, 디하이드로우라실, 베타-D-갈락토실퀴오신, 이노신, N6-이소펜테닐아데닌, 1- 메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3- 메틸시토신, 5-메틸시토신, N6-아데닌, 7-메틸 구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-만노실퀴오신, 5'5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-D46-이소펜테닐아데닌, 우라실-5-옥시아세트산 (v), 위부톡소신, 슈도우라실, 퀴오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세트산 메틸에스테르, 우라실-5-옥시 아세트산 (v), 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필)우라실, (acp3) w, 2,6-디아미노퓨린 및 이들의 유도체를 포함한다.
"대상체", "개체", "숙주" 또는 "환자"는 포유 동물과 같은 살아있는 유기체를 지칭한다. 대상체 및 숙주의 예는 말, 소, 낙타, 양, 돼지, 염소, 개, 고양이, 토끼, 기니 피그, 래트, 마우스 (예를 들어, 인간화 마우스), 모래쥐, 비-인간 영장류 (예를 들어, 원숭이), 인간 등등, 비-포유 동물, 예를 들어 비-포유류 척추 동물, 예컨대 조류 (예를 들어, 닭 또는 오리), 어류 (예를 들어, 상어) 또는 개구리 (예를 들어, Xenopus), 및 비-포유류 무척추 동물 및 이의 형질 전환 종을 포함하지만 이에 국한되는 것은 아니다. 특정 측면에서, 대상체는 단일 유기체 (예를 들어, 인간)를 지칭한다. 특정 측면에서, 연구 및/또는 질병에 대한 공통 면역 인자를 갖는 작은 코호트를 포함하는 개체 그룹, 및/또는 질병이 없는 개체로 이루어지는 코호트 (예를 들어, 음성/ 정상 대조군)가 제공된다. 샘플을 얻는 대상체는 질병 및/또는 장애 (예를 들어, 하나 이상의 알레르기, 감염, 암 또는 자가 면역 장애 등등)에 영향받을 수 있고, 질병에 의하여 영향을 받지 않는 음성 대조군 대상체와 비교될 수 있다.
"키트"는 본 명세서에 개시된 방법을 수행하기 위한 물질 또는 시약을 전달하기 위한 전달 시스템을 지칭한다. 일부 구체예에서, 키트는 한 위치에서 다른 위치로 반응 시약 (예를 들어, 적절한 컨테이너 내의 프로브, 효소 등)의 저장, 수송, 또는 전달을 가능케하는 시스템 및/또는 지지 물질 (예를 들어, 완충액, 분석을 수행하기 위한 서면 설명서)을 포함한다. 예를 들어, 키트는 관련 반응 시약 및/또는 지지 물질을 함유하는 하나 이상의 동봉물 (예를 들어, 박스)를 포함한다. 이러한 컨텐츠는 의도된 수신자에게 함께 또는 별도로 전달될 수 있다. 예를 들어, 제1 컨테이너는 분석에 사용하기 위한 효소를 함유할 수 있는 반면, 제2 컨테이너는 복수 개의 프라이머를 함유한다.
"폴리펩타이드"는 일부 측면에서 2 개 이상의 아미노산을 포함하는 분자를 지칭한다. 일부 구체예에서, 폴리펩타이드는 단일 펩타이드로 구성된다. 일부 구체예에서, 폴리펩타이드는 2 개 이상의 펩타이드를 포함한다. 예를 들어, 폴리펩타이드는 적어도 약 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500, 600, 700, 800, 900 또는 1000 개 펩타이드 또는 아미노산을 포함할 수 있다. 폴리펩타이드의 예는 아미노산 사슬, 단백질, 펩타이드, 호르몬, 폴리펩타이드 당류, 지질, 당지질, 인지질, 항체, 효소, 키나아제, 수용체, 전사 인자 및 리간드를 포함하지만 이에 제한되지는 않는다.
"샘플"은 일부 측면에서 생물학적, 환경적, 의료적, 대상체, 또는 환자 샘플 또는 폴리뉴클레오타이드, 예를 들어 표적 폴리뉴클레오타이드를 함유하는 샘플을 지칭한다.
"약학적으로 허용되는"은 생리학적으로 용인성이고, 인간에게 투여될 때 알레르기성 또는 유사한 비방향성 반응, 예컨대 위 경련, 현기증 등등을 일으키지 않는 분자 엔티티 및 조성물을 지칭한다.
"예방"은 단백질의 과수준과 관련되거나 단백질 활성과 관련이 있는 질환 또는 장애의 진행 예방, 그 증상의 개시 방지, 진행 방지를 지칭한다.
"억제", "치료" 및 "치료하는"은 상호 교환적으로 사용되며, 예를 들어 단백질의 과수준과 관련되거나 단백질 활성과 관련된 질병 상태, 질환 또는 장애의 증상의 정체, 생존의 연장, 증상의 부분적 또는 전체적 개선, 및 부분적 또는 전체적 근절을 말한다. 예를 들어, 암의 치료는 암성 성장 또는 종양의 정체, 부분적 또는 전체적 제거를 포함하나, 이에 제한되지는 않는다. 치료 또는 부분적 제거는 예를 들어, 성장 또는 종양 크기 및/또는 부피의 배수 감소, 예컨대 약 2 배, 약 3 배, 약 4 배, 약 5 배, 약 10 배, 약 20 배, 약 50 배 또는 그 사이의 모든 배수 감소를 포함한다. 유사하게, 치료 또는 부분적 제거는 성장 또는 종양 크기 및/또는 부피의 약 1%, 2%, 3%, 4%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 그 사이의 임의의 백분율 감소인 백분율 감소를 포함한다.
본원에서 언급되는, 특허 문서, 과학 논문 및 데이터베이스를 포함한 모든 출판물은 각각의 개별 출판물이 개별적으로 참조로 통합된 것과 동일한 정도로 모든 목적을 위해 전체적으로 참조로 포함된다. 본 명세서에 기재된 정의가 본원에 참조로 포함된 특허, 출원, 공개된 출원 및 기타 간행물에 기재된 정의와 상반되거나 달리 불일치하는 경우, 본원에 기재된 정의는 본원에 참조로 포함된 정의보다 우선한다.
설명을 위한 예시적인 응용법을 참조하여 몇몇 측면들이 아래에 기술된다. 본 명세서에 기술된 특징들에 대한 완전한 이해를 제공하기 위해 다수의 특정 세부 사항들, 관계들 및 방법들이 제시됨을 이해해야 한다. 그러나, 관련 기술 분야의 통상의 기술자는 본 명세서에 기술된 특징들이 상기 하나 이상의 특정 세부 사항 없이, 또는 다른 방법을 이용하여 실시될 수 있다는 것을 쉽게 인식할 것이다. 본 명세서에 기술된 특징은 설명된 작용 또는 사건의 순서에 의해 제한되지 않는데, 일부 작용은 다른 순서로 및/또는 다른 작용 또는 사건과 동시에 일어날 수 있기 때문이다. 또한, 본 명세서에 기술된 특징들에 따른 방법론을 구현하기 위해 설명된 모든 작용 또는 사건들이 요구되는 것은 아니다.
본 명세서에 사용된 섹션 제목은 단지 조직화 목적을 위한 것이며 기술된 주제를 제한하는 것으로 해석되어서는 아니된다.
VIII. 예시적 구체예
제공되는 구체예들 중에는 하기의 것들이 있다:
1. 폴리뉴클레오타이드 라이브러리를 제조하는 방법으로서,
상기 방법은 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 부착된 제1 어댑터와 대향하는 말단에서 또는 그 근처에서 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 제2 어댑터를 부가하는 단계를 포함하고,
상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드는:
(i) 세포 집단 중 하나의 세포에 존재하는, 하나 이상의 표적 폴리뉴클레오타이드(들) 또는 이들의 상보체(들)의 앰플리콘을 포함하는 하나 이상의 표적 단일-가닥 폴리뉴클레오타이드(들); 및
(ii) 상기 세포에서 각각이 폴리뉴클레오타이드 또는 그의 상보체의 앰플리콘을 포함하는 단일-가닥 폴리뉴클레오타이드의 집합체를 포함하고;
여기서 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 상기 세포 집단 중 동일한 세포로부터 유래한 (i) 및 (ii)로부터의 모든 폴리뉴클레오타이드에 대하여 동일한 용기 바코드를 포함하는 것인 방법.
2. 제1구체예에 있어서, 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드는 상기 세포 집단에서 복수 개의 세포의 (i) 및 (ii)의 폴리뉴클레오타이드를 포함하는 것인 방법.
3. 제1구체예 또는 제2구체예에 있어서, 상기 복수 개의 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 단일-가닥 폴리뉴클레오타이드 각각에 고유한 분자 바코드를 더 포함하는 것인 방법.
4. 제1구체예 내지 제3구체예 중 어느 하나의 구체예에 있어서, 상기 세포 집단의 각각의 세포로부터의 상기 바코딩된 단일-가닥 폴리뉴클레오타이드의 집합체는, 집합적으로, 전사체 또는 부분적 전사체의 상보적 DNA (cDNA)를 포함하는 것인 방법.
5. 제1구체예 내지 제4구체예 중 어느 하나의 구체예에 있어서, 상기 전사체 또는 부분적 전사체는, 집합적으로, 세포의 게놈에 존재하는 전사물 중 적어도 60%, 70%, 75%, 80%, 85% 90% 95%, 96%, 97%, 98%, 99% 또는 100%를 포함하는 것인 방법.
6. 제1구체예 내지 제5구체예 중 어느 하나의 구체예에 있어서, 상기 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 (약) 50 염기쌍보다 큰, 100 염기쌍보다 큰, 또는 200 염기쌍보다 큰 크기를 갖는 것인 방법.
7. 제1구체예 내지 제6구체예 중 어느 하나의 구체예에 있어서, 상기 바코딩된 단일-가닥의 폴리뉴클레오타이드 각각은 50 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp, 또는 약 50 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp인 크기를 갖는 것인 방법.
8. 제1구체예 내지 제7구체예 중 어느 하나의 구체예에 있어서, 상기 제2 어댑터를 부가하는 단계는 상기 복수 개의 바코딩된 단일-가닥의 폴리뉴클레오타이드를 포함하는 균질한 혼합물에서 수행되는 것인 방법.
9. 제1구체예 내지 제8구체예 중 어느 하나의 구체예에 있어서, 상기 제1 어댑터는 상기 용기 바코드를 포함하는 것인 방법.
10. 폴리뉴클레오타이드 라이브러리를 제조하는 방법으로서, 상기 방법은:
(a) 복수 개의 각각의 용기 내의 세포를 용해시키는 단계로서, 상기 용기 각각은 세포 집단을 포함하는 샘플부터의 세포를 포함하는 것인 단계;
(b) 각각의 용기에서, 복수 개의 상보적 폴리뉴클레오타이드를 생산하는 단계로서, 상기 복수 개의 상보적인 폴리뉴클레오타이드의 생산은 (i) 하나 이상의 표적-특이적 프라이머를 사용하여 상기 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드(들)에 상보적인 하나 이상의 표적 폴리뉴클레오타이드(들)을 생산하는 것; 및 (ii) 무작위적 올리고 프라이머를 사용하여, 그 각각이 상기 세포 내 폴리뉴클레오타이드에 상보적인 것인, 폴리뉴클레오타이드의 집합체를 생산하는 것을 포함하는 것인, 단계를 포함한다.
11. 제10구체예에 있어서, 상기 용기 각각은 복수 개의 분자 바코딩된 올리고뉴클레오타이드, 하나의 용기 바코딩된 올리고뉴클레오타이드 또는 용기 바코딩된 올리고뉴클레오타이드의 풀, 및 임의로, 하나의 제1 어댑터를 더 포함하고, 상기 방법은:
(c) 복수 개의, 임의로 복수 개 중의 각각의, 상보적 폴리뉴클레오타이드에 복수 개의 분자 바코딩된 올리고뉴클레오타이드 중 하나를 부착시켜, 그에 의하여 각각이 분자 바코드를 포함하는 복수 개의 바코딩된 폴리뉴클레오타이드를 생성하는 단계로서, 여기서 임의로 상기 분자 바코딩된 폴리뉴클레오타이드 각각의 상기 분자 바코드는 상기 복수 개 내 다른 바코딩된 폴리뉴클레오타이드에 의하여 함유된 분자 바코드와는 구별되고 및/또는 고유한 분자 바코드인 단계;
(d) 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀 중 하나, 및 상기 제1 어댑터, 또는 이의 증폭된 생성물을, 복수 개의, 임의로 각각의, 상기 바코딩된 폴리뉴클레오타이드에 부착시켜, 그에 의하여 복수 개의 이중-바코딩된 폴리뉴클레오타이드를 생성하는 단계로서 여기서 동일 용기 내 상기 이중-바코딩된 폴리뉴클레오타이드 각각은 동일한 용기 바코드를 포함하는 단계를 더 포함한다.
12. 제11구체예에 있어서, (e) 복수 개의, 임의로 각각의, 상기 복수 개의 이중-바코딩된 폴리뉴클레오타이드의 딘일-가닥의 앰플리콘을 생성하는 단계를 더 포함하는 것인 방법.
13. 제12구체예에 있어서, (f) 상기 단일-가닥의 앰플리콘 각각에 제2 어댑터를 부가하는 단계로서, 상기 제1 어댑터 및 제2 어댑터는 상기 이중-바코딩된 단일-가닥의 폴리뉴클레오타이드의 각각의 대향 말단에 또는 그 근처에 존재하는 것인 방법.
14. 폴리뉴클레오타이드 라이브러리를 생성하는 방법으로서, 상기 방법은:
(a) 복수 개의 용기 각각 내의 세포를 용해시키는 단계로서, 상기 용기 각각은 세포 집단을 포함하는 샘플로부터의 세포, 복수 개의 분자 바코딩된 올리고뉴클레오타이드, 및 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀, 및, 임의로, 제1 어댑터를 포함하는 것인 단계;
(b) 각 용기에서, 복수 개의 상보적인 폴리뉴클레오타이드를 생성하는 단계로서, 상기 복수 개를 생성하는 것은, (i) 상기 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드(들)에 상보적인 하나 이상의 표적 폴리뉴클레오타이드(들)를 생성하는 것; 및 (ii) 각각이 상기 세포 내 폴리뉴클레오타이드에 개별적으로 상보적인 폴리뉴클레오타이드의 집합체를 생성하는 것을 포함하는 것인 단계;
(c) 각각의 상보적인 폴리뉴클레오타이드에 복수 개의 분자 바코딩된 올리고뉴클레오타이드 중 하나를 부착시켜, 그에 의하여 각각이 고유한 분자 바코드를 포함하는 복수 개의 바코딩된 폴리뉴클레오타이드를 생성하는 단계;
(d) 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀, 또는 이의 증폭된 생성물 중 하나를, 상기 바코딩된 폴리뉴클레오타이드 각각에 부착시켜, 그에 의하여 복수 개의 이중-바코딩된 폴리뉴클레오타이드를 생성하는 단계로서, 여기서 동일 용기 내의 상기 이중-바코딩된 폴리뉴클레오타이드 각각은 동일한 용기 바코드를 포함하는 것인 단계;
(e) 상기 복수 개의 이중-바코딩된 폴리뉴클레오타이드 각각의 단일-가닥의 앰플리콘을 생성하는 단계; 및
(f) 상기 단일-가닥의 앰플리콘 각각에 제2 어댑터를 부가하여, 그에 의하여 상기 제2 어댑터를 이중-바코딩된 단일-가닥 폴리뉴클레오타이드에 부가하는 단계로서, 여기서 상기 제1 어댑터 및 제2 어댑터는 상기 이중-바코딩된 단일-가닥의 폴리뉴클레오타이드 각각의 대향 말단에 또는 그 근처에 존재하는 것인 단계를 포함한다.
15. 제11구체예 내지 제14구체예 중 어느 하나의 구체예에 있어서, 상기 제1 어댑터는 상기 용기 바코딩된 올리고뉴클레오타이드를 포함하는 것인 방법.
16. 제10구체예 내지 제15구체예 중 어느 하나의 구체예에 있어서, 상기 세포 집단의 각각의 세포로부터의 상기 폴리뉴클레오타이드의 집합체는, 집합적으로, 세포의 전사체 또는 부분적 전사체의 전사물에 상보적인 서열을 포함하는 것인 방법.
17. 제16구체예에 있어서, 상기 전사체 또는 부분적 전사체는 상기 세포의 게놈에 존재하는 전사물의 적어도 60%, 70%, 75%, 80%, 85% 90% 95%, 96%, 97%, 98%, 99% 또는 100%를 포함하는 것인 방법.
18. 제1구체예 내지 제17구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들) 및/또는 상기 세포 내 폴리뉴클레오타이드는 DNA인 것인 방법.
19. 제1구체예 내지 제18구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들) 및/또는 상기 세포 내 폴리뉴클레오타이드는 RNA인 것인 방법.
20. 제19구체예에 있어서, 상기 RNA는 mRNA인 것인 방법.
21. 제10구체예 내지 제20구체예 중 어느 하나의 구체예에 있어서, (b)의 상기 하나 이상의 상보적인 폴리뉴클레오타이드(들) 각각은 cDNA인 것인 방법.
22. 제1구체예 내지 제21구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 cDNA 가닥인 것인 방법.
23. 제1구체예 내지 제22구체예 중 어느 하나의 구체예에 있어서, 상기 제1 어댑터 및/또는 제2 어댑터는 적어도 하나의 범용 프라이밍 부위를 포함하는 것인 방법.
24. 제1구체예 내지 제23구체예 중 어느 하나의 구체예에 있어서,
상기 제1 어댑터 및 제2 어댑터는 상이하고; 및/또는
상기 제1 어댑터는 제1 범용 프라이밍 부위를 포함하고 상기 제2 어댑터는 제2 범용 프라이밍 부위를 포함하고, 여기서 임의로 상기 제1 범용 프라이밍 부위 및 제2 범용 프라이밍 부위는 상이한 것인 방법.
25. 제24구체예에 있어서, 상기 제1 범용 프라이밍 부위 및/또는 제2 범용 프라이밍 부위는 P7 프라이밍 부위 (C7) 또는 이의 인접 부분 또는 P5 프라이밍 부위 (C5) 또는 이의 인접 부분이거나 이들을 포함하고, 여기서 임의로 상기 인접 부분은 상보적 서열에 어닐링하기 충분한 것인 방법.
26. 제24구체예 또는 제25구체예에 있어서, 상기 제1 범용 프라이밍 부위는 P7 프라이밍 부위 (C7) 또는 이의 인접 부분이거나 이들을 포함하고, 상기 제2 범용 프라이밍 부위는 P5 프라이밍 부위 (C5) 또는 이의 인접 부분이거나 이들을 포함하는 것인 방법.
27. 제25구체예 또는 제26구체예에 있어서, 상기 P7 프라이밍 부위 (C7)는 서열 AGATCGGAAGAGCACACGTCTGAACTCCA (SEQ ID NO:77)을 포함하거나, 또는 이의 인접 부분인 것인 방법.
28. 제25구체예 또는 제26구체예에 있어서, 상기 P5 프라이밍 부위는 서열 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT (SEQ ID NO:78)을 포함하거나, 또는 이의 인접 부분인 것인 방법.
29. 제25구체예 내지 제28구체예 중 어느 하나의 구체예에 있어서, 상기 인접 부분은 적어도 15, 20, 25 또는 30 개 뉴클레오타이드 길이 또는 적어도 약 15, 20, 25 또는 30 개 뉴클레오타이드 길이를 포함하는 것인 방법.
30. 제25구체예, 제26구체예, 제28구체예 또는 제29구체예 중 어느 하나의 구체예에 있어서, 상기 P5 프라이밍 부위는 SEQ ID NO:25 (AGATCGGAAGAGCGTCGTGT)에 제시된 인접 부분인 것인 방법.
31. 제1구체예 내지 제9구체예 및 제13구체예 내지 제30구체예 중 어느 하나의 구체예에 있어서, 상기 제2 어댑터를 부가하는 것은 상기 제2 범용 프라이밍 부위를 포함하는 올리고뉴클레오타이드의 존재하에서 상기 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 스플린트 올리고뉴클레오타이드 (splint oligonucleotide)를 혼성화하는 것을 포함하고, 여기서, 상기 스플린트 올리고뉴클레오타이드는 (i) 상기 제2 범용 프라이밍 부위에 상보적인 서열 및 (ii) 상기 바코딩된 단일-가닥 폴리뉴클레오타이드의 3' 말단에 무작위로 어닐링할 수 있는 축퇴 오버행 (overhang) 서열을 포함하는 것인 방법.
32. 제31구체예에 있어서, 상기 혼성화 전에, 상기 스플린트 올리고뉴클레오타이드 및 상기 제2 범용 프라이밍 부위를 포함하는 올리고뉴클레오타이드는 스플린트-어댑터 이중체를 형성하기 위하여 어닐링되는 것인 방법.
33. 제31구체예 또는 제32구체예에 있어서, 상기 축퇴 오버행 서열은 서열 (N)3-12을 함유하고, 여기서 N은 임의의 뉴클레오타이드인 것인 방법.
34. 제31구체예 내지 제33구체예 중 어느 하나의 구체예에 있어서, 상기 축퇴 오버행 서열은 서열 NNNNNN을 포함하고, 여기서 N은 임의의 뉴클레오타이드인 것인 방법 (SEQ ID NO:24).
35. 제31구체예 내지 제34구체예 중 어느 하나의 구체예에 있어서, 상기 스플린트 올리고뉴클레오타이드는 서열 ACACGACGCTCTTCCGATCTNNNNNN을 포함하고, 여기서 N은 임의의 뉴클레오타이드인 것인 방법 (SEQ ID NO:26).
36. 제31구체예 내지 제35구체예 중 어느 하나의 구체예에 있어서, 상기 제2 범용 프라이밍 부위를 포함하는 올리고뉴클레오타이드는 서열 AGATCGGAAGAGCGTCGTGT (SEQ ID NO:25)를 포함하는 것인 방법.
37. 제1구체예 내지 제9구체예 및 제11구체예 내지 제36구체예 중 어느 하나의 구체예에 있어서, 상기 용기 바코딩된 올리고뉴클레오타이드는 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40 또는 50 개 뉴클레오타이드 또는 약 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40 또는 50 개 뉴클레오타이드를 포함하는 것인 방법.
38. 제1구체예 내지 제9구체예 및 제11구체예 내지 제37구체예 중 어느 하나의 구체예에 있어서, 상기 용기 바코딩된 올리고뉴클레오타이드는 10 내지 30 개 뉴클레오타이드 또는 약 10 내지 30 개 뉴클레오타이드를 포함하는 것인 방법.
39. 제1구체예 내지 제38구체예 중 어느 하나의 구체예에 있어서, 상기 용기 바코딩된 올리고뉴클레오타이드는 축퇴 서열을 포함하는 것인 방법.
40. 제1구체예 내지 제9구체예 및 제11구체예 내지 제39구체예 중 어느 하나의 구체예에 있어서, 상기 용기 바코딩된 올리고뉴클레오타이드는 서열 (N)14-17을 포함하고, 여기서 N은 임의의 뉴클레오타이드이고, 여기서 임의로 상기 서열 내 적어도 하나 또는 2 개의 N은 W이고, W은 아데닌 또는 티민인 것인 방법.
41. 제1구체예 내지 제9구체예 및 제11구체예 내지 제40구체예 중 어느 하나의 구체예에 있어서, 상기 용기 바코딩된 올리고뉴클레오타이드는 서열 NNNNWNNNNWNNNN (SEQ ID NO:80), WNNNNWNNNNWNNNN (SEQ ID NO:81), NWNNNWNNNNWNNNN (SEQ ID NO:82) 또는 NNWNNNNWNNNNWNNNN (SEQ ID NO:83)을 포함하고, 여기서 N은 임의의 뉴클레오타이드이고 W는 아데닌 또는 티민인 것인 방법.
42. 제11구체예 내지 제41구체예 중 어느 하나의 구체예에 있어서, 각각의 용기는 제1 어댑터의 풀을 포함하고, 상기 제1 어댑터의 풀의 각각의 용기 바코딩된 올리고뉴클레오타이드는 상기 풀 내 다른 용기 바코딩된 올리고뉴클레오타이드 중 적어도 하나와 비교할 때 적어도 하나의 염기-시프트 또는 염기 첨가를 포함하는 것인 방법.
43. 제42구체예에 있어서, 상기 제1 어댑터의 풀의 상기 용기 바코딩된 올리고뉴클레오타이드는 서열 NNNNWNNNNWNNNN (SEQ ID NO:80), WNNNNWNNNNWNNNN (SEQ ID NO:81), NWNNNWNNNNWNNNN (SEQ ID NO:82) and NNWNNNNWNNNNWNNNN (SEQ ID NO:83)을 포함하고, 여기서 N은 임의의 뉴클레오타이드이고 W는 아데닌 또는 티민인 것인 방법.
44. 제11구체예 내지 제43구체예 중 어느 하나의 구체예에 있어서, 단계 (d)에서, 상기 방법은:
용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 그의 풀 또는 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 그의 풀을 포함하는 제1 어댑터를 증폭하는 것을 더 포함하고,
여기서 상기 증폭은 상기 용기 바코딩된 올리고뉴클레오타이드를 부착하기 이전 또는 그와 동시에 수행되는 것인 방법.
45. 제11구체예 내지 제44구체예 중 어느 하나의 구체예에 있어서, 상기 용기 바코딩된 올리고뉴클레오타이드를 부착하는 것은 상기 용기 바코딩된 올리고뉴클레오타이드의 영역을 상기 상보적인 폴리뉴클레오타이드 각각의 영역 또는 상기 분자 바코드를 포함하는 분자 바코딩된 폴리뉴클레오타이드 각각의 영역에 혼성화시키는 것을 포함하는 것인 방법.
46. 제45구체예에 있어서, 상기 영역은 상기 분자 바코딩된 폴리뉴클레오타이드의 분자 바코드의 5' 말단 영역에 상보적인 3' 태깅 폴리뉴클레오타이드를 포함하는 것인 방법.
47. 제10구체예 내지 제46구체예 중 어느 하나의 구체예에 있어서, 단계 (b)에서,
상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 역전사 효소 및 상기 표적 폴리뉴클레오타이드(들) 중 표적 서열에 상보적인 하나 이상의 표적-특이적 프라이머(들)의 존재하에서 상기 표적 폴리뉴클레오타이드(들)의 역전사에 의하여 생성되고; 및/또는
상기 폴리뉴클레오타이드의 집합체는 역전사 효소 및 상기 세포 내 폴리뉴클레오타이드에 상보적인 하나 이상의 전사체 프라이머의 존재하에서 상기 세포 내 폴리뉴클레오타이드의 역전사에 의하여 생성되는 것인 방법.
48. 제1구체예 내지 제47구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 면역 분자 또는 그의 사슬의 폴리뉴클레오타이드를 포함하는 것인 방법.
49. 제1구체예 내지 제48구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은, 각각이 면역 분자 사슬의 폴리뉴클레오타이드를 포함하는, 적어도 2 개의 표적 폴리뉴클레오타이드를 포함하는 것인 방법.
50. 제1구체예 내지 제49구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 TCR 또는 그의 사슬의 폴리뉴클레오타이드를 포함하는 것인 방법.
51. 제1구체예 내지 제50구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드는 T-세포 수용체 알파 (TCRα)로 이루어지는 제1 폴리뉴클레오타이드 및 T-세포 수용체 (TCRβ)로 이루어지는 제2 폴리뉴클레오타이드를 포함하는 것인 방법.
52. 제1구체예 내지 제50구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 T-세포 수용체 감마 (TCRγ)로 이루어지는 제1 폴리뉴클레오타이드 및 T-세포 수용체 델타 (TCR델타)로 이루어지는 제2 폴리뉴클레오타이드를 포함하는 것인 방법.
53. 제1구체예 내지 제49구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 항체 또는 그의 사슬의 폴리뉴클레오타이드를 포함하는 것인 방법.
54. 제1구체예 내지 제49구체예 및 제53구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 중쇄 면역글로불린 (IgH) 폴리뉴클레오타이드로 이루어지는 제1 폴리뉴클레오타이드 및 경쇄 면역글로불린 (IgL) 폴리뉴클레오타이드로 이루어지는 제2 폴리뉴클레오타이드를 포함하는 것인 방법.
55. 제47구체예 내지 제54구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적-특이적 프라이머 및/또는 상기 하나 이상의 전사체 프라이머는 폴리(T) 서열을 포함하는 것인 방법.
56. 제47구체예 내지 제54구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 전사체 프라이머는 무작위 6량체 올리고뉴클레오타이드 프라이머의 혼합물을 포함하는 것인 방법.
57. 제47구체예 내지 제56구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적-특이적 프라이머는 상기 표적 폴리뉴클레오타이드의 표적 서열(들)의 서열(들)에 상보적인 하나 이상의 프라이머를 포함하는 것인 방법.
58. 제57구체예에 있어서, 상기 하나 이상의 표적-특이적 프라이머는 적어도 제1 프라이머 및 제2 프라이머를 포함하는 것인 방법.
59. 제57구체예 또는 제58구체예에 있어서, 상기 하나 이상의 표적-특이적 프라이머는 복수 개의 면역 분자 또는 그의 사슬의 표적 서열에 대한 프라이머를 포함하는 것인 방법.
60. 제59구체예에 있어서, 상기 면역 분자는 T 세포 수용체 또는 항체인 것인 방법.
61. 제58구체예 내지 제60구체예 중 어느 하나의 구체예에 있어서, 적어도 상기 제1 프라이머는 면역 분자의 제1 사슬의 폴리뉴클레오타이드의 표적 서열에 상보적이고 제2 프라이머는 상기 면역 분자의 제2 사슬의 폴리뉴클레오타이드의 표적 서열에 상보적인 것인 방법.
62. 제58구체예 내지 제61구체예 중 어느 하나의 구체예에 있어서, 상기 제1 및 제2 프라이머는 TCR의 상이한 TCR 사슬 폴리뉴클레오타이드의 표적 서열에 상보적인 것인 방법.
63. 제58구체예 내지 제62구체예 중 어느 하나의 구체예에 있어서,
상기 제1 프라이머는 TCR알파 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고 상기 제2 프라이머는 TCR베타 폴리뉴클레오타이드 서열의 표적 서열에 상보적이거나; 또는
상기 제1 프라이머는 TCR감마 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고 상기 제2 프라이머는 TCR델타 폴리뉴클레오타이드 서열의 표적 서열에 상보적인 것인 방법.
64. 제62구체예 또는 제63에 있어서, 상기 TCR 사슬 폴리뉴클레오타이드의 표적 서열은 불변 영역 서열인 것인 방법.
65. 제58구체예 내지 제64구체예 중 어느 하나의 구체예에 있어서,
상기 제1 프라이머는 TCR알파 불변 영역 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고 상기 제2 프라이머는 TCR베타 불변 영역 폴리뉴클레오타이드 서열의 표적 서열에 상보적이거나; 또는
상기 제1 프라이머는 TCR감마 불변 영역 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고 상기 제2 프라이머는 TCR델타 불변 영역 폴리뉴클레오타이드 서열의 표적 서열에 상보적인 것인 방법.
66. 제58구체예 내지 제61구체예 중 어느 하나의 구체예에 있어서, 적어도 상기 제1 및 제2 프라이머는 항체의 상이한 항체 사슬 폴리뉴클레오타이드의 표적 서열에 상보적인 것인 방법.
67. 제58구체예 내지 제61구체예 및 제66구체예 중 어느 하나의 구체예에 있어서, 상기 제1 프라이머는 중쇄 면역글로불린 (IgH) 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고 상기 제2 프라이머는 경쇄 면역글로불린 (IgL) 폴리뉴클레오타이드 서열의 표적 서열에 상보적인 것인 방법.
68. 제66구체예 또는 제67구체예에 있어서, 상기 항체 사슬 폴리뉴클레오타이드의 표적 서열은 불변 영역 서열인 것인 방법.
69. 제58구체예 내지 제61구체예 및 제66구체예 내지 제68구체예 중 어느 하나의 구체예에 있어서, 상기 제1 프라이머는 중쇄 불변 영역 (CH) 폴리뉴클레오타이드 서열의 표적 서열에 상보적이고 상기 제2 프라이머는 경쇄 불변 영역 (CL) 폴리뉴클레오타이드 서열의 표적 서열에 상보적인 것인 방법.
70. 제68구체예 또는 제69구체예에 있어서,
상기 CH 폴리뉴클레오타이드의 표적 서열은 IgM, IgD, IgA, IgE 또는 IgG, 또는 이들의 조합으로부터의 것; 및/또는
상기 CL 폴리뉴클레오타이드 서열의 표적 서열은 Ig카파, Ig람다 또는 이들의 조합으로부터의 것인 방법.
71. 제1구체예 내지 제70구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 전장 코딩 서열을 포함하는 것인 방법.
72. 제10구체예 내지 제71구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들) 및 상기 폴리뉴클레오타이드의 집합체는 동일한 반응 부피의 용기에서 생성되는 것인 방법.
73. 제10구체예 내지 제72구체예 중 어느 하나의 구체예에 있어서, 단계 (b)에서, 상기 복수 개의 상보적 폴리뉴클레오타이드를 생산하는 것은 비-주형 말단 전이 효소의 사용을 포함하고, 여기서 3 개 이상의 비-주형 뉴클레오타이드, 리보뉴클레오타이드 또는 이들의 유사체가 각각의 생성되는 상보적 폴리뉴클레오타이드의 3' 말단에 부가되는 것인 방법.
74. 제73구체예에 있어서, 상기 비-주형 말단 전이 효소는 역전사 효소 또는 중합 효소인 것인 방법.
75. 제73구체예 또는 제74구체예에 있어서, 상기 비-주형 말단 전이 효소는 역전사 효소이고, 여기서 상기 역전사 효소는 수퍼스크립트 II 역전사 효소, 맥시마 역전사 효소, 프로토스크립트 II 역전사 효소, 말로니 뮤린 백혈병 바이러스 역전사 효소 (MMLV-RT), 하이스크라이버 역전사 효소, 조류 골수아세포증 바이러스 (AMV) 역전사 효소, 말단 데옥시뉴클레오티딜 전이 활성을 포함하는 임의의 역전사 효소, 및 이들의 조합 중에서 선택되는 것인 방법.
76. 제11구체예 내지 제75구체예 중 어느 하나의 구체예에 있어서, 단계 (c)에서, 상기 부착하는 것은 상기 분자 바코딩된 올리고뉴클레오타이드 중 하나의 영역을 상기 상보적 폴리뉴클레오타이드 각각의 3 개 이상의 비-주형 뉴클레오타이드에 혼성화시키는 것을 포함하는 것인 방법.
77. 제73구체예 내지 제75구체예 중 어느 하나의 구체예에 있어서, 상기 복수 개의 분자 바코딩된 올리고뉴클레오타이드는 각각이 상기 3 개 이상의 비-주형 뉴클레오타이드에 상보적인 3' 부분을 포함하는 복수 개의 주형 스위치 올리고뉴클레오타이드로서 제공되는 것인 방법.
78. 제77구체예에 있어서, 상기 주형 스위치 올리고뉴클레오타이드는 상기 용기 바코드를 포함하는 상기 제1 어댑터의 3' 태깅 올리고뉴클레오타이드에 상보적인 5' 말단 영역을 더 포함하는 것인 방법.
79. 제11구체예 내지 제78구체예 중 어느 하나의 구체예에 있어서,
상기 역전사 효소는 주형 스위칭 활성을 가지며;
상기 복수 개의 생성된 상보적 폴리뉴클레오타이드의 적어도 일부 가닥은 3 개 이상의 비-주형 뉴클레오타이드를 포함하는 3' 오버행을 함유하고;
상기 복수 개의 분자 바코딩된 올리고뉴클레오타이드는 각각이 (1) 상기 용기 바코드를 포함하는 상기 제1 어댑터의 3' 태깅 올리고뉴클레오타이드에 상보적인 5' 말단 영역 (2) 상기 분자 바코드 및 (3) 상기 3' 오버행의 상기 3 개 이상의 비-주형 뉴클레오타이드에 상보적인 3' 부분을 포함하는 복수 개의 주형 스위치 올리고뉴클레오타이드로서 제공되고; 및
상기 주형 스위치 올리고뉴클레오타이드는 상기 역전사 효소에 대한 주형으로 작용하여 그로써, 상기 분자 바코드는 각각의 상보적인 폴리뉴클레오타이드 내로 혼입되는 것인 방법.
80. 제77구체예 내지 제79구체예 중 어느 하나의 구체예에 있어서, 상기 2 개 이상의 비-주형 뉴클레오타이드에 상보적인 3' 부분은 뉴클레오타이드, 리보뉴클레오타이드 또는 이들의 유사체를 포함하는 것인 방법.
81. 제73구체예 내지 제80구체예 중 어느 하나의 구체예에 있어서, 상기 3 개 이상의 비-주형 뉴클레오타이드는 3 개 이상의 C 뉴클레오타이드를 포함하고 상기 3 개 이상의 비-주형 뉴클레오타이드에 상보적인 3' 부분은 하나 이상의 G 뉴클레오타이드 또는 리보뉴클레오타이드 또는 이들의 유사체를 포함하는 것인 방법.
82. 제73구체예 내지 제77구체예 중 어느 하나의 구체예에 있어서, 상기 주형 스위치 올리고뉴클레오타이드는 역전사 효소 또는 DNA 중합 효소에 의한 연장을 저지하는 3' 변형된 뉴클레오타이드를 더 포함하는 것인 방법.
83. 제82구체예에 있어서, 상기 변형은 상기 3' 뉴클레오타이드의 데옥시, 포스페이트, 아미노, 또는 알킬 변형인 것인 방법.
84. 제11구체예 내지 제83구체예 중 어느 하나의 구체예에 있어서, 단계 (d)는 상기 부착 후에 상기 복수 개의 상보적인 분자 바코딩된 폴리뉴클레오타이드 각각을 연장하는 것을 더 포함하는 것인 방법.
85. 제1구체예 내지 제84구체예 중 어느 하나의 구체예에 있어서, 상기 용기는 웰, 에멀젼, 또는 액적인 것인 방법.
86. 제12구체예 내지 제85구체예 중 어느 하나의 구체예에 있어서, 단계 (e) 전에, 상기 2 개 이상의 복수 개의 용기의 컨텐츠를 조합하고, 그에 의하여 상기 2 개 이상의 복수 개의 이중-바코딩된 단일-가닥 폴리뉴클레오타이드를 포함하는 균질한 혼합물을 생성하는 것을 포함하는 것인 방법.
87. 제86구체예에 있어서, 상기 복수 개의 용기의 컨텐츠를 조합하는 것은 상기 2 개 이상의 복수 개의 용기를 부수고 상기 2 개 이상의 부서진 용기로부터 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드를 풀링하는 것을 포함하는 것인 방법.
88. 제86구체예 또는 제87구체예에 있어서, 단계 (e) 전에, 50 염기쌍보다 큰, 100 염기쌍보다 큰, 또는 200 염기쌍보다 큰, 또는 약 50 염기쌍보다 큰, 100 염기쌍보다 큰, 또는 200 염기쌍보다 큰 크기를 갖는 이중-바코딩된 단일-가닥 폴리뉴클레오타이드를 선별하거나 정제하는 것을 포함하는 것인 방법.
89. 제86구체예 내지 제88구체예 중 어느 하나의 구체예에 있어서, 단계 (e) 전에, 50 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp, 또는 약 50 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp의 크기를 갖는 이중-바코딩된 단일-가닥 폴리뉴클레오타이드를 선별하거나 정제하는 것을 포함하는 것인 방법.
90. 제1구체예 내지 제89구체예 중 어느 하나의 구체예에 있어서, 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드는 순서대로 (5'에서 3'으로): 상기 제1 어댑터, 상기 용기 바코드, 상기 분자 바코드 및 상기 제2 어댑터를 포함하는 것인 방법.
91. 제1구체예 내지 제90구체예 중 어느 하나의 구체예에 있어서, 상기 제1 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드의 5' 영역에 또는 그 근처에 위치하는 것인 방법.
92. 제1구체예 내지 제91구체예 중 어느 하나의 구체예에 있어서, 상기 제2 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드의 3' 영역에 또는 그 근처에 위치하는 것인 방법.
93. 제10구체예 내지 제92구체예 중 어느 하나의 구체예에 있어서, 단계 (a)-(f) 중 하나 이상은 용액 내에서 수행되고 및/또는 고체 지지체, 임의로 비드의 존재하에서 수행되지 않는 것인 방법.
94. 제11구체예 내지 제93구체예 중 어느 하나의 구체예에 있어서, 적어도 단계 (c) 및 (d)는 용액 내에서 수행되고 및/또는 고체 지지체, 임의로 비드의 존재하에서 수행되지 않는 것인 방법.
95. 제10구체예 내지 제94구체예 중 어느 하나의 구체예에 있어서, 단계 (a)-(e) 각각은 용액 내에서 수행되고 및/또는 고체 지지체, 임의로 비드의 존재하에서 수행되지 않는 것인 방법.
96. 제1구체예 내지 제95구체예 중 어느 하나의 구체예에 있어서, 상기 세포 집단은 적어도 1x103, 5x103, 1x104, 5x104, 1x105, 5x105, 1x106, 또는 5x106 개 세포 또는 약 적어도 1x103, 5x103, 1x104, 5x104, 1x105, 5x105, 1x106, 또는 5x106 개 세포를 포함하는 것인 방법.
97. 제1구체예 내지 제96구체예 중 어느 하나의 구체예에 있어서, 상기 세포 집단은 대상체로부터의 생물학적 샘플로부터의 것인 방법.
98. 제97구체예에 있어서, 상기 생물학적 샘플은 전혈 샘플, 버피 코트 샘플, 말초 혈액 단핵 세포 (PBMC) 샘플, 비분획 T 세포 샘플, 림프구 샘플, 백혈구 샘플, 성분 채집물, 또는 백혈구 성분 채집물이거나 이를 포함하는 것인 방법.
99. 제1구체예 내지 제98구체예 중 어느 하나의 구체예에 있어서, 상기 세포 집단은 면역 세포를 포함하는 것인 방법.
100. 제1구체예 내지 제99구체예 중 어느 하나의 구체예에 있어서, 상기 면역 세포는 림프구 또는 항원 제시 세포를 포함하는 것인 방법.
101. 제1구체예 내지 제100구체예 중 어느 하나의 구체예에 있어서, 상기 면역 세포는 림프구 또는 그의 서브유형, B 세포 또는 그의 서브유형, T 세포 또는 그의 서브유형, 또는 이들의 조합인 것인 방법.
102. 제101구체예에 있어서, 상기 면역 세포는 CD4+ 및/또는 CD8+ T 세포인 T 세포인 것인 방법.
103. 제1구체예 내지 제102구체예 중 어느 하나의 구체예에 있어서, 상기 세포 집단은 중앙 기억 T 세포, 이펙터 기억 T 세포, 나이브 T 세포, 줄기 중앙 기억 T 세포, 이펙터 T 세포 및 조절 T 세포가 풍부하거나 이를 포함하는 것인 방법.
104. 제1구체예 내지 제101구체예 중 어느 하나의 구체예에 있어서, 상기 세포 집단은 기억 B-세포, 나이브 B-세포 또는 형질모세포 B-세포 (plasmablast B-cell)이 풍부한 것인 방법.
105. 제97구체예 내지 제104구체예 중 어느 하나의 구체예에 있어서, 상기 대상체는 인간 대상체인 것인 방법.
106. 제97구체예 내지 제105구체예 중 어느 하나의 구체예에 있어서, 상기 대상체는 암, 감염 또는 자가면역 질병 상태를 갖는 것인 방법.
107. 제106구체예에 있어서, 상기 감염은 바이러스성, 박테리아성 또는 진균성 감염인 것인 방법.
108. 제1구체예 내지 제107구체예 중 어느 하나의 구체예에 있어서, 상기 복수 개의 바코딩된 단일-가닥의 폴리뉴클레오타이드를 증폭하고, 그에 의하여 복수 개의 폴리뉴클레오타이드 주형을 생성하는 것을 더 포함하는 것인 방법.
109. 제1구체예 내지 제108구체예 중 어느 하나의 구체예에 있어서, 증폭은 상기 제1 어댑터 서열에 상보적인 제1 프라이머 및 상기 제2 어댑터 서열에 상보적인 제2 프라이머를 포함하는 제1 프라이머 세트의 존재하에서 수행되는 것인 방법.
110. 제109구체예에 있어서, 상기 제1 및/또는 제2 프라이머는 범용 프라이머인 것인 방법.
111. 제110구체예에 있어서, 상기 제1 및/또는 제2 프라이머는 상기 P7 프라이밍 부위 (C7) 또는 그의 인접 부분 또는 상기 P5 프라이밍 부위 (C5) 또는 그의 인접 부분에 상보적인 것인 방법.
112. 제110구체예 또는 제111구체예에 있어서, 상기 제1 프라이머는 상기 P7 프라이밍 부위 (C7) 또는 그의 인접 부분에 상보적이고 상기 제2 프라이머는 상기 P5 프라이밍 부위 (C5) 또는 그의 인접 부분에 상보적인 것인 방법.
113. 제111구체예 또는 제112구체예에 있어서,
상기 P7 프라이밍 부위 (C7) 또는 그의 인접 부분에 상보적인 상기 프라이머는 서열 CAAGCAGAAGACGGCATACGAGAT (SEQ ID NO:39)를 갖거나 포함하고; 및/또는
상기 P5 프라이밍 부위 (C5) 또는 그의 인접 부분에 상보적인 상기 프라이머는 서열 ACACGACGCTCTTCCGATCT (SEQ ID NO:27)을 포함하는 것인 방법.
114. 제109구체예 내지 제113구체예 중 어느 하나의 구체예에 있어서, 상기 제1 및/또는 제2 프라이머는 시퀀싱 어댑터를 더 포함하는 것인 방법.
115. 제114구체예에 있어서,
상기 P7 프라이밍 부위 (C7) 또는 그의 인접 부분에 상보적인 상기 프라이머는 서열 CAAGCAGAAGACGGCATACGAGAT[NNNNNN]GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (SEQ ID NO:28)을 더 포함하고; 및/또는
상기 P5 프라이밍 부위 (C5) 또는 그의 인접 부분에 상보적인 상기 프라이머는 서열 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCC (SEQ ID NO:76)을 포함하는 것인 방법.
116. 제1구체예 내지 제115구체예 중 어느 하나의 구체예에 있어서, 상기 복수 개의 바코딩된 폴리뉴클레오타이드 각각을 정제하는 것을 더 포함하는 것인 방법.
117. 제1구체예 내지 제116구체예 중 어느 하나의 구체예에 기재된 방법에 의하여 생성된 복수 개의 바코딩된 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 라이브러리.
118. 복수 개의 바코딩된 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 라이브러리로서,
상기 복수 개의 바코딩된 폴리뉴클레오타이드는 (i) 세포 집단 중 하나의 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드(들)의 앰플리콘을 포함하는 하나 이상의 표적 폴리뉴클레오타이드(들); 및 (ii) 각각이 상기 세포의 폴리뉴클레오타이드의 앰플리콘을 포함하는 폴리뉴클레오타이드의 집합체를 포함하고, 여기서 각각의 바코딩된 폴리뉴클레오타이드는:
제1 범용 프라이머에 상보적인 제1 범용 프라이밍 부위를 포함하는 제1 어댑터;
상기 세포 집단의 동일한 세포로부터의 (i) 및 (ii)로부터의 모든 바코딩된 폴리뉴클레오타이드에 대하여 동일한 용기 바코드; 및
제2 범용 프라이머에 상보적인 제2 범용 프라이밍 부위를 포함하는 제2 어댑터 서열을 포함한다.
119. 제118구체예에 있어서, 상기 복수 개의 바코딩된 폴리뉴클레오타이드 주형 각각은 각각의 폴리뉴클레오타이드 주형에 고유한 분자 바코드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
120. 제118구체예 또는 제119구체예에 있어서, 상기 세포 집단의 각각의 세포로부터의 상기 바코딩된 폴리뉴클레오타이드 주형의 집합체는, 집합적으로, 전사체 또는 부분적 전사체의 상보적 DNA (cDNA)를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
121. 제118구체예 내지 제120구체예 중 어느 하나의 구체예에 있어서, 상기 전사체 또는 부분적 전사체는, 집합적으로 상기 세포의 게놈에 존재하는 전사물의 적어도 60%, 70%, 75%, 80%, 85% 90% 95%, 96%, 97%, 98%, 99% 또는 100%를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
122. 제118구체예 내지 제121구체예 중 어느 하나의 구체예에 있어서, 상기 바코딩된 폴리뉴클레오타이드 주형 각각은 50 염기쌍보다 큰, 100 염기쌍보다 큰, 또는 200 염기쌍보다 큰, 또는 약 50 염기쌍보다 큰, 100 염기쌍보다 큰, 또는 200 염기쌍보다 큰 크기를 갖는 것인 폴리뉴클레오타이드 라이브러리.
123. 제118구체예 내지 제122구체예 중 어느 하나의 구체예에 있어서, 상기 바코딩된 단일-가닥 폴리뉴클레오타이드 각각은 50 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp, 또는 약 50 염기쌍 (bp) 내지 1500 bp, 50 bp 내지 1250 bp, 50 bp 내지 1000 bp, 50 bp 내지 750 bp, 50 bp 내지 500 bp, 100 bp 내지 1500 bp, 100 bp 내지 1250 bp, 100 bp 내지 1000 bp, 100 bp 내지 750 bp, 100 bp 내지 500 bp, 200 bp 내지 1500 bp, 200 bp 내지 1250 bp, 200 bp 내지 1000 bp, 200 bp 내지 750 bp 또는 250 bp 내지 500 bp 크기를 갖는 것인 폴리뉴클레오타이드 라이브러리.
124. 제118구체예 내지 제123구체예 중 어느 하나의 구체예에 있어서, 상기 제1 어댑터는 상기 용기 바코드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
125. 제118구체예 내지 제124구체예 중 어느 하나의 구체예에 있어서, 상기 제1 어댑터 및 제2 어댑터는 상이한 것인 폴리뉴클레오타이드 라이브러리.
126. 제118구체예 내지 제125구체예 중 어느 하나의 구체예에 있어서, 상기 제1 범용 프라이밍 부위 및/또는 제2 범용 프라이밍 부위는 P7 프라이밍 부위 (C7) 또는 그의 인접 부분 또는 P5 프라이밍 부위 (C5) 또는 그의 인접 부분이거나 이를 포함하고, 여기서 임의로 상기 인접 부분은 상보적 서열에 어닐링하기에 충분한 것인 폴리뉴클레오타이드 라이브러리.
127. 제118구체예 내지 제126구체예 중 어느 하나의 구체예에 있어서, 상기 제1 범용 프라이밍 부위는 상기 P7 프라이밍 부위 (C7) 또는 그의 인접 부분이거나 이를 포함하고 상기 제2 범용 프라이밍 부위는 상기 P5 프라이밍 부위 (C5) 또는 그의 인접 부분이거나 이를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
128. 제126구체예 또는 제127구체예에 있어서, 상기 P7 프라이밍 부위 (C7)은 서열 AGATCGGAAGAGCACACGTCTGAACTCCA(SEQ ID NO:77)을 포함하거나, 또는 그의 인접 부분인 것인 폴리뉴클레오타이드 라이브러리.
129. 제126구체예 또는 제127구체예에 있어서, 상기 P5 프라이밍 부위는 서열 AGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGTGGTCGCCGTATCATT (SEQ ID NO:78)을 포함하거나, 또는 그의 인접 부분인 것인 폴리뉴클레오타이드 라이브러리.
130. 제126구체예 내지 제129구체예 중 어느 하나의 구체예에 있어서, 상기 인접 부분은 적어도 15, 20, 25 또는 30 개 뉴클레오타이드 길이 또는 적어도 약 15, 20, 25 또는 30 개 뉴클레오타이드 길이를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
131. 제129구체예 또는 제130구체예에 있어서, 상기 P5 프라이밍 부위는 SEQ ID NO:25 (AGATCGGAAGAGCGTCGTGT)에 제시된 인접 부분인 것인 폴리뉴클레오타이드 라이브러리.
132. 제118구체예 내지 제131구체예 중 어느 하나의 구체예에 있어서, 상기 용기 바코딩된 올리고뉴클레오타이드는 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40 또는 50 개 뉴클레오타이드 또는 약 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40 또는 50 개 뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
133. 제118구체예 내지 제132구체예 중 어느 하나의 구체예에 있어서, 상기 용기 바코딩된 올리고뉴클레오타이드는 10 내지 30 개 뉴클레오타이드 또는 약 10 내지 30 개 뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
134. 제118구체예 내지 제133구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 면역 분자 또는 그의 사슬의 폴리뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
135. 제118구체예 내지 제134구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 각각 면역 분자 사슬의 폴리뉴클레오타이드를 포함하는 적어도 2 개의 표적 폴리뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
136. 제118구체예 내지 제135구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 TCR 또는 그의 사슬의 폴리뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
137. 제118구체예 내지 제136구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드는 T-세포 수용체 알파 (TCRα)의 제1 폴리뉴클레오타이드 및 T-세포 수용체 (TCRβ)의 제2 폴리뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
138. 제118구체예 내지 제136구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 T-세포 수용체 감마 (TCRγ)의 제1 폴리뉴클레오타이드 및 T-세포 수용체 델타 (TCR델타)의 제2 폴리뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
139. 제118구체예 내지 제135구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 항체 또는 그의 사슬의 폴리뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
140. 제118구체예 내지 제135구체예 및 제139구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)은 중쇄 면역글로불린 (IgH) 폴리뉴클레오타이드의 제1 폴리뉴클레오타이드 및 경쇄 면역글로불린 (IgL) 폴리뉴클레오타이드의 제2 폴리뉴클레오타이드를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
141. 제118구체예 내지 제140구체예 중 어느 하나의 구체예에 있어서, 상기 바코딩된 폴리뉴클레오타이드는 순서대로 (5'에서 3'으로): 상기 제1 어댑터, 상기 용기 바코드, 상기 분자 바코드 및 상기 제2 어댑터를 포함하는 것인 폴리뉴클레오타이드 라이브러리.
142. 제118구체예 내지 제141구체예 중 어느 하나의 구체예에 있어서, 상기 제1 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드의 5' 영역에 또는 그 근처에 위치하는 것인 폴리뉴클레오타이드 라이브러리.
143. 제118구체예 내지 제137구체예 중 어느 하나의 구체예에 있어서, 상기 제2 어댑터는 상기 이중-바코딩된 단일-가닥 폴리뉴클레오타이드의 3' 영역에 또는 그 근처에 위치하는 것인 폴리뉴클레오타이드 라이브러리.
144. 제1구체예 내지 제116구체예 중 어느 하나의 구체예에 의하여 생성된 또는 제118구체예 내지 제141구체예 중 어느 하나의 구체예의 폴리뉴클레오타이드 라이브러리로부터의, 상기 하나 이상의 복수 개의 바코딩된 폴리뉴클레오타이드를 시퀀싱하는 것을 포함하는, 시퀀싱 방법.
145. 제144구체예에 있어서, 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 전사체가 시퀀싱되는 것인 방법.
146. 제145구체예에 있어서, 상기 시퀀싱 전에 전체 전사체 또는 그의 일부를 증폭하는 것을 포함하는 것인 방법.
147. 제146구체예에 있어서, 상기 증폭은 각각 상기 제1 및 제2 어댑터 서열에 특이적인 제1 프라이머 및 제2 프라이머를 포함하는 제1 프라이머 세트를 이용하여 수행되는 것인 방법.
148. 제146구체예 또는 제147구체예에 있어서, 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 하나 이상의 표적 폴리뉴클레오타이드(들)이 시퀀싱되는 것인 방법.
149. 제148구체예에 있어서, 상기 시퀀싱 전에 상기 복수 개의 폴리뉴클레오타이드 주형으로부터의 하나 이상의 표적 폴리뉴클레오타이드(들)을 증폭하는 것을 더 포함하는 것인 방법.
150. 제149구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드(들)의 전장 서열(들)이 증폭되는 것인 방법.
151. 제149구체예 또는 제150구체예에 있어서, 증폭은 하나 이상의 표적 폴리뉴클레오타이드에 상보적인 하나 이상의 제1 프라이머 및 상기 제1 어댑터 서열에 상보적인 제2 프라이머를 포함하는 제2 프라이머 세트의 존재하에서 수행되는 것인 방법.
152. 제151구체예에 있어서, 상기 제2 프라이머 세트의 상기 제2 프라이머는 P7 프라이밍 부위 (C7) 또는 그의 인접 부분 또는 상기 P5 프라이밍 부위 (C5) 또는 그의 인접 부분에 상보적인 것인 방법.
153. 제151구체예 또는 제152구체예에 있어서, 상기 제2 프라이머 세트의 상기 제2 프라이머는 P7 프라이밍 부위 (C7) 또는 그의 인접 부분에 상보적인 것인 방법.
154. 제151구체예 또는 제153구체예에 있어서, 상기 제2 프라이머 세트의 상기 제2 프라이머는 서열 CAAGCAGAAGACGGCATACGAGAT (SEQ ID NO:39) 또는 CAAGCAGAAGACGGCATACGAGAT[NNNNNN]GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (SEQ ID NO:28)을 갖거나 포함하는 것인 방법.
155. 제151구체예 내지 제154구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 표적 폴리뉴클레오타이드에 상보적인 상기 하나 이상의 제1 프라이머는 면역 분자 또는 그의 사슬의 표적 서열에 특이적인 것인 방법.
156. 제155구체예에 있어서, 상기 면역 분자는 T 세포 수용체 또는 항체인 것인 방법.
157. 제155구체예 또는 제156구체예에 있어서, 상기 하나 이상의 제1 프라이머는 상기 면역 분자의 불변 영역의 표적 서열에 특이적인 것인 방법.
158. 제155구체예 내지 제157구체예 중 어느 하나의 구체예에 있어서, 상기 면역 분자는 TCR이고, 상기 하나 이상의 제1 프라이머는 AGTCTCTCAGCTGGTACACGG (SEQ ID NO:37), ATGGCTCAAACACAGCGACCTC (SEQ ID NO:38) 또는 이들의 조합을 포함하는 것인 방법.
159. 제155구체예 내지 제158구체예 중 어느 하나의 구체예에 있어서, 상기 면역 분자는 항체고, 상기 하나 이상의 제1 프라이머는 SEQ ID NOs: 29-36 중 어느 하나 또는 이들의 조합을 포함하는 것인 방법.
160. 제144구체예 내지 제159구체예 중 어느 하나의 구체예에 있어서, 상기 하나 이상의 바코딩된 폴리뉴클레오타이드(들)의 세포 기원을 결정하는 것을 더 포함하는 것인 방법.
161. 제160구체예에 있어서, 상기 세포 기원을 결정하는 것은 상기 동일한 세포로부터인 것과 동일한 용기 바코드를 갖는 서열 정보를 식별하는 것을 포함하는 것인 방법.
162. 제144구체예 또는 제161구체예에 있어서, 상기 표적 폴리뉴클레오타이드는 제1 폴리뉴클레오타이드 사슬 및 제2 폴리뉴클레오타이드 사슬을 포함하는 면역 분자이고, 상기 방법은 동일한 용기 바코드의 존재에 의하여 상기 제1 폴리뉴클레오타이드 사슬 및 상기 제2 폴리뉴클레오타이드 사슬을 상기 동일한 세포에 매칭시키는 것을 포함하는 것인 방법.
163. 제154구체예 내지 제162구체예 중 어느 하나의 구체예에 있어서, 상기 동일한 분자 바코드를 갖는 폴리뉴클레오타이드의 수를 정량하거나 결정하는 것을 더 포함하는 것인 방법.
164. 제154구체예 내지 제163구체예 중 어느 하나의 구체예에 있어서, 상기 방법은 동일한 용기 바코드를 갖는 전사체 서열 및 표적 폴리뉴클레오타이드 서열을 식별하고 그에 의하여 상기 표적 폴리뉴클레오타이드(들)을 보유하는 세포의 전사체 정보를 식별하는 것을 포함하는 것인 방법.
165. 전사체 분석 방법으로서, 상기 방법은:
(a) 제1구체예 내지 제116구체예 중 어느 하나의 구체예에 기재된 방법에 의하여 생성되는 상기 복수 개의 바코딩된 폴리뉴클레오타이드부터의 또는 제118구체예 내지 제141구체예 중 어느 하나의 구체예에 기재된 상기 폴리뉴클레오타이드 라이브러리의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 바코딩된 폴리뉴클레오타이드로부터 표적 폴리뉴클레오타이드를 시퀀싱하여, 그에 의하여 상기 복수 개의 세포로부터 상기 표적 폴리뉴클레오타이드에 대한 서열 정보를 생성하는 단계;
(b) 제1구체예 내지 제116구체예 중 어느 하나의 구체예에 기재된 방법에 의하여 생성되는 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터 또는 제118구체예 내지 제141구체예 중 어느 하나의 구체예에 기재된 폴리뉴클레오타이드 라이브러리의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터 전체 전사체 또는 이의 부분을 시퀀싱하고, 그에 의하여 상기 복수 개의 세포로부터 전사체 데이터를 생성하는 단계; 및
(c) 동일한 세포로부터의 것과 동일한 용기 바코드를 갖는 (a)로부터의 및 (b)로부터의 서열 정보를 식별하는 단계를 포함한다.
166. 선택된 단일 세포의 전사체를 분석하는 방법으로서, 상기 방법은:
(a) 제1구체예 내지 제116구체예 중 어느 하나의 구체예에 기재된 방법에 의하여 생성되는 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 또는 제118구체예 내지 제141구체예 중 어느 하나의 구체예에 기재된 폴리뉴클레오타이드 라이브러리의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 표적 폴리뉴클레오타이드를 증폭하고 시퀀싱하여, 그에 의하여 상기 복수 개의 세포 중 적어도 하나에서 상기 표적 폴리뉴클레오타이드 각각에 대한 서열 정보를 생성하는 단계;
(b) (a)에서 시퀀싱된 상기 표적 폴리뉴클레오타이드 중 하나와 관련된 용기 바코드(들)을 동정하고, 그에 의하여 상기 표적 폴리뉴클레오타이드를 보유하는 선택된 단일 세포를 동정하는 단계;
(c) 상기 용기 바코드를 보유하는 세포의 상기 복수 개의 바코딩된 폴리뉴클레오타이드로부터 전사체 또는 이의 부분을 증폭하고 시퀀싱하고, 그에 의하여 상기 선택된 표적 폴리펩타이드-발현 세포로부터의 전사체 데이터를 생성하는 단계를 포함한다.
167. 제166구체예에 있어서, 상기 전사체 또는 이의 부분은 (b)에서 동정된 상기 용기 바코드에 특이적인 프라이머 및 상기 바코딩된 폴리뉴클레오타이드의 상기 제2 어댑터 서열에 특이적인 프라이머를 이용하여 상기 선택된 세포로부터 증폭 또는 시퀀싱되는 것인 방법.
168. 전사체 또는 이의 부분에 대한 서열 정보와, 동일한 세포로부터의 표적 폴리뉴클레오타이드(들) 중 적어도 하나를 매칭시키는 단계를 포함하고,
여기서 상기 서열 정보는 제1구체예 내지 제114구체예 중 어느 하나의 구체예에 기재된 방법에 의하여 생성되는 복수 개의 바코딩된 폴리뉴클레오타이드로부터 또는 제118구체예 내지 제141구체예 중 어느 하나의 구체예에 기재된 폴리뉴클레오타이드 라이브러리의 복수 개의 폴리뉴클레오타이드 주형으로부터 결정되거나, 또는 제154구체예 내지 제164구체예 중 어느 하나의 구체예에 기재된 방법으로부터 결정되는 것인 전사체 분석 방법.
169. 제168구체예에 있어서, 상기 동일한 용기 바코드를 갖는 서열은 동일한 세포로부터인 것과 매칭되는 것인 방법.
170. 제165구체예 내지 제169구체예 중 어느 하나의 구체예에 있어서, 상기 전사체 데이터는 상기 세포의 기능 또는 활성과 관련된 파라미터, 특성, 특징 또는 표현형을 포함하는 것인 방법.
171. 제170구체예에 있어서, 상기 전사체 데이터는 상기 세포의 활성화, 고갈 또는 증식 활성과 관련된 것인 방법.
IX. 실시예
하기 실시예는 오직 설명의 목적으로 포함된 것이고 발명의 범위를 제한하는 것으로 의도되지 않는다.
실시예 1 - 단일-세포 폴리뉴클레오타이드 시퀀싱을 위한 에먼전에서의 사물 바코딩
A. 세포 준비
단일-세포 폴리뉴클레오타이드 시퀀싱을 수행하기 위한 단일 세포 현탁액을 총 말초 혈액 단핵 세포 (PBMC)로부터 수득하였다. 대략 50 mL의 혈액을 소듐 헤파린 (BD)을 함유한 Vacutainer CPT Cell Preparation Tubes에 넣고, 1800 × g에서 20 분 동안 원심 분리하고, 세포 제조 완충제 (2% 소 태아 혈청 및 2 mM EDTA가 보충된 1x PBS)에서 2 회 세척하고, 200 × g에서 스핀을 주어 혈소판을 제거하고, 결과물인 PBMC를 RPMI-1640 배지 (Life Technologies) + 20% 소 태아 혈청 + 10% DMSO에 -80℃에서 필요할 때까지 동결 보존하였다. 에멀젼 생성 전에, PBMC를 해동시키고, Cell Buffer: 1 x Dulbecco's Phosphate-Buffered Saline (PBS)에서 원심 분리 (10 분간 200 × g)로 2 회 세척하였다. 이어서, 세포를 Cell Buffer에서 3.5 x 106 세포/mL의 세포 농도로 희석시켰다. 이어서, 현탁액을 20 ㎛ 세포 스트레이너를 통해 피펫팅하였다.
B. 에멀젼에서의 바코딩
준비된 세포 및 반응 혼합물을 함유하는 에멀젼을 형성하였다. 반응 혼합물은 액적 형성 과정 동안 세포 현탁액과 1:1 부피비로 혼합된 2x 농축 물로서 제조되었다.
1. 에멀젼 반응 혼합물의 제조
하기 표 E1의 시약 및 올리고뉴클레오타이드를 함유하는 에멀젼 반응 혼합물을 PCR-클린 후드에서 실온 혼합하였다.
Figure 112020008957713-pct00001
2. 단일 세포로부터 이중- 바코딩된 전사물 라이브러리 생성
이중-바코딩된 폴리뉴클레오타이드 라이브러리를 생성하는 예시적인 방법의 개요가 도 1a 및 도 1b에 도시된다. 준비된 세포 및 반응 혼합물을 사용하여 에멀젼을 형성하였다. 에멀젼 생성 플랫폼은 각각 Mitos Flow Rate 센서를 포함하는, 단일 공기 압축기로 구동되는 3 개의 Mitos P-Pump (Dolomite Microfluidics)를 포함하여, 2 개의 수성상과 1 개의 플루오로친화성 (fluorophilic) 오일 연속상의 플로오로친화적-코팅된 쿼츠 Dolomite Small 2-Reagent 칩으로의 컴퓨터-제어 흐름을 허용한다. 하나의 수성 유입 채널은 원하는 적-당-세포 (cells-per-droplet) 점유 수준을 생성하기 위해 필요한 밀도로 세포를 함유하였고 (일부 구체예에서 이러한 원하는 적-당-세포 점유 수준은 1임), 제2 수성 채널은 용해 및 반응 혼합물을 함유하였다.
100 ㎕의 Hamilton Microliter 시린지를 사용하여 각각의 반응 혼합물 약 100 ㎕의 2 회 주입으로 100 ㎕ 내경 PEEK 튜빙 샘플 루프를 부하시켰다. 100 ㎕ Hamilton Gastight 시린지를 사용하여 약 110 ㎕의 세포 현탁액을 ~110 ㎕, 0.2 mm 내부 직경 FEP 튜빙 루프에 넣었다. 루프는 세포가 정착 및/또는 다발화되는 것을 방지하기 위해 약 1-2 초마다 한 번씩 세포 루프를 지속적으로 반전시키는 기계적 회전자에 부착되었다. 에멀젼은 칩의 2 개의 오일 채널로부터의 동시 오일 흐름 대비 Dolomite 2-시약 칩을 통한 동일한 유속의 수성 상의 집중 유동 분사에 의해 형성되었다. 바깥 오일 채널은 HFE7500 (Novec 7500) 플루오로카본 오일에 0.5-5.0% (w/v) 폴리에틸렌 글리콜-계 계면활성제를 함유하였다. 에멀젼 분사를 일정한 유속으로 수행하였다 (세포 상 및 반응 상 채널에서 동일). 냉각된 블록에서 대략 0℃로 유지된 0.2 mL PCR 스트립 튜브 (Eppendorf)에 적가함으로써, 12 cm, 0.5 mm 내경 PEEK 튜브를 통해 에멀젼 칩 출력이 수집되었다.
모세관 마이크로피펫을 사용하여 각 튜브의 바닥에서 과량의 오일을 제거하였다. 각각의 에멀젼 분획을 40 ㎕의 오버레이 용액: 25 mM Na-EDTA, pH 8.0으로 부드럽게 오버레이시켰다.
전사물 태깅 반응을 위해 열 사이클러에서 에멀젼을 인큐베이션시켰다. 간단히, 45 분 역전사 (RT) 단계 동안, RNA는 42℃에서 폴리A-특이적 RT 프라이머 (올리고-dT 프라이머)(SEQ ID NO:1)을 이용하여 역전사되었는데, 무작위화된 분자 바코드를 함유하는 범용 어댑터 서열 (SEQ ID NO:3)의 주형-스위치-기반 첨가와 함께였다 (예컨대, 도 1a 참조). RT 후, 에멀젼을 40 사이클의 열 순환 (각 사이클: 10 초간 82℃, 25 초간 65℃) 적용하여 최초 용해 및 반응 믹스에서 20,000 카피 (cp)/㎕로 희석된 용기 바코드 주형 (SEQ ID NO:2)의 PCR 증폭을 수행하여, 15,000 cp/㎕ 또는 ~1 per ~65 pL 액적의 최종 혼합물에서 농도를 생성한다 (예컨대, 도 1b 참조). 용기 바코드 (본 명세서에서 "액적 바코드"라고도 지칭됨)의 한 말단은 Illumina 판독 2 ("P7") 프라이머 부위 (SEQ ID NO:77)를 함유하는 반면, 다른 말단은 범용 어댑터 올리고뉴클레오타이드 (SEQ ID NO:4)의 공통 서열과 매치된다. 따라서, 따라서, PCR 동안, 주형-스위칭된 cDNA는 증폭된 용기 바코드 가닥에 어닐링되고 중첩 연장에 의해 스플라이싱되어 분자 바코드 및 용기 바코드 서열을 함유하는 전장 생성물을 생성할 수 있었다.
전술한 방법은 실시예 5에 기술된 바와 같이 어댑터를 첨가하고, 실시예 6-8에 기술된 바와 같이 전사체 및 표적-특이적 분석에 사용되도록 조정될 수 있다.
실시예 2 - 단일-세포 폴리뉴클레오타이드 시퀀싱을 위한 표적-특이적 프라이머를 이용한 에멀젼에서의 전사물 바코딩
A. 세포 준비
50 mL 혈액을 소듐 헤파린 (BD)을 함유한 Vacutainer CPT Cell Preparation Tube에 넣고, 1800 x g에서 20 분 동안 원심 분리하고, 세포 준비 완충제 (2% 소 태아 혈청 및 2 mM EDTA가 보충된 1 x PBS)에서 2 회 세척하고, 200 xg에서 스핀하여 혈소판을 제거하고, 결과물 PBMC를 RPMI-1640 배지 (Life Technologies) + 20% 소 태아 혈청 + 10% DMSO에서 -80℃에서 필요할 때까지 동결 보존하였다. 에멀젼 생성 전에, PBMC를 해동시키고, 세포 제조 완충제로 2 회 세척 하고 계수하였다. B-세포는 음성 선택 기반 인간 B-세포 농축 키트 (Stem Cell Technologies)를 사용하여 단리되었다. 세포를 20 미크론 세포 스트레이너를 통해 여과시키고 세포 준비 완충액에서 6.2E + 06 세포/ml (3 백만 B-세포 실험) 또는 3.1E + 06 세포/ml (PGT- 공여체 및 난소 종양 실험)로 희석하였다.
B. 에멀젼에서 면역 수용체 바코딩
에멀젼 생성 플랫폼은 각각 Mitos Flow Rate 센서를 포함하는, 하나의 공기 압축기에 의해 구동되는 3 개의 Mitos P-Pump (Dolomite Microfluidics)로 구성되어, 2 개의 수성상과 1 개의 플루오로친화성 오일 연속상의 플로오로친화적-코팅된 쿼츠 Dolomite Small 2-Reagent 칩으로의 컴퓨터-제어 흐름을 허용한다. 하나의 수성 유입 채널은 원하는 적-당-세포 점유 수준을 생성하기 위해 필요한 밀도로 세포를 함유한 반면, 제2 수성 채널은 하기 표 E2에서 제시되는 반응 완충제 및 올리고뉴클레오타이드, 5 단위/㎕ MuMLV-계 역전사 효소 (Thermo Scientific) 및 0.1 단위/㎕ Herculase II PCR 중합 효소로 구성되는 용해 및 반응 혼합물을 함유하였다. 100-㎕ Hamilton Microliter 시린지를 사용하여 각각의 LR 믹스 ~ 100 ㎕의 2 회 주입으로 100 ㎕ 내부 직경 PEEK 튜빙 샘플 루프를 부하시켰다. 100-㎕ Hamilton Gastight 시린지를 사용하여 ~ 110 ㎕의 세포 현탁액을 ~ 100-㎕, 0.2 mm 내부 직경 FEP 튜빙 루프에 넣었다. 에멀젼은 칩의 2 개의 오일 채널로부터의 동시 오일 흐름 대비 2-시약 칩을 통한 동일한 유속의 수성 상의 집중 유동 분사에 의해 형성되었다. 칩 배출 채널을 이탈하는 에멀젼을 콜드 블록 (cold block) 상의 0.2-ml PCR 스트립 튜브 (Eppendorf)에 떨어뜨린 후, 튜브 바닥에서 피펫팅하여 여분의 오일을 제거하고 40 ㎕의 오버레이 용액 (25mM Na-EDTA, pH 8.0)을 첨가하고 전사물 태깅 반응을 위하여 튜브를 표준 열순환기로 옮겼다.
Figure 112020008957713-pct00002
Figure 112020008957713-pct00003
45 분 역전사 (RT) 단계 동안, RNA를, 전술한 바와 같이 무작위화된 분자 바코드를 함유하는 범용 어댑터 서열의 주형-스위치-기반 첨가와 함께 42℃에서 표적-특이적 RT 프라이머 (표 E2)를 이용하여 역전사시켰다 (Shugay, M. et al. Towards error-free profiling of immune repertoires. Nat. Methods 11, 653-655 (2014); Islam, S. et al. Highly multiplexed and strand-specific single-cell RNA 5' sequencing. Nat. Protoc . 7, 813-828 (2012))(예컨대, 도 1a 참조). RT에 이어서, 에멀젼을 40 사이클의 열 순환 (각 사이클: 10 초간 82℃, 25 초간 65℃)에 적용하여 초기 용해 및 반응 믹스에서 30,000 cp/㎕로 희석된 액적 바코드 주형의 PCR 증폭을 수행하여, ~ 65 pL 액적당 15,000 cp/㎕ 또는 ~ 1의 최종 혼합물에서의 농도를 생성한다. 용기 바코드 (액적 바코드)의 한 말단은 Illumina 판독 2 ("P7") 프라이머 부위 (SEQ ID NO:77)를 함유하는 반면, 다른 말단은 범용 어댑터 올리고뉴클레오타이드 (SEQ ID NO:4)의 공통 서열과 매치된다 (예컨대, 도 1b 참조). 따라서, PCR 동안, 주형-스위칭된 cDNA는 증폭된 용기 바코드 가닥에 어닐링되고 중첩 연장에 의해 스플라이싱되어 분자 바코드 및 용기 바코드 서열을 함유하는 전장 생성물을 생성할 수 있다.
상기 기재된 방법은 예컨대 역전사 단계 동안 무작위적 6량체 올리고뉴클레오타이드의 포함에 의하는, 전사체 또는 그의 일부을 역전사시키는 프라이머를 포함하도록 조정될 수 있다. 이들 방법은 또한 실시예 5에 기술된 바와 같이 어댑터를 첨가하고, 실시예 6 내지 8에 기술된 바와 같이 전사체 및 표적-특이적 분석에 사용되도록 조정될 수 있다.
실시예 3 - 단일-세포 폴리뉴클레오타이드 시퀀싱을 위한 에멀젼에서의 표적 서열의 전사물 및 전사체의 바코딩 방법
A. 세포 준비
동결보존된 PBMC 현탁액을 빠르게 해동하고 실온에서 10 부피의 RPMI + 10% FBS에 첨가하였다. 세포를 350 x g에서 8 분 동안 원심 분리하여 펠렛화하고 2x10^6 세포/mL로 RPMI + 10% FBS에 재현탁시켰다. PBMC를 조직 배양 인큐베이터에서 대략 16 시간 동안 휴지시켰다.
휴지된 PBMC를 대략 10:1 PBMC:APC의 비율로 자가 항원-제시 세포와 공동 배양하였다. 이 경우에, APC는 조사된 HSV-감염된 HeLa 세포에 노출되었던 자가 단핵구-유래 수지상 세포였다. 공동-배양물을 5 시간 동안 인큐베이션하였다. 본 명세서에 기재된 방법으로 제한하려는 의도는 없지만, 약 5 시간의 배양 시간은 항원-특이적 세포가 항원에 반응하거나, 또는 다른 세포에 의하여 배지 내로 방출 된 사이토카인에 대해 반응하여 새로운 mRNA를 발현하기에 충분할 것으로 생각된다.
PBMC를 상하로 부드럽게 피펫팅하여 공동-배양물로부터 이탈시키고 새로운 튜브로 이동시켰다. 세포를 얼음 위에 놓고 CELL 완충액 (20 g/L 어류 스킨 젤라틴 (Biotium), 155 mM KCl, 0.05% 소듐 아자이드, 5 mM HEPES-Na pH 7.5) + 2 mM EDTA에서 세척하고, 이어서 CELL 완충액에서, 마지막으로 20-미크론 메쉬 스트레이너를 통해 여과되고 CELL 완충액에 재현탁되었다. 아크리딘 오렌지-프로피디움 요오다이드로 염색하여 세포를 계수하고 생존력을 평가하였다. 최종 세포 밀도는 3.5 × 10^6 생존 (프로피디움 요오다이드-음성) 세포/mL로 조정되었고 얼음에 보관하였다.
에멀젼 생성 직전에, 세포 현탁액을 가열하고 1 분 동안 얼음 위에 다시 두었다.
B. 에멀젼에서의 바코딩
이전 실시예에서와 같이, 단일 세포 폴리뉴클레오타이드 분자에 분자 바코드 및 용기 바코드를 부가하기 위해, 후속 전사체 태깅 반응을 위한 반응 혼합물 및 준비된 세포를 함유하는 에멀젼이 형성되었다. 반응 혼합물은 2x 농축물로서 제조되며, 이는 액적 형성 과정 동안 세포 현탁액과 1:1 부피비로 혼합된다.
1. 에멀젼 반응 혼합물의 제조
하기 표 E3의 시약 및 올리고뉴클레오타이드를 함유하는 반응 혼합물을 제조하였다. 시퀀싱 중 다양성을 증가시키기 위하여 VB 올리고 1 (SEQ ID NO:6), 2 (SEQ ID NO:7), 3 (SEQ ID NO:8), 및 4 (SEQ ID NO:9)를 균등몰 혼합물로서 첨가하여 앰플리콘의 염기-시프트된 (교차된) 앙상블을 생성하였다. 반응 혼합물을 이전 실시예에서 기술된 에멀젼 생성 장치의 반응 샘플 루프에 로딩하였다.
Figure 112020008957713-pct00004
Figure 112020008957713-pct00005
2. 단일 세포로부터 이중- 바코딩된 전사물 라이브러리 생성
준비된 세포 및 반응 혼합물을 사용하여 에멀젼을 형성하였다. 에멀젼 생성 플랫폼은 각각 Mitos Flow Rate 센서를 포함하는, 단일 공기 압축기로 구동되는 3 개의 Mitos P-Pump (Dolomite Microfluidics)를 포함하여, 2 개의 수성상과 1 개의 플루오로친화성 (fluorophilic) 오일 연속상의 플로오로친화적-코팅된 쿼츠 Dolomite Small 2-Reagent 칩으로의 컴퓨터-제어 흐름을 허용한다. 하나의 수성 유입 채널은 원하는 적-당-세포 (cells-per-droplet) 점유 수준을 생성하기 위해 필요한 밀도로 세포를 함유하였고, 제2 수성 채널은 용해 및 반응 혼합물을 함유하였다.
100 ㎕의 Hamilton Microliter 시린지를 사용하여 각각의 반응 혼합물 약 100 ㎕의 2 회 주입으로 100 ㎕ 내경 PEEK 튜빙 샘플 루프를 부하시켰다. 100 ㎕ Hamilton Gastight 시린지를 사용하여 약 110 ㎕의 세포 현탁액을 ~110 ㎕, 0.2 mm 내부 직경 FEP 튜빙 루프에 넣었다. 루프는 세포가 정착 및/또는 다발화되는 것을 방지하기 위해 약 1-2 초마다 한 번씩 세포 루프를 지속적으로 반전시키는 기계적 회전자에 부착되었다. 에멀젼은 칩의 2 개의 오일 채널로부터의 동시 오일 흐름 대비 Dolomite 2-시약 칩을 통한 동일한 유속의 수성 상의 집중 유동 분사에 의해 형성되었다. 바깥 오일 채널은 HFE7500 (Novec 7500) 플루오로카본 오일에 0.5-5.0% (w/v) 폴리에틸렌 글리콜-계 계면활성제를 함유하였다. 에멀젼 분사를 일정한 유속으로 수행하였다 (세포 상 및 반응 상 채널에서 동일). 냉각된 블록에서 대략 0℃로 유지된 4 반복체 (replicate) 0.2 mL PCR 스트립 튜브 (Eppendorf)에 적가함으로써, 12 cm, 0.5 mm 내경 PEEK 튜브를 통해 에멀젼 칩 출력이 수집되었다. 모세관 마이크로피펫을 사용하여 각 튜브의 바닥에서 과량의 오일을 제거하였다.
전사물 태깅 반응을 위해 열 순환기에서 에멀젼을 인큐베이션시켰다. 간단히, 반응물을 4℃에서 10 분 동안 사전 냉각시켰다. 이어서, 45 분 역전사 (RT) 단계 동안, RNA를 37℃에서 역전사시켰는데, 표적-특이적 프라이머와 함께이거나, 또는 6량체 올리고뉴클레오타이드의 결합에 기초한 무작위 프라이밍 및 무작위화된 분자 바코드를 함유하는 범용 어댑터의 주형-스위치-기반 첨가와 함께였고, 각각 고유한 분자 식별자 (바코드)를 갖는 cDNA 분자를 생성하였다. RT 후, 온도를 94℃에서 10 분 동안 유지시켰다. 그 후, 에멀젼을 50 사이클의 열 순환 (각 사이클: 10 초간 83℃ (변성), 25 초간 65℃ (연장))에 적용하여 용기 바코드 올리고를 증폭시켰다. VB 올리고의 증폭 후, 에멀젼을 10 회 더 높은 온도의 열 순환 (각 사이클: 10 초간 95℃ (변성), 25 초간 63℃ (어닐링), 2분 20초간 72℃ (연장))에 적용시켰다. 열 순환 사이클이 완료된 후, 에멀젼을 4℃에서 유지하였다.
실시예 4 - 이중- 바코딩된 cDNA의 정제
각각의 에멀젼 분획 튜브에 대해, 상기 실시예에서 생성된 cDNA 전사물을 이중-바코딩한 후, 동일한 부피의 1:1 (v:v) 퍼플루오로옥탄올:FC-40과 혼합하여 에멀젼을 분해하고 (PCR 후), EDTA를 5 mM의 최종 농도로 첨가하여 DNA 중합을 정지시켰다. 대략 0.1 부피의 Qiagen Protease를 첨가하고, 부서진 에멀젼을 10 내지 15 분 동안 50℃에서 인큐베이션한 후, 튜브를 95℃에서 3 분 동안 인큐베이션함으로써 프로테아제의 열 불활성화를 수행하였다. 튜브를 잠시 원심 분리하고 상부 수성 상을 새로운 튜브로 옮겼다.
이중-바코딩된 cDNA를 제조업자의 지시에 따라 1.8 부피의 AMPure XP (Beckman Coulter)로 정제하여 농축 및 탈염시켰다. cDNA를 비드로부터 용출시키고, 8 ㎕의 0.1 M 소듐 하이드록사이드 + 1 mM EDTA를 첨가하고 3 분 동안 50℃로 가열함으로써 변성시켰다. RT 프라이머의 5' 비오틴화로 인해 전장 생성물이 비오틴을 함유한 경우, 이러한 전장 생성물은 스트렙타비딘 비드 상에서의 세정에 의해 과량의 액적 바코드 PCR 생성물로부터 분리되었다.
2 ㎕의 6X DNA 로딩 염료 (New England Biolabs)를 첨가한 후, 변성 된 단일-가닥 cDNA를 5 V/cm에서 35 분간 30 mM NaOH + 1mM EDTA에서 1.5% (w/v) 아가로오스 겔 상에서 분리하였다. 겔의 pH를 중화시킨 후, 100-1000 nt에 상응하는 크기 범위 내 cDNA를 함유하는 겔을 절제하고, DNA 회수 키트 (예컨대, ZymocleanTM Gel DNA Recovery Kit, Zymo Research)를 사용하고 20 ㎕의 10 mM Tris-Cl, pH 8.5 + 0.05% TWEEN® 20으로 용리하여 절제된 아가로오스로부터 cDNA를 정제하였다. cDNA를 1.8 부피의 AMPure XP 비드로 더 탈염시키고 95℃에서 10 초간 가열하여 10.5 ㎕의 10 mM Tris-Cl, pH 8.0 + 0.05 % TWEEN® 20 내로 용리시키고 얼음 위에 두어 침전시켰다.
실시예 5 - 3' 어댑터 서열의 이중- 바코딩된 cDNA 전사물로의 연결
공지된 프라이밍 부위를 함유하는 어댑터 서열을 실시예 3에 기재된 바와 같이 생성된 이중-바코딩된 cDNA 전사물에 부가하고, 실시예 4에 기재된 바와 같이 정제하였다. 상기 어댑터 서열의 부가는 공지의 프라이머를 이용하여 전사물 전부에 대한 증폭, 클로닝, 또는 시퀀싱, 예를 들어 차세대 시퀀싱을 가능하게 한다. 몇몇 어댑터 서열이 공지되어 있고 시퀀싱에 일상적으로 사용되는데, 예컨대 본 명세서에서 사용된 예시적인 P5 어댑터 서열이다.
1. 3' 어댑터 서열 첨가 방법
단일-가닥의, 이중-바코딩된 cDNA 서열의 알려지지 않은 3' 말단에 어댑터 서열을 첨가하기 위해 몇 가지 방법이 사용되었다. ssDNA 어댑터를 연결하는 리가아제, 예컨대 Thermostable App 리가아제 (NEB) 및 CircLigase II (Epicentre)가 이중-바코딩된 cDNA 전사물의 3' 말단에 어댑터 서열을 추가하기 위하여 사용되었다. cDNA의 3' 말단에 비-주형 뉴클레오타이드의 효소적 첨가에 기초한, 시판 키트 (Swift Biosciences Accel-NGS 1S DNA Kit) 또한 어댑터 서열을 첨가하기 위하여 사용되었다. 또한, cDNA의 3' 말단에 돌출되어 있는 어댑터에 어닐링되는 축퇴 스플린트를 사용하는 방법이 사용되었고, 최대 6 개의 뉴클레오타이드 축퇴 오버행이었다 (즉, NNNNNN; SEQ ID NO:24). 축퇴 오버행에 대해, NNNNNN (SEQ ID NO:24)가 시험된 프로토콜에서 가장 잘 작동하는 것으로 나타났다.
2. 6- 뉴클레오타이드 오버행을 갖는 축퇴 스플린트를 사용한 이중- 바코딩된 cDNA로의 3' 어댑터 서열 부가
짧은 P5 프라이밍 서열을 함유하는 올리고뉴클레오타이드, /5Phos/ AGATCGGAAGAGCGTCGTGT /3AmMO/ (SEQ ID NO:25) 및 ACACGACGCTCTTCCGATCT NNNNNN /3AmMO/ (SEQ ID NO:26)로 제시되는 스플린트 올리고뉴클레오타이드를 1.2:1의 비로 혼합함으로써 스플린트-어댑터 이중체 분자를 형성하였다. 어닐링 완충액이 30 mM HEPES-Na pH 7.5, 0.1 M KCl에 첨가되었다. 용액을 열 순환기에서 85℃에서 2 분 동안 가열하고 0.1℃/초의 속도로 37℃로 냉각시켰다.
상기 파트 A로부터 회수된, 이중-바코딩된 cDNA 전사체를 그 후 스플린트-어댑터 용액과 혼합하였다. 이어서, 동일 부피의 Blunt/TA Ligase Master Mix (New England Biolabs)를 혼합물에 첨가하고 실온에서 인큐베이션함으로써 어댑터를 cDNA 전사물에 연결시켰다. 과량의 어댑터 DNA는 AMPure XP로 혼합물을 정제하고 10 mM Tris-Cl, pH 8.0 + 0.05 % TWEEN® 20에서 DNA를 용리하여 제거되었다.
실시예 6 - 전사체 라이브러리의 PCR 증폭 및 시퀀싱
A. 폴리뉴클레오타이드의 라이브러리 증폭
정제된 이중-바코딩되고 범용 어댑터-표지된 서열은, 전사물의 이중 바코드 및 코딩 서열의 5'에 위치된 (cDNA 전사물의 5' 말단), C7 범용 어댑터 서열 (SEQ ID NO:28)에 상보적인 포워드 프라이머, 및 전사물의 이중 바코드 및 코딩 서열의 3'에 위치된 (cDNA 전사물의 3' 말단), P5 범용 어댑터 서열 (SEQ ID NO:27)에 상보적인 리버스 프라이머를 이용하여 8 사이클 동안 PCR 증폭되었다 (PCR0).
PCR0 반응 혼합물 (어댑터-연결된 cDNA (실시예 5에서 생성됨), DNA 중합 효소, C7 포워드 프라이머, P5 리버스 프라이머, dNTP 및 반응 완충액을 함유함)을 처음에 98℃에서 1 분 동안 변성시킨 후, 8 사이클의 열 순환 (각 사이클: 10 초간 98℃, 20 초간 69℃, 10 초간 72℃) 및 72℃에서 2 분의 최종 연장을 수행하였다. PCR 완료 후, 혼합물을 4℃에서 유지시켰다.
각각의 PCR0-생성된 cDNA 서열은 C7 어댑터 서열, 용기 바코드 서열 (숙주 세포 식별용), 분자 바코드 (전사물 식별용), 전사물 및 P5 어댑터 서열을 함유하였다. 이어서 증폭된 라이브러리 (PCR0 생성물)를 AMPure XP 비드를 사용하여 정제하고 10 mM Tris-Cl, pH 8.0 + 0.05 % TWEEN® 20에서 용리시켰다.
이어서, 정제된 전사체 라이브러리를 사용하여 다음 중 하나 이상을 시퀀싱하였다: 하나 이상의 전장 표적 유전자(들), 예컫내 면역 수용체, 에멀젼 내의 모든 세포의 전사체 및/또는 하기 기재된 바와 같은 에멀젼 내의 하나 이상의 선택된 세포(들)의 전사체.
B. 표적 유전자 시퀀싱
1. PCR1 : 표적 유전자(들)의 증폭
선택된 표적 유전자를 증폭시키기 위해, PCR0에 사용된 범용 포워드 프라이머 (C7-인덱스-P7 프라이머; SEQ ID NO:28) 및 원하는 표적(들)에 특이적인 리버스 프라이머 (예를 들어, 면역글로불린- 또는 T-세포 수용체-특이적 프라이머)를 사용하여 PCR0 생성물이 증폭되었다. PCR1 반응에 사용된 예시적인 표적 프라이머가 하기 표 E4에 제시되어 있다.
Figure 112020008957713-pct00006
PCR1 반응 혼합물 (PCR0 생성물 (상기 파트 A에서 생성됨), DNA 중합 효소, C7-인덱스-P7 포워드 프라이머, 표적-특이적 리버스 프라이머, dNTP 및 반응 완충제 함유)을 처음에 98℃에서 1 분간 변성시킨 후, 10 사이클의 열 순환 (각 사이클: 10 초간 98℃, 20 초간 61℃, 20 초간 72℃) 및 72℃에서 2 분의 최종 연장 수행하였다. PCR1의 완료 후, 혼합물을 4℃에서 유지시켰다. PCR1 생성물 (표적 유전자 서열(들))을 AMPure XP 비드로 정제하고, 10 mM Tris-Cl, pH 8.0 + 0.05% TWEEN® 20에서 용리시켰다.
2. PCR2 : 표적 유전자 증폭, 3' 시퀀싱 어댑터 서열 첨가
C7 포워드 프라이머 (SEQ ID NO:39) 및 범용 프라이밍 P5 짧은 서열을 함유하는 표적-특이적 리버스 프라이머를 사용하여, 정제된 PCR1 생성물을 증폭시켰다. PCR2 반응에 사용된 예시적인 프라이머가 하기 표 E5에 제시되어 있다.
Figure 112020008957713-pct00007
Figure 112020008957713-pct00008
PCR2 반응 혼합물 (PCR1 생성물 (상기 파트 B1에서 생성됨), DNA 중합 효소, C7 포워드 프라이머 (SEQ ID NO:39), 표적-특이적-짧은 P5 리버스 프라이머, dNTP 및 반응 완충액 함유)을 처음에 98℃에서 1 분 동안 변성시킨 후, 6 사이클의 열 순환 (각 사이클: 10 초간 98℃, 20 초간 65℃, 20 초간 72℃) 및 72℃에서 2 분의 최종 연장 수행하였다. PCR2의 완료 후, 혼합물을 4℃에서 유지시켰다. PCR2 생성물 (표적 유전자 서열(들))을 AMPure XP 비드로 정제하고, 10 mM Tris-Cl, pH 8.0 + 0.05% TWEEN® 20으로 용리시켰다.
3. 표적 유전자의 정량적 PCR ( qPCR3 ) 및 시퀀싱
정제된 PCR2 또는 PCR0 생성물을 정량적 PCR (qPCR)에 사용하여 qPCR3 엔드포인트를 달성하기 위한 증폭 사이클의 수를 결정하였다. PCR0으로부터의 프리-증폭된 어댑터-연결된 물질, 또는 PCR2로부터의 전장 IG 또는 TR 물질은 C7 (포워드; SEQ ID NO:39) 및 C5-P5 (리버스; SEQ ID NO:76) 프라이머로 증폭되었다.
간단히, qPCR3 반응 혼합물 (PCR0 또는 PCR2 생성물 (각각 파트 A 또는 B1에서 생성됨), DNA 중합 효소, C7 포워드 프라이머 (SEQ ID NO:39), C5-P5 리버스 프라이머 (SEQ ID NO:76), dNTP, EvaGreen 및 반응 완충액 함유)을 처음에 98℃에서 1 분 동안 변성시킨 후, 3 사이클의 열 순환 (각 사이클: 10 초간 98℃, 20 초간 60℃, 20 초간 72℃) 후, 30 사이클의 제2 회전 열 순환 (각 사이클: 10 초간 98℃, 20 초간 70℃, 20 초간 72℃) 수행하였다. qPCR 세기 플롯을 조사하여 형광 강도가 최대이지만 DNA의 증폭이 아직 끝나지 않은 증폭 사이클을 결정하였다. 이것이 qPCR3 엔드포인트의 최종 사이클 수로 결정되었다.
각 라이브러리를 지수적 상으로 증폭시키기 위해 필요한 PCR 사이클의 수를 결정한 후, 동일한 PCR을 원하는 사이클 수에 대하여 비-정량적 방식으로 반복하고 1 AMPure XP로 정제하고 10 mM Tris-Cl, pH 8.0 + 0.05% TWEEN® 20으로 용리시켰다. 임의로, qPCR3 결과는 DASH에 의해 표준화되었다 (Guet al., Genome Biology 2016, 17:41). Agilent Tapestation D1000 테이프에서 결과를 분석하고, KAPA NGS Quant Kit for Illumina로 정량하고, 어댑터-연결된 라이브러리에 대하여는 Illumina NextSeq 고출력 75-사이클 키트 (예컨대, 32 사이클 Read 1, 6 사이클 Index Read I7, 54 사이클 Read 2)로, 또는 전장 IG 및 TR 라이브러리에 대하여는 Illumina MiSeq V3 600-사이클 키트 (예컨대, 325 사이클 Read 1, 6 사이클 Index Read I7, 300 사이클 Read 2)로 시퀀싱하였다. 일부 경우, NextSeq 시퀀서는 56 사이클의 Read 1, 6 사이클의 Index Read I7 및 33 사이클의 Read2를 사용하였다.
C. 모든 세포로부터의 전사체 시퀀싱
모든 세포로부터 전사체 라이브러리를 생성하기 위해, 표적-특이적 리버스 프라이머를, 증폭을 위하여 범용 포워드 프라이머 (예컨대, SEQ ID NOs: 28 및 39)와 조합하여 사용하기 위한 3' 어댑터 서열에 대한 범용 리버스 프라이머 (예컨대, SEQ ID NOs: 27 및 76)로 대체하는 것을 제외하고는, 상기 기재된 바와 같이 PCR1, PCR2 및 qPCR3 반응이 수행된다. 따라서, 범용의 포워드 및 리버스 프라이머를 사용하여 에멀젼에서 모든 세포의 모든 전사체를 시퀀싱할 수 있다.
D. 선택된 세포로부터의 전사체 시퀀싱
선택된 세포로부터 전사체 라이브러리를 생성하기 위해, 원하는 세포 또는 세포들, 예를 들어 상기 파트 A에서 시퀀싱된 대상 Ig 분자 또는 TCR을 함유하는 세포 또는 세포들의 용기 바코드 (VB)에 상보적인 포워드 프라이머 및 3' 어댑터 서열에 대한 범용 리버스 프라이머 (예컨대, SEQ ID NOs: 27 및 76)를 사용하는 것을 제외하고는, 상기한 바와 같이 PCR1, PCR2 및 qPCR3 반응이 수행된다.
실시예 7 - 서열 데이터 분석
Illumina MiSeq 판독값을 처리하여 mRNA 분자 및 액적에 대한 전장 컨센서스 서열을 생성하고, IgBLAST 및 IMGT/HighV-QUEST로 주석을 달고, 맞춤형 스크립트 및 Change-0 패키지로 처리하여 통계 및 수치를 생성하였다. Illumina 소프트웨어를 사용하여 MiSeq 판독값을 역-다중화하였다. Phred 퀄리티 5 미만의 위치는 Ns로 마스킹하였다. 이소형-특이적 프라이머, 용기 바코드 (VB), 분자 바코드 (MB) 및 어댑터 서열을 앰플리콘에서 확인하고 최대 오차 0.2의 pRESTOMaskPrimers-cut을 사용하여 잘라내었다.
A. 선택된 면역 수용체 서열 데이터의 분석
일 예시로, 표적화된 면역 수용체의 전장 서열을 준비하고 시퀀싱하였다. 리드 1 컨센서스 서열 및 리드 2 컨센서스 서열은 VB 및 MB를 함께 포함하는 고유 분자 식별자 (UMI)로 그룹화된 판독값으로부터 각각의 mRNA에 대해 별도로 생성되었으며, 이는 동일한 원래의 mRNA 기원 분자로부터 발생하는 PCR 복제물이다. UMI 판독 그룹을 MUSCLE과 정렬시키고, pRESTO를 사용하여 다음 파라미터를 갖는 컨센서스 서열을 구축하였다: maxdiv = 0.1; bf PRIMER; prfreq = 0.6; maxmiss = 0.5; q = 5; 판독 그룹에 대한 >60%의 호출된 PCR 프라이머 서열 일치; 최대 뉴클레오타이드 다양성 = 0.1; 인델 포지션에 대하여 다수 법칙 (majority rule) 사용; 사후 (컨센서스) 품질로 정렬 컬럼 마스킹. 그 후, 페어링된 최종 컨센서스 서열은 두 번의 라운드에서 스티칭되었다. 먼저, 각 판독 쌍의 컨센서스 서열 말단의 언갭드 (ungapped) 정렬을 Z-점수 근사를 사용하여 최적화하고, 다음 파라미터를 이용하여 pRESTO AssemblePairs-정렬에 구현된 이항 p-값으로 점수를 매겼다: 최소 길이 = 8; 알파 lxlO5; 최대 오류 = 0.3. 이러한 방식으로 스티칭에 실패한 판독 쌍의 경우, 스티칭 또는 갭드 리드조이닝 전에 각 판독을 스캐폴드하기 위하여 인간 BCR 및 TCR 생식선 V 엑손을 사용하여, pRESTO의 AssemblePairs-참조 파라미터: 최소 식별 = 0.5; e 값 lxlO 5를 사용하여 스티칭을 시도하였다.
1. V D J 분절 주석달기 이소형 확인
IgBLAST, Change-0 및 맞춤 스크립트를 사용하여 기원의 생식선 V(D)J 유전자를 식별하고, mRNA 서열을 V(D)J 영역으로 트리밍하고, CDR3 영역을 식별하고, 생식선 V 뉴클레오타이드 서열로부터의 돌연변이를 계산하였다. IgBLAST는 Ns를 미스매치로 카운트하지만 6 개 이상의 V-영역 Ns를 갖는 mRNA 서열을 돌연변이 분석 및 교차-분획 페어링 정밀도 분석을 위해 여과하였다. IG 중쇄의 경우, pRESTO MaskPrimers-점수 파라미터: start = 0; 최대 오차 = 0.2를 사용하여, 예상되는 서열에 비-프라이머 C-영역 (불변 영역 엑손)을 매칭시켜 이소형 동일성을 확인하였다. 특정 프라이머 교차 (crosstalk) 사건이 육안 검사에 의해 해결되는 2 개의 프라이머/비-프라이머 조합을 제외하고, 불일치 (discordant) 프라이머/비-프라이머 C-영역 호출인 앰플리콘은 폐기하였다.
2. V(D)J 서열을 클론 계통으로 그룹화
V(D J 서열을 가중 클론내 거리를 갖는 단일-결합 클러스터링을 사용하여 클론 그룹화하였다. Change-0 패키지 DefineClones-by 그룹 파라미터: 모델 = mln; 유전자 = 첫 번째; dist = 4.0; norm = 없음으로 하여 클러스터링을 수행하였다. 먼저, 모든 기능성 Ig VH 사슬의 액적 컨센서스 서열을 V-J 접합 빈에 비닝하여, 그로써 동일한 초기 재조합 사건으로부터 발생할 수 있는 서열이 함께 비닝되었다 (IMGT/HighV-QUEST에 의하여 확인되는 바, 가장 매칭되는 Ig VH 유전자, 가장 매칭되는 Ig JH 유전자 및 접합 길이에 기초하여). 클론 내 거리 문턱값은 Change-0 shm 패키지의 distToNearest 기능을 사용하여 각 Ig VH 빈 내에서 가장 가까운-이웃 거리의 히스토그램을 생성하고, 자연적인 거리 컷오프에 대한 히스토그램을 육안으로 검사하여 (이원 히스토그램의 트로프에서) 선택되었다. 경쇄의 클론 클러스터는 동일 거리 모델과 문턱값을 사용하여 정의되었다.
3. 액적 필터링 , 페어링 충실도 계산
중쇄-경쇄 페어링 신뢰도를 2 가지 독립적인 방식으로 평가하였다: 액적내 mRNA 서열 일치 및 복제-간 페어링 일치를 사용. 액적내 mRNA 일치는 유전자좌 내 V(D)J 서열의 평균 쌍별 뉴클레오타이드 차이 (Nei's pi <0.02)로서 정의되었다. IgBLAST 주석을 사용하여, mRNA 서열은 V(D)J 뉴클레오타이드 코딩 서열로 트리밍되었다. 각각의 액적 내에서 모든 생성물 mRNA 서열을 V 유전자좌로 그룹화하였다. 각 그룹 내에서 디폴트 파라미터를 사용하여 pRESTO AlignSets에 구현된 대로 MUSCLE을 사용하여 다수 서열을 정렬하였다. 액적 컨센서스 사슬은 pRESTO 파라미터: BuildConsensus.py; 최대 div = 0.2; 최대 miss = 0.5를 사용하여 유전자좌당 다수 mRNA로부터 구축되었다. 무작위로 셔플된 액적을 사용하여 다양성 컷오프 pi <0.02를 선택하였다. 셔플된 액적에서, 중쇄 유전자좌의 0.01% 미만 (경쇄 유전자좌의 <0.2%)이 이 기준을 충족시켰다. 다중-세포 또는 면역-수용체 포함 액 적을 추가적인 정확도 분석을 위해 분리하였다.
단일 계통만을 함유할 가능성이 있는 VDJ 클러스터, 즉 단일 V(D)J 및 VJ 재배열에서 발생한 후 증식한 VDJ 클러스터에 중점을 두어, 다수의 반복체 (별개의 에멀젼 실험)에 걸쳐 동일한 클론-쌍의 관찰에 기초하여 페어링 정확도를 계산하였다. 유사한 VDJ 재배열이 개별적으로 여러 번 독립적인 시각에 발생할 수 있으며, 본래 다수의 상이한 경쇄 VJ 재배치와 페어링되는 동일한 중쇄 V(D)J 재배치가 결과한다. 희귀한 V(D)J 재배열이 본 명세서에 기술된 방법에 의해 달성되는 기술적 정확성에 대한 보다 정확한 측정치를 제공할 것이기 때문에, 이러한 분석에 초점을 맞추기 위하여 긴 중쇄 CDR3 (CDR3H)(보다 희귀한 V(D)J 재배열을 위한 대용품으로서)가 이용되었다. 클론 할당 신뢰도를 높이기 위해 >6N인 서열도 제거되었다. 분획에 걸쳐 관찰된 가장 긴 사분위수 클론 (접합 길이 ≥54 nt인 2,604 개의 클론)에 대해 페어링 정확도는 CDR 3H 길이와 함께 96% 이상까지 증가하였다. 클론-쌍 일치의 가능성은 두 개의 독립적인 실험에서 진정한 쌍의 공동 확률이므로, 페어링 정확도는 반복체를 통한 페어링 일치의 제곱근으로 추산되었으며 다음과 같이 계산되었으며, 여기서
Figure 112020008957713-pct00009
은 페어링된 중쇄 클론 h 및 경쇄 클론 l을 갖고 물리적 분획 f에서 발견되는 용기 바코드의 수 d이다. 각각의 실험에 대한 평균 (제곱) 페어링 정확도는 중쇄 클론 h 및 모든 분획 쌍 (f, g), 페어링된 경쇄 클론 (1, k)의 일치를 평균하여 추산된다:
Figure 112020008957713-pct00010
따라서 이 실험 예에 따르면, 각 실험의 평균 정확도 (실험들 간 정확도 오차 내까지)는 96.1%였다.
B. 전사체 서열 데이터 분석
전사체 서열 데이터의 경우, 동일한 VB를 포함하는 판독값은 붕괴되었고 (collapsed), 전사물 (HiSAT2)을 식별하기 위해 서열을 인간 레퍼런스 게놈에 정렬시켰다. 샘툴 (samtools)을 사용하여 출력 파일의 정렬을 조작하고, 게놈 위치에 따라 판독값을 전사물에 할당하였다.
각각의 VB-게놈 맵핑에 대해, 판독값은 MB에 의하여 붕괴되었다. 매트릭스는 MB 수로 구축되었고, 액적당 각각의 개별 레퍼런스 유전자에 맵핑되었다. 그 후, 이들 데이터는 표적 데이터, 예를 들어 파트 A에서 상기 기재된 바와 같이 처리된 면역 수용체 서열 데이터와 병합되었다. 각각의 VB (액적)로부터의 데이터는 유전자 수 및 수용체 정보로 주석이 달렸다. 그 후, 조합된 데이터 세트를 분석하여 단일-세포 RNA 서열 프로파일 (scRNAseq)을 시험하였다. 차원 축소, 클러스터링 및 시각화는 t-SNE, Seurat, ZIFA, PCA, LDA 및 기타 예시적인 프로그램을 사용하여 수행되었다.
실시예 8 - 다수의 단일 세포로부터 예시적인 고처리량 전사체 서열 데이터 분석 및 플롯팅
약 7,000 개의 PBM가 준비되었고 상기 실시예 4A 및 4B에 일반적으로 기재된 바와 같이 전사체 및 전장 BCR 및 TCR 수용체가 시퀀싱되었다.
Illumina NextSeq에 의한 분석 전에, 실시예 4B에 기술된 바와 같이 제조된 에멀젼의 전사체 시퀀싱 라이브러리를 D1000 DNA 테이프스테이션으로 분석하였다. 전사체는 대략 170-900 bp의 크기 범위의 서열로 나타났다. 실시예 4A에서 기술된 표적화된-시퀀싱에 의해 시퀀싱된 전장 TCR 서열은 또한 NextSeq 분석 전에 D1000 DNA 테이프스테이션으로 분석되었으며, 이는 각각 628 및 664 bp에서 TCR 알파 및 베타 피크를 나타냈다.
NextSeq 분석 후, >1,000 판독값을 갖는 모든 액적 세포 프로파일 (n = 6,707)은 t-분포 확률적 임베딩 (t-SNE) 및 Seurat 클러스터링에 의해 분석되었다. 다차원의 단일-세포 전사체 데이터를 t-SNE 플롯을 사용하여 가시화하고, 세포들을 유사한 전사 프로파일을 갖는 세포들의 Seurat 클러스터링에 기초하여 (도 3a) 또는 시퀀싱된 면역 수용체의 성질에 의하여 (즉, BCR (적색/중간 회색) 또는 TCR (녹색/진한 회색))(도 3b) 컬러-코딩하였고, 이는 동일한 표현형을 갖는 세포들의 클러스터링을 입증하였다.
시퀀싱된 세포에서 예시적인 유전자에 대한 전사체 데이터를 분석하고, 시퀀싱된 면역 수용체와 동일한 용기 바코드를 갖는 서열 정보를 동일한 세포로부터의 것으로 식별하였다. 전사체에서 예시적인 유전자에 대한 단일-세포 전사체 데이터는 발현 수준의 히트 맵에 기초하여 컬러-코딩되었고, Toll-유사 수용체 7 (TLR7; 도 4a), T-세포 표면 당단백질 CD3 엡실론 사슬 (CD3E; 도 4b), 자연 살해 세포 과립 단백질 7 (NKG7; 도 4c), MRC1 만노스 수용체 C-타입 1 (MRC1; 도 4d)에 대하여 도시되었다.
이들 결과는, T 세포 (CD3E) 또는 B 세포 (TLR7)와 관련된 유전자 마커가, 각각 전장 TCR 또는 BCR을 발현하는 세포에서 일반적으로 함께 클러스터링되기 때문에, 게놈-범위의 RNA 발현 프로파일이 고 처리량 방식으로 면역 수용체와 함께 포착될 수 있음을 나타낸다. 마찬가지로, T 세포 또는 B 세포와 관련되지 않은 유전자 마커, 예컨대 예시적인 NK 세포 마커 NKG7 또는 예시적인 단핵구 마커 MRC1은 전장 TCR 또는 BCR 면역 수용체를 갖는 세포에서 클러스터링되는 것으로 나타나지 않았다.
본 발명은, 예를 들어 본 발명의 다양한 측면을 설명하기 위해 제공되는 특정 개시된 구체예로 범위가 제한되도록 의도되지 않는다. 기재된 조성물 및 방법에 대한 다양한 변형이 본 명세서의 설명 및 교시로부터 명백해질 것이다. 이러한 변형은 본 개시의 진정한 범위 및 사상을 벗어나지 않고 실시될 수 있으며 본 개시의 범위 내에 속하도록 의도된다.
서열
Figure 112020008957713-pct00011
Figure 112020008957713-pct00012
Figure 112020008957713-pct00013
Figure 112020008957713-pct00014
Figure 112020008957713-pct00015
Figure 112020008957713-pct00016
SEQUENCE LISTING <110> Goldfless, Stephen Jacob Briggs, Adrian Wrangham Chari, Rajagopal JIang, Yue Hause, Ronald Vigneault, Francois <120> HIGH-THROUGHPUT POLYNUCLEOTIDE LIBRARY SEQUENCING AND TRANSCRIPTOME ANALYSIS <130> 735042011740 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 62/511,949 <151> 2017-05-26 <160> 100 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> 5'biotin oligo-dT anchored reverse transcription primer <220> <221> misc_feature <222> 1 <223> 5' biotin modification with an 18-carbon spacer <220> <221> misc_feature <222> 27 <223> n = A,T,C or G <400> 1 tttttttttt tttttttttt tttttvn 27 <210> 2 <211> 78 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode template oligo <220> <221> misc_feature <222> 30, 31, 32, 33, 35, 36, 37, 38, 40, 41, 42, 43 <223> n = A,T,C or G <400> 2 atccatccac gactgacgga cgtattaaan nnnwnnnnwn nnnagatcgg aagagcacac 60 gtctgaactc cagtcacc 78 <210> 3 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> template switch oligo <220> <221> misc_feature <222> 33 <223> riboguanosine <220> <221> misc_feature <222> 34 <223> riboguanosine <220> <221> misc_feature <222> 24, 25, 27, 28, 30, 31 <223> n = A,T,C or G <400> 3 aatacgtccg tcagtcgtgg atgnntnnan ntggg 35 <210> 4 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode forward primer/universal adaptor oligonucleotide <400> 4 catccacgac tgacggacgt att 23 <210> 5 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode reverse primer <400> 5 gtgactggag ttcagacgtg tgct 24 <210> 6 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode oligo 1 <220> <221> misc_feature <222> (1)...(5) <223> phosphorothioate linkage <220> <221> misc_feature <222> (83)...(87) <223> phosphorothioate linkage <220> <221> misc_feature <222> 41, 42, 43, 44, 46, 47, 48, 49, 51, 52, 53, 54 <223> n = A,T,C or G <400> 6 tacgtctacg cgctgctctg ccacgactga cggacgtatt nnnnwnnnnw nnnnagatcg 60 gaagagcaca cgtctgaact ccagtca 87 <210> 7 <211> 88 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode oligo 2 <220> <221> misc_feature <222> (1)...(5) <223> phosphorothioate linkage <220> <221> misc_feature <222> (84)...(88) <223> phosphorothioate linkage <220> <221> misc_feature <222> 42, 43, 44, 45, 47, 48, 49, 50, 52, 53, 54, 55 <223> n = A,T,C or G <400> 7 tacgtctacg cgctgctctg ccacgactga cggacgtatt wnnnnwnnnn wnnnnagatc 60 ggaagagcac acgtctgaac tccagtca 88 <210> 8 <211> 89 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode oligo 3 <220> <221> misc_feature <222> (1)...(5) <223> phosphorothioate linkage <220> <221> misc_feature <222> (85)...(89) <223> phosphorothioate linkage <220> <221> misc_feature <222> 41, 43, 44, 45, 46, 48, 49, 50, 51, 53, 54, 55, 56 <223> n = A,T,C or G <400> 8 tacgtctacg cgctgctctg ccacgactga cggacgtatt nwnnnnwnnn nwnnnnagat 60 cggaagagca cacgtctgaa ctccagtca 89 <210> 9 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode oligo 4 <220> <221> misc_feature <222> (1)...(5) <223> phosphorothioate <220> <221> misc_feature <222> (86)...(90) <223> phosphorothioate <220> <221> misc_feature <222> 41, 42, 44, 45, 46, 47, 49, 50, 51, 52, 54, 55, 56, 57 <223> n = A,T,C or G <400> 9 tacgtctacg cgctgctctg ccacgactga cggacgtatt nnwnnnnwnn nnwnnnnaga 60 tcggaagagc acacgtctga actccagtca 90 <210> 10 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode forward primer <400> 10 gtgactggag ttcagacgtg tgct 24 <210> 11 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> vessel barcode reverse primer <400> 11 tacgtctacg cgctgctctg 20 <210> 12 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> IgG constant RT primer <220> <221> modified_base <222> 10 <223> gm <220> <221> modified_base <222> 11 <223> gm <220> <221> modified_base <222> 12 <223> gm <400> 12 aggacagccg ggaaggtgt 19 <210> 13 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> IgL constant RT primer <220> <221> modified_base <222> 9 <223> gm <220> <221> modified_base <222> 11 <223> 2'-O-methyl-adenosine <220> <221> modified_base <222> 12 <223> gm <400> 13 gctcccgggt agaagtca 18 <210> 14 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> IgK constant RT primer <220> <221> modified_base <222> 11 <223> gm <220> <221> modified_base <222> 12 <223> gm <220> <221> modified_base <222> 13 <223> 2'-O-methyl-adenosine <400> 14 ggcctctctg ggatagaagt 20 <210> 15 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> IgM constant RT primer <220> <221> modified_base <222> 13 <223> gm <220> <221> modified_base <222> 14 <223> cm <220> <221> modified_base <222> 15 <223> gm <400> 15 tgtgaggtgg ctgcgtactt g 21 <210> 16 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> IgA constant RT primer <220> <221> modified_base <222> 12 <223> gm <220> <221> modified_base <222> 13 <223> gm <220> <221> modified_base <222> 14 <223> 2'-O-methyladenosine <400> 16 ctggctrggt gggaagtttc t 21 <210> 17 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> IgD constant RT primer <220> <221> modified_base <222> 12 <223> 2'-O-methyladenosine <220> <221> modified_base <222> 13 <223> gmcm <220> <221> modified_base <222> 15 <223> cm <400> 17 cacgcatttg tactcgcctt g 21 <210> 18 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> IgE constant RT primer <220> <221> modified_base <222> 10 <223> 2'-O-methyladenosine <220> <221> modified_base <222> 12 <223> 2'-O-methyladenosine <220> <221> modified_base <222> 13 <223> gm <400> 18 gatggtggca tagtgaccag 20 <210> 19 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> TRA constant RT primer <220> <221> modified_base <222> 15 <223> 2'-O-methyladenosine <220> <221> modified_base <222> 16 <223> 2'-O-methyladenosine <220> <221> modified_base <222> 18 <223> cm <400> 19 tgtttgagaa tcaaaatcgg tgaa 24 <210> 20 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> TRB constant RT primer <220> <221> modified_base <222> 9 <223> gm <220> <221> modified_base <222> 10 <223> gm <220> <221> modified_base <222> 11 <223> gm <400> 20 acgtggtcgg ggaagaag 18 <210> 21 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> TRG constant RT primer <220> <221> modified_base <222> 13 <223> ac4cgm <220> <221> modified_base <222> 14 <223> gm <220> <221> modified_base <222> 16 <223> 2'-O-methyladenosine <400> 21 caagaagaca aaggtatgtt cc 22 <210> 22 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> TRD constant RT primer <220> <221> modified_base <222> 12 <223> gm <220> <221> modified_base <222> 13 <223> 2'-O-methyladenosine <220> <221> modified_base <222> 14 <223> cm <400> 22 tcttcttgga tgacacgaga 20 <210> 23 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> template switch oligo <220> <221> modified_base <222> 24 <223> 2'-deoxyuridine <220> <221> misc_feature <222> 34 <223> riboguanosine <220> <221> misc_feature <222> 35 <223> riboguanosine <220> <221> modified_base <222> 36 <223> 3-deoxyguanosine <220> <221> misc_feature <222> 25, 26, 28, 29, 31, 32 <223> n = A,T,C or G <400> 23 aatacgtccg tcagtcgtgg atgunntnna nntggg 36 <210> 24 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> degenerate overhang <220> <221> misc_feature <222> 1, 2, 3, 4, 5, 6 <223> n = A,T,C or G <400> 24 nnnnnn 6 <210> 25 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> short P5 priming sequence <220> <221> modified_base <222> 1 <223> phosphorylated adenosine <220> <221> modified_base <222> 20 <223> 3' amnino modified (3AmMO) thymine <400> 25 agatcggaag agcgtcgtgt 20 <210> 26 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> splint oligonucleotide <220> <221> modified_base <222> 26 <223> 3'amino modified (3AmMO) nucleotide (a, g, c, or t) <220> <221> misc_feature <222> 21, 22, 23, 24, 25, 26 <223> n = A,T,C or G <400> 26 acacgacgct cttccgatct nnnnnn 26 <210> 27 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> short P5 reverse primer <400> 27 acacgacgct cttccgatct 20 <210> 28 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> C7-index-P7 forward primer <220> <221> misc_feature <222> 25, 26, 27, 28, 29, 30 <223> n = A,T,C or G <400> 28 caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 29 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IgG constant reverse primer sequence <400> 29 aagtagtcct tgaccaggca gc 22 <210> 30 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> IgL constant reverse primer sequence <400> 30 ggcttgaagc tcctcagagg a 21 <210> 31 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IgK constant reverse primer sequence <400> 31 aggcacacaa cagaggcagt tc 22 <210> 32 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IgM constant reverse primer sequence <400> 32 cgacggggaa ttctcacagg ag 22 <210> 33 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IgD constant reverse primer sequence <400> 33 tgtctgcacc ctgatatgat gg 22 <210> 34 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> IgA constant 1 reverse primer sequence <400> 34 gggtgctgca gaggctcag 19 <210> 35 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> IgA constant 2 reverse primer sequence <400> 35 gggtgctgtc gaggctcag 19 <210> 36 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IgE constant reverse primer sequence <400> 36 ggaatgtttt tgcagcagcg gg 22 <210> 37 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> TRA constant reverse primer sequence <400> 37 agtctctcag ctggtacacg g 21 <210> 38 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> TRB constant reverse primer sequence <400> 38 atggctcaaa cacagcgacc tc 22 <210> 39 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> C7 <400> 39 caagcagaag acggcatacg agat 24 <210> 40 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> IgG adapter-tagged target-specific reverse primer sequence <400> 40 acacgacgct cttccgatct ccagggggaa gacsgatg 38 <210> 41 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> IgG adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 41 acacgacgct cttccgatct nccaggggga agacsgatg 39 <210> 42 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> IgG adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 42 acacgacgct cttccgatct nnccaggggg aagacsgatg 40 <210> 43 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> IgG adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 43 acacgacgct cttccgatct nnnccagggg gaagacsgat g 41 <210> 44 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> IgA adapter-tagged target-specific reverse primer sequence <400> 44 acacgacgct cttccgatct ggctcagcgg gaagaccttg 40 <210> 45 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> IgA adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 45 acacgacgct cttccgatct nggctcagcg ggaagacctt g 41 <210> 46 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> IgA adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 46 acacgacgct cttccgatct nnggctcagc gggaagacct tg 42 <210> 47 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> IgA adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 47 acacgacgct cttccgatct nnnggctcag cgggaagacc ttg 43 <210> 48 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> IgE adapter-tagged target-specific reverse primer sequence <400> 48 acacgacgct cttccgatct gggaagacgg atgggctctg 40 <210> 49 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> IgE adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 49 acacgacgct cttccgatct ngggaagacg gatgggctct g 41 <210> 50 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> IgE adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 50 acacgacgct cttccgatct nngggaagac ggatgggctc tg 42 <210> 51 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> IgE adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 51 acacgacgct cttccgatct nnngggaaga cggatgggct ctg 43 <210> 52 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> IgM adapter-tagged target-specific reverse primer sequence <400> 52 acacgacgct cttccgatct gagacgaggt ggaaaagggt tg 42 <210> 53 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> IgM adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 53 acacgacgct cttccgatct ngagacgagg tggaaaaggg ttg 43 <210> 54 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> IgM adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 54 acacgacgct cttccgatct nngagacgag gtggaaaagg gttg 44 <210> 55 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> IgM adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 55 acacgacgct cttccgatct nnngagacga ggtggaaaag ggttg 45 <210> 56 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> IgD adapter-tagged target-specific reverse primer sequence <400> 56 acacgacgct cttccgatct ggaacacatc cggagccttg 40 <210> 57 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> IgD adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 57 acacgacgct cttccgatct nggaacacat ccggagcctt g 41 <210> 58 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> IgD adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 58 acacgacgct cttccgatct nnggaacaca tccggagcct tg 42 <210> 59 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> IgD adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 59 acacgacgct cttccgatct nnnggaacac atccggagcc ttg 43 <210> 60 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> IgL adapter-tagged target-specific reverse primer sequence <400> 60 acacgacgct cttccgatct agggygggaa cagagtgac 39 <210> 61 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> IgL adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 61 acacgacgct cttccgatct nagggyggga acagagtgac 40 <210> 62 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> IgL adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 62 acacgacgct cttccgatct nnagggyggg aacagagtga c 41 <210> 63 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> IgL adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 63 acacgacgct cttccgatct nnnagggygg gaacagagtg ac 42 <210> 64 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> IgK adapter-tagged target-specific reverse primer sequence <400> 64 acacgacgct cttccgatct gacagatggt gcagccacag 40 <210> 65 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> IgK adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 65 acacgacgct cttccgatct ngacagatgg tgcagccaca g 41 <210> 66 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> IgK adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 66 acacgacgct cttccgatct nngacagatg gtgcagccac ag 42 <210> 67 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> IgK adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 67 acacgacgct cttccgatct nnngacagat ggtgcagcca cag 43 <210> 68 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> TRA adapter-tagged target-specific reverse primer sequence <400> 68 acacgacgct cttccgatct cacggcaggg tcagggttc 39 <210> 69 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> TRA adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 69 acacgacgct cttccgatct ncacggcagg gtcagggttc 40 <210> 70 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> TRA adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 70 acacgacgct cttccgatct nncacggcag ggtcagggtt c 41 <210> 71 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> TRA adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 71 acacgacgct cttccgatct nnncacggca gggtcagggt tc 42 <210> 72 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> TRB adapter-tagged target-specific reverse primer sequence <400> 72 acacgacgct cttccgatct cgacctcggg tgggaacac 39 <210> 73 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> TRB adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21 <223> n = A,T,C or G <400> 73 acacgacgct cttccgatct ncgacctcgg gtgggaacac 40 <210> 74 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> TRB adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22 <223> n = A,T,C or G <400> 74 acacgacgct cttccgatct nncgacctcg ggtgggaaca c 41 <210> 75 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> TRB adapter-tagged target-specific reverse primer sequence <220> <221> misc_feature <222> 21, 22, 23 <223> n = A,T,C or G <400> 75 acacgacgct cttccgatct nnncgacctc gggtgggaac ac 42 <210> 76 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> C5-P5 reverse primer <400> 76 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tcc 53 <210> 77 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> P7 priming site (C7) <400> 77 agatcggaag agcacacgtc tgaactcca 29 <210> 78 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> P5 priming site <400> 78 agatcggaag agcgtcgtgt agggaaagag tgtagatctc ggtggtcgcc gtatcatt 58 <210> 79 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Universal adaptor <220> <221> misc_feature <222> 21, 22, 23, 24, 25, 26 <223> n = A,T,C or G <400> 79 acacgacgct cttccgatct nnnnnn 26 <210> 80 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Universal adaptor <220> <221> misc_feature <222> 1, 2, 3, 4, 6, 7, 8, 9, 11, 12, 13, 14 <223> n = A,T,C or G <400> 80 nnnnwnnnnw nnnn 14 <210> 81 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Universal adaptor <220> <221> misc_feature <222> 2, 3, 4, 5, 7, 8, 9, 10, 12, 13, 14, 15 <223> n = A,T,C or G <400> 81 wnnnnwnnnn wnnnn 15 <210> 82 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Universal adaptor <220> <221> misc_feature <222> 1, 3, 4, 5, 7, 8, 9, 10, 12, 13, 14, 15 <223> n = A,T,C or G <400> 82 nwnnnwnnnn wnnnn 15 <210> 83 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Universal adaptor <220> <221> misc_feature <222> 1, 2, 4, 5, 6, 7, 9, 10, 11, 12, 14, 15, 16, 17 <223> n = A,T,C or G <400> 83 nnwnnnnwnn nnwnnnn 17 <210> 84 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> IgM-RT primer <220> <221> modified_base <222> 1 <223> biotinylated thymine <400> 84 tgtgaggtgg ctgcgtactt g 21 <210> 85 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> IgG-RT primer <220> <221> modified_base <222> 1 <223> biotinylated adenine <400> 85 aggacagccg ggaaggtgt 19 <210> 86 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> IgD-RT primer <220> <221> modified_base <222> 1 <223> biotinylated cytosine <400> 86 cacgcatttg tactcgcctt g 21 <210> 87 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> IgA-RT primer <220> <221> modified_base <222> 1 <223> biotinylated cytosine <400> 87 ctggctrggt gggaagtttc t 21 <210> 88 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> IgE-RT primer <220> <221> modified_base <222> 1 <223> biotinylated guanine <400> 88 ggtggcatag tgaccagaga 20 <210> 89 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> IgK-RT primer <220> <221> modified_base <222> 1 <223> biotinylated thymine <400> 89 tattcagcag gcacacaaca ga 22 <210> 90 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> IgL-RT primer <220> <221> modified_base <222> 1 <223> biotinylated adenine <400> 90 agtgtggcct tgttggcttg 20 <210> 91 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> TCR-A-RT primer <220> <221> modified_base <222> 1 <223> biotinylated guanine <400> 91 gggagatctc tgcttctgat g 21 <210> 92 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> TCR-B-RT primer <220> <221> modified_base <222> 1 <223> biotinylated guanine <400> 92 ggtgaatagg cagacagact tg 22 <210> 93 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> CD4-RT primer <220> <221> modified_base <222> 1 <223> biotinylated guanine <400> 93 ggcagtcaat ccgaacact 19 <210> 94 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> CD-8-RT primer <220> <221> modified_base <222> 1 <223> biotinylated cytosine <400> 94 ctacaaagtg ggcccttctg 20 <210> 95 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> CD4-nested primer <400> 95 acacgacgct cttccgatct tgtggccttg ccgagggagg 40 <210> 96 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> CD8-nested primer <400> 96 acacgacgct cttccgatct tgcggaatcc cagagggcca 40 <210> 97 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> C7-bc-P7 primer <220> <221> misc_feature <222> 25, 26, 27, 28, 29, 30 <223> n = A,T,C or G <400> 97 caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60 atct 64 <210> 98 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> C5-P5 primer <400> 98 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 99 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Vessel barcode sequence <220> <221> misc_feature <222> 1, 2, 3, 4, 6, 7, 8, 9, 11, 12, 13, 14, 16, 17, 18, 19 <223> n = A,T,C or G <400> 99 nnnnwnnnnw nnnnwnnnnw 20 <210> 100 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Vessel barcode sequence <220> <221> misc_feature <222> 1, 2, 3, 4, 6, 9, 10, 11, 13, 16, 17, 18 <223> n = A,T,C or G <400> 100 nnnnwnscnn nwnscnnn 18

Claims (172)

  1. 폴리뉴클레오타이드 라이브러리를 생성하는 방법으로서, 상기 방법은:
    (a) 복수 개의 용기 각각 내의 세포를 용해시키는 단계로서, 상기 용기 각각은 세포 집단으로부터의 세포, 복수 개의 분자 바코딩된 올리고뉴클레오타이드, 및 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀, 및, 제1 어댑터 또는 제1 어댑터의 풀을 포함하는 것인 단계;
    (b) 각 용기에서, 복수 개의 상보적인 폴리뉴클레오타이드를 생성하는 단계로서, 상기 복수 개의 상보적인 폴리뉴클레오타이드를 생성하는 것은, (i) 하나 이상의 표적-특이적 프라이머를 사용하여 세포에 존재하는 하나 이상의 표적 폴리뉴클레오타이드 전사물(들)에 상보적인 하나 이상의 표적 폴리뉴클레오타이드(들)를 생성하는 것; 및 (ii) 각각이 세포 내 폴리뉴클레오타이드 전사물에 개별적으로 상보적인, 폴리뉴클레오타이드의 집합체를 생성하는 것을 포함하는 것인 단계;
    (c) 복수 개의 상보적인 폴리뉴클레오타이드에 복수 개의 분자 바코딩된 올리고뉴클레오타이드 중 하나를 부착시켜, 그에 의하여 각각이 고유한 분자 바코드를 포함하는 복수 개의 분자 바코딩된 폴리뉴클레오타이드를 생성하는 단계;
    (d) 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 풀, 또는 이의 증폭된 생성물 중 하나, 및 제1 어댑터 또는 제1 어댑터의 풀 중 하나 또는 이의 증폭된 생성물을, 분자 바코딩된 폴리뉴클레오타이드 복수 개에 부착시켜, 그에 의하여 복수 개의 이중-바코딩된 폴리뉴클레오타이드, 임의로 이중-바코딩된 단일-가닥의 폴리뉴클레오타이드를 생성하는 단계로서, 여기서 이중-바코딩된 폴리뉴클레오타이드 각각은 분자 바코드 및 용기 바코드를 포함하고, 동일 용기 내의 이중-바코딩된 폴리뉴클레오타이드 각각은 동일한 용기 바코드를 포함하는 것인 단계;
    (e) 복수 개의 이중-바코딩된 폴리뉴클레오타이드 각각의 단일-가닥의 앰플리콘을 생성하는 단계; 및
    (f) 단일-가닥의 앰플리콘 각각에 제2 어댑터를 부가하여, 그에 의하여 제2 어댑터를 이중-바코딩된 단일-가닥 폴리뉴클레오타이드에 부가하는 단계로서, 여기서 제1 어댑터 및 제2 어댑터는 이중-바코딩된 단일-가닥의 폴리뉴클레오타이드 각각의 대향 말단에 또는 그 근처에 존재하는 것인 단계를 포함한다.
  2. 제1항에 있어서, 제1 어댑터는 용기 바코딩된 올리고뉴클레오타이드를 포함하는 것인 방법.
  3. 제1항에 있어서, 복수 개의 이중-바코딩된 폴리뉴클레오타이드는 복수 개의 이중-바코딩된 단일-가닥의 폴리뉴클레오타이드인 것인 방법.
  4. 제1항에 있어서, 하나 이상의 표적 폴리뉴클레오타이드(들)은 표적 유전자의 전장 코딩 서열을 포함하는 것인 방법.
  5. 제1항에 있어서, 복수 개의 바코딩된 단일-가닥의 폴리뉴클레오타이드 각각은 단일-가닥 폴리뉴클레오타이드 각각 또는 그의 증폭된 생성물에 고유한 분자 바코드를 더 포함하는 것인 방법.
  6. 제1항에 있어서, 용기의 각각의 세포로부터의 복수 개의 이중-바코딩된 단일-가닥의 폴리뉴클레오타이드는, 집합적으로, 각 세포의 전사체 또는 부분적 전사체의 상보적 DNA (cDNA)를 포함하는 것인 방법.
  7. 제1항에 있어서, 용기의 각각의 세포로부터의 폴리뉴클레오타이드의 집합체는, 집합적으로, 각 세포의 전사체 또는 부분적 전사체의 전사물에 상보적인 서열을 포함하는 것인 방법.
  8. 제7항에 있어서, 전사체 또는 부분적 전사체는, 집합적으로, 세포의 게놈에 존재하는 전사물의 적어도 60%, 70%, 75%, 80%, 85% 90% 95%, 96%, 97%, 98%, 99% 또는 100%를 포함하는 것인 방법.
  9. 제1항에 있어서, (b)의 하나 이상의 상보적인 폴리뉴클레오타이드(들) 각각은 cDNA이고; 및/또는
    하나 이상의 바코딩된 단일-가닥 폴리뉴클레오타이드(들) 각각은 cDNA 가닥인 것인 방법.
  10. 제1항에 있어서, 제1 어댑터 및/또는 제2 어댑터는 적어도 하나의 범용 프라이밍 부위를 포함하는 것인 방법.
  11. 제1항에 있어서, 제2 어댑터를 부가하는 것은 제2 범용 프라이밍 부위를 포함하는 올리고뉴클레오타이드의 존재하에서 바코딩된 단일-가닥 폴리뉴클레오타이드 각각에 스플린트 올리고뉴클레오타이드 (splint oligonucleotide)를 혼성화하는 것을 포함하고, 여기서, 스플린트 올리고뉴클레오타이드는 (i) 제2 범용 프라이밍 부위에 상보적인 서열 및 (ii) 바코딩된 단일-가닥 폴리뉴클레오타이드의 3' 말단에 무작위로 어닐링할 수 있는 축퇴 오버행 (overhang) 서열을 포함하고,
    혼성화 전에, 스플린트 올리고뉴클레오타이드 및 상기 제2 범용 프라이밍 부위를 포함하는 올리고뉴클레오타이드는 스플린트-어댑터 이중체를 형성하기 위하여 어닐링되는 것인 방법.
  12. 제11항에 있어서, 축퇴 오버행 서열은 서열 NNNNNN을 포함하고, 여기서 N은 임의의 뉴클레오타이드이고 (SEQ ID NO:24);
    스플린트 올리고뉴클레오타이드는 서열 ACACGACGCTCTTCCGATCTNNNNNN을 포함하고, 여기서 N은 임의의 뉴클레오타이드이고 (SEQ ID NO:26); 및/또는
    제2 범용 프라이밍 부위를 포함하는 올리고뉴클레오타이드는 서열 AGATCGGAAGAGCGTCGTGT (SEQ ID NO:25)를 포함하는 것인 방법.
  13. 제1항에 있어서, 용기 바코딩된 올리고뉴클레오타이드는
    축퇴 서열;
    서열 (N)14-17, 여기서 N은 임의의 뉴클레오타이드이고, 여기서 임의로 상기 서열 내 적어도 하나 또는 2 개의 N은 W이고, W은 아데닌 또는 티민인 것인 서열; 및/또는
    서열 NNNNWNNNNWNNNN (SEQ ID NO:80), WNNNNWNNNNWNNNN (SEQ ID NO:81), NWNNNWNNNNWNNNN (SEQ ID NO:82) 또는 NNWNNNNWNNNNWNNNN (SEQ ID NO:83), 여기서 N은 임의의 뉴클레오타이드이고 W는 아데닌 또는 티민인 것인 서열을 포함하는 것인 방법.
  14. 제1항에 있어서, 각각의 용기는 용기 바코딩된 올리고뉴클레오타이드의 풀을 포함하는 제1 어댑터의 풀을 포함하고, 제1 어댑터의 풀의 각각의 용기 바코딩된 올리고뉴클레오타이드는 풀 내 다른 용기 바코딩된 올리고뉴클레오타이드 중 적어도 하나와 비교할 때 적어도 하나의 염기-시프트 또는 염기 첨가를 포함하는 것인 방법.
  15. 제1항에 있어서, 단계 (d)에서, 상기 방법은:
    (i) 용기 바코딩된 올리고뉴클레오타이드 중 하나 또는 그의 풀; 또는
    제1 어댑터는 용기 바코딩된 올리고뉴클레오타이드 중 하나 그의 풀을 포함하는 것인, 제1 어댑터 중 하나 또는 그의 풀을 증폭하는 것으로서, 여기서 증폭은 용기 바코딩된 올리고뉴클레오타이드를 부착하기 이전 또는 그와 동시에 수행되는 것; 및/또는
    (ii) 복수 개의 이중-바코딩된 폴리뉴클레오타이드를 생성하는 부착 후에 복수 개의 분자 바코딩된 폴리뉴클레오타이드 각각을 연장하는 것을 더 포함하는 것인 방법.
  16. 제1항에 있어서, 단계 (b)에서,
    하나 이상의 표적 폴리뉴클레오타이드(들)은 역전사 효소 및 표적 폴리뉴클레오타이드전사물(들) 중 표적 서열에 상보적인 하나 이상의 표적-특이적 프라이머(들)의 존재하에서 표적 폴리뉴클레오타이드(들)의 역전사에 의하여 생성되고; 및/또는
    폴리뉴클레오타이드의 집합체는 역전사 효소 및 세포 내 폴리뉴클레오타이드 전사물에 상보적인 하나 이상의 전사체 프라이머의 존재하에서 세포 내 폴리뉴클레오타이드 전사물의 역전사에 의하여 생성되고, 여기서 하나 이상의 표적-특이적 프라이머 및/또는 하나 이상의 전사체 프라이머는 폴리(T) 서열, 또는 무작위 6량체 올리고뉴클레오타이드 프라이머의 혼합물을 포함하고; 및/또는
    복수 개의 상보적 폴리뉴클레오타이드를 생산하는 것은 비-주형 말단 전이 효소의 사용을 포함하고, 여기서 3 개 이상의 비-주형 뉴클레오타이드, 리보뉴클레오타이드 또는 이들의 유사체가 각각의 생성되는 상보적 폴리뉴클레오타이드의 3' 말단에 부가되는 것인 방법.
  17. 제1항에 있어서, 하나 이상의 표적 폴리뉴클레오타이드는 T-세포 수용체 알파 (TCRα)를 인코딩하는 제1 폴리뉴클레오타이드 및 T-세포 수용체 (TCRβ를 인코딩하는 제2 폴리뉴클레오타이드;
    T-세포 수용체 감마 (TCRγ를 인코딩하는 제1 폴리뉴클레오타이드 및 T-세포 수용체 델타 (TCR δ)를 인코딩하는 제2 폴리뉴클레오타이드, 또는
    중쇄 면역글로불린 (IgH) 폴리뉴클레오타이드를 인코딩하는 제1 폴리뉴클레오타이드 및 경쇄 면역글로불린 (IgL) 폴리뉴클레오타이드를 인코딩하는 제2 폴리뉴클레오타이드를 포함하는 것인 방법.
  18. 제1항에 있어서, 하나 이상의 표적 폴리뉴클레오타이드(들) 및 폴리뉴클레오타이드의 집합체는 동일한 반응 부피의 용기에서 생성되는 것인 방법.
  19. 제1항에 있어서, 단계 (c)에서, 상기 부착하는 것은 복수 개의 분자 바코딩된 올리고뉴클레오타이드 중 하나의 영역을 상보적 폴리뉴클레오타이드 각각의 3 개 이상의 비-주형 뉴클레오타이드에 혼성화시키는 것을 포함하고,
    복수 개의 분자 바코딩된 올리고뉴클레오타이드는 각각이 상기 3 개 이상의 비-주형 뉴클레오타이드에 상보적인 3' 부분을 포함하는 복수 개의 주형 스위치 올리고뉴클레오타이드로서 제공되며; 및/또는
    주형 스위치 올리고뉴클레오타이드는 제1 어댑터의 일부에 상보적인 5' 말단 영역을 더 포함하고, 여기서 제1 어댑터는 용기 바코딩된 올리고뉴클레오타이드를 포함하는 것인 방법.
  20. 제1항에 있어서, 용기는 웰, 에멀젼, 액적 또는 마이크로캡슐인 것인 방법.
  21. 제1항에 있어서, 복수 개의 이중-바코딩된 단일-가닥의 폴리뉴클레오타이드 각각은 5'에서 3'으로, 제1 어댑터, 용기 바코드, 분자 바코드 및 제2 어댑터를 포함하는 것인 방법.
  22. 제1항에 있어서, 단계 (a)-(f) 중 하나 이상은 용액 내에서 수행되고 및/또는 고체 지지체의 존재하에서 수행되지 않고;
    적어도 단계 (c) 및 (d)는 용액 내에서 수행되고 및/또는 고체 지지체의 존재하에서 수행되지 않고; 및/또는
    단계 (a)-(e) 각각은 용액 내에서 수행되고 및/또는 고체 지지체의 존재하에서 수행되지 않는 것인 방법.
  23. 제1항에 있어서, 세포 집단은 적어도 1 x 103, 5 x 103, 1 x 104, 5 x 104, 1 x 105, 5 x 105, 1 x 106, 또는 5 x 106 개 세포를 포함하는 것인 방법.
  24. 제1항에 있어서, 세포 집단은 림프구 또는 그의 서브유형, B 세포 또는 그의 서브유형, T 세포 또는 그의 서브유형, 또는 이들의 조합을 포함하는 것인 방법.
  25. 제24항에 있어서, 세포 집단은 CD4+ T 세포 및/또는 CD8+ T 세포인 T 세포를 포함하는 것인 방법.
  26. 제1항에 있어서, 상기 방법은 복수 개의 바코딩된 단일-가닥의 폴리뉴클레오타이드를 증폭하고, 그에 의하여 복수 개의 폴리뉴클레오타이드 주형을 생성하는 것을 더 포함하는 것인 방법.
  27. 제1항 내지 제26항 중 어느 하나의 항에 기재된 방법에 의하여 생성된 복수 개의 바코딩된 폴리뉴클레오타이드를 포함하는 폴리뉴클레오타이드 라이브러리.
  28. 제1항 내지 제26항 중 어느 하나의 항에 의하여 생성된 하나 이상의 복수 개의 바코딩된 폴리뉴클레오타이드, 임의로 이중 바코딩된 폴리뉴클레오타이드를 시퀀싱하는 것을 포함하는, 하나 이상의 세포의 하나 이상의 표적 폴리뉴클레오타이드 및/또는 완전한 또는 부분적인 전사체를 시퀀싱하는 방법.
  29. 제28항에 있어서, 상기 방법은 시퀀싱 전에 완전한 전사체 또는 그의 일부를 증폭하며, 여기서 증폭은 각각 제1 및 제2 어댑터 서열에 특이적인 제1 프라이머 및 제2 프라이머를 포함하는 제1 프라이머 세트를 이용하여 수행되고;
    시퀀싱 전에 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 하나 이상의 표적 폴리뉴클레오타이드(들)을 증폭하며, 여기서 하나 이상의 표적 폴리뉴클레오타이드(들)의 전장 서열(들)이 증폭되고;
    하나 이상의 바코딩된 폴리뉴클레오타이드(들), 임의로 이중 바코딩된 폴리뉴클레오타이드의 세포 기원을 결정하고; 또는
    동일한 바코드를 갖는 폴리뉴클레오타이드의 수를 정량하거나 결정하는 것을 더 포함하는 것인 방법.
  30. 전사체 분석 방법으로서, 상기 방법은:
    (a) 제1항 내지 제26항 중 어느 하나의 항에 기재된 방법에 의하여 생성되는 복수 개의 바코딩된 폴리뉴클레오타이드부터의 하나 이상의 표적 폴리뉴클레오타이드(들)을 시퀀싱하여, 그에 의하여 복수 개의 세포로부터 표적 폴리뉴클레오타이드에 대한 서열 정보를 생성하는 단계로서, 여기서 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중-바코딩된 폴리뉴클레오타이드인 것인 단계;
    (b) 제1항 내지 제26항 중 어느 하나의 항에 기재된 방법에 의하여 생성되는 복수 개의 바코딩된 폴리뉴클레오타이드로부터 전체 전사체 또는 이의 부분을 시퀀싱하고, 그에 의하여 복수 개의 세포로부터 전사체 데이터를 생성하는 단계로서, 여기서 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중-바코딩된 폴리뉴클레오타이드인 것인 단계; 및
    (c) 동일한 세포로부터의 것과 동일한 용기 바코드를 갖는 (a)로부터의 및 (b)로부터의 서열 정보를 식별하는 단계를 포함한다.
  31. 선택된 단일 세포의 전사체를 분석하는 방법으로서, 상기 방법은:
    (a) 제1항 내지 제26항 중 어느 하나의 항에 기재된 방법에 의하여 생성되는 복수 개의 바코딩된 폴리뉴클레오타이드로부터의 하나 이상의 표적 폴리뉴클레오타이드(들)을 증폭하고 시퀀싱하여, 그에 의하여 복수 개의 세포 중 적어도 하나에서 표적 폴리뉴클레오타이드 각각에 대한 서열 정보를 생성하는 단계로서, 여기서 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중-바코딩된 폴리뉴클레오타이드인 것인 단계;
    (b) (a)에서 시퀀싱된 표적 폴리뉴클레오타이드(들) 중 하나와 관련된 용기 바코드(들)을 동정하고, 그에 의하여 표적 폴리뉴클레오타이드를 보유하는 선택된 단일 세포를 동정하는 단계;
    (c) (b)에서 동정된 용기 바코드를 보유하는 세포의 복수 개의 바코딩된 폴리뉴클레오타이드로부터 전사체 또는 이의 부분을 증폭하고 시퀀싱하고, 그에 의하여 선택된 표적 폴리펩타이드-발현 세포로부터의 전사체 데이터를 생성하는 단계를 포함한다.
  32. 제31항에 있어서, 전사체 또는 이의 부분은 (b)에서 동정된 용기 바코드에 특이적인 프라이머 및 바코딩된 폴리뉴클레오타이드의 제2 어댑터 서열에 특이적인 프라이머를 이용하여 선택된 세포로부터 증폭 또는 시퀀싱되는 것인 방법.
  33. 전사체 분석 방법으로서, 상기 방법은 전사체 또는 이의 부분에 대한 서열 정보와, 동일한 세포로부터의 표적 폴리뉴클레오타이드(들) 중 적어도 하나를 매칭시키는 단계를 포함하고,
    여기서 서열 정보는 제1항 내지 제26항 중 어느 하나의 항에 기재된 방법에 의하여 생성되는 복수 개의 바코딩된 폴리뉴클레오타이드로부터 결정되고,
    여기서 바코딩된 폴리뉴클레오타이드는 분자 바코드 및 용기 바코드를 포함하는 이중-바코딩된 폴리뉴클레오타이드인 것인 전사체 분석 방법.
  34. 제33항에 있어서, 동일한 용기 바코드를 갖는 서열은 동일한 세포로부터인 것과 매칭되는 것인 방법.
  35. 제30항에 있어서, 전사체 데이터는 세포의 기능 또는 활성과 관련된 파라미터, 특성, 특징 또는 표현형을 포함하고; 및/또는
    전사체 데이터는 세포의 활성화, 고갈 또는 증식 활성과 관련된 것인 방법.
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
  63. 삭제
  64. 삭제
  65. 삭제
  66. 삭제
  67. 삭제
  68. 삭제
  69. 삭제
  70. 삭제
  71. 삭제
  72. 삭제
  73. 삭제
  74. 삭제
  75. 삭제
  76. 삭제
  77. 삭제
  78. 삭제
  79. 삭제
  80. 삭제
  81. 삭제
  82. 삭제
  83. 삭제
  84. 삭제
  85. 삭제
  86. 삭제
  87. 삭제
  88. 삭제
  89. 삭제
  90. 삭제
  91. 삭제
  92. 삭제
  93. 삭제
  94. 삭제
  95. 삭제
  96. 삭제
  97. 삭제
  98. 삭제
  99. 삭제
  100. 삭제
  101. 삭제
  102. 삭제
  103. 삭제
  104. 삭제
  105. 삭제
  106. 삭제
  107. 삭제
  108. 삭제
  109. 삭제
  110. 삭제
  111. 삭제
  112. 삭제
  113. 삭제
  114. 삭제
  115. 삭제
  116. 삭제
  117. 삭제
  118. 삭제
  119. 삭제
  120. 삭제
  121. 삭제
  122. 삭제
  123. 삭제
  124. 삭제
  125. 삭제
  126. 삭제
  127. 삭제
  128. 삭제
  129. 삭제
  130. 삭제
  131. 삭제
  132. 삭제
  133. 삭제
  134. 삭제
  135. 삭제
  136. 삭제
  137. 삭제
  138. 삭제
  139. 삭제
  140. 삭제
  141. 삭제
  142. 삭제
  143. 삭제
  144. 삭제
  145. 삭제
  146. 삭제
  147. 삭제
  148. 삭제
  149. 삭제
  150. 삭제
  151. 삭제
  152. 삭제
  153. 삭제
  154. 삭제
  155. 삭제
  156. 삭제
  157. 삭제
  158. 삭제
  159. 삭제
  160. 삭제
  161. 삭제
  162. 삭제
  163. 삭제
  164. 삭제
  165. 삭제
  166. 삭제
  167. 삭제
  168. 삭제
  169. 삭제
  170. 삭제
  171. 삭제
  172. 삭제
KR1020197038441A 2017-05-26 2018-05-25 고-처리량 폴리뉴클레오타이드 라이브러리 시퀀싱 및 전사체 분석 KR102550778B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762511949P 2017-05-26 2017-05-26
US62/511,949 2017-05-26
PCT/US2018/034768 WO2018218222A1 (en) 2017-05-26 2018-05-25 High-throughput polynucleotide library sequencing and transcriptome analysis

Publications (2)

Publication Number Publication Date
KR20200039623A KR20200039623A (ko) 2020-04-16
KR102550778B1 true KR102550778B1 (ko) 2023-07-03

Family

ID=62621068

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020197038441A KR102550778B1 (ko) 2017-05-26 2018-05-25 고-처리량 폴리뉴클레오타이드 라이브러리 시퀀싱 및 전사체 분석

Country Status (10)

Country Link
US (1) US20200354784A1 (ko)
EP (1) EP3631012B1 (ko)
JP (1) JP7308187B2 (ko)
KR (1) KR102550778B1 (ko)
CN (1) CN111148849A (ko)
AU (1) AU2018273999A1 (ko)
CA (1) CA3064205A1 (ko)
ES (1) ES2926722T3 (ko)
MA (1) MA49352A (ko)
WO (1) WO2018218222A1 (ko)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
GB2504240B (en) 2012-02-27 2015-05-27 Cellular Res Inc Compositions and kits for molecular counting of nucleic acids
JP6545682B2 (ja) 2013-08-28 2019-07-17 ベクトン・ディキンソン・アンド・カンパニーBecton, Dickinson And Company 大規模並列単一細胞分析
EP3262192B1 (en) 2015-02-27 2020-09-16 Becton, Dickinson and Company Spatially addressable molecular barcoding
ES2934982T3 (es) 2015-03-30 2023-02-28 Becton Dickinson Co Métodos para la codificación con códigos de barras combinatorios
CN108026524A (zh) 2015-09-11 2018-05-11 赛卢拉研究公司 用于核酸文库标准化的方法和组合物
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
KR102522023B1 (ko) 2016-09-26 2023-04-17 셀룰러 리서치, 인크. 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정
US11319583B2 (en) 2017-02-01 2022-05-03 Becton, Dickinson And Company Selective amplification using blocking oligonucleotides
CN112243461B (zh) 2018-05-03 2024-07-12 贝克顿迪金森公司 在相对的转录物末端进行分子条形码化
CN112272710A (zh) 2018-05-03 2021-01-26 贝克顿迪金森公司 高通量多组学样品分析
WO2020072380A1 (en) 2018-10-01 2020-04-09 Cellular Research, Inc. Determining 5' transcript sequences
US11932849B2 (en) 2018-11-08 2024-03-19 Becton, Dickinson And Company Whole transcriptome analysis of single cells using random priming
CN113195717A (zh) 2018-12-13 2021-07-30 贝克顿迪金森公司 单细胞全转录组分析中的选择性延伸
KR20210141449A (ko) * 2018-12-28 2021-11-23 내셔널 유니버시티 오브 싱가포르 표적화된 상보적 dna 강화를 위한 방법
US11661631B2 (en) 2019-01-23 2023-05-30 Becton, Dickinson And Company Oligonucleotides associated with antibodies
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
JP2022551918A (ja) * 2019-10-09 2022-12-14 エドワード フリッチュ, マルチドメインタンパク質ワクチン
CN114729350A (zh) * 2019-11-08 2022-07-08 贝克顿迪金森公司 使用随机引发获得用于免疫组库测序的全长v(d)j信息
CN115244184A (zh) 2020-01-13 2022-10-25 贝克顿迪金森公司 用于定量蛋白和rna的方法和组合物
CN115516109A (zh) * 2020-02-17 2022-12-23 通用测序技术公司 条码化核酸用于检测和测序的方法
US11661625B2 (en) 2020-05-14 2023-05-30 Becton, Dickinson And Company Primers for immune repertoire profiling
US20230203600A1 (en) * 2020-05-29 2023-06-29 Riken Method for treating cell population and method for analyzing genes included in cell population
US20210371909A1 (en) * 2020-06-02 2021-12-02 Becton, Dickinson And Company Oligonucleotides and beads for 5 prime gene expression assay
KR102468839B1 (ko) * 2020-06-03 2022-11-18 주식회사 제노헬릭스 Rna 검출 방법
CN111549025B (zh) * 2020-06-08 2021-09-14 郑州大学第一附属医院 链置换引物和细胞转录组文库构建方法
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
TWI811831B (zh) * 2020-11-03 2023-08-11 香港商行動基因(智財)有限公司 用於檢測基因變異的靶向定序方法及套組
WO2022109343A1 (en) 2020-11-20 2022-05-27 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
US20220177950A1 (en) * 2020-12-03 2022-06-09 Roche Sequencing Solutions, Inc. Whole transcriptome analysis in single cells
CN113512767B (zh) * 2021-04-30 2022-09-23 天津诺禾致源生物信息科技有限公司 用于构建small RNA文库的接头、试剂盒及small RNA文库的构建方法
CN113322523B (zh) * 2021-06-17 2024-03-19 翌圣生物科技(上海)股份有限公司 Rna快速建库方法及其应用
CN113462750A (zh) * 2021-06-29 2021-10-01 浙江峻山生物科技有限公司 一种提高病毒核酸检测灵敏度的样本保存液及其制备方法
WO2023004358A1 (en) * 2021-07-20 2023-01-26 Donald Danforth Plant Science Center All-in-one rna sequencing assay and uses thereof
WO2023086819A1 (en) * 2021-11-09 2023-05-19 Nuprobe Usa, Inc. Methods and compositions for sequencing and fusion detection using randomer reverse primers
WO2023141604A2 (en) * 2022-01-21 2023-07-27 Mission Bio, Inc. Methods of molecular tagging for single-cell analysis

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150376609A1 (en) * 2014-06-26 2015-12-31 10X Genomics, Inc. Methods of Analyzing Nucleic Acids from Individual Cells or Cell Populations
WO2016126871A2 (en) * 2015-02-04 2016-08-11 The Regents Of The University Of California Sequencing of nucleic acids via barcoding in discrete entities

Family Cites Families (68)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4656134A (en) 1982-01-11 1987-04-07 Board Of Trustees Of Leland Stanford Jr. University Gene amplification in eukaryotic cells
US5242794A (en) 1984-12-13 1993-09-07 Applied Biosystems, Inc. Detection of specific sequences in nucleic acids
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4766067A (en) 1985-05-31 1988-08-23 President And Fellows Of Harvard College Gene amplification
GB8601597D0 (en) 1986-01-23 1986-02-26 Wilson R H Nucleotide sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US4921794A (en) 1987-01-14 1990-05-01 President And Fellows Of Harvard College T7 DNA polymerase
US4795699A (en) 1987-01-14 1989-01-03 President And Fellows Of Harvard College T7 DNA polymerase
US4988617A (en) 1988-03-25 1991-01-29 California Institute Of Technology Method of detecting a nucleotide change in nucleic acids
US5168038A (en) 1988-06-17 1992-12-01 The Board Of Trustees Of The Leland Stanford Junior University In situ transcription in cells and tissues
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
US5091310A (en) 1988-09-23 1992-02-25 Cetus Corporation Structure-independent dna amplification by the polymerase chain reaction
US5066584A (en) 1988-09-23 1991-11-19 Cetus Corporation Methods for generating single stranded dna by the polymerase chain reaction
US5142033A (en) 1988-09-23 1992-08-25 Hoffmann-La Roche Inc. Structure-independent DNA amplification by the polymerase chain reaction
US4994370A (en) 1989-01-03 1991-02-19 The United States Of America As Represented By The Department Of Health And Human Services DNA amplification technique
DE3920358A1 (de) 1989-06-22 1991-01-17 Behringwerke Ag Bispezifische und oligospezifische, mono- und oligovalente antikoerperkonstrukte, ihre herstellung und verwendung
US5494810A (en) 1990-05-03 1996-02-27 Cornell Research Foundation, Inc. Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
DK1136556T3 (da) 1991-11-25 2005-10-03 Enzon Inc Fremgangsmåde til fremstilling af multivalente antigen-bindende proteiner
CA2124967C (en) 1991-12-17 2008-04-08 Nils Lonberg Transgenic non-human animals capable of producing heterologous antibodies
US5925517A (en) 1993-11-12 1999-07-20 The Public Health Research Institute Of The City Of New York, Inc. Detectably labeled dual conformation oligonucleotide probes, assays and kits
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US6852487B1 (en) 1996-02-09 2005-02-08 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using the ligase detection reaction with addressable arrays
EP1736554B1 (en) 1996-05-29 2013-10-09 Cornell Research Foundation, Inc. Detection of nucleic acid sequence differences using coupled ligase detection and polymerase chain reactions
ATE295427T1 (de) 1996-06-04 2005-05-15 Univ Utah Res Found Überwachung der hybridisierung während pcr
US6054276A (en) 1998-02-23 2000-04-25 Macevicz; Stephen C. DNA restriction site mapping
WO1999051773A1 (en) 1998-04-03 1999-10-14 Phylos, Inc. Addressable protein arrays
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
CA2330673C (en) 1998-05-01 2009-05-26 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and dna molecules
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
GB9928787D0 (en) 1999-12-03 2000-02-02 Medical Res Council Direct screening method
US6582938B1 (en) 2001-05-11 2003-06-24 Affymetrix, Inc. Amplification of nucleic acids
US6686184B1 (en) 2000-05-25 2004-02-03 President And Fellows Of Harvard College Patterning of surfaces utilizing microfluidic stamps including three-dimensionally arrayed channel networks
ATE290020T1 (de) 2001-08-31 2005-03-15 Avidex Ltd Löslicher t zell rezeptor
GB0127564D0 (en) 2001-11-16 2002-01-09 Medical Res Council Emulsion compositions
JP2006507921A (ja) 2002-06-28 2006-03-09 プレジデント・アンド・フェロウズ・オブ・ハーバード・カレッジ 流体分散のための方法および装置
US7569664B2 (en) 2002-10-09 2009-08-04 Immunocore Limited Single chain recombinant T cell receptors
US20060078893A1 (en) 2004-10-12 2006-04-13 Medical Research Council Compartmentalised combinatorial chemistry by microfluidic control
EP3616781A1 (en) 2003-04-10 2020-03-04 President and Fellows of Harvard College Formation and control of fluidic species
CN1842368B (zh) 2003-08-27 2014-05-28 哈佛大学 流体物种的电子控制
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US20050221339A1 (en) 2004-03-31 2005-10-06 Medical Research Council Harvard University Compartmentalised screening by microfluidic control
US7643818B2 (en) 2004-11-22 2010-01-05 Seven Networks, Inc. E-mail messaging to/from a mobile terminal
JP2008535644A (ja) 2005-03-04 2008-09-04 プレジデント・アンド・フエローズ・オブ・ハーバード・カレツジ 多重エマルジョンの形成のための方法および装置
CA2636855C (en) 2006-01-11 2016-09-27 Raindance Technologies, Inc. Microfluidic devices and methods of use in the formation and control of nanoreactors
US20070195127A1 (en) 2006-01-27 2007-08-23 President And Fellows Of Harvard College Fluidic droplet coalescence
EP3031918B1 (en) 2006-05-11 2018-03-14 Raindance Technologies Inc. Microfluidic devices
JP5539325B2 (ja) 2008-04-30 2014-07-02 インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド 修飾されたrna単量体を用いるrnアーゼhを基礎とするアッセイ
US8911948B2 (en) 2008-04-30 2014-12-16 Integrated Dna Technologies, Inc. RNase H-based assays utilizing modified RNA monomers
WO2010036352A1 (en) 2008-09-23 2010-04-01 Quantalife, Inc Droplet-based assay system
US10464987B2 (en) 2009-10-06 2019-11-05 Abbvie Inc. Human single-chain T cell receptors
GB2497912B (en) 2010-10-08 2014-06-04 Harvard College High-throughput single cell barcoding
WO2014108850A2 (en) * 2013-01-09 2014-07-17 Yeda Research And Development Co. Ltd. High throughput transcriptome analysis
WO2014144495A1 (en) 2013-03-15 2014-09-18 Abvitro, Inc. Single cell bar-coding for antibody discovery
RU2578009C2 (ru) * 2013-05-08 2016-03-20 Закрытое акционерное общество "ЕВРОГЕН" Способ идентификации нативных пар фрагментов днк или рнк, присутствующих в одних и тех же живых клетках
WO2014210353A2 (en) 2013-06-27 2014-12-31 10X Technologies, Inc. Compositions and methods for sample processing
GB201317301D0 (en) * 2013-09-30 2013-11-13 Linnarsson Sten Method for capturing and encoding nucleic acid from a plurality of single cells
LT3456846T (lt) 2014-04-21 2022-09-12 President And Fellows Of Harvard College Nukleorūgšties unikalios sekos įvedimo sistemos ir būdai
EP3191605B1 (en) 2014-09-09 2022-07-27 The Broad Institute, Inc. A droplet-based method and apparatus for composite single-cell nucleic acid analysis
JP6672310B2 (ja) * 2014-09-15 2020-03-25 アブビトロ, エルエルシー ハイスループットヌクレオチドライブラリーシークエンシング
WO2016100977A1 (en) * 2014-12-19 2016-06-23 The Broad Institute Inc. Methods for profiling the t-cel- receptor repertoire
US11746367B2 (en) * 2015-04-17 2023-09-05 President And Fellows Of Harvard College Barcoding systems and methods for gene sequencing and other applications
CA2983937A1 (en) 2015-04-27 2016-11-03 Abvitro Llc Methods of sequencing, determining, pairing, and validating therapeutic agents and disease specific antigens
BR112018005937A2 (pt) 2015-09-24 2019-05-21 Abvitro Llc conjugados de oligonucleotídeo de afinidade e usos destes
CN113774495A (zh) 2015-09-25 2021-12-10 阿布维特罗有限责任公司 用于对天然配对t细胞受体序列进行t细胞受体靶向鉴别的高通量方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150376609A1 (en) * 2014-06-26 2015-12-31 10X Genomics, Inc. Methods of Analyzing Nucleic Acids from Individual Cells or Cell Populations
WO2016126871A2 (en) * 2015-02-04 2016-08-11 The Regents Of The University Of California Sequencing of nucleic acids via barcoding in discrete entities

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Tamar Hashimshony et al., Cell Reports, 2, p.666-673, 2012.

Also Published As

Publication number Publication date
MA49352A (fr) 2020-04-08
JP7308187B2 (ja) 2023-07-13
RU2019143662A3 (ko) 2022-02-25
CA3064205A1 (en) 2018-11-29
CN111148849A (zh) 2020-05-12
AU2018273999A1 (en) 2019-12-05
KR20200039623A (ko) 2020-04-16
EP3631012A1 (en) 2020-04-08
WO2018218222A1 (en) 2018-11-29
RU2019143662A (ru) 2021-06-28
JP2020523034A (ja) 2020-08-06
EP3631012B1 (en) 2022-06-08
US20200354784A1 (en) 2020-11-12
ES2926722T3 (es) 2022-10-27

Similar Documents

Publication Publication Date Title
KR102550778B1 (ko) 고-처리량 폴리뉴클레오타이드 라이브러리 시퀀싱 및 전사체 분석
AU2020204449B2 (en) High-throughput nucleotide library sequencing
US20210293812A1 (en) High throughput process for t cell receptor target identification of natively-paired t cell receptor sequences
CN108291257B (zh) 亲和-寡核苷酸缀合物及其用途
JP2019537430A (ja) 親和性−オリゴヌクレオチドコンジュゲートおよびその使用
RU2790291C2 (ru) Секвенирование полинуклеотидных библиотек с высокой пропускной способностью и анализ транскриптомов

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant