KR20220139859A - 생물학적 샘플에서 전체 게놈 증폭 및 표적 분자의 분석을 위한 방법 및 키트 - Google Patents

생물학적 샘플에서 전체 게놈 증폭 및 표적 분자의 분석을 위한 방법 및 키트 Download PDF

Info

Publication number
KR20220139859A
KR20220139859A KR1020227023430A KR20227023430A KR20220139859A KR 20220139859 A KR20220139859 A KR 20220139859A KR 1020227023430 A KR1020227023430 A KR 1020227023430A KR 20227023430 A KR20227023430 A KR 20227023430A KR 20220139859 A KR20220139859 A KR 20220139859A
Authority
KR
South Korea
Prior art keywords
sequence
amplification
tagged
primer
library
Prior art date
Application number
KR1020227023430A
Other languages
English (en)
Inventor
니콜로 마나레시
안드레아 라스파도리
알베르토 페라리니
Original Assignee
메나리니 실리콘 바이오시스템스 에스.피.에이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메나리니 실리콘 바이오시스템스 에스.피.에이. filed Critical 메나리니 실리콘 바이오시스템스 에스.피.에이.
Publication of KR20220139859A publication Critical patent/KR20220139859A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1075Isolating an individual clone by screening libraries by coupling phenotype to genotype, not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/131Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a member of a cognate binding pair, i.e. extends to antibodies, haptens, avidin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

게놈 DNA 및 표적 분자를 포함하는 생물학적 샘플에서 전체 게놈 증폭 및 복수 표적 분자의 분석을 위한 방법으로서, 상기 생물학적 샘플을, 태그된 올리고뉴클레오티드와 접합된, 표적 분자의 적어도 하나에 대해 지시되는 적어도 하나의 결합제와 접촉시키는 단계로서, 상기 태그된 올리고뉴클레오티드는 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는, 단계; 분리 단계를 수행하여, 결합되지 않은 결합제를 선택적으로 제거하고, 이렇게 하여, 표지된 생물학적 샘플을 수득하는 단계; 표지된 생물학적 샘플에 대해 전체 게놈 증폭 및 태그된 올리고뉴클레오티드의 증폭을 수행하는 단계; 증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리를 제조하는 단계; 대규모 병렬 서열분석 라이브러리를 서열분석하는 단계; 각 서열분석 판독으로부터 BAB 및 UMI의 서열을 검색하는 단계; 및 각 결합제에 대해 상이한 UMI의 수를 계수하는 단계를 포함하는, 방법이 개시되어 있다.

Description

생물학적 샘플에서 전체 게놈 증폭 및 표적 분자의 분석을 위한 방법 및 키트
관련 출원에 대한 상호 참조
이 특허 출원은 2019년 12월 16일자로 출원된 이탈리아 특허 출원 제102019000024159호로부터의 우선권을 주장하고, 그 개시 전체는 참조에 의해 본 명세서에 도입된다.
발명의 기술 분야
본 발명은 생물학적 샘플, 특히 단일 세포 샘플에서 전체 게놈 증폭(whole genome amplification) 및 표적 분자(target molecule)의 분석, 특히 단백질의 정량화를 위한 방법 및 키트(kit)에 관한 것이다.
선행 기술
단일-세포 분석의 방법은, 벌크 샘플의 불균일성에 기인하는 합병증 없이 세포 상태에 대한 정보를 수득할 수 있다. 동일한 단일 세포에서 프로테옴과 게놈의 분석은 세포의 표현형과 유전자형 사이의 상관관계를 제공하고, 따라서 다양한 생물학적 및 병리학적 프로세스에 대한 독특한 통찰을 가능하게 한다. 이것은 특히 종양에 해당하고, 종양에서는, 체세포적으로 획득된 유전적 불균일성과 이의 전사 및 단백질 번역에 대한 영향이 암의 발생과 진화의 중요한 요소이다.
전체 게놈 증폭(WGA)은 단일 세포로부터 게놈을 분석하여, 더 많은 DNA를 수득하고 서열분석, SNP 검출 등을 포함한 상이한 유형의 유전자 분석을 간소화 및/또는 가능하게 하는 데 유용하다. 결정론적 제한 부위(DRS-WGA)에 기초하는 LM-PCR에 의한 WGA는 제EP1109938호로부터 공지되어 있다.
WO 제2017/178655호 및 WO 제2019/016401호는 로우-패스(low-pass) 전체 게놈 서열분석 및 카피 수 프로파일링을 위해 DRS-WGA(예: Ampli1™ WGA) 또는 MALBAC로부터 대규모 병렬 서열분석 라이브러리(massively parallel sequencing library)를 제조하는 간략화된 방법을 교시한다.
최근, 단일 세포에서 게놈과 전사체를 동시에 분석하는 방법이 개발되었다. 데이 에스. 등의 논문[참조: Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129]은 수작업으로 단리한 단일 세포로부터의 메신저 RNA를 먼저 단일 가닥 cDNA로 전사하고, 이어서 준선형 전체 게놈 증폭에 의해 게놈 DNA와 함께 증폭하는 방법을 교시한다. 이어서, 2개의 상이한 라이브러리(1개는 cDNA로부터의 것 및 1개는 게놈 DNA로부터의 것)가 제조되고, 서열분석된다. 또 다른 접근법[참조: Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370]에서, 올리고-dT 코팅 비드를 사용하여 mRNA를 gDNA로부터 물리적으로 분리하여, 완전히 용해된 단일 세포로부터 폴리아데닐화된 mRNA 분자를 포획하고 단리한다. 이어서, 변경된 Smart-seq2 프로토콜을 사용하여 mRNA가 증폭되고[참조: Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639], gDNA는 이용 가능한 전체 게놈 증폭 방법으로 증폭하고 서열분석할 수 있다. 이러한 방법은 유전자형을 메신저 전사에 연결하는 데 유용하지만, 단백질의 직접 검출을 수행할 수 없고, 단백질의 번역 및 전환/분해는 세포에서 활발하게 조절되지 않는다.
현재, 가장 광범위하게 적용되는 단일 세포 단백질 검출 접근법은 태그된 항체를 사용하여 특정 단백질을 표적화하는 것에 의존한다. 형광-활성화 세포 선별(FACS) 또는 형광 현미경에 의한 단백질의 형광-기반 검출 및 정량화에 의해, 특정 세포 단백질을 인식하는 형광 표지된 항체를 사용하여, 낮은 수준의 다중화로 단일 세포에서 단백질 검출이 가능해진다. 그러나, 형광단-기반 고도 다중화된 검정은 복수 염료의 방출 스펙트럼 사이의 스펙트럼 중첩에 의해 도전받기 때문에, 이 접근법은 일반적으로 10 내지 15회의 동시 측정으로 제한된다. 더욱이, 중첩 스펙트럼의 디콘볼루션(deconvolution)에는 복잡한 알고리즘이 필요하다.
플루이다임(Fluidigm) 질량 세포계측기(CyTOF™)는 금속 함유 폴리머 태그된(MAXPAR™) 항체를 사용하여 단백질을 검출한다. 이 기기는 비-광학적 물리적 검출 원리와 표지의 상이한 화학적 특성을 기반으로 한다. 형광 표지는 특별히 설계된 다원자 원소 태그로 치환되고, 검출은 비행 시간형 질량 분석(TOF-MS)의 고해상도, 감도 및 분석 속도를 이용한다. 다수의 이용가능한 안정한 동위원소를 태그로서 사용할 수 있기 때문에, 다수의 단백질이 개별 세포에서 잠재적으로 동시에 검출될 수 있다[참조: Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002]. 프레이 등의 연구[참조: Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742]는 RNA의 근접 결찰 검정(PLAYR)을 기반으로 단일 세포에서 RNA와 단백질을 동시에 검출하는 방법을 교시한다. PLAYR은 질량-세포분석을 통해 단일 세포에서 전사체의 고도로 다중화된 정량화를 가능하게 하고, 이는 40개 초과의 상이한 mRNA 및 단백질의 동시 정량화를 가능하게 한다. 마지막으로, 질량 세포분석에 의해, 단백질 포스포릴화[참조: Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332(6030), 687-696. http://doi.org/10.1126/science.1198704] 및 세포 증식[참조: Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075] 등의 단백질 및 메신저 RNA 전사와 함께, 복수의 세포 프로세스 및 표현형 특성을 조사할 수 있었다.
이러한 접근법의 제한은 다음과 같다:
- 질량 분석기에서의 이온 비행 역학으로 인해, 질량 세포분석의 처리량은 형광-기반 기기의 처리량보다 뒤쳐진다. 추가로, 질량 리포터의 감도는 양자 효율이 높은 형광단(예: 피코에리트린)의 수가 적기 때문에, 질량 세포측정을 사용하여 매우 낮은 수준으로 발현되는 분자의 특징을 측정하는 것이 곤란해진다[참조: Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019].
- 중요한 것은, 세포가 분무화 및 이온화되기 때문에, 분석 후에 세포를 회복할 수 없고, 따라서 게놈 DNA를 분석할 수 없다.
올리고뉴클레오티드 표지된 항체를 통한 단백질 검출 방법은 프레드릭슨 등의 논문[참조: Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473]에 기재되어 있고, 이는 2개의 DNA 앱타머(aptamer)에 의한 표적 단백질의 협조적 및 근위의 결합이 각 앱타머 친화성 프로브에 연결된 올리고뉴클레오티드의 결찰을 촉진하는 기술(근접 결찰 검정; PLA)을 교시한다. 2개의 이러한 근접 프로브의 결찰은 표적 단백질의 동일성과 양을 반영하는 증폭 가능한 DNA 서열을 생성시킨다. 방법 3PLA[참조: Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974]는 3개의 인식 이벤트를 사용함으로써 근접 결찰 방법의 감도와 특이성을 연장하고, 100개 정도의 표적 분자를 검출할 수 있다. 3PLA에서, 3개의 올리고뉴클레오티드 변형 항체 시약 세트가 개별 표적 단백질에 결합하여 근접 결찰에 의해 검출 가능한 신호를 발생시킨다. 2개의 근접 프로브 상의 올리고뉴클레오티드의 3' 및 5' 말단은 제3 근접 프로브에 존재하는 올리고뉴클레오티드와 하이브리드화하여, 3개의 프로브와 표적 단백질을 포함하는 복합체를 형성할 수 있다. 이것은 2개의 올리고뉴클레오티드가 2개의 결찰 반응에 의해 중간 단편을 통해 연결되도록 하고, 제3 근접 프로브에 의해 템플릿화되어 qPCR에 의해 검출될 수 있는 특정 증폭 가능한 DNA 가닥이 형성된다. 근접 신장 검정(Proximity Extension Assay; PEA)은 2개의 올리고뉴클레오티드 표지된 항체가 개별 단백질에 결합하고, 올리고뉴클레오티드가 3' 말단에서 부분적으로 어닐링되고, 폴리머라제에 의한 신장이 qPCR에 의해 검출될 수 있는 증폭 가능한 DNA 서열을 생성하는 PLA의 변이이다[참조: Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424]. 상기의 방법은 단일 세포 단백질 검출용으로 특별히 설계되지 않았지만, 플루이다임(Fluidigm) C1™ 단일 세포 자동 제조 시스템을 사용하여, PEA 검정을 사용하여, 실행당 최대 96개의 단일 세포에서 92개 단백질의 패널의 증폭 가능한 표적의 제조를 자동화했다[참조: Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 ™ Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5)]. 플루이다임 C1 마이크로유체 시스템은 전사체 또는 게놈 DNA 서열을 전체 엑솜 서열분석 및 표적 DNA 서열분석으로 분석하기 위한 다양한 단일 세포 생물학적 방법을 서포트하지만, 이 방법을 간단하게 조합하여 동일한 단일 세포로부터 유전자형 및 표현형에 대한 정보를 수득할 수 없다.
따라서, 검출이 qPCR을 기반으로 하는 PLA 및 PEA 검정은 감도가 높고 매우 특이적이지만, 처리량이 제한되고, 단백질만을 검출할 수 있다.
나노스트링 테크놀로지 인코포레이티드(NanoString Technologies, Inc.)의 US 제9,714,937호는, 표적 단백질 및 검출 항체의 제1 영역, 링커 올리고뉴클레오티드에 대한 하이브리드화를 통해 검출 항체에 연결된 복수의 박리가능한 표지를 포함하는 나노리포터를 갖는 표적 단백질의 제2 영역에 대해 특이적인 바이오틴 등의 모이어티에 접합된 포획 항체의 사용을 통한 단백질의 검출 방법을 교시한다. 2개의 항체는 표적 단백질과 복합체를 형성하고, 이는 그 모이어티에 대해 높은 친화성을 갖는 매트릭스 또는 비드와의 결합을 형성할 수 있다. 나노리포터 분자의 수를 계수함으로써 표적을 검출 및 정량화한다. nCounter® 디지털 분자 바코드 기술을 기반으로 하는 나노스트링 인코포레이티드(Nanostring, Inc.)로부터 상업적으로 이용 가능한 검정법은 특정 단백질 에피토프를 표적화하는 고유한 올리고뉴클레오티드 표지 항체를 사용하여 단백질을 검출한다. 고유한 단일 가닥 DNA 태그는 비오틴화된 포획 프로브와, 일련의 형광 표지된 RNA 세그먼트에 어닐링된 단일 가닥 DNA 분자에 의해 작성된 리포터 프로브의 조합을 사용하여 검출된다. 이러한 표지의 선형 순서에 의해, 목적하는 각 표적에 대해 고유한 바코드가 생성된다. 이어서, 비오틴과 고정화된 스트렙트아비딘 분자 사이의 비공유 결합을 통해 복합체를 이미징 표면에 고정화하고, 형광 바코드를 이미징하여 계수한다. 단백질-특이적 바코드당 계수 수는 샘플에 존재하는 분자 수와 직접 관련된 디지털 측정치이다. 단백질 검출은 특정 표적 RNA에 대해 설계된 포획 프로브-리포터 프로브 커플을 사용하여 메신저 RNA 검출과 조합될 수 있다. 1회의 분석으로 약 30개의 단백질 표적과 770개의 mRNA 표적을 분석할 수 있다.
이 방법의 결점은 RNA(2,500개 세포에 해당) 및/또는 단백질(100,000개 세포에 해당)의 프로파일링에 대량의 세포를 필요로 하고, 그 자체로는 단일 세포의 프로파일링에 적합하지 않다는 것이다. 잠재적으로, 이 방법은 게놈 DNA 등의 다른 분석물을 검출하는 데 사용될 수 있지만, 게놈 서열을 직접 판독할 수 없을 뿐만 아니라, 공지된 서열의 존재/부재에 대한 신호만을 제공할 수 있다. 하이브리드화를 기반으로 하기 때문에, 서열 변이체에 대하여 부분적으로 내성이 있고, 상이한 서열 변이체를 구별할 수 없는 경우가 있다.
서열분석에 의한 전사체 및 에피토프의 세포 인덱싱(CITE-seq)으로 명명된 단일 세포에서 복수의 단백질 및 RNA 전사물의 통합 분석을 위한 NGS 기반 방법은 문헌[참조: Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868, and US 2018/0251825]에 기재되어 있다. 이 방법은 메신저 RNA에 존재하는 것과 유사한 항체 태그에 존재하는 3'-폴리 아데노신 테일을 통해 세포 단백질 및 전사체 측정치를 단일 세포 판독에 통합하기 위해 사용되는 올리고뉴클레오티드 표지 항체에 의존한다. 이 방법은 10X 게놈믹스(Genomics)가 제공하는 것 등의 단일 세포에서 샘플 분할 및 단일 세포 라이브러리 제조를 위한 액적(droplet)-기반 접근법과 호환성이 있다. 보다 상세하게는, CITE-seq 방법에서, 세포 표면 에피토프에 대한 올리고뉴클레오티드 표지된 항체로 염색된 세포는 마이크로유체 수단에 의해 용해 효소 및 바코드 비드를 포함하는 오일 액적으로 분할된다. 각 단일 세포/액적으로부터의 바코드 항체 및 mRNA는 고유한 세포 바코드를 갖는 비드에 의해 포획된다. 이어서, mRNA는 역전사되고, 바코드 항체로부터의 올리고와 함께 증폭되어 서열분석의 준비가 된 NGS 라이브러리를 생성한다. 마지막으로, 서열 계수는 바코드 항체의 정량화에 사용된다. 유사하게는, 문헌[참조: Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939]은 DNA 표지 항체 및 액적 마이크로유체를 기반으로 하는 방법, RNA 발현 및 단백질 정량화 검정(REAP-seq)을 교시하고, 이에 의해 단백질은 82개의 바코드 항체를 사용하여 정량화할 수 있고, >20,000의 전사를 단일 세포에서 프로파일링할 수 있다. 상기에서 언급한 2개 방법은 모두 역전사효소의 DNA 폴리머라제 활성을 이용하여 프라이밍된 올리고 표지된 항체를 폴리(dT) 세포 바코드로 동시에 신장하고, 동일한 반응에서 mRNA로부터 상보적 DNA를 합성한다. 다른 한편, 액적 접근법을 기반으로 하는 다른 방법은 전체 게놈 카피 수 프로파일의 분석 또는 단일 세포 내의 게놈 서열의 분석에 이용할 수 있다. 예를 들면, 10X 게놈믹스(Genomics)에 의한 상용 솔루션 크로미움 싱글 셀 CNV 솔루션(Chromium Single cell CNV Solution)은 수백으로부터 수천의 단일 세포의 복제 수 프로파일링을 가능하게 하고, 미션 바이오(Mission Bio)의 타페스트리(Tapestri®) 플랫폼은 유전자 패널의 서열 및 CNV 분석을 위한 단일 세포 표적 DNA 서열분석을 제공한다.
이러한 방법의 결점은 다음과 같다:
- 상기에서 설명한 전사체/프로테옴 프로파일링을 동시에 수행하는 방법은 둘 다, 게놈 DNA가 증폭에 필요한 폴리아데노신 테일을 갖고 있지 않기 때문에, 단백질 또는 전사물과 함께 게놈 서열을 동시에 분석할 수 없다.
- Dropseq 기반의 카피 수 및/또는 표적 서열분석 방법은 게놈 DNA 분석에만 적합하지만, 전사 프로파일 또는 표면 마커 또는 기타 단백질의 정량화 등의 단일 세포의 표현형에 대한 정보는 제공하지 않는다.
- 액적-기반의 단일 세포 분할 접근법에서, 단일 세포 및 모든 정보 내용은 프로세스에서 본질적으로 "파괴"되고, 절차가 완료된 후, 추가 분석을 수행하기 위해 단일 세포를 회복할 수 없다.
발명의 요약
따라서, 본 발명의 목적은, 생물학적 샘플에서 전체 게놈 증폭 및 복수 표적 분자의 분석을 위한 방법을 제공하는 것이고, 이는 게놈 전체의 카피-수 프로파일/게놈 서열의 분석 및 동일한 단일 세포 상에서의 단백질 발현의 분석을 동시에 가능하게 하고, 특히 다음과 같은 최신 기술의 결점 중 하나 이상을 극복한다:
- 단백질을 검출 및 정량화하고, 동일한 샘플에서 게놈을 단일-세포 분해능까지 분석하는 것은 불가능하고,
- 추가 표적 게놈 정보를 위해 단일 세포를 재분석하는 것은 불가능하다.
이 목적은 청구항 제1항에 정의된 방법에 의해 달성된다.
본 발명의 또 다른 목적은 청구항 제17항에 정의된 바와 같은 키트를 제공하는 것이다.
도 1은 본 발명에 따른 3' 태그된 올리고 서열의 부재(도 1A) 또는 존재(도 1B)하에 태그된 올리고뉴클레오티드(tagged oligonucleotide)의 2개의 가능한 실시양태의 일반적 구조를 나타낸다. PL = 페이로드(payload) 서열; 5-TOS = 제1 태그된 올리고뉴클레오티드 증폭 서열; 3-TOS = 제2 태그된 올리고뉴클레오티드 증폭 서열; UMI = 고유 분자 식별자 서열; BAB = 결합제(binding agent) 바코드 서열.
도 2는 2개의 상이한 태그된 올리고의 태그된 올리고뉴클레오티드 라이브러리를 나타내는 그래프를 도시하고, 1개는 상이한 온도에서 5-TOS와 3-TOS 사이에서 분자내 헤어핀이 형성되기 쉬운 경향이 있다("헤어핀 존재": Tm = 67℃, "헤어핀 부재": Tm = 45℃). x축은 예상 UMI 계수이고, y축은 서열분석 후에 계수된 UMI이다.
도 3은 27회의 PCR 사이클에 의한 상이한 양의 올리고 혼합물의 증폭을 나타내는 그래프를 도시한다. 각각의 희석은 3회의 독립된 희석 복제로부터 수행되었다. x축은 관찰될 것으로 예상되는 별개의 UMI의 수이고, y축은 실험적으로 관찰된 UMI이다.
도 4는 상이한 양의 상이한 BAB를 갖는 4개의 올리고 혼합물의 증폭에 대한 3개의 그래프를 도시한다. 각 희석에는 각 올리고당 1개씩, 합계 4개의 데이터 포인트가 있다. 도 4A: 23회의 PCR 사이클을 수행했다. 도 4B: 27회의 PCR 사이클을 수행했다. 도 4C: 35회의 PCR 사이클을 수행했다. x축은 관찰될 것으로 예상되는 별개의 UMI의 수이고, y축은 실험적으로 관찰된 UMI이다.
도 5는 1개의 프라이머 증폭을 갖는 태그된 올리고의 본 발명에 따른 실시양태의 구조를 도시한다. 추가 캡션: 5-WGAH = 5' WGA 핸들 서열; 3-WGAH = 3' WGA 핸들 서열; 1AH = 제1 증폭 핸들 서열; 2AH = 제2 증폭 핸들 서열.
도 6은 적어도 제2 프라이머 증폭을 갖는 태그된 올리고의 본 발명에 따른 또 다른 실시양태의 구조를 도시한다. 도 6A: BAB에 상응하는 어닐링 부위를 갖는 태그된 올리고 및 상대적 신장 올리고뉴클레오티드의 구조. 도 6B: BAB에 상응하지 않는 어닐링 부위를 갖는 태그된 올리고 및 상대 신장 올리고뉴클레오티드의 구조. 추가 캡션: E-p = 5' 신장 올리고뉴클레오티드 서열; SS = 스페이서 서열(spacer sequence); AS = 어닐링 서열; AS-RC = 어닐링 서열 역상보체.
도 7은 분자 길이의 함수로서 ssDNA 분자의 말단에 위치하는 15nt 길이의 상보적 서열에 의해 유도된 헤어핀의 용융 온도([Na+]=150mM; [Mg++]=4mM)의 인 실리코(in silico) 예측의 그래프를 도시한다.
도 8은 적어도 3개의 프라이머 증폭을 갖는 태그된 올리고의 본 발명에 따른 또 다른 실시양태의 구조를 도시한다.
도 9는 라이브러리 생성을 위한 일반적 도식을 도시한다. 도 9A: 도 5의 실시양태에 따른 태그된 올리고로부터 라이브러리의 생성. 도 9B: 도 6A의 실시양태에 따른 태그된 올리고로부터 라이브러리의 생성. 도 9C: 도 8의 실시양태에 따른 태그된 올리고로부터 라이브러리의 생성. 추가 캡션: 2AH-RC = 제2 증폭 핸들 서열 역상보체.
도 10은 실시예 1에 개시된 P5-Synth 올리고 및 상응하는 라이브러리 프라이머의 설계를 도시한다.
도 11은 실시예 1에 따른 라이브러리 프라이머를 사용한 올리고 P5-Synth의 NGS 라이브러리 생성의 도식을 도시한다.
도 12는 Ab-올리고 및 제2 형광 항체로 염색된 PBMC 및 SK-BR-3 세포의 산포도를 도시한다. x축은 APC 채널의 형광 수준이고, 이는 Ab-올리고 태그1, 태그2 및 태그4의 양에 비례한다. y축은 PE 채널의 형광 수준이고, 이는 Ab-올리고 태그3의 양에 비례한다.
도 13은 실시예 1에 따른 단일 세포로부터 P5-synth 태그된 올리고로부터 생성된 라이브러리로부터의 전기영동을 도시한다.
도 14는 WGA 후의 태그된 올리고 증폭을 사용하여 도 8의 실시양태에 따라 처리된 단일 세포로부터의 단백질 정량화 결과를 도시한다. 각각 사이토케라틴(도 8A), Her2(도 8B), CD45(도 8C) 및 IgG1 이소형 대조군(도 8D) 정량화의 UMI 계수. y축은 UMI의 수이고, x축은 도 9에 따라 단리된 세포 유형이다.
도 15는 WGA 중에 태그된 올리고 증폭을 사용하여 도 8의 실시양태에 따라 처리된 단일 세포로부터의 단백질 정량화 결과를 도시한다. 각각 사이토케라틴(도 8A), Her2(도 8B), CD45(도 8C) 및 IgG1 이소형 대조군(도 8D) 정량화의 UMI 계수. y축은 UMI의 수이고, x축은 도 9에 따라 단리된 세포 유형이다.
도 16은 실시예 3에 개시된 P5-Lib1 올리고 및 상응하는 라이브러리 프라이머의 설계를 도시한다.
도 17은 라이브러리 프라이머를 사용한 P5-Lib1 올리고의 NGS 라이브러리 생성의 도식을 도시한다.
도 18은 단일 세포로부터 수득된 CNA 분석을 위한 로우패스(LowPass) 프로파일의 예를 도시한다. 도 18A: P5-Lib1 올리고를 스파이킹하고 도 5의 실시양태에 따라 처리된 단일 세포 CNA 프로파일. 도 18B: P5-Synth 올리고를 스파이킹하고 도 8의 실시양태에 따라 처리된 단일 세포 CNA 프로파일. 도 18C: 태그된 올리고 스파이크 부재하의 단일 세포 CNA 프로파일. 모든 프로파일은 전형적 이득 및 손실을 갖는 SK-BR-3 세포에 상응한다. 작은 변동은 단일 세포 게놈 불균일성에 기인한 것이다.
도 19는 P5-Synth 및 P5-Lib1을 스파이킹한 단일 세포로부터 수득된 태그된 올리고 라이브러리를 나타내는 그래프를 도시한다. x축은 예상된 UMI 수이고, y축은 서열분석 후에 계수된 UMI이다.
정의
달리 정의되지 않는 한, 본 명세서에서 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 다수의 방법 및 재료를 본 발명의 실시 또는 시험에 사용할 수 있지만, 바람직한 방법 및 재료를 하기에 기재한다. 달리 언급되지 않는 한, 본 발명에서 사용하기 위해 본 명세서에 기재된 기술은 당업자에게 공지된 표준 방법론이다.
"ab-올리고 혼합물"은 세포의 내부(즉, "내부 ab-올리고 혼합물") 및/또는 외부(즉, "외부 ab-올리고 혼합물") 에피토프 및/또는 이소형 대조군 ab-올리고를 표적화하는 모든 ab-올리고를 함유하는 용액을 의미한다.
"항체-올리고뉴클레오티드 접합체" 또는 "ab-올리고 접합체" 또는 "ab-올리고"는 항체 분자와 ssDNA 올리고뉴클레오티드 분자의 화학적 접합에 의해 유도되는 합성 분자를 의미한다. 화학적 접합은 통상 공유 방식으로 2개 분자의 연결을 가능하게 하는 특정 화학 반응을 사용하여 수행된다. 항체:올리고뉴클레오티드의 화학량론은 특정 비율을 갖기 위해 제어될 수 있다. WGA 초기 단계에서는, 항체 모이어티가 통상 소화되고, 올리고뉴클레오티드 부분만이 잔류한다. 단순함을 위해, 설명에서, 이들 분자는 여전히 ab-올리고 분자 또는 ab-올리고 앰플리콘으로 지칭될 것이다.
약어 "APC"는 형광단 알로피코시아닌을 의미한다.
"결합제 바코드 서열(BAB)"은 결합제를 식별하는 고유한 DNA 올리고뉴클레오티드 서열을 의미한다.
"균형 잡힌 PCR 증폭"이란, 복수 표적의 증폭을 수행하는 PCR의 특징을 의미하고, 이에 의해 각 PCR 사이클에서 실질적으로 모든 표적 분자가 증폭된다.
"결합제"는, 지정된 표적 분자, 예를 들면, 단백질 또는 글리코실화 단백질 또는 포스포릴화 단백질에 특이적으로 결합할 수 있는 분자(예컨대, 비제한적 예로서, 항체, 아피바디, 리간드, 앱타머, 합성 결합 단백질, 소분자)를 의미한다.
"CITE-Seq" 또는 "서열분석에 의한 전사체 및 에피토프의 세포 인덱스"는, 단일 세포에서 동시 단백질 정량화 및 mRNA 서열분석을 위한 스토엑키우스 등(Stoeckius et al.)에 의해 개발된 방법을 의미한다.
"CyTOF" 또는 "비행 시간에 의한 세포측정"은 세포측정과 조합하여 질량분석을 사용하여 단일 세포 내의 단백질 정량화를 가능하게 하는 질량 세포측정 기술을 수행하는 장치를 의미한다. 세포는 중금속 동위원소와 결합된 결합제로 염색된다.
용어 "접합체"는 결합제와 태그된 올리고뉴클레오티드의 공유 접합으로부터 수득된 분자를 의미한다.
"카피 수 변경(CNA)"은 동일한 개별 게놈과 관련하여 일반적으로 정의되는 게놈 영역의 카피 수의 체세포 변화를 의미한다.
"DNA 라이브러리 정제"란, DNA 라이브러리 재료를, 효소, dNTP, 염 및/또는 목적하는 DNA 라이브러리의 일부가 아닌 기타 분자 등의 원치 않는 반응 성분으로부터 분리하는 프로세스를 의미한다. DNA 라이브러리 정제 프로세스의 예로는 에겐코우트(Agencourt) AMPure, 머크 밀리포어 아미콘(Merck Millipore Amicon) 스핀-컬럼 또는 베크만 코울터(Beckman Coulter) 등의 고상 가역 고정화(SPRI) 비드를 사용한 정제가 있다.
"DNA 라이브러리 정량화"란, DNA 라이브러리 재료를 정량화하는 프로세스를 의미한다. DNA 라이브러리 정량화 프로세스의 예는 QuBit 기술, 전기영동 검정(Agilent Bioanalyzer 2100, Perkin Elmer LabChip 기술) 또는 RT-PCR 피코그린(PicoGreen) 시스템(Kapa Biosystems)을 사용한 정량화가 있다.
"동적 범위"란, 특정 양이 가정할 수 있는 최대치와 최소치 사이의 비율을 의미한다.
"라이브러리 프라이머"는 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열화 가능한 라이브러리를 생성하기 위해 프라이머로서 작용하는 ssDNA 분자를 의미한다.
"로우-패스 전체 게놈 서열분석" 또는 "로우패스 서열분석"은 1 미만의 평균 서열분석 심도에서 전체 게놈 서열분석을 의미한다.
"대규모 병렬 서열분석(massive-parallel sequencing)" 또는 "차세대 서열분석(next generation sequencing, NGS)"은 공간적 및/또는 시간적으로 분리된, 클론적으로 서열분석된(사전 클론 증폭의 존재 또는 부재하에) DNA 분자 라이브러리의 생성을 포함하는 DNA 서열분석 방법을 의미한다. 이의 예로는 일루미나(Illumina) 플랫폼(Illumina Inc), 이온토렌트(IonTorrent) 플랫폼(ThermoFisher Scientific Inc), 퍼시픽 바이오사이언시스(Pacific Biosciences) 플랫폼, MinIon(Oxford Nanopore Technologies Ltd)이 포함된다.
"복수의 어닐링 및 루핑 기반 증폭 사이클(Multiple Annealing and Looping Based Amplification Cycles; MALBAC)"은 준선형 전체 게놈 증폭 방법을 의미한다[참조: Zong et al., 2012, Genome-wide detection of single-nucleotide and copy-number variations of a single human cell, Science. Dec 21;338(6114):1622-6. doi: 10.1126/science.1229164.]. MALBAC 프라이머는 주형과 하이브리드화하는 8개의 뉴클레오티드 3' 랜덤 서열과 27개의 뉴클레오티드 5' 공통 서열(GTG AGT GAT GGT TGA GGT AGT GTG GAG)을 갖고 있다. 제1 신장 후, 세미앰플리콘은 또 다른 신장을 위한 주형으로서 사용되고, 이는 상보적 5' 및 3' 말단을 갖는 전체 앰플리콘을 생성한다. 준선형 증폭의 몇 사이클 후에, 전체 앰플리콘은 후속 PCR 사이클로 기하급수적으로 증폭될 수 있다.
용어 "올리고뉴클레오티드" 또는 "올리고"는, 비제한적 예로서, 데옥시리보핵산(DNA), 리보핵산(RNA), 잠금 핵산(LNA), 펩티드 핵산(PNA) 등의 뉴클레오티드 서열을 포함하는 올리고머 분자를 의미한다.
"태그된 올리고뉴클레오티드" 또는 "태그된 올리고"는 결합제(예: 1차 항체)에 직접 접합된 올리고뉴클레오티드 분자(예: ssDNA 분자)를 의미한다. 태그된 올리고는 결합제의 리간드인 표적 분자(예: 단백질)의 간접적 정량화에 사용된다.
약어 "PE"는 형광단 피코에리트린을 의미한다.
"PFA 2%"는 인산염 완충 생리식염수 중의 2% w/v의 파라포름알데히드 용액을 의미한다.
"1차 WGA DNA 라이브러리(pWGAlib)"는 WGA 반응으로부터 수득된 DNA 라이브러리를 의미한다.
용어 "재증폭" 또는 "re-amp"는 1차 WGA DNA 라이브러리의 전체 또는 상당 부분이 추가로 증폭되는 PCR 반응을 의미한다.
"잔기"는 단백질의 폴리펩티드 쇄에 존재하는 아미노산 잔기를 의미한다.
"바코드의 서열분석"이란, 1개의 서열분석기 판독 내에서 서열분석될 때, 해당 판독을 해당 바코드와 관련된 특정 샘플에 할당하는 것을 가능하게 하는 폴리뉴클레오티드 서열을 의미한다.
"UMI" 또는 "고유 분자 식별자 서열"은 각 ssDNA 또는 dsDNA 분자에 대해 실질적으로 고유한 축퇴성(degenerate) 또는 부분-축퇴성(즉, 랜덤 또는 세미랜덤) 올리고뉴클레오티드 서열을 의미한다.
"범용 WGA-프라이머" 또는 "WGA PCR 프라이머"는 제한 효소의 작용에 의해 생성된 각 단편에 연결되는 추가 올리고뉴클레오티드를 의미한다. 범용 WGA 프라이머는 Ampli1™ WGA 등의 DRS-WGA에 사용된다.
발명의 상세한 설명
본 발명에 따른 게놈 DNA 및 표적 분자를 포함하는 생물학적 샘플에서 전체 게놈 증폭 및 복수 표적 분자의 분석 방법은 하기의 단계를 포함한다.
단계 a)에서, 생물학적 샘플이 제공된다. 생물학적 샘플은 바람직하게는 단일 세포이지만, 몇몇 세포를 포함하는 샘플일 수도 있다.
단계 b)에서, 생물학적 샘플은 태그된 올리고뉴클레오티드와 접합된 적어도 하나 이상의 표적 분자에 대해 지시되는 적어도 하나의 결합제와 접촉하고, 그 결과, 생물학적 샘플에 적어도 하나의 표적 분자가 존재하는 경우, 적어도 하나의 결합제는 적어도 하나의 표적 분자에 결합한다.
결합제는 바람직하게는 항체 또는 이의 단편, 앱타머, 소분자, 펩티드 및 단백질로 이루어진 그룹으로부터 선택된다. 표적 분자는 바람직하게는 단백질, 펩티드, 당단백질, 탄수화물, 지질 및 이들의 조합으로 이루어진 그룹으로부터 선택된다. 보다 바람직하게는, 결합제는 항체이다. 결합제는 모노클로날 항체 또는 효소 기질 등의 특정 화학량론 또는 폴리클로날 항체 또는 소분자 등의 불특정 화학량론으로 표적 분자에 결합한다. 전자는, 후자와 관련하여 표적의 보다 양호한 정량화를 가능하게 한다. 결합제는 공유 결합 상호작용 또는 비-공유 상호작용을 통해 태그된 올리고에 화학적으로 접합한다. 전자의 경우, 올리고와 결합제 둘 다는 상호 결합을 가능하게 하는 반응성 모이어티를 갖고 있다. 결합제:올리고 화학량론은 접합 절차 중에 제어될 수 있다.
결합제/표적 분자의 예의 비제한적 목록이 하기 표 1에 보고되어 있다.
결합제(들) 표적 분자(들)
항체 또는 나노바디 또는 Fab 등의 항체의 단편 항원, 포스포-단백질(pAKT) 등의 번역후 변형된 단백질, 또는 아세틸화 단백질(예: 히스톤)
앱타머 항원
소분자 약물 세포 표면 수용체, 채널
펩티드 단백질, 효소
단백질 단백질, DNA, RNA
태그된 올리고뉴클레오티드로서 사용되는 올리고뉴클레오티드는 바람직하게는 5' 또는 3' 말단에 화학적 변형을 갖는 ssDNA 또는 dsDNA 분자이다. 이 변형은 상대 결합제와의 공유 접합에 사용된다.
결합제와 접합된 태그된 올리고에 의해 형성된 접합체는 세포외 에피토프 및 세포내 에피토프 모두를 표적화할 수 있다. "외부" 및 "내부" 접합체는 최종 염색 농도에서 접합체를 포함하는 2개의 개별 혼합물로서 생물학적 샘플에 적용될 수 있다. 첫째, 외부 혼합물을 적용하여 외부 에피토프를 표지한다. 둘째, 세제 또는 유사한 수단을 사용하여 세포를 투과처리하고, 내부 혼합물을 샘플에 적용하여 내부 에피토프를 표지한다. 또는, 외부 접합체 및 내부 접합체를 함께 혼합하여 원-스텝 염색을 수행할 수도 있다. 최종 염색 농도는 각 결합제에 따라 상이하고, 실험적으로 결정해야 한다.
태그된 올리고 서열은 결합제와의 접합을 용이하게 하고 비용을 절감하기 위해 바람직하게는 300개 염기보다 짧고, 더욱 바람직하게는 120개 염기보다 짧다. 바람직한 실시양태에서, 태그된 올리고 서열은 60 내지 80개 뉴클레오티드이다.
도 1A를 참조하면, 태그된 올리고뉴클레오티드는 하기를 포함한다:
i) 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는 핵산의 페이로드 서열(PL), 및
ii) 핵산의 적어도 하나의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS).
페이로드 서열에는 표적 계수에 필요한 정보가 함유되어 있다.
고유 분자 식별자 서열(UMI)은 바람직하게는 10 내지 30개 뉴클레오티드 범위의 축퇴성 또는 반-축퇴성 서열이다. 바람직하게는, UMI는 적어도 10개 염기의 길이를 갖고, 이론상의 410=1,048,576개의 상이한 조합에 상응하며, 이는 대부분의 표적 분자에 충분하다. 매우 풍부한 표적 분자의 경우, 더 긴 UMI를 사용하여, 12개 염기 등의 가능한 조합을 증가시킬 수 있다. 반-축퇴성 염기를 사용하면, 가능한 조합이 감소하고, UMI 길이가 바람직하게는 최대 20개 또는 30개 염기까지 증가한다. 반-축퇴성 UMI는, 존재하는 별개의 UMI의 과대평가를 방지하는 서열을 재정렬시키기 위해 판독에 사용될 수 있는 참조 포인트를 도입하는 데 유리하게 사용될 수 있다. UMI 서열은 BAB의 5' 또는 3'의 어느 하나에 위치할 수 있다. UMI 서열은, 최초로 서열분석된 염기의 복잡성을 증가시키기 위해, 판독 1 서열분석 프라이머 어닐링 부위의 직후에 우선적으로 위치시킨다. 이는 일루미나(Illumina) 서열분석 플랫폼에 유리하고, 이는 최초 서열분석 단계에서 클러스터 식별에 높은 복잡성이 필요하기 때문이다. BAB는 각 접합체 분자에 대해 고정된 서열이다. BAB는 호모폴리머, 헤어핀 및/또는 헤테로이중쇄 형성 등의 1차 PCR 증폭 및 서열분석 단계를 방해할 수 있는 기능을 회피하기 위해 설계되었고[참조: Frank, D. N., 2009, BARCRAWL and BARTAB: software tools for the design and implementation of barcoded primers for highly multiplexed DNA sequencing. BMC Bioinformatics, 10, 362. http://doi.org/10.1186/1471-2105-10-362], 이들의 상대적 해밍(Hamming) 거리를 최대화하기 위해, 정의된 길이의 모든 가능한 BAB 서열 풀로부터 선택되고, 따라서 PCR 또는 서열분석 오류가 서열분석된 판독의 잘못된 할당을 유도할 가능성을 최소화한다. BAB 길이는 검출할 표적 분자의 수에 기초하여 선택해야 한다. 바람직하게는, BAB는 적어도 10개의 뉴클레오티드 길이를 갖고, 이론상 410=1,048,576개의 상이한 조합에 상응하며, 이는 GC 함량(예: [30%..70%]), 호모폴리머의 부재, 헤어핀의 부재 및 최소 해밍 거리(바람직하게는 ≥3 nt)에 필터를 적용한 후에 약 2000개의 가능한 BAB 서열로 감소된다.
제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS)은 태그된 올리고의 5'에 위치한다. 이 서열은 태그된 올리고 증폭 및 후속 라이브러리 생성에 필요하다. 태그된 올리고 증폭은, 적절한 UMI 계수를 방해할 수 있는 샘플의 처리 중에 분자 손실로 인한 임의의 바이어스를 회피하기 위해 필요하다.
도 1B를 참조하면, 표적 올리고뉴클레오티드는 바람직하게는 적어도 하나의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)을 추가로 포함한다. 이 서열은 태그된 올리고의 3'에 위치한다. 이 서열은 태그된 올리고 증폭 및 후속 라이브러리 생성에 필요하다. 태그된 올리고 증폭은, 적절한 UMI 계수를 방해할 수 있는 샘플의 처리 중에 분자 손실로 인한 임의의 바이어스를 회피하기 위해 필요하다.
바람직한 실시양태에서, 5-TOS 및 3-TOS 서열은 태그된 올리고 증폭을 방해할 수 있기 때문에, 증폭 온도 범위 내에서 헤어핀 및 이의 기타 분자내 안정한 2차 구조의 형성을 회피하도록 설계된다. 도 2는 2개의 상이한 태그된 올리고로부터의 태그된 올리고뉴클레오티드 라이브러리를 나타내는 그래프를 도시하고, 1개는 상이한 온도에서 5-TOS와 3-TOS 사이에서 분자내 헤어핀이 형성되기 쉬운 경향이 있다("헤어핀 존재": Tm = 67℃, 서열번호 50, ΔG = -11.15 kcal/mol; "헤어핀 부재": Tm = 45℃, 서열번호 51, ΔG = -1.52 kcal/mol). x축은 예측 UMI 계수이고, y축은 서열분석 후에 계수된 UMI이다.
태그된 올리고 및 이들의 증폭 프라이머는 고감도, 광범위한 동적 범위, 균형 잡힌 PCR 증폭 및 재현성을 달성하도록 최적화되었다.
본 발명의 바람직한 실시양태에서, UMI 서열 길이는 0 내지 약 106 분자 범위의 표적을 정량화하기 위해 선택되었다(n = 10).
동적 범위는 4차수(102로부터 106 분자)에 걸친 농도를 갖는 태그된 올리고의 증폭에 의해 특성화되었다. 도 3은 27회의 PCR 사이클에 의한 상이한 양의 올리고 혼합물의 증폭을 나타내는 그래프를 도시한다. 각각의 희석은 3회의 독립된 희석 복제로부터 수행되었다. x축은 관찰될 것으로 예상되는 개별 UMI의 수이고, y축은 실험적으로 관찰된 UMI이다. 관찰된 UMI와 증폭 전의 예측된 UMI 사이의 분자 수 102 내지 106 범위에서 매우 선형의 상관관계가 관찰될 수 있다.
균형 잡힌 PCR 증폭은 동일한 개시 샘플에서 상이한 증폭 사이클을 수행하여 특성화되었다. 도 4A 및 4b에 도시된 바와 같이, 상이한 수의 합계 PCR 사이클 수(각각 23 및 27 PCR 사이클)로 태그된 올리고의 동일한 풀을 증폭해도, 관찰된 UMI의 차이는 발생하지 않았고, 이는 PCR 사이클의 수가 UMI 계수에 영향을 미치지 않는 것을 나타낸다.
감도는 상이한 양(40개 분자까지)의 태그된 올리고 풀의 증폭에 의해 특성화되었다. 도 4C에 도시된 바와 같이, 태그된 올리고 분자를 102개까지 정량화할 수 있다. 연속 희석 용액 실험은, 용적 내의 분자의 분포가 매우 불균일하기 때문에, 샘플링 바이어스가 발생하기 쉽고, 이는 매우 희석된 용액과 특히 관련이 있다는 점에 유의해야 한다. 따라서, 관찰된 정량화 한계는 검정의 한계보다는 실험 설정과 관련된 과소평가일 수 있다.
본 발명에 따른 방법의 단계 c)에서, 분리 단계를 수행하여 비결합된 결합제를 선택적으로 제거하고, 이렇게 하여, 표지된 생물학적 샘플을 수득한다. 분리 단계는 통상 적절한 완충 용액으로 세척하고, 원심분리에 의해 표지된 생물학적 샘플을 수집함으로써 수행된다.
단계 d)에서, 상기 게놈 DNA의 전체 게놈 증폭 및 적어도 하나의 결합제와 접합된 태그된 올리고뉴클레오티드의 증폭은 표지된 생물학적 샘플 상에서 동시에 수행된다. 게놈 DNA의 전체 게놈 증폭은 결정론적 제한 부위 전체 게놈 증폭(DRS-WGA) 또는 복수의 어닐링 및 루프 기반 증폭 사이클 전체 게놈 증폭(MALBAC)의 어느 하나에 의해 수행된다.
단계 e)에서, 증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리가 작성된다.
단계 f)에서, 대규모 병렬 서열분석 라이브러리가 서열분석된다.
단계 g)에서, 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)의 서열이 각 서열분석 판독(sequencing read)으로부터 검색된다.
단계 h)에서, 상이한 고유 분자 식별자 서열(UMI)의 수가 각 결합제에 대해 계수된다.
단계 e), f), g) 및 h)는 상세한 설명의 후반에서 특정 실시양태를 참조하여 더 상세히 개시될 것이다.
상기 개시된 방법은 바람직하게는 생물학적 샘플로부터 단일 세포를 단리하는 단계를 추가로 포함한다. 단리는 세포를 선별함으로써, 특히, 예를 들면, DEPArray® NxT(Menarini Silicon Biosystems S.p.A.) 등의 세포 선별기를 사용하거나, 또는 대안으로서 세포를 액적으로 분할함으로써 수행할 수 있다. 단리 단계는 바람직하게는 단계 c) 이후 및 단계 d) 이전에 수행된다.
상기 개시된 방법은 바람직하게는 단계 f) 전에 대규모 병렬 서열분석 라이브러리를 정제하는 단계를 포함한다.
보다 구체적인 용어로서, 그러나 본 설명의 범위를 제한하려는 의도는 없이, Ampli1 단백질(A1-P)로도 지정된 상기 개시된 방법에 의해, 단백질의 정량화 및 단일 세포의 전체 게놈 유전적 특성화가 가능해진다. 단일 세포에서 단일 또는 복수의 단백질 정량화는 태그된 올리고뉴클레오티드와 접합된 결합제(특히, 항체(Ab))의 패널을 사용하여 달성된다. 이러한 올리고뉴클레오티드는 DNA 바코드 서열을 통해 접합된 항체를 명확하게 식별하고, 랜덤 또는 부분 축퇴성 서열, 즉 에피토프 정량화에 사용되는 고유 분자 식별자(Unique Molecular Identifiers; UMI)를 통해 목적 에피토프의 존재량을 정량화하도록 설계되었다. 생물학적 샘플은 각각 고유 DNA 바코드 서열을 갖는 하나 이상의 Ab-올리고 접합체로 표지된다. 이어서, 단일 세포 또는 세포 풀을 상이한 수단(예: DEPArray™ NxT 시스템)으로 단리할 수 있고, 이들의 게놈 내용물을 전체 게놈 증폭(예: Ampli1™ Whole-Genome-Amplification 키트)에 의해 증폭시킬 수 있다. 후자의 단계 또는 직후에, 태그된 올리고뉴클레오티드는 NGS 라이브러리 제조 절차 중의 다운샘플링을 회피하기 위해 사전 증폭시킨다. 특정 프라이머, 즉 "라이브러리 프라이머"는 서열분석의 준비가 된 NGS(Illumina) 라이브러리를 생성하기 위해 사용된다. 태그된 올리고뉴클레오티드는 Ampli1™ WGA(A1-WGA) 워크플로와 호환성이 있도록 설계되어, A1-P를 사용한 단백질 정량화와 병행하여 단일 세포 유전자 분석(예: Ampli1™ LowPass)을 가능하게 한다.
하기에서, 본 발명의 3개의 특정 실시양태가 개시되고, 이들은 각각 태그된 올리고 증폭 및 전체 게놈 증폭을 위해 상이한 수의 프라이머를 사용한다.
제1의 바람직한 실시양태에서 및 도 5를 참조하면, 태그된 올리고뉴클레오티드는 5'으로부터 3'으로 적어도
a) 5' 전체 게놈 증폭 핸들 서열(5-WGAH) 및 제1 증폭 핸들 서열(1AH)을 차례로 포함하는, 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
b) 페이로드 서열(PL);
c) 핵산의 제2 증폭 핸들 서열(2AH) 및 3' 전체 게놈 증폭 핸들 서열(3-WGAH)을 차례로 포함하는, 핵산의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)
을 포함한다.
3-WGAH는 5-WGAH의 역상보적 서열이고, 전체 게놈 증폭 중에 gDNA 및 태그된 올리고뉴클레오티드의 동시 증폭을 가능하게 한다. 1AH 및 2AH는 각각 페이로드 서열의 5' 및 3' 말단에 위치하고, 후속 라이브러리 생성에 사용된다. 1AH 및 2AH는 바람직하게는 태그된 올리고 증폭을 억제할 수 있는 헤어핀 등의 안정한 분자내 2차 구조를 회피하도록 설계되어 있다. 전술한 각 서열 사이에는 고정 서열이 존재할 수 있다.
전체 게놈 증폭 및 태그된 올리고의 증폭은 바람직하게는 단일 프라이머(single primer)를 사용하여 수행된다.
제2의 바람직한 실시양태에서 및 도 6A 및 6B를 참조하면, 태그된 올리고뉴클레오티드는 5'으로부터 3'으로 적어도
a) 5' 전체 게놈 증폭 핸들 서열(5-WGAH) 및 제1 증폭 핸들 서열(1AH)을 차례로 포함하는, 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
b) 페이로드 서열(PL);
c) 임의로, 어닐링 서열(AS)
을 포함한다.
적어도 하나의 프라이머가 전체 게놈 증폭 및 태그된 올리고뉴클레오티드의 증폭에 사용되고, 적어도 하나의 올리고뉴클레오티드(E-p)가 태그된 올리고뉴클레오티드의 신장에 사용되고, 상기 적어도 하나의 올리고뉴클레오티드(E-p)는 5'으로부터 3'으로 적어도
d) 5' 전체 게놈 증폭 핸들 서열(5-WGAH);
e) 스페이서 서열(SS);
f) 제2 증폭 핸들 서열(2AH); 및
g) 어닐링 서열(AS-RC)에 대해 역상보적인 서열 또는 결합제 바코드 서열(BAB-RC)에 대해 역상보적인 서열
을 포함한다.
달리 말하면, 태그된 올리고의 증폭은 E-p의 3' 말단에 위치한 어닐링 서열 역상보체(AS-RC)를 사용하여 태그된 올리고의 3'에 위치한 AS에 E-p를 어닐링함으로써 발생하고(도 6A), 따라서 반응 내에서 태그된 올리고와 E-p 모두의 3' 신장을 유발하고, WGA-프라이머 증폭 가능한 분자를 차례로 생성한다. 또는, 도 6B에 도시된 바와 같이, AS는 BAB 서열과 일치할 수 있고, E-p는 BAB 역상보 서열(BAB-RC)을 통해 BAB 서열에 어닐링할 수 있다. 제1 옵션(AS에 대한 어닐링)은 단일 E-p를 임의의 BAB와 함께 사용할 수 있다는 이점이 있고, 따라서 제조 비용과 프로토콜 복잡성을 경감시킬 수 있다. 제2 옵션(BAB에 대한 어닐링)은 존재량에 차이가 큰 표적으로부터 유래하는 신호를 정규화하기 위해 유리하게 사용될 수 있다. 이것은, 비제한적 예로서, 잠재적으로 매우 풍부한 표적에 대해 제한 양의 프라이머를 사용함으로써, 또는 매우 풍부한 태그된 올리고의 증폭을 감소시키기 위해 상이한 BAB 어닐링 온도를 사용함으로써 달성할 수 있다. 어닐링 온도는 BAB 길이 및/또는 조성에 의해 조정될 수 있다.
태그된 올리고 및 E-p의 신장 후, WGA 프라이머는 수득된 더 큰 분자 내에서 태그된 올리고의 증폭을 수행한다. 스페이서 서열(SS)은 태그된 올리고에 의해 생성된 앰플리콘의 길이를 증가시킨다. 단편 길이가 증가하면, 단편의 상보적 말단에 의해 유도된 헤어핀 등의 분자내 2차 구조가 불안정해지고, 이에 따라 용융 온도가 저하되고(도 7), 기타 WGA 단편과 함께 태그된 올리고 증폭이 촉진된다[참조: M. Zuker. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 31 (13), 3406-15, (2003)]. 신장 올리고뉴클레오티드(E-p) 서열 길이는 바람직하게는 60 내지 300개 염기의 범위 내이다. 보다 바람직하게는, 신장 올리고뉴클레오티드(E-p) 서열의 길이는 120 내지 200개 염기의 범위 내이다.
제3의 바람직한 실시양태에서 및 도 8을 참조하면, 태그된 올리고뉴클레오티드는 5'으로부터 3'으로 적어도
a) 제1 증폭 핸들 서열(1AH)에 상응하는 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
b) 페이로드 서열(PL);
c) 제2 증폭 핸들 서열(2AH)에 상응하는 핵산의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)
을 포함한다.
적어도 하나의 제1 프라이머는 전체 게놈 증폭에 사용되고, 적어도 하나의 제2 및 하나의 제3 프라이머는 태그된 올리고뉴클레오티드의 증폭에 사용되며, 적어도 하나의 제2 프라이머는 제1 증폭 핸들 서열(1AH)과 동일한 서열을 갖고, 적어도 하나의 제3 프라이머는 제2 증폭 핸들 서열에 역상보적인 서열(2AH-RC)을 갖는다.
태그된 올리고 증폭 프라이머는 WGA PCR 열 프로파일의 적어도 최초 10 내지 15 사이클과 호환성이 있는 용융 온도를 갖도록 설계되어 있다.
바람직하게는, 적어도 하나의 제2 프라이머 및 적어도 하나의 제3 프라이머가 단계 d)에서 첨가된다.
증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리를 제조하는 단계 e)는 바람직하게는 제1 증폭 핸들 서열(1AH)에 상응하는 3' 서열을 포함하는 적어도 하나의 제1 라이브러리 프라이머, 및 제2 증폭 핸들 서열(2AH-RC)에 역상보적인 서열에 상응하는 3' 서열을 포함하는 적어도 하나의 제2 라이브러리 프라이머를 사용하는 PCR 반응에 의해 수행된다.
따라서, 라이브러리 프라이머는 단일 PCR 단계로 결합제의 정량 분석을 위한 NGS 라이브러리를 생성하기 위해 유리하게 사용된다. 본 명세서에 보고된 라이브러리 프라이머의 특정 예는, 본 발명의 범위를 제한하려는 의도 없이, 일루미나(Illumina) 서열분석 플랫폼과 호환성이 있는 라이브러리를 생성하기 위해 사용된다.
바람직한 실시양태에서, 정방향 및 역방향 프라이머는 5'으로부터 3'으로 하기를 포함하는 일루미나 어댑터(Illumina)를 기반으로 설계된다:
1) 일루미나 어댑터 서열(IA): 일루미나 서열분석에 필요하다.
- 인덱스 서열분석 프라이머/유세포 결합 서열: 이 영역은 i5/i7 인덱스 서열분석 프라이머에 대한 어닐링 서열 뿐만 아니라 유세포 결합에 필요하다.
- i5/i7 인덱스: NGS 다중화 반응에 사용되는 인덱스;
- 판독 1/판독 2 서열분석 프라이머: 일루미나 서열분석 프라이머 및 태그된 올리고로부터 라이브러리의 증폭을 위한 어닐링 서열.
2) 제1 증폭 핸들 서열(1AH) 또는 제2 증폭 핸들 서열에 대해 역상보적인 서열(2AH-RC): 이러한 서열은 태그된 올리고 증폭 후에 이중 가닥인 태그된 올리고 상에서 각각 제1 증폭 핸들 서열 및 제2 증폭 핸들 서열과 어닐링된다.
도 9는 도 5(도 9A), 도 6A(도 9B) 및 도 8(도 9C)에 따른 실시양태에서 증폭된 태그된 올리고뉴클레오티드로부터 각각 대규모 병렬 서열분석 라이브러리의 생성에 사용되는 라이브러리 프라이머의 구조를 도시한다.
라이브러리의 생성 후, 바람직하게는 적어도 하나의 정제 단계를 수행하고, 이어서 라이브러리 정량화 및 그 후의 서열분석 절차에 필요한 풀링을 수행한다. 서열분석은 페어드-엔드(paired-end) 서열분석으로서 우선적으로 수행되고, 각각 라이브러리 DNA 분자의 가닥으로부터 유래하는 2개의 판독이 생성된다.
동일한 접근법을 사용하여 이온 토렌트(Ion Torrent) 등의 기타 서열분석 플랫폼용의 NGS 라이브러리를 생성할 수 있다.
NGS 라이브러리로부터 생성된 페어드-엔드 판독 서열의 분석은 다음 단계에 따라 분석된다:
1. 서브-서열 추출. UMI, BAB 및 증폭 핸들 서열(1AH 및/또는 2AH)에 상응하는 서브-서열은 태그된 각 올리고 분자에 대한 양쪽 서열분석 판독으로부터 추출된다.
2. 재정렬을 판독한다. BAB의 서브-서열 및/또는 증폭 핸들 서열(들)이 참조 서열과 정합하지 않는 경우(5개 염기마다 0.5 내지 2의 부정합의 허용범위), 서브-서열의 위치는 -n 내지 +n 범위의 가변 양(여기서, n은 허용되는 최대 오프셋이다)까지의 오프셋이고(예: n=8), 서브-서열이 다시 추출된다. 각 반복에 대해, 참조 서열로부터의 해밍 거리가 계산되고, 최소 거리를 반환하는 오프셋이 선택되고, 모든 서브-서열(UMI, BAB, 증폭 핸들 서열)이 추출된다.
3. 필터링을 판독한다. BAB를 판독하고/하거나, 참조 서열과는 상이한 서브-서열을 처리하고, 이들의 서브-서열은 정의된 양을 초과하는 염기가 저품질의 판독으로서 폐기된다.
4. UMI의 결정. 판독 페어로부터의 UMI 서열은 서열분석 에러의 부재하에 완전히 상보적일 것으로 예상된다. 제1 가닥 UMI와 제2 가닥 상보적 UMI 서열 사이에 임의의 차이가 있는 경우:
a. 판독 페어는 낮은 신뢰도로 폐기될 수 있거나, 또는
b. 2개 서열 사이의 컨센서스는, UMI의 각 위치에 대해, 2개의 서열분석 판독으로부터의 서열 중에서 염기를 선택함으로써 계산할 수 있고, 이는 서열분석기의 염기 콜러(caller)에 의해 보고된 최고 염기 콜링 스코어를 갖는다.
제1 방법(a)은 서열분석 바이어스로 인해 표적 분자를 과대평가하는 경향이 낮지만, 결합제와 표적 분자 사이의 실제 결합 이벤트를 판독할 수 있고, 이는 대신 제2 방법(b)으로 회복시킨다.
5. 표적 분자 정량화. 표적 분자의 계수는 분석된 샘플 중의 특정 결합제를 나타내는 각 BAB 서열에 대한 별개의 UMI 서열의 수를 결정함으로써 수행된다.
본 발명에 따른 키트는 하기를 포함한다:
a) 태그된 올리고뉴클레오티드와 접합된 생물학적 샘플 중의 적어도 하나의 표적 분자에 대해 지시된 적어도 하나의 결합제로서, 상기 태그된 올리고뉴클레오티드는
i) 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는 핵산의 페이로드 서열(PL),
ii) 적어도 하나의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS)
을 포함하는, 적어도 하나의 결합제;
b) 전체 게놈 증폭을 수행하기 위한 적어도 하나의 프라이머 및 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 적어도 하나의 프라이머로서, 상기 전체 게놈 증폭을 수행하기 위한 적어도 하나의 프라이머 및 상기 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 적어도 하나의 프라이머는 동일한 서열을 갖거나 상이한 서열을 갖는, 적어도 하나의 프라이머
를 포함한다.
바람직한 실시양태에서, 키트는 태그된 올리고뉴클레오티드를 신장하기 위한 올리고뉴클레오티드를 포함한다.
바람직한 실시양태에서, 적어도 하나의 태그된 올리고뉴클레오티드는 서열번호 1에 상응하는 서열을 갖고, 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 프라이머는 2개이고 각각 서열번호 2 및 서열번호 3의 서열을 갖는다. 키트는 바람직하게는 하나 이상의 제1 라이브러리 프라이머(들) 및 하나 이상의 제2 라이브러리 프라이머(들)를 추가로 포함한다. 보다 바람직하게는, 상기 제1 라이브러리 프라이머는 서열번호 8 내지 서열번호 15로 이루어진 그룹으로부터 선택된 서열을 갖고, 상기 제2 라이브러리 프라이머는 서열번호 16 내지 서열번호 27로 이루어진 그룹으로부터 선택된 서열을 갖는다.
또 다른 바람직한 실시양태에서, 적어도 하나의 태그된 올리고뉴클레오티드는 서열번호 28에 상응하는 서열을 갖고, 태그된 올리고뉴클레오티드의 신장을 수행하기 위한 올리고뉴클레오티드는 서열번호 29에 상응하는 서열을 갖는다. 키트는 바람직하게는 하나 이상의 제1 라이브러리 프라이머(들) 및 하나 이상의 제2 라이브러리 프라이머(들)를 추가로 포함한다. 보다 바람직하게는, 상기 제1 라이브러리 프라이머는 서열번호 30 내지 서열번호 37로 이루어진 그룹으로부터 선택된 서열을 갖고, 상기 제2 라이브러리 프라이머는 서열번호 38 내지 서열번호 49로 이루어진 그룹으로부터 선택된 서열을 갖는다.
실시예
실시예 1
이 실시예에서, 태그된 올리고는 WGA 후에 도 8에 따른 설정으로 증폭을 수행하도록 설계되었다. "P5-Synth"(서열번호 1, 도 10, NNNNNNNNNN: UMI 서열)라는 명칭의 태그된 올리고는 Ampli1™ WGA 키트(Menarini Silicon Biosystems)와 호환성이 있도록 설계되었다. 제1 증폭 핸들 서열(1AH)은 일루미나 TruSeq DNA 및 RNA CD 인덱스의 인덱스 2(i5) 어댑터의 최후 19개 염기와 동일했다. 제2 증폭 핸들 서열(2AH)은 분자내 2차 구조 및 인간 게놈에 대한 정합 가능성을 회피하기 위해 인 실리코(in silico)로 생성되었다. 양쪽 증폭 핸들 서열의 용융 온도는 WGA 프라이머의 용융 온도와 유사하도록 설계되었다. 태그된 올리고 증폭 프라이머(서열번호 2 및 서열번호 3)는 제1 및 제2 증폭 핸들 서열에 따라 설계되었다.
도 10에 나타난 바와 같이, 정방향 라이브러리 프라이머는 인덱스 2(i5) 어댑터(Illumina)와 동일한 반면, 역방향 라이브러리 프라이머는 제2 증폭 핸들 서열의 역상보 서열이 부가된 인덱스 1(i7) 어댑터와 동일하다. 보다 상세하게는, 도 10은 P5-Synth 올리고 및 상응하는 라이브러리 프라이머의 설계를 도시한다.
올리고 P5-Synth(서열번호 1): 백색 박스는 UMI 및 결합제 바코드를 갖는 내부 도메인을 나타낸다. 흑색 경계선을 갖는 회색 박스는 제1 및 제2 증폭 핸들 서열을 나타낸다.
P5 라이브러리 프라이머(서열번호 8): NGS 라이브러리의 생성에 사용되는 정방향 프라이머. 회색 박스 내는 올리고 P5-Synth를 사용한 어닐링 부위이고; 짧은 점선 박스 내는 서열분석 반응의 다중화에 사용된 i5 인덱스이고; 긴 점선 박스 내는 인덱스 서열분석 프라이머/유세포 어댑터 서열이다.
Synth 라이브러리 프라이머(서열번호 16): NGS 라이브러리의 생성에 사용되는 역방향 프라이머. 회색 박스 내는 올리고 P5-Synth를 사용한 어닐링 부위이다. 짧은 점선 박스 내는 서열분석 프라이머 부위이고; 점선 박스 내는 서열분석 반응의 다중화에 사용되는 i5 인덱스이고; 긴 점선 박스 내는 인덱스 서열분석 프라이머/유세포 어댑터 서열이다.
도 11에 나타낸 바와 같이, 라이브러리의 생성 중에, 일루미나 인덱스 1 및 2 어댑터가 태그된 올리고의 5' 및 3'에 각각 부가된다.
이 예에서, 태그된 올리고는 5' 아미노 변형인자를 통해 접합되었다. 아민 모이어티와 올리고의 5' 사이에 C6 또는 C12 스페이서가 존재하여, 후속 PCR 반응에 대한 입체 장애 억제 효과를 회피했다. 항체는 아미노 반응성 시약을 통해 라이신, 글루타민, 아르기닌 및 아스파라긴 잔기로부터 항체에 통상 존재하는 아민을 사용하여 태그된 올리고에 공유 결합되었다. 태그된 올리고를 사용하여 4개의 Ab-올리고(표 2)가 생성되었고, 항체 올리고 접합은 엑스페데온 리미티드(Expedeon Ltd)(25 Norman Way, Over, Cambridge CB24 5QE, United Kingdom)에 의해 1:2의 항체:태그된 올리고 화학량론을 사용하여 수행되었다. 에피토프 국재화: 세포막에 대한 위치를 나타낸다.
명칭 항체 이소형 항체 명칭 결합제 바코드 에피토프 국재화
Ab-올리고 태그1 항 Pan-사이토케라틴 마우스 IgG1 항CK TACTCATGCT
(서열번호 4)
내부
Ab-올리고 태그2 항 Her2 마우스 IgG1 항Her2 AGATAGCGCA
(서열번호 5)
내부
Ab-올리고 태그3 항 CD45 마우스 IgG2a 항CD45 TCTCTCGCTG
(서열번호 6)
외부
Ab-올리고 태그4 IgG1 이소형 대조군 마우스 IgG1 IgG1이소형 CTGAGTCAGA
(서열번호 7)
-
Ab-올리고를 사용하여 2개의 상이한 유형의 세포주를 염색했다. 제1 세포 유형은 사이토케라틴 및 Her2 단백질을 과발현하는 유방 종양 유래의 세포주인 SK-BR-3 세포였다. 제2 세포 유형은 말초 혈액 단핵 세포(PBMC)였고, 이는 CD45와 무시할 수 있는 수준의 사이토케라틴 및 Her2를 발현하는 전혈로부터 추출한 백혈구이다.
SK-BR-3 세포(ATCC® HTB-30™, ATCC)를 제조원의 절차에 따라 배양물에서 성장시켰다. PBMC는 인간 혈액 샘플로부터 추출되었다. 커스텀화된 프로토콜에 따라 PFA 2%를 사용하여 양쪽 세포 유형을 고정했다.
Ab-올리고를 사용한 세포 염색은 100,000 내지 50,000개의 사전에 고정 및 투과처리된 세포에서 수행되었다. 세포는 1000 × g, RT에서 5분 동안 원심분리하여 수집했다. 세포를 적어도 1mL의 실행 완충액(autoMACS 실행 완충액, ref. 130-091-221, Miltenyi Biotec)으로 세척하고, 원심분리에 의해 수집했다. 이 최후의 단계를 2회 반복했다. 외부 Ab-올리고 및 이들의 이소형 Ab-올리고 대조군은 100㎕의 실행 완충액에서 작업 농도까지 희석시킨다. 외부 Ab-올리고 혼합물(Ab-올리고 태그3)을 세포에 첨가하고, 실온에서 15분 동안 인큐베이팅했다. 이어서, 샘플을 1mL의 실행 완충액으로 2회 세척하고, 원심분리에 의해 수집했다. 500㎕의 실행 완충액 중의 염소 항 마우스 IgG2a - PE 항체를 첨가하고, +4℃에서 30분 동안 인큐베이팅했다. 이 단계는 PE에서 PBMC 세포의 염색을 가능하게 했다. 샘플을 실행 완충액으로 2회 세척했다. 내부 Ab-올리고 및 이의 이소형 Ab-올리고 대조군은 200㎕의 내부 Perm 완충액(Inside Stain Kit, Ref. 130-090-477, Miltenyi Biotec)에서 작업 농도까지 희석시킨다. 내부 Ab-올리고 혼합물(Ab-올리고 태그1, 2 및 4)을 세포에 첨가하고, 실온에서 10분 동안 인큐베이팅했다. 샘플을 1mL의 내부 Perm 완충액으로 2회 세척하고, 원심분리에 의해 수집했다. 500㎕의 내부 Perm 완충액 중의 훽스트(Hoechst) 및 염소 항 마우스 IgG1 - APC 항체의 혼합물을 첨가하고, +4℃에서 30분 동안 인큐베이팅했다. 이 단계는 PE 및 모든 세포 핵에서 SK-BR-3 세포의 염색을 가능하게 했다. 샘플을 실행 완충액으로 2회 세척했다.
형광단에 접합된 2차 항체를 첨가함으로써, 형광에 의해 SK-BR-3 세포(APC 채널) 및 PBMC(PE 채널)를 동정할 수 있다. 더욱이, 형광 수준은 Ab-올리고의 상대적 존재량을 반영한다. 단일 세포는 DEPArray™ NxT 시스템(Menarini Silicon Biosystems)을 사용하여 이들의 면역형광 표지에 기반하여 정제되었다(도 12).
구체적으로, 도 12는 Ab-올리고 및 2차 형광 항체로 염색된 PBMC 및 SK-BR-3 세포의 산포도를 도시한다. x축은 APC 채널의 형광 수준이고, 이는 Ab-올리고 태그1, 태그2 및 태그4의 양에 비례한다. y축은 PE 채널의 형광 수준이고, 이는 Ab-올리고 태그3의 양에 비례한다. 산포도는 면역형광 수준에 따라 각각 특정 세포 유형을 포함하는 4개의 사분면으로 분할된다: 1) PBMC(높은 수준의 CD45 및 낮은 수준의 CK, Her2); 2) 이중 양성 세포(높은 수준의 CD45, CK, Her2); 3) 이중 음성 세포(낮은 수준의 CD45, CK, Her2); 4) SK-BR-3 세포(낮은 수준의 CD45 및 높은 수준의 CK, Her2). 빈/채워진 사각형/원으로 강조 표시된 단일 세포를 단리하고, 라이브러리의 생성에 사용했다.
또는, WGA 후에 태그된 올리고 증폭을 수행하기 위해, 정방향/역방향 프라이머와 Ampli1™ PCR 키트 시약의 커스텀화된 반응 혼합물을 표 3의 좌측 삽입도에 따라 제조했다. WGA 생성물을 함유하는 각 튜브에 15㎕의 반응 혼합물을 첨가했다. 각 샘플은 표 3의 우측 삽입도에 나타낸 열 프로파일에 따라 인큐베이팅되었다.
Figure pct00001
좌측 삽입도: 태그된 올리고 증폭 반응의 반응 혼합물 조성. 우측 삽입도: 태그된 올리고 증폭의 열 사이클 프로그램.
라이브러리 제조는 0.5M의 최종 농도에서 P5 및 Lib1 라이브러리 프라이머를 사용하여 Ampli1™ PCR 키트를 사용하여 증폭된 Ab-올리고 앰플리콘을 함유하는 1㎕의 WGA의 분취량을 채취함으로써 수행되었다. PCR 열 사이클 프로파일은 표 5에 제시되어 있다. 각 샘플은 생물정보학 분석 동안 데이터를 역다중화하기 위해 이중 인덱스용의 NGS 라이브러리 프라이머의 상이한 조합을 가졌다. 사용된 라이브러리 프라이머 목록은 표 4에 제시되어 있다. P5 라이브러리 프라이머는 태그된 올리고 P5-Synth와 함께 사용할 수 있는 정방향 프라이머이다.
서열 P5 라이브러리 프라이머 (5' -> 3') [i5] 인덱스 번호 서열번호
AATGATACGGCGACCACCGAGATCTACAC TATAGCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D501 8
AATGATACGGCGACCACCGAGATCTACAC ATAGAGGC ACACTCTTTCCCTACACGACGCTCTTCCGATCT D502 9
AATGATACGGCGACCACCGAGATCTACAC CCTATCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D503 10
AATGATACGGCGACCACCGAGATCTACAC GGCTCTGA ACACTCTTTCCCTACACGACGCTCTTCCGATCT D504 11
AATGATACGGCGACCACCGAGATCTACAC AGGCGAAG ACACTCTTTCCCTACACGACGCTCTTCCGATCT D505 12
AATGATACGGCGACCACCGAGATCTACAC TAATCTTA ACACTCTTTCCCTACACGACGCTCTTCCGATCT D506 13
AATGATACGGCGACCACCGAGATCTACAC CAGGACGT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D507 14
AATGATACGGCGACCACCGAGATCTACAC GTACTGAC ACACTCTTTCCCTACACGACGCTCTTCCGATCT D508 15
서열 Synth 라이브러리 프라이머 (5' -> 3') [i7] 인덱스 번호 서열번호
CAAGCAGAAGACGGCATACGAGAT CGAGTAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D701 16
CAAGCAGAAGACGGCATACGAGAT TCTCCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D702 17
CAAGCAGAAGACGGCATACGAGAT AATGAGCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D703 18
CAAGCAGAAGACGGCATACGAGAT GGAATCTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D704 19
AGCAGAAGACGGCATACGAGAT TTCTGAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D705 20
CAAGCAGAAGACGGCATACGAGAT ACGAATTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D706 21
CAAGCAGAAGACGGCATACGAGAT AGCTTCAG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D707 22
CAAGCAGAAGACGGCATACGAGAT GCGCATTA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D708 23
CAAGCAGAAGACGGCATACGAGAT CATAGCCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D709 24
CAAGCAGAAGACGGCATACGAGAT TTCGCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D710 25
CAAGCAGAAGACGGCATACGAGAT GCGCGAGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D711 26
CAAGCAGAAGACGGCATACGAGAT CTATCGCT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D712 27
단계 온도 시간 사이클
1 95℃ 3 분 1
2 95℃ 30 초 3
60℃ 30 초
72℃ 10 초
3 95℃ 30 초 23-30
65℃ 30 초
72℃ 10 초
4 72℃ 1 분 1
5 4℃ 1
NGS 라이브러리 생성을 위한 열 사이클 프로파일. 단계 3 동안의 사이클 수는 회수된 세포의 수와 세포 내의 총 Ab-올리고의 유효량에 따라 상이하다. 통상, 단계 3에서 27회의 증폭 사이클을 수행하면, 단일 세포로부터 충분한 양의 앰플리콘이 수득되었다.
라이브러리 샘플은 아겐코우트 암퓨어(Agencourt AmPure) XP 비드(Beckman-Coulter)를 사용하여 정제했다. NGS DNA 정량화는 KAPA SYBR® FAST qPCR 키트(Kapa Biosystems)를 사용하여 수행했다. 각 NGS 라이브러리는 아길런트 바이오어낼라이저(Agilent Bioanalyzer) 2100(Agilent)을 사용하여 조사되었고, 통상 185bp에서 단일 피크로 구성된 라이브러리 전기영동도를 나타낸다(도 13).
샘플을 함께 풀링하고, MiSeq 시약 키트 v3 150-사이클(Ref. MS-102-3001, Illumina)을 사용하여 MiSeq 시스템(Illumina)에서 서열분석을 수행했다. 데이터 분석은 파이톤(Python)에서 개발된 커스텀 소프트웨어를 사용하여 수행되었다. UMI 계수에 따른 단백질 표적의 정량화는 도 14에 보고되어 있다. 예상된 바와 같이, SK-BR-3 세포는 사이토케라틴과 Her2의 높은 발현과 CD45의 낮은 수준을 나타낸 반면, PBMC는 반대 거동을 나타냈다. 단백질 발현 수준은 이중 양성 세포, 특히 이소형 대조군에서 높았고, 이는 이러한 세포가 비특이적 염색을 받기 쉽다는 것을 나타낸다. 역으로, 이중 음성 세포는 4개 표적 모두에 대해 더 낮은 수준을 나타냈다.
실시예 2
이 예에서, 태그된 올리고는 WGA 중에 도 8에 따른 설정으로 증폭을 수행하도록 설계되었다. 실험 절차는 하기를 제외하고는 실시예 1과 동일하다. 태그된 올리고 증폭 프라이머를, 0.02μM의 최종 농도로 1차 PCR 반응 혼합물에 직접 첨가했다. 라이브러리의 생성 및 데이터 분석은 실시예 1에 나타낸 바와 같이 수행되었다.
UMI 계수에 따른 단백질 표적의 정량화는 도 15에 보고되어 있다. 예상된 바와 같이, SK-BR-3 세포는 사이토케라틴과 Her2의 높은 발현과 CD45의 매우 낮은 수준을 나타낸 반면, PBMC는 반대의 거동을 나타냈다. 단백질 발현 수준은 이중 양성 세포, 특히 이소형 대조군에서 높았고, 이는 이러한 세포가 비특이적 염색을 받기 쉽다는 것을 나타낸다. 역으로, 이중 음성 세포는 4개 표적 모두에 대해 더 낮은 수준을 나타냈다. 실시예 1의 결과에 따르면, 태그된 올리고의 증폭은 WGA 중 또는 WGA 후 양쪽에서 수행 가능하다고 추론할 수 있다. 그러나, 절대 UMI 계수는 2개 절차 사이에 크게 상이하다는 점에 유의해야 한다. 2개 세포 유형 사이의 차이는, 태그된 올리고 증폭이 WGA 중에 수행된 경우, CK와 비교하여 발현이 낮은 CD45 표적에 대해 예상된 것과 더 일치한다.
실시예 3
이 예에서, 태그된 올리고는 단일 세포에 직접 추가되었다. 태그된 올리고, 즉 "P5-Lib1"(서열번호 28)은 Ampli1™ WGA 키트(Menarini Silicon Biosystems)에 의해 증폭될 수 있도록 설계되었다. 태그된 올리고 증폭 프라이머는 서열번호 29의 서열을 갖는다(정방향 및 역방향 프라이머는 동일하고, Ampli1 WGA Lib1 프라이머의 서열을 공유한다). 구체적으로, 5'-WGA 핸들 서열은 Lib1 WGA 프라이머와 동일했고, 3'-WGA 핸들 서열은 Lib1 WGA 프라이머의 역상보적 서열이었다. 제1 증폭 핸들 서열은 실시예 1에서 기재된 것과 동일하다. 제2 증폭 핸들 서열은 3'-WGA 핸들 서열과 이의 5' 말단에 추가 5bp 서열로 구성된다(도 16).
보다 상세하게는, 도 16은 P5-Synth 올리고 및 상응하는 라이브러리 프라이머의 설계를 나타낸다.
올리고 P5-Lib1: 두꺼운 경계선을 갖는 백색의 채워진 박스는 UMI 및 결합제 바코드를 갖는 내부 도메인을 나타낸다. 두꺼운 경계선을 갖는 회색의 채워진 박스는 2개의 라이브러리 프라이머에 대한 어닐링 부위를 나타낸다. 얇은 경계선을 갖는 회색의 박스는 WGA 핸들 서열(Lib1)이다.
P5 라이브러리 프라이머: NGS 라이브러리의 생성에 사용되는 정방향 프라이머. 회색의 채워진 박스에서 태그된 올리고 P5-Lib1을 갖는 어닐링 부위. 짧은 점선 박스 내는 서열분석 프라이머 부위이고; 점선 박스 내는 서열분석 반응의 다중화에 사용되는 i5 인덱스이고; 긴 점선 박스 내는 인덱스 서열분석 프라이머/유세포 어댑터 서열이다.
Lib1 라이브러리 프라이머: NGS 라이브러리의 생성에 사용되는 역방향 프라이머. 회색의 채워진 박스 내는 태그된 올리고 P5-Lib1을 갖는 어닐링 부위이고: 이 서열은 Lib1 역상보적 서열의 일부와 작은 테일(ACCAC)로 구성되어 있고, 올리고 P5-Lib1의 3' 말단에만 어닐링을 가능하게 한다. 짧은 점선의 박스 내는 서열분석 프라이머 부위이고; 점선 박스 내는 서열분석 반응의 다중화에 사용되는 i5 인덱스이고; 긴 점선 박스 내는 인덱스 서열분석 프라이머/유세포 어댑터 서열이다.
정방향 라이브러리 프라이머는 인덱스 2(i5) 어댑터(Illumina)와 동일한 반면, 역방향 라이브러리 프라이머는 제2 증폭 핸들 서열의 역상보적 서열이 부가된 인덱스 1(i7) 어댑터와 동일했다(도 16). 따라서, 라이브러리 생성 중에, 일루미나 인덱스 1 및 2 어댑터가 각각 태그된 올리고의 5' 및 3'에 부가된다(도 17).
SK-BR-3 세포(ATCC® HTB-30™, ATCC)는, 제조원의 절차에 따라 배양액에서 성장시키고, 커스텀화된 프로토콜에 따라 PFA 2%를 사용하여 고정시켰다. 단일 세포는 형태에 기초하여 DEPArray™ NxT 시스템(Menarini Silicon Biosystems)을 사용하여 정제되었다. P5-Lib1 및 P5-Synth 태그된 올리고는 단일 세포를 포함하는 튜브 내부에 직접 부가했다. 상이한 양의 각 올리고를 각 단일 세포에 추가하고, Ampli1™ WGA를 수행했다. P5-Synth 태그된 올리고를 함유하는 샘플은 실시예 1에서와 같이 증폭시켰다.
태그된 올리고 라이브러리 생성은 Ab-올리고 앰플리콘을 함유하는 1㎕의 WGA의 분취량을 채취함으로써 수행되었고, 최종 농도 0.5M에서 P5 및 Lib1 라이브러리 프라이머를 사용하여 Ampli1™ PCR 키트를 사용하여 증폭시켰다. PCR 열 사이클 프로파일은 표 5에 제시되어 있다. 각 샘플은 생물정보학 분석 중에 데이터를 역다중화하기 위해 이중 인덱싱을 위한 NGS 라이브러리 프라이머의 상이한 조합을 가졌다. 사용된 라이브러리 프라이머 목록은 표 6에 제시되어 있다.
서열 P5 라이브러리 프라이머 (5' -> 3') [i5] 인덱스 번호 서열번호
AATGATACGGCGACCACCGAGATCTACAC TATAGCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D501 30
AATGATACGGCGACCACCGAGATCTACAC ATAGAGGC ACACTCTTTCCCTACACGACGCTCTTCCGATCT D502 31
AATGATACGGCGACCACCGAGATCTACAC CCTATCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D503 32
AATGATACGGCGACCACCGAGATCTACAC GGCTCTGA ACACTCTTTCCCTACACGACGCTCTTCCGATCT D504 33
AATGATACGGCGACCACCGAGATCTACAC AGGCGAAG ACACTCTTTCCCTACACGACGCTCTTCCGATCT D505 34
AATGATACGGCGACCACCGAGATCTACAC TAATCTTA ACACTCTTTCCCTACACGACGCTCTTCCGATCT D506 35
AATGATACGGCGACCACCGAGATCTACAC CAGGACGT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D507 36
AATGATACGGCGACCACCGAGATCTACAC GTACTGAC ACACTCTTTCCCTACACGACGCTCTTCCGATCT D508 37
서열 lib1 라이브러리 프라이머 (5' -> 3') [i7] 인덱스 번호 서열번호
CAAGCAGAAGACGGCATACGAGAT CGAGTAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC GGATTCCTGCT TCAGTACCAC D701 38
CAAGCAGAAGACGGCATACGAGAT TCTCCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D702 39
CAAGCAGAAGACGGCATACGAGAT AATGAGCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D703 40
CAAGCAGAAGACGGCATACGAGAT GGAATCTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D704 41
CAAGCAGAAGACGGCATACGAGAT TTCTGAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D705 42
CAAGCAGAAGACGGCATACGAGAT ACGAATTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D706 43
CAAGCAGAAGACGGCATACGAGAT AGCTTCAG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D707 44
CAAGCAGAAGACGGCATACGAGAT GCGCATTA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D708 45
CAAGCAGAAGACGGCATACGAGAT CATAGCCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D709 46
CAAGCAGAAGACGGCATACGAGAT TTCGCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D710 47
CAAGCAGAAGACGGCATACGAGAT GCGCGAGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D711 48
CAAGCAGAAGACGGCATACGAGAT CTATCGCT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D712 49
10㎕ WGA 샘플의 분취량을 SPRI 비드(Beckmann Coulter)로 정제하고, 이어서 Ampli1™ 로우패스(LowPass) 키트로 처리하여 CNA 분석을 위한 NGS 라이브러리를 생성했다. WGA 절차 전에 단일 세포에서 태그된 올리고를 스파이킹하여도, 하류의 유전자 분석에는 영향을 미치지 않았다(도 18). 도 5 및 도 8에 도시된 워크플로우에 적합하도록 설계된 태그된 올리고는 WGA 절차에 영향을 미치거나 간섭하지 않았다. 더욱이, 양쪽 조건 모두에서 태그된 올리고뉴클레오티드로부터 NGS 라이브러리를 수득하는 것이 여전히 가능했다. 태그된 올리고뉴클레오티드 둘 다는 정확하게 정량화될 수 있고, 이는 양쪽 방법론과 태그된 올리고 설계의 견고성을 나타낸다(도 19).
이점
본 발명에 따른 생물학적 샘플에서 전체 게놈 증폭 및 다중 표적 분자의 분석 방법은 동일한 단일 세포에서 게놈 전체의 카피 수 프로파일/게놈 서열 및 단백질 발현의 분석을 동시에 수득할 수 있게 한다.
본 발명의 방법은 게놈 DNA의 전체 게놈 증폭을 수행할 수 있게 하고, 목적의 유전자 패널의 로우패스 서열분석 또는 표적화된 서열분석에 의한 게놈 전체 카피 수 프로파일링 등의 추가 분석을 가능하게 하고, 소수(1개 이하)의 순환 종양 세포(CTC)만이 이용할 수 있는 경우일 수 있기 때문에, 매우 적은 수의 샘플을 사용하여 단일 세포의 해상도까지 복수 단백질 패널의 디지털 정량화를 검출 및 수행할 수 있게 한다. 이것은, 유전자형, 표현형 및 환경의 차이가 혼동을 줄 수 있고 유전자형(서열 변화의 카피 수)와 표현형(단백질 발현)과의 상관관계를 완전히 방지할 수 있는, 유전적으로 불균일한 샘플에서 상이한 세포의 각 분자 유형을 측정하는 것보다 특히 유리하다.
본 발명에 따른 방법은, 놀랍게도, 비제한적 예로서 제공되는 하기 하나 이상의 차원에서 당업자가 이전에 달성할 수 없다고 생각했던 성능을 사용하여 최신 기술을 발전시킨다:
· 세포당 수백 카피까지 단일 세포에서 단백질 디지털 정량화.
· 이 프로세스에서 고유한 WGA를 사용함으로써, 상기 단일 세포의 기타 특성을 조사하기 위한 추가 유전 물질을 수득할 수 있는 가능성, 및 검증을 위해 단일 세포를 확실하게 재분석할 가능성으로 상기 포인트가 수득된다고 생각되며, 이는 10× Genomics에서 제안한 것과 같은 액적-기반의 접근법으로는 불가능하다.
이 방법의 주요 적용 분야는 종양학이지만, 이 방법은 피부과 또는 과증식 표현형 등의 모자이크 장애 등의 다른 분야에도 적용될 수 있다.
SEQUENCE LISTING <110> MENARINI SILICON BIOSYSTEMS S.P.A. <120> METHOD AND KIT FOR WHOLE GENOME AMPLIFICATION AND ANALYSIS OF TARGET MOLECULES IN A BIOLOGICAL SAMPLE <130> 941-18 <160> 51 <170> BiSSAP 1.3.6 <210> 1 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> P5-Synth <220> <221> misc_feature <222> 20..29 <223> /note="n is g or c or t or a" <400> 1 cacgacgctc ttccgatctn nnnnnnnnnc ggctatgcat tatgcgcca 49 <210> 2 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo first amplification primer (1AH-p) <400> 2 cacgacgctc ttccgatct 19 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo second amplification primer (2AH-RC-p) <400> 3 tggcgcataa tgcatagccg 20 <210> 4 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB1 example 1 <400> 4 tactcatgct 10 <210> 5 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB2 Example 1 <400> 5 agatagcgca 10 <210> 6 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB3 Example 1 <400> 6 tctctcgctg 10 <210> 7 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB4 Example 1 <400> 7 ctgagtcaga 10 <210> 8 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D501 <400> 8 aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 9 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D502 <400> 9 aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 10 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D503 <400> 10 aatgatacgg cgaccaccga gatctacacc ctatcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 11 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D504 <400> 11 aatgatacgg cgaccaccga gatctacacg gctctgaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 12 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D505 <400> 12 aatgatacgg cgaccaccga gatctacaca ggcgaagaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 13 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D506 <400> 13 aatgatacgg cgaccaccga gatctacact aatcttaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 14 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D507 <400> 14 aatgatacgg cgaccaccga gatctacacc aggacgtaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 15 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D508 <400> 15 aatgatacgg cgaccaccga gatctacacg tactgacaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 16 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D701 <400> 16 caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 17 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D702 <400> 17 caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 18 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D703 <400> 18 caagcagaag acggcatacg agataatgag cggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 19 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D704 <400> 19 caagcagaag acggcatacg agatggaatc tcgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 20 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D705 <400> 20 caagcagaag acggcatacg agatttctga atgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 21 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D706 <400> 21 caagcagaag acggcatacg agatacgaat tcgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 22 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D707 <400> 22 caagcagaag acggcatacg agatagcttc aggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 23 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D708 <400> 23 caagcagaag acggcatacg agatgcgcat tagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 24 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D709 <400> 24 caagcagaag acggcatacg agatcatagc cggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 25 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D710 <400> 25 caagcagaag acggcatacg agatttcgcg gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 26 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D711 <400> 26 caagcagaag acggcatacg agatgcgcga gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 27 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D712 <400> 27 caagcagaag acggcatacg agatctatcg ctgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 28 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> P5-Lib1 <220> <221> misc_feature <222> 41..50 <223> /note="n is c or g or t or a" <400> 28 agtgggattc ctgctgtcag tcacgacgct cttccgatct nnnnnnnnnn gtggtactga 60 cagcaggaat cccact 76 <210> 29 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo extension oligonucleotide with P5-Lib1 <400> 29 agtgggattc ctgctgtcag t 21 <210> 30 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D501 <400> 30 aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 31 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D502 <400> 31 aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 32 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D503 <400> 32 aatgatacgg cgaccaccga gatctacacc ctatcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 33 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D504 <400> 33 aatgatacgg cgaccaccga gatctacacg gctctgaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 34 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D505 <400> 34 aatgatacgg cgaccaccga gatctacaca ggcgaagaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 35 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D506 <400> 35 aatgatacgg cgaccaccga gatctacact aatcttaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 36 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D507 <400> 36 aatgatacgg cgaccaccga gatctacacc aggacgtaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 37 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D508 <400> 37 aatgatacgg cgaccaccga gatctacacg tactgacaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 38 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D701 <400> 38 caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 39 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D702 <400> 39 caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 40 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D703 <400> 40 caagcagaag acggcatacg agataatgag cggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 41 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D704 <400> 41 caagcagaag acggcatacg agatggaatc tcgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 42 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D705 <400> 42 caagcagaag acggcatacg agatttctga atgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 43 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D706 <400> 43 caagcagaag acggcatacg agatacgaat tcgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 44 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D707 <400> 44 caagcagaag acggcatacg agatagcttc aggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 45 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D708 <400> 45 caagcagaag acggcatacg agatgcgcat tagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 46 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D709 <400> 46 caagcagaag acggcatacg agatcatagc cggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 47 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D710 <400> 47 caagcagaag acggcatacg agatttcgcg gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 48 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D711 <400> 48 caagcagaag acggcatacg agatgcgcga gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 49 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D712 <400> 49 caagcagaag acggcatacg agatctatcg ctgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 50 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> with hairpin <220> <221> misc_feature <222> 20..29 <223> /note="n = a or t or g or c" <400> 50 cacgacgctc ttccgatctn nnnnnnnnnt actcatgcta gatcggaaga gcacacgtc 59 <210> 51 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> without hairpin <220> <221> misc_feature <222> 20..29 <223> /note="n = a or t or g or c" <400> 51 cacgacgctc ttccgatctn nnnnnnnnnt tactcatgct ggctatgcat tatgcgcca 59

Claims (24)

  1. 게놈 DNA 및 표적 분자(target molecule)를 포함하는 생물학적 샘플에서 전체 게놈 증폭(whole genome amplification) 및 복수 표적 분자의 분석을 위한 방법으로서,
    a) 생물학적 샘플을 제공하는 단계;
    b) 상기 생물학적 샘플을, 태그된 올리고뉴클레오티드(tagged oligonucleotide)와 접합된, 표적 분자의 적어도 하나에 대해 지시되는 적어도 하나의 결합제(binding agent)와 접촉시키는 단계로서, 상기 태그된 올리고뉴클레오티드는
    i) 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는 핵산의 페이로드(payload) 서열(PL), 및
    ii) 핵산의 적어도 하나의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS)
    을 포함하고;
    이에 따라, 생물학적 샘플에 적어도 하나의 표적 분자가 존재하는 경우, 적어도 하나의 결합제가 적어도 하나의 표적 분자에 결합하는, 단계;
    c) 분리 단계를 수행하여, 결합되지 않은 결합제를 선택적으로 제거하고, 이렇게 하여, 표지된 생물학적 샘플을 수득하는 단계;
    d) 표지된 생물학적 샘플에 대해,
    - i) 결정론적 제한 부위 전체 게놈 증폭(DRS-WGA), 또는
    ii) 복수의 어닐링(Multiple Annealing) 및 루핑(Looping) 기반 증폭 사이클 전체 게놈 증폭(MALBAC)
    에 의한 상기 게놈 DNA의 전체 게놈 증폭, 및
    - 적어도 하나의 결합제와 접합된 태그된 올리고뉴클레오티드의 증폭
    을 수행하는 단계로서,
    전체 게놈 증폭 및 상기 태그된 올리고뉴클레오티드의 증폭은 동시에 수행되는 단계;
    e) 증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리(massively parallel sequencing library)를 제조하는 단계;
    f) 대규모 병렬 서열분석 라이브러리를 서열분석하는 단계;
    g) 각 서열분석 판독(sequencing read)으로부터 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)의 서열을 검색하는 단계;
    h) 각 결합제에 대해 상이한 고유 분자 식별자 서열(UMI)의 수를 계수하는 단계
    를 포함하는, 방법.
  2. 제1항에 있어서, 상기 태그된 올리고뉴클레오티드가 적어도 하나의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)을 추가로 포함하는, 방법.
  3. 제1항 또는 제2항에 있어서, 상기 고유 분자 식별자 서열(UMI)이 10 내지 30개 뉴클레오티드 범위의 축퇴성(degenerate) 또는 반축퇴성 서열인, 방법.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 방법이 생물학적 샘플로부터 단일 세포를 단리하는 단계를 추가로 포함하는, 방법.
  5. 제4항에 있어서, 상기 단리 단계가 세포를 선별함으로써 수행되는, 방법.
  6. 제4항에 있어서, 상기 단리 단계가 세포를 액적(droplet)으로 분할함으로써 수행되는, 방법.
  7. 제4항 내지 제6항 중 어느 한 항에 있어서, 상기 단리 단계가 단계 c)의 이후 및 단계 d)의 이전에 수행되는, 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 단계 f)의 전에 대규모 병렬 서열분석 라이브러리를 정제하는 단계를 추가로 포함하는, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 적어도 하나의 결합제가
    a) 항체 또는 이의 단편,
    b) 앱타머(aptamer),
    c) 소분자,
    d) 펩티드 및
    e) 단백질
    로 이루어진 그룹으로부터 선택되는, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 표적 분자가
    a) 단백질,
    b) 펩티드,
    c) 당단백질,
    d) 탄수화물,
    e) 지질 및
    f) 이들의 조합
    으로 이루어진 그룹으로부터 선택되는, 방법.
  11. 제2항 내지 제10항 중 어느 한 항에 있어서,
    상기 태그된 올리고뉴클레오티드가 5'으로부터 3'으로 적어도
    a) 5' 전체 게놈 증폭 핸들 서열(5-WGAH) 및 제1 증폭 핸들 서열(1AH)을 차례로 포함하는, 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
    b) 페이로드 서열(PL);
    c) 핵산의 제2 증폭 핸들 서열(2AH) 및 3' 전체 게놈 증폭 핸들 서열(3-WGAH)을 차례로 포함하는, 핵산의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)
    을 포함하는, 방법.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, 상기 전체 게놈 증폭 및 태그된 올리고의 증폭이 단일 프라이머(single primer)를 사용하여 수행되는, 방법.
  13. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 태그된 올리고뉴클레오티드가 5'으로부터 3'으로 적어도
    a) 5' 전체 게놈 증폭 핸들 서열(5-WGAH) 및 제1 증폭 핸들 서열(1AH)을 차례로 포함하는, 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
    b) 페이로드 서열(PL);
    c) 임의로, 어닐링 서열(AS)
    을 포함하고;
    여기서, 적어도 하나의 프라이머는 전체 게놈 증폭 및 상기 태그된 올리고뉴클레오티드의 증폭에 사용되고, 적어도 하나의 올리고뉴클레오티드(E-p)는 태그된 올리고뉴클레오티드의 신장(extension)에 사용되고,
    상기 적어도 하나의 올리고뉴클레오티드(E-p)는 5'으로부터 3'으로 적어도
    d) 5' 전체 게놈 증폭 핸들 서열(5-WGAH);
    e) 스페이서 서열(spacer sequence; SS);
    f) 제2 증폭 핸들 서열(2AH); 및
    g) 어닐링 서열에 대해 역상보적인 서열(AS-RC) 또는 결합제 바코드 서열에 대해 역상보적인 서열(BAB-RC)
    을 포함하는, 방법.
  14. 제1항 내지 제10항 중 어느 한 항에 있어서,
    상기 태그된 올리고뉴클레오티드가 5'으로부터 3'으로 적어도
    a) 제1 증폭 핸들 서열(1AH)에 상응하는 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
    b) 페이로드 서열(PL);
    c) 제2 증폭 핸들 서열(2AH)에 상응하는 핵산의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)
    을 포함하고;
    여기서, 적어도 하나의 제1 프라이머는 전체 게놈 증폭에 사용되고, 적어도 하나의 제2 및 하나의 제3 프라이머는 태그된 올리고뉴클레오티드의 증폭에 사용되며;
    상기 적어도 하나의 제2 프라이머는 제1 증폭 핸들 서열(1AH)과 동일한 서열을 갖고, 적어도 하나의 제3 프라이머는 제2 증폭 핸들 서열에 역상보적인 서열(2AH-RC)을 갖는, 방법.
  15. 제14항에 있어서, 상기 적어도 하나의 제2 프라이머 및 적어도 하나의 제3 프라이머가 단계 d)에서 첨가되는, 방법.
  16. 제11항 내지 제15항 중 어느 한 항에 있어서, 증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리를 제조하는 상기 단계 e)가, 제1 증폭 핸들 서열(1AH)에 상응하는 3' 서열을 포함하는, 적어도 하나의 제1 라이브러리 프라이머, 및 제2 증폭 핸들 서열에 역상보적인 서열(2AH-RC)에 상응하는 3' 서열을 포함하는, 적어도 하나의 제2 라이브러리 프라이머를 사용하는 PCR 반응에 의해 수행되는, 방법.
  17. 제1항 내지 제16항 중 어느 한 항의 방법을 수행하기 위한 키트(kit)로서,
    a) 태그된 올리고뉴클레오티드와 접합된 생물학적 샘플 중의 적어도 하나의 표적 분자에 대해 지시된 적어도 하나의 결합제로서, 상기 태그된 올리고뉴클레오티드는
    i) 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는 핵산의 페이로드 서열(PL),
    ii) 적어도 하나의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS)
    를 포함하는, 적어도 하나의 결합제;
    b) 전체 게놈 증폭을 수행하기 위한 적어도 하나의 프라이머 및 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 적어도 하나의 프라이머로서, 상기 전체 게놈 증폭을 수행하기 위한 적어도 하나의 프라이머 및 상기 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 적어도 하나의 프라이머는 동일한 서열을 갖거나 상이한 서열을 갖는, 적어도 하나의 프라이머
    를 포함하는, 키트.
  18. 제20항에 있어서, 태그된 올리고뉴클레오티드를 신장시키기 위한 올리고뉴클레오티드를 추가로 포함하는, 키트.
  19. 제17항 또는 제18항에 있어서, 상기 적어도 하나의 태그된 올리고뉴클레오티드가 서열번호 1에 상응하는 서열을 갖고, 상기 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 프라이머가 2개이고 각각 서열번호 2 및 서열번호 3의 서열을 갖는, 키트.
  20. 제17항 내지 제19항 중 어느 한 항에 있어서, 하나 이상의 제1 라이브러리 프라이머(들) 및 하나 이상의 제2 라이브러리 프라이머(들)를 추가로 포함하는, 키트.
  21. 제20항에 있어서, 상기 제1 라이브러리 프라이머(들)가 서열번호 8 내지 서열번호 15로 이루어진 그룹으로부터 선택된 서열을 갖고, 상기 제2 라이브러리 프라이머(들)가 서열번호 16 내지 서열번호 27로 이루어진 그룹으로부터 선택된 서열을 갖는, 키트.
  22. 제17항 또는 제18항에 있어서, 상기 적어도 하나의 태그된 올리고뉴클레오티드가 서열번호 28에 상응하는 서열을 갖고, 상기 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 프라이머가 서열번호 29에 상응하는 서열을 갖는, 키트.
  23. 제22항에 있어서, 하나 이상의 제1 라이브러리 프라이머(들) 및 하나 이상의 제2 라이브러리 프라이머(들)를 추가로 포함하는, 키트.
  24. 제23항에 있어서, 상기 제1 라이브러리 프라이머(들)가 서열번호 30 내지 서열번호 37로 이루어진 그룹으로부터 선택된 서열을 갖고, 상기 제2 라이브러리 프라이머(들)가 서열번호 38 내지 서열번호 49로 이루어진 그룹으로부터 선택된 서열을 갖는, 키트.
KR1020227023430A 2019-12-16 2020-12-16 생물학적 샘플에서 전체 게놈 증폭 및 표적 분자의 분석을 위한 방법 및 키트 KR20220139859A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IT102019000024159A IT201900024159A1 (it) 2019-12-16 2019-12-16 Metodo e kit per amplificazione totale del genoma e analisi di molecole bersaglio in un campione biologico
IT102019000024159 2019-12-16
PCT/IB2020/062053 WO2021124166A1 (en) 2019-12-16 2020-12-16 Method and kit for whole genome amplification and analysis of target molecules in a biological sample

Publications (1)

Publication Number Publication Date
KR20220139859A true KR20220139859A (ko) 2022-10-17

Family

ID=69904109

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227023430A KR20220139859A (ko) 2019-12-16 2020-12-16 생물학적 샘플에서 전체 게놈 증폭 및 표적 분자의 분석을 위한 방법 및 키트

Country Status (15)

Country Link
US (1) US20230053146A1 (ko)
EP (1) EP4077713B1 (ko)
JP (1) JP2023511492A (ko)
KR (1) KR20220139859A (ko)
CN (1) CN114867867A (ko)
AU (1) AU2020408301A1 (ko)
CA (1) CA3161615A1 (ko)
DK (1) DK4077713T3 (ko)
ES (1) ES2959838T3 (ko)
FI (1) FI4077713T3 (ko)
IL (1) IL293720B2 (ko)
IT (1) IT201900024159A1 (ko)
PL (1) PL4077713T3 (ko)
PT (1) PT4077713T (ko)
WO (1) WO2021124166A1 (ko)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6673541B1 (en) 1998-09-18 2004-01-06 Micromet Ag DNA amplification of a single cell
EP3236264A3 (en) 2009-10-13 2017-11-08 Nanostring Technologies, Inc Protein detection via nanoreporters
ITUA20162640A1 (it) 2016-04-15 2017-10-15 Menarini Silicon Biosystems Spa Metodo e kit per la generazione di librerie di dna per sequenziamento massivo parallelo
EP3583214B1 (en) * 2017-02-02 2023-11-22 New York Genome Center, Inc. Methods and compositions for identifying or quantifying targets in a biological sample
EP3431611A1 (en) 2017-07-21 2019-01-23 Menarini Silicon Biosystems S.p.A. Improved method and kit for the generation of dna libraries for massively parallel sequencing
US11414701B2 (en) * 2018-05-24 2022-08-16 The Broad Institute, Inc. Multimodal readouts for quantifying and sequencing nucleic acids in single cells

Also Published As

Publication number Publication date
US20230053146A1 (en) 2023-02-16
CN114867867A (zh) 2022-08-05
DK4077713T3 (da) 2023-08-28
CA3161615A1 (en) 2021-06-24
IL293720B1 (en) 2023-10-01
IT201900024159A1 (it) 2021-06-16
ES2959838T3 (es) 2024-02-28
WO2021124166A1 (en) 2021-06-24
IL293720B2 (en) 2024-02-01
PT4077713T (pt) 2023-08-18
IL293720A (en) 2022-08-01
JP2023511492A (ja) 2023-03-20
EP4077713B1 (en) 2023-07-26
FI4077713T3 (fi) 2023-09-27
AU2020408301A1 (en) 2022-06-30
EP4077713A1 (en) 2022-10-26
PL4077713T3 (pl) 2024-01-03

Similar Documents

Publication Publication Date Title
US20210371914A1 (en) Methods and compositions for identifying or quantifying targets in a biological sample
US11434538B2 (en) Method of nucleic acid sequence detection
US20230279477A1 (en) Methods for spatial analysis using targeted rna capture
JP2023040233A (ja) 分子の多重検出方法
CN112154216A (zh) 生物分子探针以及检测基因和蛋白表达的方法
EP3587589B1 (en) Reagents and methods for the analysis of circulating microparticles
WO2011142836A2 (en) Assays for the detection of genotype, mutations, and/or aneuploidy
KR20130113447A (ko) 고정된 프라이머들을 이용하여 표적 dna의 직접적인 캡쳐, 증폭 및 서열화
KR102512168B1 (ko) 차세대서열결정법을 이용한 표적 단백질의 집단적 정량 방법과 그 용도
CN106536735A (zh) 分析dna样品的探针集合和使用所述探针集合的方法
KR20180041331A (ko) 분자결합핵산 선정과 표적분자 동정 방법 및 키드, 그리고 그들의 용도
EP4077713B1 (en) Method and kit for whole genome amplification and analysis of target molecules in a biological sample
KR20230129675A (ko) 결합올리고뉴클레오티드의 제조 및 용도
JP2003125800A (ja) 核酸の検出方法

Legal Events

Date Code Title Description
A201 Request for examination