KR20220139859A - Methods and kits for whole genome amplification and analysis of target molecules in biological samples - Google Patents

Methods and kits for whole genome amplification and analysis of target molecules in biological samples Download PDF

Info

Publication number
KR20220139859A
KR20220139859A KR1020227023430A KR20227023430A KR20220139859A KR 20220139859 A KR20220139859 A KR 20220139859A KR 1020227023430 A KR1020227023430 A KR 1020227023430A KR 20227023430 A KR20227023430 A KR 20227023430A KR 20220139859 A KR20220139859 A KR 20220139859A
Authority
KR
South Korea
Prior art keywords
sequence
amplification
tagged
primer
library
Prior art date
Application number
KR1020227023430A
Other languages
Korean (ko)
Inventor
니콜로 마나레시
안드레아 라스파도리
알베르토 페라리니
Original Assignee
메나리니 실리콘 바이오시스템스 에스.피.에이.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메나리니 실리콘 바이오시스템스 에스.피.에이. filed Critical 메나리니 실리콘 바이오시스템스 에스.피.에이.
Publication of KR20220139859A publication Critical patent/KR20220139859A/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6804Nucleic acid analysis using immunogens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1075Isolating an individual clone by screening libraries by coupling phenotype to genotype, not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/122Massive parallel sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/131Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a member of a cognate binding pair, i.e. extends to antibodies, haptens, avidin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2563/00Nucleic acid detection characterized by the use of physical, structural and functional properties
    • C12Q2563/179Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid

Abstract

게놈 DNA 및 표적 분자를 포함하는 생물학적 샘플에서 전체 게놈 증폭 및 복수 표적 분자의 분석을 위한 방법으로서, 상기 생물학적 샘플을, 태그된 올리고뉴클레오티드와 접합된, 표적 분자의 적어도 하나에 대해 지시되는 적어도 하나의 결합제와 접촉시키는 단계로서, 상기 태그된 올리고뉴클레오티드는 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는, 단계; 분리 단계를 수행하여, 결합되지 않은 결합제를 선택적으로 제거하고, 이렇게 하여, 표지된 생물학적 샘플을 수득하는 단계; 표지된 생물학적 샘플에 대해 전체 게놈 증폭 및 태그된 올리고뉴클레오티드의 증폭을 수행하는 단계; 증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리를 제조하는 단계; 대규모 병렬 서열분석 라이브러리를 서열분석하는 단계; 각 서열분석 판독으로부터 BAB 및 UMI의 서열을 검색하는 단계; 및 각 결합제에 대해 상이한 UMI의 수를 계수하는 단계를 포함하는, 방법이 개시되어 있다.A method for whole genome amplification and analysis of a plurality of target molecules in a biological sample comprising genomic DNA and a target molecule, wherein the biological sample is conjugated with a tagged oligonucleotide and directed against at least one of the target molecules. contacting with a binder, wherein the tagged oligonucleotide comprises a binder barcode sequence (BAB) and a unique molecular identifier sequence (UMI); performing a separation step to selectively remove unbound binder, thereby obtaining a labeled biological sample; performing whole genome amplification and amplification of the tagged oligonucleotides on the labeled biological sample; preparing a massively parallel sequencing library from the amplified tagged oligonucleotides; sequencing the massively parallel sequencing library; retrieving the sequences of BAB and UMI from each sequencing read; and counting the number of different UMIs for each binder.

Description

생물학적 샘플에서 전체 게놈 증폭 및 표적 분자의 분석을 위한 방법 및 키트Methods and kits for whole genome amplification and analysis of target molecules in biological samples

관련 출원에 대한 상호 참조CROSS-REFERENCE TO RELATED APPLICATIONS

이 특허 출원은 2019년 12월 16일자로 출원된 이탈리아 특허 출원 제102019000024159호로부터의 우선권을 주장하고, 그 개시 전체는 참조에 의해 본 명세서에 도입된다.This patent application claims priority from Italian Patent Application No. 102019000024159, filed on December 16, 2019, the entire disclosure of which is incorporated herein by reference.

발명의 기술 분야technical field of invention

본 발명은 생물학적 샘플, 특히 단일 세포 샘플에서 전체 게놈 증폭(whole genome amplification) 및 표적 분자(target molecule)의 분석, 특히 단백질의 정량화를 위한 방법 및 키트(kit)에 관한 것이다.The present invention relates to methods and kits for whole genome amplification and analysis of target molecules, in particular quantification of proteins, in biological samples, in particular single cell samples.

선행 기술prior art

단일-세포 분석의 방법은, 벌크 샘플의 불균일성에 기인하는 합병증 없이 세포 상태에 대한 정보를 수득할 수 있다. 동일한 단일 세포에서 프로테옴과 게놈의 분석은 세포의 표현형과 유전자형 사이의 상관관계를 제공하고, 따라서 다양한 생물학적 및 병리학적 프로세스에 대한 독특한 통찰을 가능하게 한다. 이것은 특히 종양에 해당하고, 종양에서는, 체세포적으로 획득된 유전적 불균일성과 이의 전사 및 단백질 번역에 대한 영향이 암의 발생과 진화의 중요한 요소이다.The method of single-cell analysis can obtain information about the cell status without complications due to the heterogeneity of the bulk sample. Analysis of the proteome and genome in the same single cell provides correlations between the phenotype and genotype of cells, thus enabling unique insights into various biological and pathological processes. This is particularly true of tumors, where somatically acquired genetic heterogeneity and its influence on transcription and protein translation are important factors in the development and evolution of cancer.

전체 게놈 증폭(WGA)은 단일 세포로부터 게놈을 분석하여, 더 많은 DNA를 수득하고 서열분석, SNP 검출 등을 포함한 상이한 유형의 유전자 분석을 간소화 및/또는 가능하게 하는 데 유용하다. 결정론적 제한 부위(DRS-WGA)에 기초하는 LM-PCR에 의한 WGA는 제EP1109938호로부터 공지되어 있다.Whole genome amplification (WGA) is useful for analyzing the genome from a single cell to obtain more DNA and to simplify and/or enable analysis of different types of genes, including sequencing, SNP detection, and the like. WGA by LM-PCR based on deterministic restriction sites (DRS-WGA) is known from EP1109938.

WO 제2017/178655호 및 WO 제2019/016401호는 로우-패스(low-pass) 전체 게놈 서열분석 및 카피 수 프로파일링을 위해 DRS-WGA(예: Ampli1™ WGA) 또는 MALBAC로부터 대규모 병렬 서열분석 라이브러리(massively parallel sequencing library)를 제조하는 간략화된 방법을 교시한다. WO 2017/178655 and WO 2019/016401 provide massively parallel sequencing from DRS-WGA (eg Ampli1™ WGA) or MALBAC for low-pass whole genome sequencing and copy number profiling. A simplified method of making a massively parallel sequencing library is taught.

최근, 단일 세포에서 게놈과 전사체를 동시에 분석하는 방법이 개발되었다. 데이 에스. 등의 논문[참조: Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129]은 수작업으로 단리한 단일 세포로부터의 메신저 RNA를 먼저 단일 가닥 cDNA로 전사하고, 이어서 준선형 전체 게놈 증폭에 의해 게놈 DNA와 함께 증폭하는 방법을 교시한다. 이어서, 2개의 상이한 라이브러리(1개는 cDNA로부터의 것 및 1개는 게놈 DNA로부터의 것)가 제조되고, 서열분석된다. 또 다른 접근법[참조: Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370]에서, 올리고-dT 코팅 비드를 사용하여 mRNA를 gDNA로부터 물리적으로 분리하여, 완전히 용해된 단일 세포로부터 폴리아데닐화된 mRNA 분자를 포획하고 단리한다. 이어서, 변경된 Smart-seq2 프로토콜을 사용하여 mRNA가 증폭되고[참조: Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639], gDNA는 이용 가능한 전체 게놈 증폭 방법으로 증폭하고 서열분석할 수 있다. 이러한 방법은 유전자형을 메신저 전사에 연결하는 데 유용하지만, 단백질의 직접 검출을 수행할 수 없고, 단백질의 번역 및 전환/분해는 세포에서 활발하게 조절되지 않는다.Recently, a method has been developed to analyze the genome and transcriptome simultaneously in a single cell. Day S. et al. [Reference: Dey S. et al., 2015, Integrated genome and transcriptome sequencing of the same cell. Nature Biotechnology, 33(3), 285-289. http://doi.org/10.1038/nbt.3129] describes a method in which messenger RNA from a single cell isolated by hand is first transcribed into single-stranded cDNA and then amplified together with genomic DNA by quasi-linear whole genome amplification. teach Two different libraries (one from cDNA and one from genomic DNA) are then prepared and sequenced. Another approach [see Macaulay, I. C., et al., 2015, G&T-seq: Parallel sequencing of single-cell genomes and transcriptomes. Nature Methods, 12(6), 519-522. http://doi.org/10.1038/nmeth.3370], using oligo-dT coated beads to physically separate mRNA from gDNA to capture and isolate polyadenylated mRNA molecules from fully lysed single cells . Then, mRNA was amplified using a modified Smart-seq2 protocol [Picelli, S. et al., 2013, Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nature Methods, 10(11), 1096-1100. http://doi.org/10.1038/nmeth.2639], gDNA can be amplified and sequenced by available whole genome amplification methods. Although this method is useful for linking genotypes to messenger transcription, it cannot perform direct detection of proteins, and translation and conversion/degradation of proteins are not actively regulated in cells.

현재, 가장 광범위하게 적용되는 단일 세포 단백질 검출 접근법은 태그된 항체를 사용하여 특정 단백질을 표적화하는 것에 의존한다. 형광-활성화 세포 선별(FACS) 또는 형광 현미경에 의한 단백질의 형광-기반 검출 및 정량화에 의해, 특정 세포 단백질을 인식하는 형광 표지된 항체를 사용하여, 낮은 수준의 다중화로 단일 세포에서 단백질 검출이 가능해진다. 그러나, 형광단-기반 고도 다중화된 검정은 복수 염료의 방출 스펙트럼 사이의 스펙트럼 중첩에 의해 도전받기 때문에, 이 접근법은 일반적으로 10 내지 15회의 동시 측정으로 제한된다. 더욱이, 중첩 스펙트럼의 디콘볼루션(deconvolution)에는 복잡한 알고리즘이 필요하다.Currently, the most widely applied single cell protein detection approaches rely on targeting specific proteins using tagged antibodies. Fluorescence-based detection and quantification of proteins by fluorescence-activated cell sorting (FACS) or fluorescence microscopy allows for protein detection in single cells with low levels of multiplexing using fluorescently labeled antibodies that recognize specific cellular proteins becomes However, since fluorophore-based highly multiplexed assays are challenged by the spectral overlap between the emission spectra of multiple dyes, this approach is generally limited to 10 to 15 simultaneous measurements. Moreover, deconvolution of overlapping spectra requires complex algorithms.

플루이다임(Fluidigm) 질량 세포계측기(CyTOF™)는 금속 함유 폴리머 태그된(MAXPAR™) 항체를 사용하여 단백질을 검출한다. 이 기기는 비-광학적 물리적 검출 원리와 표지의 상이한 화학적 특성을 기반으로 한다. 형광 표지는 특별히 설계된 다원자 원소 태그로 치환되고, 검출은 비행 시간형 질량 분석(TOF-MS)의 고해상도, 감도 및 분석 속도를 이용한다. 다수의 이용가능한 안정한 동위원소를 태그로서 사용할 수 있기 때문에, 다수의 단백질이 개별 세포에서 잠재적으로 동시에 검출될 수 있다[참조: Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002]. 프레이 등의 연구[참조: Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742]는 RNA의 근접 결찰 검정(PLAYR)을 기반으로 단일 세포에서 RNA와 단백질을 동시에 검출하는 방법을 교시한다. PLAYR은 질량-세포분석을 통해 단일 세포에서 전사체의 고도로 다중화된 정량화를 가능하게 하고, 이는 40개 초과의 상이한 mRNA 및 단백질의 동시 정량화를 가능하게 한다. 마지막으로, 질량 세포분석에 의해, 단백질 포스포릴화[참조: Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332(6030), 687-696. http://doi.org/10.1126/science.1198704] 및 세포 증식[참조: Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075] 등의 단백질 및 메신저 RNA 전사와 함께, 복수의 세포 프로세스 및 표현형 특성을 조사할 수 있었다.A Fluidigm mass cytometer (CyTOF™) uses a metal-containing polymer tagged (MAXPAR™) antibody to detect proteins. This instrument is based on the principle of non-optical physical detection and the different chemical properties of the label. The fluorescent label is replaced with a specially designed polyatomic element tag, and detection utilizes the high resolution, sensitivity and analysis speed of time-of-flight mass spectrometry (TOF-MS). Because multiple available stable isotopes can be used as tags, multiple proteins can potentially be simultaneously detected in individual cells (Ornatsky, O. et al, 2010, Highly multiparametric analysis by mass cytometry. Journal of Immunological Methods, 361(1-2), 1-20. http://doi.org/10.1016/j.jim.2010.07.002]. The study of Frei et al. [Frei et al., 2016, Highly multiplexed simultaneous detection of RNAs and proteins in single cells. Nature Methods, 13(3), 269-275. http://doi.org/10.1038/nmeth.3742] teaches a method for simultaneous detection of RNA and protein in single cells based on the proximity ligation assay (PLAYR) of RNA. PLAYR enables highly multiplexed quantification of transcripts in single cells via mass-cytometry, which enables simultaneous quantification of more than 40 different mRNAs and proteins. Finally, by mass cytometry, protein phosphorylation [Bendall, S. C. et. Al., 2011, Single-Cell Mass Cytometry of Differential Immune and Drug Responses Across a Human Hematopoietic Continuum. Science, 332 (6030), 687-696. http://doi.org/10.1126/science.1198704] and cell proliferation [Behbehani, G. K. et al., 2012, Single-cell mass cytometry adapted to measurements of the cell cycle. Cytometry Part A, 81A(7), 552-566. http://doi.org/10.1002/cyto.a.22075], along with protein and messenger RNA transcription, could be investigated for multiple cellular processes and phenotypic properties.

이러한 접근법의 제한은 다음과 같다:The limitations of this approach are:

- 질량 분석기에서의 이온 비행 역학으로 인해, 질량 세포분석의 처리량은 형광-기반 기기의 처리량보다 뒤쳐진다. 추가로, 질량 리포터의 감도는 양자 효율이 높은 형광단(예: 피코에리트린)의 수가 적기 때문에, 질량 세포측정을 사용하여 매우 낮은 수준으로 발현되는 분자의 특징을 측정하는 것이 곤란해진다[참조: Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019].- Due to ion flight dynamics in mass spectrometers, the throughput of mass cytometry lags behind that of fluorescence-based instruments. Additionally, the sensitivity of mass reporters makes it difficult to characterize molecules expressed at very low levels using mass cytometry because of the small number of highly quantum efficient fluorophores (e.g., phycoerythrin) [cf. Spitzer, M. H. et al., 2016, Mass Cytometry: Single Cells, Many Features. Cell, 165(4), 780-791. http://doi.org/10.1016/j.cell.2016.04.019].

- 중요한 것은, 세포가 분무화 및 이온화되기 때문에, 분석 후에 세포를 회복할 수 없고, 따라서 게놈 DNA를 분석할 수 없다.- Importantly, since the cells are nebulized and ionized, the cells cannot be recovered after analysis, and therefore the genomic DNA cannot be analyzed.

올리고뉴클레오티드 표지된 항체를 통한 단백질 검출 방법은 프레드릭슨 등의 논문[참조: Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473]에 기재되어 있고, 이는 2개의 DNA 앱타머(aptamer)에 의한 표적 단백질의 협조적 및 근위의 결합이 각 앱타머 친화성 프로브에 연결된 올리고뉴클레오티드의 결찰을 촉진하는 기술(근접 결찰 검정; PLA)을 교시한다. 2개의 이러한 근접 프로브의 결찰은 표적 단백질의 동일성과 양을 반영하는 증폭 가능한 DNA 서열을 생성시킨다. 방법 3PLA[참조: Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974]는 3개의 인식 이벤트를 사용함으로써 근접 결찰 방법의 감도와 특이성을 연장하고, 100개 정도의 표적 분자를 검출할 수 있다. 3PLA에서, 3개의 올리고뉴클레오티드 변형 항체 시약 세트가 개별 표적 단백질에 결합하여 근접 결찰에 의해 검출 가능한 신호를 발생시킨다. 2개의 근접 프로브 상의 올리고뉴클레오티드의 3' 및 5' 말단은 제3 근접 프로브에 존재하는 올리고뉴클레오티드와 하이브리드화하여, 3개의 프로브와 표적 단백질을 포함하는 복합체를 형성할 수 있다. 이것은 2개의 올리고뉴클레오티드가 2개의 결찰 반응에 의해 중간 단편을 통해 연결되도록 하고, 제3 근접 프로브에 의해 템플릿화되어 qPCR에 의해 검출될 수 있는 특정 증폭 가능한 DNA 가닥이 형성된다. 근접 신장 검정(Proximity Extension Assay; PEA)은 2개의 올리고뉴클레오티드 표지된 항체가 개별 단백질에 결합하고, 올리고뉴클레오티드가 3' 말단에서 부분적으로 어닐링되고, 폴리머라제에 의한 신장이 qPCR에 의해 검출될 수 있는 증폭 가능한 DNA 서열을 생성하는 PLA의 변이이다[참조: Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424]. 상기의 방법은 단일 세포 단백질 검출용으로 특별히 설계되지 않았지만, 플루이다임(Fluidigm) C1™ 단일 세포 자동 제조 시스템을 사용하여, PEA 검정을 사용하여, 실행당 최대 96개의 단일 세포에서 92개 단백질의 패널의 증폭 가능한 표적의 제조를 자동화했다[참조: Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 ™ Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5)]. 플루이다임 C1 마이크로유체 시스템은 전사체 또는 게놈 DNA 서열을 전체 엑솜 서열분석 및 표적 DNA 서열분석으로 분석하기 위한 다양한 단일 세포 생물학적 방법을 서포트하지만, 이 방법을 간단하게 조합하여 동일한 단일 세포로부터 유전자형 및 표현형에 대한 정보를 수득할 수 없다. A method of protein detection using an oligonucleotide-labeled antibody is described in a paper by Fredriksson et al. [Fredriksson et al., 2002, Protein detection using proximity-dependent DNA ligation assays. Nature Biotechnology, 20(5), 473-477. http://doi.org/10.1038/nbt0502-473], which shows that cooperative and proximal binding of a target protein by two DNA aptamers is of an oligonucleotide linked to each aptamer affinity probe. A technique to facilitate ligation (proximity ligation assay; PLA) is taught. Ligation of two such proximity probes results in an amplifiable DNA sequence that reflects the identity and amount of the target protein. Method 3PLA (Schallmeiner, E. et al., 2007, Sensitive protein detection via triple-binder proximity ligation assays. Nature Methods, 4(2), 135-137. http://doi.org/10.1038/nmeth974] extends the sensitivity and specificity of the proximity ligation method by using three recognition events, and can detect as many as 100 target molecules. In 3PLA, a set of three oligonucleotide modified antibody reagents bind to individual target proteins and generate a detectable signal by proximity ligation. The 3' and 5' ends of the oligonucleotides on the two proximity probes may hybridize with the oligonucleotides present in the third proximity probe to form a complex comprising the three probes and the target protein. This allows the two oligonucleotides to be linked through an intermediate fragment by two ligation reactions, which are templated by a third proximity probe to form a specific amplifiable DNA strand that can be detected by qPCR. Proximity Extension Assay (PEA) is a method in which two oligonucleotide labeled antibodies bind to individual proteins, the oligonucleotides are partially annealed at the 3' end, and extension by polymerase can be detected by qPCR. It is a mutation of PLA that produces amplifiable DNA sequences (Lundberg, M. et al., 2011, Homogeneous antibody-based proximity extension assays provide sensitive and specific detection of low-abundant proteins in human blood. Nucleic Acids Research, 39(15). http://doi.org/10.1093/nar/gkr424]. Although the above method was not specifically designed for single cell protein detection, the PEA assay, using the Fluidigm C1™ single cell automated preparation system, was used to measure 92 proteins in up to 96 single cells per run. The panel's preparation of amplifiable targets was automated (Egidio C. et al., 2014, A Method for Detecting Protein Expression in Single Cells Using the C1 ™ Single-Cell Auto Prep System (TECH2P.874), J Immunol, 192 (1 Supplement) 135.5)]. The Fluidime C1 microfluidic system supports a variety of single-cell biological methods for analyzing transcript or genomic DNA sequences by whole-exome sequencing and target DNA sequencing, but a simple combination of these methods allows for genotyping and genotyping from the same single cell. Information on the phenotype could not be obtained.

따라서, 검출이 qPCR을 기반으로 하는 PLA 및 PEA 검정은 감도가 높고 매우 특이적이지만, 처리량이 제한되고, 단백질만을 검출할 수 있다.Therefore, PLA and PEA assays, whose detection is based on qPCR, are highly sensitive and highly specific, but have limited throughput and can only detect proteins.

나노스트링 테크놀로지 인코포레이티드(NanoString Technologies, Inc.)의 US 제9,714,937호는, 표적 단백질 및 검출 항체의 제1 영역, 링커 올리고뉴클레오티드에 대한 하이브리드화를 통해 검출 항체에 연결된 복수의 박리가능한 표지를 포함하는 나노리포터를 갖는 표적 단백질의 제2 영역에 대해 특이적인 바이오틴 등의 모이어티에 접합된 포획 항체의 사용을 통한 단백질의 검출 방법을 교시한다. 2개의 항체는 표적 단백질과 복합체를 형성하고, 이는 그 모이어티에 대해 높은 친화성을 갖는 매트릭스 또는 비드와의 결합을 형성할 수 있다. 나노리포터 분자의 수를 계수함으로써 표적을 검출 및 정량화한다. nCounter® 디지털 분자 바코드 기술을 기반으로 하는 나노스트링 인코포레이티드(Nanostring, Inc.)로부터 상업적으로 이용 가능한 검정법은 특정 단백질 에피토프를 표적화하는 고유한 올리고뉴클레오티드 표지 항체를 사용하여 단백질을 검출한다. 고유한 단일 가닥 DNA 태그는 비오틴화된 포획 프로브와, 일련의 형광 표지된 RNA 세그먼트에 어닐링된 단일 가닥 DNA 분자에 의해 작성된 리포터 프로브의 조합을 사용하여 검출된다. 이러한 표지의 선형 순서에 의해, 목적하는 각 표적에 대해 고유한 바코드가 생성된다. 이어서, 비오틴과 고정화된 스트렙트아비딘 분자 사이의 비공유 결합을 통해 복합체를 이미징 표면에 고정화하고, 형광 바코드를 이미징하여 계수한다. 단백질-특이적 바코드당 계수 수는 샘플에 존재하는 분자 수와 직접 관련된 디지털 측정치이다. 단백질 검출은 특정 표적 RNA에 대해 설계된 포획 프로브-리포터 프로브 커플을 사용하여 메신저 RNA 검출과 조합될 수 있다. 1회의 분석으로 약 30개의 단백질 표적과 770개의 mRNA 표적을 분석할 수 있다. US 9,714,937 to NanoString Technologies, Inc. discloses a plurality of peelable labels linked to a detection antibody via hybridization to a target protein and a first region of a detection antibody, a linker oligonucleotide. Methods of detecting a protein through the use of a capture antibody conjugated to a moiety, such as biotin, specific for a second region of the target protein having a nanoreporter comprising it are taught. The two antibodies form a complex with the target protein, which can form a bond with a matrix or bead with high affinity for that moiety. Targets are detected and quantified by counting the number of nanoreporter molecules. A commercially available assay from Nanostring, Inc., based on nCounter ® digital molecular barcode technology, detects proteins using unique oligonucleotide labeled antibodies that target specific protein epitopes. A unique single-stranded DNA tag is detected using a combination of a biotinylated capture probe and a reporter probe written by a single-stranded DNA molecule annealed to a series of fluorescently labeled RNA segments. The linear sequence of these labels creates a unique barcode for each target of interest. The complex is then immobilized on the imaging surface through non-covalent bonding between biotin and immobilized streptavidin molecules, and the fluorescent barcodes are imaged and counted. The number of counts per protein-specific barcode is a digital measure that is directly related to the number of molecules present in the sample. Protein detection can be combined with messenger RNA detection using a capture probe-reporter probe couple designed for a specific target RNA. About 30 protein targets and 770 mRNA targets can be analyzed in one analysis.

이 방법의 결점은 RNA(2,500개 세포에 해당) 및/또는 단백질(100,000개 세포에 해당)의 프로파일링에 대량의 세포를 필요로 하고, 그 자체로는 단일 세포의 프로파일링에 적합하지 않다는 것이다. 잠재적으로, 이 방법은 게놈 DNA 등의 다른 분석물을 검출하는 데 사용될 수 있지만, 게놈 서열을 직접 판독할 수 없을 뿐만 아니라, 공지된 서열의 존재/부재에 대한 신호만을 제공할 수 있다. 하이브리드화를 기반으로 하기 때문에, 서열 변이체에 대하여 부분적으로 내성이 있고, 상이한 서열 변이체를 구별할 수 없는 경우가 있다.A drawback of this method is that it requires a large number of cells for profiling of RNA (corresponding to 2,500 cells) and/or protein (corresponding to 100,000 cells), and by itself is not suitable for profiling of single cells. . Potentially, this method can be used to detect other analytes, such as genomic DNA, but cannot read the genomic sequence directly, but can only provide a signal for the presence/absence of a known sequence. Because it is based on hybridization, it is partially resistant to sequence variants and sometimes cannot distinguish between different sequence variants.

서열분석에 의한 전사체 및 에피토프의 세포 인덱싱(CITE-seq)으로 명명된 단일 세포에서 복수의 단백질 및 RNA 전사물의 통합 분석을 위한 NGS 기반 방법은 문헌[참조: Stoeckius et al., 2017, Simultaneous epitope and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868, and US 2018/0251825]에 기재되어 있다. 이 방법은 메신저 RNA에 존재하는 것과 유사한 항체 태그에 존재하는 3'-폴리 아데노신 테일을 통해 세포 단백질 및 전사체 측정치를 단일 세포 판독에 통합하기 위해 사용되는 올리고뉴클레오티드 표지 항체에 의존한다. 이 방법은 10X 게놈믹스(Genomics)가 제공하는 것 등의 단일 세포에서 샘플 분할 및 단일 세포 라이브러리 제조를 위한 액적(droplet)-기반 접근법과 호환성이 있다. 보다 상세하게는, CITE-seq 방법에서, 세포 표면 에피토프에 대한 올리고뉴클레오티드 표지된 항체로 염색된 세포는 마이크로유체 수단에 의해 용해 효소 및 바코드 비드를 포함하는 오일 액적으로 분할된다. 각 단일 세포/액적으로부터의 바코드 항체 및 mRNA는 고유한 세포 바코드를 갖는 비드에 의해 포획된다. 이어서, mRNA는 역전사되고, 바코드 항체로부터의 올리고와 함께 증폭되어 서열분석의 준비가 된 NGS 라이브러리를 생성한다. 마지막으로, 서열 계수는 바코드 항체의 정량화에 사용된다. 유사하게는, 문헌[참조: Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939]은 DNA 표지 항체 및 액적 마이크로유체를 기반으로 하는 방법, RNA 발현 및 단백질 정량화 검정(REAP-seq)을 교시하고, 이에 의해 단백질은 82개의 바코드 항체를 사용하여 정량화할 수 있고, >20,000의 전사를 단일 세포에서 프로파일링할 수 있다. 상기에서 언급한 2개 방법은 모두 역전사효소의 DNA 폴리머라제 활성을 이용하여 프라이밍된 올리고 표지된 항체를 폴리(dT) 세포 바코드로 동시에 신장하고, 동일한 반응에서 mRNA로부터 상보적 DNA를 합성한다. 다른 한편, 액적 접근법을 기반으로 하는 다른 방법은 전체 게놈 카피 수 프로파일의 분석 또는 단일 세포 내의 게놈 서열의 분석에 이용할 수 있다. 예를 들면, 10X 게놈믹스(Genomics)에 의한 상용 솔루션 크로미움 싱글 셀 CNV 솔루션(Chromium Single cell CNV Solution)은 수백으로부터 수천의 단일 세포의 복제 수 프로파일링을 가능하게 하고, 미션 바이오(Mission Bio)의 타페스트리(Tapestri®) 플랫폼은 유전자 패널의 서열 및 CNV 분석을 위한 단일 세포 표적 DNA 서열분석을 제공한다.An NGS-based method for the integrated analysis of multiple protein and RNA transcripts in a single cell, termed cellular indexing of transcripts and epitopes by sequencing (CITE-seq), is described in Stoeckius et al., 2017, Simultaneous epitope. and transcriptome measurement in single cells, Nature Methods volume 14, pages 865-868, and US 2018/0251825. This method relies on an oligonucleotide labeled antibody used to integrate cellular protein and transcriptome measurements into a single cell readout via a 3'-poly adenosine tail present in an antibody tag similar to that present in messenger RNA. This method is compatible with droplet-based approaches for splitting samples from single cells and preparing single cell libraries, such as that provided by 10X Genomics. More specifically, in the CITE-seq method, cells stained with oligonucleotide-labeled antibodies to cell surface epitopes are split into oil droplets containing lytic enzymes and barcoded beads by microfluidic means. Barcode antibodies and mRNAs from each single cell/droplet are captured by beads with unique cell barcodes. The mRNA is then reverse transcribed and amplified with oligos from the barcoded antibody to generate an NGS library ready for sequencing. Finally, sequence counts are used for quantification of barcoded antibodies. Similarly, Peterson et al., 2017, Multiplexed quantification of proteins and transcripts in single cells, Nature biotech., (35) 10:936-939, describes DNA-labeled antibodies and droplet microfluidics based Teaching methods, RNA expression and protein quantification assays (REAP-seq), whereby proteins can be quantified using 82 barcoded antibodies, and transcripts of >20,000 can be profiled in a single cell. Both methods mentioned above use the DNA polymerase activity of reverse transcriptase to simultaneously extend primed oligo-labeled antibodies to poly(dT) cell barcodes, and synthesize complementary DNA from mRNA in the same reaction. On the other hand, other methods based on the droplet approach can be used for analysis of whole genome copy number profiles or analysis of genomic sequences within a single cell. For example, the commercial solution Chromium Single cell CNV Solution by 10X Genomics enables copy number profiling of hundreds to thousands of single cells, and Mission Bio The Tapestri ® platform provides single-cell target DNA sequencing for sequencing and CNV analysis of gene panels.

이러한 방법의 결점은 다음과 같다:The drawbacks of this method are:

- 상기에서 설명한 전사체/프로테옴 프로파일링을 동시에 수행하는 방법은 둘 다, 게놈 DNA가 증폭에 필요한 폴리아데노신 테일을 갖고 있지 않기 때문에, 단백질 또는 전사물과 함께 게놈 서열을 동시에 분석할 수 없다.- Neither method of performing transcript/proteome profiling described above simultaneously analyzes genomic sequences with proteins or transcripts because genomic DNA does not have the polyadenosine tail required for amplification.

- Dropseq 기반의 카피 수 및/또는 표적 서열분석 방법은 게놈 DNA 분석에만 적합하지만, 전사 프로파일 또는 표면 마커 또는 기타 단백질의 정량화 등의 단일 세포의 표현형에 대한 정보는 제공하지 않는다.- Dropseq-based copy number and/or target sequencing methods are only suitable for genomic DNA analysis, but do not provide information on the phenotype of single cells, such as transcriptional profiles or quantification of surface markers or other proteins.

- 액적-기반의 단일 세포 분할 접근법에서, 단일 세포 및 모든 정보 내용은 프로세스에서 본질적으로 "파괴"되고, 절차가 완료된 후, 추가 분석을 수행하기 위해 단일 세포를 회복할 수 없다.- In the droplet-based single cell division approach, a single cell and all information content are essentially "destroyed" in the process, and after the procedure is complete, the single cell cannot be recovered for further analysis.

발명의 요약Summary of the invention

따라서, 본 발명의 목적은, 생물학적 샘플에서 전체 게놈 증폭 및 복수 표적 분자의 분석을 위한 방법을 제공하는 것이고, 이는 게놈 전체의 카피-수 프로파일/게놈 서열의 분석 및 동일한 단일 세포 상에서의 단백질 발현의 분석을 동시에 가능하게 하고, 특히 다음과 같은 최신 기술의 결점 중 하나 이상을 극복한다:Accordingly, it is an object of the present invention to provide a method for whole genome amplification and analysis of multiple target molecules in a biological sample, which is the analysis of genome-wide copy-number profiles/genomic sequences and of protein expression on the same single cell. It enables simultaneous analysis and overcomes one or more of the deficiencies of state-of-the-art, in particular:

- 단백질을 검출 및 정량화하고, 동일한 샘플에서 게놈을 단일-세포 분해능까지 분석하는 것은 불가능하고,- it is impossible to detect and quantify proteins and to analyze the genome to single-cell resolution in the same sample,

- 추가 표적 게놈 정보를 위해 단일 세포를 재분석하는 것은 불가능하다.- It is not possible to reanalyze single cells for additional target genomic information.

이 목적은 청구항 제1항에 정의된 방법에 의해 달성된다.This object is achieved by the method defined in claim 1 .

본 발명의 또 다른 목적은 청구항 제17항에 정의된 바와 같은 키트를 제공하는 것이다.Another object of the present invention is to provide a kit as defined in claim 17 .

도 1은 본 발명에 따른 3' 태그된 올리고 서열의 부재(도 1A) 또는 존재(도 1B)하에 태그된 올리고뉴클레오티드(tagged oligonucleotide)의 2개의 가능한 실시양태의 일반적 구조를 나타낸다. PL = 페이로드(payload) 서열; 5-TOS = 제1 태그된 올리고뉴클레오티드 증폭 서열; 3-TOS = 제2 태그된 올리고뉴클레오티드 증폭 서열; UMI = 고유 분자 식별자 서열; BAB = 결합제(binding agent) 바코드 서열.
도 2는 2개의 상이한 태그된 올리고의 태그된 올리고뉴클레오티드 라이브러리를 나타내는 그래프를 도시하고, 1개는 상이한 온도에서 5-TOS와 3-TOS 사이에서 분자내 헤어핀이 형성되기 쉬운 경향이 있다("헤어핀 존재": Tm = 67℃, "헤어핀 부재": Tm = 45℃). x축은 예상 UMI 계수이고, y축은 서열분석 후에 계수된 UMI이다.
도 3은 27회의 PCR 사이클에 의한 상이한 양의 올리고 혼합물의 증폭을 나타내는 그래프를 도시한다. 각각의 희석은 3회의 독립된 희석 복제로부터 수행되었다. x축은 관찰될 것으로 예상되는 별개의 UMI의 수이고, y축은 실험적으로 관찰된 UMI이다.
도 4는 상이한 양의 상이한 BAB를 갖는 4개의 올리고 혼합물의 증폭에 대한 3개의 그래프를 도시한다. 각 희석에는 각 올리고당 1개씩, 합계 4개의 데이터 포인트가 있다. 도 4A: 23회의 PCR 사이클을 수행했다. 도 4B: 27회의 PCR 사이클을 수행했다. 도 4C: 35회의 PCR 사이클을 수행했다. x축은 관찰될 것으로 예상되는 별개의 UMI의 수이고, y축은 실험적으로 관찰된 UMI이다.
도 5는 1개의 프라이머 증폭을 갖는 태그된 올리고의 본 발명에 따른 실시양태의 구조를 도시한다. 추가 캡션: 5-WGAH = 5' WGA 핸들 서열; 3-WGAH = 3' WGA 핸들 서열; 1AH = 제1 증폭 핸들 서열; 2AH = 제2 증폭 핸들 서열.
도 6은 적어도 제2 프라이머 증폭을 갖는 태그된 올리고의 본 발명에 따른 또 다른 실시양태의 구조를 도시한다. 도 6A: BAB에 상응하는 어닐링 부위를 갖는 태그된 올리고 및 상대적 신장 올리고뉴클레오티드의 구조. 도 6B: BAB에 상응하지 않는 어닐링 부위를 갖는 태그된 올리고 및 상대 신장 올리고뉴클레오티드의 구조. 추가 캡션: E-p = 5' 신장 올리고뉴클레오티드 서열; SS = 스페이서 서열(spacer sequence); AS = 어닐링 서열; AS-RC = 어닐링 서열 역상보체.
도 7은 분자 길이의 함수로서 ssDNA 분자의 말단에 위치하는 15nt 길이의 상보적 서열에 의해 유도된 헤어핀의 용융 온도([Na+]=150mM; [Mg++]=4mM)의 인 실리코(in silico) 예측의 그래프를 도시한다.
도 8은 적어도 3개의 프라이머 증폭을 갖는 태그된 올리고의 본 발명에 따른 또 다른 실시양태의 구조를 도시한다.
도 9는 라이브러리 생성을 위한 일반적 도식을 도시한다. 도 9A: 도 5의 실시양태에 따른 태그된 올리고로부터 라이브러리의 생성. 도 9B: 도 6A의 실시양태에 따른 태그된 올리고로부터 라이브러리의 생성. 도 9C: 도 8의 실시양태에 따른 태그된 올리고로부터 라이브러리의 생성. 추가 캡션: 2AH-RC = 제2 증폭 핸들 서열 역상보체.
도 10은 실시예 1에 개시된 P5-Synth 올리고 및 상응하는 라이브러리 프라이머의 설계를 도시한다.
도 11은 실시예 1에 따른 라이브러리 프라이머를 사용한 올리고 P5-Synth의 NGS 라이브러리 생성의 도식을 도시한다.
도 12는 Ab-올리고 및 제2 형광 항체로 염색된 PBMC 및 SK-BR-3 세포의 산포도를 도시한다. x축은 APC 채널의 형광 수준이고, 이는 Ab-올리고 태그1, 태그2 및 태그4의 양에 비례한다. y축은 PE 채널의 형광 수준이고, 이는 Ab-올리고 태그3의 양에 비례한다.
도 13은 실시예 1에 따른 단일 세포로부터 P5-synth 태그된 올리고로부터 생성된 라이브러리로부터의 전기영동을 도시한다.
도 14는 WGA 후의 태그된 올리고 증폭을 사용하여 도 8의 실시양태에 따라 처리된 단일 세포로부터의 단백질 정량화 결과를 도시한다. 각각 사이토케라틴(도 8A), Her2(도 8B), CD45(도 8C) 및 IgG1 이소형 대조군(도 8D) 정량화의 UMI 계수. y축은 UMI의 수이고, x축은 도 9에 따라 단리된 세포 유형이다.
도 15는 WGA 중에 태그된 올리고 증폭을 사용하여 도 8의 실시양태에 따라 처리된 단일 세포로부터의 단백질 정량화 결과를 도시한다. 각각 사이토케라틴(도 8A), Her2(도 8B), CD45(도 8C) 및 IgG1 이소형 대조군(도 8D) 정량화의 UMI 계수. y축은 UMI의 수이고, x축은 도 9에 따라 단리된 세포 유형이다.
도 16은 실시예 3에 개시된 P5-Lib1 올리고 및 상응하는 라이브러리 프라이머의 설계를 도시한다.
도 17은 라이브러리 프라이머를 사용한 P5-Lib1 올리고의 NGS 라이브러리 생성의 도식을 도시한다.
도 18은 단일 세포로부터 수득된 CNA 분석을 위한 로우패스(LowPass) 프로파일의 예를 도시한다. 도 18A: P5-Lib1 올리고를 스파이킹하고 도 5의 실시양태에 따라 처리된 단일 세포 CNA 프로파일. 도 18B: P5-Synth 올리고를 스파이킹하고 도 8의 실시양태에 따라 처리된 단일 세포 CNA 프로파일. 도 18C: 태그된 올리고 스파이크 부재하의 단일 세포 CNA 프로파일. 모든 프로파일은 전형적 이득 및 손실을 갖는 SK-BR-3 세포에 상응한다. 작은 변동은 단일 세포 게놈 불균일성에 기인한 것이다.
도 19는 P5-Synth 및 P5-Lib1을 스파이킹한 단일 세포로부터 수득된 태그된 올리고 라이브러리를 나타내는 그래프를 도시한다. x축은 예상된 UMI 수이고, y축은 서열분석 후에 계수된 UMI이다.
1 shows the general structure of two possible embodiments of tagged oligonucleotides in the absence (FIG. 1A) or presence (FIG. 1B) of a 3'-tagged oligo sequence according to the present invention. PL = payload sequence; 5-TOS = first tagged oligonucleotide amplification sequence; 3-TOS = second tagged oligonucleotide amplification sequence; UMI = unique molecular identifier sequence; BAB = binding agent barcode sequence.
2 depicts a graph representing a tagged oligonucleotide library of two different tagged oligos, one prone to intramolecular hairpin formation between 5-TOS and 3-TOS at different temperatures (“hairpins”). present": Tm = 67 °C, "without hairpins": Tm = 45 °C). The x-axis is the expected UMI coefficients, and the y-axis is the counted UMIs after sequencing.
3 shows a graph showing the amplification of different amounts of oligo mixtures by 27 PCR cycles. Each dilution was performed from three independent dilution replicates. The x-axis is the number of distinct UMIs expected to be observed, and the y-axis is the experimentally observed UMIs.
Figure 4 shows three graphs of amplification of four oligo mixtures with different amounts of different BABs. Each dilution has a total of 4 data points, one for each oligo. Figure 4A: 23 PCR cycles were performed. Figure 4B: 27 PCR cycles were performed. Figure 4C: 35 PCR cycles were performed. The x-axis is the number of distinct UMIs expected to be observed, and the y-axis is the experimentally observed UMIs.
5 shows the structure of an embodiment according to the invention of tagged oligos with one primer amplification. Additional captions: 5-WGAH = 5' WGA handle sequence; 3-WGAH = 3' WGA handle sequence; 1AH = first amplification handle sequence; 2AH = second amplification handle sequence.
6 shows the structure of another embodiment according to the invention of a tagged oligo having at least a second primer amplification. Figure 6A: Structures of tagged oligos and relative elongation oligonucleotides with annealing sites corresponding to BAB. Figure 6B: Structures of tagged oligos and relative elongation oligonucleotides with annealing sites that do not correspond to BAB. Additional captions: Ep = 5' stretch oligonucleotide sequence; SS = spacer sequence; AS = annealing sequence; AS-RC = annealing sequence reverse complement.
Figure 7 shows the melting temperature ([Na + ] = 150 mM; [Mg ++ ] = 4 mM) of hairpins in silico (in silico) induced by a 15 nt long complementary sequence located at the end of the ssDNA molecule as a function of molecular length. In silico) a graph of the prediction is shown.
Figure 8 shows the structure of another embodiment according to the invention of tagged oligos with at least three primer amplifications.
9 shows a general scheme for library creation. Figure 9A: Generation of a library from tagged oligos according to the embodiment of Figure 5. Figure 9B: Generation of a library from tagged oligos according to the embodiment of Figure 6A. Figure 9C: Generation of a library from tagged oligos according to the embodiment of Figure 8. Additional captions: 2AH-RC = second amplification handle sequence reverse complement.
Figure 10 depicts the design of the P5-Synth oligos and corresponding library primers disclosed in Example 1.
11 shows a schematic of NGS library generation of oligo P5-Synth using library primers according to Example 1. FIG.
Figure 12 shows a scatter plot of PBMC and SK-BR-3 cells stained with Ab-oligo and a second fluorescent antibody. The x-axis is the fluorescence level of the APC channel, which is proportional to the amounts of Ab-oligo tag1, tag2 and tag4. The y-axis is the fluorescence level of the PE channel, which is proportional to the amount of Ab-oligo tag3.
13 depicts electrophoresis from a library generated from P5-synth tagged oligos from single cells according to Example 1. FIG.
14 depicts the results of protein quantification from single cells treated according to the embodiment of FIG. 8 using tagged oligo amplification after WGA. UMI counts of cytokeratin (Figure 8A), Her2 (Figure 8B), CD45 (Figure 8C) and IgG1 isotype controls (Figure 8D) quantification, respectively. The y-axis is the number of UMIs and the x-axis is the cell type isolated according to FIG. 9 .
15 depicts the results of protein quantification from single cells treated according to the embodiment of FIG. 8 using tagged oligo amplification during WGA. UMI counts of cytokeratin (Figure 8A), Her2 (Figure 8B), CD45 (Figure 8C) and IgG1 isotype controls (Figure 8D) quantification, respectively. The y-axis is the number of UMIs and the x-axis is the cell type isolated according to FIG. 9 .
16 depicts the design of the P5-Lib1 oligos and corresponding library primers disclosed in Example 3.
17 shows a schematic of NGS library generation of P5-Lib1 oligos using library primers.
18 shows an example of a LowPass profile for CNA analysis obtained from single cells. Figure 18A: Single cell CNA profile spiked with P5-Lib1 oligos and treated according to the embodiment of Figure 5. Figure 18B: Single cell CNA profile spiked with P5-Synth oligos and treated according to the embodiment of Figure 8. Figure 18C: Single cell CNA profile in the absence of tagged oligo spikes. All profiles correspond to SK-BR-3 cells with typical gains and losses. Small fluctuations are due to single-cell genome heterogeneity.
19 depicts a graph representing a tagged oligo library obtained from single cells spiked with P5-Synth and P5-Lib1. The x-axis is the expected number of UMIs, and the y-axis is the counted UMIs after sequencing.

정의Justice

달리 정의되지 않는 한, 본 명세서에서 사용된 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 당업자가 일반적으로 이해하는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 다수의 방법 및 재료를 본 발명의 실시 또는 시험에 사용할 수 있지만, 바람직한 방법 및 재료를 하기에 기재한다. 달리 언급되지 않는 한, 본 발명에서 사용하기 위해 본 명세서에 기재된 기술은 당업자에게 공지된 표준 방법론이다.Unless defined otherwise, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Although many methods and materials similar or equivalent to those described herein can be used in the practice or testing of the present invention, the preferred methods and materials are described below. Unless otherwise noted, the techniques described herein for use in the present invention are standard methodologies known to those skilled in the art.

"ab-올리고 혼합물"은 세포의 내부(즉, "내부 ab-올리고 혼합물") 및/또는 외부(즉, "외부 ab-올리고 혼합물") 에피토프 및/또는 이소형 대조군 ab-올리고를 표적화하는 모든 ab-올리고를 함유하는 용액을 의미한다.An “ab-oligo mixture” refers to any cell targeting an internal (ie, an “internal ab-oligo mixture”) and/or external (ie, an “external ab-oligo mixture”) epitope and/or isotype control ab-oligo. solutions containing ab-oligos.

"항체-올리고뉴클레오티드 접합체" 또는 "ab-올리고 접합체" 또는 "ab-올리고"는 항체 분자와 ssDNA 올리고뉴클레오티드 분자의 화학적 접합에 의해 유도되는 합성 분자를 의미한다. 화학적 접합은 통상 공유 방식으로 2개 분자의 연결을 가능하게 하는 특정 화학 반응을 사용하여 수행된다. 항체:올리고뉴클레오티드의 화학량론은 특정 비율을 갖기 위해 제어될 수 있다. WGA 초기 단계에서는, 항체 모이어티가 통상 소화되고, 올리고뉴클레오티드 부분만이 잔류한다. 단순함을 위해, 설명에서, 이들 분자는 여전히 ab-올리고 분자 또는 ab-올리고 앰플리콘으로 지칭될 것이다.“Antibody-oligonucleotide conjugate” or “ab-oligo conjugate” or “ab-oligo” refers to a synthetic molecule derived by chemical conjugation of an antibody molecule with an ssDNA oligonucleotide molecule. Chemical conjugation is usually performed using specific chemical reactions that enable the linkage of two molecules in a covalent manner. The stoichiometry of the antibody:oligonucleotide can be controlled to have a specific ratio. In the early stages of WGA, the antibody moiety is usually digested, leaving only the oligonucleotide portion. For simplicity, in the description, these molecules will still be referred to as ab-oligo molecules or ab-oligo amplicons.

약어 "APC"는 형광단 알로피코시아닌을 의미한다.The abbreviation “APC” refers to the fluorophore allophycocyanin.

"결합제 바코드 서열(BAB)"은 결합제를 식별하는 고유한 DNA 올리고뉴클레오티드 서열을 의미한다."Binder barcode sequence (BAB)" means a unique DNA oligonucleotide sequence that identifies a binder.

"균형 잡힌 PCR 증폭"이란, 복수 표적의 증폭을 수행하는 PCR의 특징을 의미하고, 이에 의해 각 PCR 사이클에서 실질적으로 모든 표적 분자가 증폭된다.By “balanced PCR amplification” is meant the characteristic of PCR in which amplification of multiple targets is performed, whereby substantially all target molecules are amplified in each PCR cycle.

"결합제"는, 지정된 표적 분자, 예를 들면, 단백질 또는 글리코실화 단백질 또는 포스포릴화 단백질에 특이적으로 결합할 수 있는 분자(예컨대, 비제한적 예로서, 항체, 아피바디, 리간드, 앱타머, 합성 결합 단백질, 소분자)를 의미한다.A "binding agent" refers to a molecule capable of specifically binding to a designated target molecule, e.g., a protein or a glycosylated protein or a phosphorylated protein (e.g., by way of non-limiting example, an antibody, affibody, ligand, aptamer, synthetic binding proteins, small molecules).

"CITE-Seq" 또는 "서열분석에 의한 전사체 및 에피토프의 세포 인덱스"는, 단일 세포에서 동시 단백질 정량화 및 mRNA 서열분석을 위한 스토엑키우스 등(Stoeckius et al.)에 의해 개발된 방법을 의미한다."CITE-Seq" or "cellular index of transcripts and epitopes by sequencing" refers to the method developed by Stoeckius et al. for simultaneous protein quantification and mRNA sequencing in single cells. it means.

"CyTOF" 또는 "비행 시간에 의한 세포측정"은 세포측정과 조합하여 질량분석을 사용하여 단일 세포 내의 단백질 정량화를 가능하게 하는 질량 세포측정 기술을 수행하는 장치를 의미한다. 세포는 중금속 동위원소와 결합된 결합제로 염색된다."CyTOF" or "cytometry by time-of-flight" means a device that performs mass cytometry techniques that use mass spectrometry in combination with cytometry to enable quantification of proteins within single cells. Cells are stained with a binder bound to a heavy metal isotope.

용어 "접합체"는 결합제와 태그된 올리고뉴클레오티드의 공유 접합으로부터 수득된 분자를 의미한다.The term “conjugate” refers to a molecule obtained from the covalent conjugation of a tagged oligonucleotide with a binding agent.

"카피 수 변경(CNA)"은 동일한 개별 게놈과 관련하여 일반적으로 정의되는 게놈 영역의 카피 수의 체세포 변화를 의미한다."Copy number alteration (CNA)" refers to a somatic change in the copy number of a genomic region that is generally defined with respect to the same individual genome.

"DNA 라이브러리 정제"란, DNA 라이브러리 재료를, 효소, dNTP, 염 및/또는 목적하는 DNA 라이브러리의 일부가 아닌 기타 분자 등의 원치 않는 반응 성분으로부터 분리하는 프로세스를 의미한다. DNA 라이브러리 정제 프로세스의 예로는 에겐코우트(Agencourt) AMPure, 머크 밀리포어 아미콘(Merck Millipore Amicon) 스핀-컬럼 또는 베크만 코울터(Beckman Coulter) 등의 고상 가역 고정화(SPRI) 비드를 사용한 정제가 있다."DNA library purification" means the process of separating DNA library material from unwanted reaction components, such as enzymes, dNTPs, salts, and/or other molecules that are not part of the desired DNA library. Examples of DNA library purification processes include purification using solid-state reversible immobilization (SPRI) beads, such as Agencourt AMPure, Merck Millipore Amicon spin-columns, or Beckman Coulter. .

"DNA 라이브러리 정량화"란, DNA 라이브러리 재료를 정량화하는 프로세스를 의미한다. DNA 라이브러리 정량화 프로세스의 예는 QuBit 기술, 전기영동 검정(Agilent Bioanalyzer 2100, Perkin Elmer LabChip 기술) 또는 RT-PCR 피코그린(PicoGreen) 시스템(Kapa Biosystems)을 사용한 정량화가 있다."DNA library quantification" means the process of quantifying DNA library material. Examples of DNA library quantification processes include quantification using QuBit technology, electrophoretic assays (Agilent Bioanalyzer 2100, Perkin Elmer LabChip technology) or RT-PCR PicoGreen systems (Kapa Biosystems).

"동적 범위"란, 특정 양이 가정할 수 있는 최대치와 최소치 사이의 비율을 의미한다."Dynamic range" means the ratio between the maximum and minimum values that a particular quantity can assume.

"라이브러리 프라이머"는 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열화 가능한 라이브러리를 생성하기 위해 프라이머로서 작용하는 ssDNA 분자를 의미한다."Library primer" means an ssDNA molecule that acts as a primer to generate a library capable of massively parallel sequencing from tagged oligonucleotides.

"로우-패스 전체 게놈 서열분석" 또는 "로우패스 서열분석"은 1 미만의 평균 서열분석 심도에서 전체 게놈 서열분석을 의미한다."Low-pass whole genome sequencing" or "low-pass sequencing" means whole genome sequencing at an average sequencing depth of less than one.

"대규모 병렬 서열분석(massive-parallel sequencing)" 또는 "차세대 서열분석(next generation sequencing, NGS)"은 공간적 및/또는 시간적으로 분리된, 클론적으로 서열분석된(사전 클론 증폭의 존재 또는 부재하에) DNA 분자 라이브러리의 생성을 포함하는 DNA 서열분석 방법을 의미한다. 이의 예로는 일루미나(Illumina) 플랫폼(Illumina Inc), 이온토렌트(IonTorrent) 플랫폼(ThermoFisher Scientific Inc), 퍼시픽 바이오사이언시스(Pacific Biosciences) 플랫폼, MinIon(Oxford Nanopore Technologies Ltd)이 포함된다.“Massive-parallel sequencing” or “next generation sequencing (NGS)” refers to spatially and/or temporally separated, clonally sequenced (with or without pre-clonal amplification). ) refers to a DNA sequencing method comprising the generation of a library of DNA molecules. Examples thereof include the Illumina platform (Illumina Inc), the IonTorrent platform (ThermoFisher Scientific Inc), the Pacific Biosciences platform, and the MinIon (Oxford Nanopore Technologies Ltd).

"복수의 어닐링 및 루핑 기반 증폭 사이클(Multiple Annealing and Looping Based Amplification Cycles; MALBAC)"은 준선형 전체 게놈 증폭 방법을 의미한다[참조: Zong et al., 2012, Genome-wide detection of single-nucleotide and copy-number variations of a single human cell, Science. Dec 21;338(6114):1622-6. doi: 10.1126/science.1229164.]. MALBAC 프라이머는 주형과 하이브리드화하는 8개의 뉴클레오티드 3' 랜덤 서열과 27개의 뉴클레오티드 5' 공통 서열(GTG AGT GAT GGT TGA GGT AGT GTG GAG)을 갖고 있다. 제1 신장 후, 세미앰플리콘은 또 다른 신장을 위한 주형으로서 사용되고, 이는 상보적 5' 및 3' 말단을 갖는 전체 앰플리콘을 생성한다. 준선형 증폭의 몇 사이클 후에, 전체 앰플리콘은 후속 PCR 사이클로 기하급수적으로 증폭될 수 있다."Multiple Annealing and Looping Based Amplification Cycles (MALBAC)" refers to a quasi-linear whole genome amplification method [Zong et al., 2012, Genome-wide detection of single-nucleotide and copy-number variations of a single human cell, Science. Dec 21;338(6114):1622-6. doi: 10.1126/science.1229164.]. The MALBAC primer has an 8 nucleotide 3' random sequence that hybridizes with the template and a 27 nucleotide 5' consensus sequence (GTG AGT GAT GGT TGA GGT AGT GTG GAG). After the first extension, the semi-amplicon is used as a template for another extension, which creates a whole amplicon with complementary 5' and 3' ends. After several cycles of quasi-linear amplification, the entire amplicon can be amplified exponentially with subsequent PCR cycles.

용어 "올리고뉴클레오티드" 또는 "올리고"는, 비제한적 예로서, 데옥시리보핵산(DNA), 리보핵산(RNA), 잠금 핵산(LNA), 펩티드 핵산(PNA) 등의 뉴클레오티드 서열을 포함하는 올리고머 분자를 의미한다.The term “oligonucleotide” or “oligo” refers to, by way of non-limiting example, an oligomeric molecule comprising a nucleotide sequence such as deoxyribonucleic acid (DNA), ribonucleic acid (RNA), locked nucleic acid (LNA), peptide nucleic acid (PNA), and the like. means

"태그된 올리고뉴클레오티드" 또는 "태그된 올리고"는 결합제(예: 1차 항체)에 직접 접합된 올리고뉴클레오티드 분자(예: ssDNA 분자)를 의미한다. 태그된 올리고는 결합제의 리간드인 표적 분자(예: 단백질)의 간접적 정량화에 사용된다."Tagged oligonucleotide" or "tagged oligo" refers to an oligonucleotide molecule (eg, an ssDNA molecule) conjugated directly to a binding agent (eg, a primary antibody). Tagged oligos are used for indirect quantification of target molecules (eg proteins) that are ligands of binding agents.

약어 "PE"는 형광단 피코에리트린을 의미한다.The abbreviation “PE” refers to the fluorophore phycoerythrin.

"PFA 2%"는 인산염 완충 생리식염수 중의 2% w/v의 파라포름알데히드 용액을 의미한다."PFA 2%" means a 2% w/v paraformaldehyde solution in phosphate buffered saline.

"1차 WGA DNA 라이브러리(pWGAlib)"는 WGA 반응으로부터 수득된 DNA 라이브러리를 의미한다."Primary WGA DNA library (pWGAlib)" means a DNA library obtained from a WGA reaction.

용어 "재증폭" 또는 "re-amp"는 1차 WGA DNA 라이브러리의 전체 또는 상당 부분이 추가로 증폭되는 PCR 반응을 의미한다.The term “reamplification” or “re-amp” refers to a PCR reaction in which all or a substantial portion of a primary WGA DNA library is further amplified.

"잔기"는 단백질의 폴리펩티드 쇄에 존재하는 아미노산 잔기를 의미한다."Residue" means an amino acid residue present in a polypeptide chain of a protein.

"바코드의 서열분석"이란, 1개의 서열분석기 판독 내에서 서열분석될 때, 해당 판독을 해당 바코드와 관련된 특정 샘플에 할당하는 것을 가능하게 하는 폴리뉴클레오티드 서열을 의미한다."Sequencing of a barcode" means a polynucleotide sequence that, when sequenced within one sequencer read, makes it possible to assign that read to a specific sample associated with that barcode.

"UMI" 또는 "고유 분자 식별자 서열"은 각 ssDNA 또는 dsDNA 분자에 대해 실질적으로 고유한 축퇴성(degenerate) 또는 부분-축퇴성(즉, 랜덤 또는 세미랜덤) 올리고뉴클레오티드 서열을 의미한다."UMI" or "unique molecular identifier sequence" means a degenerate or partially-degenerate (ie, random or semi-random) oligonucleotide sequence that is substantially unique for each ssDNA or dsDNA molecule.

"범용 WGA-프라이머" 또는 "WGA PCR 프라이머"는 제한 효소의 작용에 의해 생성된 각 단편에 연결되는 추가 올리고뉴클레오티드를 의미한다. 범용 WGA 프라이머는 Ampli1™ WGA 등의 DRS-WGA에 사용된다."Universal WGA-primer" or "WGA PCR primer" means an additional oligonucleotide linked to each fragment produced by the action of a restriction enzyme. Universal WGA primers are used for DRS-WGAs such as Ampli1™ WGA.

발명의 상세한 설명DETAILED DESCRIPTION OF THE INVENTION

본 발명에 따른 게놈 DNA 및 표적 분자를 포함하는 생물학적 샘플에서 전체 게놈 증폭 및 복수 표적 분자의 분석 방법은 하기의 단계를 포함한다.The method for amplifying whole genomes and analyzing multiple target molecules in a biological sample including genomic DNA and target molecules according to the present invention includes the following steps.

단계 a)에서, 생물학적 샘플이 제공된다. 생물학적 샘플은 바람직하게는 단일 세포이지만, 몇몇 세포를 포함하는 샘플일 수도 있다.In step a), a biological sample is provided. The biological sample is preferably a single cell, but may also be a sample comprising several cells.

단계 b)에서, 생물학적 샘플은 태그된 올리고뉴클레오티드와 접합된 적어도 하나 이상의 표적 분자에 대해 지시되는 적어도 하나의 결합제와 접촉하고, 그 결과, 생물학적 샘플에 적어도 하나의 표적 분자가 존재하는 경우, 적어도 하나의 결합제는 적어도 하나의 표적 분자에 결합한다.In step b), the biological sample is contacted with at least one binding agent directed to at least one target molecule conjugated with the tagged oligonucleotide, as a result of which at least one target molecule is present in the biological sample, at least one of the binding agent binds to at least one target molecule.

결합제는 바람직하게는 항체 또는 이의 단편, 앱타머, 소분자, 펩티드 및 단백질로 이루어진 그룹으로부터 선택된다. 표적 분자는 바람직하게는 단백질, 펩티드, 당단백질, 탄수화물, 지질 및 이들의 조합으로 이루어진 그룹으로부터 선택된다. 보다 바람직하게는, 결합제는 항체이다. 결합제는 모노클로날 항체 또는 효소 기질 등의 특정 화학량론 또는 폴리클로날 항체 또는 소분자 등의 불특정 화학량론으로 표적 분자에 결합한다. 전자는, 후자와 관련하여 표적의 보다 양호한 정량화를 가능하게 한다. 결합제는 공유 결합 상호작용 또는 비-공유 상호작용을 통해 태그된 올리고에 화학적으로 접합한다. 전자의 경우, 올리고와 결합제 둘 다는 상호 결합을 가능하게 하는 반응성 모이어티를 갖고 있다. 결합제:올리고 화학량론은 접합 절차 중에 제어될 수 있다.The binding agent is preferably selected from the group consisting of antibodies or fragments thereof, aptamers, small molecules, peptides and proteins. The target molecule is preferably selected from the group consisting of proteins, peptides, glycoproteins, carbohydrates, lipids and combinations thereof. More preferably, the binding agent is an antibody. A binding agent binds to a target molecule with a specific stoichiometry, such as a monoclonal antibody or enzyme substrate, or a non-specific stoichiometry, such as a polyclonal antibody or small molecule. The former enables better quantification of the target in relation to the latter. The binding agent chemically conjugates to the tagged oligo through covalent or non-covalent interactions. In the former case, both the oligo and the binder have reactive moieties that allow them to bond to each other. Binder:oligo stoichiometry can be controlled during the conjugation procedure.

결합제/표적 분자의 예의 비제한적 목록이 하기 표 1에 보고되어 있다.A non-limiting list of examples of binding agents/target molecules is reported in Table 1 below.

결합제(들)binder(s) 표적 분자(들)target molecule(s) 항체 또는 나노바디 또는 Fab 등의 항체의 단편Antibodies or Nanobodies or fragments of antibodies such as Fab 항원, 포스포-단백질(pAKT) 등의 번역후 변형된 단백질, 또는 아세틸화 단백질(예: 히스톤)Antigens, post-translationally modified proteins such as phospho-proteins (pAKT), or acetylated proteins (such as histones) 앱타머aptamer 항원antigen 소분자 약물small molecule drugs 세포 표면 수용체, 채널cell surface receptors, channels 펩티드peptide 단백질, 효소protein, enzyme 단백질protein 단백질, DNA, RNAProtein, DNA, RNA

태그된 올리고뉴클레오티드로서 사용되는 올리고뉴클레오티드는 바람직하게는 5' 또는 3' 말단에 화학적 변형을 갖는 ssDNA 또는 dsDNA 분자이다. 이 변형은 상대 결합제와의 공유 접합에 사용된다.Oligonucleotides used as tagged oligonucleotides are preferably ssDNA or dsDNA molecules with chemical modifications at the 5' or 3' ends. This modification is used for covalent conjugation with counterpart binders.

결합제와 접합된 태그된 올리고에 의해 형성된 접합체는 세포외 에피토프 및 세포내 에피토프 모두를 표적화할 수 있다. "외부" 및 "내부" 접합체는 최종 염색 농도에서 접합체를 포함하는 2개의 개별 혼합물로서 생물학적 샘플에 적용될 수 있다. 첫째, 외부 혼합물을 적용하여 외부 에피토프를 표지한다. 둘째, 세제 또는 유사한 수단을 사용하여 세포를 투과처리하고, 내부 혼합물을 샘플에 적용하여 내부 에피토프를 표지한다. 또는, 외부 접합체 및 내부 접합체를 함께 혼합하여 원-스텝 염색을 수행할 수도 있다. 최종 염색 농도는 각 결합제에 따라 상이하고, 실험적으로 결정해야 한다.Conjugates formed by tagged oligos conjugated with a binding agent can target both extracellular and intracellular epitopes. An “external” and an “internal” conjugate can be applied to a biological sample as two separate mixtures comprising the conjugate at the final staining concentration. First, an exogenous mixture is applied to label extrinsic epitopes. Second, cells are permeabilized using detergent or similar means, and the internal mixture is applied to the sample to label internal epitopes. Alternatively, one-step staining may be performed by mixing the external conjugate and the internal conjugate together. The final dyeing concentration is different for each binder and must be determined experimentally.

태그된 올리고 서열은 결합제와의 접합을 용이하게 하고 비용을 절감하기 위해 바람직하게는 300개 염기보다 짧고, 더욱 바람직하게는 120개 염기보다 짧다. 바람직한 실시양태에서, 태그된 올리고 서열은 60 내지 80개 뉴클레오티드이다. The tagged oligo sequence is preferably shorter than 300 bases, more preferably shorter than 120 bases to facilitate conjugation with the binder and to reduce cost. In a preferred embodiment, the tagged oligo sequence is between 60 and 80 nucleotides.

도 1A를 참조하면, 태그된 올리고뉴클레오티드는 하기를 포함한다:Referring to Figure 1A, the tagged oligonucleotides include:

i) 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는 핵산의 페이로드 서열(PL), 및i) a payload sequence (PL) of a nucleic acid comprising a binder barcode sequence (BAB) and a unique molecular identifier sequence (UMI), and

ii) 핵산의 적어도 하나의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS).ii) at least one first tagged oligonucleotide amplification sequence of the nucleic acid (5-TOS).

페이로드 서열에는 표적 계수에 필요한 정보가 함유되어 있다.The payload sequence contains the information necessary for target counting.

고유 분자 식별자 서열(UMI)은 바람직하게는 10 내지 30개 뉴클레오티드 범위의 축퇴성 또는 반-축퇴성 서열이다. 바람직하게는, UMI는 적어도 10개 염기의 길이를 갖고, 이론상의 410=1,048,576개의 상이한 조합에 상응하며, 이는 대부분의 표적 분자에 충분하다. 매우 풍부한 표적 분자의 경우, 더 긴 UMI를 사용하여, 12개 염기 등의 가능한 조합을 증가시킬 수 있다. 반-축퇴성 염기를 사용하면, 가능한 조합이 감소하고, UMI 길이가 바람직하게는 최대 20개 또는 30개 염기까지 증가한다. 반-축퇴성 UMI는, 존재하는 별개의 UMI의 과대평가를 방지하는 서열을 재정렬시키기 위해 판독에 사용될 수 있는 참조 포인트를 도입하는 데 유리하게 사용될 수 있다. UMI 서열은 BAB의 5' 또는 3'의 어느 하나에 위치할 수 있다. UMI 서열은, 최초로 서열분석된 염기의 복잡성을 증가시키기 위해, 판독 1 서열분석 프라이머 어닐링 부위의 직후에 우선적으로 위치시킨다. 이는 일루미나(Illumina) 서열분석 플랫폼에 유리하고, 이는 최초 서열분석 단계에서 클러스터 식별에 높은 복잡성이 필요하기 때문이다. BAB는 각 접합체 분자에 대해 고정된 서열이다. BAB는 호모폴리머, 헤어핀 및/또는 헤테로이중쇄 형성 등의 1차 PCR 증폭 및 서열분석 단계를 방해할 수 있는 기능을 회피하기 위해 설계되었고[참조: Frank, D. N., 2009, BARCRAWL and BARTAB: software tools for the design and implementation of barcoded primers for highly multiplexed DNA sequencing. BMC Bioinformatics, 10, 362. http://doi.org/10.1186/1471-2105-10-362], 이들의 상대적 해밍(Hamming) 거리를 최대화하기 위해, 정의된 길이의 모든 가능한 BAB 서열 풀로부터 선택되고, 따라서 PCR 또는 서열분석 오류가 서열분석된 판독의 잘못된 할당을 유도할 가능성을 최소화한다. BAB 길이는 검출할 표적 분자의 수에 기초하여 선택해야 한다. 바람직하게는, BAB는 적어도 10개의 뉴클레오티드 길이를 갖고, 이론상 410=1,048,576개의 상이한 조합에 상응하며, 이는 GC 함량(예: [30%..70%]), 호모폴리머의 부재, 헤어핀의 부재 및 최소 해밍 거리(바람직하게는 ≥3 nt)에 필터를 적용한 후에 약 2000개의 가능한 BAB 서열로 감소된다.The unique molecular identifier sequence (UMI) is preferably a degenerate or semi-degenerate sequence in the range of 10 to 30 nucleotides. Preferably, the UMI is at least 10 bases in length and corresponds to 4 10 =1,048,576 different combinations in theory, which is sufficient for most target molecules. For highly abundant target molecules, longer UMIs can be used to increase the possible combinations of 12 bases, etc. The use of semi-degenerate bases reduces the possible combinations and increases the UMI length, preferably up to a maximum of 20 or 30 bases. Semi-degenerate UMIs can be advantageously used to introduce reference points that can be used for readouts to realign sequences that prevent overestimation of existing distinct UMIs. The UMI sequence may be located either 5' or 3' of the BAB. The UMI sequence is preferentially placed immediately after the read 1 sequencing primer annealing site to increase the complexity of the first sequenced base. This is advantageous for the Illumina sequencing platform, as it requires high complexity for cluster identification in the initial sequencing step. BAB is a fixed sequence for each conjugate molecule. BAB was designed to circumvent functions that might interfere with primary PCR amplification and sequencing steps such as homopolymer, hairpin and/or heteroduplex formation [Frank, DN, 2009, BARCRAWL and BARTAB: software tools for the design and implementation of barcoded primers for highly multiplexed DNA sequencing. BMC Bioinformatics, 10, 362. http://doi.org/10.1186/1471-2105-10-362], selected from a pool of all possible BAB sequences of a defined length to maximize their relative Hamming distance. thus minimizing the possibility that PCR or sequencing errors will lead to misallocation of sequenced reads. The BAB length should be selected based on the number of target molecules to be detected. Preferably, the BAB is at least 10 nucleotides in length, corresponding in theory 4 10 =1,048,576 different combinations, which corresponds to the GC content (eg [30%..70%]), the absence of homopolymers, the absence of hairpins. and about 2000 possible BAB sequences after applying the filter to the minimum Hamming distance (preferably ≧3 nt).

제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS)은 태그된 올리고의 5'에 위치한다. 이 서열은 태그된 올리고 증폭 및 후속 라이브러리 생성에 필요하다. 태그된 올리고 증폭은, 적절한 UMI 계수를 방해할 수 있는 샘플의 처리 중에 분자 손실로 인한 임의의 바이어스를 회피하기 위해 필요하다.The first tagged oligonucleotide amplification sequence (5-TOS) is located 5' of the tagged oligo. This sequence is required for tagged oligo amplification and subsequent library generation. Tagged oligo amplification is necessary to avoid any bias due to molecular loss during processing of the sample that could interfere with proper UMI counts.

도 1B를 참조하면, 표적 올리고뉴클레오티드는 바람직하게는 적어도 하나의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)을 추가로 포함한다. 이 서열은 태그된 올리고의 3'에 위치한다. 이 서열은 태그된 올리고 증폭 및 후속 라이브러리 생성에 필요하다. 태그된 올리고 증폭은, 적절한 UMI 계수를 방해할 수 있는 샘플의 처리 중에 분자 손실로 인한 임의의 바이어스를 회피하기 위해 필요하다.1B , the target oligonucleotide preferably further comprises at least one second tagged oligonucleotide amplification sequence (3-TOS). This sequence is located 3' of the tagged oligo. This sequence is required for tagged oligo amplification and subsequent library generation. Tagged oligo amplification is necessary to avoid any bias due to molecular loss during processing of the sample that could interfere with proper UMI counts.

바람직한 실시양태에서, 5-TOS 및 3-TOS 서열은 태그된 올리고 증폭을 방해할 수 있기 때문에, 증폭 온도 범위 내에서 헤어핀 및 이의 기타 분자내 안정한 2차 구조의 형성을 회피하도록 설계된다. 도 2는 2개의 상이한 태그된 올리고로부터의 태그된 올리고뉴클레오티드 라이브러리를 나타내는 그래프를 도시하고, 1개는 상이한 온도에서 5-TOS와 3-TOS 사이에서 분자내 헤어핀이 형성되기 쉬운 경향이 있다("헤어핀 존재": Tm = 67℃, 서열번호 50, ΔG = -11.15 kcal/mol; "헤어핀 부재": Tm = 45℃, 서열번호 51, ΔG = -1.52 kcal/mol). x축은 예측 UMI 계수이고, y축은 서열분석 후에 계수된 UMI이다.In a preferred embodiment, the 5-TOS and 3-TOS sequences are designed to avoid the formation of stable secondary structures in hairpins and other intramolecular thereof within the amplification temperature range, as they may interfere with tagged oligo amplification. 2 depicts a graph showing a library of tagged oligonucleotides from two different tagged oligos, one prone to intramolecular hairpin formation between 5-TOS and 3-TOS at different temperatures (" "With hairpin": Tm = 67° C., SEQ ID NO: 50, AG = -11.15 kcal/mol; "Without hairpin": Tm = 45° C., SEQ ID NO: 51, AG = -1.52 kcal/mol). The x-axis is the predicted UMI coefficients, and the y-axis is the UMI counted after sequencing.

태그된 올리고 및 이들의 증폭 프라이머는 고감도, 광범위한 동적 범위, 균형 잡힌 PCR 증폭 및 재현성을 달성하도록 최적화되었다.Tagged oligos and their amplification primers were optimized to achieve high sensitivity, wide dynamic range, balanced PCR amplification and reproducibility.

본 발명의 바람직한 실시양태에서, UMI 서열 길이는 0 내지 약 106 분자 범위의 표적을 정량화하기 위해 선택되었다(n = 10).In a preferred embodiment of the invention, the UMI sequence length was chosen to quantify a target ranging from 0 to about 10 6 molecules (n=10).

동적 범위는 4차수(102로부터 106 분자)에 걸친 농도를 갖는 태그된 올리고의 증폭에 의해 특성화되었다. 도 3은 27회의 PCR 사이클에 의한 상이한 양의 올리고 혼합물의 증폭을 나타내는 그래프를 도시한다. 각각의 희석은 3회의 독립된 희석 복제로부터 수행되었다. x축은 관찰될 것으로 예상되는 개별 UMI의 수이고, y축은 실험적으로 관찰된 UMI이다. 관찰된 UMI와 증폭 전의 예측된 UMI 사이의 분자 수 102 내지 106 범위에서 매우 선형의 상관관계가 관찰될 수 있다.The dynamic range was characterized by amplification of tagged oligos with concentrations spanning four orders of magnitude (10 2 to 10 6 molecules). 3 shows a graph showing the amplification of different amounts of oligo mixtures by 27 PCR cycles. Each dilution was performed from three independent dilution replicates. The x-axis is the number of individual UMIs expected to be observed, and the y-axis is the experimentally observed UMIs. A very linear correlation can be observed in the number of molecules ranging from 10 2 to 10 6 between the observed UMI and the predicted UMI before amplification.

균형 잡힌 PCR 증폭은 동일한 개시 샘플에서 상이한 증폭 사이클을 수행하여 특성화되었다. 도 4A 및 4b에 도시된 바와 같이, 상이한 수의 합계 PCR 사이클 수(각각 23 및 27 PCR 사이클)로 태그된 올리고의 동일한 풀을 증폭해도, 관찰된 UMI의 차이는 발생하지 않았고, 이는 PCR 사이클의 수가 UMI 계수에 영향을 미치지 않는 것을 나타낸다.Balanced PCR amplification was characterized by performing different amplification cycles on the same starting sample. As shown in Figures 4A and 4B, amplifying the same pool of tagged oligos with different numbers of total PCR cycles (23 and 27 PCR cycles, respectively) did not result in any observed differences in UMI, which indicates that the number does not affect the UMI coefficient.

감도는 상이한 양(40개 분자까지)의 태그된 올리고 풀의 증폭에 의해 특성화되었다. 도 4C에 도시된 바와 같이, 태그된 올리고 분자를 102개까지 정량화할 수 있다. 연속 희석 용액 실험은, 용적 내의 분자의 분포가 매우 불균일하기 때문에, 샘플링 바이어스가 발생하기 쉽고, 이는 매우 희석된 용액과 특히 관련이 있다는 점에 유의해야 한다. 따라서, 관찰된 정량화 한계는 검정의 한계보다는 실험 설정과 관련된 과소평가일 수 있다.Sensitivity was characterized by amplification of different amounts (up to 40 molecules) of tagged oligo pools. As shown in Figure 4C, up to 10 2 tagged oligo molecules can be quantified. It should be noted that serial dilution solution experiments are prone to sampling bias because the distribution of molecules within the volume is very non-uniform, which is particularly relevant for highly dilute solutions. Thus, the observed limit of quantification may be an underestimation related to the experimental setup rather than the limit of the assay.

본 발명에 따른 방법의 단계 c)에서, 분리 단계를 수행하여 비결합된 결합제를 선택적으로 제거하고, 이렇게 하여, 표지된 생물학적 샘플을 수득한다. 분리 단계는 통상 적절한 완충 용액으로 세척하고, 원심분리에 의해 표지된 생물학적 샘플을 수집함으로써 수행된다.In step c) of the method according to the invention, a separation step is carried out to selectively remove unbound binder, in this way to obtain a labeled biological sample. The separation step is usually performed by washing with an appropriate buffer solution and collecting the labeled biological sample by centrifugation.

단계 d)에서, 상기 게놈 DNA의 전체 게놈 증폭 및 적어도 하나의 결합제와 접합된 태그된 올리고뉴클레오티드의 증폭은 표지된 생물학적 샘플 상에서 동시에 수행된다. 게놈 DNA의 전체 게놈 증폭은 결정론적 제한 부위 전체 게놈 증폭(DRS-WGA) 또는 복수의 어닐링 및 루프 기반 증폭 사이클 전체 게놈 증폭(MALBAC)의 어느 하나에 의해 수행된다.In step d), the whole genome amplification of said genomic DNA and amplification of the tagged oligonucleotide conjugated with at least one binding agent are performed simultaneously on the labeled biological sample. Whole genome amplification of genomic DNA is performed either by deterministic restriction site whole genome amplification (DRS-WGA) or by multiple annealing and loop based amplification cycle whole genome amplification (MALBAC).

단계 e)에서, 증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리가 작성된다.In step e), a large-scale parallel sequencing library is constructed from the amplified tagged oligonucleotides.

단계 f)에서, 대규모 병렬 서열분석 라이브러리가 서열분석된다.In step f), a massively parallel sequencing library is sequenced.

단계 g)에서, 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)의 서열이 각 서열분석 판독(sequencing read)으로부터 검색된다.In step g), the sequences of the binder barcode sequence (BAB) and the unique molecular identifier sequence (UMI) are retrieved from each sequencing read.

단계 h)에서, 상이한 고유 분자 식별자 서열(UMI)의 수가 각 결합제에 대해 계수된다.In step h), the number of different unique molecular identifier sequences (UMIs) is counted for each binding agent.

단계 e), f), g) 및 h)는 상세한 설명의 후반에서 특정 실시양태를 참조하여 더 상세히 개시될 것이다.Steps e), f), g) and h) will be disclosed in more detail with reference to specific embodiments later in the detailed description.

상기 개시된 방법은 바람직하게는 생물학적 샘플로부터 단일 세포를 단리하는 단계를 추가로 포함한다. 단리는 세포를 선별함으로써, 특히, 예를 들면, DEPArray® NxT(Menarini Silicon Biosystems S.p.A.) 등의 세포 선별기를 사용하거나, 또는 대안으로서 세포를 액적으로 분할함으로써 수행할 수 있다. 단리 단계는 바람직하게는 단계 c) 이후 및 단계 d) 이전에 수행된다.The disclosed method preferably further comprises isolating a single cell from the biological sample. Isolation can be carried out by selecting the cells, in particular, using a cell sorter such as, for example, DEPArray ® Menarini Silicon Biosystems SpA (DEPArray ® NxT), or alternatively by dividing the cells into droplets. The isolation step is preferably carried out after step c) and before step d).

상기 개시된 방법은 바람직하게는 단계 f) 전에 대규모 병렬 서열분석 라이브러리를 정제하는 단계를 포함한다.The disclosed method preferably comprises the step of purifying the massively parallel sequencing library before step f).

보다 구체적인 용어로서, 그러나 본 설명의 범위를 제한하려는 의도는 없이, Ampli1 단백질(A1-P)로도 지정된 상기 개시된 방법에 의해, 단백질의 정량화 및 단일 세포의 전체 게놈 유전적 특성화가 가능해진다. 단일 세포에서 단일 또는 복수의 단백질 정량화는 태그된 올리고뉴클레오티드와 접합된 결합제(특히, 항체(Ab))의 패널을 사용하여 달성된다. 이러한 올리고뉴클레오티드는 DNA 바코드 서열을 통해 접합된 항체를 명확하게 식별하고, 랜덤 또는 부분 축퇴성 서열, 즉 에피토프 정량화에 사용되는 고유 분자 식별자(Unique Molecular Identifiers; UMI)를 통해 목적 에피토프의 존재량을 정량화하도록 설계되었다. 생물학적 샘플은 각각 고유 DNA 바코드 서열을 갖는 하나 이상의 Ab-올리고 접합체로 표지된다. 이어서, 단일 세포 또는 세포 풀을 상이한 수단(예: DEPArray™ NxT 시스템)으로 단리할 수 있고, 이들의 게놈 내용물을 전체 게놈 증폭(예: Ampli1™ Whole-Genome-Amplification 키트)에 의해 증폭시킬 수 있다. 후자의 단계 또는 직후에, 태그된 올리고뉴클레오티드는 NGS 라이브러리 제조 절차 중의 다운샘플링을 회피하기 위해 사전 증폭시킨다. 특정 프라이머, 즉 "라이브러리 프라이머"는 서열분석의 준비가 된 NGS(Illumina) 라이브러리를 생성하기 위해 사용된다. 태그된 올리고뉴클레오티드는 Ampli1™ WGA(A1-WGA) 워크플로와 호환성이 있도록 설계되어, A1-P를 사용한 단백질 정량화와 병행하여 단일 세포 유전자 분석(예: Ampli1™ LowPass)을 가능하게 한다.In more specific terms, but without intending to limit the scope of this description, the method disclosed above, also designated Ampli1 protein (A1-P), allows for quantification of the protein and whole genome genetic characterization of single cells. Quantification of single or multiple proteins in a single cell is achieved using a panel of binding agents (particularly antibodies (Abs)) conjugated with tagged oligonucleotides. These oligonucleotides unambiguously identify conjugated antibodies via DNA barcode sequences and quantify the abundance of desired epitopes via random or partially degenerate sequences, i.e., Unique Molecular Identifiers (UMI) used for epitope quantification. designed to do Biological samples are labeled with one or more Ab-oligo conjugates, each having a unique DNA barcode sequence. Single cells or pools of cells can then be isolated by different means (e.g., the DEPArray™ NxT system) and their genomic contents can be amplified by whole genome amplification (e.g., Ampli1™ Whole-Genome-Amplification Kit). . At or immediately after the latter step, the tagged oligonucleotides are pre-amplified to avoid downsampling during the NGS library preparation procedure. Specific primers, i.e. “library primers,” are used to generate NGS (Illumina) libraries ready for sequencing. Tagged oligonucleotides are designed to be compatible with the Ampli1™ WGA (A1-WGA) workflow, enabling single-cell genetic analysis (eg Ampli1™ LowPass) in parallel with protein quantification using A1-P.

하기에서, 본 발명의 3개의 특정 실시양태가 개시되고, 이들은 각각 태그된 올리고 증폭 및 전체 게놈 증폭을 위해 상이한 수의 프라이머를 사용한다.In the following, three specific embodiments of the present invention are disclosed, each using a different number of primers for tagged oligo amplification and whole genome amplification.

제1의 바람직한 실시양태에서 및 도 5를 참조하면, 태그된 올리고뉴클레오티드는 5'으로부터 3'으로 적어도In a first preferred embodiment and with reference to FIG. 5 , the tagged oligonucleotide is at least 5′ to 3′

a) 5' 전체 게놈 증폭 핸들 서열(5-WGAH) 및 제1 증폭 핸들 서열(1AH)을 차례로 포함하는, 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);a) a first tagged oligonucleotide amplification sequence of a nucleic acid (5-TOS) comprising, in turn, a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);

b) 페이로드 서열(PL);b) payload sequence (PL);

c) 핵산의 제2 증폭 핸들 서열(2AH) 및 3' 전체 게놈 증폭 핸들 서열(3-WGAH)을 차례로 포함하는, 핵산의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)c) a second tagged oligonucleotide amplification sequence of a nucleic acid (3-TOS) comprising, in turn, a second amplification handle sequence of the nucleic acid (2AH) and a 3' whole genome amplification handle sequence (3-WGAH)

을 포함한다.includes

3-WGAH는 5-WGAH의 역상보적 서열이고, 전체 게놈 증폭 중에 gDNA 및 태그된 올리고뉴클레오티드의 동시 증폭을 가능하게 한다. 1AH 및 2AH는 각각 페이로드 서열의 5' 및 3' 말단에 위치하고, 후속 라이브러리 생성에 사용된다. 1AH 및 2AH는 바람직하게는 태그된 올리고 증폭을 억제할 수 있는 헤어핀 등의 안정한 분자내 2차 구조를 회피하도록 설계되어 있다. 전술한 각 서열 사이에는 고정 서열이 존재할 수 있다.3-WGAH is the reverse complementary sequence of 5-WGAH, allowing simultaneous amplification of gDNA and tagged oligonucleotides during whole genome amplification. 1AH and 2AH are located at the 5' and 3' ends of the payload sequence, respectively, and are used for subsequent library generation. 1AH and 2AH are preferably designed to avoid stable intramolecular secondary structures such as hairpins that can inhibit tagged oligo amplification. A fixed sequence may exist between each of the above-described sequences.

전체 게놈 증폭 및 태그된 올리고의 증폭은 바람직하게는 단일 프라이머(single primer)를 사용하여 수행된다.Whole genome amplification and amplification of tagged oligos are preferably performed using a single primer.

제2의 바람직한 실시양태에서 및 도 6A 및 6B를 참조하면, 태그된 올리고뉴클레오티드는 5'으로부터 3'으로 적어도 In a second preferred embodiment and with reference to FIGS. 6A and 6B , the tagged oligonucleotide is at least 5′ to 3′

a) 5' 전체 게놈 증폭 핸들 서열(5-WGAH) 및 제1 증폭 핸들 서열(1AH)을 차례로 포함하는, 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);a) a first tagged oligonucleotide amplification sequence of a nucleic acid (5-TOS) comprising, in turn, a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);

b) 페이로드 서열(PL);b) payload sequence (PL);

c) 임의로, 어닐링 서열(AS)c) optionally an annealing sequence (AS)

을 포함한다.includes

적어도 하나의 프라이머가 전체 게놈 증폭 및 태그된 올리고뉴클레오티드의 증폭에 사용되고, 적어도 하나의 올리고뉴클레오티드(E-p)가 태그된 올리고뉴클레오티드의 신장에 사용되고, 상기 적어도 하나의 올리고뉴클레오티드(E-p)는 5'으로부터 3'으로 적어도At least one primer is used for whole genome amplification and amplification of the tagged oligonucleotide, at least one oligonucleotide (E-p) is used for extension of the tagged oligonucleotide, and wherein said at least one oligonucleotide (E-p) is 3 ' at least

d) 5' 전체 게놈 증폭 핸들 서열(5-WGAH);d) 5' whole genome amplification handle sequence (5-WGAH);

e) 스페이서 서열(SS);e) a spacer sequence (SS);

f) 제2 증폭 핸들 서열(2AH); 및f) a second amplification handle sequence (2AH); and

g) 어닐링 서열(AS-RC)에 대해 역상보적인 서열 또는 결합제 바코드 서열(BAB-RC)에 대해 역상보적인 서열g) a sequence that is reverse complementary to the annealing sequence (AS-RC) or reverse complementary to the binder barcode sequence (BAB-RC)

을 포함한다.includes

달리 말하면, 태그된 올리고의 증폭은 E-p의 3' 말단에 위치한 어닐링 서열 역상보체(AS-RC)를 사용하여 태그된 올리고의 3'에 위치한 AS에 E-p를 어닐링함으로써 발생하고(도 6A), 따라서 반응 내에서 태그된 올리고와 E-p 모두의 3' 신장을 유발하고, WGA-프라이머 증폭 가능한 분자를 차례로 생성한다. 또는, 도 6B에 도시된 바와 같이, AS는 BAB 서열과 일치할 수 있고, E-p는 BAB 역상보 서열(BAB-RC)을 통해 BAB 서열에 어닐링할 수 있다. 제1 옵션(AS에 대한 어닐링)은 단일 E-p를 임의의 BAB와 함께 사용할 수 있다는 이점이 있고, 따라서 제조 비용과 프로토콜 복잡성을 경감시킬 수 있다. 제2 옵션(BAB에 대한 어닐링)은 존재량에 차이가 큰 표적으로부터 유래하는 신호를 정규화하기 위해 유리하게 사용될 수 있다. 이것은, 비제한적 예로서, 잠재적으로 매우 풍부한 표적에 대해 제한 양의 프라이머를 사용함으로써, 또는 매우 풍부한 태그된 올리고의 증폭을 감소시키기 위해 상이한 BAB 어닐링 온도를 사용함으로써 달성할 수 있다. 어닐링 온도는 BAB 길이 및/또는 조성에 의해 조정될 수 있다.In other words, amplification of the tagged oligo occurs by annealing E-p to the AS located 3' of the tagged oligo using the annealing sequence reverse complement (AS-RC) located at the 3' end of E-p (Fig. 6A), thus This results in 3' extension of both the tagged oligo and E-p in the reaction, which in turn produces a WGA-primer amplifiable molecule. Alternatively, as shown in FIG. 6B , AS can match the BAB sequence, and E-p can anneal to the BAB sequence via the BAB reverse complementary sequence (BAB-RC). The first option (anneal to AS) has the advantage that a single E-p can be used with any BAB, thus reducing manufacturing cost and protocol complexity. The second option (anneal to BAB) can advantageously be used to normalize signals originating from targets with large differences in abundance. This can be achieved, by way of non-limiting example, by using limiting amounts of primers for potentially highly enriched targets, or by using different BAB annealing temperatures to reduce amplification of highly enriched tagged oligos. The annealing temperature can be adjusted by the BAB length and/or composition.

태그된 올리고 및 E-p의 신장 후, WGA 프라이머는 수득된 더 큰 분자 내에서 태그된 올리고의 증폭을 수행한다. 스페이서 서열(SS)은 태그된 올리고에 의해 생성된 앰플리콘의 길이를 증가시킨다. 단편 길이가 증가하면, 단편의 상보적 말단에 의해 유도된 헤어핀 등의 분자내 2차 구조가 불안정해지고, 이에 따라 용융 온도가 저하되고(도 7), 기타 WGA 단편과 함께 태그된 올리고 증폭이 촉진된다[참조: M. Zuker. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 31 (13), 3406-15, (2003)]. 신장 올리고뉴클레오티드(E-p) 서열 길이는 바람직하게는 60 내지 300개 염기의 범위 내이다. 보다 바람직하게는, 신장 올리고뉴클레오티드(E-p) 서열의 길이는 120 내지 200개 염기의 범위 내이다.After extension of the tagged oligo and E-p, the WGA primer performs amplification of the tagged oligo within the resulting larger molecule. The spacer sequence (SS) increases the length of the amplicon produced by the tagged oligo. As the fragment length increases, intramolecular secondary structures such as hairpins induced by the complementary ends of the fragment become unstable, thereby lowering the melting temperature (Fig. 7), and promoting amplification of tagged oligos with other WGA fragments. become [cf. M. Zuker. Mfold web server for nucleic acid folding and hybridization prediction. Nucleic Acids Res. 31 (13), 3406-15, (2003)]. The length of the elongation oligonucleotide (E-p) sequence is preferably in the range of 60 to 300 bases. More preferably, the length of the elongation oligonucleotide (E-p) sequence is in the range of 120 to 200 bases.

제3의 바람직한 실시양태에서 및 도 8을 참조하면, 태그된 올리고뉴클레오티드는 5'으로부터 3'으로 적어도In a third preferred embodiment and with reference to Figure 8, the tagged oligonucleotide is at least 5' to 3'

a) 제1 증폭 핸들 서열(1AH)에 상응하는 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);a) a first tagged oligonucleotide amplification sequence (5-TOS) of a nucleic acid corresponding to a first amplification handle sequence (1AH);

b) 페이로드 서열(PL);b) payload sequence (PL);

c) 제2 증폭 핸들 서열(2AH)에 상응하는 핵산의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)c) a second tagged oligonucleotide amplification sequence (3-TOS) of a nucleic acid corresponding to a second amplification handle sequence (2AH)

을 포함한다.includes

적어도 하나의 제1 프라이머는 전체 게놈 증폭에 사용되고, 적어도 하나의 제2 및 하나의 제3 프라이머는 태그된 올리고뉴클레오티드의 증폭에 사용되며, 적어도 하나의 제2 프라이머는 제1 증폭 핸들 서열(1AH)과 동일한 서열을 갖고, 적어도 하나의 제3 프라이머는 제2 증폭 핸들 서열에 역상보적인 서열(2AH-RC)을 갖는다.at least one first primer is used for whole genome amplification, at least one second and one third primer is used for amplification of the tagged oligonucleotide, and at least one second primer is used for amplification of a first amplification handle sequence (1AH) and the at least one third primer has a sequence that is reverse complementary to the second amplification handle sequence (2AH-RC).

태그된 올리고 증폭 프라이머는 WGA PCR 열 프로파일의 적어도 최초 10 내지 15 사이클과 호환성이 있는 용융 온도를 갖도록 설계되어 있다.The tagged oligo amplification primers are designed to have a melting temperature compatible with at least the first 10 to 15 cycles of the WGA PCR thermal profile.

바람직하게는, 적어도 하나의 제2 프라이머 및 적어도 하나의 제3 프라이머가 단계 d)에서 첨가된다.Preferably, at least one second primer and at least one third primer are added in step d).

증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리를 제조하는 단계 e)는 바람직하게는 제1 증폭 핸들 서열(1AH)에 상응하는 3' 서열을 포함하는 적어도 하나의 제1 라이브러리 프라이머, 및 제2 증폭 핸들 서열(2AH-RC)에 역상보적인 서열에 상응하는 3' 서열을 포함하는 적어도 하나의 제2 라이브러리 프라이머를 사용하는 PCR 반응에 의해 수행된다.Step e) of preparing a massively parallel sequencing library from the amplified tagged oligonucleotides preferably comprises at least one first library primer comprising a 3' sequence corresponding to the first amplification handle sequence (1AH), and a second PCR reaction using at least one second library primer comprising a 3' sequence corresponding to a sequence reverse complementary to the amplification handle sequence (2AH-RC).

따라서, 라이브러리 프라이머는 단일 PCR 단계로 결합제의 정량 분석을 위한 NGS 라이브러리를 생성하기 위해 유리하게 사용된다. 본 명세서에 보고된 라이브러리 프라이머의 특정 예는, 본 발명의 범위를 제한하려는 의도 없이, 일루미나(Illumina) 서열분석 플랫폼과 호환성이 있는 라이브러리를 생성하기 위해 사용된다.Therefore, library primers are advantageously used to generate NGS libraries for quantitative analysis of binders in a single PCR step. The specific examples of library primers reported herein are used to generate libraries compatible with the Illumina sequencing platform, without intending to limit the scope of the present invention.

바람직한 실시양태에서, 정방향 및 역방향 프라이머는 5'으로부터 3'으로 하기를 포함하는 일루미나 어댑터(Illumina)를 기반으로 설계된다:In a preferred embodiment, the forward and reverse primers are designed based on an Illumina adapter comprising from 5' to 3':

1) 일루미나 어댑터 서열(IA): 일루미나 서열분석에 필요하다.1) Illumina adapter sequence (IA): Required for Illumina sequencing.

- 인덱스 서열분석 프라이머/유세포 결합 서열: 이 영역은 i5/i7 인덱스 서열분석 프라이머에 대한 어닐링 서열 뿐만 아니라 유세포 결합에 필요하다.- Index sequencing primers/flow cytometric binding sequence: This region is required for flow cytometric binding as well as annealing sequences for i5/i7 index sequencing primers.

- i5/i7 인덱스: NGS 다중화 반응에 사용되는 인덱스;- i5/i7 index: index used for NGS multiplexing reaction;

- 판독 1/판독 2 서열분석 프라이머: 일루미나 서열분석 프라이머 및 태그된 올리고로부터 라이브러리의 증폭을 위한 어닐링 서열.- Read 1/Read 2 sequencing primers: Illumina sequencing primers and annealing sequences for amplification of libraries from tagged oligos.

2) 제1 증폭 핸들 서열(1AH) 또는 제2 증폭 핸들 서열에 대해 역상보적인 서열(2AH-RC): 이러한 서열은 태그된 올리고 증폭 후에 이중 가닥인 태그된 올리고 상에서 각각 제1 증폭 핸들 서열 및 제2 증폭 핸들 서열과 어닐링된다.2) a sequence that is reverse complementary to the first amplification handle sequence (1AH) or the second amplification handle sequence (2AH-RC): these sequences are the first amplification handle sequence and the second amplification handle sequence respectively on the double-stranded tagged oligo after amplification of the tagged oligo; annealed with a second amplification handle sequence.

도 9는 도 5(도 9A), 도 6A(도 9B) 및 도 8(도 9C)에 따른 실시양태에서 증폭된 태그된 올리고뉴클레오티드로부터 각각 대규모 병렬 서열분석 라이브러리의 생성에 사용되는 라이브러리 프라이머의 구조를 도시한다.9 shows the structure of library primers used in the generation of a massively parallel sequencing library from the amplified tagged oligonucleotides, respectively, in the embodiment according to FIGS. 5 ( FIG. 9A ), FIG. 6A ( FIG. 9B ) and FIG. 8 ( FIG. 9C ). shows

라이브러리의 생성 후, 바람직하게는 적어도 하나의 정제 단계를 수행하고, 이어서 라이브러리 정량화 및 그 후의 서열분석 절차에 필요한 풀링을 수행한다. 서열분석은 페어드-엔드(paired-end) 서열분석으로서 우선적으로 수행되고, 각각 라이브러리 DNA 분자의 가닥으로부터 유래하는 2개의 판독이 생성된다.After generation of the library, preferably at least one purification step is performed, followed by pooling necessary for library quantification and subsequent sequencing procedures. Sequencing is preferentially performed as a paired-end sequencing, resulting in two reads, each derived from a strand of the library DNA molecule.

동일한 접근법을 사용하여 이온 토렌트(Ion Torrent) 등의 기타 서열분석 플랫폼용의 NGS 라이브러리를 생성할 수 있다.The same approach can be used to generate NGS libraries for other sequencing platforms such as Ion Torrent.

NGS 라이브러리로부터 생성된 페어드-엔드 판독 서열의 분석은 다음 단계에 따라 분석된다:Analysis of paired-end read sequences generated from the NGS library is analyzed according to the following steps:

1. 서브-서열 추출. UMI, BAB 및 증폭 핸들 서열(1AH 및/또는 2AH)에 상응하는 서브-서열은 태그된 각 올리고 분자에 대한 양쪽 서열분석 판독으로부터 추출된다.1. Sub-sequence extraction. Sub-sequences corresponding to UMI, BAB and amplification handle sequences (1AH and/or 2AH) are extracted from both sequencing reads for each tagged oligo molecule.

2. 재정렬을 판독한다. BAB의 서브-서열 및/또는 증폭 핸들 서열(들)이 참조 서열과 정합하지 않는 경우(5개 염기마다 0.5 내지 2의 부정합의 허용범위), 서브-서열의 위치는 -n 내지 +n 범위의 가변 양(여기서, n은 허용되는 최대 오프셋이다)까지의 오프셋이고(예: n=8), 서브-서열이 다시 추출된다. 각 반복에 대해, 참조 서열로부터의 해밍 거리가 계산되고, 최소 거리를 반환하는 오프셋이 선택되고, 모든 서브-서열(UMI, BAB, 증폭 핸들 서열)이 추출된다.2. Read the realignment. If the sub-sequence and/or amplification handle sequence(s) of the BAB do not match the reference sequence (with a tolerance of 0.5 to 2 mismatch for every 5 bases), the position of the sub-sequence ranges from -n to +n. Offset up to a variable amount (where n is the maximum offset allowed) (eg n=8), and the sub-sequence is re-extracted. For each iteration, the Hamming distance from the reference sequence is calculated, the offset that returns the minimum distance is selected, and all sub-sequences (UMI, BAB, amplification handle sequences) are extracted.

3. 필터링을 판독한다. BAB를 판독하고/하거나, 참조 서열과는 상이한 서브-서열을 처리하고, 이들의 서브-서열은 정의된 양을 초과하는 염기가 저품질의 판독으로서 폐기된다.3. Read the filtering. The BAB is read and/or sub-sequences different from the reference sequence are processed, whose sub-sequences have more than a defined amount of bases discarded as poor quality reads.

4. UMI의 결정. 판독 페어로부터의 UMI 서열은 서열분석 에러의 부재하에 완전히 상보적일 것으로 예상된다. 제1 가닥 UMI와 제2 가닥 상보적 UMI 서열 사이에 임의의 차이가 있는 경우:4. Determination of UMI. The UMI sequences from the read pairs are expected to be completely complementary in the absence of sequencing errors. If there is any difference between the first strand UMI and the second strand complementary UMI sequence:

a. 판독 페어는 낮은 신뢰도로 폐기될 수 있거나, 또는a. read pairs may be discarded with low confidence, or

b. 2개 서열 사이의 컨센서스는, UMI의 각 위치에 대해, 2개의 서열분석 판독으로부터의 서열 중에서 염기를 선택함으로써 계산할 수 있고, 이는 서열분석기의 염기 콜러(caller)에 의해 보고된 최고 염기 콜링 스코어를 갖는다.b. Consensus between two sequences can be calculated, for each position in the UMI, by selecting bases from among the sequences from the two sequencing reads, which is the highest base calling score reported by the sequencer's base caller. have

제1 방법(a)은 서열분석 바이어스로 인해 표적 분자를 과대평가하는 경향이 낮지만, 결합제와 표적 분자 사이의 실제 결합 이벤트를 판독할 수 있고, 이는 대신 제2 방법(b)으로 회복시킨다.Although the first method (a) has a low tendency to overestimate the target molecule due to sequencing bias, it can read the actual binding event between the binding agent and the target molecule, which instead reverts to the second method (b).

5. 표적 분자 정량화. 표적 분자의 계수는 분석된 샘플 중의 특정 결합제를 나타내는 각 BAB 서열에 대한 별개의 UMI 서열의 수를 결정함으로써 수행된다.5. Target Molecules Quantification. Counting of target molecules is performed by determining the number of distinct UMI sequences for each BAB sequence representing a particular binding agent in the analyzed sample.

본 발명에 따른 키트는 하기를 포함한다:The kit according to the invention comprises:

a) 태그된 올리고뉴클레오티드와 접합된 생물학적 샘플 중의 적어도 하나의 표적 분자에 대해 지시된 적어도 하나의 결합제로서, 상기 태그된 올리고뉴클레오티드는 a) at least one binding agent directed to at least one target molecule in a biological sample conjugated with a tagged oligonucleotide, said tagged oligonucleotide comprising:

i) 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는 핵산의 페이로드 서열(PL), i) a payload sequence (PL) of a nucleic acid comprising a binder barcode sequence (BAB) and a unique molecular identifier sequence (UMI);

ii) 적어도 하나의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS) ii) at least one first tagged oligonucleotide amplification sequence (5-TOS)

을 포함하는, 적어도 하나의 결합제;at least one binder comprising;

b) 전체 게놈 증폭을 수행하기 위한 적어도 하나의 프라이머 및 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 적어도 하나의 프라이머로서, 상기 전체 게놈 증폭을 수행하기 위한 적어도 하나의 프라이머 및 상기 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 적어도 하나의 프라이머는 동일한 서열을 갖거나 상이한 서열을 갖는, 적어도 하나의 프라이머b) at least one primer for carrying out whole genome amplification and at least one primer for carrying out amplification of a tagged oligonucleotide, wherein at least one primer for carrying out said whole genome amplification and amplification of said tagged oligonucleotide at least one primer for carrying out the at least one primer having the same sequence or having a different sequence

를 포함한다.includes

바람직한 실시양태에서, 키트는 태그된 올리고뉴클레오티드를 신장하기 위한 올리고뉴클레오티드를 포함한다.In a preferred embodiment, the kit comprises an oligonucleotide for extending the tagged oligonucleotide.

바람직한 실시양태에서, 적어도 하나의 태그된 올리고뉴클레오티드는 서열번호 1에 상응하는 서열을 갖고, 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 프라이머는 2개이고 각각 서열번호 2 및 서열번호 3의 서열을 갖는다. 키트는 바람직하게는 하나 이상의 제1 라이브러리 프라이머(들) 및 하나 이상의 제2 라이브러리 프라이머(들)를 추가로 포함한다. 보다 바람직하게는, 상기 제1 라이브러리 프라이머는 서열번호 8 내지 서열번호 15로 이루어진 그룹으로부터 선택된 서열을 갖고, 상기 제2 라이브러리 프라이머는 서열번호 16 내지 서열번호 27로 이루어진 그룹으로부터 선택된 서열을 갖는다.In a preferred embodiment, the at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO: 1, and there are two primers for carrying out the amplification of the tagged oligonucleotide, each having the sequence of SEQ ID NO: 2 and SEQ ID NO: 3. The kit preferably further comprises one or more first library primer(s) and one or more second library primer(s). More preferably, the first library primer has a sequence selected from the group consisting of SEQ ID NO: 8 to SEQ ID NO: 15, and the second library primer has a sequence selected from the group consisting of SEQ ID NO: 16 to SEQ ID NO: 27.

또 다른 바람직한 실시양태에서, 적어도 하나의 태그된 올리고뉴클레오티드는 서열번호 28에 상응하는 서열을 갖고, 태그된 올리고뉴클레오티드의 신장을 수행하기 위한 올리고뉴클레오티드는 서열번호 29에 상응하는 서열을 갖는다. 키트는 바람직하게는 하나 이상의 제1 라이브러리 프라이머(들) 및 하나 이상의 제2 라이브러리 프라이머(들)를 추가로 포함한다. 보다 바람직하게는, 상기 제1 라이브러리 프라이머는 서열번호 30 내지 서열번호 37로 이루어진 그룹으로부터 선택된 서열을 갖고, 상기 제2 라이브러리 프라이머는 서열번호 38 내지 서열번호 49로 이루어진 그룹으로부터 선택된 서열을 갖는다.In another preferred embodiment, the at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO:28 and the oligonucleotide for effecting extension of the tagged oligonucleotide has a sequence corresponding to SEQ ID NO:29. The kit preferably further comprises one or more first library primer(s) and one or more second library primer(s). More preferably, the first library primer has a sequence selected from the group consisting of SEQ ID NO: 30 to SEQ ID NO: 37, and the second library primer has a sequence selected from the group consisting of SEQ ID NO: 38 to SEQ ID NO: 49.

실시예Example

실시예Example 1 One

이 실시예에서, 태그된 올리고는 WGA 후에 도 8에 따른 설정으로 증폭을 수행하도록 설계되었다. "P5-Synth"(서열번호 1, 도 10, NNNNNNNNNN: UMI 서열)라는 명칭의 태그된 올리고는 Ampli1™ WGA 키트(Menarini Silicon Biosystems)와 호환성이 있도록 설계되었다. 제1 증폭 핸들 서열(1AH)은 일루미나 TruSeq DNA 및 RNA CD 인덱스의 인덱스 2(i5) 어댑터의 최후 19개 염기와 동일했다. 제2 증폭 핸들 서열(2AH)은 분자내 2차 구조 및 인간 게놈에 대한 정합 가능성을 회피하기 위해 인 실리코(in silico)로 생성되었다. 양쪽 증폭 핸들 서열의 용융 온도는 WGA 프라이머의 용융 온도와 유사하도록 설계되었다. 태그된 올리고 증폭 프라이머(서열번호 2 및 서열번호 3)는 제1 및 제2 증폭 핸들 서열에 따라 설계되었다.In this example, tagged oligos were designed to perform amplification after WGA with the setup according to FIG. 8 . A tagged oligo named "P5-Synth" (SEQ ID NO: 1, FIG. 10, NNNNNNNNNN: UMI sequence) was designed to be compatible with the Ampli1™ WGA kit (Menarini Silicon Biosystems). The first amplification handle sequence (1AH) was identical to the last 19 bases of the index 2 (i5) adapter of the Illumina TruSeq DNA and RNA CD index. A second amplification handle sequence (2AH) was generated in silico to avoid intramolecular secondary structures and potential matches to the human genome. The melting temperatures of both amplification handle sequences were designed to be similar to those of the WGA primers. Tagged oligo amplification primers (SEQ ID NO: 2 and SEQ ID NO: 3) were designed according to the first and second amplification handle sequences.

도 10에 나타난 바와 같이, 정방향 라이브러리 프라이머는 인덱스 2(i5) 어댑터(Illumina)와 동일한 반면, 역방향 라이브러리 프라이머는 제2 증폭 핸들 서열의 역상보 서열이 부가된 인덱스 1(i7) 어댑터와 동일하다. 보다 상세하게는, 도 10은 P5-Synth 올리고 및 상응하는 라이브러리 프라이머의 설계를 도시한다.As shown in FIG. 10 , the forward library primer is identical to the index 2 (i5) adapter (Illumina), whereas the reverse library primer is identical to the index 1 (i7) adapter to which the reverse complementary sequence of the second amplification handle sequence is added. More specifically, Figure 10 depicts the design of P5-Synth oligos and corresponding library primers.

올리고 P5-Synth(서열번호 1): 백색 박스는 UMI 및 결합제 바코드를 갖는 내부 도메인을 나타낸다. 흑색 경계선을 갖는 회색 박스는 제1 및 제2 증폭 핸들 서열을 나타낸다.Oligo P5-Synth (SEQ ID NO: 1): White boxes indicate internal domains with UMI and binder barcodes. Gray boxes with black borders indicate the first and second amplification handle sequences.

P5 라이브러리 프라이머(서열번호 8): NGS 라이브러리의 생성에 사용되는 정방향 프라이머. 회색 박스 내는 올리고 P5-Synth를 사용한 어닐링 부위이고; 짧은 점선 박스 내는 서열분석 반응의 다중화에 사용된 i5 인덱스이고; 긴 점선 박스 내는 인덱스 서열분석 프라이머/유세포 어댑터 서열이다.P5 library primer (SEQ ID NO: 8): Forward primer used for generation of NGS library. The gray boxes are the annealing sites with oligo P5-Synth; The short dashed box is the i5 index used for multiplexing the sequencing reaction; Inside the long dashed box is the index sequencing primer/flow cyto adapter sequence.

Synth 라이브러리 프라이머(서열번호 16): NGS 라이브러리의 생성에 사용되는 역방향 프라이머. 회색 박스 내는 올리고 P5-Synth를 사용한 어닐링 부위이다. 짧은 점선 박스 내는 서열분석 프라이머 부위이고; 점선 박스 내는 서열분석 반응의 다중화에 사용되는 i5 인덱스이고; 긴 점선 박스 내는 인덱스 서열분석 프라이머/유세포 어댑터 서열이다.Synth library primer (SEQ ID NO: 16): Reverse primer used for generation of NGS library. The gray boxes are the annealing sites using oligo P5-Synth. Within the short dashed box are the sequencing primer sites; The dashed box is the i5 index used for multiplexing the sequencing reaction; Inside the long dashed box is the index sequencing primer/flow cyto adapter sequence.

도 11에 나타낸 바와 같이, 라이브러리의 생성 중에, 일루미나 인덱스 1 및 2 어댑터가 태그된 올리고의 5' 및 3'에 각각 부가된다.As shown in Figure 11, during library generation, Illumina index 1 and 2 adapters are added to the 5' and 3' of the tagged oligos, respectively.

이 예에서, 태그된 올리고는 5' 아미노 변형인자를 통해 접합되었다. 아민 모이어티와 올리고의 5' 사이에 C6 또는 C12 스페이서가 존재하여, 후속 PCR 반응에 대한 입체 장애 억제 효과를 회피했다. 항체는 아미노 반응성 시약을 통해 라이신, 글루타민, 아르기닌 및 아스파라긴 잔기로부터 항체에 통상 존재하는 아민을 사용하여 태그된 올리고에 공유 결합되었다. 태그된 올리고를 사용하여 4개의 Ab-올리고(표 2)가 생성되었고, 항체 올리고 접합은 엑스페데온 리미티드(Expedeon Ltd)(25 Norman Way, Over, Cambridge CB24 5QE, United Kingdom)에 의해 1:2의 항체:태그된 올리고 화학량론을 사용하여 수행되었다. 에피토프 국재화: 세포막에 대한 위치를 나타낸다.In this example, the tagged oligo was conjugated via a 5' amino modifier. A C6 or C12 spacer was present between the amine moiety and the 5' of the oligo to avoid the steric hindrance inhibitory effect on the subsequent PCR reaction. Antibodies were covalently linked via amino-reactive reagents from lysine, glutamine, arginine and asparagine residues to tagged oligos using amines commonly present in antibodies. Four Ab-oligos (Table 2) were generated using tagged oligos and antibody oligo conjugation was 1:2 by Expedeon Ltd (25 Norman Way, Over, Cambridge CB24 5QE, United Kingdom). of antibody:tagged oligo stoichiometry. Epitope localization: indicates location relative to the cell membrane.

명칭designation 항체antibody 이소형Lee So-hyung 항체 명칭Antibody name 결합제 바코드binder barcode 에피토프epitope 국재화localization Ab-올리고 태그1Ab-oligo tag 1 항 Pan-사이토케라틴Anti-Pan-cytokeratin 마우스 IgG1mouse IgG1 항CKanti-CK TACTCATGCT
(서열번호 4)
TACTCATGCT
(SEQ ID NO: 4)
내부inside
Ab-올리고 태그2Ab-oligo tag2 항 Her2Anti Her2 마우스 IgG1mouse IgG1 항Her2Anti Her2 AGATAGCGCA
(서열번호 5)
AGATAGCGCA
(SEQ ID NO: 5)
내부inside
Ab-올리고 태그3Ab-oligo tag3 항 CD45Anti-CD45 마우스 IgG2amouse IgG2a 항CD45Anti-CD45 TCTCTCGCTG
(서열번호 6)
TCTCTCGCTG
(SEQ ID NO: 6)
외부Out
Ab-올리고 태그4Ab-oligo tag4 IgG1 이소형 대조군IgG1 isotype control 마우스 IgG1mouse IgG1 IgG1이소형IgG1 isotype CTGAGTCAGA
(서열번호 7)
CTGAGTCAGA
(SEQ ID NO: 7)
--

Ab-올리고를 사용하여 2개의 상이한 유형의 세포주를 염색했다. 제1 세포 유형은 사이토케라틴 및 Her2 단백질을 과발현하는 유방 종양 유래의 세포주인 SK-BR-3 세포였다. 제2 세포 유형은 말초 혈액 단핵 세포(PBMC)였고, 이는 CD45와 무시할 수 있는 수준의 사이토케라틴 및 Her2를 발현하는 전혈로부터 추출한 백혈구이다.Ab-oligos were used to stain two different types of cell lines. The first cell type was SK-BR-3 cells, a breast tumor-derived cell line overexpressing cytokeratin and Her2 proteins. The second cell type was peripheral blood mononuclear cells (PBMC), which are leukocytes extracted from whole blood expressing CD45 and negligible levels of cytokeratin and Her2.

SK-BR-3 세포(ATCC® HTB-30™, ATCC)를 제조원의 절차에 따라 배양물에서 성장시켰다. PBMC는 인간 혈액 샘플로부터 추출되었다. 커스텀화된 프로토콜에 따라 PFA 2%를 사용하여 양쪽 세포 유형을 고정했다.SK-BR-3 cells (ATCC ® HTB-30™, ATCC) were grown in culture according to the manufacturer's procedures. PBMCs were extracted from human blood samples. Both cell types were fixed using PFA 2% according to a customized protocol.

Ab-올리고를 사용한 세포 염색은 100,000 내지 50,000개의 사전에 고정 및 투과처리된 세포에서 수행되었다. 세포는 1000 × g, RT에서 5분 동안 원심분리하여 수집했다. 세포를 적어도 1mL의 실행 완충액(autoMACS 실행 완충액, ref. 130-091-221, Miltenyi Biotec)으로 세척하고, 원심분리에 의해 수집했다. 이 최후의 단계를 2회 반복했다. 외부 Ab-올리고 및 이들의 이소형 Ab-올리고 대조군은 100㎕의 실행 완충액에서 작업 농도까지 희석시킨다. 외부 Ab-올리고 혼합물(Ab-올리고 태그3)을 세포에 첨가하고, 실온에서 15분 동안 인큐베이팅했다. 이어서, 샘플을 1mL의 실행 완충액으로 2회 세척하고, 원심분리에 의해 수집했다. 500㎕의 실행 완충액 중의 염소 항 마우스 IgG2a - PE 항체를 첨가하고, +4℃에서 30분 동안 인큐베이팅했다. 이 단계는 PE에서 PBMC 세포의 염색을 가능하게 했다. 샘플을 실행 완충액으로 2회 세척했다. 내부 Ab-올리고 및 이의 이소형 Ab-올리고 대조군은 200㎕의 내부 Perm 완충액(Inside Stain Kit, Ref. 130-090-477, Miltenyi Biotec)에서 작업 농도까지 희석시킨다. 내부 Ab-올리고 혼합물(Ab-올리고 태그1, 2 및 4)을 세포에 첨가하고, 실온에서 10분 동안 인큐베이팅했다. 샘플을 1mL의 내부 Perm 완충액으로 2회 세척하고, 원심분리에 의해 수집했다. 500㎕의 내부 Perm 완충액 중의 훽스트(Hoechst) 및 염소 항 마우스 IgG1 - APC 항체의 혼합물을 첨가하고, +4℃에서 30분 동안 인큐베이팅했다. 이 단계는 PE 및 모든 세포 핵에서 SK-BR-3 세포의 염색을 가능하게 했다. 샘플을 실행 완충액으로 2회 세척했다. Cell staining with Ab-oligos was performed on 100,000 to 50,000 pre-fixed and permeabilized cells. Cells were collected by centrifugation at 1000 × g, RT for 5 min. Cells were washed with at least 1 mL of running buffer (autoMACS running buffer, ref. 130-091-221, Miltenyi Biotec) and collected by centrifugation. This last step was repeated twice. External Ab-oligos and their isotype Ab-oligo controls are diluted to working concentration in 100 μl of running buffer. An external Ab-oligo mixture (Ab-oligo tag3) was added to the cells and incubated for 15 minutes at room temperature. Samples were then washed twice with 1 mL of running buffer and collected by centrifugation. Goat anti-mouse IgG2a-PE antibody in 500 μl of running buffer was added and incubated at +4° C. for 30 minutes. This step enabled staining of PBMC cells in PE. Samples were washed twice with running buffer. Internal Ab-oligos and their isoform Ab-oligo controls are diluted to working concentration in 200 μl of Internal Perm Buffer (Inside Stain Kit, Ref. 130-090-477, Miltenyi Biotec). Internal Ab-oligo mixtures (Ab-oligo tags 1, 2 and 4) were added to the cells and incubated for 10 minutes at room temperature. Samples were washed twice with 1 mL of internal Perm buffer and collected by centrifugation. A mixture of Hoechst and goat anti-mouse IgG1-APC antibodies in 500 μl of internal Perm buffer was added and incubated at +4° C. for 30 minutes. This step enabled staining of SK-BR-3 cells in PE and all cell nuclei. Samples were washed twice with running buffer.

형광단에 접합된 2차 항체를 첨가함으로써, 형광에 의해 SK-BR-3 세포(APC 채널) 및 PBMC(PE 채널)를 동정할 수 있다. 더욱이, 형광 수준은 Ab-올리고의 상대적 존재량을 반영한다. 단일 세포는 DEPArray™ NxT 시스템(Menarini Silicon Biosystems)을 사용하여 이들의 면역형광 표지에 기반하여 정제되었다(도 12).By adding a secondary antibody conjugated to a fluorophore, SK-BR-3 cells (APC channel) and PBMC (PE channel) can be identified by fluorescence. Moreover, the fluorescence level reflects the relative abundance of Ab-oligos. Single cells were purified based on their immunofluorescence labeling using the DEPArray™ NxT system (Menarini Silicon Biosystems) (FIG. 12).

구체적으로, 도 12는 Ab-올리고 및 2차 형광 항체로 염색된 PBMC 및 SK-BR-3 세포의 산포도를 도시한다. x축은 APC 채널의 형광 수준이고, 이는 Ab-올리고 태그1, 태그2 및 태그4의 양에 비례한다. y축은 PE 채널의 형광 수준이고, 이는 Ab-올리고 태그3의 양에 비례한다. 산포도는 면역형광 수준에 따라 각각 특정 세포 유형을 포함하는 4개의 사분면으로 분할된다: 1) PBMC(높은 수준의 CD45 및 낮은 수준의 CK, Her2); 2) 이중 양성 세포(높은 수준의 CD45, CK, Her2); 3) 이중 음성 세포(낮은 수준의 CD45, CK, Her2); 4) SK-BR-3 세포(낮은 수준의 CD45 및 높은 수준의 CK, Her2). 빈/채워진 사각형/원으로 강조 표시된 단일 세포를 단리하고, 라이브러리의 생성에 사용했다.Specifically, Figure 12 shows a scatter plot of PBMC and SK-BR-3 cells stained with Ab-oligo and secondary fluorescent antibodies. The x-axis is the fluorescence level of the APC channel, which is proportional to the amounts of Ab-oligo tag1, tag2 and tag4. The y-axis is the fluorescence level of the PE channel, which is proportional to the amount of Ab-oligo tag3. The scatter plot is divided into four quadrants according to immunofluorescence levels, each containing a specific cell type: 1) PBMCs (high levels of CD45 and low levels of CK, Her2); 2) double positive cells (high levels of CD45, CK, Her2); 3) double negative cells (low levels of CD45, CK, Her2); 4) SK-BR-3 cells (low levels of CD45 and high levels of CK, Her2). Single cells highlighted with empty/filled squares/circles were isolated and used for library generation.

또는, WGA 후에 태그된 올리고 증폭을 수행하기 위해, 정방향/역방향 프라이머와 Ampli1™ PCR 키트 시약의 커스텀화된 반응 혼합물을 표 3의 좌측 삽입도에 따라 제조했다. WGA 생성물을 함유하는 각 튜브에 15㎕의 반응 혼합물을 첨가했다. 각 샘플은 표 3의 우측 삽입도에 나타낸 열 프로파일에 따라 인큐베이팅되었다.Alternatively, to perform tagged oligo amplification after WGA, a customized reaction mixture of forward/reverse primers and Ampli1™ PCR kit reagents was prepared according to the left inset in Table 3. To each tube containing the WGA product was added 15 μl of the reaction mixture. Each sample was incubated according to the thermal profile shown in the right inset of Table 3.

Figure pct00001
Figure pct00001

좌측 삽입도: 태그된 올리고 증폭 반응의 반응 혼합물 조성. 우측 삽입도: 태그된 올리고 증폭의 열 사이클 프로그램.Left inset: reaction mixture composition of tagged oligo amplification reaction. Right inset: Thermal cycle program of tagged oligo amplification.

라이브러리 제조는 0.5M의 최종 농도에서 P5 및 Lib1 라이브러리 프라이머를 사용하여 Ampli1™ PCR 키트를 사용하여 증폭된 Ab-올리고 앰플리콘을 함유하는 1㎕의 WGA의 분취량을 채취함으로써 수행되었다. PCR 열 사이클 프로파일은 표 5에 제시되어 있다. 각 샘플은 생물정보학 분석 동안 데이터를 역다중화하기 위해 이중 인덱스용의 NGS 라이브러리 프라이머의 상이한 조합을 가졌다. 사용된 라이브러리 프라이머 목록은 표 4에 제시되어 있다. P5 라이브러리 프라이머는 태그된 올리고 P5-Synth와 함께 사용할 수 있는 정방향 프라이머이다.Library preparation was performed by taking an aliquot of 1 μl of WGA containing the amplified Ab-oligo amplicons using the Ampli1™ PCR kit using P5 and Lib1 library primers at a final concentration of 0.5M. PCR thermal cycle profiles are presented in Table 5. Each sample had a different combination of NGS library primers for dual indexing to demultiplex data during bioinformatics analysis. A list of library primers used is given in Table 4. The P5 library primer is a forward primer that can be used with the tagged oligo P5-Synth.

서열 P5 라이브러리 Sequence P5 library 프라이머primer (5' -> 3') (5' -> 3') [i5] 인덱스 번호[i5] index number 서열번호 SEQ ID NO: AATGATACGGCGACCACCGAGATCTACAC TATAGCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC TATAGCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D501D501 88 AATGATACGGCGACCACCGAGATCTACAC ATAGAGGC ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC ATAGAGGC ACACTCTTTCCCTACACGACGCTCTTCCGATCT D502D502 99 AATGATACGGCGACCACCGAGATCTACAC CCTATCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC CCTATCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D503D503 1010 AATGATACGGCGACCACCGAGATCTACAC GGCTCTGA ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC GGCTCTGA ACACTCTTTCCCTACACGACGCTCTTCCGATCT D504D504 1111 AATGATACGGCGACCACCGAGATCTACAC AGGCGAAG ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC AGGCGAAG ACACTCTTTCCCTACACGACGCTCTTCCGATCT D505D505 1212 AATGATACGGCGACCACCGAGATCTACAC TAATCTTA ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC TAATCTTA ACACTCTTTCCCTACACGACGCTCTTCCGATCT D506D506 1313 AATGATACGGCGACCACCGAGATCTACAC CAGGACGT ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC CAGGACGT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D507D507 1414 AATGATACGGCGACCACCGAGATCTACAC GTACTGAC ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC GTACTGAC ACACTCTTTCCCTACACGACGCTCTTCCGATCT D508D508 1515 서열 order SynthSynth 라이브러리 library 프라이머primer (5' -> 3') (5' -> 3') [i7] 인덱스 번호[i7] index number 서열번호 SEQ ID NO: CAAGCAGAAGACGGCATACGAGAT CGAGTAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT CGAGTAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D701D701 1616 CAAGCAGAAGACGGCATACGAGAT TCTCCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT TCTCCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D702D702 1717 CAAGCAGAAGACGGCATACGAGAT AATGAGCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT AATGAGCG GTGACTGGAGTTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D703D703 1818 CAAGCAGAAGACGGCATACGAGAT GGAATCTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT GGAATCTC GTGACTGGAGTTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D704D704 1919 AGCAGAAGACGGCATACGAGAT TTCTGAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG AGCAGAAGACGGCATACGAGAT TTCTGAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D705D705 2020 CAAGCAGAAGACGGCATACGAGAT ACGAATTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT ACGAATTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D706D706 2121 CAAGCAGAAGACGGCATACGAGAT AGCTTCAG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT AGCTTCAG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D707D707 2222 CAAGCAGAAGACGGCATACGAGAT GCGCATTA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT GCGCATTA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D708D708 2323 CAAGCAGAAGACGGCATACGAGAT CATAGCCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT CATAGCCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D709D709 2424 CAAGCAGAAGACGGCATACGAGAT TTCGCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT TTCGCGGA GTGACTGGAGTTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D710D710 2525 CAAGCAGAAGACGGCATACGAGAT GCGCGAGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT GCGCGAGA GTGACTGGAGTTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D711D711 2626 CAAGCAGAAGACGGCATACGAGAT CTATCGCT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG CAAGCAGAAGACGGCATACGAGAT CTATCGCT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC TGGCGCATAATGCATAGCCG D712D712 2727

단계step 온도temperature 시간hour 사이클cycle 1One 95℃95 3 분3 minutes 1One 22 95℃95℃ 30 초30 seconds 33 60℃60℃ 30 초30 seconds 72℃72℃ 10 초10 seconds 33 95℃95℃ 30 초30 seconds 23-3023-30 65℃65℃ 30 초30 seconds 72℃72℃ 10 초10 seconds 44 72℃72 1 분1 minute 1One 55 4℃4℃ 1One

NGS 라이브러리 생성을 위한 열 사이클 프로파일. 단계 3 동안의 사이클 수는 회수된 세포의 수와 세포 내의 총 Ab-올리고의 유효량에 따라 상이하다. 통상, 단계 3에서 27회의 증폭 사이클을 수행하면, 단일 세포로부터 충분한 양의 앰플리콘이 수득되었다.Thermal cycle profile for NGS library generation. The number of cycles during step 3 depends on the number of cells recovered and the effective amount of total Ab-oligos in the cells. Usually, after 27 amplification cycles in step 3, a sufficient amount of amplicons was obtained from a single cell.

라이브러리 샘플은 아겐코우트 암퓨어(Agencourt AmPure) XP 비드(Beckman-Coulter)를 사용하여 정제했다. NGS DNA 정량화는 KAPA SYBR® FAST qPCR 키트(Kapa Biosystems)를 사용하여 수행했다. 각 NGS 라이브러리는 아길런트 바이오어낼라이저(Agilent Bioanalyzer) 2100(Agilent)을 사용하여 조사되었고, 통상 185bp에서 단일 피크로 구성된 라이브러리 전기영동도를 나타낸다(도 13).Library samples were purified using Agencourt AmPure XP beads (Beckman-Coulter). NGS DNA quantification was performed using a KAPA SYBR ® FAST qPCR kit (Kapa Biosystems). Each NGS library was examined using an Agilent Bioanalyzer 2100 (Agilent), and a library electrophoresis diagram usually consisting of a single peak at 185 bp is shown ( FIG. 13 ).

샘플을 함께 풀링하고, MiSeq 시약 키트 v3 150-사이클(Ref. MS-102-3001, Illumina)을 사용하여 MiSeq 시스템(Illumina)에서 서열분석을 수행했다. 데이터 분석은 파이톤(Python)에서 개발된 커스텀 소프트웨어를 사용하여 수행되었다. UMI 계수에 따른 단백질 표적의 정량화는 도 14에 보고되어 있다. 예상된 바와 같이, SK-BR-3 세포는 사이토케라틴과 Her2의 높은 발현과 CD45의 낮은 수준을 나타낸 반면, PBMC는 반대 거동을 나타냈다. 단백질 발현 수준은 이중 양성 세포, 특히 이소형 대조군에서 높았고, 이는 이러한 세포가 비특이적 염색을 받기 쉽다는 것을 나타낸다. 역으로, 이중 음성 세포는 4개 표적 모두에 대해 더 낮은 수준을 나타냈다.Samples were pooled together and sequencing was performed on a MiSeq system (Illumina) using the MiSeq Reagent Kit v3 150-cycle (Ref. MS-102-3001, Illumina). Data analysis was performed using custom software developed in Python. Quantification of protein targets according to UMI counts is reported in FIG. 14 . As expected, SK-BR-3 cells showed high expression of cytokeratin and Her2 and low levels of CD45, whereas PBMC showed the opposite behavior. Protein expression levels were high in double positive cells, especially in isotype controls, indicating that these cells are susceptible to non-specific staining. Conversely, double negative cells showed lower levels for all four targets.

실시예Example 2 2

이 예에서, 태그된 올리고는 WGA 중에 도 8에 따른 설정으로 증폭을 수행하도록 설계되었다. 실험 절차는 하기를 제외하고는 실시예 1과 동일하다. 태그된 올리고 증폭 프라이머를, 0.02μM의 최종 농도로 1차 PCR 반응 혼합물에 직접 첨가했다. 라이브러리의 생성 및 데이터 분석은 실시예 1에 나타낸 바와 같이 수행되었다.In this example, the tagged oligo was designed to perform amplification during WGA with the setup according to FIG. 8 . The experimental procedure is the same as in Example 1 except for the following. Tagged oligo amplification primers were added directly to the primary PCR reaction mixture to a final concentration of 0.02 μM. Generation of the library and data analysis were performed as shown in Example 1.

UMI 계수에 따른 단백질 표적의 정량화는 도 15에 보고되어 있다. 예상된 바와 같이, SK-BR-3 세포는 사이토케라틴과 Her2의 높은 발현과 CD45의 매우 낮은 수준을 나타낸 반면, PBMC는 반대의 거동을 나타냈다. 단백질 발현 수준은 이중 양성 세포, 특히 이소형 대조군에서 높았고, 이는 이러한 세포가 비특이적 염색을 받기 쉽다는 것을 나타낸다. 역으로, 이중 음성 세포는 4개 표적 모두에 대해 더 낮은 수준을 나타냈다. 실시예 1의 결과에 따르면, 태그된 올리고의 증폭은 WGA 중 또는 WGA 후 양쪽에서 수행 가능하다고 추론할 수 있다. 그러나, 절대 UMI 계수는 2개 절차 사이에 크게 상이하다는 점에 유의해야 한다. 2개 세포 유형 사이의 차이는, 태그된 올리고 증폭이 WGA 중에 수행된 경우, CK와 비교하여 발현이 낮은 CD45 표적에 대해 예상된 것과 더 일치한다.Quantification of protein targets according to UMI counts is reported in FIG. 15 . As expected, SK-BR-3 cells showed high expression of cytokeratin and Her2 and very low levels of CD45, whereas PBMC showed the opposite behavior. Protein expression levels were high in double positive cells, especially in isotype controls, indicating that these cells are susceptible to non-specific staining. Conversely, double negative cells showed lower levels for all four targets. According to the results of Example 1, it can be inferred that the amplification of the tagged oligo can be performed both during or after WGA. However, it should be noted that the absolute UMI coefficients are significantly different between the two procedures. The difference between the two cell types is more consistent with what would be expected for a CD45 target with low expression compared to CK when tagged oligo amplification was performed during WGA.

실시예Example 3 3

이 예에서, 태그된 올리고는 단일 세포에 직접 추가되었다. 태그된 올리고, 즉 "P5-Lib1"(서열번호 28)은 Ampli1™ WGA 키트(Menarini Silicon Biosystems)에 의해 증폭될 수 있도록 설계되었다. 태그된 올리고 증폭 프라이머는 서열번호 29의 서열을 갖는다(정방향 및 역방향 프라이머는 동일하고, Ampli1 WGA Lib1 프라이머의 서열을 공유한다). 구체적으로, 5'-WGA 핸들 서열은 Lib1 WGA 프라이머와 동일했고, 3'-WGA 핸들 서열은 Lib1 WGA 프라이머의 역상보적 서열이었다. 제1 증폭 핸들 서열은 실시예 1에서 기재된 것과 동일하다. 제2 증폭 핸들 서열은 3'-WGA 핸들 서열과 이의 5' 말단에 추가 5bp 서열로 구성된다(도 16).In this example, the tagged oligo was added directly to a single cell. The tagged oligo, “P5-Lib1” (SEQ ID NO: 28), was designed to be amplified by the Ampli1™ WGA kit (Menarini Silicon Biosystems). The tagged oligo amplification primer has the sequence of SEQ ID NO: 29 (the forward and reverse primers are identical and share the sequence of the Ampli1 WGA Lib1 primer). Specifically, the 5'-WGA handle sequence was identical to the Lib1 WGA primer, and the 3'-WGA handle sequence was the reverse complementary sequence of the Lib1 WGA primer. The first amplification handle sequence is identical to that described in Example 1. The second amplification handle sequence consists of a 3'-WGA handle sequence and an additional 5 bp sequence at its 5' end (FIG. 16).

보다 상세하게는, 도 16은 P5-Synth 올리고 및 상응하는 라이브러리 프라이머의 설계를 나타낸다.More specifically, Figure 16 shows the design of P5-Synth oligos and corresponding library primers.

올리고 P5-Lib1: 두꺼운 경계선을 갖는 백색의 채워진 박스는 UMI 및 결합제 바코드를 갖는 내부 도메인을 나타낸다. 두꺼운 경계선을 갖는 회색의 채워진 박스는 2개의 라이브러리 프라이머에 대한 어닐링 부위를 나타낸다. 얇은 경계선을 갖는 회색의 박스는 WGA 핸들 서열(Lib1)이다.Oligo P5-Lib1: white filled boxes with thick borders indicate internal domains with UMI and binder barcodes. Gray filled boxes with thick borders indicate annealing sites for the two library primers. The gray box with a thin border is the WGA handle sequence (Lib1).

P5 라이브러리 프라이머: NGS 라이브러리의 생성에 사용되는 정방향 프라이머. 회색의 채워진 박스에서 태그된 올리고 P5-Lib1을 갖는 어닐링 부위. 짧은 점선 박스 내는 서열분석 프라이머 부위이고; 점선 박스 내는 서열분석 반응의 다중화에 사용되는 i5 인덱스이고; 긴 점선 박스 내는 인덱스 서열분석 프라이머/유세포 어댑터 서열이다.P5 library primers: Forward primers used for generation of NGS libraries. Annealing sites with tagged oligo P5-Lib1 in gray filled boxes. Within the short dashed box are the sequencing primer sites; The dashed box is the i5 index used for multiplexing the sequencing reaction; Inside the long dashed box is the index sequencing primer/flow cyto adapter sequence.

Lib1 라이브러리 프라이머: NGS 라이브러리의 생성에 사용되는 역방향 프라이머. 회색의 채워진 박스 내는 태그된 올리고 P5-Lib1을 갖는 어닐링 부위이고: 이 서열은 Lib1 역상보적 서열의 일부와 작은 테일(ACCAC)로 구성되어 있고, 올리고 P5-Lib1의 3' 말단에만 어닐링을 가능하게 한다. 짧은 점선의 박스 내는 서열분석 프라이머 부위이고; 점선 박스 내는 서열분석 반응의 다중화에 사용되는 i5 인덱스이고; 긴 점선 박스 내는 인덱스 서열분석 프라이머/유세포 어댑터 서열이다.Lib1 library primer: Reverse primer used for generation of NGS library. Inside the gray filled box is the annealing site with the tagged oligo P5-Lib1: this sequence consists of a small tail (ACCAC) with part of the Lib1 reverse-complementary sequence, allowing annealing only to the 3' end of the oligo P5-Lib1 make it The short dashed box is the sequencing primer site; The dashed box is the i5 index used for multiplexing the sequencing reaction; Inside the long dashed box is the index sequencing primer/flow cyto adapter sequence.

정방향 라이브러리 프라이머는 인덱스 2(i5) 어댑터(Illumina)와 동일한 반면, 역방향 라이브러리 프라이머는 제2 증폭 핸들 서열의 역상보적 서열이 부가된 인덱스 1(i7) 어댑터와 동일했다(도 16). 따라서, 라이브러리 생성 중에, 일루미나 인덱스 1 및 2 어댑터가 각각 태그된 올리고의 5' 및 3'에 부가된다(도 17).The forward library primer was identical to the index 2 (i5) adapter (Illumina), whereas the reverse library primer was identical to the index 1 (i7) adapter to which the reverse complementary sequence of the second amplification handle sequence was added ( FIG. 16 ). Thus, during library generation, Illumina index 1 and 2 adapters are added to the 5' and 3' of the tagged oligos, respectively (FIG. 17).

SK-BR-3 세포(ATCC® HTB-30™, ATCC)는, 제조원의 절차에 따라 배양액에서 성장시키고, 커스텀화된 프로토콜에 따라 PFA 2%를 사용하여 고정시켰다. 단일 세포는 형태에 기초하여 DEPArray™ NxT 시스템(Menarini Silicon Biosystems)을 사용하여 정제되었다. P5-Lib1 및 P5-Synth 태그된 올리고는 단일 세포를 포함하는 튜브 내부에 직접 부가했다. 상이한 양의 각 올리고를 각 단일 세포에 추가하고, Ampli1™ WGA를 수행했다. P5-Synth 태그된 올리고를 함유하는 샘플은 실시예 1에서와 같이 증폭시켰다.SK-BR-3 cells (ATCC ® HTB-30™, ATCC) were grown in culture according to the manufacturer's procedure and fixed using PFA 2% according to a customized protocol. Single cells were purified based on morphology using the DEPArray™ NxT system (Menarini Silicon Biosystems). P5-Lib1 and P5-Synth tagged oligos were added directly inside the tube containing single cells. A different amount of each oligo was added to each single cell and Ampli1™ WGA was performed. Samples containing P5-Synth tagged oligos were amplified as in Example 1.

태그된 올리고 라이브러리 생성은 Ab-올리고 앰플리콘을 함유하는 1㎕의 WGA의 분취량을 채취함으로써 수행되었고, 최종 농도 0.5M에서 P5 및 Lib1 라이브러리 프라이머를 사용하여 Ampli1™ PCR 키트를 사용하여 증폭시켰다. PCR 열 사이클 프로파일은 표 5에 제시되어 있다. 각 샘플은 생물정보학 분석 중에 데이터를 역다중화하기 위해 이중 인덱싱을 위한 NGS 라이브러리 프라이머의 상이한 조합을 가졌다. 사용된 라이브러리 프라이머 목록은 표 6에 제시되어 있다.Tagged oligo library generation was performed by taking aliquots of 1 μl WGA containing Ab-oligo amplicons and amplified using the Ampli1™ PCR kit using P5 and Lib1 library primers at a final concentration of 0.5M. PCR thermal cycle profiles are presented in Table 5. Each sample had a different combination of NGS library primers for double indexing to demultiplex data during bioinformatics analysis. A list of library primers used is given in Table 6.

서열 P5 라이브러리 Sequence P5 library 프라이머primer (5' -> 3') (5' -> 3') [i5] 인덱스 번호[i5] index number 서열번호 SEQ ID NO: AATGATACGGCGACCACCGAGATCTACAC TATAGCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC TATAGCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D501D501 3030 AATGATACGGCGACCACCGAGATCTACAC ATAGAGGC ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC ATAGAGGC ACACTCTTTCCCTACACGACGCTCTTCCGATCT D502D502 3131 AATGATACGGCGACCACCGAGATCTACAC CCTATCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC CCTATCCT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D503D503 3232 AATGATACGGCGACCACCGAGATCTACAC GGCTCTGA ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC GGCTCTGA ACACTCTTTCCCTACACGACGCTCTTCCGATCT D504D504 3333 AATGATACGGCGACCACCGAGATCTACAC AGGCGAAG ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC AGGCGAAG ACACTCTTTCCCTACACGACGCTCTTCCGATCT D505D505 3434 AATGATACGGCGACCACCGAGATCTACAC TAATCTTA ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC TAATCTTA ACACTCTTTCCCTACACGACGCTCTTCCGATCT D506D506 3535 AATGATACGGCGACCACCGAGATCTACAC CAGGACGT ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC CAGGACGT ACACTCTTTCCCTACACGACGCTCTTCCGATCT D507D507 3636 AATGATACGGCGACCACCGAGATCTACAC GTACTGAC ACACTCTTTCCCTACACGACGCTCTTCCGATCTAATGATACGGCGACCACCGAGATCTACAC GTACTGAC ACACTCTTTCCCTACACGACGCTCTTCCGATCT D508D508 3737 서열 order lib1lib1 라이브러리 library 프라이머primer (5' -> 3') (5' -> 3') [i7] 인덱스 번호[i7] index number 서열번호 SEQ ID NO: CAAGCAGAAGACGGCATACGAGAT CGAGTAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC GGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT CGAGTAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATC GGATTCCTGCT TCAGTACCAC D701D701 3838 CAAGCAGAAGACGGCATACGAGAT TCTCCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT TCTCCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D702D702 3939 CAAGCAGAAGACGGCATACGAGAT AATGAGCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT AATGAGCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D703D703 4040 CAAGCAGAAGACGGCATACGAGAT GGAATCTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT GGAATCTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D704D704 4141 CAAGCAGAAGACGGCATACGAGAT TTCTGAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT TTCTGAAT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D705D705 4242 CAAGCAGAAGACGGCATACGAGAT ACGAATTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT ACGAATTC GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D706D706 4343 CAAGCAGAAGACGGCATACGAGAT AGCTTCAG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT AGCTTCAG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D707D707 4444 CAAGCAGAAGACGGCATACGAGAT GCGCATTA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT GCGCATTA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D708D708 4545 CAAGCAGAAGACGGCATACGAGAT CATAGCCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT CATAGCCG GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D709D709 4646 CAAGCAGAAGACGGCATACGAGAT TTCGCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT TTCGCGGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D710D710 4747 CAAGCAGAAGACGGCATACGAGAT GCGCGAGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT GCGCGAGA GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D711D711 4848 CAAGCAGAAGACGGCATACGAGAT CTATCGCT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCACCAAGCAGAAGACGGCATACGAGAT CTATCGCT GTGACTGGAGTTCAGACGTGTGCTCTTCCGATCGGATTCCTGCT TCAGTACCAC D712D712 4949

10㎕ WGA 샘플의 분취량을 SPRI 비드(Beckmann Coulter)로 정제하고, 이어서 Ampli1™ 로우패스(LowPass) 키트로 처리하여 CNA 분석을 위한 NGS 라이브러리를 생성했다. WGA 절차 전에 단일 세포에서 태그된 올리고를 스파이킹하여도, 하류의 유전자 분석에는 영향을 미치지 않았다(도 18). 도 5 및 도 8에 도시된 워크플로우에 적합하도록 설계된 태그된 올리고는 WGA 절차에 영향을 미치거나 간섭하지 않았다. 더욱이, 양쪽 조건 모두에서 태그된 올리고뉴클레오티드로부터 NGS 라이브러리를 수득하는 것이 여전히 가능했다. 태그된 올리고뉴클레오티드 둘 다는 정확하게 정량화될 수 있고, 이는 양쪽 방법론과 태그된 올리고 설계의 견고성을 나타낸다(도 19).Aliquots of 10 μl WGA samples were purified with SPRI beads (Beckmann Coulter) and then processed with the Ampli1™ LowPass kit to generate NGS libraries for CNA analysis. Spiking of tagged oligos in single cells prior to the WGA procedure did not affect downstream genetic analysis ( FIG. 18 ). Tagged oligos designed to fit the workflow shown in FIGS. 5 and 8 did not affect or interfere with the WGA procedure. Moreover, it was still possible to obtain NGS libraries from tagged oligonucleotides in both conditions. Both tagged oligonucleotides can be accurately quantified, indicating the robustness of both methodology and tagged oligo design ( FIG. 19 ).

이점advantage

본 발명에 따른 생물학적 샘플에서 전체 게놈 증폭 및 다중 표적 분자의 분석 방법은 동일한 단일 세포에서 게놈 전체의 카피 수 프로파일/게놈 서열 및 단백질 발현의 분석을 동시에 수득할 수 있게 한다.The method for whole genome amplification and analysis of multiple target molecules in a biological sample according to the present invention makes it possible to simultaneously obtain genome-wide copy number profile/analysis of genomic sequence and protein expression in the same single cell.

본 발명의 방법은 게놈 DNA의 전체 게놈 증폭을 수행할 수 있게 하고, 목적의 유전자 패널의 로우패스 서열분석 또는 표적화된 서열분석에 의한 게놈 전체 카피 수 프로파일링 등의 추가 분석을 가능하게 하고, 소수(1개 이하)의 순환 종양 세포(CTC)만이 이용할 수 있는 경우일 수 있기 때문에, 매우 적은 수의 샘플을 사용하여 단일 세포의 해상도까지 복수 단백질 패널의 디지털 정량화를 검출 및 수행할 수 있게 한다. 이것은, 유전자형, 표현형 및 환경의 차이가 혼동을 줄 수 있고 유전자형(서열 변화의 카피 수)와 표현형(단백질 발현)과의 상관관계를 완전히 방지할 수 있는, 유전적으로 불균일한 샘플에서 상이한 세포의 각 분자 유형을 측정하는 것보다 특히 유리하다.The method of the present invention makes it possible to perform whole-genome amplification of genomic DNA, and enables further analysis such as low-pass sequencing of the desired gene panel or genome-wide copy number profiling by targeted sequencing, and Since it may be the case that only (1 or less) circulating tumor cells (CTCs) are available, it allows the detection and performance of digital quantification of multiple protein panels down to the resolution of single cells using a very small number of samples. This is because differences in genotype, phenotype and environment can be confounding and completely prevent correlation between genotype (copy number of sequence changes) and phenotype (protein expression) of different cells in a genetically heterogeneous sample. It is particularly advantageous over measuring molecular types.

본 발명에 따른 방법은, 놀랍게도, 비제한적 예로서 제공되는 하기 하나 이상의 차원에서 당업자가 이전에 달성할 수 없다고 생각했던 성능을 사용하여 최신 기술을 발전시킨다:The method according to the invention surprisingly advances the state of the art using capabilities previously thought unachievable by the person skilled in the art in one or more dimensions, given by way of non-limiting example:

· 세포당 수백 카피까지 단일 세포에서 단백질 디지털 정량화.· Digital quantification of proteins in single cells up to hundreds of copies per cell.

· 이 프로세스에서 고유한 WGA를 사용함으로써, 상기 단일 세포의 기타 특성을 조사하기 위한 추가 유전 물질을 수득할 수 있는 가능성, 및 검증을 위해 단일 세포를 확실하게 재분석할 가능성으로 상기 포인트가 수득된다고 생각되며, 이는 10× Genomics에서 제안한 것과 같은 액적-기반의 접근법으로는 불가능하다.I believe that by using the unique WGA in this process, the above points are obtained with the possibility of obtaining additional genetic material to investigate other properties of the single cell, and the possibility of reliably reanalyzing the single cell for validation. This is not possible with a droplet-based approach such as that proposed by 10× Genomics.

이 방법의 주요 적용 분야는 종양학이지만, 이 방법은 피부과 또는 과증식 표현형 등의 모자이크 장애 등의 다른 분야에도 적용될 수 있다.Although the main field of application of this method is oncology, the method can also be applied to other fields such as dermatology or mosaic disorders such as hyperproliferative phenotypes.

SEQUENCE LISTING <110> MENARINI SILICON BIOSYSTEMS S.P.A. <120> METHOD AND KIT FOR WHOLE GENOME AMPLIFICATION AND ANALYSIS OF TARGET MOLECULES IN A BIOLOGICAL SAMPLE <130> 941-18 <160> 51 <170> BiSSAP 1.3.6 <210> 1 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> P5-Synth <220> <221> misc_feature <222> 20..29 <223> /note="n is g or c or t or a" <400> 1 cacgacgctc ttccgatctn nnnnnnnnnc ggctatgcat tatgcgcca 49 <210> 2 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo first amplification primer (1AH-p) <400> 2 cacgacgctc ttccgatct 19 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo second amplification primer (2AH-RC-p) <400> 3 tggcgcataa tgcatagccg 20 <210> 4 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB1 example 1 <400> 4 tactcatgct 10 <210> 5 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB2 Example 1 <400> 5 agatagcgca 10 <210> 6 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB3 Example 1 <400> 6 tctctcgctg 10 <210> 7 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB4 Example 1 <400> 7 ctgagtcaga 10 <210> 8 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D501 <400> 8 aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 9 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D502 <400> 9 aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 10 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D503 <400> 10 aatgatacgg cgaccaccga gatctacacc ctatcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 11 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D504 <400> 11 aatgatacgg cgaccaccga gatctacacg gctctgaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 12 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D505 <400> 12 aatgatacgg cgaccaccga gatctacaca ggcgaagaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 13 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D506 <400> 13 aatgatacgg cgaccaccga gatctacact aatcttaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 14 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D507 <400> 14 aatgatacgg cgaccaccga gatctacacc aggacgtaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 15 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D508 <400> 15 aatgatacgg cgaccaccga gatctacacg tactgacaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 16 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D701 <400> 16 caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 17 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D702 <400> 17 caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 18 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D703 <400> 18 caagcagaag acggcatacg agataatgag cggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 19 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D704 <400> 19 caagcagaag acggcatacg agatggaatc tcgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 20 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D705 <400> 20 caagcagaag acggcatacg agatttctga atgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 21 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D706 <400> 21 caagcagaag acggcatacg agatacgaat tcgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 22 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D707 <400> 22 caagcagaag acggcatacg agatagcttc aggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 23 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D708 <400> 23 caagcagaag acggcatacg agatgcgcat tagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 24 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D709 <400> 24 caagcagaag acggcatacg agatcatagc cggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 25 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D710 <400> 25 caagcagaag acggcatacg agatttcgcg gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 26 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D711 <400> 26 caagcagaag acggcatacg agatgcgcga gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 27 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D712 <400> 27 caagcagaag acggcatacg agatctatcg ctgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 28 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> P5-Lib1 <220> <221> misc_feature <222> 41..50 <223> /note="n is c or g or t or a" <400> 28 agtgggattc ctgctgtcag tcacgacgct cttccgatct nnnnnnnnnn gtggtactga 60 cagcaggaat cccact 76 <210> 29 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo extension oligonucleotide with P5-Lib1 <400> 29 agtgggattc ctgctgtcag t 21 <210> 30 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D501 <400> 30 aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 31 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D502 <400> 31 aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 32 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D503 <400> 32 aatgatacgg cgaccaccga gatctacacc ctatcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 33 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D504 <400> 33 aatgatacgg cgaccaccga gatctacacg gctctgaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 34 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D505 <400> 34 aatgatacgg cgaccaccga gatctacaca ggcgaagaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 35 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D506 <400> 35 aatgatacgg cgaccaccga gatctacact aatcttaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 36 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D507 <400> 36 aatgatacgg cgaccaccga gatctacacc aggacgtaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 37 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D508 <400> 37 aatgatacgg cgaccaccga gatctacacg tactgacaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 38 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D701 <400> 38 caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 39 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D702 <400> 39 caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 40 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D703 <400> 40 caagcagaag acggcatacg agataatgag cggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 41 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D704 <400> 41 caagcagaag acggcatacg agatggaatc tcgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 42 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D705 <400> 42 caagcagaag acggcatacg agatttctga atgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 43 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D706 <400> 43 caagcagaag acggcatacg agatacgaat tcgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 44 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D707 <400> 44 caagcagaag acggcatacg agatagcttc aggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 45 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D708 <400> 45 caagcagaag acggcatacg agatgcgcat tagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 46 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D709 <400> 46 caagcagaag acggcatacg agatcatagc cggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 47 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D710 <400> 47 caagcagaag acggcatacg agatttcgcg gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 48 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D711 <400> 48 caagcagaag acggcatacg agatgcgcga gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 49 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D712 <400> 49 caagcagaag acggcatacg agatctatcg ctgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 50 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> with hairpin <220> <221> misc_feature <222> 20..29 <223> /note="n = a or t or g or c" <400> 50 cacgacgctc ttccgatctn nnnnnnnnnt actcatgcta gatcggaaga gcacacgtc 59 <210> 51 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> without hairpin <220> <221> misc_feature <222> 20..29 <223> /note="n = a or t or g or c" <400> 51 cacgacgctc ttccgatctn nnnnnnnnnt tactcatgct ggctatgcat tatgcgcca 59 SEQUENCE LISTING <110> MENARINI SILICON BIOSYSTEMS S.P.A. <120> METHOD AND KIT FOR WHOLE GENOME AMPLIFICATION AND ANALYSIS OF TARGET MOLECULES IN A BIOLOGICAL SAMPLE <130> 941-18 <160> 51 <170> BiSSAP 1.3.6 <210> 1 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> P5-Synth <220> <221> misc_feature <222> 20..29 <223> /note="n is g or c or t or a" <400> 1 cacgacgctc ttccgatctn nnnnnnnnnc ggctatgcat tatgcgcca 49 <210> 2 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo first amplification primer (1AH-p) <400> 2 cacgacgctc ttccgatct 19 <210> 3 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo second amplification primer (2AH-RC-p) <400> 3 tggcgcataa tgcatagccg 20 <210> 4 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB1 example 1 <400> 4 tactcatgct 10 <210> 5 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB2 Example 1 <400> 5 agatagcgca 10 <210> 6 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB3 Example 1 <400> 6 tctctcgctg 10 <210> 7 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> BAB4 Example 1 <400> 7 ctgagtcaga 10 <210> 8 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D501 <400> 8 aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 9 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D502 <400> 9 aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 10 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D503 <400> 10 aatgatacgg cgaccaccga gatctacacc ctatcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 11 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D504 <400> 11 aatgatacgg cgaccaccga gatctacacg gctctgaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 12 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D505 <400> 12 aatgatacgg cgaccaccga gatctacaca ggcgaagaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 13 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D506 <400> 13 aatgatacgg cgaccaccga gatctacact aatcttaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 14 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D507 <400> 14 aatgatacgg cgaccaccga gatctacacc aggacgtaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 15 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D508 <400> 15 aatgatacgg cgaccaccga gatctacacg tactgacaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 16 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> D701 <400> 16 caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60 cgatc 65 <210> 17 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D702 <400> 17 caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 18 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D703 <400> 18 caagcagaag acggcatacg agataatgag cggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 19 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D704 <400> 19 caagcagaag acggcatacg agatggaatc tcgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 20 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D705 <400> 20 caagcagaag acggcatacg agatttctga atgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 21 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D706 <400> 21 caagcagaag acggcatacg agatacgaat tcgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 22 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D707 <400> 22 caagcagaag acggcatacg agatagcttc aggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 23 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D708 <400> 23 caagcagaag acggcatacg agatgcgcat tagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 24 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D709 <400> 24 caagcagaag acggcatacg agatcatagc cggtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 25 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D710 <400> 25 caagcagaag acggcatacg agatttcgcg gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 26 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D711 <400> 26 caagcagaag acggcatacg agatgcgcga gagtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 27 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> D712 <400> 27 caagcagaag acggcatacg agatctatcg ctgtgactgg agttcagacg tgtgctcttc 60 cgatctggcg cataatgcat agccg 85 <210> 28 <211> 76 <212> DNA <213> Artificial Sequence <220> <223> P5-Lib1 <220> <221> misc_feature <222> 41..50 <223> /note="n is c or g or t or a" <400> 28 agtgggattc ctgctgtcag tcacgacgct cttccgatct nnnnnnnnnn gtggtactga 60 cagcaggaat cccact 76 <210> 29 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Tagged oligo extension oligonucleotide with P5-Lib1 <400> 29 agtgggattc ctgctgtcag t 21 <210> 30 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D501 <400> 30 aatgatacgg cgaccaccga gatctacact atagcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 31 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D502 <400> 31 aatgatacgg cgaccaccga gatctacaca tagaggcaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 32 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D503 <400> 32 aatgatacgg cgaccaccga gatctacacc ctatcctaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 33 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D504 <400> 33 aatgatacgg cgaccaccga gatctacacg gctctgaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 34 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D505 <400> 34 aatgatacgg cgaccaccga gatctacaca ggcgaagaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 35 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D506 <400> 35 aatgatacgg cgaccaccga gatctacact aatcttaaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 36 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D507 <400> 36 aatgatacgg cgaccaccga gatctacacc aggacgtaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 37 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> D508 <400> 37 aatgatacgg cgaccaccga gatctacacg tactgacaca ctctttccct acacgacgct 60 cttccgatct 70 <210> 38 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D701 <400> 38 caagcagaag acggcatacg agatcgagta atgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 39 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D702 <400> 39 caagcagaag acggcatacg agattctccg gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 40 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D703 <400> 40 caagcagaag acggcatacg agataatgag cggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 41 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D704 <400> 41 caagcagaag acggcatacg agatggaatc tcgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 42 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D705 <400> 42 caagcagaag acggcatacg agatttctga atgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 43 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D706 <400> 43 caagcagaag acggcatacg agatacgaat tcgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 44 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D707 <400> 44 caagcagaag acggcatacg agatagcttc aggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 45 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D708 <400> 45 caagcagaag acggcatacg agatgcgcat tagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 46 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D709 <400> 46 caagcagaag acggcatacg agatcatagc cggtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 47 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D710 <400> 47 caagcagaag acggcatacg agatttcgcg gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 48 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D711 <400> 48 caagcagaag acggcatacg agatgcgcga gagtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 49 <211> 86 <212> DNA <213> Artificial Sequence <220> <223> D712 <400> 49 caagcagaag acggcatacg agatctatcg ctgtgactgg agttcagacg tgtgctcttc 60 cgatcggatt cctgcttcag taccac 86 <210> 50 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> with hairpin <220> <221> misc_feature <222> 20..29 <223> /note="n = a or t or g or c" <400> 50 cacgacgctc ttccgatctn nnnnnnnnnt actcatgcta gatcggaaga gcacacgtc 59 <210> 51 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> without hairpin <220> <221> misc_feature <222> 20..29 <223> /note="n = a or t or g or c" <400> 51 cacgacgctc ttccgatctn nnnnnnnnnt tactcatgct ggctatgcat tatgcgcca 59

Claims (24)

게놈 DNA 및 표적 분자(target molecule)를 포함하는 생물학적 샘플에서 전체 게놈 증폭(whole genome amplification) 및 복수 표적 분자의 분석을 위한 방법으로서,
a) 생물학적 샘플을 제공하는 단계;
b) 상기 생물학적 샘플을, 태그된 올리고뉴클레오티드(tagged oligonucleotide)와 접합된, 표적 분자의 적어도 하나에 대해 지시되는 적어도 하나의 결합제(binding agent)와 접촉시키는 단계로서, 상기 태그된 올리고뉴클레오티드는
i) 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는 핵산의 페이로드(payload) 서열(PL), 및
ii) 핵산의 적어도 하나의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS)
을 포함하고;
이에 따라, 생물학적 샘플에 적어도 하나의 표적 분자가 존재하는 경우, 적어도 하나의 결합제가 적어도 하나의 표적 분자에 결합하는, 단계;
c) 분리 단계를 수행하여, 결합되지 않은 결합제를 선택적으로 제거하고, 이렇게 하여, 표지된 생물학적 샘플을 수득하는 단계;
d) 표지된 생물학적 샘플에 대해,
- i) 결정론적 제한 부위 전체 게놈 증폭(DRS-WGA), 또는
ii) 복수의 어닐링(Multiple Annealing) 및 루핑(Looping) 기반 증폭 사이클 전체 게놈 증폭(MALBAC)
에 의한 상기 게놈 DNA의 전체 게놈 증폭, 및
- 적어도 하나의 결합제와 접합된 태그된 올리고뉴클레오티드의 증폭
을 수행하는 단계로서,
전체 게놈 증폭 및 상기 태그된 올리고뉴클레오티드의 증폭은 동시에 수행되는 단계;
e) 증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리(massively parallel sequencing library)를 제조하는 단계;
f) 대규모 병렬 서열분석 라이브러리를 서열분석하는 단계;
g) 각 서열분석 판독(sequencing read)으로부터 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)의 서열을 검색하는 단계;
h) 각 결합제에 대해 상이한 고유 분자 식별자 서열(UMI)의 수를 계수하는 단계
를 포함하는, 방법.
A method for whole genome amplification and analysis of multiple target molecules in a biological sample comprising genomic DNA and a target molecule, the method comprising:
a) providing a biological sample;
b) contacting the biological sample with at least one binding agent directed to at least one of a target molecule conjugated to a tagged oligonucleotide, wherein the tagged oligonucleotide is
i) a payload sequence (PL) of a nucleic acid comprising a binder barcode sequence (BAB) and a unique molecular identifier sequence (UMI), and
ii) at least one first tagged oligonucleotide amplification sequence of a nucleic acid (5-TOS)
comprising;
Accordingly, when the at least one target molecule is present in the biological sample, the at least one binding agent binds to the at least one target molecule;
c) performing a separation step to selectively remove unbound binder, thereby obtaining a labeled biological sample;
d) for a labeled biological sample,
- i) deterministic restriction site whole genome amplification (DRS-WGA), or
ii) Multiple Annealing and Looping Based Amplification Cycle Whole Genome Amplification (MALBAC)
whole genome amplification of the genomic DNA by
- amplification of tagged oligonucleotides conjugated with at least one binding agent
As a step of performing,
Whole genome amplification and amplification of the tagged oligonucleotide are performed simultaneously;
e) preparing a massively parallel sequencing library from the amplified tagged oligonucleotides;
f) sequencing the massively parallel sequencing library;
g) retrieving the sequence of the binder barcode sequence (BAB) and the unique molecular identifier sequence (UMI) from each sequencing read;
h) counting the number of different unique molecular identifier sequences (UMIs) for each binding agent;
A method comprising
제1항에 있어서, 상기 태그된 올리고뉴클레오티드가 적어도 하나의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)을 추가로 포함하는, 방법.The method of claim 1 , wherein the tagged oligonucleotide further comprises at least one second tagged oligonucleotide amplification sequence (3-TOS). 제1항 또는 제2항에 있어서, 상기 고유 분자 식별자 서열(UMI)이 10 내지 30개 뉴클레오티드 범위의 축퇴성(degenerate) 또는 반축퇴성 서열인, 방법.3. The method of claim 1 or 2, wherein the unique molecular identifier sequence (UMI) is a degenerate or semi-degenerate sequence in the range of 10 to 30 nucleotides. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 방법이 생물학적 샘플로부터 단일 세포를 단리하는 단계를 추가로 포함하는, 방법.4. The method of any one of claims 1 to 3, wherein the method further comprises isolating a single cell from the biological sample. 제4항에 있어서, 상기 단리 단계가 세포를 선별함으로써 수행되는, 방법.5. The method of claim 4, wherein the isolating step is performed by selecting the cells. 제4항에 있어서, 상기 단리 단계가 세포를 액적(droplet)으로 분할함으로써 수행되는, 방법.5. The method of claim 4, wherein the isolating step is performed by dividing the cells into droplets. 제4항 내지 제6항 중 어느 한 항에 있어서, 상기 단리 단계가 단계 c)의 이후 및 단계 d)의 이전에 수행되는, 방법.7. The method according to any one of claims 4 to 6, wherein the isolating step is carried out after step c) and before step d). 제1항 내지 제7항 중 어느 한 항에 있어서, 단계 f)의 전에 대규모 병렬 서열분석 라이브러리를 정제하는 단계를 추가로 포함하는, 방법.8. The method according to any one of claims 1 to 7, further comprising purifying the massively parallel sequencing library prior to step f). 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 적어도 하나의 결합제가
a) 항체 또는 이의 단편,
b) 앱타머(aptamer),
c) 소분자,
d) 펩티드 및
e) 단백질
로 이루어진 그룹으로부터 선택되는, 방법.
9. The method of any one of claims 1 to 8, wherein the at least one binder is
a) an antibody or fragment thereof;
b) an aptamer;
c) small molecules;
d) peptides and
e) protein
selected from the group consisting of
제1항 내지 제9항 중 어느 한 항에 있어서, 상기 표적 분자가
a) 단백질,
b) 펩티드,
c) 당단백질,
d) 탄수화물,
e) 지질 및
f) 이들의 조합
으로 이루어진 그룹으로부터 선택되는, 방법.
10. The method of any one of claims 1 to 9, wherein the target molecule is
a) protein;
b) a peptide;
c) glycoproteins;
d) carbohydrates;
e) lipids and
f) combinations of these
selected from the group consisting of
제2항 내지 제10항 중 어느 한 항에 있어서,
상기 태그된 올리고뉴클레오티드가 5'으로부터 3'으로 적어도
a) 5' 전체 게놈 증폭 핸들 서열(5-WGAH) 및 제1 증폭 핸들 서열(1AH)을 차례로 포함하는, 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
b) 페이로드 서열(PL);
c) 핵산의 제2 증폭 핸들 서열(2AH) 및 3' 전체 게놈 증폭 핸들 서열(3-WGAH)을 차례로 포함하는, 핵산의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)
을 포함하는, 방법.
11. The method according to any one of claims 2 to 10,
wherein the tagged oligonucleotide is at least 5' to 3'
a) a first tagged oligonucleotide amplification sequence of a nucleic acid (5-TOS) comprising, in turn, a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);
b) a payload sequence (PL);
c) a second tagged oligonucleotide amplification sequence of a nucleic acid (3-TOS) comprising, in turn, a second amplification handle sequence of the nucleic acid (2AH) and a 3' whole genome amplification handle sequence (3-WGAH)
A method comprising
제1항 내지 제11항 중 어느 한 항에 있어서, 상기 전체 게놈 증폭 및 태그된 올리고의 증폭이 단일 프라이머(single primer)를 사용하여 수행되는, 방법.12. The method according to any one of claims 1 to 11, wherein the whole genome amplification and amplification of the tagged oligo are performed using a single primer. 제1항 내지 제10항 중 어느 한 항에 있어서,
상기 태그된 올리고뉴클레오티드가 5'으로부터 3'으로 적어도
a) 5' 전체 게놈 증폭 핸들 서열(5-WGAH) 및 제1 증폭 핸들 서열(1AH)을 차례로 포함하는, 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
b) 페이로드 서열(PL);
c) 임의로, 어닐링 서열(AS)
을 포함하고;
여기서, 적어도 하나의 프라이머는 전체 게놈 증폭 및 상기 태그된 올리고뉴클레오티드의 증폭에 사용되고, 적어도 하나의 올리고뉴클레오티드(E-p)는 태그된 올리고뉴클레오티드의 신장(extension)에 사용되고,
상기 적어도 하나의 올리고뉴클레오티드(E-p)는 5'으로부터 3'으로 적어도
d) 5' 전체 게놈 증폭 핸들 서열(5-WGAH);
e) 스페이서 서열(spacer sequence; SS);
f) 제2 증폭 핸들 서열(2AH); 및
g) 어닐링 서열에 대해 역상보적인 서열(AS-RC) 또는 결합제 바코드 서열에 대해 역상보적인 서열(BAB-RC)
을 포함하는, 방법.
11. The method according to any one of claims 1 to 10,
wherein the tagged oligonucleotide is at least 5' to 3'
a) a first tagged oligonucleotide amplification sequence of a nucleic acid (5-TOS) comprising, in turn, a 5' whole genome amplification handle sequence (5-WGAH) and a first amplification handle sequence (1AH);
b) a payload sequence (PL);
c) optionally an annealing sequence (AS)
comprising;
wherein at least one primer is used for whole genome amplification and amplification of the tagged oligonucleotide, and at least one oligonucleotide (Ep) is used for extension of the tagged oligonucleotide,
said at least one oligonucleotide (Ep) is at least 5' to 3'
d) 5' whole genome amplification handle sequence (5-WGAH);
e) a spacer sequence (SS);
f) a second amplification handle sequence (2AH); and
g) a sequence that is reverse complementary to an annealing sequence (AS-RC) or a sequence reverse complementary to a binder barcode sequence (BAB-RC)
A method comprising
제1항 내지 제10항 중 어느 한 항에 있어서,
상기 태그된 올리고뉴클레오티드가 5'으로부터 3'으로 적어도
a) 제1 증폭 핸들 서열(1AH)에 상응하는 핵산의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS);
b) 페이로드 서열(PL);
c) 제2 증폭 핸들 서열(2AH)에 상응하는 핵산의 제2 태그된 올리고뉴클레오티드 증폭 서열(3-TOS)
을 포함하고;
여기서, 적어도 하나의 제1 프라이머는 전체 게놈 증폭에 사용되고, 적어도 하나의 제2 및 하나의 제3 프라이머는 태그된 올리고뉴클레오티드의 증폭에 사용되며;
상기 적어도 하나의 제2 프라이머는 제1 증폭 핸들 서열(1AH)과 동일한 서열을 갖고, 적어도 하나의 제3 프라이머는 제2 증폭 핸들 서열에 역상보적인 서열(2AH-RC)을 갖는, 방법.
11. The method according to any one of claims 1 to 10,
wherein the tagged oligonucleotide is at least 5' to 3'
a) a first tagged oligonucleotide amplification sequence (5-TOS) of a nucleic acid corresponding to a first amplification handle sequence (1AH);
b) a payload sequence (PL);
c) a second tagged oligonucleotide amplification sequence (3-TOS) of a nucleic acid corresponding to a second amplification handle sequence (2AH)
comprising;
wherein at least one first primer is used for whole genome amplification and at least one second and one third primer is used for amplification of the tagged oligonucleotide;
wherein the at least one second primer has a sequence identical to the first amplification handle sequence (1AH) and the at least one third primer has a sequence that is reverse complementary to the second amplification handle sequence (2AH-RC).
제14항에 있어서, 상기 적어도 하나의 제2 프라이머 및 적어도 하나의 제3 프라이머가 단계 d)에서 첨가되는, 방법.15. The method of claim 14, wherein the at least one second primer and at least one third primer are added in step d). 제11항 내지 제15항 중 어느 한 항에 있어서, 증폭된 태그된 올리고뉴클레오티드로부터 대규모 병렬 서열분석 라이브러리를 제조하는 상기 단계 e)가, 제1 증폭 핸들 서열(1AH)에 상응하는 3' 서열을 포함하는, 적어도 하나의 제1 라이브러리 프라이머, 및 제2 증폭 핸들 서열에 역상보적인 서열(2AH-RC)에 상응하는 3' 서열을 포함하는, 적어도 하나의 제2 라이브러리 프라이머를 사용하는 PCR 반응에 의해 수행되는, 방법.16. The method according to any one of claims 11 to 15, wherein step e) of preparing a massively parallel sequencing library from the amplified tagged oligonucleotides comprises generating a 3' sequence corresponding to the first amplification handle sequence (1AH). in a PCR reaction using at least one first library primer comprising at least one first library primer, and at least one second library primer comprising a 3′ sequence corresponding to a sequence reverse complementary to a second amplification handle sequence (2AH-RC). carried out by the method. 제1항 내지 제16항 중 어느 한 항의 방법을 수행하기 위한 키트(kit)로서,
a) 태그된 올리고뉴클레오티드와 접합된 생물학적 샘플 중의 적어도 하나의 표적 분자에 대해 지시된 적어도 하나의 결합제로서, 상기 태그된 올리고뉴클레오티드는
i) 결합제 바코드 서열(BAB) 및 고유 분자 식별자 서열(UMI)을 포함하는 핵산의 페이로드 서열(PL),
ii) 적어도 하나의 제1 태그된 올리고뉴클레오티드 증폭 서열(5-TOS)
를 포함하는, 적어도 하나의 결합제;
b) 전체 게놈 증폭을 수행하기 위한 적어도 하나의 프라이머 및 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 적어도 하나의 프라이머로서, 상기 전체 게놈 증폭을 수행하기 위한 적어도 하나의 프라이머 및 상기 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 적어도 하나의 프라이머는 동일한 서열을 갖거나 상이한 서열을 갖는, 적어도 하나의 프라이머
를 포함하는, 키트.
17. A kit for carrying out the method of any one of claims 1 to 16, comprising:
a) at least one binding agent directed to at least one target molecule in a biological sample conjugated with a tagged oligonucleotide, said tagged oligonucleotide comprising:
i) a payload sequence (PL) of a nucleic acid comprising a binder barcode sequence (BAB) and a unique molecular identifier sequence (UMI);
ii) at least one first tagged oligonucleotide amplification sequence (5-TOS)
at least one binder comprising;
b) at least one primer for carrying out whole genome amplification and at least one primer for carrying out amplification of a tagged oligonucleotide, wherein at least one primer for carrying out said whole genome amplification and amplification of said tagged oligonucleotide at least one primer for carrying out the at least one primer having the same sequence or having a different sequence
comprising, a kit.
제20항에 있어서, 태그된 올리고뉴클레오티드를 신장시키기 위한 올리고뉴클레오티드를 추가로 포함하는, 키트.21. The kit of claim 20, further comprising an oligonucleotide for extending the tagged oligonucleotide. 제17항 또는 제18항에 있어서, 상기 적어도 하나의 태그된 올리고뉴클레오티드가 서열번호 1에 상응하는 서열을 갖고, 상기 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 프라이머가 2개이고 각각 서열번호 2 및 서열번호 3의 서열을 갖는, 키트.19. The method according to claim 17 or 18, wherein said at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO: 1, and there are two primers for carrying out amplification of said tagged oligonucleotide, SEQ ID NO: 2 and SEQ ID NO: 2, respectively. A kit having the sequence of number 3. 제17항 내지 제19항 중 어느 한 항에 있어서, 하나 이상의 제1 라이브러리 프라이머(들) 및 하나 이상의 제2 라이브러리 프라이머(들)를 추가로 포함하는, 키트.20. The kit according to any one of claims 17 to 19, further comprising one or more first library primer(s) and one or more second library primer(s). 제20항에 있어서, 상기 제1 라이브러리 프라이머(들)가 서열번호 8 내지 서열번호 15로 이루어진 그룹으로부터 선택된 서열을 갖고, 상기 제2 라이브러리 프라이머(들)가 서열번호 16 내지 서열번호 27로 이루어진 그룹으로부터 선택된 서열을 갖는, 키트.21. The group of claim 20, wherein the first library primer(s) has a sequence selected from the group consisting of SEQ ID NO: 8 to SEQ ID NO: 15, and the second library primer(s) has a sequence selected from the group consisting of SEQ ID NO: 16 to SEQ ID NO: 27 A kit having a sequence selected from 제17항 또는 제18항에 있어서, 상기 적어도 하나의 태그된 올리고뉴클레오티드가 서열번호 28에 상응하는 서열을 갖고, 상기 태그된 올리고뉴클레오티드의 증폭을 수행하기 위한 프라이머가 서열번호 29에 상응하는 서열을 갖는, 키트.19. The method according to claim 17 or 18, wherein the at least one tagged oligonucleotide has a sequence corresponding to SEQ ID NO: 28, and the primers for carrying out amplification of the tagged oligonucleotide have a sequence corresponding to SEQ ID NO: 29 having, kit. 제22항에 있어서, 하나 이상의 제1 라이브러리 프라이머(들) 및 하나 이상의 제2 라이브러리 프라이머(들)를 추가로 포함하는, 키트.23. The kit of claim 22, further comprising one or more first library primer(s) and one or more second library primer(s). 제23항에 있어서, 상기 제1 라이브러리 프라이머(들)가 서열번호 30 내지 서열번호 37로 이루어진 그룹으로부터 선택된 서열을 갖고, 상기 제2 라이브러리 프라이머(들)가 서열번호 38 내지 서열번호 49로 이루어진 그룹으로부터 선택된 서열을 갖는, 키트.
24. The group of claim 23, wherein said first library primer(s) has a sequence selected from the group consisting of SEQ ID NO: 30 to SEQ ID NO: 37, and said second library primer(s) has a sequence selected from the group consisting of SEQ ID NO: 38 to SEQ ID NO: 49 A kit having a sequence selected from
KR1020227023430A 2019-12-16 2020-12-16 Methods and kits for whole genome amplification and analysis of target molecules in biological samples KR20220139859A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IT102019000024159 2019-12-16
IT102019000024159A IT201900024159A1 (en) 2019-12-16 2019-12-16 METHOD AND KIT FOR TOTAL AMPLIFICATION OF THE GENOME AND ANALYSIS OF TARGET MOLECULES IN A BIOLOGICAL SAMPLE
PCT/IB2020/062053 WO2021124166A1 (en) 2019-12-16 2020-12-16 Method and kit for whole genome amplification and analysis of target molecules in a biological sample

Publications (1)

Publication Number Publication Date
KR20220139859A true KR20220139859A (en) 2022-10-17

Family

ID=69904109

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227023430A KR20220139859A (en) 2019-12-16 2020-12-16 Methods and kits for whole genome amplification and analysis of target molecules in biological samples

Country Status (15)

Country Link
US (1) US20230053146A1 (en)
EP (1) EP4077713B1 (en)
JP (1) JP2023511492A (en)
KR (1) KR20220139859A (en)
CN (1) CN114867867A (en)
AU (1) AU2020408301A1 (en)
CA (1) CA3161615A1 (en)
DK (1) DK4077713T3 (en)
ES (1) ES2959838T3 (en)
FI (1) FI4077713T3 (en)
IL (1) IL293720B2 (en)
IT (1) IT201900024159A1 (en)
PL (1) PL4077713T3 (en)
PT (1) PT4077713T (en)
WO (1) WO2021124166A1 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2343359C (en) 1998-09-18 2008-12-23 Micromet Ag Dna amplification of a single cell
CA2775613C (en) 2009-10-13 2018-06-12 Nanostring Technologies, Inc. Protein detection via nanoreporters
ITUA20162640A1 (en) 2016-04-15 2017-10-15 Menarini Silicon Biosystems Spa METHOD AND KIT FOR THE GENERATION OF DNA LIBRARIES FOR PARALLEL MAXIMUM SEQUENCING
EP4324931A2 (en) * 2017-02-02 2024-02-21 New York Genome Center, Inc. Methods and compositions for identifying or quantifying targets in a biological sample
EP3431611A1 (en) 2017-07-21 2019-01-23 Menarini Silicon Biosystems S.p.A. Improved method and kit for the generation of dna libraries for massively parallel sequencing
US11414701B2 (en) * 2018-05-24 2022-08-16 The Broad Institute, Inc. Multimodal readouts for quantifying and sequencing nucleic acids in single cells

Also Published As

Publication number Publication date
PT4077713T (en) 2023-08-18
AU2020408301A1 (en) 2022-06-30
IL293720B2 (en) 2024-02-01
CN114867867A (en) 2022-08-05
IL293720A (en) 2022-08-01
PL4077713T3 (en) 2024-01-03
US20230053146A1 (en) 2023-02-16
EP4077713A1 (en) 2022-10-26
WO2021124166A1 (en) 2021-06-24
JP2023511492A (en) 2023-03-20
IL293720B1 (en) 2023-10-01
EP4077713B1 (en) 2023-07-26
ES2959838T3 (en) 2024-02-28
IT201900024159A1 (en) 2021-06-16
CA3161615A1 (en) 2021-06-24
DK4077713T3 (en) 2023-08-28
FI4077713T3 (en) 2023-09-27

Similar Documents

Publication Publication Date Title
US20210371914A1 (en) Methods and compositions for identifying or quantifying targets in a biological sample
US11434538B2 (en) Method of nucleic acid sequence detection
US20230279477A1 (en) Methods for spatial analysis using targeted rna capture
JP2023040233A (en) Methods for multiplex detection of molecules
EP3587589B1 (en) Reagents and methods for the analysis of circulating microparticles
CN112154216A (en) Biomolecule probes and methods for detecting gene and protein expression
WO2011142836A2 (en) Assays for the detection of genotype, mutations, and/or aneuploidy
KR20130113447A (en) Direct capture, amplification and sequencing of target dna using immobilized primers
KR102512168B1 (en) Method for Quantitatively Analyzing Protein Population Using Next Generation Sequencing and Use Thereof
CN106536735A (en) Probe set for analyzing a dna sample and method for using the same
KR20180041331A (en) The method and kit of the selection of Molecule-Binding Nucleic Acids and the identification of the targets, and their use
EP4077713B1 (en) Method and kit for whole genome amplification and analysis of target molecules in a biological sample
US20230313309A1 (en) Methods for Nucleic Acid Sequence Detection
KR20230129675A (en) Preparation and Use of Binding Oligonucleotides
JP2003125800A (en) Method for detecting nucleic acid

Legal Events

Date Code Title Description
A201 Request for examination